360面经

操作系统用户态和内核态,内核态一般有哪些操作

python为什么不需要编译 你是怎么理解python解释器的

你怎么知道K-means的k值取多少好

我:取一个区间然后每次加5算距离,距离小的好balaba

面试官:我问的不是这个。直接凉了

C++编译的四个过程,每个过程都干了什么事情

说说xgboost

怎么算xgboost的importance

ROC曲线和PR曲线分别适合什么场景

手写多路归并排序

快速排序、多路归并排序、堆排序的时间、空间复杂度,多路归并排序每次归并怎么选最小值,时间复杂度是多少

 

BIGO

写个代码吧二叉树层次遍历

什么时候用TCP,什么时候用UDP

TCP拥塞控制

怎么往hash表里插入一个值

hashmap是怎么实现的C++红黑树呢map呢是怎么写的

场景题:

给定一个100GB的文件,横排是时间和日志的记录,统计一个小时内实时在线人数

找60个点 算出每个点的人走的和留的,在进行一次运算

 

 

阿里巴巴

Spark怎么和Kafka连接的

LR怎么做的特征处理

过拟合,欠拟合怎么解决正则化有什么用

 

猿辅导:

讲个最近的项目

两道题

1、一道二叉树从起点到叶子节点有没有值为k的路径

2、 环形区域偷钱,不能同时偷

 

 

 

贝壳大数据:

一面:

讲一下HDFS和Map-reduce原理

说出Spark和Hadoop三个不同的地方

SparkSql区间函数用过哪些

说说你实习的内容Hive用过么

说说Hive原理

Combinaer作用

MapReduce的shuffle和Spark的shuffle

说说Spark核心组件

SparkSql连接的两种方式Sql写的多么  

Mysql三个范式

SparkStreaming和Kafka数据丢失和数据重复的问题

二面:

讲讲项目(很详细),然后问项目都是你做的么 我:大部分

你的项目中有什么难点

Spark有哪些组件

Spark是怎么工作的

Kafka了解么

你机器学习都是调的包把举个例子哪个没调包

你以后的发展想往什么方面(我们这里有XXXXXX业务)

三面HR:

做项目你觉得你有什么成长

这个项目的多少是你自己完成的

你最大的贡献是什么

如果你们老师非让你干怎么样

了解过贝壳么

你平时喜欢干什么

你学习的方式和渠道

你对自己有什么规划

实习公司叫什么

你之前面试过哪家公司或者有offer么(这个答得不好,什么叫8月15才开始投,明明之前投过贝壳)

可以来实习嘛

你周围的人对你的评价

你还有什么想问我的么

贝壳和链家的关系了解么

 

 

 

 

 

 

京东面试

用Python写一个单例模式

用Python写一个链表

Hive的聚合函数

SparkStreaming Spark-submit的时候优化参数是哪些

Flink和Spark的区别

Kafka和Redis的区别

Spark shuffle和hadoop shuffle

Django了解哪些

场景题全球有10几万个点,在东京的一个维度有一个坐标,求1公里内所有的点

 

流利说面试

讲项目

MYSQL的存储引擎有哪些

MYSQL可重复读是怎么实现

MYSQL事务你是怎么理解的

事务的四大特性

事务的一致性怎么解释

Spark用过哪些算子

Yarn分为哪两个部分Yarn是怎么配置的Hadoop HDFS是怎么配置

用过哪些Java集合

Kafka的特点

MYSQL默认的隔离级别 是什么怎么实现的 为什么用这个隔离级别

Hadoop和Spark的Map-Reduce有什么不同

项目中的数据量是多少

你还有什么问我的么

 

中兴面经

一个函数执行过程中栈堆的地址变化

自己写一个C++的宏定义

 

明略科技面试

哈工大附近的万达商务酒店

 

讲讲最近的一个项目

讲讲你主要做了什么项目

Linux了解么 管道是干嘛的

Spark讲一下

场景题目一个日志里面有url和userid访问一次一个记录统计一个url每天有几个人访问

他们的代码题都是抄的你的么

你的优点是什么

 

 

 其他的最近现场的一些企业面到的感觉不太会的,记录了,不全

一条   sql语句是怎么执行的

Linux find命令参数

top命令按照内存排序怎么办

Python协程

Http 503

Hbase有没有数据稀疏的情况

hdfs的secondaryname是什么意思

secondaryname和namenode放在一起会怎么样

Hbase查一条数据除了rowkey和列簇还需要什么

Hbase预分区

Kafka数据太多,Spark处理不过来怎么办

hdfs适合存储什么样子的数据

是怎么把日志读进SparkSql的

SparkSql的优化

做机器学习的时候怎么做的特征选择

决策树的预剪枝和后剪枝

Mysql什么时候用行级锁,什么时候用表级锁

Mysql怎么存储的

C++虚函数表是怎么查询的

Python是怎么做内存管理的

C++和Python的区别

面向对象有什么特性

Java的反射机制