大华-大数据工程师(数据挖掘方向)-一面面经

2019-09-27 22min 电话一面
很久没发凉经了,笔试过了叫去长沙现场面没去,后改成电话面,问题节奏很快。
1.自我介绍,你们学校是211吗(弱弱地说了句省211)
2.介绍项目,你做了哪些特征,什么特征比较有效,特征重要性怎么计算
3.xgboost和lightgbm有什么区别
4.pandas里map和apply的区别
5.Python里is和==一样吗
6.list和元组有什么区别,list是迭代器吗
7.数据库有哪些,窗函数,左连接和右连接
8.linux学的怎么样, top命令
9.jieba分词原理,词性标注
10.kmeans相关,k值,改进
11.多线程了解吗
12.为什么没有去实习(我也想,导师不放啊。。。)
13.你的比赛项目都是去年做的,今年上半年在干嘛(在复习原理刷刷题什么的。。。)
何时才能上岸?
#机器学习##浙江大华技术股份有限公司##数据挖掘##面经##校招#
全部评论
昨天我也是电话面的,有没有说后续多久通知啊?
点赞 回复
分享
发布于 2019-09-28 15:01

相关推荐

 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
3 21 评论
分享
牛客网
牛客企业服务