03-13 11:38 网易_数据开发(实习员工)

关注

百度大数据研发实习

一面
实习深挖
对于高耗时任务的代码优化思路
如何发现不必要的扫表
sparksql和hivesql有什么区别
sparksql和hive on spark性能有差异吗，差异在哪
hdfs架构
datanode心跳机制
datanode挂了之后会怎么样，容错机制是怎么样
机架感知
有限内存下的一亿数据怎么排序
了解哪些shell命令
有a，b两个文件，存的都是id，写shell找出a中有但b中没有的id行
flink窗口计算相关
java反射是什么，作用场景，反射性能
数据质量是怎么保证的，完整性唯一性具体怎么实现的
反问业务和工作内容主要做离线还是实时
#面经##百度#

全部评论

推荐最新楼层

东北大学计算机类

你这啥时候投的？我看最近都没有大数据研发的岗位

1 回复

发布于 03-13 16:24 河北

想提桶的安德鲁准备进厂

门头沟学院材料类

大佬，简历要写成啥样才能有机会面试啊

1 回复

发布于 03-13 21:29 浙江

联想

校招火热招聘中

官网直投

南昌大学美术学类

我发了饿了么的25届实习内推码，同学有需要可以自取，这次转正率超高可以一试

点赞回复

发布于 03-13 15:54 江西

牛客287782785号

合肥工业大学计算机类

请问你是在哪投递的

点赞回复

发布于 03-14 10:31 安徽

门头沟学院计算机类

佬，如何避免不必要的扫表，答案是啥

点赞回复

发布于 03-14 18:16 北京

三石大数据

大数据开发工程师

跟我两年前面试差不多内容

点赞回复

发布于 03-24 13:57 浙江

咕咕酱没有悲伤

04-15 21:45

门头沟学院计算机类

OPPO前端暑期实习一面面经

面试官很和善，都是问答无手写时长：40min项目里响应式布局怎么做的计算机中的基本数据类型有哪些计算机为什么用二进制js中的基本数据类型有哪些原型和原型链，原型链的尽头this的几种情况浏览器事件循环跨域的解决方案预检请求是什么CSS 水平垂直居中的方式CSS 绝对定位后对子元素width:50%的影响口述：用两个栈实现一个队列的伪代码反问：部门业务技术栈（面试是统一的，不分部门。技术栈大多数vue，少部分React）期望的能力和品质（比较注重基础，对前端有热情）

点赞评论收藏

转发

在冲浪的比尔很想润

04-25 20:36

中央民族大学统计学类

美团大数据开发实习

一面——60mins自我介绍拉链表的制作，数据量有多少，为什么不用快照表呢项目有哪些表数仓分层有哪些，具体做了什么，数仓分层作用怎么设计表，怎么建模，DIMDWD层的主题分了哪些如何做的可视化什么是数据倾斜，数据倾斜的解决方案Hadoop和spark的区别Spark的shuffle流程是怎么样的对哪些数据库了解Shuffle有哪几种类型在shuffle的过程中会进行排序吗，有哪几种排序什么是快速排序，时间复杂度是多少，手撕快排代码题Spark是如何划分stage阶段Spark SQL的执行流程，如何将一个SQL语句转换为任务宽窄依赖，宽依赖阶段会发生什么两个SQL题反问

点赞评论收藏

转发

04-15 19:49

已编辑

阿里巴巴_开发工程师

阿里巴巴实习内推

技术风险与效能部招人啦，我们是属于阿里控股爱橙科技下面的部门，当前投递到我们部门的人比较少！！！大家快冲呐！！！ 💼 公司岗位 JAVA/c++/go开发 💢 工作强度 我感觉还可以，周一周二周四1095或者1085，周三周五大部分人6点下班 🏬工作地点 北京/杭州/上海 我工作在杭州西溪园区，附近租房很方便，房源很多，租房大约1000-2000内，其他地方不太清楚 💰 薪资待遇400/天 有餐补，二线中餐晚餐各20/元，一线中晚餐各为25元，夜宵10/元，在杭州的话餐补大约为50/天 租房补贴2000， 另外入职还有最多两个星期的免费酒店住宿，这段时间好找房子绰绰有余了！！！ 有问题...

25届暑期实习

点赞评论收藏

转发

聪明勇敢有力气y

04-19 08:08

已编辑

第一拖拉机制造厂拖拉机学院

美团数据开发转正实习面经总结:美团效率，完全没准备好就面试了。问了很多八股，兼具深度广度，知道的不知道全问了。学习之路道阻且长啊。数仓分层：为什么不能直接建DWD,DIM层，ODS层的必要性是什么？DWS层的作用是什么，为什么不能直接建ADS层？完全同上乱答SQL考查:统计每个科目各等级的人数，写的很艰辛，面试的时候脑子经常短路，干着急。菜就多练分组topN，窗口函数。left join where中的条件写在where里和写在on里面有什么区别，查询结果一样吗？Java考查:HashMap底层组成，怎么减少扩容次数，答扩大初始容量，增加扩容因子。说说面向对象。了解的数据类型。Hive：什么情况会导致倾斜，怎么解决。写了一个HQL语句，问从提交到MR的整个详细执行过程，答的很粗略。hive 怎么根据表名去找表数据，metastore。MySQL 常见内存引擎，什么时候适合用哪种引擎。事务隔离级别。银行应该用哪种隔离级别。为什么用B+树，而不是B树或者其他。行列存储优缺点。常见的压缩格式。MR:切片规则，100个文件前面99个小文件，最后一个文件150M，默认切几片。顺势问到小文件的危害，怎么解决。分区器问题，疯狂拷打，但没什么印象了环形缓冲区调大调小有什么问题，纯乱答。写个快排，没注意有重复元素，好像陷入死循环了。问了为什么选择走数据开发这条路，有看过什么大数据类型的书吗。最后问你的亮点是什么，一直都不知道这些问题怎么答然后详细描述。其他的想不起来了。

点赞评论收藏

转发

DataPulse_辉常努腻

04-14 12:05

上海交通大学计算机类

奇安信|大数据面经|这公司现在还能去么？😂

模型开发的流程，需求调研过程中有哪些人员参加，调研过程，你会输出什么文档？如何保障数据质量（准确性）？spark有什么优缺点？在使用过程如何规避缺点？spark内存模型？spark和MR为什么会进行shuffle，如何减少shuffle？小文件治理的方式？主题域建设的流程？大表join大表的优化（10亿与1千万数据关联）？为什么存在ods穿透？为什么离职，旧公司工作强度如何？这公司现在还能去么？我真的哭死。

点赞评论收藏

转发

10 36 评论

招聘动态

滴滴

2025届秋招储备实习生招聘

联想

24届应届+25届实习

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

592388次浏览 9945人参与

# 华为开奖那些事 #

679795次浏览 5879人参与

# 我想象的工作vs实际工作 #

84977次浏览 1461人参与

# 我的成功项目解析 #

78029次浏览 2301人参与

# 毕业租房也有小确幸 #

23642次浏览 1371人参与

# 租房前辈的忠告 #

27068次浏览 1933人参与

# 简历中的项目经历要怎么写 #

410640次浏览 6860人参与

# 秋招开了，你想投哪些公司呢 #

111106次浏览 3203人参与

# 如果可以选，你最想从事什么工作 #

166755次浏览 2860人参与

# 双非本科求职如何逆袭 #

193217次浏览 2847人参与

# 晒一晒我的offer #

3126560次浏览 52408人参与

# 如何排解工作中的焦虑 #

23317次浏览 295人参与

# 我的上岸简历长这样 #

152497次浏览 3056人参与

# 如果校招重来我最想改变的是 #

80531次浏览 1474人参与

# 你的简历改到第几版了 #

288174次浏览 4398人参与

# 春招你拿到offer了吗 #

347793次浏览 5187人参与

# 第一次面试 #

41784次浏览 638人参与

# 你的秋招进行到哪一步了 #

338625次浏览 6138人参与

# 24秋招避雷总结 #

330125次浏览 3776人参与

# 海康威视求职进展汇总 #

86808次浏览 1055人参与

牛客网
牛客企业服务