字节 - 风控算法实习生面试(一、二面)面经


一面
1. 一个一个问项目
2.常见数据预处理工作(缺失值填补,离散变量编码,归一化等等)
3. 数据分箱算法了解吗?分箱算法的好处,python常用的自动分箱的库。(这个我也麻了,自动分箱在学校项目里确实很少用到)
4.了解哪些特征筛选方法?
5. K-means和GMM原理,两个有什么联系和区别
6. 还了解哪些聚类算法?聚类算法有哪些常用的距离度量方式?
7. KNN算法找到最近的样本点计算很复杂,有什么改进算法?(KD树)
8. 决策树算法按照什么标准进行分割的?随机森林算法和boosting tree有什么区别?
9. 随机森林进行特征筛选的原理是什么?(这个当时回答的不好,我本来以为是进行特征前向筛选,根据重要性排序。结果后来在网上搜索发现是向特征X注入随机噪声,计算袋外误差(OOB)变化来进行的排序)
10. 怎样解决过拟合问题?(问的循序渐进,比如我说可以数据增强,就问数据增强哪些方法;然后说加入Dropout,就问dropout在CNN中如何实现的;然后说加入BN层,就直接问那比如一个三通道的图像数据输入,BN是Normal哪个维度的数据......等等)
11. 进程/线程/协程区别。python的GIL机制了解吗?讲一讲为什么有GIL,有什么坏处,怎么解决。(这个问题属实没想到,面算法居然考了这个,回答的不太好,记不太清楚了)

算法:
第一题:走楼梯(N阶楼梯一次1步或者2步,走完多少种方法,LC简单题),就是简单的动态规划。但是他会追问,如何优化空间(两个变量);如何优化时间(快速幂乘法)
第二题:(这道题没怎么见过)给定一个二叉树,玩家1已经选择了二叉树的一个节点X;你是玩家2,你也可以选择一个开始节点。你们开始做游戏,从选择的开始节点开始感染相邻节点(只能感染未被感染的父节点或者子节点),最后谁感染的节点更多谁就赢了。题目给定了一个二叉树,二叉树的总节点个数N和玩家1选定的节点X,输出你是否能够找到一个开始节点使得你本场游戏一定不输(True or Flase)。我估计这道题是LC中等难度的,面试官说你想好了说说思路,能把伪代码写出来就行。一开始想错了,后经过提醒改正,写出了伪代码。


二面

1. 选一个项目展开讲讲(讲了学校的科研项目)
2. 讲一讲项目里用到的元学习网络Reptile。
3. 小样本学习除了这个网络以外还有了解吗?(讲了讲小样本学习网络孪生网络)你们当时为何采用Reptile而不用其他网络呢?
4. GAN网络的原理。GAN网络的损失函数如何定义的?(这个损失函数搞忘了,复习确实不到位)
5. 交叉熵损失函数是什么?写下来。为什么分类任务里面用交叉熵而不用MSE(估计看我前面没说出来GAN损失函数,就问了这个问题)
6. 常用的正则化方法?(跟一面类似,但是详细问了一下L1正则和L2正则的区别,L1 L2服从哪个分布之类的)
7. 还是问了树模型,跟一面相似。(决策树分类标准,决策树学习到的是什么?决策树怎么用于回归问题呢?)
8. 问了RNN的原理;LSTM的原理;除了LSTM还知道哪些gate RNN;写一下LSTM的公式,gate是怎么样的?(这个写LSTM公式又麻了,公式一大串根本记不清楚了,我简单说了一下LSTM的构造和RNN的不同之处,公式记不住了)


概率题
条件概率题:讲的是扔硬币,m个假硬币只有正面,n个真硬币有正面有反面。现在挑了一个硬币,扔了r次硬币全都是正面,问这个硬币是真硬币的概率。(需要在那个面试系统里面边写边讲)
算法题
正则表达式匹配那道题(LC hard难度)

三面

(今晚三面,总结一下以前的面试情况当作复习了。字节实习生要四次面试,太难了)

#字节跳动实习##实习##笔试题目##面经#
全部评论
楼主加油
1 回复
分享
发布于 2022-04-06 22:44
楼主,您面试之参加笔试了吗?
点赞 回复
分享
发布于 2022-04-07 10:20
联想
校招火热招聘中
官网直投
🤣为啥我有笔试
点赞 回复
分享
发布于 2022-04-07 21:25
厉害了,感觉全都是力扣题和机器学习,加油鸭
点赞 回复
分享
发布于 2022-04-16 22:12
楼主,能分享后面的面试经验吗🤗
点赞 回复
分享
发布于 2022-05-01 02:16
求后续🤣
点赞 回复
分享
发布于 2022-05-01 17:25
求后续
点赞 回复
分享
发布于 2022-05-09 19:46
和楼主二面内容好像,求后续 以及字节实习需要四面吗,我还以为三面就可以等结果了(刚三面完)
点赞 回复
分享
发布于 2022-05-14 14:30
太棒了楼主,我也投的风控,希望有点帮助😂
点赞 回复
分享
发布于 2022-07-11 21:02

相关推荐

头像
04-10 11:13
已编辑
东北大学 计算机类
全程50分钟,这次是女面试官,人很好,不怎么拷打,开始时先介绍了面试流程1.自我介绍2.介绍第一个项目,我的是一个RAG的项目,吟唱完让我说一下项目的两个亮点,我就介绍了语义感知的文本切分和缓解幻觉的两个点,又提问了一些问题3.介绍第二个项目,我的是一个论文项目,我直接共享桌面对着模型图讲了一遍,当然中间也穿插着提问,殊不知这次共享有几率让我寄掉4.问一个基础问题,面试官问了我transformer的结构,这个我看过好几遍,直接开始吟唱,丝滑的讲了一遍结构5.代码题,在这个地方我前面已经开了共享桌面,然后她说代码题链接发到邮箱了,我就切到邮箱的界面了,直接让面试官看到我邮箱里一堆别的公司发给我的邮件了,犯了大忌了😭题目是找出数组里k个最小元素,应该用排序算法,然后我先用了简单的,然后准备用快排,快排之前练过,但是这次写的总报错,鼠鼠太菜了😭然后我就跟面试官详细讲了快排的思路6.反问,问了部门做什么的,说是用大模型做风控的;问我到岗时间,直接祖传话术--------------------------------------------------------------------次日约了二面 #实习#  #算法#  #面试中的破防瞬间#  #实习,投递多份简历没人回复怎么办#  #简历被挂麻了,求建议# #软件开发2024笔面经#
点赞 评论 收藏
转发
16 98 评论
分享
牛客网
牛客企业服务