字节 - 风控算法实习生面试(一、二面)面经


一面
1. 一个一个问项目
2.常见数据预处理工作(缺失值填补,离散变量编码,归一化等等)
3. 数据分箱算法了解吗?分箱算法的好处,python常用的自动分箱的库。(这个我也麻了,自动分箱在学校项目里确实很少用到)
4.了解哪些特征筛选方法?
5. K-means和GMM原理,两个有什么联系和区别
6. 还了解哪些聚类算法?聚类算法有哪些常用的距离度量方式?
7. KNN算法找到最近的样本点计算很复杂,有什么改进算法?(KD树)
8. 决策树算法按照什么标准进行分割的?随机森林算法和boosting tree有什么区别?
9. 随机森林进行特征筛选的原理是什么?(这个当时回答的不好,我本来以为是进行特征前向筛选,根据重要性排序。结果后来在网上搜索发现是向特征X注入随机噪声,计算袋外误差(OOB)变化来进行的排序)
10. 怎样解决过拟合问题?(问的循序渐进,比如我说可以数据增强,就问数据增强哪些方法;然后说加入Dropout,就问dropout在CNN中如何实现的;然后说加入BN层,就直接问那比如一个三通道的图像数据输入,BN是Normal哪个维度的数据......等等)
11. 进程/线程/协程区别。python的GIL机制了解吗?讲一讲为什么有GIL,有什么坏处,怎么解决。(这个问题属实没想到,面算法居然考了这个,回答的不太好,记不太清楚了)

算法:
第一题:走楼梯(N阶楼梯一次1步或者2步,走完多少种方法,LC简单题),就是简单的动态规划。但是他会追问,如何优化空间(两个变量);如何优化时间(快速幂乘法)
第二题:(这道题没怎么见过)给定一个二叉树,玩家1已经选择了二叉树的一个节点X;你是玩家2,你也可以选择一个开始节点。你们开始做游戏,从选择的开始节点开始感染相邻节点(只能感染未被感染的父节点或者子节点),最后谁感染的节点更多谁就赢了。题目给定了一个二叉树,二叉树的总节点个数N和玩家1选定的节点X,输出你是否能够找到一个开始节点使得你本场游戏一定不输(True or Flase)。我估计这道题是LC中等难度的,面试官说你想好了说说思路,能把伪代码写出来就行。一开始想错了,后经过提醒改正,写出了伪代码。


二面

1. 选一个项目展开讲讲(讲了学校的科研项目)
2. 讲一讲项目里用到的元学习网络Reptile。
3. 小样本学习除了这个网络以外还有了解吗?(讲了讲小样本学习网络孪生网络)你们当时为何采用Reptile而不用其他网络呢?
4. GAN网络的原理。GAN网络的损失函数如何定义的?(这个损失函数搞忘了,复习确实不到位)
5. 交叉熵损失函数是什么?写下来。为什么分类任务里面用交叉熵而不用MSE(估计看我前面没说出来GAN损失函数,就问了这个问题)
6. 常用的正则化方法?(跟一面类似,但是详细问了一下L1正则和L2正则的区别,L1 L2服从哪个分布之类的)
7. 还是问了树模型,跟一面相似。(决策树分类标准,决策树学习到的是什么?决策树怎么用于回归问题呢?)
8. 问了RNN的原理;LSTM的原理;除了LSTM还知道哪些gate RNN;写一下LSTM的公式,gate是怎么样的?(这个写LSTM公式又麻了,公式一大串根本记不清楚了,我简单说了一下LSTM的构造和RNN的不同之处,公式记不住了)


概率题
条件概率题:讲的是扔硬币,m个假硬币只有正面,n个真硬币有正面有反面。现在挑了一个硬币,扔了r次硬币全都是正面,问这个硬币是真硬币的概率。(需要在那个面试系统里面边写边讲)
算法题
正则表达式匹配那道题(LC hard难度)

三面

(今晚三面,总结一下以前的面试情况当作复习了。字节实习生要四次面试,太难了)

#字节跳动实习##实习##笔试题目##面经#
全部评论
楼主加油
1 回复 分享
发布于 2022-04-06 22:44
太棒了楼主,我也投的风控,希望有点帮助😂
点赞 回复 分享
发布于 2022-07-11 21:02
和楼主二面内容好像,求后续 以及字节实习需要四面吗,我还以为三面就可以等结果了(刚三面完)
点赞 回复 分享
发布于 2022-05-14 14:30
求后续
点赞 回复 分享
发布于 2022-05-09 19:46
求后续🤣
点赞 回复 分享
发布于 2022-05-01 17:25
楼主,能分享后面的面试经验吗🤗
点赞 回复 分享
发布于 2022-05-01 02:16
厉害了,感觉全都是力扣题和机器学习,加油鸭
点赞 回复 分享
发布于 2022-04-16 22:12
🤣为啥我有笔试
点赞 回复 分享
发布于 2022-04-07 21:25
楼主,您面试之参加笔试了吗?
点赞 回复 分享
发布于 2022-04-07 10:20

相关推荐

03-20 15:12
已编辑
门头沟学院 Java
上次抖音生态运营挂后,风控团队HR联系约面,HR姐姐电话里千叮咛万嘱咐,算法再刷刷(看来上次贪心二分IP段那个算法,留下了不太妙的面评)一面(2025-03-10)1. 常用的HTTP方法,以及使用场景2. HTTP协议Header字段举例3. Cookie和Token区别?为什么Token可以放到Authorization字段中?4. HTTP和HTTPS的区别?5. 中间人攻击怎么攻击的?(流程)中间人怎么获取到密钥?(ps:我研究生做密码学密钥协商的)6. 项目中的滚动分表如何考量?7. 缓存优化如何保证DB和缓存的一致性?8. 如果现在不只存冷数据,如果缓存中的数据有可能变更,怎么做一致性?9. Redis缓存过期时间是怎么设置的?10. 布隆过滤器在项目里面怎么用的?11. 12306 RocketMQ选型?对比其他消息队列有没有进行过对比?12. 手撕1:给一个域名,例如:www.douyin.com 反转成 com.douyin.www,要求使用JavaAPI和字节数组O(1)空间原地翻转两种形式。13. LRU,不允许使用LinkedHashMap,面试官说没时间了,口播下思路就行14. 反问二面(2025-03-13)1. 项目拷打2. 你项目里压测发现CPU占用过高,这是哪一块的CPU占用过高?压测的什么呢?3. 压测的目的是什么呢?4. 讲一下你的分布式锁是怎么实现的,讲一下怎么用的?5. 分布式锁用的redis里的哪个指令?6. 除了过期时间,分布式锁还有其他地方要考虑的吗?7. 除了redis,你了解过其他组件能帮助实现分布式锁吗(etcd,zookeeper等,还有mysql)?为什么最终选择了redis?8. 你后面提到你还是用redis做了缓存,这个缓存中是什么内容?9. 对于这种大量任务并发场景,用MQ来做会不会好一点?说一下你怎么改变一下设计?10. 那你觉得RocketMQ如果用的话,会有什么问题吗?11. MQ有什么机制能够帮助你实现你的调度时间这个特性?12. rocketmq延迟消息怎么实现的?13. 本来我希望十分钟后执行,但现在我改主意了,希望推迟执行,可是消息已经发送出去了,你该怎么处理?14. 大概说一下主键索引和唯一索引的区别15. 没有主键数据怎么存呢?16. 如果有主键,还会你说的rawid吗?17. 建表的时候,你一般考虑健什么索引?建多少索引?18. Epoll的边缘触发相较于水平触发而言,优化的主要是哪一块的开销?19. 为什么能够优化系统调用次数呢?20. 在实现一个网络库的时候,有哪些事件是可以不用监听的?举最简单的例子来说,缓冲区里的读事件、写事件、读写事件,你实现一个网络库不监听这些事件会有什么问题或好处?21. 引导:那你描述一下Epoll编程我怎么去监听一个事件?wait你要监听哪些东西,有哪些东西我其实可以不监听?(这个没答出来,对epoll的理解还是太浅了)22. 刚才你提到了一个很核心的词:状态变化。epoll的核心就是状态变化,那是不是有些状态变化我是可以不管的?23. 手撕:字节上次杭州那个部门挂的那道算法,这次做了点改动,又让我撕。感觉撕的比较顺利。24. 反问当天下午,感觉还行,问了HR啥时候出结果,HR说第二天,结果晚上直接给我挂了,哭。当天晚上觉得伤心,字节上又狂投十多个部门,结果均石沉大海,杳无音讯,这是因为啥脏的面评吗?(嘤~)
点赞 评论 收藏
分享
1. [明确性]   - 用户意图是否清晰传达?   - 是否存在歧义或多义表述?   - 示例对比:     × "写个故事"     √ "用300字编写一个科幻微小说,主题是时间循环,结局出人意料"2. [有效性]   - 输出结果与预期目标的匹配度   - 是否包含必要约束条件(格式/长度/风格等)     × "总结会议内容"     √ "用bullet points总结昨日产品评审会的三个核心决策,并标注相关负责人"3. [用户适配]   - 是否符合目标用户的语言习惯?   - 是否预设了合理的知识层级?     × 面向儿童:"阐释量子纠缠的波函数坍缩现象"     √ 面向儿童:"用小狗找骨头的故事解释远距离感应"4. [结构设计]   - 是否包含有效的上下文铺垫?   - 多步骤指令的逻辑连贯性     √ 优秀结构:       1) 设定角色:"你是一位资深营养师"       2) 限定条件:"针对糖尿病患者的春季食谱"       3) 输出要求:"以表格形式呈现,包含早中晚三餐"5. [风险控制]   - 是否规避敏感话题触发?   - 是否存在文化偏见风险?   - 示例改进:     × "比较不同宗教的优劣"     √ "客观陈述佛教与基督教的核心教义差异"6. [扩展性]   - 是否支持自然追问?   - 能否引发有价值的延伸对话?     √ 优秀prompt:       "先解释区块链基本原理,然后给出三个实际应用案例,最后分析当前面临的主要挑战"7. [效率优化]   - Token使用是否经济?   - 复杂任务是否进行分阶段处理?     × 单次请求:"详细分析2023全球新能源汽车市场,包括政策、技术、销量、竞争格局..."     √ 分步请求:       1) 政策环境分析       2) 关键技术突破       3) 头部企业对比8. [可测试性]   - 是否具备明确的验证标准?   - 能否通过A/B测试量化效果?     评估指标示例:     - 首次响应准确率     - 多轮对话维护率     - 用户修正次数9. [错误处理]   - 是否预设容错机制?   - 是否包含纠偏引导?     √ 优秀实践:       "如果问题涉及专业医疗建议,请提示'根据AI伦理准则,建议咨询执业医师'"10. [体验感知]    - 交互语气是否符合场景?    - 是否营造适当的对话温度?      示例对比:      × "输入你要问的问题"      √ "您好!今天想探讨什么有趣的话题呢?" #牛客激励计划#  #产品经理#  #找工作#  #牛客在线求职答疑中心#  #牛客解忧铺#  #秋招前后对offer的期望对比#  #AI# #牛客AI配图神器#
点赞 评论 收藏
分享
评论
19
122
分享

创作者周榜

更多
牛客网
牛客企业服务