字节又挂挂挂我!全程都很融洽都能被挂!

刚结束之前的流程就被捞起来了 全程大概1h15min
还是先自我介绍,提问论文(大概20min):
1.介绍一下论文的Transformer-based model
2.Embedding采用的方式
3.和Transformer的不同点
相比之前对项目的拷打这次的一面以机器学习基础知识为主(记不太全了)
1.Transformer哪几层有参数(qkv,LN),推一下Transformer中参数量O(n^2)
2.优化器了解吗,推导一下Adam
3.BN和LN区别
4.序列建模的方法了解吗,比如target attention
手撕:
1.手写LR反向传播
2.leetcode最长递增子序列 dp秒了
反问:
跟面试官聊了一下推荐的职业路线和如何学习,聊了很长时间
全部评论

相关推荐

1 5 评论
分享
牛客网
牛客企业服务