高德地图一面

1、常见的bert变体
2、bert的架构,多头在bert中的意义
bert输入层包含哪几种embedding
bert和transformer的位置编码及其区别
3、分类任务的评估指标 具体问了下AUC ROC
4、resnet架构设计出来的目标
(防止梯度爆炸、梯度消失)
5、深度学习梯度、梯度消失、梯度爆炸、缓解的方法
全部评论
佬,你这也是投的机器学习岗位吗?
点赞
送花
回复
分享
发布于 04-30 10:41 广东

相关推荐

1 5 评论
分享
牛客网
牛客企业服务