小米多模态算法面经-一面

1、对多模态大模型的了解
2、目前的文生图、图生图的方法?
3、目前的图像或者视频编码器?
4、vit的大概原理
5、文本编码器?
6、目标检测iou计算代码
7、对chatgpt的了解
8、transformer结构介绍
9、transformer中encoder和decoder的区别
10、clip代码(面试过程有提到自己了解clip)
全部评论
佬,求个timeline
1 回复
分享
发布于 04-04 15:00 黑龙江
请问下,多模态大模型是指哪些?这些我平常只是听到,但是不知道是大模型指大语言模型和扩散Diffusion的生图模型
点赞 回复
分享
发布于 03-31 20:47 湖南
滴滴
校招火热招聘中
官网直投
佬,算法题难吗,问的啥
点赞 回复
分享
发布于 04-05 01:53 美国
实习还是春招呀
点赞 回复
分享
发布于 04-06 12:03 上海
点赞 回复
分享
发布于 04-10 22:38 广东

相关推荐

头像
04-16 19:40
已编辑
东北大学 计算机类
点赞 评论 收藏
转发
4 28 评论
分享
牛客网
牛客企业服务