首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
课程
专栏·文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
mysterioussun
苏州大学 电子信息类
发布于江苏
关注
已关注
取消关注
@sdjhshbswp:
美团 腾讯 百度 淘天 大模型相关 日常实习面经
一些答的不好的八股问题总结 忘了很多 想到再更新答案和问题 1. llama 7b 为什么比其他基座好,与gpt3比做了什么改进:数据上质量更高,结构上用的RoPE+SwiGLUE2. GQA可以给训练加速吗:不可以,3. 检索增强怎么做的:4. 长度外推除了ROPE还有什么方法(长度外推一个是训练时数据没那么长导致的一些问题,一个是计算复杂度太高没那么多资源):局部注意力(平移不变性,感受野,window),插值,flashattetion, GQA5. Baichuan和chatglm2有什么不同,数据上,训练上,结构上6. Visualglm图片怎么处理的:blip-qformer7. Transformer结构,一层层讲:8. Visualbert什么结构:前text后visual,用faster-cnn和resnet-50提取视觉特征9. RLHF流程:一个actor,一个critic,一个reward model。将sft后的模型输出后生成回答,回答+答案输入RW得到分数(取最后一个token投影一下)10. Reward model怎么训练的,损失函数是什么:11. 提示工程的fewshot有什么做法:聚类12. Chatglm2与1有什么区别:prefix-decoder回归casual-decoder(原因1.多轮对话用prefix-decoder需要构造多个数据来训练,而casual可以直接用整个多轮对话数据,等效,且各个对话的权重不一样)(这个改动导致了2维编码的去除);gelu->swiglu;RMSnorm;flashattention;MQA13. Chatglm2对话权重不一样的原因:14. 为什么chatglm系列的用ptuning比lora好:都是清华一个实验室出的,配套效果吧15. Ptuning是怎么样做的大概讲讲:前面cocat可学习参数,多了一个MLP层,代码中在k,v矩阵中concat矩阵参数16. Lora怎么做的?为什么只调q,v矩阵或者q矩阵?别人实验这样做不代表在你这个场景下这样做就是对的?:17. 为什么模型都聚焦于decoder-only而不是encoder-only或者encoder-decoder:18. Self-consistency是什么
点赞 28
评论 4
全部评论
推荐
最新
楼层
秋招专场
校招火热招聘中
官网直投
相关推荐
鱼鱼搞点offer
05-28 12:02
菜鸟集团_研发部_计算机视觉算法工程师(准入职员工)
菜鸟集团25届实习内推
🔥菜鸟集团25届实习生招聘启动啦!看见很多自己内推的牛友没进面很难受,瞅了一圈简历,给大家几个简历小tip, 1.自我评价,重点强调为什么自己能胜任xx工作(尤其是非技术类) 2.工作经历公式 【star法则】 实习部分做的和岗位JD越贴合越好 3.校园经历,只挑跟应聘岗位相关的写,展现自己职业规划清晰划重点!暑期实习已启动!岗位设计研发类、算法类、产品类、物流类、米哈游、销售类、职能类,工作地点以杭州菜鸟总部园区为主,hc多多直通车!在招聘正式启动之前,同学可以通过提前内推通道投递简历,正式启动后第一时间可进入面试流程,先人一步拿offer【投递链接】https://jinshuju....
投递菜鸟集团等公司10个岗位 >
点赞
评论
收藏
转发
梦屿千寻a
05-27 11:27
已编辑
华南理工大学 机械类
华为
大家主管面都是聊天,我是压力面。主管面正式约了三次时间,加上微信上hr约时间,改了我五次面试时间。真是厉害通软,华为云,主管面已g
点赞
评论
收藏
转发
范晨
04-29 20:16
唐山师范学院 计算机类
7k 996
❤️职场感受7k 996 我看谁能去
点赞
评论
收藏
转发
程序员小白条
05-24 14:22
门头沟学院 计算机类
莉莉丝游戏工具开发一面 Java 面经
莉莉丝游戏工具开发一面 面试时长在 30 分钟左右,好像是做插件 CI/CD 之类的~ 没问计算机网络~ 1)简单的自我介绍 2)共享屏幕看了下两个项目,介绍下是为什么要做,然后亮点功能的业务流程 3)TypeScript 原理实现,转 JS 4)前后端怎么部署的,怎么上线 5)Redis 排行榜,数据结构 6)Redis 数据库和缓存一致性问题 7)Redis 限流 8)缓存击穿 9)缓存雪崩 10)死锁 11)分布式死锁 12)信号量 13)信号量和互斥锁区别和联系 14)并发项目优化点 15)SpringMVC 模型 16)平时喜欢玩游戏吗? 17)反问技术栈和业务,面试轮次 有问题请评...
莉莉丝游戏一面1人在聊
查看16道真题和解析
软件开发2024笔面经
点赞
评论
收藏
转发
点赞
收藏
评论
分享
回复帖子
提到的真题
返回内容
全站热榜
1
...
毕业第一课之租房攻略
4.7W
2
...
不要去美化那条自己没走过的路
1.0W
3
...
秋招≠高考,25届应该如何准备秋招
8257
4
...
面试避雷话术
6424
5
...
为什么都在劝退计算机国企?
5131
6
...
找工作第一课之如何写一份好的简历
4402
7
...
【🎁】25届硬件牛牛互助计划(1期)
4133
8
...
想知道双非的学长学姐都在简历上写什么进大厂了
3720
9
...
5.30 拼多多三面凉经
3665
10
...
结束了,研三一年应聘感受
3665
正在热议
#
和牛牛一起刷题打卡
#
8596次浏览
785人参与
#
机械制造薪资爆料
#
346723次浏览
4083人参与
#
牛客帮帮团来啦!有问必答
#
1044156次浏览
15875人参与
#
通信硬件薪资爆料
#
249038次浏览
2346人参与
#
你收到了团子的OC了吗
#
523441次浏览
6220人参与
#
春招你拿到offer了吗
#
396797次浏览
5735人参与
#
你怎么评价今年的春招?
#
8350次浏览
150人参与
#
本周投递记录
#
217198次浏览
5331人参与
#
晒一晒我的offer
#
3710946次浏览
57441人参与
#
腾讯工作体验
#
150357次浏览
1459人参与
#
担心入职之后被发现很菜怎么办
#
36425次浏览
307人参与
#
Offer比较,求稳定还是求发展
#
6563次浏览
82人参与
#
来选选带哪个offer回家过年
#
190848次浏览
1829人参与
#
设计人如何选offer
#
14432次浏览
281人参与
#
百度工作体验
#
28369次浏览
285人参与
#
实习生应该准时下班吗
#
87230次浏览
644人参与
#
我想象的工作vs实际工作
#
103715次浏览
1674人参与
#
字节跳动工作体验
#
72841次浏览
2008人参与
#
我发现了面试通关密码
#
375974次浏览
6959人参与
#
如何写一份好简历
#
308016次浏览
4396人参与
牛客网
牛客企业服务