公司的大模型微调项目怎么学

如题 鼠鼠目前正在进行一段大模型agent的实习 实习了四个月了捏 
但每天就只是看看agent的论文
设计设计项目流程
然后无法接触大模型微调或预训练
鼠鼠拿到了项目微调的代码
鼠鼠想问问各位大哥 对于这个微调项目侧重需要弄懂哪里呢 鼠鼠现在学习了Megatron 和deep speed 还有模型结构 分词方法 还有别的咩 #牛客帮帮团来啦!有问必答#  #不给转正的实习,你还去吗#
全部评论
m
点赞 回复
分享
发布于 04-27 14:09 江苏
了解megatron和deepspeed不就行吗,知道原理面试能说出来也算是实践了啊,或者问问同组做这个的前辈咋做的也行啊
点赞 回复
分享
发布于 04-27 14:11 北京
联想
校招火热招聘中
官网直投
最好还是有创新,解决了一些问题。
点赞 回复
分享
发布于 05-03 10:34 北京

相关推荐

1 1 评论
分享
牛客网
牛客企业服务