微软 bing LLM 应用面经

这次面的是工程院 bing 团队的 LLM 应用组,问的问题量不大,有一些比较开放性的问题比较有意思。
1.自我介绍 两面都有
2. 主要会根据项目做一些介绍,这个一面久,二面短一些。
3. 一面问了 transformer 结构
4. 有没有做过大模型之外的 NLP 相关的内容(简单讲了讲)
二面的开放性问题
5. 做 rag 应用的时候, 如果幻觉问题严重怎么办?比如已经给了很多 rag 召回的内容了,但是还是错误很多,尤其是一些时间数字类的信息,很容易不准确。(我回答:类似于指令微调,构造对应的数据集, 微调强化大模型对检索的内容的跟随能力)
6.接着上面,那你觉得这种数据集怎么构造呢? 检索的内容和问题很好弄,但是答案怎么获取方便?(我: 我觉得可以反向构造,我先从网络上爬一堆内容作为答案,比如把新闻里的一些信息作为答案,然后让大模型比如 gpt4 生成对应的问题, 再检索召回相关的内容,构造数据集。 面试官说这个想法还挺有意思的)
7. 我想通过加噪声的方式提高模型的鲁棒性, 你觉得这个噪声应该怎么加好? 或者说怎么确定加在 token 的什么位置,加什么 token?(不太懂,我就说从我一般的理解,加噪声都是从 embedding 去加的, 比如随机加一些高斯噪声提高鲁棒性)
8.如果我做 rag 召回的相关内容里,会有人恶意注入了一些错误的信息, 你觉得会影响大模型的生成内容吗?怎么避免?(我认为肯定会有影响, 因为关注的信息有错。 我觉得可以提高召回的信息量, 从而稀释错误信息占比来解决)
9.接着上面的回答, 我们的输入长度有限制,不能无限加召回的内容怎么办?(可以在检索召回链路中再加一层,类似于粗排后再精排一次,从而减少错误信息的量)
其他的不记得了,就是感觉现在面试很喜欢问一些开放性问题。
代码题
一面编辑距离, 二面是一个有序数组左边平移一定位置后的数组,找到一个 target 的下标。都不算难。
全部评论
微软 北京 算是你校的大本营哈哈哈 占比不小
2
送花
回复
分享
发布于 04-05 18:47 江西
面了很多大模型暑期机会,面对一些开放性问答的时候感觉是最容易博得面试官好感的部分,大佬太强了!持续关注交流
1
送花
回复
分享
发布于 04-01 15:10 广东
滴滴
校招火热招聘中
官网直投
问下大佬,微软哪里投呀
点赞
送花
回复
分享
发布于 03-30 23:11 北京
其实我觉得加噪声应该在数据集上就加,一种是人产生的噪声,这是有固定模式的;另一种,就是模型训练的本身的噪声了。
点赞
送花
回复
分享
发布于 04-06 03:57 江西
佬有拿到oc吗
点赞
送花
回复
分享
发布于 04-06 21:31 北京
想问下LLM应用这个方向招的公司多吗
点赞
送花
回复
分享
发布于 04-15 22:18 广东

相关推荐

4.26更新:4.23HR面后进入录用评估,昨天已收到offer邮件!祝大家也早日收到满意的offer!#晒一晒我的offer#—— —— —— —— —— —— —— —— —— ——10分钟后更新:发面经真的会有好运!10分钟后状态就更新为HR面了—— —— —— —— —— —— —— —— —— ——#如何判断面试是否凉了#4.10初试,4.16复试后面试官让等HR电话,目前官网还是复试链接状态,慌得一批。。。听说发面经有好运,许愿早日进HR面!初试:(约50分钟)1. 面试官介绍部门2. 自我介绍3. 聊简历4. 八股    Q:如何规范LLM的回答?    A:1.SFT微调;2.上下⽂学习(prompt中给例⼦);3.涉及到专业领域时,使⽤RAG    Q:RAG实现?    A:1.分割文档 2.使⽤向量模型将文档转为向量(对⽐学习,双塔模型)3.将向量灌⼊向量数据库;4.将⽤⼾query转为向量,并在向量数据库中检索;5.设置距离阈值,将前n个最相关的结果给到大模型    Q:Transformer中的⾃注意⼒?    A:将每个token embedding与Wq,Wk,Wv相乘得到Q,K,V。对于每个token,计算其Q与所有token的K之间的点乘,通过softmax转为系数,与对应token的V相乘得到与该token的注意⼒。    Q:Transformer中的Q与K点乘后,为什么要除以根号下dk?    A:点乘当dk较⼤时,会导致结果较⼤,经过softmax后可能会导致梯度消失。除以根号下dk相当于正则化,防⽌梯度消失    Q:SVM基本原理?    A:最⼤化超平⾯和⽀持向量之间的margin    Q:SVM是⼆分类模型,如何处理多分类问题?    A:训练多个⼆分类SVM模型对应于每个类别,判断样本是否属于该类,最后根据每个模型结果的置信度得到结果    Q:SVM是线性模型,如何处理⾼维问题?    A:使⽤核函数对数据进⾏升维5. 算法题:DFS模版题,较简单6. 提问环节    Q:有什么可以提⾼的地⽅?    A:多了解模型微调复试:聊简历,一道算法题,20分钟结束算法题:给定字符串,输出其中不包含重复元素的最长子串的长度
点赞 评论 收藏
转发
9 30 评论
分享
牛客网
牛客企业服务