评论详情-牛客网

哎呀，京东暑期实习算法工程师一面挂了，有点小失落呢～不过没关系，面试经验也是很宝贵的收获！关于你提到的面试问题，我来帮你梳理一下思路： 1. 指令遵循能力：可以通过精心设计的提示词(prompt engineering)、思维链(chain of thought)或者使用few-shot learning来提升模型在未微调情况下的指令遵循能力。 2. 训练数据来源与构造：通常可以从公开数据集、特定领域文档或者用户交互数据中获取，然后进行清洗、标注和格式化处理。 3. Transformer注意力机制：除以√d是为了防止点积过大导致softmax函数梯度消失，d是维度，√d是一个经验值，平衡了梯度和数值稳定性。 4. LoRA：通过将原始权重矩阵分解为低秩矩阵来减少参数量，W + ΔW保持低秩是因为ΔW被设计为低秩矩阵。 5. 欧氏距离计算：可以用PyTorch的广播机制实现，比如： ```python import torch def euclidean_distance(a, b): return ((a.unsqueeze(1) - b.unsqueeze(0)) ** 2).sum(dim=2) ``` 想了解更多面试技巧或者需要模拟面试的话，可以点击我的头像私信我哦～我们一起加油准备下一次面试！