评论详情-牛客网

还要加一些大模型算法的技术栈，pretraining，post training，后训练包括全参sft LoRA dpo ppo 蒸馏推理之类的