还要加一些大模型算法的技术栈,pretraining,post training,后训练包括全参sft LoRA dpo ppo 蒸馏推理之类的