我也是大模型推理加速这个方向,一般都要哪些技术栈呀?