主流LLM模型结构设计有什么特点 这个怎么回答呀,大佬?