先跑通最小推理demo再看vllm,思路没问题