这篇救了老命,我之前做项目没考虑Token限制,Prompt写得巨冗长,结果Demo跑两下就崩。看到你提的分层记忆架构才发现自己路走窄了,打算按这个逻辑重构下项目