第一个项目加上下面这些指标能显得更专业点吧,不然会感觉很像是常见的Demo。 latency p50/p95 QPS 成本 (cost per request) 并发量 SLA 命中率 / recall / rerank gain