
也是看连接里的视频学到了 https://v.douyin.com/AqrdGjD2MYg/ 09/19 fOX:/ d@A.GI 一、检索优化(8种)

二、分块优化(4种)

三、生成优化(3种)

⚡ 四、系统优化(2种)

优化效果对比优化前:┌─────────────────────────────────────┐│ 检索召回率: 45% → 85% (+40%) ││ 回答准确率: 60% → 92% (+32%) ││ 平均延迟: 5.2s → 1.8s (-65%) ││ Token 消耗: 4000 → 2500 (-37%) │└─────────────────────────────────────┘核心优化流程用户查询 │ ▼┌──────────────────┐│ 查询理解/扩展 │ ← 策略 1-3└────────┬─────────┘ │ ▼┌──────────────────┐│ 多路检索 │ ← 策略 4-7│ (向量+关键词) │└────────┬─────────┘ │ ▼┌──────────────────┐│ 重排序精选 │ ← 策略 6, 8└────────┬─────────┘ │ ▼┌──────────────────┐│ 上下文压缩 │ ← 策略 14└────────┬─────────┘ │ ▼┌──────────────────┐│ 优化 Prompt 生成 │ ← 策略 13└────────┬─────────┘ │ ▼ 最终答案关键结论RAG 优化是系统工程:检索、分块、生成每个环节都重要按需选择:不同场景(事实查询/代码生成/创意写作)用不同策略数据质量优先:垃圾进 → 垃圾出,先保证分块质量持续迭代:通过监控指标不断优化
还没有评论,来说两句吧...