Datawhale AI夏令营 源2.0-2B AI应用
提交作品规则 & Task1案例:智能编程助手 - 飞书云文档 (feishu.cn)离线计算:在线计算:
·
提交作品规则 & Task1案例:智能编程助手 - 飞书云文档 (feishu.cn)

1. RAG概念理解
- 定义:RAG是结合检索和生成的方法,引入外部知识增强模型回答。
- 目的:解决大模型知识局限、数据安全和模型幻觉问题。
2. RAG基本步骤
- 索引:文档分割成文本块,构建向量索引。
- 检索:问题与文本块相似度计算,检索相关片段。
- 生成:检索片段作为背景,生成问题回答。
3. RAG链路构建
-
离线计算:
- 文档解析、切割,形成知识库。
- 文档片段向量化。
- 向量存入数据库管理。
-
在线计算:
- 根据Query检索知识。
- 召回大概率相关文档片段。
- 精排与重排提升检索效果。
4. 检索过程详解
- 召回:基于字符串匹配快速筛选文档。
- 精排:Query向量与Chunk向量相似度计算。
- 重排:重排模型提升检索准确性。
5. RAG效果提升
- 二阶段检索:重排模型优化结果,稳定准确率增长。
- 向量检索技术:faiss、annoy等提高检索速度。
6. RAG应用
- 检索文档片段与Query结合,形成prompt。
- 大模型利用知识生成有效回答。
更多推荐




所有评论(0)