RAG的核心

RAG大致分为6个流程

1. 导入将你的数据接入系统可能是PDF word内容网页内容这一步的目标就是要拿到干净的文本内容

2. 分块文档一般很长直接用的会有两个问题 1大模型的上下文窗口有限塞不下整篇文档 2我们检索时是找到最相关的一段而不是整篇文档比如你的产品手册可以按章节切或者固定字数去切切块也不能太大太大检索不够准确容易超出上下文限制太小语义不够完整上下文丢失一般控制在500-1000字以内相邻的块有一定的重叠比如重叠个100个字

3. 把文字变成向量这是RAG的核心将你的文本内容转换为数字这个由专门的Embedding模型完成

4. 索引 index 存进向量数据库向量算出来的普通数据库存结构性数据向量数据库专门存向量一般用的Milvus 在向量数据库中更新迭代快、社区活跃度高，同时也提供了较完善的可视化界面，上手和管理都比较方便我们存的时候向量和原文一起存后面检索出来要把原文给大模型看

5. 检索检索时会把用户的问题也转换为向量拿转换的向量去向量数据库去对比找出相似的文本块

6. 回答检索到的内容和用户问题打包发给大模型

评论