什么是RAG?

RAG 概念最早是 2020 年 Meta（当时还叫 Facebook AI）的研究团队提出的。他们的思路很直接：与其让模型把所有东西都记在脑子里，不如教它"先查资料，再回答"。这样一来，模型的回答就有据可依了——既利用了大模型理解语义的能力，又能接入最新的、私有的知识库数据。

我觉得了解什么事RAG之前要了解什么事LLM 大模型因为RAG是一种将强大的信息检索 (Information Retrieval, IR) 技术与生成式大语言模型 (LLM) 相结合的框架。

简单的说大模型是一个把互联网的海量知识数据喂给模型让模型具有语言规律世界常识和推理能力这样的大模型会有一些问题比如

幻觉问题它会一本正经的胡说八道给你生成一个看起来合理却完全错误的内容因为大模型推理本质是预测概率最高的词它并不理解真正意思它对某个问题不知道时它就开始胡说八道了

时效性问题模型的知识内容是截止到你训练截止的时间

私有数据无法获取因为大模型是在公开数据训练无法访问你自己企业的数据机密文件

无法追溯大模型的回答无法给你提供出处

所以就出现了RAG 在让 LLM 回答问题或生成文本之前，先从一个大规模的知识库（如数据库、文档集合）中检索出相关的上下文信息，然后将这些信息与原始问题一并提供给 LLM，从而“增强”其生成能力，使其能够产出更准确、更具时效性、更符合特定领域知识的回答。

下面列举几个最常见的场景：

评论