优点
1. 成本低 上手快
想让你的大模型懂你的业务知识 拿你的数据去微调模型 二用RAG把知识喂给大模型 微调模型要准备训练数据 要算力 要时间 RAG只需要你将文档灌进向量库
2. 知识更新方便
微调完的模型 知识就固话了 你想更新你得再去微调一轮 RAG不一样 文档有变动重新处理一个就好了 对于知识频繁改动的场景 这点很重要
3. 答案可以追溯 大模型在回答时你能看到他参考了那些文档 用户觉得答案有问题可以去查验原文
缺点
1. 如果你的文档质量差组织乱 那么他检索的内容好不到哪里去 RAG的上限取决于你喂给他的数据
2. 系统复杂度上来了 原本直接调大模型就完事,现在多了文档处理、向量存储、检索排序这些环节,链路变长了。任何一个环节出问题,最终效果都会打折扣。调试起来也比单纯调模型麻烦
3. 检索耗时 检索环节能占整个 RAG 流程耗时的 60% 以上。如果业务对延迟敏感,这块得重点优化