检索增强生成
检索增强生成(Retrieval-Augmented Generation, RAG)是缓解LLM[[幻觉问题]]和知识更新慢的有效技术方案。
工作原理
RAG允许模型在回答前先搜索实时互联网或企业私有知识库,确保回答有据可依,且具备时效性。
优势
- 缓解幻觉:通过引用外部知识源,减少模型编造事实的可能性
- 知识更新:模型的知识停留在预训练结束的那一刻,RAG可以引入最新信息
- 可追溯性:回答可以追溯到具体来源,增强可信度
局限性
RAG无法解决如何低成本地实时更新模型内部参数的问题,这是当前未解之谜。