检索增强生成

检索增强生成

检索增强生成（Retrieval-Augmented Generation, RAG）是缓解LLM[[幻觉问题]]和知识更新慢的有效技术方案。

工作原理

RAG允许模型在回答前先搜索实时互联网或企业私有知识库，确保回答有据可依，且具备时效性。

优势

缓解幻觉：通过引用外部知识源，减少模型编造事实的可能性
知识更新：模型的知识停留在预训练结束的那一刻，RAG可以引入最新信息
可追溯性：回答可以追溯到具体来源，增强可信度

局限性

RAG无法解决如何低成本地实时更新模型内部参数的问题，这是当前未解之谜。