检索增强生成

检索增强生成

检索增强生成

检索增强生成(Retrieval-Augmented Generation, RAG)是缓解LLM[[幻觉问题]]和知识更新慢的有效技术方案。

工作原理

RAG允许模型在回答前先搜索实时互联网或企业私有知识库,确保回答有据可依,且具备时效性。

优势

  • 缓解幻觉:通过引用外部知识源,减少模型编造事实的可能性
  • 知识更新:模型的知识停留在预训练结束的那一刻,RAG可以引入最新信息
  • 可追溯性:回答可以追溯到具体来源,增强可信度

局限性

RAG无法解决如何低成本地实时更新模型内部参数的问题,这是当前未解之谜。

分享到