RAG系统(检索增强生成)
RAG(Retrieval-Augmented Generation)是 AI 工程中解决 LLM 知识过时和幻觉问题的核心技术架构。它通过检索企业私有数据,将"通用模型"改造为"懂业务的系统",被视为企业 AI 应用的"脊梁"。
关键技术点
- 文档处理:PDF、网页、会议纪要、转录文本等内容清洗与切分
- Chunking 策略:固定长度切分 vs 语义切分
- 向量数据库:Pinecone、Weaviate、Qdrant、pgvector、Elasticsearch
- 检索优化:Hybrid Search、Reranking、Query Rewrite
典型项目
- 内部 FAQ 助手
- 文档智能问答系统
- 企业知识库搜索平台
与现有维基的连接
RAG 是 [[you-are-not-using-agent-you-are-leading-ai-junior-engineers]] 中"AI 初级工程师"团队的核心能力之一,也是 [[why-enterprise-all-in-ai-dies-in-two-months-20260425]] 中企业 AI 转型成功的关键技术基础。