多模型协作治理

多模型协作治理

多模型协作治理是一种企业级AI治理策略，通过引入多个AI模型相互校验、审稿、比较，以降低单模型的幻觉和错误率。微软的[[Critique]]和[[Council]]机制是这一策略的代表性实践。

核心逻辑

承认单模型不完美: 没有任何一个模型是万能的，每个模型都有盲点
通过机制降低错误: 利用多模型交叉验证发现单模型无法察觉的错误
流程提高可验证性: 通过结构化的校验流程确保输出质量

实现方式

相互校验（Critique）: 让不同模型对同一任务进行审稿和批评
相互比较（Council）: 让不同模型对同一任务进行对比评估
能力互补: 引入外部模型（如[[Anthropic]]）补充现有模型的能力短板

优缺点

优点:

显著降低幻觉率和错误率
提高输出的可靠性和可信度
接近企业治理逻辑，易于融入现有流程

潜在问题:

增加计算成本和延迟
多模型协作本身也需要被观测和治理
可能导致治理的无限递归问题

相关概念

[[Agent治理]] — 确保Agent可控、可管、可解释的机制
[[Agent可观测性]] — 端到端追踪AI Agent行为过程的能力
[[链路风险]] — Agent在多步执行中错误被放大的复合风险
[[企业级AI vs 消费级AI]] — 两种场景下对AI产品核心要求的差异