Agent可观测性

Agent可观测性

Agent可观测性（Agent Observability）是指端到端地追踪、分析和回放AI Agent的完整行为过程的能力，包括工具调用、模型切换、推理路径、成本消耗等维度。这是Agent从“演示品”走向“生产力工具”的生死线，是企业级AI治理的基础。

与传统APM的区别

传统应用性能监控（APM）关注的是CPU、内存、接口延迟和错误码等基础设施指标。而Agent可观测性需要关注全新的维度：

提示词路径: Agent在每一步推理中使用的提示词
工具调用轨迹: Agent调用了哪些外部工具和API
模型切换: Agent在不同模型之间的切换记录
上下文污染: Agent上下文窗口中的信息污染情况
推理分叉: Agent在决策过程中的分支选择
成本消耗: 每一步的Token消耗和计算成本

关键能力

根据[[Sentry]]的开发者指南，Agent可观测性需要实现：

追踪（Trace）: 完整记录Agent的行为链路
回放（Replay）: 能够重现Agent的执行过程
分析（Analysis）: 对Agent行为进行深度分析
归因（Attribution）: 将成本和错误归因到具体步骤

市场信号

2026年4月，[[InsightFinder]]完成1500万美元融资，核心卖点就是帮助企业找出AI Agents出错的原因。这标志着企业AI进入第二阶段——从“先把Agent做出来”转向“让Agent在真实业务里可控、可管、可解释”。

相关概念

[[Agent治理]] — 确保Agent可控、可管、可解释的机制
[[链路风险]] — Agent在多步执行中错误被放大的复合风险
[[企业级AI vs 消费级AI]] — 两种场景下对AI产品核心要求的差异
[[多模型协作治理]] — 通过多个AI模型相互校验降低错误率的治理策略
[[企业AI转型陷阱]] — 企业不加管控推进AI导致成本失控的普遍现象