Agent可观测性
Agent可观测性(Agent Observability)是指端到端地追踪、分析和回放AI Agent的完整行为过程的能力,包括工具调用、模型切换、推理路径、成本消耗等维度。这是Agent从“演示品”走向“生产力工具”的生死线,是企业级AI治理的基础。
与传统APM的区别
传统应用性能监控(APM)关注的是CPU、内存、接口延迟和错误码等基础设施指标。而Agent可观测性需要关注全新的维度:
- 提示词路径: Agent在每一步推理中使用的提示词
- 工具调用轨迹: Agent调用了哪些外部工具和API
- 模型切换: Agent在不同模型之间的切换记录
- 上下文污染: Agent上下文窗口中的信息污染情况
- 推理分叉: Agent在决策过程中的分支选择
- 成本消耗: 每一步的Token消耗和计算成本
关键能力
根据[[Sentry]]的开发者指南,Agent可观测性需要实现:
- 追踪(Trace): 完整记录Agent的行为链路
- 回放(Replay): 能够重现Agent的执行过程
- 分析(Analysis): 对Agent行为进行深度分析
- 归因(Attribution): 将成本和错误归因到具体步骤
市场信号
2026年4月,[[InsightFinder]]完成1500万美元融资,核心卖点就是帮助企业找出AI Agents出错的原因。这标志着企业AI进入第二阶段——从“先把Agent做出来”转向“让Agent在真实业务里可控、可管、可解释”。
相关概念
- [[Agent治理]] — 确保Agent可控、可管、可解释的机制
- [[链路风险]] — Agent在多步执行中错误被放大的复合风险
- [[企业级AI vs 消费级AI]] — 两种场景下对AI产品核心要求的差异
- [[多模型协作治理]] — 通过多个AI模型相互校验降低错误率的治理策略
- [[企业AI转型陷阱]] — 企业不加管控推进AI导致成本失控的普遍现象