AI 代理开始烧钱以后，企业真正缺的是“成本控制面”

2026-06-19

2026-07-03

AI代理, 企业AI, AI基础设施, 成本治理, FinOps

摘要：企业 AI 的下一阶段，不是继续鼓励所有人多用模型，而是把模型、代理、工具调用、预算、权限和审计接成一套可控系统。AI 成本控制正在从财务问题变成产品架构问题。

AI 代理成本控制

过去一年，企业谈 AI 的语气大多是鼓励式的：让员工多用，让团队多试，让流程尽快接上模型。现在语气正在变。不是因为 AI 没用了，而是因为 AI 开始真正进入工作流以后，成本、权限和责任都变得不再可忽略。

如果一个员工每天问几次 ChatGPT，费用还像办公软件；如果一个代理自动读取文档、调用工具、搜索资料、生成代码、重试任务、跑评测、反复写入系统，它就不再是“一个用户在聊天”，而是一条不断消耗模型、上下文和外部服务的自动化流水线。

企业 AI 真正进入生产系统之后，第一道管理能力不是更漂亮的聊天界面，而是成本控制面。

代理成本和 SaaS 成本不是一回事

传统 SaaS 软件的费用相对容易理解：多少席位、什么版本、按月还是按年、有没有超额。企业采购可以提前做预算，财务可以按部门摊销，IT 可以根据账号数量估算成本。

AI 代理不一样。

它的成本不是固定席位，而是任务执行过程中的连续消耗。一次简单问答可能只消耗很少 token；一次长程代理任务可能会读入大量上下文，调用多个模型，多轮规划，反复验证，再把结果写回系统。更麻烦的是，代理为了“把事情做完”，天然会产生重试、分解、反思、验证和工具调用。能力越强，越可能在后台消耗更多资源。

这就是为什么 AI 成本不能只靠月底账单管理。等账单出来，问题已经发生了。

真正的企业级 AI 管理，必须在运行时就知道：谁在用、用在哪个项目、调用了哪个模型、任务属于哪个业务目标、有没有预算上限、有没有异常循环、有没有越权访问、有没有比当前模型更便宜的替代路径。

换句话说，AI 成本治理不是财务报表，而是运行时基础设施。

OpenAI 和 Databricks 的新动作说明风向变了

6 月中旬，OpenAI 发布了面向 ChatGPT Enterprise 的 credit usage analytics 和更新后的 spend controls。它的重点很明确：让企业看到信用用量、理解组织内部的采用模式，并围绕团队工作方式设置限制。这个信号很重要，因为它说明模型提供商也意识到，企业客户要的不只是“能力更强”，还要“可见、可控、可解释”。

几乎同一时间，Databricks 在 Data + AI Summit 相关更新里把 Unity AI Gateway 推到更靠前的位置。它强调的不只是模型服务，而是跨提供商的统一成本管理、支出可见性、细粒度归因、硬预算上限、智能路由、模型与代理运行时的治理和防护。Axios 的报道也提到，企业客户可能在 AI 使用上出现单月数千万美元级别的意外支出，因此需要防止 runaway spend 的控制机制。

这些动作合在一起看，说明企业 AI 正在从“工具采用阶段”进入“控制面建设阶段”。

早期，企业最关心的是员工愿不愿意用 AI。现在，企业开始关心另一个问题：如果大家都开始用，系统能不能承受？账单能不能预测？敏感数据会不会乱流？代理会不会在没人看着的时候反复调用昂贵模型？

这不是保守，而是成熟。

真正贵的不是模型，而是不受控的工作流

很多人讨论 AI 成本时，喜欢比较模型单价。这个视角太窄。

模型单价当然重要，但真正决定企业成本的，是工作流设计。

同样一个任务，可以有很多种做法。最粗暴的做法，是把所有上下文都塞给最强模型，让它一次性回答。更成熟的做法，是先用轻量模型做分类和路由，再只把关键片段交给强模型；先用检索缩小范围，再让模型处理证据；先用规则过滤明显无效任务，再调用代理；对高风险操作设置人工确认，对低风险操作自动执行。

这就是 AI 时代的 FinOps 不再只是采购谈价，而是架构设计。

谁负责把任务拆成不同成本层级？谁决定什么时候用强模型，什么时候用小模型？谁定义代理最多可以重试几次？谁监控某个用户、部门或项目突然暴涨的调用量？谁判断一次昂贵调用是否真的产生了业务价值？

这些问题如果没有答案，企业就会在“大家都在用 AI”的热闹里慢慢失控。

AI 成本控制面至少要管五件事

第一是用量归因。企业必须知道每一笔模型消耗归属于哪个用户、团队、项目、代理、模型和业务流程。没有归因，就没有治理。

第二是预算上限。AI 不能只做事后提醒，必须能在运行时阻断异常消耗。尤其是代理任务，一旦进入错误循环，事后告警已经太晚。

第三是模型路由。不是所有任务都需要最强模型。企业需要一套路由策略，把简单任务、批处理任务、检索任务、推理任务、代码任务和高风险任务分层处理。

第四是权限和工具边界。模型调用本身只是成本的一部分，代理接入数据库、代码仓库、CRM、邮件、财务系统以后，真正的风险来自工具调用。成本控制面必须和权限控制面合在一起。

第五是价值回收。企业不能只看“用了多少 token”，还要看这些 token 让哪个流程缩短、哪个成本下降、哪个客户响应变快、哪个工程问题被解决。否则 AI 很容易变成又一个看起来先进但很难算账的技术预算黑洞。

对创业公司和企业内部团队的启发

如果你在做企业 AI 产品，不要只把精力放在“模型效果更好”上。未来客户真正愿意长期付费的，往往是让 AI 可运营的能力：监控、审计、预算、权限、路由、评测、回滚、追责。

如果你是企业内部 AI 负责人，也不要只追求“全员 AI 使用率”。这个指标很容易虚高。更好的指标是：哪些流程被 AI 稳定改造了，哪些任务有明确节省，哪些代理有可审计的执行记录，哪些成本可以被解释，哪些失败可以被及时阻断。

AI 的真正落地，不是让每个人都多开一个聊天窗口，而是把模型变成企业工作流中可治理的一部分。

未来的企业 AI 平台，很可能会越来越像云平台早期的演化路径。先是大家兴奋地开机器，后来发现账单失控，于是出现资源标签、预算、成本中心、自动伸缩、权限策略、监控告警和 FinOps。AI 现在正在经历同样的过程，只是速度更快，风险更复杂。

所以这一轮值得关注的不是“企业开始少用 AI 了”，而是企业终于开始认真建设 AI 的控制系统。

会用 AI 只是第一阶段。

用得起、管得住、算得清，才是第二阶段。

参考资料

OpenAI：《New usage analytics and updated spend controls for enterprises》，2026-06-18，https://openai.com/index/chatgpt-enterprise-spend-controls/
Databricks：《AI governance at Data + AI Summit 2026: What’s new with Unity AI Gateway》，2026-06-16，https://www.databricks.com/blog/ai-governance-data-ai-summit-2026-whats-new-unity-ai-gateway
Databricks：《Building an open ecosystem for AI governance with Unity AI Gateway》，2026-06-17，https://www.databricks.com/blog/building-open-ecosystem-ai-governance-unity-ai-gateway
Axios：《Exclusive: Databricks rolls out AI spend controls》，2026-06-16，https://www.axios.com/2026/06/16/databricks-stop-ai-overspend-tokenmaxxing
Financial Times：《We created a monster: companies rein in AI usage as costs strain budgets》，2026-06-19，https://www.ft.com/content/1d37cc08-e0aa-45a4-a45d-4ad282529314

AI技术