摘要:企业 AI 的下一阶段,不是继续鼓励所有人多用模型,而是把模型、代理、工具调用、预算、权限和审计接成一套可控系统。AI 成本控制正在从财务问题变成产品架构问题。

过去一年,企业谈 AI 的语气大多是鼓励式的:让员工多用,让团队多试,让流程尽快接上模型。现在语气正在变。不是因为 AI 没用了,而是因为 AI 开始真正进入工作流以后,成本、权限和责任都变得不再可忽略。
如果一个员工每天问几次 ChatGPT,费用还像办公软件;如果一个代理自动读取文档、调用工具、搜索资料、生成代码、重试任务、跑评测、反复写入系统,它就不再是“一个用户在聊天”,而是一条不断消耗模型、上下文和外部服务的自动化流水线。
企业 AI 真正进入生产系统之后,第一道管理能力不是更漂亮的聊天界面,而是成本控制面。
代理成本和 SaaS 成本不是一回事
传统 SaaS 软件的费用相对容易理解:多少席位、什么版本、按月还是按年、有没有超额。企业采购可以提前做预算,财务可以按部门摊销,IT 可以根据账号数量估算成本。
AI 代理不一样。
它的成本不是固定席位,而是任务执行过程中的连续消耗。一次简单问答可能只消耗很少 token;一次长程代理任务可能会读入大量上下文,调用多个模型,多轮规划,反复验证,再把结果写回系统。更麻烦的是,代理为了“把事情做完”,天然会产生重试、分解、反思、验证和工具调用。能力越强,越可能在后台消耗更多资源。
这就是为什么 AI 成本不能只靠月底账单管理。等账单出来,问题已经发生了。
真正的企业级 AI 管理,必须在运行时就知道:谁在用、用在哪个项目、调用了哪个模型、任务属于哪个业务目标、有没有预算上限、有没有异常循环、有没有越权访问、有没有比当前模型更便宜的替代路径。
换句话说,AI 成本治理不是财务报表,而是运行时基础设施。
OpenAI 和 Databricks 的新动作说明风向变了
6 月中旬,OpenAI 发布了面向 ChatGPT Enterprise 的 credit usage analytics 和更新后的 spend controls。它的重点很明确:让企业看到信用用量、理解组织内部的采用模式,并围绕团队工作方式设置限制。这个信号很重要,因为它说明模型提供商也意识到,企业客户要的不只是“能力更强”,还要“可见、可控、可解释”。
几乎同一时间,Databricks 在 Data + AI Summit 相关更新里把 Unity AI Gateway 推到更靠前的位置。它强调的不只是模型服务,而是跨提供商的统一成本管理、支出可见性、细粒度归因、硬预算上限、智能路由、模型与代理运行时的治理和防护。Axios 的报道也提到,企业客户可能在 AI 使用上出现单月数千万美元级别的意外支出,因此需要防止 runaway spend 的控制机制。
这些动作合在一起看,说明企业 AI 正在从“工具采用阶段”进入“控制面建设阶段”。
早期,企业最关心的是员工愿不愿意用 AI。现在,企业开始关心另一个问题:如果大家都开始用,系统能不能承受?账单能不能预测?敏感数据会不会乱流?代理会不会在没人看着的时候反复调用昂贵模型?
这不是保守,而是成熟。
真正贵的不是模型,而是不受控的工作流
很多人讨论 AI 成本时,喜欢比较模型单价。这个视角太窄。
模型单价当然重要,但真正决定企业成本的,是工作流设计。
同样一个任务,可以有很多种做法。最粗暴的做法,是把所有上下文都塞给最强模型,让它一次性回答。更成熟的做法,是先用轻量模型做分类和路由,再只把关键片段交给强模型;先用检索缩小范围,再让模型处理证据;先用规则过滤明显无效任务,再调用代理;对高风险操作设置人工确认,对低风险操作自动执行。
这就是 AI 时代的 FinOps 不再只是采购谈价,而是架构设计。
谁负责把任务拆成不同成本层级?谁决定什么时候用强模型,什么时候用小模型?谁定义代理最多可以重试几次?谁监控某个用户、部门或项目突然暴涨的调用量?谁判断一次昂贵调用是否真的产生了业务价值?
这些问题如果没有答案,企业就会在“大家都在用 AI”的热闹里慢慢失控。
AI 成本控制面至少要管五件事
第一是用量归因。企业必须知道每一笔模型消耗归属于哪个用户、团队、项目、代理、模型和业务流程。没有归因,就没有治理。
第二是预算上限。AI 不能只做事后提醒,必须能在运行时阻断异常消耗。尤其是代理任务,一旦进入错误循环,事后告警已经太晚。
第三是模型路由。不是所有任务都需要最强模型。企业需要一套路由策略,把简单任务、批处理任务、检索任务、推理任务、代码任务和高风险任务分层处理。
第四是权限和工具边界。模型调用本身只是成本的一部分,代理接入数据库、代码仓库、CRM、邮件、财务系统以后,真正的风险来自工具调用。成本控制面必须和权限控制面合在一起。
第五是价值回收。企业不能只看“用了多少 token”,还要看这些 token 让哪个流程缩短、哪个成本下降、哪个客户响应变快、哪个工程问题被解决。否则 AI 很容易变成又一个看起来先进但很难算账的技术预算黑洞。
对创业公司和企业内部团队的启发
如果你在做企业 AI 产品,不要只把精力放在“模型效果更好”上。未来客户真正愿意长期付费的,往往是让 AI 可运营的能力:监控、审计、预算、权限、路由、评测、回滚、追责。
如果你是企业内部 AI 负责人,也不要只追求“全员 AI 使用率”。这个指标很容易虚高。更好的指标是:哪些流程被 AI 稳定改造了,哪些任务有明确节省,哪些代理有可审计的执行记录,哪些成本可以被解释,哪些失败可以被及时阻断。
AI 的真正落地,不是让每个人都多开一个聊天窗口,而是把模型变成企业工作流中可治理的一部分。
未来的企业 AI 平台,很可能会越来越像云平台早期的演化路径。先是大家兴奋地开机器,后来发现账单失控,于是出现资源标签、预算、成本中心、自动伸缩、权限策略、监控告警和 FinOps。AI 现在正在经历同样的过程,只是速度更快,风险更复杂。
所以这一轮值得关注的不是“企业开始少用 AI 了”,而是企业终于开始认真建设 AI 的控制系统。
会用 AI 只是第一阶段。
用得起、管得住、算得清,才是第二阶段。
参考资料
- OpenAI:《New usage analytics and updated spend controls for enterprises》,2026-06-18,https://openai.com/index/chatgpt-enterprise-spend-controls/
- Databricks:《AI governance at Data + AI Summit 2026: What’s new with Unity AI Gateway》,2026-06-16,https://www.databricks.com/blog/ai-governance-data-ai-summit-2026-whats-new-unity-ai-gateway
- Databricks:《Building an open ecosystem for AI governance with Unity AI Gateway》,2026-06-17,https://www.databricks.com/blog/building-open-ecosystem-ai-governance-unity-ai-gateway
- Axios:《Exclusive: Databricks rolls out AI spend controls》,2026-06-16,https://www.axios.com/2026/06/16/databricks-stop-ai-overspend-tokenmaxxing
- Financial Times:《We created a monster: companies rein in AI usage as costs strain budgets》,2026-06-19,https://www.ft.com/content/1d37cc08-e0aa-45a4-a45d-4ad282529314