从“人人都用最强模型”到“先看预算”:企业开始给 AI 使用踩刹车

摘要:当高端模型被员工、代码代理和办公自动化流程大规模调用时,企业很快发现,AI 账单可能比生产力提升更早冲到管理层面前。

过去一年,企业 AI 的口号是“让每个员工都拥有一个智能助手”。

但到了 2026 年中,另一个现实开始浮出水面:当 GPT-5.5、Claude Opus 4.6 这类高端模型被员工、代码代理和办公自动化流程大规模调用时,账单可能比生产力提升更快出现。

花旗、Atlassian、Adobe 等公司的案例显示,企业 AI 已经从“能力实验”进入“成本治理”阶段。

AI 办公室里的成本警报

当每一次提示词、每一次代码代理运行、每一次长文档分析都变成可计费 token,AI 不再只是生产力工具,也成为新的预算变量。

账单为什么突然失控

404 Media 报道称,多家科技、娱乐、银行等行业公司正在限制员工使用 AI,并要求员工改用较弱、较便宜的模型。该报道依据包括泄露的 Slack 聊天、内部仪表盘截图和邮件等材料。在其中一个案例里,AI 支出据称已经增长到每月超过 1500 万美元。

AI Weekly 对这篇报道的摘要进一步列出几个具体案例:Atlassian 的月度 AI 支出据称从 2025 年 8 月约 500 万美元升至 2026 年 5 月超过 1500 万美元;花旗在 6 月 24 日关闭了 Claude Opus 4.6、4.7 和 GPT-5.5 的访问,理由是这些模型每次交互消耗更多 AI Credits;Adobe 则计划结束无限 Claude 访问。

这些数字之所以重要,不只是因为它们大,而是因为它们揭穿了一个企业 AI 部署中的常见幻觉:AI 成本不是一次性采购,也不只是固定座席费。随着企业把 AI 嵌入 IDE、浏览器、文档、客服、数据分析、代码审查和自动化代理,每一次调用都会变成持续发生的边际成本。

高级模型的强大,正是它昂贵的原因

GPT-5.5 和 Claude Opus 4.6 这类前沿模型的卖点,恰恰是能处理更长上下文、更复杂任务和更长时间的代理式工作。

OpenAI 在 GPT-5.5 发布说明中称,该模型面向编码、研究、数据分析、文档与电子表格生成、软件操作等复杂任务,并在 API 中标出 gpt-5.5 的价格为每 100 万输入 token 5 美元、每 100 万输出 token 30 美元;gpt-5.5-pro 的价格更高,为每 100 万输入 token 30 美元、每 100 万输出 token 180 美元。

Anthropic 对 Claude Opus 4.6 的介绍也显示,它面向更困难的编码、代理和企业工作流,并提供 effort 控制,让开发者在智能、速度和成本之间调节;其 API 价格为每 100 万输入 token 5 美元、每 100 万输出 token 25 美元。

这就解释了企业为什么会从“鼓励多用”转向“按任务选择模型”。一个员工偶尔问几个问题,成本可能可以忽略;但一个代码代理反复读仓库、搜索文件、生成补丁、运行测试、修复错误,就可能在短时间内消耗大量输入与输出 token。

真正烧钱的不是聊天框,而是被自动化流程放大的循环调用。

“无限使用”可能只是补贴期

早期企业 AI 采购常带有一种 SaaS 式想象:买一个座席,员工就可以无限使用。但大模型的成本结构更像云计算、数据库查询或 GPU 任务队列。用得越多,成本越高;模型越强,单位成本越高;上下文越长,账单越不可预测。

这也是为什么一些公司开始取消无限访问、引入 token 上限、关停排行榜、降低默认模型等级,甚至只允许特定岗位使用最高端模型。

ITPro 报道称,Accenture 也因 token 支出快速上升而要求部分员工减少不必要的 AI 使用,并提到多家企业正在引入 token caps 和 spending limits。

这并不意味着企业不再相信 AI。恰恰相反,企业已经开始把 AI 当作真实基础设施来管理。

只有当一种技术进入核心工作流,财务部门才会严肃追问:谁在用?用在哪?带来多少收入、节省多少时间、减少多少风险?每一美元 token 是否值得?

企业 AI 成本治理闭环

企业不应只问“能不能用 AI”,还要问“这个任务需要什么等级的模型、预算归属在哪里、产出如何衡量”。

企业接下来会怎么做

第一,高级模型会从“默认工具”变成“受控资源”。

过去员工可能习惯于所有任务都调用最强模型;未来,写邮件、整理会议纪要、普通问答可能会被路由到便宜模型,只有复杂代码、法律分析、投研建模、关键客户场景才允许使用顶级模型。

第二,AI 成本会被分摊到部门和项目。

一个平台团队统一采购 AI,但真正消耗 token 的可能是工程、销售、客服、财务或法务。没有成本归属,就没有行为约束。Atlassian 推出成本追踪面板这类做法,本质上是把“看不见的 AI 消耗”变成“每个团队可见的预算项”。

第三,企业会建立模型路由和降级机制。

同一个任务可以有多种解法:先用小模型分类,再用中端模型生成,再把最关键的一步交给高端模型;或者对长上下文做摘要、缓存和去重,避免重复把同一批材料喂给模型。Anthropic 对 Opus 提到 prompt caching 和 batch processing 可节省成本,这类机制会成为企业 AI 工程的标配。

第四,AI 项目会被迫证明 ROI。

以前“员工喜欢用”“看起来很先进”足以推动试点;现在不够了。企业会追踪每个 AI 工作流节省了多少工时、减少了多少返工、提升了多少转化率,或者是否只是把普通任务变成了昂贵的自动化表演。

真正的问题不是“AI 太贵”,而是“贵得不透明”

AI 成本上涨并不一定是坏消息。某些任务即便花费高,只要能替代高价值专家时间、减少严重错误、缩短产品周期,仍然值得投入。

问题在于,许多企业此前没有把 AI 成本、质量和产出绑定起来,只看到了使用量增长,却没有看到单位经济模型。

这就是 2026 年企业 AI 的转折点:从“全员试用”转向“精细化运营”。谁能把模型能力、业务价值和财务约束放进同一个系统里,谁就能继续扩大 AI 使用;谁还停留在“给员工开通最强模型就等于数字化转型”,谁就会先遇到账单。

AI 的下一轮竞争,是成本控制能力的竞争

花旗、Atlassian、Adobe 等案例提示我们,企业 AI 的瓶颈不只是模型智商,也不只是员工采纳率,而是成本治理能力。前沿模型会继续变强,但企业不会无限制地为每一次调用买单。

未来成熟的 AI 企业,不会只问“我们能不能接入最强模型”,而会继续追问:

  • 这个任务值不值得用最强模型?
  • 能不能先用便宜模型完成 80%?
  • 能不能缓存、批处理、压缩上下文?
  • 这个 AI 工作流的收益是否覆盖 token、工程和管理成本?

AI 不是从办公室退场了,而是从“免费兴奋剂”变成了“需要预算、监控和问责的生产系统”。这也许会让 AI 部署变慢,但会让真正有价值的 AI 应用变得更清晰。

参考资料

  1. 404 Media: Companies Are Throttling Employees’ AI Use Because It’s Too Expensive.
    https://www.404media.co/companies-are-throttling-employees-ai-use-because-its-too-expensive/
  2. AI Weekly: Atlassian, Citi, Adobe cap employee AI access as bills climb.
    https://aiweekly.co/alerts/atlassian-citi-adobe-cap-employee-ai-access-as-bills-climb
  3. OpenAI: Introducing GPT-5.5.
    https://openai.com/index/introducing-gpt-5-5/
  4. Anthropic: Claude Opus 4.6.
    https://www.anthropic.com/news/claude-opus-4-6
  5. Anthropic: Claude Opus.
    https://www.anthropic.com/claude/opus
  6. ITPro: Accenture tells staff to stop using AI for unnecessary tasks amid surging costs.
    https://www.itpro.com/technology/artificial-intelligence/what-were-seeing-right-now-is-just-rapid-escalation-in-ai-token-spend-accenture-tells-staff-to-stop-using-ai-for-unnecessary-tasks-amid-surging-costs
分享到