从“人人都用最强模型”到“先看预算”：企业开始给 AI 使用踩刹车

2026-07-03

企业AI, Token经济, FinOps, AI成本治理, 模型路由

摘要：当高端模型被员工、代码代理和办公自动化流程大规模调用时，企业很快发现，AI 账单可能比生产力提升更早冲到管理层面前。

过去一年，企业 AI 的口号是“让每个员工都拥有一个智能助手”。

但到了 2026 年中，另一个现实开始浮出水面：当 GPT-5.5、Claude Opus 4.6 这类高端模型被员工、代码代理和办公自动化流程大规模调用时，账单可能比生产力提升更快出现。

花旗、Atlassian、Adobe 等公司的案例显示，企业 AI 已经从“能力实验”进入“成本治理”阶段。

AI 办公室里的成本警报

当每一次提示词、每一次代码代理运行、每一次长文档分析都变成可计费 token，AI 不再只是生产力工具，也成为新的预算变量。

账单为什么突然失控

404 Media 报道称，多家科技、娱乐、银行等行业公司正在限制员工使用 AI，并要求员工改用较弱、较便宜的模型。该报道依据包括泄露的 Slack 聊天、内部仪表盘截图和邮件等材料。在其中一个案例里，AI 支出据称已经增长到每月超过 1500 万美元。

AI Weekly 对这篇报道的摘要进一步列出几个具体案例：Atlassian 的月度 AI 支出据称从 2025 年 8 月约 500 万美元升至 2026 年 5 月超过 1500 万美元；花旗在 6 月 24 日关闭了 Claude Opus 4.6、4.7 和 GPT-5.5 的访问，理由是这些模型每次交互消耗更多 AI Credits；Adobe 则计划结束无限 Claude 访问。

这些数字之所以重要，不只是因为它们大，而是因为它们揭穿了一个企业 AI 部署中的常见幻觉：AI 成本不是一次性采购，也不只是固定座席费。随着企业把 AI 嵌入 IDE、浏览器、文档、客服、数据分析、代码审查和自动化代理，每一次调用都会变成持续发生的边际成本。

高级模型的强大，正是它昂贵的原因

GPT-5.5 和 Claude Opus 4.6 这类前沿模型的卖点，恰恰是能处理更长上下文、更复杂任务和更长时间的代理式工作。

OpenAI 在 GPT-5.5 发布说明中称，该模型面向编码、研究、数据分析、文档与电子表格生成、软件操作等复杂任务，并在 API 中标出 gpt-5.5 的价格为每 100 万输入 token 5 美元、每 100 万输出 token 30 美元；gpt-5.5-pro 的价格更高，为每 100 万输入 token 30 美元、每 100 万输出 token 180 美元。

Anthropic 对 Claude Opus 4.6 的介绍也显示，它面向更困难的编码、代理和企业工作流，并提供 effort 控制，让开发者在智能、速度和成本之间调节；其 API 价格为每 100 万输入 token 5 美元、每 100 万输出 token 25 美元。

这就解释了企业为什么会从“鼓励多用”转向“按任务选择模型”。一个员工偶尔问几个问题，成本可能可以忽略；但一个代码代理反复读仓库、搜索文件、生成补丁、运行测试、修复错误，就可能在短时间内消耗大量输入与输出 token。

真正烧钱的不是聊天框，而是被自动化流程放大的循环调用。

“无限使用”可能只是补贴期

早期企业 AI 采购常带有一种 SaaS 式想象：买一个座席，员工就可以无限使用。但大模型的成本结构更像云计算、数据库查询或 GPU 任务队列。用得越多，成本越高；模型越强，单位成本越高；上下文越长，账单越不可预测。

这也是为什么一些公司开始取消无限访问、引入 token 上限、关停排行榜、降低默认模型等级，甚至只允许特定岗位使用最高端模型。

ITPro 报道称，Accenture 也因 token 支出快速上升而要求部分员工减少不必要的 AI 使用，并提到多家企业正在引入 token caps 和 spending limits。

这并不意味着企业不再相信 AI。恰恰相反，企业已经开始把 AI 当作真实基础设施来管理。

只有当一种技术进入核心工作流，财务部门才会严肃追问：谁在用？用在哪？带来多少收入、节省多少时间、减少多少风险？每一美元 token 是否值得？

企业 AI 成本治理闭环

企业不应只问“能不能用 AI”，还要问“这个任务需要什么等级的模型、预算归属在哪里、产出如何衡量”。

企业接下来会怎么做

第一，高级模型会从“默认工具”变成“受控资源”。

过去员工可能习惯于所有任务都调用最强模型；未来，写邮件、整理会议纪要、普通问答可能会被路由到便宜模型，只有复杂代码、法律分析、投研建模、关键客户场景才允许使用顶级模型。

第二，AI 成本会被分摊到部门和项目。

一个平台团队统一采购 AI，但真正消耗 token 的可能是工程、销售、客服、财务或法务。没有成本归属，就没有行为约束。Atlassian 推出成本追踪面板这类做法，本质上是把“看不见的 AI 消耗”变成“每个团队可见的预算项”。

第三，企业会建立模型路由和降级机制。

同一个任务可以有多种解法：先用小模型分类，再用中端模型生成，再把最关键的一步交给高端模型；或者对长上下文做摘要、缓存和去重，避免重复把同一批材料喂给模型。Anthropic 对 Opus 提到 prompt caching 和 batch processing 可节省成本，这类机制会成为企业 AI 工程的标配。

第四，AI 项目会被迫证明 ROI。

以前“员工喜欢用”“看起来很先进”足以推动试点；现在不够了。企业会追踪每个 AI 工作流节省了多少工时、减少了多少返工、提升了多少转化率，或者是否只是把普通任务变成了昂贵的自动化表演。

真正的问题不是“AI 太贵”，而是“贵得不透明”

AI 成本上涨并不一定是坏消息。某些任务即便花费高，只要能替代高价值专家时间、减少严重错误、缩短产品周期，仍然值得投入。

问题在于，许多企业此前没有把 AI 成本、质量和产出绑定起来，只看到了使用量增长，却没有看到单位经济模型。

这就是 2026 年企业 AI 的转折点：从“全员试用”转向“精细化运营”。谁能把模型能力、业务价值和财务约束放进同一个系统里，谁就能继续扩大 AI 使用；谁还停留在“给员工开通最强模型就等于数字化转型”，谁就会先遇到账单。

AI 的下一轮竞争，是成本控制能力的竞争

花旗、Atlassian、Adobe 等案例提示我们，企业 AI 的瓶颈不只是模型智商，也不只是员工采纳率，而是成本治理能力。前沿模型会继续变强，但企业不会无限制地为每一次调用买单。

未来成熟的 AI 企业，不会只问“我们能不能接入最强模型”，而会继续追问：

这个任务值不值得用最强模型？
能不能先用便宜模型完成 80%？
能不能缓存、批处理、压缩上下文？
这个 AI 工作流的收益是否覆盖 token、工程和管理成本？

AI 不是从办公室退场了，而是从“免费兴奋剂”变成了“需要预算、监控和问责的生产系统”。这也许会让 AI 部署变慢，但会让真正有价值的 AI 应用变得更清晰。

参考资料

404 Media: Companies Are Throttling Employees’ AI Use Because It’s Too Expensive.
https://www.404media.co/companies-are-throttling-employees-ai-use-because-its-too-expensive/
AI Weekly: Atlassian, Citi, Adobe cap employee AI access as bills climb.
https://aiweekly.co/alerts/atlassian-citi-adobe-cap-employee-ai-access-as-bills-climb
OpenAI: Introducing GPT-5.5.
https://openai.com/index/introducing-gpt-5-5/
Anthropic: Claude Opus 4.6.
https://www.anthropic.com/news/claude-opus-4-6
Anthropic: Claude Opus.
https://www.anthropic.com/claude/opus
ITPro: Accenture tells staff to stop using AI for unnecessary tasks amid surging costs.
https://www.itpro.com/technology/artificial-intelligence/what-were-seeing-right-now-is-just-rapid-escalation-in-ai-token-spend-accenture-tells-staff-to-stop-using-ai-for-unnecessary-tasks-amid-surging-costs

会员专区