中国AI的“暴力美学”:当美国人在用我们的Token“吃软饭”

2026 年 2 月,全球 AI 圈被一份数据震出了“内伤”。

根据全球最大的 AI 模型 API 聚合平台 OpenRouter 的最新周报,大模型江湖的权力天平发生了一次历史性的倾斜:中国模型的周调用量达到了惊人的 5.16 万亿 Token,而美国同行的数据则跌落至 2.7 万亿。

更让硅谷大佬们感到“诛心”的是:这场胜利不是在自家的温室里打出来的,而是在美国的主场。OpenRouter 的数据显示,其平台近 47.17% 的用户来自美国本土。换句话说,正当硅谷精英们在咖啡馆讨论 AGI(通用人工智能)如何改变人类命运时,他们手下的程序员们正成规模地、如饥似渴地调用着来自大洋彼岸的中国 API。

有人要抬杠:堆量有什么用?能当饭吃吗?能。不仅能当饭吃,还能把对方的饭桌掀了。

如果说 2025 年的 DeepSeek 是孤身破局的“孤勇者”,那么 2026 年初的这场胜利,则是中国大模型的“集团军”冲锋。打开 OpenRouter 的调用量排行榜,前五名中,中国模型占据了四席,这种统治力让以往霸榜的 OpenAI 和 Anthropic 显得形单影只。

本月的最大黑马非 MiniMax M2.5 莫属。这款来自上海的模型在 2 月中旬发布后,单周调用量直接飙升至 2.45 万亿 Token,涨幅高达 197%。它不但在量上取胜,在硬核测试(如 SWE-bench 编程评测)中也拿到了 80.2% 的高分,与昂贵的 Claude Opus 4.6 仅有 0.6% 的微弱差距。

月之暗面的 Kimi K2.5 以 1.21 万亿 Token 稳居次席。Kimi 依然保持着它在长文本处理和逻辑推理上的优势,成为了全球开发者在处理复杂文档和长流程任务时的首选“数字劳动力”。

智谱 AI 的 GLM-5 以 158% 的涨幅冲到了第三,而老牌强手 DeepSeek V3.2 则在 第五名虎视眈眈。这四款模型构成了中国 AI 的第一梯队,它们不仅智商在线,最重要的是——它们真的便宜得离谱。

很多人看到中国模型 API 价格是美国的 1/16 甚至 1/22,第一反应是“中国企业又在搞补贴、打价格战”。这种认知依然停留在 20 世纪。在 20 26 年的今天,这种价格差已经不再是营销手段,而是生产力逻辑的代差。

美国大模型走的是“精英逻辑”。他们将 AI 视为数字时代的“爱马仕”,投入百亿美金,用最昂贵的芯片集群,维持着极高的毛利。他们的目标是卖“智力溢价”。而中国模型走的是“工业逻辑”。我们将 AI 视为数字时代的“工业大米”或“自来水”。中国企业的强项在于,通过极致的算法优化(如 MLA 架构和混合专家模型 MoE 的效率极限压榨),硬是在同等算力下跑出了几倍于对手的效率。

当一个美国开发者构建一个需要高频调用、长文本处理的智能体(Agent)时,调用 GPT-5 可能需要 5 美元,而调用中国模型只需要 0.2 美元。在商业逻辑中,这叫“生存红线”。当技术被中国搞成“白菜价”时,它才真正具备了改造传统工业体系、渗透进路边摊和每一行代码的可能。

我们要看清这 5.16 万亿 Token 背后的底层支撑:这本质上是中国强大基建能力的数字化变现。

中国拥有全球最完整、最稳健的电网。在大西北,无数的风机和光伏板昼夜不停地产生廉价电力。过去,我们通过高压输电线将这些电力运往东南沿海,驱动工厂制造衬衫、手机和新能源车。现在,我们通过算力枢纽,直接将这些电力转化为“算力”,再通过算法提炼成“Tokens”。

Tokens,就是数字时代的石油。每一个跳动的字符,其实都是中国基建狂魔在数字世界的投影。美国开发者调用我们的 API,本质上是在跨洋消耗中国廉价且高效的能源。我们不再仅仅出口物理实体,我们开始出口“廉价的高级智力”。

为什么调用量会突然在 2026 年爆发?因为 AI 正在从“对话工具”变成“劳动力(Agent)”。当一个 AI Agent 开始独立执行任务(比如写一个完整的 APP 或是自动处理财务报表)时,它不再是“快思考”,而是“慢思考”。它会在脑子里反复模拟、纠错、验证。这种“思考密度”的提升,让 Token 的消耗量比普通的 Q&A 增长了上百倍。这种指数级的需求爆发,瞬间拉开了中美两套生产模式的差距:谁能大规模提供低成本、高稳定的“数字面粉”,谁就能接住这波流量。

5.16 万亿这个数字确实硬核,但也容易让人产生“我们已经全面超越”的错觉。作为科技观察者,我们需要泼一盆冷水:虽然我们搞定了“面粉”,但美国还在研制“星舰引擎”。

调用量代表的是应用层的繁荣。因为我们的东西便宜、好用、管饱,所以全球开发者拿它去跑代码补全、写周报、做客服机器人。这些是基础的“体力活”。但在最顶尖的、决定人类文明走向的“极限推理”层面,美国依然握有重器。OpenAI 的 GPT-5.2 系列或 Anthropic 的 Claude 4.6,它们追求的不是销量的第一,而是“智力上限”。它们在试图攻克复杂的科学猜想、药物分子发现以及顶尖的物理仿真。

中国路径走普惠、走效率、走应用。这是生产力的底层能源。我们要让 AI 深入到每一条生产线,让它成为每个人都能拧开的“智力水龙头”。而美国路径走前沿、走大力、走突破。试图利用海量资源砸出 AGI 的那个奇点。如果我们只满足于做全球的“Token 工厂”,通过压榨电力和算法效率来赚取微薄的辛苦钱,而忽略了原始创新的“制空权”,那么在下一轮范式革命到来时,我们依然可能面临“卡脖子”的风险。

站在 5.16 万亿的门槛上,未来已经出现了明显的分叉。中国模型用“暴力美学”和“工业成本”告诉世界:AI 不该是实验室里的神龛,它应该是每一个程序员、每一家路边摊都能随手拧开的自来水。这种“掀桌子”的勇气,打破了硅谷对高阶智力的垄断,让全球开发者享受到了普惠算力的红利。

但我们也要记住:量产的胜利只是基础,真正的终极战场是“智力的边界”。我们已经造好了足以养活全球的“面包”,接下来的挑战是,我们能否在那群试图造“星舰”的竞争者面前,也拿出属于自己的、能划破夜空的火光。

思考题:面对成本只有 1/20 的智力资源,你会选择把这省下来的钱投入到业务扩张中,还是用来雇佣更昂贵的顶级模型去探索那 1% 的未知领域?

分享到