从 GPU 到自研 ASIC:OpenAI 为什么要把推理芯片握在自己手里

摘要:OpenAI 与 Broadcom 的 Jalapeño 定制推理芯片说明,AI 公司正在把模型、硬件、推理成本和供应链纳入同一个战略闭环。

从 GPU 到自研 ASIC:OpenAI 为什么要把推理芯片握在自己手里

OpenAI 和 Broadcom 发布 Jalapeño 定制推理芯片,表面上是一条硬件新闻,实际上是 AI 行业进入下一阶段的信号:前沿模型公司不再只比模型参数、训练数据和产品入口,也开始把芯片、内存、网络、推理服务和成本结构纳入同一个战略闭环。

过去几年,AI 公司的核心瓶颈主要是训练算力。谁能拿到更多 GPU,谁就能训练更大模型。但到了 2026 年,推理正在变成更关键的长期成本。ChatGPT、Codex、语音助手、多模态 Agent、企业 API 和搜索入口每天都要处理海量请求。训练是一次性资本开支和迭代投入,推理则是持续发生的运营成本。

因此,OpenAI 做推理芯片不是为了“炫技”,而是为了掌控自己的单位经济模型。

一、推理时代的成本控制权

Jalapeño 被定义为面向 LLM inference 的 Intelligence Processor。这个定位很重要,它不是通用 GPU,也不是先冲训练场景,而是围绕大模型推理中的关键模式优化:算子、内存移动、网络通信、服务调度和模型调用结构。

通用 GPU 的优势是灵活,生态成熟,能覆盖训练、推理、科学计算、图形渲染等多种任务。但大规模产品化推理并不总需要这种通用性。对于每天重复执行的模型服务来说,如果能把硬件结构直接对准核心工作负载,就有机会换来更好的性能功耗比、更稳定的供应和更可预测的成本。

这就是 ASIC 的意义:牺牲一部分通用性,换取特定任务上的效率。

OpenAI 的动机也不难理解。它既要支撑 ChatGPT 这类消费级入口,又要支撑 Codex 这样的高强度工程工作流,还要为企业 API 提供可靠延迟和价格。如果长期完全依赖外部 GPU 供应,成本、排期和产品策略都会受制于人。

二、Broadcom 的角色:定制芯片军火商

Broadcom 不是突然闯入 AI 芯片市场。它长期服务于大型云厂商和超大规模客户,擅长定制 ASIC、网络芯片、交换和系统级集成。对 OpenAI 来说,Broadcom 的价值不是提供一个“现成 GPU 替代品”,而是把 OpenAI 对模型和推理负载的理解转化成可生产的芯片和平台。

这也说明 AI 芯片竞争正在变成三层结构:

  • 第一层是英伟达 GPU 生态,依旧是训练和通用加速的核心。
  • 第二层是云厂商和模型公司的自研 ASIC,用于高频推理和特定负载。
  • 第三层是系统集成,包括内存、网络、机柜、电力、冷却和调度平台。

Jalapeño 不是要立刻替代所有 GPU,而是 OpenAI 开始构建自己的第二层和第三层能力。

三、模型公司为什么必须理解硬件

正文配图

这条新闻最值得注意的一点,是 OpenAI 称芯片开发过程使用了 OpenAI 模型来加速设计和优化。这意味着 AI 不是只在芯片上运行,也开始参与芯片本身的设计。

如果这个趋势成立,未来的模型公司会越来越像系统公司。它们不仅训练模型,还要理解模型如何映射到芯片、如何减少内存搬运、如何优化推理批处理、如何在不同任务之间分配算力。

这会改变 AI 公司内部的能力结构。顶级模型公司不再只需要研究员、数据工程师和产品经理,也需要芯片架构师、编译器工程师、网络工程师、数据中心工程师和成本优化团队。

模型能力和基础设施能力正在合流。

四、对英伟达意味着什么

Jalapeño 不意味着英伟达马上失去优势。英伟达的护城河仍然很深:CUDA 生态、训练能力、开发者工具链、供应链、整机系统和网络方案都不是一颗 ASIC 能替代的。

但它说明客户正在分层。对训练、探索和多任务负载,GPU 仍然强;对稳定、高频、大规模推理,越来越多公司会考虑自研或定制芯片。Google TPU、AWS Trainium/Inferentia、Meta MTIA、Microsoft Maia,以及现在 OpenAI + Broadcom 的 Jalapeño,本质上都在做同一件事:把部分 AI 工作负载从通用 GPU 迁移到自有硬件平台。

这对英伟达不是立即的替代风险,而是利润结构风险。最稳定、最大规模、最可预测的推理负载,可能会逐渐被大客户拿回自己手里。

五、AI 公司开始追求 full-stack advantage

OpenAI 这次发布的真正关键词不是芯片,而是 full-stack advantage。模型、产品、推理平台、芯片、网络、电力和冷却,正在被看作一个整体。

未来 AI 竞争可能出现两类公司:

一类是模型能力强,但依赖外部基础设施,成本和供应受制于人。另一类是模型能力、产品入口和基础设施控制力都强,可以用更低推理成本提供更高频的智能服务。

后一类公司的商业优势会越来越明显。因为 AI 产品一旦进入日常工作和消费场景,成本不是边缘问题,而是核心问题。每一次用户提问、每一次代码生成、每一次 Agent 执行任务,背后都是推理成本。

结语

Jalapeño 的意义不只是 OpenAI 有了一颗芯片,而是 AI 行业的主战场正在从“谁能训练最大模型”扩展到“谁能以可承受成本持续运行智能”。

当模型调用成为新的电力消耗,当推理成本成为产品毛利的决定因素,芯片就不再是后台基础设施,而是 AI 公司战略的一部分。

OpenAI 做自研推理芯片,不是离开软件,而是承认未来的软件公司必须重新理解硬件。

参考资料:

  • OpenAI: OpenAI and Broadcom unveil LLM-optimized inference chip
  • Broadcom: OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor
分享到