从 GPU 到自研 ASIC：OpenAI 为什么要把推理芯片握在自己手里

2026-06-25

OpenAI, 推理成本, AI基础设施, AI芯片, Broadcom

摘要：OpenAI 与 Broadcom 的 Jalapeño 定制推理芯片说明，AI 公司正在把模型、硬件、推理成本和供应链纳入同一个战略闭环。

从 GPU 到自研 ASIC：OpenAI 为什么要把推理芯片握在自己手里

OpenAI 和 Broadcom 发布 Jalapeño 定制推理芯片，表面上是一条硬件新闻，实际上是 AI 行业进入下一阶段的信号：前沿模型公司不再只比模型参数、训练数据和产品入口，也开始把芯片、内存、网络、推理服务和成本结构纳入同一个战略闭环。

过去几年，AI 公司的核心瓶颈主要是训练算力。谁能拿到更多 GPU，谁就能训练更大模型。但到了 2026 年，推理正在变成更关键的长期成本。ChatGPT、Codex、语音助手、多模态 Agent、企业 API 和搜索入口每天都要处理海量请求。训练是一次性资本开支和迭代投入，推理则是持续发生的运营成本。

因此，OpenAI 做推理芯片不是为了“炫技”，而是为了掌控自己的单位经济模型。

一、推理时代的成本控制权

Jalapeño 被定义为面向 LLM inference 的 Intelligence Processor。这个定位很重要，它不是通用 GPU，也不是先冲训练场景，而是围绕大模型推理中的关键模式优化：算子、内存移动、网络通信、服务调度和模型调用结构。

通用 GPU 的优势是灵活，生态成熟，能覆盖训练、推理、科学计算、图形渲染等多种任务。但大规模产品化推理并不总需要这种通用性。对于每天重复执行的模型服务来说，如果能把硬件结构直接对准核心工作负载，就有机会换来更好的性能功耗比、更稳定的供应和更可预测的成本。

这就是 ASIC 的意义：牺牲一部分通用性，换取特定任务上的效率。

OpenAI 的动机也不难理解。它既要支撑 ChatGPT 这类消费级入口，又要支撑 Codex 这样的高强度工程工作流，还要为企业 API 提供可靠延迟和价格。如果长期完全依赖外部 GPU 供应，成本、排期和产品策略都会受制于人。

二、Broadcom 的角色：定制芯片军火商

Broadcom 不是突然闯入 AI 芯片市场。它长期服务于大型云厂商和超大规模客户，擅长定制 ASIC、网络芯片、交换和系统级集成。对 OpenAI 来说，Broadcom 的价值不是提供一个“现成 GPU 替代品”，而是把 OpenAI 对模型和推理负载的理解转化成可生产的芯片和平台。

这也说明 AI 芯片竞争正在变成三层结构：

第一层是英伟达 GPU 生态，依旧是训练和通用加速的核心。
第二层是云厂商和模型公司的自研 ASIC，用于高频推理和特定负载。
第三层是系统集成，包括内存、网络、机柜、电力、冷却和调度平台。

Jalapeño 不是要立刻替代所有 GPU，而是 OpenAI 开始构建自己的第二层和第三层能力。

三、模型公司为什么必须理解硬件

正文配图

这条新闻最值得注意的一点，是 OpenAI 称芯片开发过程使用了 OpenAI 模型来加速设计和优化。这意味着 AI 不是只在芯片上运行，也开始参与芯片本身的设计。

如果这个趋势成立，未来的模型公司会越来越像系统公司。它们不仅训练模型，还要理解模型如何映射到芯片、如何减少内存搬运、如何优化推理批处理、如何在不同任务之间分配算力。

这会改变 AI 公司内部的能力结构。顶级模型公司不再只需要研究员、数据工程师和产品经理，也需要芯片架构师、编译器工程师、网络工程师、数据中心工程师和成本优化团队。

模型能力和基础设施能力正在合流。

四、对英伟达意味着什么

Jalapeño 不意味着英伟达马上失去优势。英伟达的护城河仍然很深：CUDA 生态、训练能力、开发者工具链、供应链、整机系统和网络方案都不是一颗 ASIC 能替代的。

但它说明客户正在分层。对训练、探索和多任务负载，GPU 仍然强；对稳定、高频、大规模推理，越来越多公司会考虑自研或定制芯片。Google TPU、AWS Trainium/Inferentia、Meta MTIA、Microsoft Maia，以及现在 OpenAI + Broadcom 的 Jalapeño，本质上都在做同一件事：把部分 AI 工作负载从通用 GPU 迁移到自有硬件平台。

这对英伟达不是立即的替代风险，而是利润结构风险。最稳定、最大规模、最可预测的推理负载，可能会逐渐被大客户拿回自己手里。

五、AI 公司开始追求 full-stack advantage

OpenAI 这次发布的真正关键词不是芯片，而是 full-stack advantage。模型、产品、推理平台、芯片、网络、电力和冷却，正在被看作一个整体。

未来 AI 竞争可能出现两类公司：

一类是模型能力强，但依赖外部基础设施，成本和供应受制于人。另一类是模型能力、产品入口和基础设施控制力都强，可以用更低推理成本提供更高频的智能服务。

后一类公司的商业优势会越来越明显。因为 AI 产品一旦进入日常工作和消费场景，成本不是边缘问题，而是核心问题。每一次用户提问、每一次代码生成、每一次 Agent 执行任务，背后都是推理成本。

结语

Jalapeño 的意义不只是 OpenAI 有了一颗芯片，而是 AI 行业的主战场正在从“谁能训练最大模型”扩展到“谁能以可承受成本持续运行智能”。

当模型调用成为新的电力消耗，当推理成本成为产品毛利的决定因素，芯片就不再是后台基础设施，而是 AI 公司战略的一部分。

OpenAI 做自研推理芯片，不是离开软件，而是承认未来的软件公司必须重新理解硬件。

参考资料：

OpenAI: OpenAI and Broadcom unveil LLM-optimized inference chip
Broadcom: OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor

AI技术

一、推理时代的成本控制权

二、Broadcom 的角色：定制芯片军火商

三、模型公司为什么必须理解硬件

四、对英伟达意味着什么

五、AI 公司开始追求 full-stack advantage

结语