Vera Rubin
NVIDIA下一代计算平台,接替Blackwell架构,于2026年GTC上正式揭幕。Vera Rubin不是单纯的下一代GPU,而是"七颗突破性芯片、五种机架级系统、一台巨型超级计算机"的完整垂直集成平台,专为代理AI每一个阶段(预训练、后训练、测试时扩展、实时推理)而生。
七颗芯片
- Vera CPU:NVIDIA首款自研CPU,专为强化学习和代理验证而设计,单线程性能与能效远超传统CPU
- Rubin GPU:核心算力引擎,支持海量MoE(混合专家)模型
- NVLink 6 Switch:连接72颗Rubin GPU + 36颗Vera CPU的高速互连
- ConnectX-9 SuperNIC:高带宽网络与共享存储
- BlueField-4 DPU:实现POD级GPU内存扩展与AI原生存储
- Spectrum-6 Ethernet Switch:机架间低延迟东-西流量
- Groq 3 LPU:集成收购的Groq技术,低延迟大上下文解码加速器
五种机架
- Vera Rubin NVL72(72 GPU + 36 CPU超级节点)
- Vera CPU Rack(256颗CPU密集液冷)
- Groq 3 LPX Rack(256 LPU,640 TB/s带宽)
- BlueField-4 STX存储机架
- Spectrum-6 SPX以太网机架
性能指标
- 训练大型MoE模型只需1/4 GPU(对比Blackwell)
- 推理每瓦特吞吐量提升10倍
- 每token成本降至1/10
- Groq 3集成后,推理每兆瓦吞吐可达35倍
战略意义
Vera Rubin标志着NVIDIA从GPU供应商向全栈AI基础设施平台提供商的战略转型。黄仁勋称其为"推理之王",整个系统垂直集成、端到端优化,像一台巨型超级计算机。Blackwell + Vera Rubin系统订单累计已达至少1万亿美元(2025-2027年)。