Vera Rubin

Vera Rubin

Vera Rubin

NVIDIA下一代计算平台,接替Blackwell架构,于2026年GTC上正式揭幕。Vera Rubin不是单纯的下一代GPU,而是"七颗突破性芯片、五种机架级系统、一台巨型超级计算机"的完整垂直集成平台,专为代理AI每一个阶段(预训练、后训练、测试时扩展、实时推理)而生。

七颗芯片

  • Vera CPU:NVIDIA首款自研CPU,专为强化学习和代理验证而设计,单线程性能与能效远超传统CPU
  • Rubin GPU:核心算力引擎,支持海量MoE(混合专家)模型
  • NVLink 6 Switch:连接72颗Rubin GPU + 36颗Vera CPU的高速互连
  • ConnectX-9 SuperNIC:高带宽网络与共享存储
  • BlueField-4 DPU:实现POD级GPU内存扩展与AI原生存储
  • Spectrum-6 Ethernet Switch:机架间低延迟东-西流量
  • Groq 3 LPU:集成收购的Groq技术,低延迟大上下文解码加速器

五种机架

  • Vera Rubin NVL72(72 GPU + 36 CPU超级节点)
  • Vera CPU Rack(256颗CPU密集液冷)
  • Groq 3 LPX Rack(256 LPU,640 TB/s带宽)
  • BlueField-4 STX存储机架
  • Spectrum-6 SPX以太网机架

性能指标

  • 训练大型MoE模型只需1/4 GPU(对比Blackwell)
  • 推理每瓦特吞吐量提升10倍
  • 每token成本降至1/10
  • Groq 3集成后,推理每兆瓦吞吐可达35倍

战略意义

Vera Rubin标志着NVIDIA从GPU供应商向全栈AI基础设施平台提供商的战略转型。黄仁勋称其为"推理之王",整个系统垂直集成、端到端优化,像一台巨型超级计算机。Blackwell + Vera Rubin系统订单累计已达至少1万亿美元(2025-2027年)。

分享到