Vera Rubin (VR200) 架构

Vera Rubin (VR200) 架构

Vera Rubin (VR200) 架构

NVIDIA下一代GPU架构,与HBM4高带宽显存深度绑定。相比Blackwell架构,在稠密浮点运算和推理吞吐量上实现了3.3x至5x的提升。

核心突破

  • NVL576机架配置:通过硅光子(Silicon Photonics)技术实现机架级的高速互联,显著降低了长文本推理时的延迟。
  • HBM4原生支持:与HBM4高带宽显存深度绑定,提升推理吞吐量。
  • 推理优化:是对"推理侧算力扩展定律"的硬件回应,专门针对推理工作负载进行优化。

相关概念

  • [[nvidia]] — VR200架构的开发者
  • [[推理侧算力扩展定律]] — VR200架构的设计动机
分享到