Vera Rubin (VR200) 架构
NVIDIA下一代GPU架构,与HBM4高带宽显存深度绑定。相比Blackwell架构,在稠密浮点运算和推理吞吐量上实现了3.3x至5x的提升。
核心突破
- NVL576机架配置:通过硅光子(Silicon Photonics)技术实现机架级的高速互联,显著降低了长文本推理时的延迟。
- HBM4原生支持:与HBM4高带宽显存深度绑定,提升推理吞吐量。
- 推理优化:是对"推理侧算力扩展定律"的硬件回应,专门针对推理工作负载进行优化。
相关概念
- [[nvidia]] — VR200架构的开发者
- [[推理侧算力扩展定律]] — VR200架构的设计动机