Blackwell Ultra (GB300)

Blackwell Ultra (GB300)

Blackwell Ultra (GB300)

Blackwell Ultra是NVIDIA在2026年推出的下一代GPU架构,是Blackwell架构的升级版本,代号GB300。该架构是实现35倍推理成本削减的核心硬件基础。

核心特性

  • NVFP4支持:原生支持NVIDIA的4位浮点格式(NVFP4),实现推理效率的质变
  • 288GB HBM4带宽:巨大的显存容量和带宽,支撑大规模模型推理
  • 双层动态精度缩放:以16个元素为一个小块(Micro-block)进行独立量化,保留高精度缩放因子
  • Transformer Engine优化:实现纳秒级的动态精度切换,按需分配算力

战略意义

  • Meta参与了Blackwell Ultra的规格定义,体现了"硬件共建"的深度捆绑模式
  • 与[[Rubin (NVIDIA平台)]]共同构成NVIDIA在推理领域的护城河
  • 使单Token推理成本实现35倍断崖式下跌,开启[[Token挥霍时代]]

相关实体

  • [[nvidia]]:Blackwell Ultra的制造商
  • [[meta]]:参与规格定义的核心客户
  • [[rubin-nvidia-platform]]:NVIDIA下一代GPU平台
分享到