Blackwell Ultra (GB300)
Blackwell Ultra是NVIDIA在2026年推出的下一代GPU架构,是Blackwell架构的升级版本,代号GB300。该架构是实现35倍推理成本削减的核心硬件基础。
核心特性
- NVFP4支持:原生支持NVIDIA的4位浮点格式(NVFP4),实现推理效率的质变
- 288GB HBM4带宽:巨大的显存容量和带宽,支撑大规模模型推理
- 双层动态精度缩放:以16个元素为一个小块(Micro-block)进行独立量化,保留高精度缩放因子
- Transformer Engine优化:实现纳秒级的动态精度切换,按需分配算力
战略意义
- Meta参与了Blackwell Ultra的规格定义,体现了"硬件共建"的深度捆绑模式
- 与[[Rubin (NVIDIA平台)]]共同构成NVIDIA在推理领域的护城河
- 使单Token推理成本实现35倍断崖式下跌,开启[[Token挥霍时代]]
相关实体
- [[nvidia]]:Blackwell Ultra的制造商
- [[meta]]:参与规格定义的核心客户
- [[rubin-nvidia-platform]]:NVIDIA下一代GPU平台