Nvidia Rubin

Nvidia Rubin

Nvidia Rubin

[[Nvidia]]公布的下一代GPU平台,专为[[智能体(Agentic)推理]]设计,是推动[[推理成本厘时代]]进一步深化的关键硬件。

关键规格

  • 架构:Rubin GPU将集成Vera CPU
  • 算力:支持50 petaflops的NVFP4算力
  • 成本承诺:承诺将推理Token成本再次降低10倍

行业意义

Nvidia Rubin的发布将进一步加速推理成本的下降趋势,为大规模Agent应用和万亿级Token场景提供硬件基础,巩固Nvidia在AI基础设施领域的领导地位。

分享到