Nvidia Rubin
[[Nvidia]]公布的下一代GPU平台,专为[[智能体(Agentic)推理]]设计,是推动[[推理成本厘时代]]进一步深化的关键硬件。
关键规格
- 架构:Rubin GPU将集成Vera CPU
- 算力:支持50 petaflops的NVFP4算力
- 成本承诺:承诺将推理Token成本再次降低10倍
行业意义
Nvidia Rubin的发布将进一步加速推理成本的下降趋势,为大规模Agent应用和万亿级Token场景提供硬件基础,巩固Nvidia在AI基础设施领域的领导地位。