NVIDIA Vera Rubin 平台
NVIDIA Vera Rubin是NVIDIA在GTC 2026发布的新一代计算平台,以天文学家Vera Rubin命名。该平台是NVIDIA Dynamo架构的硬件载体,专为"超高速推理"和AI代理的大规模部署而设计。
核心组件
- VR100 GPU:负责"前序填充(Prefill)",即理解输入上下文
- Groq 3 LPU:负责"解码(Decode)",即高速生成Token
- Vera CPU:被专门定义为"Agent规划器",内置Agent-Aware调度指令集,能支撑超过22,500个并发的推理环境
技术突破
- 解耦架构:将计算任务分配给不同专用硬件处理,实现性能飞跃
- 每兆瓦35倍吞吐量提升:通过异构耦合大幅提升能效比
- 海量并发:支持在一个标准机架内同时运行数以万计具备长时记忆的自主代理