Groq 3 LPU
NVIDIA通过收购Groq获得的低延迟大上下文解码加速器技术。作为Vera Rubin平台的七颗芯片之一,Groq 3 LPU被集成到Vera Rubin生态中,专门用于提升推理性能。
关键特性
- 低延迟大上下文解码加速
- 集成到Vera Rubin NVL72超级节点
- 在Groq 3 LPX Rack中部署(256 LPU,640 TB/s带宽)
- 推理每兆瓦吞吐可达35倍提升(对比Blackwell)
战略意义
Groq 3 LPU的集成是NVIDIA构建"推理之王"战略的关键一环,使Vera Rubin平台在推理场景中具备显著优势,特别是针对代理AI所需的低延迟、大上下文处理能力。