LPU (语言处理单元)

LPU (语言处理单元)

LPU (语言处理单元)

LPU(Language Processing Unit)是[[groq]]公司开发的确定性执行架构,内置230MB超快SRAM,能以极低延迟运行AI推理任务。LPU代表了与GPU不同的推理架构路线,其技术被NVIDIA以约200亿美元高价授权。NVIDIA发布的Groq 3 LPX平台由128颗Groq 3 LPU组成,与Vera Rubin NVL72协同工作,可实现每兆瓦35倍的吞吐量提升。

相关条目

  • [[groq]]
  • [[边缘推理芯片]]
  • [[从训练到推理的重心转移]]
分享到