LPU (语言处理单元)
LPU(Language Processing Unit)是[[groq]]公司开发的确定性执行架构,内置230MB超快SRAM,能以极低延迟运行AI推理任务。LPU代表了与GPU不同的推理架构路线,其技术被NVIDIA以约200亿美元高价授权。NVIDIA发布的Groq 3 LPX平台由128颗Groq 3 LPU组成,与Vera Rubin NVL72协同工作,可实现每兆瓦35倍的吞吐量提升。
相关条目
- [[groq]]
- [[边缘推理芯片]]
- [[从训练到推理的重心转移]]