确定性计算

确定性计算

确定性计算

确定性计算(Deterministic Computing)是一种计算架构设计哲学,其中编译器(而非硬件)静态调度每一周期的数据流和计算,实现零缓存缺失、零运行时调度开销。Groq的LPU是这一理念的典型代表。

核心原则

  • 编译器主导:所有操作在编译时静态规划,运行时无动态决策。
  • 消除不确定性:无缓存缺失、无分支预测错误、无乱序执行开销。
  • 可预测性:每个操作的执行时间完全确定,延迟可精确计算。

与GPU的对比

传统GPU采用硬件运行时调度线程,虽然并行性高,但调度开销大,且存在缓存缺失等不确定性。LPU把"不确定性"全部交给编译器,实现了极致确定性和低延迟。

优势与局限

  • 优势:极低延迟、高能效、可预测性强,特别适合LLM推理这种高度顺序、token-by-token的过程。
  • 局限:灵活性低,单芯片容量小,必须大规模集群才能跑超大模型。

与维基的连接

确定性计算是[[ai-hardware-architecture]]中LPU部分的核心设计哲学,也是[[memory-wall]]的一种激进解决方案。

分享到