JEPA (联合嵌入预测架构)

JEPA (联合嵌入预测架构)

JEPA (联合嵌入预测架构)

定义

JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)是杨立昆提出的一种 AI 架构,也是 AMI Labs 的核心技术。与传统的生成式模型不同,JEPA 不在像素或文字空间进行预测,而是在"抽象表示空间"进行预测。

工作原理

JEPA 的核心思想是构建一个内部模拟器,使 AI 能够在抽象表示空间中预测世界的状态变化。其数学表达为:
$$S_{t+1} = f(S_t, a_t)$$
其中 $S$ 是世界的状态,$a$ 是智能体的动作。

与生成式模型的区别

  • 生成式模型:在像素或文字空间进行预测,如 GPT 的"预测下一个词"。
  • JEPA:在抽象表示空间进行预测,关注的是世界状态的变化而非具体的像素或文字。

优势

  • 更高效:在抽象空间进行预测,计算成本更低。
  • 更鲁棒:不受具体像素或文字变化的影响。
  • 更智能:能够进行因果推理和内部模拟。

挑战

  • 如何定义和构建合适的"抽象表示空间"?
  • 如何在规模化训练中保持 JEPA 的优势?
  • 如何与现有的 LLM 生态进行整合或竞争?
分享到