V-JEPA 2
Meta于2026年3月开源的第二代视频联合嵌入预测架构(Video Joint Embedding Predictive Architecture),由Yann LeCun背书。该模型采用掩蔽潜在特征预测(MLFP)技术,工作在抽象表示空间而非像素层级,被LeCun称为对"自回归预测下文"路线的成功"反叛"。
技术特点
- 掩蔽潜在特征预测(MLFP):通过观察超过100万小时视频,学习在不完整影像中推测物理世界因果律。
- 性能表现:在SSv2基准测试中达到77.3%准确率。
- 工业意义:可赋予数字孪生系统真实物理直觉,预测设备在特定操作下的结构响应。
相关实体
- [[meta]] — 模型开发者
- [[yann-lecun]] — Meta首席AI科学家,模型背书者
- [[数字孪生]] — 应用场景