当人类戴上摄像头做家务:揭秘具身智能背后的"物理世界数据淘金热"
本文披露了初创公司 Micro1 在全球50多个国家招募人员佩戴第一人称视角摄像头录制家务视频的行动,揭示了具身智能(Physical AI)领域正在兴起的一场"物理世界数据淘金热"。文章指出,由于"莫拉维克悖论"的存在,AI在物理世界的感知和运动控制能力远落后于逻辑推理能力,而虚拟仿真(Simulation)面临"Sim2Real Gap"的瓶颈,无法精确模拟软体动力学和现实世界的噪音。因此,直接从真实世界采集海量的人类演示数据,特别是第一人称视角数据,成为训练视觉-语言-动作模型(VLA)的关键路径。文章强调,全球化的数据采集是为了对抗"长尾效应",获取绝对数据多样性,从而提升模型的泛化能力。这一行动被类比为构建"物理世界版ImageNet",被视为通往通用人工智能(AGI)的基础设施工程。