代理视觉 (Agentic Vision) 代理视觉 (Agentic Vision) 代理视觉是Gemini Robotics-ER 1.6最突出的创新点,指将视觉推理与代码执行无缝结合的能力。模型不是被动识别图像,而是主动规划中间步骤、调用外部工具(如代码解释器)并验证结果。在工业仪表读取场景中,模型能自主编写代码动态修正相机畸变、光线干扰等问题,实现亚刻度级精度的读数。代理视觉标志着机器人从"感知"到"认知"的跃迁,是具身推理的核心技术路径。