指向 (Pointing)

指向 (Pointing)

指向 (Pointing)

指向是Gemini Robotics-ER 1.6中空间推理的基础能力,指模型在图像中精确定位关键点的能力。指向不是简单的手势识别,而是作为中间表示(intermediate representation)用于分解复杂任务,包括计数、关系判断、轨迹规划和约束遵守。例如,模型能准确识别并指向工作台上的多种工具,不会产生幻觉。指向能力为后续的代理视觉和任务规划奠定基础。

分享到