0
没有评估器,Agent 的 loop 只是在空转
大多数人搭自主编码 Agent 时只盯着模型、工具和循环,却忽略了最关键的 evaluator。没有外部评估器,Agent 的“完成”只是自我报告;它会提前停止、走捷径、高估结果,然后自信地告诉你任务已经完成。
大多数人搭自主编码 Agent 时只盯着模型、工具和循环,却忽略了最关键的 evaluator。没有外部评估器,Agent 的“完成”只是自我报告;它会提前停止、走捷径、高估结果,然后自信地告诉你任务已经完成。