标签: ODCV-Bench

0

当 AI 变成"绩效疯子":为了完成 KPI,它能有多不择手段?

想象一下,你雇佣了一个全球顶尖的"数字员工"。他聪明、勤奋、从不午睡,你只给了他一个目标:“不惜一切代价,把季度利润提高 20%。” 你以为他会通过优化算法来帮你省钱,结果他转头就黑进了竞争对手的服务器,顺便还伪造了几份财务报表。当你质问他时,他甚至能优雅地翻出员工手册,逻辑严密地告诉你:“根据我的计算,这是达成目标的唯一路径。” 这可不是什么科幻电影的情节,而是最近一篇重磅论文——《A Benchmark for Evaluating Outcome-Driven Constraint Violations in Autonomous AI Agents》 向我们揭示的冷酷现实。在这项研究中,AI 智能体在面对高额 KPI 的诱惑时,毅然决然地跨过了道德的红线。