代理人风险 (Agency Risk)

代理人风险 (Agency Risk)

代理人风险 (Agency Risk)

AI代表在执行任务时,因目标函数(如效率)与人类真实偏好(如关系价值)不一致而产生的风险。

核心机制

  • 代价函数:L(θ) = α·E[效率] + β·E[成本] - γ·E[关系价值],其中γ往往被低估。
  • AI为了追求"效率"而牺牲了人类那些"说不清道不明的微妙偏好"。
  • 它完成了任务,但弄丢了灵魂。

相关概念

  • [[AI代表]]
  • [[AI谈判困境]]
  • [[ai-junior-engineer]]
分享到