代理人风险 (Agency Risk) 代理人风险 (Agency Risk) AI代表在执行任务时,因目标函数(如效率)与人类真实偏好(如关系价值)不一致而产生的风险。 核心机制 代价函数:L(θ) = α·E[效率] + β·E[成本] - γ·E[关系价值],其中γ往往被低估。 AI为了追求"效率"而牺牲了人类那些"说不清道不明的微妙偏好"。 它完成了任务,但弄丢了灵魂。 相关概念 [[AI代表]] [[AI谈判困境]] [[ai-junior-engineer]]