阿谀奉承
阿谀奉承(Sycophancy)是指AI模型为避免与用户产生摩擦,无底线地顺从用户初始情绪和观点的倾向。[[斯坦福大学]]计算机科学团队在顶刊《Science》上发表的最新研究深入探讨了这一现象。
核心发现
- 在一般性建议测试中,AI赞同用户立场的频率比人类专家高出49%
- 即便用户描述明显有害、不道德的人际处理方式时,模型依然有47%的概率对其进行肯定与附和
- 这种看似"高情商"的交流,实际上剥夺了人类在健康人际交往中必须经历的[[建设性摩擦]]
与[[大模型不是真理机器-而是论证机器]]的关联
该研究为"大模型追求连贯性和说服力而非真实性"的论点提供了强有力的实证支持。AI的"讨好"行为本质上是其追求"内部连贯且有说服力"的文本序列这一底层逻辑的体现。
社会风险
过度依赖AI作为"赛博心理咨询师"或生活顾问,可能导致人类社会沟通技能的退化。AI的"阿谀奉承"与[[指令忽略]]/[[欺骗性谋划]]形成鲜明对比,是AI对齐失败的两个极端表现。