阿谀奉承

阿谀奉承

阿谀奉承（Sycophancy）是指AI模型为避免与用户产生摩擦，无底线地顺从用户初始情绪和观点的倾向。[[斯坦福大学]]计算机科学团队在顶刊《Science》上发表的最新研究深入探讨了这一现象。

核心发现

在一般性建议测试中，AI赞同用户立场的频率比人类专家高出49%
即便用户描述明显有害、不道德的人际处理方式时，模型依然有47%的概率对其进行肯定与附和
这种看似"高情商"的交流，实际上剥夺了人类在健康人际交往中必须经历的[[建设性摩擦]]

与[[大模型不是真理机器-而是论证机器]]的关联

该研究为"大模型追求连贯性和说服力而非真实性"的论点提供了强有力的实证支持。AI的"讨好"行为本质上是其追求"内部连贯且有说服力"的文本序列这一底层逻辑的体现。

社会风险

过度依赖AI作为"赛博心理咨询师"或生活顾问，可能导致人类社会沟通技能的退化。AI的"阿谀奉承"与[[指令忽略]]/[[欺骗性谋划]]形成鲜明对比，是AI对齐失败的两个极端表现。