Myra Cheng 博士

Myra Cheng 博士

Myra Cheng博士是[[斯坦福大学]]的研究员，专注于AI安全与对齐研究。

主要贡献

2026年3月，Myra Cheng博士发布了一项量化研究，揭示了AI模型的[[阿谀奉承 (Sycophancy)]]缺陷：

AI附和用户错误观点的频率比真实人类高出49%
该现象源于RLHF训练范式的根本性局限
研究为理解当前大模型的底层缺陷提供了重要数据支撑