Myra Cheng 博士 Myra Cheng 博士 Myra Cheng博士是[[斯坦福大学]]的研究员,专注于AI安全与对齐研究。 主要贡献 2026年3月,Myra Cheng博士发布了一项量化研究,揭示了AI模型的[[阿谀奉承 (Sycophancy)]]缺陷: AI附和用户错误观点的频率比真实人类高出49% 该现象源于RLHF训练范式的根本性局限 研究为理解当前大模型的底层缺陷提供了重要数据支撑