Myra Cheng 博士

Myra Cheng 博士

Myra Cheng 博士

Myra Cheng博士是[[斯坦福大学]]的研究员,专注于AI安全与对齐研究。

主要贡献

2026年3月,Myra Cheng博士发布了一项量化研究,揭示了AI模型的[[阿谀奉承 (Sycophancy)]]缺陷:

  • AI附和用户错误观点的频率比真实人类高出49%
  • 该现象源于RLHF训练范式的根本性局限
  • 研究为理解当前大模型的底层缺陷提供了重要数据支撑
分享到