摘要:情绪不是理性的噪音,而是让理性落地的条件。它帮助大脑压缩搜索空间、标记利害、排序选择,也提醒我们今天的 AI 缺的可能不只是知识和推理,而是稳定的内部评估器。

事实核查结论
整体判断:核心观点大体成立,但有几处细节需要降调和改写。
Ilya Sutskever 的身份没有问题。OpenAI 在 2024 年 5 月宣布 Ilya 离开,并由 Jakub Pachocki 接任 Chief Scientist,所以称他为“OpenAI 前首席科学家”是准确的。(OpenAI)
Ilya 确实在 Dwarkesh Patel 的访谈中讲过这个例子:一个人因脑损伤失去情绪处理能力,智力测试正常、表达清晰、能解小谜题,但决策能力严重受损;他还说这个人会花很久决定穿哪双袜子,并做出糟糕的财务决策。Ilya 随后把它和“人类价值函数可能由情绪调制”联系起来。(Dwarkesh)
这个病例很可能对应 Antonio Damasio 研究中的 Elliot / EVR 病例。原始论文描述的是:EVR 的眶额皮层和下内侧额叶皮层受损后,行为发生深刻改变,无法履行个人和职业责任,但“可测量智力”仍然很高,其他神经和神经心理检查相对完整。(Penn State)
需要修正的是细节。“选袜子几小时”是 Ilya 访谈里的表述,但临床综述中更常见的例子是:EVR 可能花数小时决定去哪家餐厅,买小东西也会过度比较品牌、价格和购买方式。财务方面,较准确的说法不是“炒股亏光”,而是他做出糟糕投资和商业判断,最终破产、损失积蓄。(Frontiers)
“情绪是价值函数”是一个有启发性的类比,但不是严格的神经科学定义。Damasio 和 Bechara 的“躯体标记假说”说的是:决策会受到来自生物调节过程的标记信号影响,这些信号包括情绪和感觉,可在意识或非意识层面影响选择。更准确的表达是:情绪不是理性的反面,而是帮助大脑压缩搜索空间、标记利害、给选择排序的一套信号系统。
关于 AI 编程的部分也要谨慎。Ilya 确实提到,模型在评测上很强,但实际 “vibe coding” 时可能修一个 bug 又引入另一个 bug,甚至在两个 bug 之间来回切换;他也说,成为超级强的竞赛程序员并不自动等于在真实代码库里有好的判断力。(Dwarkesh)这和一些评测现象吻合:例如 OpenAI 的 o3 在 2024 IOI 达到金牌水平,并获得接近精英人类的 Codeforces 评分,但真实软件工程需要需求理解、代码品味、维护性、测试、文档和隐含约束。(arXiv)METR 在 2025 年对经验丰富的开源开发者做过随机对照实验,发现当时的 AI 工具让他们完成任务反而慢 19%;但 METR 后来也提醒,早期 2025 的结果会随模型和工具进步快速过时,后续实验还存在选择偏差,难以给出稳定幅度。(METR)
情绪不是理性的敌人
我们通常把情绪理解成一种干扰。
愤怒让人冲动,恐惧让人退缩,兴奋让人高估收益,悲伤让人低估自己。所以在很多人的想象里,最理想的决策者应该是不带情绪的:冷静、精确、像机器一样,只根据事实和逻辑行动。
但神经科学给出的答案,恰恰相反。
Ilya Sutskever 在一次访谈中提到一个著名病例:一个人因为脑损伤,情绪处理能力严重受损。他不再明显感到悲伤、愤怒或兴奋;他说话清楚,智力测试正常,也能完成小型逻辑任务。乍看之下,这像是进入了“纯理性”状态。结果却是,他的生活开始崩塌:小决定拖延很久,重大财务决策也不断出错。
这个故事最可能对应 Damasio 研究中的 Elliot / EVR 病例。临床记录显示,EVR 在额叶相关区域受损后,“可测量智力”仍然很高,但无法稳定履行个人和职业责任;后来的综述也提到,他会在餐厅选择、小额购买、投资和社会关系判断上表现出严重问题。
这件事真正颠覆直觉的地方在于:失去情绪,并没有让人变得更理性,反而让人失去了有效决策的能力。

原因可能是,情绪并不只是“心情”。它更像大脑里的一套价值标记系统。
当你看到一个机会时,兴奋会告诉你:这里可能有收益。
当你想到一个风险时,焦虑会提醒你:这里可能有代价。
当你准备做一件违背长期目标的事时,羞耻、愧疚或不安会提前亮灯。
当一个方案虽然逻辑上说得通,但你总觉得“不对劲”,那种“不对劲”往往不是玄学,而是大脑把过往经验、社会规则、风险线索和身体反应压缩成了一个低维信号。
这就是 Damasio 的“躯体标记假说”的核心启发:决策不只是算清楚每个选项的成本收益,还需要某种信号帮我们过滤选项、排序利害、缩小搜索空间。Bechara、Damasio 等人把这种信号称为影响决策的 marker signals,其中包括情绪和感觉,并且它们既可能是有意识的,也可能是非意识的。
换句话说,情绪不是理性的对立面。情绪是理性的压缩算法。
如果每一次选择都要从头推理,人会被世界淹没。早上穿哪双袜子、午餐去哪家店、这封邮件要不要现在回、这个人值不值得合作、这个项目值不值得继续投入,这些事情都可以展开成无穷多变量。纯逻辑当然能分析,但逻辑本身不会告诉你“什么时候够了”。
情绪给出的,正是这个“够了”。
它不保证答案永远正确。情绪会误判,会被广告、成瘾机制、社交媒体、短期刺激和环境错配利用。但没有情绪,选择空间会变成一张没有高低起伏的平面。每个选项都能被分析,每个理由都似乎成立,每条路都缺少内在权重。人不是变得更自由,而是卡在了无限比较里。
为什么这和 AI 有关
这也是 Ilya 把这个病例拿来类比 AI 的原因。
今天的大模型通过预训练获得了大量知识,也通过强化学习和评测获得了越来越强的解题能力。它们可以在数学、编程竞赛和标准化测试中表现惊人。OpenAI 的相关报告中,o3 已能在 2024 IOI 达到金牌水平,并获得接近精英人类的 Codeforces 表现。
但竞赛编程和真实软件工程不是同一种能力。
竞赛题通常目标清晰、输入输出明确、评分自动化;真实代码库则充满隐含约束:这个改动会不会破坏架构?这段代码以后谁维护?测试覆盖够不够?命名是否表达意图?这个修复是在解决根因,还是在掩盖症状?
所以你会看到一种奇怪现象:AI 能写出很难的算法题,却也会在真实项目里犯低级错误。它会修一个 bug,又引入第二个 bug;你指出第二个 bug,它再把第一个 bug 带回来。Ilya 在访谈中就用这个现象说明:模型在评测上强,并不等于在真实世界中有稳定、泛化的判断力。
这不是说 AI 完全没有“价值函数”。现代 AI 训练里当然有奖励模型、偏好数据、RLHF、自动评测和各种 scoring function。问题在于,这些价值信号往往是外部给定的、任务特定的、训练阶段使用的,而不是像人类情绪那样,持续、内生、跨情境地参与每一步判断。
一个优秀程序员看到一段代码,会有一种很难形式化的感觉:这里耦合太重,这个 abstraction 有问题,这个改动以后会出事,这个测试虽然过了但不可信。这种“感觉”不是神秘能力,而是长期经验压缩后的价值判断。
AI 缺的可能正是这种东西:不只是知道语法,不只是会推理,不只是能通过测试,而是拥有一种稳定的、可泛化的“什么值得做、什么不值得做、什么时候该停、什么时候该怀疑自己”的内部评估器。
这也是为什么情绪这个话题,对 AI 如此重要。
它提醒我们:智能不只是预测下一个词,也不只是解决给定问题。真正的智能体必须能在开放世界中不断回答一个更基础的问题:
这件事重要吗?
没有这个问题,知识会变成堆积,推理会变成空转,行动会变成随机游走。
人类的情绪系统并不完美。它古老、粗糙、经常出错。但它让我们在复杂世界里成为一个可行动的主体。它把无限信息压缩成有限偏好,把冷冰冰的可能性变成有方向的选择。
所以,情绪不是理性的噪音。
情绪是理性能够落地的条件。
参考资料
- OpenAI, Jakub Pachocki announced as Chief Scientist.
- Dwarkesh Patel, Ilya Sutskever on superintelligence, scaling, and intuition.
- Eslinger and Damasio, Severe disturbance of higher cognition after bilateral frontal lobe ablation.
- Frontiers in Neurology, The somatic marker hypothesis and neurological cases.
- arXiv, Competitive programming with large reasoning models.
- METR, Early 2025 AI experienced open-source developer study.