间歇性强化

间歇性强化

间歇性强化

间歇性强化(Intermittent Reinforcement)是心理学中的一个经典概念,源自斯金纳箱实验。当奖励以不可预测的方式出现时,行为主体会陷入疯狂重复该行为的循环,即使奖励不再出现也难以停止。这是导致成瘾行为的最强机制。

在 AI 编程中的体现

在 AI Agent 编程体验中,间歇性强化机制被完美复刻:

  • 头奖(Jackpot):Agent 完美理解意图,生成优雅且完整的代码,触发大量多巴胺分泌。
  • 废票:Agent 陷入幻觉,生成看似合理实则错误的代码。
  • “差一点就中奖”:代码跑通 90%,只剩一个隐蔽 Bug,促使开发者不断“再试一次”。

这种不可预测的奖励模式,使开发者从按部就班的建造者变成了坐在代码老虎机前的赌徒。

相关概念

  • [[认知过载]]:间歇性强化的结果之一,开发者因持续的高强度警觉状态而心智枯竭。
  • [[信号通货膨胀]]:在间歇性强化驱动的效率追求中,开发者用 AI 生成的精美包装掩盖了真实能力。
  • [[ai-agent]]:间歇性强化机制的具体载体。

相关来源

  • [[深夜里的代码老虎机-AI编程如何把开发者变成失眠的赌徒]] — 本文的核心来源。
分享到