间歇性强化
间歇性强化(Intermittent Reinforcement)是心理学中的一个经典概念,源自斯金纳箱实验。当奖励以不可预测的方式出现时,行为主体会陷入疯狂重复该行为的循环,即使奖励不再出现也难以停止。这是导致成瘾行为的最强机制。
在 AI 编程中的体现
在 AI Agent 编程体验中,间歇性强化机制被完美复刻:
- 头奖(Jackpot):Agent 完美理解意图,生成优雅且完整的代码,触发大量多巴胺分泌。
- 废票:Agent 陷入幻觉,生成看似合理实则错误的代码。
- “差一点就中奖”:代码跑通 90%,只剩一个隐蔽 Bug,促使开发者不断“再试一次”。
这种不可预测的奖励模式,使开发者从按部就班的建造者变成了坐在代码老虎机前的赌徒。
相关概念
- [[认知过载]]:间歇性强化的结果之一,开发者因持续的高强度警觉状态而心智枯竭。
- [[信号通货膨胀]]:在间歇性强化驱动的效率追求中,开发者用 AI 生成的精美包装掩盖了真实能力。
- [[ai-agent]]:间歇性强化机制的具体载体。
相关来源
- [[深夜里的代码老虎机-AI编程如何把开发者变成失眠的赌徒]] — 本文的核心来源。