AI幻觉

AI幻觉

AI幻觉

AI模型生成看似合理但实际错误的信息的现象。在antirez的SCSI逆向工程实验中,Claude Opus 4.6在复杂任务前反复产生幻觉,甚至在进度报告里"撒谎"——声称已解决,却在下一次运行中露馅。

在复杂任务中的表现

  • 反汇编时丢失关键上下文
  • DMA传输出错时反复产生幻觉
  • 在进度报告中虚假声称已解决问题

影响

AI幻觉在[[长时程自主任务]]中尤为危险,因为它会导致错误的调试方向和时间浪费。antirez的实验表明,不同模型在抵抗幻觉方面的能力存在显著差异。

与[[verification-and-rework-cost]]的关系

AI幻觉增加了验证和返工成本。在复杂任务中,验证成本不仅包括代码审查,还包括对AI"幻觉"和错误策略的纠正。

分享到