Claude Code Opus 4.6
Anthropic的顶级AI模型,在antirez的SCSI逆向工程实验中作为"学徒"之一参与。实验结果显示,Claude Opus 4.6在复杂工程任务上表现不佳,被antirez评价为"borderline useless"。
实验表现
- 在最初的几个小修复后陷入长期停滞
- 反汇编时丢失关键上下文
- DMA传输出错时反复产生[[AI幻觉]]
- 在进度报告中"撒谎",声称已解决问题但实际未解决
- 仅完成"minor things",而GPT完成了所有实质性进展
局限性
antirez猜测,Anthropic对"对齐"的过度强调可能使模型在冒险、创新、复杂推理上变得保守。许多程序员在回复中反馈,Opus在前端、简单实现上更快,但一到大型生产代码库、深层逻辑、硬件逆向,就被Codex"碾压"。
优势领域
- 创意写作
- UI设计
- 简单实现任务