GPT-5.5 (Spud)
GPT-5.5(代号"Spud")是OpenAI于2026年4月23日发布的最新大语言模型,距GPT-5.4(3月5日发布)仅隔六周,标志着OpenAI的发布节奏进入"周级迭代"时代。
核心定位
GPT-5.5被OpenAI定位为"智能体运行时"而非传统聊天模型,在计算机操作、多步骤智能体工作流和深度研究能力方面实现显著提升。
基准测试表现
- Terminal-Bench 2.0: 82.7%
- Humanity’s Last Exam: 40.6%
- ARC-AGI-2(验证版): 83.3%
- SWE-bench Pro: 58.6%(低于Claude Opus 4.7的64.3%)
- 在14项基准测试中取得最优成绩
战略意义
GPT-5.5的快速发布反映了AI模型竞争的白热化,也强化了[[ai-junior-engineer]]和[[智能体模式]]的叙事——模型正从"聊天工具"进化为"行动核心"。