GPT-5.5

GPT-5.5

GPT-5.5

GPT-5.5是OpenAI于2026年4月24日发布的AI模型,API正式开放。该模型被定位为OpenAI迈向"超级应用"的关键一步,核心转变是从聊天模型进化为"智能体运行时"。

关键特性

  • 智能体运行时:支持计算机操作、多步骤工作流和深度研究
  • 代号"Spud":自GPT-4.5以来首个完全重新训练的基础模型
  • 性能提升:在FrontierMath Tier 4上从27.1%跃升至35.4%
  • 数学突破:协助发现了关于off-diagonal Ramsey数的新证明(后经Lean验证)
  • 安全评级:生物/化学和网络安全能力评级为"高"

竞争表现

  • 在Terminal-Bench 2.0上以微弱优势领先Anthropic尚未公开发布的Claude Mythos Preview
  • 在14项基准测试中取得最优成绩
  • Claude Opus 4.7在SWE-Bench Pro(64.3% vs 58.6%)和GPQA Diamond(94.2% vs 93.6%)上保持领先

战略意义

  • 从聊天模型向"智能体运行时"的角色转变
  • 构建"超级应用"生态的关键一步
  • 与DeepSeek V4形成开源vs闭源、低成本vs高性能的竞争格局

相关页面

  • [[openai]] — OpenAI公司
  • [[超级应用]] — OpenAI的战略目标
  • [[智能体运行时]] — GPT-5.5的核心定位
  • [[deepseek-v4]] — 同期发布的竞争模型
分享到