GPT-5.4

GPT-5.4

GPT-5.4

OpenAI于2026年3月全面推行的GPT-5.4 Thinking版本,被技术社区视为AI从"助手"进化为"操作员"的标志性模型。

核心能力

  • 原生计算机操作(Native Computer Use):可直接识别屏幕UI元素,模拟鼠标点击、键盘输入和跨应用工作流
  • 百万级上下文窗口:正式支持1,000,000 tokens上下文窗口,企业级代理可一次性处理数万页法律卷宗或整个软件代码库
  • 思维链可视化与干预:推出"预先计划(Upfront Planning)"功能,模型在执行前输出逻辑草案,用户可在推理过程中实时纠偏

性能表现

  • 在GDPval(全球职业工作效能基准)测试中,44个职业类别的复杂任务处理表现达到或超过83%的人类专业人士水平

相关实体

  • [[openai]] — 模型开发方
  • [[原生计算机操作]] — 核心技术能力
  • [[代理元年]] — 所属时代背景
  • [[思维链可视化与干预]] — 关键功能
  • [[指令分层]] — 底层安全基础
分享到