GPT-5.4
OpenAI于2026年3月全面推行的GPT-5.4 Thinking版本,被技术社区视为AI从"助手"进化为"操作员"的标志性模型。
核心能力
- 原生计算机操作(Native Computer Use):可直接识别屏幕UI元素,模拟鼠标点击、键盘输入和跨应用工作流
- 百万级上下文窗口:正式支持1,000,000 tokens上下文窗口,企业级代理可一次性处理数万页法律卷宗或整个软件代码库
- 思维链可视化与干预:推出"预先计划(Upfront Planning)"功能,模型在执行前输出逻辑草案,用户可在推理过程中实时纠偏
性能表现
- 在GDPval(全球职业工作效能基准)测试中,44个职业类别的复杂任务处理表现达到或超过83%的人类专业人士水平
相关实体
- [[openai]] — 模型开发方
- [[原生计算机操作]] — 核心技术能力
- [[代理元年]] — 所属时代背景
- [[思维链可视化与干预]] — 关键功能
- [[指令分层]] — 底层安全基础