GPT-5.4

GPT-5.4

OpenAI于2026年3月全面推行的GPT-5.4 Thinking版本，被技术社区视为AI从"助手"进化为"操作员"的标志性模型。

核心能力

原生计算机操作（Native Computer Use）：可直接识别屏幕UI元素，模拟鼠标点击、键盘输入和跨应用工作流
百万级上下文窗口：正式支持1,000,000 tokens上下文窗口，企业级代理可一次性处理数万页法律卷宗或整个软件代码库
思维链可视化与干预：推出"预先计划（Upfront Planning）"功能，模型在执行前输出逻辑草案，用户可在推理过程中实时纠偏

性能表现

在GDPval（全球职业工作效能基准）测试中，44个职业类别的复杂任务处理表现达到或超过83%的人类专业人士水平

相关实体

[[openai]] — 模型开发方
[[原生计算机操作]] — 核心技术能力
[[代理元年]] — 所属时代背景
[[思维链可视化与干预]] — 关键功能
[[指令分层]] — 底层安全基础