原生计算机使用能力
原生计算机使用能力(Native Computer Use)是指AI模型直接操作桌面环境、浏览器和专业软件的能力,无需通过API或代码生成。这是[[GPT-5.4]]的关键特性,标志着AI从"大脑"演变为"四肢"。
技术意义
- AI不再局限于文本生成,而是能够像人类一样操作计算机界面。
- 与传统的RAG(检索增强生成)不同,原生计算机使用能力允许模型在执行复杂任务时将整个代码库或财务报表完整载入内存。
- 极大地减少了上下文丢失导致的幻觉。
与Agentic AI的关系
原生计算机使用能力是[[Agentic AI]]落地的具体技术路径。它使得"AI初级工程师"的概念从代码生成扩展到操作整个数字环境,其管理复杂性更高。参见[[ai-junior-engineer]]。
安全挑战
原生计算机使用能力带来了新的安全漏洞和滥用风险。OpenAI通过收购[[promptfoo]]强化[[指令分层]]技术,以应对提示注入攻击等安全威胁。