指令分层 (Instruction Hierarchy)

指令分层 (Instruction Hierarchy)

OpenAI于2026年3月10日研究论文中提出的模型架构改进，通过在模型架构层面引入显式的指令优先级分层，解决第三方工具调用时的越权问题。

技术意义

是实现真正"自主代理"的底层安全基础
为[[原生计算机操作]]提供了安全保障
是[[代理元年]]技术成熟度的重要支撑

相关概念

[[原生计算机操作]] — 应用场景
[[代理元年]] — 所属时代背景
[[宪法AI]] — 另一种AI对齐方法