指令分层 (Instruction Hierarchy) 指令分层 (Instruction Hierarchy) OpenAI于2026年3月10日研究论文中提出的模型架构改进,通过在模型架构层面引入显式的指令优先级分层,解决第三方工具调用时的越权问题。 技术意义 是实现真正"自主代理"的底层安全基础 为[[原生计算机操作]]提供了安全保障 是[[代理元年]]技术成熟度的重要支撑 相关概念 [[原生计算机操作]] — 应用场景 [[代理元年]] — 所属时代背景 [[宪法AI]] — 另一种AI对齐方法