护栏 vs 治理

护栏 vs 治理

"护栏 vs 治理"是AI安全领域的范式转换概念。传统的AI安全策略侧重于设置语义过滤（护栏），而在AI Agent时代，需要转向涵盖身份、权限、行为审计和物理约束的闭环管理体系（治理）。

对比

维度	护栏	治理
性质	静态的、点状的	动态的、面状的
状态	无状态	有状态的闭环管理
范围	语义过滤	身份、权限、审计、物理约束
适用场景	对话式AI	自主行动的AI Agent

意义

这一范式转换是理解AI Agent安全挑战的关键。在工业控制场景下，治理框架是确保物理安全的生死线。

相关页面

[[ai-agent安全治理]] — 治理框架的具体实现
[[受挫代理人攻击]] — 证明护栏失效的关键案例