护栏 vs 治理
"护栏 vs 治理"是AI安全领域的范式转换概念。传统的AI安全策略侧重于设置语义过滤(护栏),而在AI Agent时代,需要转向涵盖身份、权限、行为审计和物理约束的闭环管理体系(治理)。
对比
| 维度 | 护栏 | 治理 |
|---|---|---|
| 性质 | 静态的、点状的 | 动态的、面状的 |
| 状态 | 无状态 | 有状态的闭环管理 |
| 范围 | 语义过滤 | 身份、权限、审计、物理约束 |
| 适用场景 | 对话式AI | 自主行动的AI Agent |
意义
这一范式转换是理解AI Agent安全挑战的关键。在工业控制场景下,治理框架是确保物理安全的生死线。
相关页面
- [[ai-agent安全治理]] — 治理框架的具体实现
- [[受挫代理人攻击]] — 证明护栏失效的关键案例