宪法AI (Constitutional AI)

宪法AI是Anthropic提出的核心AI安全理念，通过内置规则和人类反馈机制，确保模型输出符合伦理标准。该理念是Anthropic"安全优先"品牌定位的理论基础。

核心原则

2026年3月的[[anthropic-data-leak-2026]]事件与宪法AI理念形成强烈反差：一家以"宪法AI"为核心理念的公司，却在基础的内容管理系统配置上犯下低级错误。这凸显了"模型安全"与"运营安全"之间的鸿沟。