伦理锁 (Safety Guardrails) 伦理锁 (Safety Guardrails) 伦理锁是AI模型中的安全限制,用于防止模型被用于有害目的,如致命自主武器(LAWS)和大规模监控。Anthropic拒绝取消其模型中的伦理锁,成为与美国国防部冲突的导火索。 法律争点 Anthropic援引第一修正案,主张AI模型的安全对齐属于"受保护的表达",政府强迫其取消安全限制属于"强迫发言(Compelled Speech)"。