伦理锁 (Safety Guardrails)

伦理锁是AI模型中的安全限制，用于防止模型被用于有害目的，如致命自主武器（LAWS）和大规模监控。Anthropic拒绝取消其模型中的伦理锁，成为与美国国防部冲突的导火索。