0
权重的领土主权:Anthropic为何宁可得罪五角大楼也要死守这条红线?
核心影响: 这份文档是Anthropic与五角大楼闹翻的技术导火索。它详细定义了"ASL-4"(AI安全等级4)的红线,明确指出如果模型展现出自主网络攻击或协助大规模杀伤性武器的能力,必须执行"物理隔离"部署。 深度看点: 文档中更新了关于"模型权重保护"的严苛标准,这解释了为什么他们拒绝向国防部交出完整权重。对于研究AI治理和数学对齐的