Mythos 几小时攻破 NSA？真正危险的不是一个模型，而是安全流程还停在人类速度

2026-06-22

AI安全, 智能体, 网络安全, Anthropic, Mythos, 出口管制

摘要：《经济学人》转述美国参议员 Mark Warner 的说法称，NSA 和网络司令部负责人曾告诉他，Mythos 在内部红队测试中“不是几周，而是几小时内”几乎攻破全部机密系统。这个说法需要加上测试条件的限定，但它揭示的趋势非常清楚：AI 正在把漏洞发现、路径规划和攻击编排压缩到机器速度，传统安全治理必须重构。

Mythos 红队测试示意图

Mythos 被限制使用的故事，正在出现一个更尖锐的解释。

《经济学人》在 6 月 14 日的文章中写到，美国参议院情报委员会副主席 Mark Warner 曾在 6 月 11 日表示，领导美国国家安全局和五角大楼网络司令部的 Joshua Rudd 将军告诉他，Mythos “不是在几周内，而是在几小时内”几乎攻破了他们所有的机密系统[1]。

这句话很容易被传播成一个爆炸性标题：“Mythos 几小时攻破 NSA。”

但更准确的说法应该是：这不是 Mythos 偷偷黑进 NSA，而是在授权内部测试或红队环境中，模型被用于模拟攻击自身系统，表现强到让监管者和国家安全系统重新评估前沿模型的风险边界。

更重要的是，《经济学人》文章作者 Shashank Joshi 随后也公开补充说，这句话不应被过度字面化理解；它很可能依赖 Mythos 与其他工具结合，并发生在特定测试条件下。他表示，原文引用这句话是为了说明 Mythos 的能力强度，但如果当时补充更多限定会更好[2]。

即便加上这些限定，这件事仍然非常重要。因为它说明，AI 在网络攻防中的问题已经不再是“会不会写漏洞利用代码”，而是开始触及一个更深层的问题：

当一个模型能把漏洞发现、路径规划、工具调用和结果验证压缩到机器速度，现有安全治理体系还能不能跟上？

一、不要把它理解成“单模型神话”

首先要拆掉一个误解：这不是一个模型单枪匹马、像电影黑客一样闯进所有机密网络。

真实的网络攻防从来不是单点能力，而是工具链能力。它通常包括资产发现、漏洞识别、权限提升、横向移动、凭证利用、日志规避、结果验证和报告生成。AI 真正改变的，是这些环节之间的编排速度。

Mythos 之所以引发恐慌，不是因为它突然拥有魔法，而是因为它可能把很多原本需要资深安全团队花几天、几周甚至更久完成的链路，压缩到几个小时。

英国 AI Security Institute 对 Claude Mythos Preview 的评估已经给出过类似信号：Mythos Preview 在网络靶场和多步攻击模拟中明显超过此前模型，并成为首个能端到端完成 AISI 某些 cyber range 的模型[3]。AISI 后续还指出，新版 Mythos Preview 能完成两个网络靶场，其中 “The Last Ones” 在 10 次中完成 6 次，“Cooling Tower” 在 10 次中完成 3 次[4]。

这些测试不等于真实世界攻击。AISI 也明确提醒，靶场缺少很多真实企业环境里的主动防御、检测工具和复杂干扰。但这足以说明一件事：前沿模型正在跨过“只能辅助安全研究”的阶段，进入“可以自主推进多步攻防任务”的阶段。

二、为什么“几小时”比“能攻破”更重要

这条消息里最值得关注的不是“攻破”二字，而是“几小时”。

网络安全过去一直是时间竞争。攻击者需要时间寻找入口、防守者需要时间发现异常、修复团队需要时间打补丁、管理层需要时间决策停机或隔离。

AI 改变的是这个时间结构。

过去一个复杂漏洞链可能需要多人协作、反复试错、阅读大量代码和文档。现在模型可以持续阅读代码、生成假设、调用工具、复盘失败、调整路径。只要给它足够上下文、工具权限和运行环境，它就能用远高于人工的速度遍历大量可能性。

这会改变攻防双方的成本曲线。

对攻击侧来说，AI 降低了发现漏洞、组合漏洞和生成利用链的边际成本。攻击者不需要每一步都由专家手写，只要能把目标系统、工具和任务描述组织好，模型就可能放大其能力。

对防守侧来说，传统补丁流程、漏洞评级、资产盘点、人工审计和变更审批都会显得太慢。很多企业仍然按周甚至按月处理补丁，但 AI 攻击链可能按小时推进。

所以 Mythos 事件的真实警示是：安全流程不能继续按人类速度设计。

三、这解释了为什么出口管制会被重新讨论

《经济学人》文章讨论的是美国政府限制外国用户使用 Mythos 5 和 Fable 5 的做法，并批评这种封锁可能显得反复、混乱和政治化[1]。但如果把 Warner 转述的内部测试说法放进去看，政府的担忧也就更容易理解。

过去，美国对加密技术、芯片、EDA、先进制造设备做出口管制，是因为它们能直接改变国家能力边界。现在，前沿 AI 模型也开始被放进类似逻辑里。

原因在于，模型不是单一工具，而是一种通用能力放大器。

一个足够强的网络安全模型，可以帮助防守方发现漏洞、修补系统、自动化审计；也可以帮助攻击方寻找入口、生成 exploit、编排多步攻击。它的双重用途比传统工具更强，也更难通过简单规则切割。

这就是治理难点。你不能简单说“禁止它做坏事”，因为同一项能力在防守和进攻中高度重叠。漏洞发现既能用于修补，也能用于攻击；代码理解既能用于审计，也能用于武器化；自动化编排既能用于安全运营，也能用于横向移动。

所以围绕 Mythos 的争议，本质上不是一个公司和政府的合同纠纷，而是一个新问题：当模型本身成为国家级网络能力的一部分，它还能不能像普通 SaaS 一样全球开放？

AI 模型治理与安全边界示意图

四、企业不能只等政府管制

即使 Mythos 被限制，即使某个模型暂时不对外开放，企业也不能因此松一口气。

因为能力扩散不是只发生在一个模型上。

AISI 在评估 GPT-5.5 时就提到，早期 Mythos Preview 在网络任务上已经代表一次跃升，而 GPT-5.5 也显示出类似能力水平；这表明网络攻防能力的提升可能是前沿模型整体趋势，而不是某一个模型的偶然突破[5]。

换句话说，即便今天限制的是 Mythos，明天其他模型也可能接近这个水平。

企业真正要做的，不是追着某个模型名字恐慌，而是重构自己的安全基础设施。

第一，资产管理必须自动化。企业要知道自己有哪些系统、哪些暴露面、哪些依赖、哪些版本，而不是等到事故发生后才盘点。

第二，漏洞优先级必须机器辅助。AI 攻击时代，漏洞数量会爆炸式增加，人类安全团队不可能逐条人工判断，必须结合业务重要性、暴露面、利用难度和补丁成本进行自动排序。

第三，补丁流程必须加速。传统“季度修复、月度窗口”的节奏会越来越危险。企业需要更细粒度的灰度、回滚、自动测试和变更审计。

第四，内部系统必须默认零信任。不要假设内网就是安全的，不要假设服务之间天然可信，不要让一个入口变成全网横向移动的起点。

第五，AI 工具必须有运行时边界。浏览器、命令行、代码仓库、数据库、工单系统、云账户、MCP 控制面，都要有明确权限、审计和沙箱。

五、AI 既是攻击速度，也是防守速度

我们也不应该把 Mythos 事件只理解成“AI 让攻击者更强”。

同样的能力，也会成为防守方的基础设施。

Anthropic 在 Project Glasswing 中提到，Mythos Preview 可用于发现关键软件中的漏洞；Mozilla 在相关测试中修复了大量 Firefox 漏洞，其他安全平台也报告了 Mythos 在 web exploit benchmark 上的显著能力提升[6]。

这意味着未来安全团队的工作方式会改变。

过去安全团队靠人去读代码、跑扫描器、写规则、排工单。未来更合理的方式是：AI 持续做资产发现、代码审计、补丁影响分析、攻击路径模拟和修复建议，人类负责确认优先级、处理业务风险和制定策略。

防守侧也需要机器速度。

如果攻击者用 AI 自动发现漏洞，而防守者还用人工表格排期，结果不会乐观。只有当防守流程同样被 AI 改造，企业才可能抵消攻击侧的效率增益。

这也是 Mythos 事件最有现实意义的地方：它不是提醒大家关闭 AI，而是提醒大家，安全体系本身必须 AI 化。

六、不要被“神话叙事”带偏

Mythos 这个名字本身就容易制造神话叙事。几小时攻破 NSA，听起来像超级智能已经降临。

但工程上更严谨的判断应该是：

它很可能不是一个模型凭空“黑掉”所有系统，而是在特定授权测试条件下，结合工具链、上下文和目标环境，表现出了远超传统预期的攻防推进能力。

这仍然足够严重。

因为安全系统怕的不是神话，而是速度、规模和可复制性。

只要一个能力可以从少数专家扩散到更多团队，可以从手工操作变成自动流程，可以从单点漏洞发现变成多步攻击链编排，整个防守经济学就会改变。

未来几年，企业和政府真正要回答的问题不是“哪个模型最危险”，而是：

谁可以使用高能力网络安全模型；
使用时能调用哪些工具；
任务过程如何审计；
输出结果是否可以复核；
发现漏洞后如何负责任披露；
模型是否能被限制在防守用途；
政府、厂商、企业之间如何共享风险情报。

这些问题都没有简单答案。

结语：AI 安全进入“机器速度”时代

Mythos 的故事，无论最终细节如何，已经把一个事实推到台前：前沿 AI 正在改变网络攻防的时间尺度。

过去安全治理默认人的速度。人发现漏洞，人写 exploit，人分析日志，人排补丁，人审批上线。

现在，模型可以读代码、查漏洞、连工具、跑实验、写报告、复盘失败，并持续推进。

这不意味着每个系统都会立刻失守，也不意味着人类安全专家失去价值。恰恰相反，越是进入 AI 攻防时代，安全专家越要把经验转化为自动化流程、策略边界和验证体系。

真正危险的不是 Mythos 这一个名字，而是企业、政府和软件供应链还没有准备好面对机器速度。

如果模型能在小时级发现问题，防守体系就不能再用月度节奏响应。

AI 安全的下一阶段，不是多买一个工具，而是重构从资产、漏洞、权限、补丁到审计的整套流程。

参考资料

[1] The Economist, “Donald Trump’s blocking of Anthropic is capricious and chaotic”, 2026-06-14, https://www.economist.com/briefing/2026/06/14/donald-trumps-blocking-of-anthropic-is-capricious-and-chaotic

[2] Shashank Joshi 对该引文的补充说明，转引自 Digg 汇总页，https://digg.com/tech/mno1ygvv

[3] UK AI Security Institute, “Our evaluation of Claude Mythos Preview’s cyber capabilities”, 2026-04, https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

[4] UK AI Security Institute, “How fast is autonomous AI cyber capability advancing?”, 2026-05, https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing

[5] UK AI Security Institute, “Our evaluation of OpenAI’s GPT-5.5 cyber capabilities”, 2026, https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities

[6] Anthropic, “Project Glasswing: An initial update”, 2026, https://www.anthropic.com/research/glasswing-initial-update

AI技术