一个会自己找漏洞的AI
先说数字。Anthropic测试Mythos Preview时发现:它能在83.1%的情况下一次成功复现并利用漏洞。作为对比,同家公司的Claude Opus 4.6这个指标接近0%。
不是进步一点,是从0到83%。
具体能干什么?Mythos写过一个浏览器漏洞利用程序,把四个独立漏洞串在一起,用了复杂的JIT堆喷技术,成功逃出了渲染进程和操作系统的沙箱。它还写过利用FreeBSD NFS服务器漏洞的远程代码执行程序,用的是ROP链技术。
Anthropic自己说:这个模型在每一个主流操作系统、每一个主流浏览器里都找到了数以千计的新零日漏洞。
之前那篇关于Mythos找到27年历史老漏洞的报道,现在看来只是冰山一角。
联储主席+财政部长+六大行CEO,在一个房间里
Anthropic在4月7日发布Mythos预览时,把访问权限控制在约40家机构里——这是”Project Glasswing”计划。能用上的有:亚马逊、苹果、微软、谷歌、思科、CrowdStrike、摩根大通、NVIDIA、Broadcom、Palo Alto Networks,以及Linux基金会。每家参与机构还会拿到最多1亿美元的算力资源。
然后,4月10日,联邦储备委员会主席杰罗姆·鲍威尔和财政部长斯科特·贝森特,把高盛、富国银行、摩根士丹利、美国银行、花旗的CEO叫进了同一个房间,开了一场紧急会议。
议题是:Anthropic这个AI如果被坏人拿到了怎么办?
CrowdStrike的CTO说得很直接:“从发现漏洞到被攻击者利用,这个时间窗口已经从几个月压缩到了几分钟。AI让这个速度彻底变了。”
但五角大楼还在禁止使用Anthropic
这是最矛盾的地方。
就在鲍威尔和贝森特在华盛顿召集银行家评估Mythos的同时,五角大楼仍然把Anthropic列在供应链黑名单上,要求国防部门停止使用Anthropic的所有平台。
特朗普总统和国防部长彼特·赫格塞斯的理由是:Anthropic坚持限制其AI在军事场景下的使用。
所以结论是:白宫一边让华尔街去测试防御,一边禁止军队用它。同一家公司,同一个模型,同一届政府,两种完全相反的态度。
前白宫AI顾问大卫·萨克斯说,他质疑Anthropic是否在用安全焦虑来推销产品、影响监管政策。这个批评有一定道理。
Anthropic的解释
Anthropic的逻辑是:正因为这个模型太危险,他们才不敢随便放开。Project Glasswing的设计思路是让顶级技术公司用Mythos来找自己系统里的漏洞,先于攻击者修补好。
- Mythos找到漏洞 → 参与机构修补 → 防守方占先手
- 参与方共享安全情报
- Anthropic向相关厂商报告发现的所有漏洞
这叫”以AI防AI”。问题在于:不是所有人都相信Anthropic能控制访问边界。这40家参与机构里有商业竞争对手,共享漏洞信息本身就是个复杂的博弈。
而且”数以千计”这个数字到现在没有被详细拆解。
这意味着什么
Mythos的故事比任何一个benchmark分数都重要,因为它打到了一个真实的神经:如果AI能自动找到任意系统里的漏洞,网络安全的底层逻辑就需要重写。
鲍威尔和贝森特把银行CEO叫来开紧急会议,不是在讨论AI有没有潜力。是因为他们认为威胁是真实的、是近期的。
而这场紧急会议本身,就是这个AI有多强最有力的证明。
不管萨克斯的批评是否成立,一个AI模型逼着美联储主席跟华尔街大行CEO坐在一起开安全简报——这在人类历史上是第一次。
参考来源:Trump officials may be encouraging banks to test Anthropic's Mythos model(TechCrunch);Anthropic Mythos model can find and exploit 0-days(The Register);Powell, Bessent Warn Banks About Security Risks From Anthropic's Mythos AI(Bloomberg/Yahoo Finance);After Anthropic's Mythos AI uncovers thousands of zero-day bugs, top US officials huddle with bank CEOs(TechXplore);Anthropic withholds Mythos Preview model because its hacking is too powerful(Axios)