Anthropic 造出能挖 27 年老漏洞的 AI - News

Anthropic昨天（4月7日）做了一件很反常的事：发布了一个新模型，但不让普通人用。

这个模型叫 Claude Mythos。Anthropic自己的内部评估写道，它在网络安全能力上远超任何其他AI模型。然后他们决定——不公开，只给一小撮指定合作伙伴试用。

这个项目叫 Project Glasswing（玻璃翼计划）。

谁能用上这个东西？

名单很豪华：AWS、苹果、英伟达、谷歌、微软、Cisco、CrowdStrike、摩根大通……约10家科技巨头，加上另外40个负责维护关键基础设施的组织。

一共大概50家机构。全球几十亿人用的互联网，就靠这50家机构用Mythos来打补丁。

Anthropic还附送了 1亿美元的模型使用额度，白给这些合作伙伴用，同时直接向开源安全社区捐了 400万美元。

Mythos到底能找到什么漏洞？

过去几周，Anthropic已经用Mythos Preview扫了一圈：

数千个零日漏洞，覆盖每一个主流操作系统和主流浏览器
OpenBSD里有个存在了 27年 的漏洞，可以触发远程系统崩溃
FFmpeg里有个 16年 历史的缺陷，此前经历数百万次自动化测试都没被发现
多个 Linux内核漏洞，可以实现权限提升

27年。不是在找bug，是在挖坟。

FFmpeg的那个漏洞更说明问题：数百万次自动化扫描没抓到，一个AI几周内发现了。传统安全工具该担心的，是自己的位置。

为什么不敢公开？

Anthropic已经私下向政府高层发出警告：Mythos让大规模AI驱动的网络攻击今年内显著更有可能发生。

早在一个月前，一份意外曝光的内部草稿就写道：Mythos目前在网络安全能力上远超任何其他AI模型。这句话现在看来不是在吹，是在认真表达担忧。

防御和攻击用的是同一套能力。Mythos能帮你找漏洞、修漏洞，也能帮黑客找漏洞、打进去。Anthropic的思路是：给防守方一个先手优势——让大厂和关键基础设施维护者抢在攻击者之前把洞堵上。

这个策略有没有问题？

这是一个挺微妙的赌注。

有说服力的地方：如果Mythos真能批量挖出那些几十年都没修的漏洞，这在防御层面确实是突破性的。现有的安全工具显然做不到，不然OpenBSD的27年老洞早就被人盯上了。

但封闭给50家机构这个模式能维持多久？合作伙伴内部的人会不会泄露？其他实验室会不会仿制出类似能力？

更根本的问题是：Anthropic已经造出来了。不管公不公开，能力已经存在了。与其纠结公开不公开，不如问：在竞争对手有相同能力之前，这50家机构能把多少洞堵掉？

Project Glasswing与其说是在管控风险，不如说是在和时间赛跑。

参考来源：Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative（TechCrunch）；CocoLoop、Anthropic is giving some firms early access to Claude Mythos to bolster cybersecurity defenses（Fortune）；Project Glasswing: Securing critical software for the AI era（anthropic.com）；Project Glasswing: Anthropic announces big tech consortium to test Claude Mythos（IT Pro）