Anthropic昨天(4月7日)做了一件很反常的事:发布了一个新模型,但不让普通人用。
这个模型叫 Claude Mythos。Anthropic自己的内部评估写道,它在网络安全能力上远超任何其他AI模型。然后他们决定——不公开,只给一小撮指定合作伙伴试用。
这个项目叫 Project Glasswing(玻璃翼计划)。
谁能用上这个东西?
名单很豪华:AWS、苹果、英伟达、谷歌、微软、Cisco、CrowdStrike、摩根大通……约10家科技巨头,加上另外40个负责维护关键基础设施的组织。
一共大概50家机构。全球几十亿人用的互联网,就靠这50家机构用Mythos来打补丁。
Anthropic还附送了 1亿美元的模型使用额度,白给这些合作伙伴用,同时直接向开源安全社区捐了 400万美元。
Mythos到底能找到什么漏洞?
过去几周,Anthropic已经用Mythos Preview扫了一圈:
- 数千个零日漏洞,覆盖每一个主流操作系统和主流浏览器
- OpenBSD里有个存在了 27年 的漏洞,可以触发远程系统崩溃
- FFmpeg里有个 16年 历史的缺陷,此前经历数百万次自动化测试都没被发现
- 多个 Linux内核漏洞,可以实现权限提升
27年。不是在找bug,是在挖坟。
FFmpeg的那个漏洞更说明问题:数百万次自动化扫描没抓到,一个AI几周内发现了。传统安全工具该担心的,是自己的位置。
为什么不敢公开?
Anthropic已经私下向政府高层发出警告:Mythos让大规模AI驱动的网络攻击今年内显著更有可能发生。
早在一个月前,一份意外曝光的内部草稿就写道:Mythos目前在网络安全能力上远超任何其他AI模型。这句话现在看来不是在吹,是在认真表达担忧。
防御和攻击用的是同一套能力。Mythos能帮你找漏洞、修漏洞,也能帮黑客找漏洞、打进去。Anthropic的思路是:给防守方一个先手优势——让大厂和关键基础设施维护者抢在攻击者之前把洞堵上。
这个策略有没有问题?
这是一个挺微妙的赌注。
有说服力的地方:如果Mythos真能批量挖出那些几十年都没修的漏洞,这在防御层面确实是突破性的。现有的安全工具显然做不到,不然OpenBSD的27年老洞早就被人盯上了。
但封闭给50家机构这个模式能维持多久?合作伙伴内部的人会不会泄露?其他实验室会不会仿制出类似能力?
更根本的问题是:Anthropic已经造出来了。不管公不公开,能力已经存在了。与其纠结公开不公开,不如问:在竞争对手有相同能力之前,这50家机构能把多少洞堵掉?
Project Glasswing与其说是在管控风险,不如说是在和时间赛跑。
参考来源:Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative(TechCrunch);Anthropic is giving some firms early access to Claude Mythos to bolster cybersecurity defenses(Fortune);Project Glasswing: Securing critical software for the AI era(anthropic.com);Project Glasswing: Anthropic announces big tech consortium to test Claude Mythos(IT Pro)