Microsoft把AI漏洞猎手接进了开发流程:Anthropic的Mythos正在从实验室走向基础设施

4月7日,Anthropic正式宣布Mythos。

那时候的讨论几乎全是:这模型有多可怕、会不会失控、白宫为什么要紧急开会。

15天后,微软宣布把Mythos接进了自家的安全开发生命周期(Security Development Lifecycle,SDL)。

不是测试,不是pilot,是要把AI漏洞扫描纳入正式的软件开发流程

两件事放在一起,说明一件事:Mythos在网络安全方向,已经从”太危险不敢放出来”,走到了”大公司开始当工具用”。

SDL是什么,接进去意味着什么

Security Development Lifecycle是微软自2004年沿用至今的安全开发方法论,要求所有微软产品在每个开发阶段都进行安全审查——从设计到代码到部署。这不是可选项,是微软所有产品上线前的强制流程。

把Mythos接进SDL,意思是:以后微软的代码上线之前,AI会先扫一遍,主动找漏洞

微软用了自家的CTI-REALM benchmark来评估Mythos,这是专门针对”真实世界检测工程任务”设计的测试。结果是”相比此前模型有实质性提升”。具体分数没有公开,但这种说法在微软官方公告里一般不会随便用。

Mythos能做到什么程度

Anthropic在Project Glasswing文档里写得很直接:

“AI模型现在可以自主发现软件弱点、把多个低危漏洞串联成可用的端到端利用链、并生成可执行的概念验证代码。”

换成人话:以前AI能告诉你”这里有个潜在的注入风险”,现在Mythos能告诉你”这里有个注入风险,加上那边的权限绕过,加上这个身份验证漏洞,我给你写好了利用脚本”。

这不是扫描工具,这是会自己打组合拳的红队队员

目前Mythos已经在操作系统和浏览器里找到了数以千计的重大漏洞——这个数字来自微软公告,不是推测。

Project Glasswing:微软、亚马逊、苹果

Anthropic为Mythos设计了一个受控部署机制,叫Project Glasswing——只开放给特定大公司,让他们在严格的访问限制下使用这个能力。

目前确认加入的三家:微软、亚马逊、苹果

这三家的共同点:都有大量自研代码需要持续安全维护,都有内部安全团队有能力使用这类工具,也都有足够的资源来处理Mythos发现的漏洞量。

后面这点很关键。你不能把这个工具直接开放给所有人,因为发现漏洞之后要修。如果修不过来,漏洞列表本身就成了风险——一旦泄露,后果比没发现还糟。受控部署的逻辑在这里。

微软不是在押注单一模型

有一句话值得注意:微软公告里说,”没有任何一个模型定义我们的策略”。

意思是:他们在同时测试多家AI公司的安全能力,Mythos是当前表现最好的,但他们保留随时切换的权利。

微软把这个位置设计成了多模型竞争结构,当前赢家是Mythos,但席位没有锁定。

这对Anthropic来说是个微妙的处境——被全球最大的企业软件公司纳入核心开发流程,但随时可能被替换。这种”有用但没有护城河”的位置,在企业AI市场里很典型。

微软预计2026年6月推出基于多模型的AI安全扫描预览版。那时候应该会有更多公开的测试数据。

为什么AI做进攻性安全测试是个大变量

AI做网络安全有两个方向:

防御侧——帮你检测攻击、过滤恶意流量、做SOC自动化。这条路已经有很多公司在做了,市场也已经建立。

进攻侧(offensive security)——主动扮演黑客,找你自己代码的漏洞。这条路上,人类红队队员的供给有上限,成本高,覆盖面有限。一个产品发布周期里,能跑多少轮红队测试,基本取决于团队人头。

Mythos走的是第二条路,而且据目前数据来看,能力已经到了”可以进生产流程”的程度。

微软宣布这件事当天,MSFT股价涨了1.86%。市场的判断很直接。

更有意思的问题是:六月份那个多模型扫描方案出来之后,它会不会成为所有大型软件公司的标配?如果是,这是一笔规模可观的新市场,而且进攻侧的玩家今天还没几个。

参考来源:Microsoft to integrate Anthropic's Mythos into its security development program(Reuters/iTnews);AI-powered defense for an AI-accelerated threat landscape(Microsoft Security Blog);Microsoft (MSFT) Stock Integrates Anthropic Claude Mythos Into Security Framework(CoinCentral)