刚喊完 AI 危险到能自己造自己,Anthropic 转头把最强模型开放了:Fable 5 谁都能用,碰生化和黑客题自动换老款顶上

上周 Anthropic 还在博客里写得吓人:前沿模型可能很快就能”自我进化”(RSI),不用人插手自己改自己,整个行业该踩刹车了。

这周它把自己手里最猛的模型,摆到了所有人面前。

6 月 9 日发布的 Claude Fable 5,是 Anthropic 头一回把 Mythos 级别的模型开放给普通用户——Mythos 这个档位,比之前的 Opus 还高一截。换句话说,那个几个月前演示一下就把华尔街和白宫吓得开紧急会议的东西,现在你掏钱就能调。

一个模型,两套人格

Fable 5 和闭门只给一小撮机构用的 Mythos 5,底子是同一个模型。区别在外面那层壳。

Anthropic 给 Fable 5 装了一组分类器,专门盯四类问题:网络攻击、生物、化学、模型蒸馏。一旦它觉得你问的是这四样里的事,当前这句不由 Fable 5 来答,自动甩给老款 Opus 4.8 顶上。

讲人话就是——平时让你用满血版,一碰到能拿去搞破坏的题,它自己缩手,换个能力弱点、把得严点的模型来回你。

官方给的数据是,95% 以上的对话从头到尾都跑在 Fable 5 自己身上,真正触发”换人”的是少数。

“这些安全护栏自己得扛得住别人反复来撬。”

这话是 Anthropic 自己说的。意思很清楚:模型能力越强,那层壳就越得结实,不然开放出去就是给人递刀。

跑分上它确实是 Anthropic 摆出来最强的一个

Anthropic 自己的说法是,Fable 5 在几乎所有测过的基准上都是头一档。几个具体的:

  • 代码评测 FrontierCode,中等算力档就拿了同类模型最高分
  • Hebbia 那套金融基准,分数是所有模型里最高的
  • 带图的视觉任务,也被它列成了新的第一

外面媒体扒出来的数字更直观:SWE-bench Pro 80.3%、Terminal-Bench 2.1 拿到 88%、号称最难的 Humanity’s Last Exam 59%。数据分析公司 Hex 说,Fable 是头一个在它那套复杂长任务分析基准上摸到 90% 的模型。

Stripe 试用完给的反馈是一句话——把几个月的工程量压成了几天。

时间点才是这事最微妙的地方

把这两件事摆一块看:

时间 Anthropic 干了啥
上周 发警告:AI 快能自我进化了,全行业得小心
这周 把自己最强的模型开放给所有人

一边喊危险,一边加速放货。你可以说这是”我先把防护做扎实了才敢放”,也可以说这是商业压力下的两头话。

价钱上 Fable 5 和 Mythos 5 一个数:输入每百万 token 10 美元,输出 50 美元,是 Opus 4.8 的两倍。模型已经上了 Claude API、AWS Bedrock,订阅用户分批开。Mythos 5 那一档还锁着,只发给 Project Glasswing 的合作方和一小撮生物研究者。

所以这步棋走得挺稳,也挺会算账:把”人人可用”的活儿交给装了壳的 Fable,把真正不设限的 Mythos 攥在自己手里,谁能用、用来干嘛,全捏在名单上。

至于那层壳到底扛不扛得住有人天天来撬——这个故事,得等它在野外跑一阵才有答案。

参考来源:Claude Fable 5 and Claude Mythos 5(Anthropic 官方)、Anthropic released Claude Fable 5 days after warning AI is getting too dangerous(TechCrunch)、Anthropic releases Mythos-like AI model to the public, Claude Fable 5(CNBC)