一组数字:到 2026 年 5 月,Anthropic 自己系统里合并进去的代码,超过 80% 是 Claude 写的。
而在 Claude Code 2025 年初上线之前,这个比例还是个位数。
一年多时间,从个位数到八成。6 月 4 号 Anthropic 把这个数据摆出来,配了一句不太轻松的判断:AI 行业可能比所有人想的更快,走向「递归自我改进」——也就是一个 AI 模型,自己动手造出更强的下一代。
为什么这事值得警惕
「AI 写代码」本身不新鲜了。新鲜的是 Anthropic 把它跟「造自己」这条线连了起来。
逻辑很直接:如果造一个更强 AI 所需的工程活,越来越多由现有 AI 来干,那这个循环就有可能自己转起来——人在里面的作用越来越小。
支撑这个担心的,还有一条更扎眼的趋势线。Anthropic 说,模型能稳定搞定的任务时长,大约每四个月翻一倍:
| 模型 | 时间 | 能稳定干多长的活 |
|---|---|---|
| Claude Opus 3 | 2024 年初 | 几分钟的编码任务 |
| Claude Sonnet 3.7 | 2025 年 | 约 90 分钟 |
| Claude Opus 4.6 | 之后 | 最长 12 小时 |
从「几分钟」到「12 小时」,中间也就一年多。照这个斜率往下推,会推到哪儿,不难想象。
Anthropic 自己怎么说
政策负责人、联合创始人 Jack Clark 的话挺直白:
「我们一向觉得,最该做的事就是把这个概念摆到台面上,让大家对即将到来的东西有个心理准备。」
他还补了一句更实在的——作为机构,「我们得想办法搞出工具,去验证和核查」AI 干出来的活。
翻成人话:AI 写得越来越多,但谁来检查它写的对不对,这套机制还没跟上。
别急着喊「天要塌了」
Anthropic 自己也没把话说满。他们承认,离「AI 完全自主地开发 AI」,中间还隔着不小的距离。公司给这份风险报告下的总结论是:灾难性风险,目前仍然很低。
但「目前很低」这四个字,重点在「目前」。Anthropic 另一句话是:模型再强下去,万一监督机制没能同步跟上,新的风险就会冒出来。
有意思的地方在这儿——一家把模型卖得最好、估值快摸到一万亿美元的公司,自己跳出来喊「这事可能比我们想的快,得当心」。
你可以说这是真有责任感,也可以说这是抢占叙事的高地。但有一点是实的:他们摆出来的那个 80%,是真金白银发生在自己代码库里的事,不是 PPT 上的预测。
这个故事,显然还没讲完。
参考来源:Anthropic says AI could soon create more advanced versions of itself(Interesting Engineering)