特朗普科学顾问坐不住了:数万代理账号,中国在系统性「蒸馏」美国AI

这次说话的不是哪个国会议员,不是某家AI公司的律师。

是Michael Kratsios。特朗普的科学顾问,白宫科学与技术政策办公室主任。

他4月23日公开说:

“系统性地提取和复制美国工业的创新,这没有任何创新性可言。”

这话指向很清楚——美国政府正式记录在案:中国在工业化地抄袭美国AI。

具体怎么抄的

这次不是”偷数据”这种模糊说法。Kratsios描述的是一套完整体系:

第一步:建代理账号矩阵。
数万个代理账号,分散IP,大规模查询OpenAI、Anthropic、Google的模型,绕过访问限制。

第二步:模型蒸馏。
把问出来的回答——包括推理链(chain of thought)和内部推理步骤——用来训练自己的小模型。

逻辑是:你不需要重做一百年实验,只要问出已经做过实验的人的答案,然后学它的思路。训练成本只是原版的零头。

第三步:破解安全护栏。
部分场景还涉及破解原模型的安全限制,提取平时问不出来的信息。

Kratsios的结论:这些蒸馏出来的模型,在某些基准测试上能接近美国顶级大模型的表现,训练成本却只是原版的一个零头。

这不是第一次有人说,但这次不一样

Anthropic、OpenAI、Google之前都分别报告过类似攻击。

去年有个报道被广泛转载:DeepSeek、Kimi、MiniMax被指从Claude和ChatGPT抽取了1600万次对话用于训练。三家都否认了。

那次还停在”企业投诉竞争对手”的层面。

这次不一样:是美国总统的科学顾问,站在政府位置说这话。意味着:

  • 这件事已经进入了情报体系的正式评估
  • 美国政府准备把它当政策议题处理,而不是私企法律纠纷

Kratsios还补充,白宫计划加强与科技公司的情报共享,共同设计反制方案。

一个微妙的地方

模型蒸馏本身是完全合法的技术。

拿开源模型的输出来训练小模型,在学界是常规操作,大量开源研究靠这个做出来的。

Kratsios指控的,是三件组合在一起的事:绕过访问限制 + 工业化规模 + 破解安全护栏

这三个放在一起,就不是”技术学习”,是有组织的知识产权窃取。

中国没有正面回应。这类指控从来不会有”是的,我们在抄”这种回答,但接下来的政策和外交反应会说明态度。

实际影响会怎么走

短期内,主要大模型公司大概率会收紧API访问审核——更严格的实名验证、更复杂的异常流量检测、可能的地区访问限制。

Anthropic已经在Constitutional Classifiers上投入研究,用AI检测AI的滥用行为。OpenAI和微软签了安全合作协议,共享网络安全能力。这些布局,和Kratsios说的”与产业情报共享”是配套的。

但更根本的问题是:如果蒸馏技术本身就能把一个训练了几百亿美元的模型,压缩成几百万美元可以复制的版本,那技术护城河本身就是脆弱的。

护栏、反制、情报共享都有用,但这场游戏的规则,已经变了。


“没有任何创新性可言”——Kratsios这话,听起来更像是一场漫长博弈的开场白,不是终章。

参考来源:Trump science advisor says Chinese actors are copying American AI at massive scale(The Decoder)