OpenAI 把死对头 Google 的水印塞进了 ChatGPT:AI 图第一次有了「身份证」

5 月 20 日,OpenAI 发了份不怎么张扬的公告——

它正式成为 C2PA Conforming Generator Product(一家符合内容来源认证规范的生成器产品),并且——这才是关键的——把 Google DeepMind 的 SynthID 水印技术塞进了 ChatGPT、Codex、API、DALL·E 3、ImageGen、Sora 全系图像产品

注意:是 Google DeepMind。OpenAI 跟 Google 在大模型这条赛道上死磕了三年,搜索和 Workspace 早就是正面战场。

这次居然在水印这件事上站到了一边。

三层防护是怎么搭起来的

OpenAI 这次的做法叫「multi-layered provenance」,三层堆起来:

第一层:C2PA 元数据

Coalition for Content Provenance and Authenticity 是 Adobe、微软、BBC 这帮人 2021 年起就在搞的开放标准。给图片打上加密签名的元数据,告诉你「这是谁、什么时候、用什么工具生成的、改过没有」。问题是——元数据太容易丢了,截个图、转个格式就没了。

第二层:SynthID 隐形水印

Google DeepMind 2023 年起做的技术。把肉眼看不见的信号直接写进图像像素里,截图、压缩、改格式都不影响。这次 SynthID 水印会嵌进所有 OpenAI 生成的图。

第三层:openai.com/verify 公共验证工具

任何人上传一张图,工具会同时检查 C2PA 元数据和 SynthID 水印,告诉你「这张图是不是 OpenAI 系统生成的」。

“如果两个信号都没检测到,工具不会下定论——因为这些信号可能被人为擦掉过。”

这句话挺重要——OpenAI 没装是「没人能伪造」,而是把工具的边界写清楚了。

OpenAI 自己承认了局限

公告里有几句话写得很直白:

  • 没有任何单一的溯源技术能独立解决问题
  • 工具目前只能验证 OpenAI 自家产品生成的内容
  • 任何在这套标准建立之前生成的内容,或者刻意绕开这套系统的内容,都识别不了

这种「我们做了但不能解决一切」的姿态,比 PR 稿堆形容词要诚实。

为什么这事得 OpenAI 和 Google 一起做

水印技术有个先天问题:只有大家都用同一套,才有意义

如果只有 OpenAI 的图打 SynthID 水印,那别家生成的图照样可以被人当成「未生成」来用——伪造者只需要换一家模型。

所以这事必须是行业标准,不能是产品差异化。

Adobe 已经在 Firefly 里用 Content Credentials,Google 在自家产品里铺 SynthID。OpenAI 这次的姿态等于站队——加入这个由 Google 主导的水印阵营,不去自己造一套。

接下来要看的是 Anthropic、Meta、xAI。Anthropic 在 Claude 上没有图像生成产品(Claude 不直接出图),暂时不需要做这事;Meta 的 Imagine 和 xAI 的 Aurora 目前都没明确表态。

不是慈善,是监管压力

这事的真实驱动力其实是政府。

美国、欧盟、亚洲多国监管去年开始一致施压:选举年的 AI 假图、政客 deepfake、儿童性侵图像——这些事必须有溯源机制。

OpenAI 自己每半年就要面对一次 8000+ 起 AI 生成 CSAM 的报告。在监管真的落地之前,行业最佳的策略是「我们自己先把方案做出来」,省得让立法者自己来定义技术标准。

水印这件事的本质不是技术,是治理。OpenAI 和 Google 这次站到一边,是因为各自的法律团队算过同一笔账。

剩下的问题——大家什么时候用、会不会被伪造、监管认不认——下一年才有答案。

参考来源:Advancing content provenance for a safer, more transparent AI ecosystem(OpenAI 官方博客)、OpenAI builds a new system to identify AI-generated images(The Media Copilot)、OpenAI joins C2PA and adds Google SynthID watermarks to provenance stack(Resultsense)