5 月 20 日,OpenAI 发了份不怎么张扬的公告——
它正式成为 C2PA Conforming Generator Product(一家符合内容来源认证规范的生成器产品),并且——这才是关键的——把 Google DeepMind 的 SynthID 水印技术塞进了 ChatGPT、Codex、API、DALL·E 3、ImageGen、Sora 全系图像产品。
注意:是 Google DeepMind。OpenAI 跟 Google 在大模型这条赛道上死磕了三年,搜索和 Workspace 早就是正面战场。
这次居然在水印这件事上站到了一边。
三层防护是怎么搭起来的
OpenAI 这次的做法叫「multi-layered provenance」,三层堆起来:
第一层:C2PA 元数据
Coalition for Content Provenance and Authenticity 是 Adobe、微软、BBC 这帮人 2021 年起就在搞的开放标准。给图片打上加密签名的元数据,告诉你「这是谁、什么时候、用什么工具生成的、改过没有」。问题是——元数据太容易丢了,截个图、转个格式就没了。
第二层:SynthID 隐形水印
Google DeepMind 2023 年起做的技术。把肉眼看不见的信号直接写进图像像素里,截图、压缩、改格式都不影响。这次 SynthID 水印会嵌进所有 OpenAI 生成的图。
第三层:openai.com/verify 公共验证工具
任何人上传一张图,工具会同时检查 C2PA 元数据和 SynthID 水印,告诉你「这张图是不是 OpenAI 系统生成的」。
“如果两个信号都没检测到,工具不会下定论——因为这些信号可能被人为擦掉过。”
这句话挺重要——OpenAI 没装是「没人能伪造」,而是把工具的边界写清楚了。
OpenAI 自己承认了局限
公告里有几句话写得很直白:
- “没有任何单一的溯源技术能独立解决问题“
- 工具目前只能验证 OpenAI 自家产品生成的内容
- 任何在这套标准建立之前生成的内容,或者刻意绕开这套系统的内容,都识别不了
这种「我们做了但不能解决一切」的姿态,比 PR 稿堆形容词要诚实。
为什么这事得 OpenAI 和 Google 一起做
水印技术有个先天问题:只有大家都用同一套,才有意义。
如果只有 OpenAI 的图打 SynthID 水印,那别家生成的图照样可以被人当成「未生成」来用——伪造者只需要换一家模型。
所以这事必须是行业标准,不能是产品差异化。
Adobe 已经在 Firefly 里用 Content Credentials,Google 在自家产品里铺 SynthID。OpenAI 这次的姿态等于站队——加入这个由 Google 主导的水印阵营,不去自己造一套。
接下来要看的是 Anthropic、Meta、xAI。Anthropic 在 Claude 上没有图像生成产品(Claude 不直接出图),暂时不需要做这事;Meta 的 Imagine 和 xAI 的 Aurora 目前都没明确表态。
不是慈善,是监管压力
这事的真实驱动力其实是政府。
美国、欧盟、亚洲多国监管去年开始一致施压:选举年的 AI 假图、政客 deepfake、儿童性侵图像——这些事必须有溯源机制。
OpenAI 自己每半年就要面对一次 8000+ 起 AI 生成 CSAM 的报告。在监管真的落地之前,行业最佳的策略是「我们自己先把方案做出来」,省得让立法者自己来定义技术标准。
水印这件事的本质不是技术,是治理。OpenAI 和 Google 这次站到一边,是因为各自的法律团队算过同一笔账。
剩下的问题——大家什么时候用、会不会被伪造、监管认不认——下一年才有答案。
参考来源:Advancing content provenance for a safer, more transparent AI ecosystem(OpenAI 官方博客)、OpenAI builds a new system to identify AI-generated images(The Media Copilot)、OpenAI joins C2PA and adds Google SynthID watermarks to provenance stack(Resultsense)