31亿美元,音乐巨头起诉Anthropic:AI训练数据的法律红线正在被画出来

今年1月28日,环球音乐出版集团(UMGP)、Concord Music Group和ABKCO Music联合对Anthropic提起诉讼,索赔31亿美元

核心指控:Anthropic是用盗版为Claude奠基的。

两个月后的3月18日,BMG Rights Management跟进起诉,这次点了名——Bruno Mars和Rolling Stones的歌词被用于训练模型,没有获得授权。

两起案子加在一起,可能是AI行业迄今为止来自内容版权方的最大规模法律行动。

先看去年已经有了结果的那个

2025年6月,Bartz v. Anthropic案达成了15亿美元的庭外和解。

这个案子的判决理路值得仔细看:

  • 用版权书籍训练AI = 合理使用。法院认为训练行为具有充分的转化性,判决书里的原话是spectacularly so(极其转化性)。
  • 存储盗版文件本身 ≠ 合理使用。Anthropic在训练过程中下载并存储了大量盗版材料——这个行为被认定违规。

结论就是:训练可以,但你怎么拿到训练数据这件事法院会管

这条分界线画得很清楚,也很微妙。

音乐行业的逻辑为什么更复杂

书的情况是:你下载了整本书,用它训练,这个整本书是个完整独立的版权作品。

歌词的情况要复杂一些。歌词通常很短,在大量平台上都有转载,它算不算Claude训练数据里的有意收集对象?这个论证比书难做得多。

但31亿美元的索赔额说明,音乐方面的律师对自己的论证有信心——或者至少对庭外和解的杠杆有信心。

15亿美元的前案已经证明了Anthropic倾向于和解,而不是打到底。

另外两条线也在同步推进

Meta这边,Kadrey et al. v. Meta案,Meta在初审阶段拿到了部分驳回——法院认为即使用了盗版材料做训练,在某些条件下也可以是合理使用。但种子下载过程中涉及的传播行为这部分指控还在审。

这个判决对整个行业其实是偏利好的——它说明训练行为本身已经有了相对清晰的抗辩路径。

OpenAI那边,纽约南区法院把12个版权诉讼合并处理,还命令OpenAI交出数百万条ChatGPT对话记录给原告做取证。这个动作说明原告在试图证明ChatGPT的输出内容本身侵权,而不只是训练数据侵权。

Disney v. Midjourney也还在审。这家更关注的是AI输出的图像是否是对米老鼠等IP的衍生侵权,和训练数据的故事不太一样。

诉讼重心正在从训练转向输出

法律咨询机构Morrison Foerster在今年初的报告里判断:2026年AI版权诉讼的重心正在从训练数据是否侵权转向模型输出是否侵权。

也就是说,未来的官司可能更多是:你的AI输出的内容侵权了,而不是你用什么数据训练的模型侵权了。

这个转变如果成真,对AI公司的影响会更深——因为你可以控制自己用什么数据训练,但你很难控制模型在大量用户使用过程中会输出什么。

这些诉讼对行业的实际影响

短期来看,AI公司的数据采购方式已经在变了。Google、OpenAI和Anthropic这几年都在大量签版权授权协议——跟新闻媒体、学术出版商、图书公司谈合作。这不是因为他们认为不签就一定有法律问题,而是因为不确定性太高,提前买个安心更划算。

中期来看,这些诉讼的判决会逐渐划清AI训练的法律边界。边界越清晰,对整个行业反而越好——至少投资人和合规团队会这么想。

31亿美元的起诉数字很吓人,但更值得关注的是:法院最终会把可以用来训练AI的内容和不可以的内容这条线画在哪里。这条线划完,才是这场战争真正结束的时候。

参考来源:AI in litigation series: An update on AI copyright cases in 2026(Norton Rose Fulbright);Generative AI Lawsuits Timeline(Sustainable Tech Partner);AI Trends for 2026 - Copyright Litigation Shifts from Training Data to AI Outputs(Morrison Foerster);US copyright cases against AI training surge past 100(Noah News)