今年1月28日,环球音乐出版集团(UMGP)、Concord Music Group和ABKCO Music联合对Anthropic提起诉讼,索赔31亿美元。
核心指控:Anthropic是用盗版为Claude奠基的。
两个月后的3月18日,BMG Rights Management跟进起诉,这次点了名——Bruno Mars和Rolling Stones的歌词被用于训练模型,没有获得授权。
两起案子加在一起,可能是AI行业迄今为止来自内容版权方的最大规模法律行动。
先看去年已经有了结果的那个
2025年6月,Bartz v. Anthropic案达成了15亿美元的庭外和解。
这个案子的判决理路值得仔细看:
- 用版权书籍训练AI = 合理使用。法院认为训练行为具有充分的转化性,判决书里的原话是spectacularly so(极其转化性)。
- 存储盗版文件本身 ≠ 合理使用。Anthropic在训练过程中下载并存储了大量盗版材料——这个行为被认定违规。
结论就是:训练可以,但你怎么拿到训练数据这件事法院会管。
这条分界线画得很清楚,也很微妙。
音乐行业的逻辑为什么更复杂
书的情况是:你下载了整本书,用它训练,这个整本书是个完整独立的版权作品。
歌词的情况要复杂一些。歌词通常很短,在大量平台上都有转载,它算不算Claude训练数据里的有意收集对象?这个论证比书难做得多。
但31亿美元的索赔额说明,音乐方面的律师对自己的论证有信心——或者至少对庭外和解的杠杆有信心。
15亿美元的前案已经证明了Anthropic倾向于和解,而不是打到底。
另外两条线也在同步推进
Meta这边,Kadrey et al. v. Meta案,Meta在初审阶段拿到了部分驳回——法院认为即使用了盗版材料做训练,在某些条件下也可以是合理使用。但种子下载过程中涉及的传播行为这部分指控还在审。
这个判决对整个行业其实是偏利好的——它说明训练行为本身已经有了相对清晰的抗辩路径。
OpenAI那边,纽约南区法院把12个版权诉讼合并处理,还命令OpenAI交出数百万条ChatGPT对话记录给原告做取证。这个动作说明原告在试图证明ChatGPT的输出内容本身侵权,而不只是训练数据侵权。
Disney v. Midjourney也还在审。这家更关注的是AI输出的图像是否是对米老鼠等IP的衍生侵权,和训练数据的故事不太一样。
诉讼重心正在从训练转向输出
法律咨询机构Morrison Foerster在今年初的报告里判断:2026年AI版权诉讼的重心正在从训练数据是否侵权转向模型输出是否侵权。
也就是说,未来的官司可能更多是:你的AI输出的内容侵权了,而不是你用什么数据训练的模型侵权了。
这个转变如果成真,对AI公司的影响会更深——因为你可以控制自己用什么数据训练,但你很难控制模型在大量用户使用过程中会输出什么。
这些诉讼对行业的实际影响
短期来看,AI公司的数据采购方式已经在变了。Google、OpenAI和Anthropic这几年都在大量签版权授权协议——跟新闻媒体、学术出版商、图书公司谈合作。这不是因为他们认为不签就一定有法律问题,而是因为不确定性太高,提前买个安心更划算。
中期来看,这些诉讼的判决会逐渐划清AI训练的法律边界。边界越清晰,对整个行业反而越好——至少投资人和合规团队会这么想。
31亿美元的起诉数字很吓人,但更值得关注的是:法院最终会把可以用来训练AI的内容和不可以的内容这条线画在哪里。这条线划完,才是这场战争真正结束的时候。
参考来源:AI in litigation series: An update on AI copyright cases in 2026(Norton Rose Fulbright);Generative AI Lawsuits Timeline(Sustainable Tech Partner);AI Trends for 2026 - Copyright Litigation Shifts from Training Data to AI Outputs(Morrison Foerster);US copyright cases against AI training surge past 100(Noah News)