6月24日,纽约联邦法院收到一份重量级诉状:近400家美国地方报纸联合对OpenAI和微软提起版权侵权诉讼,指控这两家科技公司在未获许可、未支付任何报酬的情况下,系统性抓取、复制并”摄取”其受版权保护的新闻报道,用于训练ChatGPT和微软Copilot等AI产品。
这不是第一家起诉OpenAI的媒体,但可能是规模最大、最具象征意义的一次。此前《纽约时报》、Ziff Davis、梅里亚姆-韦伯斯特和大英百科全书已经分别提起了诉讼,而这次,将近400家地方报纸——那些真正在覆盖美国各地社区日常新闻的”草根媒体”——站了出来。

诉状里写了什么?
原告在诉状中用了很直白的表述:OpenAI和微软”抓取、复制并摄取”(scraped, copied, and ingested)了他们的新闻作品,没有任何许可,也没有任何补偿。这些地方报纸花真金白银做采访、写报道、核实事实,结果AI公司把内容一股脑喂给了大模型,训练出来的产品还能直接回答用户的新闻问题——相当于用报纸的内容训练出了一个竞争对手。
“被告利用这些新闻作品开发能够直接替代传统新闻报道的AI产品,从而损害了新闻出版行业的生存基础。”——诉状原文
原告律师在法庭文件中强调,地方报纸是美国社区获取本地新闻的核心渠道——市议会开了什么会、本地学校预算怎么花、哪里新开了一家店,这些”接地气”的信息,都是地方报纸的记者跑出来的。AI公司免费使用这些内容,制造出能回答同样问题的AI产品,本质上是在”搭新闻机构巨额投资的便车”。
OpenAI的”选择性付费”策略
这场诉讼最刺痛人的地方在于:OpenAI并不是完全不付钱。过去两年,OpenAI已经和Axel Springer(旗下有Business Insider、Politico)、英国《金融时报》、美联社、法国《世界报》等大型国际媒体达成了付费授权协议。换句话说,大媒体有谈判筹码,能拿到钱;而地方报纸没有,就被白白用了内容。
这种”掐尖式”的授权策略,让中小型出版商特别愤怒。他们觉得,OpenAI是在用”分化瓦解”的方式逐个击破——先和大玩家和解,让小玩家陷入孤立无援的境地。但这次近400家报纸联合起来,就是要告诉OpenAI:我们虽然各自很小,但加起来不好惹。
Timing对OpenAI很糟糕
这起诉讼的Timing,对OpenAI来说相当棘手。据报道,OpenAI正在筹备IPO,但其2025年财报显示亏损高达385亿美元。持续增加的版权诉讼,会直接变成IPO招股书里的”法律风险”章节,投资者读了之后,对估值的看法可能会大打折扣。
更严重的是,如果法院最终判决OpenAI需要为训练数据支付赔偿,那这个金额可能不是几千万美元能搞定的——大模型训练用到的数据量实在太大,按传统版权计费方式算下来,可能是个天文数字。这也是为什么OpenAI拼命想和大型出版商单独和解,而不是等法院给个统一规则。
这不只是钱的问题
地方报纸的困境,其实已经持续了十几年。广告收入被Google和Facebook吃掉,数字化转型又烧钱,很多地方报纸早就撑不下去了。现在AI来了,直接用它们的内容训练模型,连”引流”这个最后的价值都被剥夺了——用户问ChatGPT就能拿到新闻要点,为什么还要去报纸网站看全文?
这起诉讼的走向,很大程度上会影响AI行业未来的数据使用规则。是继续”先用了再说”,还是建立一套透明的内容授权机制?答案可能要在法庭上见分晓了。
发表回复