核心事件概述
近日,Meta 公司面临一项由五家全球主要图书出版商及知名作者发起的集体诉讼。原告方包括麦克米伦 (Macmillan)、麦格劳希尔 (McGraw Hill)、爱思唯尔 (Elsevier)、阿歇特 (Hachette)、圣智 (Cengage) 以及作者斯科特·图罗 (Scott Turow)。该诉讼指控 Meta 在训练其 Llama AI 模型过程中,存在严重的版权侵权行为。
主要控诉内容
- 大规模非法抄袭:原告称 Meta 未经许可,在其 AI 模型的开发中“反复抄袭”了数以万计的书籍和期刊文章。
- 使用盗版资源库:诉讼详细指出,Meta 故意从 Library Genesis (创世纪图书馆)、Anna’s Archive (安娜的档案)、Sci-Hub 以及 Sci-Mag 等知名盗版网站获取版权作品。
- 数据集合规性问题:Meta 被指控利用 Common Crawl 数据集训练 Llama,而该数据集中包含了大量未经授权的版权副本。
法律与行业影响
原告律师团队称其为“历史上最大规模的版权材料侵权行为之一”。此案的判决结果可能对未来 AI 模型的数据获取渠道及版权补偿机制产生深远影响。
—
信息来源:The Verge
标签:#Meta #Llama #版权诉讼 #AI训练数据 #图书出版