4月7日,苹果公司因使用包含数百万条YouTube视频的数据集训练AI模型而面临诉讼。原告TedEntertainment、MattFisher和Golfholics三个YouTube频道指控苹果绕过YouTube的反爬虫防护措施,非法下载数百万条视频。诉讼文件指出,苹果研究团队在其研究论文《STIV:可扩展文本与图像条件视频生成》中提到使用了名为Panda-70M的数据集来训练视频生成模型。Panda-70M数据集通过网址、视频标识符和时间戳定位特定YouTube视频及片段,每个片段作为独立训练样本,而获取这些片段需要绕过YouTube的反爬虫保护机制。
原告方声称其内容在Panda-70M数据集中出现超过500次,并希望代表所有受影响的权利人发起集体诉讼。他们要求陪审团审理全部诉求,并主张苹果故意规避YouTube为保护视听内容设立的版权保护系统,要求法定赔偿、禁令救济以及律师费与诉讼成本等。此外,原告方还对亚马逊与OpenAI提起集体诉讼,指控这两家公司同样使用了Panda-70M数据集在其AI模型训练过程中。
