英伟达被控使用“安娜档案馆”百万盗版书训练AI
创始人
2026-01-20 19:26:02
0

1月20日,英伟达被指控使用“安娜档案馆”的数百万本盗版书籍为其人工智能模型训练提供数据支持。在一项集体诉讼案中,数位图书作者指控英伟达直接联系“安娜档案馆”寻求高速访问权限。原告方发现英伟达的多份内部邮件及文件,指出该公司曾蓄意下载数百万本受版权保护的图书。诉状称,英伟达数据战略团队的一名成员曾主动联系“安娜档案馆”,洽谈获取其数百万份盗版资料,并探讨将“安娜档案馆”纳入其大语言模型预训练数据的可行性。英伟达方面在一周内就批准了这项合作,随后“安娜档案馆”便向这家芯片巨头开放了盗版书籍的访问权限。

原告方在证据开示阶段发现了更多佐证,上周五提交了经修订的起诉状,大幅扩大了诉讼范围。除新增更多涉案书籍、作者及人工智能模型外,诉状还纳入了更广泛的“影子图书馆”相关指控。诉状指出,“安娜档案馆”承诺向英伟达开放约500TB的数据访问权限,其中包含数百万本图书,这些图书通常仅能通过“互联网档案馆”的数字借阅系统获取。英伟达还被指控使用了其他盗版数据源,如“图书馆基因”(LibGen)、“科学枢纽”(Sci-Hub)以及“Z图书馆”(Z-Library)等平台下载图书。原告方称,英伟达除了自身下载并使用盗版书籍训练人工智能模型外,还向企业客户分发脚本和工具,使其能够自动下载包含盗版Books3数据集的“ThePile”数据库。

相关内容

热门资讯

宝马财报超预期,CEO对美关税... 5月7日,宝马集团宣布维持2026年的财务指引,尽管第一季度利润下降25%,但业绩仍好于市场预期。宝...
理想L9Livis革新5C增程... 5月7日,理想汽车CEO李想通过微博分享了即将发布的全新理想L9Livis的核心卖点。李想指出,新车...
特斯拉Cybercab电动卡车... 近日,特斯拉Semi电动半挂卡车被捕捉到装载Cybercab驶离得州超级工厂,标志着这款双人自动驾驶...
捷豹Type00电动GT跑车即... 5月6日,汽车媒体AutocarIndia报道,捷豹计划于5月12日公布其Type00电动GT跑车的...
比亚迪领汇e9即将上市,5分钟... 5月7日,比亚迪旗下品牌领汇汽车宣布,其第二款车型领汇e9将于5月9日上市。领汇e9搭载了比亚迪的闪...
韩国SEMIFIVE联手寒序科... 5月7日,韩国SEMIFIVE公司宣布与中国寒序科技(ICYTech)合作,成功流片了一款采用三星晶...
问界M7Pro+升级城区智能驾... 5月7日,问界M7Pro+车型迎来了重要的功能升级,正式支持城区领航辅助NCA功能,使得日常城市驾驶...
雷克萨斯旗舰纯电SUV TZ冬... 5月7日,雷克萨斯宣布其旗舰纯电SUV车型TZ将于今年冬季在日本和北美市场上市。新车延续品牌最新理念...
腾讯联合UCLA发布OpenS... 5月7日,腾讯混元(TencentHunyuan)联合加州大学洛杉矶分校(UCLA)、香港中文大学等...
雷克萨斯发布全新纯电SUV:5... 今日,雷克萨斯公布了其全新纯电动三排座SUV车型——TZ。新车的车长达到5.1米,轴距为3.05米,...