英伟达被控使用“安娜档案馆”百万盗版书训练AI
创始人
2026-01-20 19:26:02
0

1月20日,英伟达被指控使用“安娜档案馆”的数百万本盗版书籍为其人工智能模型训练提供数据支持。在一项集体诉讼案中,数位图书作者指控英伟达直接联系“安娜档案馆”寻求高速访问权限。原告方发现英伟达的多份内部邮件及文件,指出该公司曾蓄意下载数百万本受版权保护的图书。诉状称,英伟达数据战略团队的一名成员曾主动联系“安娜档案馆”,洽谈获取其数百万份盗版资料,并探讨将“安娜档案馆”纳入其大语言模型预训练数据的可行性。英伟达方面在一周内就批准了这项合作,随后“安娜档案馆”便向这家芯片巨头开放了盗版书籍的访问权限。

原告方在证据开示阶段发现了更多佐证,上周五提交了经修订的起诉状,大幅扩大了诉讼范围。除新增更多涉案书籍、作者及人工智能模型外,诉状还纳入了更广泛的“影子图书馆”相关指控。诉状指出,“安娜档案馆”承诺向英伟达开放约500TB的数据访问权限,其中包含数百万本图书,这些图书通常仅能通过“互联网档案馆”的数字借阅系统获取。英伟达还被指控使用了其他盗版数据源,如“图书馆基因”(LibGen)、“科学枢纽”(Sci-Hub)以及“Z图书馆”(Z-Library)等平台下载图书。原告方称,英伟达除了自身下载并使用盗版书籍训练人工智能模型外,还向企业客户分发脚本和工具,使其能够自动下载包含盗版Books3数据集的“ThePile”数据库。

相关内容

热门资讯

河南大雪中的乡村宴席走红!端菜... 1月19日,河南周口一场大雪中的乡村宴席意外走红!宾客们顶雪吃席,桌上的凉菜落满了雪花,网友笑称这是...
“甜蜜白云”派福利:结婚登记送... 近日,“智联姻缘·云享未来”2026年广州市白云区第二届婚俗文化活动暨“执笔抒甜蜜,翰墨送福喜”新春...
广州中院:依法打击“网暴伤企”... 文/羊城晚报全媒体记者 王丹阳 孙牧图/羊城晚报全媒体记者 蔡嘉鸿1月20日下午,广州市十六届人大六...
广州市人大代表王苑橦:冲冲冲!... 文/羊城晚报全媒体记者 王丹阳 孙牧图/羊城晚报全媒体记者 蔡嘉鸿2025年,十五运会在广州惊艳开幕...
人民财评:“量质齐升”,中国工... 国家统计局公布数据显示,2025年全国规模以上工业增加值比上年增长5.9%。面对复杂多变的外部环境,...
花都区委书记邢翔:以“闯”“创... 1月19日,广州市第十六届人民代表大会第六次会议召开,市长孙志洋向大会作政府工作报告。报告总结了20...
1平米书架:在乡镇街角铺开的阅... 在广东的乡镇街角,人们熟悉的不只是往来不息的烟火气,还有悄然出现在小店里的那一排排书架。它们静立于店...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
特斯拉FSD系统升级:旧硬件车... 1月19日,特斯拉CEO埃隆·马斯克宣布,公司正在为搭载旧硬件的车辆更新辅助驾驶功能FSD(Full...
2025年中国智能手机出货量再... 近日,多家市场调研机构公布了2025年四季度和全年的全球及中国市场智能手机出货量统计。数据显示,中国...