AI“记忆”版权作品引发法律争议,大模型训练数据泄露风险凸显
创始人
2026-02-24 10:57:55
0

近日,全球顶尖人工智能模型被发现能够通过提示词生成与畅销小说几乎逐字相同的内容,这一现象对AI行业声称其系统不存储受版权保护作品的说法提出了新的质疑。研究显示,来自OpenAI、谷歌、Meta、Anthropic和xAI的大语言模型对训练数据的记忆量远超此前认知。AI及法律专家向《金融时报》表示,这种“记忆”能力可能对全球AI企业应对数十起版权诉讼产生重大影响,直接动摇了这些企业的核心抗辩理由:大语言模型只是从受版权保护作品中“学习”,而非存储副本。

上个月,斯坦福大学与耶鲁大学研究人员通过针对性提示词,成功让OpenAI、谷歌、Anthropic和xAI的大语言模型输出了《权力的游戏》《饥饿游戏》《霍比特人》等13部作品的数千字内容。谷歌Gemini2.5高精度复现了《哈利·波特与魔法石》76.8%的内容,xAI的Grok3则生成了70.3%。研究人员还通过“越狱”(绕过安全限制)Anthropic的Claude3.7Sonnet,几乎提取了整部小说的完整原文。这一结论建立在去年一项研究基础之上:该研究发现,Meta的Llama等开源模型,会记住训练数据中特定书籍的大量内容。

法律专家表示,这可能使AI企业面临重大版权侵权责任,并影响其模型训练方式与研发成本。AI模型是否记忆训练数据,已成为近期版权法律纠纷的关键因素。美国一家法院去年裁定,Anthropic使用部分受版权内容训练大语言模型可被视为合理使用,因其具有“转化性”。但法院同时认定,存储盗版作品“本质上、无可挽回地构成侵权”,最终该AI企业以15亿美元达成和解。德国去年11月的一项判决认定,OpenAI因模型记忆歌词侵犯版权。此案由词曲作者及出版商协会GEMA提起,被视为欧盟标志性判例。

相关内容

热门资讯

奥迪E7X纯电SUV亮相北京车... 2026年4月24日,奥迪与上汽合作的豪华新能源汽车品牌AUDI在2026北京车展上发布了其首款纯电...
吉利银河A7EM/A7EV双车... 今日,吉利汽车发布了2026款银河A7EM/A7EV双车系列,标志着品牌在新能源汽车领域的进一步拓展...
比亚迪2026款夏露营改装版亮... 今日,2026北京车展上,比亚迪王朝网旗下中大型旗舰MPV——2026款夏带来重磅惊喜,官方定制露营...
DeepSeek-V4模型震撼... 4月24日,DeepSeek公司宣布推出其新一代基础模型DeepSeek-V4,该模型已在官网、官方...
比亚迪大唐EV预售开启,950... 4月24日,比亚迪王朝网旗下全新全尺寸旗舰SUV大唐EV正式开启预售,预售价25万元至32万元。新车...
华为问界M6上市15分钟订单破... 4月22日,华为常务董事余承东宣布,搭载鸿蒙智行系统的问界M6汽车上市15分钟内,大定订单已突破10...
千里科技发布AI战略,2027... 4月22日,千里科技在北京举办了AI战略暨产品发布会,宣布了其“AI+车”战略的最新成果,并探讨了A...
越南青年来华“红色研学之旅”广... 文、图/羊城晚报全媒体记者 张小悦 通讯员 岳青4月11日至13日,由共青团中央主办,中央团校、共青...
广州南沙:智能育秧显优势,稻苗... 清风催新绿,春耕正当时。当许多地方仍在沿用传统手工育秧方式时,广州南沙多家育秧中心已率先引入智能化生...
把植物新品种繁殖换个名销售,法... 故事梗概2023 年4月,A公司发现B某、C公司及D公司(法人代表B某)大量对外销售、宣传销售被诉侵...