AI“记忆”版权作品引发法律争议,大模型训练数据泄露风险凸显
创始人
2026-02-24 10:57:55
0

近日,全球顶尖人工智能模型被发现能够通过提示词生成与畅销小说几乎逐字相同的内容,这一现象对AI行业声称其系统不存储受版权保护作品的说法提出了新的质疑。研究显示,来自OpenAI、谷歌、Meta、Anthropic和xAI的大语言模型对训练数据的记忆量远超此前认知。AI及法律专家向《金融时报》表示,这种“记忆”能力可能对全球AI企业应对数十起版权诉讼产生重大影响,直接动摇了这些企业的核心抗辩理由:大语言模型只是从受版权保护作品中“学习”,而非存储副本。

上个月,斯坦福大学与耶鲁大学研究人员通过针对性提示词,成功让OpenAI、谷歌、Anthropic和xAI的大语言模型输出了《权力的游戏》《饥饿游戏》《霍比特人》等13部作品的数千字内容。谷歌Gemini2.5高精度复现了《哈利·波特与魔法石》76.8%的内容,xAI的Grok3则生成了70.3%。研究人员还通过“越狱”(绕过安全限制)Anthropic的Claude3.7Sonnet,几乎提取了整部小说的完整原文。这一结论建立在去年一项研究基础之上:该研究发现,Meta的Llama等开源模型,会记住训练数据中特定书籍的大量内容。

法律专家表示,这可能使AI企业面临重大版权侵权责任,并影响其模型训练方式与研发成本。AI模型是否记忆训练数据,已成为近期版权法律纠纷的关键因素。美国一家法院去年裁定,Anthropic使用部分受版权内容训练大语言模型可被视为合理使用,因其具有“转化性”。但法院同时认定,存储盗版作品“本质上、无可挽回地构成侵权”,最终该AI企业以15亿美元达成和解。德国去年11月的一项判决认定,OpenAI因模型记忆歌词侵犯版权。此案由词曲作者及出版商协会GEMA提起,被视为欧盟标志性判例。

相关内容

热门资讯

欧盟新规:触屏操作受限,实体按... 近日,欧盟对取消实体按键的行为进行了正式约束。今年起,欧洲新车安全评鉴协会(EuroNCAP)实施新...
特斯拉AI4硬件革命:双芯片独... 近日,特斯拉官方宣布其智能辅助驾驶AI4硬件已采用完整的故障切换冗余架构。这一架构的核心在于双计算单...
极狐阿尔法S5新升级:增程版来... 今日,北汽新能源极狐品牌宣布,全新阿尔法S5将于3月中下旬上市,3月初开启预售。乔心昱副总经理透露了...
Uber发布自动驾驶新方案,助... 2月23日,网约车巨头Uber宣布推出Uber Autonomous Solutions(优步自动驾...
特斯拉FSD系统再获调查延期,... 2月24日,特斯拉再次获得美国国家公路交通安全管理局(NHTSA)对其配备FSD系统车辆涉嫌交通违法...
特斯拉第三代充电桩上线:7kW... 2月24日,特斯拉宣布第三代家庭充电桩单相版正式上线,该产品以“智能、可靠、安全、经济”为核心特点。...
广汽丰田威兰达AIR版上市:直... 今日,广汽丰田威兰达AIR版正式上市,带来前所未有的价格优惠。新车现金优惠高达2.2万元,加上国补和...
小鹏汽车2026年目标:全球首... 2月24日,小鹏汽车CEO何小鹏在开工信中宣布,2025年小鹏汽车销量创历史新高,全年卖出42.94...
现代起亚降价迎战比亚迪,韩电动... 近日,现代和起亚在韩国电动车市场采取了价格和金融政策的双重调整,以应对比亚迪等品牌的竞争。起亚首先对...
小米SU7新年红亮相,4月上市... 2月24日,小米汽车新一代SU7车型发布全新车色赤霞红,象征着新年的吉祥。该车型已开启小订,意向金为...