AI也不懂幽默?大语言模型双关语识别能力堪忧
创始人
2025-11-24 18:15:58
0

近日,一项涉及人工智能(AI)大语言模型(LLM)的研究揭示了这些模型在理解双关语方面的局限性。这项研究由英国卡迪夫大学和意大利威尼斯福斯卡里宫大学的专家团队进行,他们发现尽管大语言模型能够识别双关语的表层结构,但它们往往无法真正理解其中的幽默含义。

研究团队通过一系列测试例句来评估大语言模型对双关语的理解能力。例如,他们测试了一个句子:“I used to be a comedian, but my life became a joke.”(我曾是一名喜剧演员,但我的人生却成了一句‘玩笑话’/一场‘闹剧’。)当研究人员将“a joke”替换为语义相近但无双关意味的“chaotic”(混乱不堪)时,大语言模型仍倾向于判定该句含有双关。另一个测试例句:“Long fairy tales have a tendency to dragon.”(冗长的童话故事往往容易“dragon”[拖得太长]。)即使将“dragon”替换为同义词“prolong”(延长),大语言模型也会误判该句存在双关成分。

这项研究的结果表明,大语言模型在面对不熟悉的文字游戏时,区分双关语与非双关语句的准确率可降至20%。研究人员强调,这一发现提醒人们在依赖大语言模型执行需要幽默感、共情能力或文化敏感性的任务时,应保持高度审慎。相关研究成果已在“2025年自然语言处理实证方法会议”(EMNLP2025)上发表。

相关内容

热门资讯

华为智驾新突破:激光视觉Lim... 今日,华为乾崑智能汽车解决方案官方微博介绍了乾崑智驾ADSPro增强版的多项技术亮点。该系统首发量产...
极越汽车预重整引资,百度吉利关... 11月24日,上海集度汽车有限公司新增审查案件,申请人为该公司自身。此次审查案件是极越汽车发起的预重...
阿里巴巴“千问”AI助手新域名... 今日,阿里巴巴旗下AI助手“千问”启用了全新域名网页链接,旨在提高用户访问的便捷性。用户现在可以通过...
破万件里程碑!广州知识产权保护... 近日,广州知识产权保护中心(以下简称“广州保护中心”)专利预审服务案件量正式突破10000件大关,达...
13天19城 全运记忆Numb... 13天、19城、近万场赛事,粤港澳三地首次联合举办全运会……十五运会的意义远超赛场竞技,生动践行了“...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
AI也不懂幽默?大语言模型双关... 近日,一项涉及人工智能(AI)大语言模型(LLM)的研究揭示了这些模型在理解双关语方面的局限性。这项...
华为ADSPro城区NCA功能... 11月20日,华为在2025乾崑生态大会上宣布,其智能汽车解决方案ADSPro将支持城区领航辅助NC...
赛事保障背后的坚守:十五运会南... 11月7日至20日,第十五届全运会武术(套路)比赛与群众比赛网球项目决赛先后在南沙体育馆和南沙国际网...