AI也不懂幽默?大语言模型双关语识别能力堪忧
创始人
2025-11-24 18:15:58
0

近日,一项涉及人工智能(AI)大语言模型(LLM)的研究揭示了这些模型在理解双关语方面的局限性。这项研究由英国卡迪夫大学和意大利威尼斯福斯卡里宫大学的专家团队进行,他们发现尽管大语言模型能够识别双关语的表层结构,但它们往往无法真正理解其中的幽默含义。

研究团队通过一系列测试例句来评估大语言模型对双关语的理解能力。例如,他们测试了一个句子:“I used to be a comedian, but my life became a joke.”(我曾是一名喜剧演员,但我的人生却成了一句‘玩笑话’/一场‘闹剧’。)当研究人员将“a joke”替换为语义相近但无双关意味的“chaotic”(混乱不堪)时,大语言模型仍倾向于判定该句含有双关。另一个测试例句:“Long fairy tales have a tendency to dragon.”(冗长的童话故事往往容易“dragon”[拖得太长]。)即使将“dragon”替换为同义词“prolong”(延长),大语言模型也会误判该句存在双关成分。

这项研究的结果表明,大语言模型在面对不熟悉的文字游戏时,区分双关语与非双关语句的准确率可降至20%。研究人员强调,这一发现提醒人们在依赖大语言模型执行需要幽默感、共情能力或文化敏感性的任务时,应保持高度审慎。相关研究成果已在“2025年自然语言处理实证方法会议”(EMNLP2025)上发表。

相关内容

热门资讯

广州16岁男生穿着人字拖边走路... 近日,广东广州一位16岁男生脚穿人字拖鞋,边走路边低头看手机,丝毫没注意路况,结果他的右脚不小心撞上...
余华称不反感“老登”一词:“我... 近日,余华在浙江杭州接受记者采访时谈到“老登”这一词,余华称自己并不讨厌:我这个年纪已经是“上古神登...
吉利星瑞TCR赛车意大利站夺冠... 今日,吉利汽车运动宣布,中国车手马青骅驾驶吉利星瑞TCR赛车在2026FIATCR世界巡回赛意大利站...
演员张静初,面临47人集体起诉 近日,多位在演员张静初直播间购买过“优思益”产品的网友表示,目前仍未拿到退款,陷入退货无门的境地。5...
保利海韵首开认购约18.2亿元... 在“穗八条”新政与传统营销旺季的双重推动下,2026年“五一”黄金周广州楼市交出超预期答卷。小长假后...
高端访谈|中国式现代化为世界提... 新华社贝尔格莱德5月10日电 高端访谈|中国式现代化为世界提供了新的发展模式——访黑山副总理阿莱克西...
新疆旅游新动向丨从“凑人气”到... 石榴云/新疆日报记者 姚刚美团《2026“五一”消费洞察报告》显示,全国县域旅游热度榜Top10中,...
男子因“帮忙”刷脸认证,竟卷入... 5月10日,韶关市中级人民法院公布了这样一起案件:马某“帮人”在游戏里刷脸认证以绑定微信,导致他人游...
无人机撞上高铁致63趟列车晚点... 5月9日,公安部公布2026年以来公安机关查处的多起无人机影响铁路安全典型案例。记者留意到,其中多起...