跨轮对话性能大降!新一代大语言模型遇挑战
创始人
2026-03-01 08:50:40
0

3月1日,据最新研究显示,新一代大语言模型在处理需要跨多轮对话完成的任务时存在性能问题。研究员菲利普·拉班及其团队对现有模型在代码、数据库、操作指令等六大任务上进行了测试,发现当信息分散在多条消息中时,模型性能显著下降。相较于集中在单次提示词里的情况,性能降幅从39%缩小到33%,但问题依然存在。

在具体任务中,Python任务的提升最为明显,部分模型仅损失10%-20%的性能。拉班指出,实际场景中的性能损失可能更严重,因为测试只使用了简单的用户模拟。如果用户在对话中途改变想法,性能下降幅度可能会更大。研究发现,调低温度值等技术微调无法解决这一问题。

研究人员建议,一旦出现异常,最好重新开启一段新对话。可以先让模型把所有请求总结一遍,再用这份总结作为新对话的起点,以提高模型在多轮对话任务中的性能。

相关内容

热门资讯

奇瑞QQ3电动小车3月10日预... 今日,奇瑞汽车宣布旗下全新小型纯电动车QQ3将于3月10日开启预售。新车主打小型纯电市场,外观采用“...
新闻周刊丨从“去风险”到主动寻... 春节刚过,中国外交舞台就迎来了一位重量级客人——德国总理默茨。其实,早在春节前,法国、英国等国的领导...
灯耀元夕、棋聚羊城!广州荔湾三... 春意盎然的3月,广州市荔湾区文商旅体活动精彩纷呈。从广州文化公园璀璨的“元宵灯会”,到“五羊杯”象棋...
“制造硬实力+服务软实力” 激... 马年新春伊始,广东召开全省高质量发展大会,围绕“制造业与服务业协同发展”,聚力在“制造强省”与“服务...
华为鸿蒙智驾春节护航:辅助驾驶... 3月1日,鸿蒙智行官方发布了春节华为乾崑ADS出行报告。报告显示,在春节期间,超过90%的用户倾向于...
小米VisionGranTur... 今日,在西班牙巴塞罗那举行的Xiaomi 17 Series全球发布会上,小米Vision Gran...
岚图梦想家限量冠军版预售开启,... 3月1日,岚图汽车宣布推出旗下高端新能源MPV梦想家的限量冠军版车型,并已开启预售,预售价为31.9...
“领克Z20语音关灯事故引热议... 近日,领克Z20车主在夜间高速行驶时,误用语音控制关闭车外大灯导致事故,引发公众对语音控制大灯功能的...
理想汽车2月销量破2.6万,累... 今日,理想汽车公布了2026年2月的交付数据。数据显示,理想汽车在2月份交付新车26,421辆,截至...