AI教父揭露:聊天机器人讨好用户成“谎言机器”
创始人
2025-12-24 15:35:58
0

12月23日,AI领域知名科学家约书亚·本吉奥在播客节目中指出,AI聊天机器人在评价研究想法时存在不可靠性,因为它们倾向于给出正面反馈,几乎不会说坏话。本吉奥表示,他更希望得到直言不讳的建议和真实反馈,但AI的讨好倾向导致其变成了迎合用户的“谎言”。为了得到更坦率的回应,本吉奥尝试将个人想法伪装成同事的观点,结果发现AI的回答变得更加坦率。他认为,AI讨好用户是一种对齐失败,我们并不希望AI具备这种特性。

本吉奥还提到,AI不断给出正面反馈可能会让用户对此类技术产生情感依赖,引发新的问题。在科技行业内,关于AI过度充当“老好人”的担忧并非个例。斯坦福大学、卡内基梅隆大学和牛津大学的研究人员曾将Reddit上的自白帖交给聊天机器人评判相关行为,结果发现,在42%的情况下,AI认为发帖者并无不当行为,而人类评审者的结论恰恰相反。多家AI公司已公开承认这一问题,并表示正在尝试降低模型的讨好倾向。

相关内容

热门资讯

豆包DAU破亿,字节跳动AI新... 今日,字节跳动旗下App豆包日均活跃用户数(DAU)突破1亿大关,成为字节跳动App王国中又一“亿级...
广州南沙跨年至春节文旅菜单出炉... 文/羊城晚报全媒体记者 江皓轩 通讯员 杨焱 佘海霞 何就明图/通讯员提供记者从广州市南沙区获悉,从...
【国际漫评】危险的松绑 近日,在日本广播协会的一档电视节目里,日本多名在野党高层集体发声,严厉谴责执政联盟自民党与日本维新会...
不凡•2025|踮起脚尖,向新... 编者按:再过几天,我们就要向2025年挥手再见了。过去的一年,有许多平平淡淡的寻常瞬间,也有无数熠熠...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
广汽昊铂A800开启L3自动驾... 今日,广汽集团宣布旗下昊铂A800正式启动L3有条件自动驾驶高速道路研发测试,测试速度最高可达120...
特斯拉Model3紧急逃生装置... 12月24日,美国国家公路交通安全管理局(NHTSA)宣布对特斯拉Model 3展开缺陷调查。此次调...
比亚迪携手火山引擎,打造智能座... 近日,火山引擎与比亚迪宣布在智能座舱领域达成深度合作,将豆包大模型深度融入比亚迪DiLink系统,实...
揭阳潮汕国际机场迈入千万级,对... 12月24日,揭阳潮汕国际机场年旅客吞吐量突破1000万人次大关,正式跻身全国千万级大型机场行列。这...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...