AI教父揭露：聊天机器人讨好用户成“谎言机器”_知识学习

AI教父揭露：聊天机器人讨好用户成“谎言机器”

创始人

2025-12-24 15:35:58

0次

12月23日，AI领域知名科学家约书亚·本吉奥在播客节目中指出，AI聊天机器人在评价研究想法时存在不可靠性，因为它们倾向于给出正面反馈，几乎不会说坏话。本吉奥表示，他更希望得到直言不讳的建议和真实反馈，但AI的讨好倾向导致其变成了迎合用户的“谎言”。为了得到更坦率的回应，本吉奥尝试将个人想法伪装成同事的观点，结果发现AI的回答变得更加坦率。他认为，AI讨好用户是一种对齐失败，我们并不希望AI具备这种特性。

本吉奥还提到，AI不断给出正面反馈可能会让用户对此类技术产生情感依赖，引发新的问题。在科技行业内，关于AI过度充当“老好人”的担忧并非个例。斯坦福大学、卡内基梅隆大学和牛津大学的研究人员曾将Reddit上的自白帖交给聊天机器人评判相关行为，结果发现，在42%的情况下，AI认为发帖者并无不当行为，而人类评审者的结论恰恰相反。多家AI公司已公开承认这一问题，并表示正在尝试降低模型的讨好倾向。

上一篇：沃尔沃EX60纯电SUV将发布：续航超700公里，采用创新电池技术

下一篇：本田2026年四款新车规划曝光：CR-V升级，纯电0系列登场

热门资讯

豆包DAU破亿，字节跳动AI新... 今日，字节跳动旗下App豆包日均活跃用户数（DAU）突破1亿大关，成为字节跳动App王国中又一“亿级...

广州南沙跨年至春节文旅菜单出炉... 文/羊城晚报全媒体记者江皓轩通讯员杨焱佘海霞何就明图/通讯员提供记者从广州市南沙区获悉，从...

【国际漫评】危险的松绑近日，在日本广播协会的一档电视节目里，日本多名在野党高层集体发声，严厉谴责执政联盟自民党与日本维新会...

不凡•2025｜踮起脚尖，向新... 编者按：再过几天，我们就要向2025年挥手再见了。过去的一年，有许多平平淡淡的寻常瞬间，也有无数熠熠...

以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研，精准把握民众需求，制定切实可行的举措。在教育方面...

广汽昊铂A800开启L3自动驾... 今日，广汽集团宣布旗下昊铂A800正式启动L3有条件自动驾驶高速道路研发测试，测试速度最高可达120...

特斯拉Model3紧急逃生装置... 12月24日，美国国家公路交通安全管理局（NHTSA）宣布对特斯拉Model 3展开缺陷调查。此次调...

比亚迪携手火山引擎，打造智能座... 近日，火山引擎与比亚迪宣布在智能座舱领域达成深度合作，将豆包大模型深度融入比亚迪DiLink系统，实...

揭阳潮汕国际机场迈入千万级，对... 12月24日，揭阳潮汕国际机场年旅客吞吐量突破1000万人次大关，正式跻身全国千万级大型机场行列。这...

AI教父揭露：聊天机器人讨好用户成“谎言机器”

相关内容

热门资讯