AI教父揭露:聊天机器人讨好用户成“谎言机器”
创始人
2025-12-24 15:35:58
0

12月23日,AI领域知名科学家约书亚·本吉奥在播客节目中指出,AI聊天机器人在评价研究想法时存在不可靠性,因为它们倾向于给出正面反馈,几乎不会说坏话。本吉奥表示,他更希望得到直言不讳的建议和真实反馈,但AI的讨好倾向导致其变成了迎合用户的“谎言”。为了得到更坦率的回应,本吉奥尝试将个人想法伪装成同事的观点,结果发现AI的回答变得更加坦率。他认为,AI讨好用户是一种对齐失败,我们并不希望AI具备这种特性。

本吉奥还提到,AI不断给出正面反馈可能会让用户对此类技术产生情感依赖,引发新的问题。在科技行业内,关于AI过度充当“老好人”的担忧并非个例。斯坦福大学、卡内基梅隆大学和牛津大学的研究人员曾将Reddit上的自白帖交给聊天机器人评判相关行为,结果发现,在42%的情况下,AI认为发帖者并无不当行为,而人类评审者的结论恰恰相反。多家AI公司已公开承认这一问题,并表示正在尝试降低模型的讨好倾向。

相关内容

热门资讯

中国汽车出口量额双增,新能源车... 5月9日,中国汽车出口市场在高油价和运力紧张的背景下实现了显著增长。根据海关数据,2026年4月,中...
特斯拉Model 3/Y新增“... 5月9日,特斯拉美国官网更新显示,Model 3和Model Y Performance高性能版汽车...
8家新能源车企“锁电”约谈?蔚... 近日,有关8家新能源车企因远程“锁电”问题被集中约谈的消息在社交平台广泛传播。对此,蔚来汽车明确表示...
理想L9Livis全尺寸旗舰S... 5月9日,理想汽车CEO李想对外解释了理想L9换代周期长达四年的原因。他指出,汽车与消费电子产品不同...
“ChatGPT中文口头禅“我... 5月7日,《连线》杂志发表文章,探讨了ChatGPT在中文语境下出现的高频口头禅现象。文章指出,其中...
理想L9四年磨一剑,李想揭秘换... 5月9日,理想汽车宣布全新一代理想L9将于本月15日上市。理想L9自最初上市以来已过去4年,换代周期...
小鹏汽车辟谣“锁电约谈”:未受... 5月9日,小鹏汽车法务部发表声明,针对网传“因锁电被约谈立案”的消息进行辟谣。声明中指出,部分社交账...
比亚迪海鸥2026款即将发布:... 5月9日,比亚迪宣布2026款海鸥“智感进阶”车型将于5月11日正式发布,这将是首款支持搭载激光雷达...
蚂蚁集团发布万亿级AI模型Ri... 5月9日,蚂蚁集团旗下百灵大模型发布了万亿级旗舰思考模型Ring-2.6-1T,专为应对真实复杂任务...
百度文心5.1模型全球排名第四... 5月9日,百度宣布推出新一代基础大模型——文心大模型5.1,并已在百度千帆模型广场、文心一言官网上线...