AI谄媚倾向成安全隐忧:研究揭示AI系统过度迎合用户风险
创始人
2026-03-27 19:57:35
0

今日,美国《科学》杂志发表的研究揭示了人工智能在提供人际困境建议时的问题。研究发现,当人类用户向AI模型寻求建议时,AI常表现出过度迎合或谄媚的态度,甚至对于有害或违法的提问也倾向于肯定用户的立场。斯坦福大学的研究团队测试了包括ChatGPT和“克劳德”在内的11个主流AI系统,发现它们普遍存在不同程度的谄媚倾向。这种倾向可能导致使用者面临风险,尤其是对青少年的影响更为严重。

研究人员通过人际建议数据集向模型提问,并基于网络论坛中用户一致认为发帖者有错的帖子编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。

研究团队还招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。同时,研究人员呼吁人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。

相关内容

热门资讯

奔驰三剑客焕新登场:GLE家族... 近日,梅赛德斯-奔驰官方发布新款GLS、GLE、GLECoupe三款车型预告,并宣布将于3月31日全...
面向全球!广州将举办第二届智慧... 3月27日,广州市银发经济新场景发布暨2026年“乐活羊城”银龄集市启动仪式在越秀区农林下路举行。记...
特朗普用大写英文字母表达对北约... 资料图美国总统特朗普26日对西方盟友“冷观”美国和以色列对伊朗的军事行动表达不满,并直接点名德国和澳...
暴雨大风+冰雹!强对流天气来袭... 文/羊城晚报全媒体记者 梁怿韬根据广东省气象部门监测,3月27日广东出现冰雹天气。预计未来5天,广东...
陕西一女教师回家途中被碾压拖行... 近日,据上游新闻报道,2024年4月29日晚,陕西安康白河县一女教师荣荣(化名)在回家途中遭遇车祸身...
力争全年新落地价值招商项目20... 3月26日,广州市海珠区琶洲街道在琶洲国际人才驿站召开2026年招商引资动员大会,吹响全年招商引资的...
6.58万起!零跑A10携激光... 3月26日,零跑汽车宣布其“智能精品长续航SUV”新车A10正式上市,其中505激光雷达版售价区间为...
从灵犀互娱看游戏如何成为“广货... 近日,《2025年广州游戏产业发展报告》正式发布。报告显示,2025年广州游戏产业总营收达1532....
广州天河长兴街:全年计划引进优... 3月24日,广州市天河区长兴街道举行2026年招商投资年会。会上,街道商会代表及辖内科研院所、重点企...
中国博士后遭美方约谈盘问后自杀... 据了解,近期一名中国博士后在遭美方执法人员约谈盘问之后,于次日不幸自杀身亡。外交部发言人林剑3月27...