新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。
美国斯坦福大学研究团队测试了ChatGPT等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
来源:每日电讯
美国斯坦福大学研究团队测试了ChatGPT等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
来源:每日电讯
1
男子CT报告显示子宫正常?别让“涉事人员已停职”成了新的筐
2
雅迪4月1日起全品类涨价300元以上
3
举报自己吃空饷,令人费解之外,恐怕是当事人要由此找出多年苦寻的真相
4
中国电信一分公司因阻碍用户携号转网,被湖北省通信管理局罚款20万元
5
“养虾热”,退潮了
6
被告打点法官竟要原告买单?胜诉方有无金钱开道,何不有个说法!
7
重庆一服装公司销售不合格校服被罚:掺杂、掺假,以假充真,以次充好
8
调查处理,为何两年后才有结果公开?
9
应警惕人工智能“过度谄媚”
10
当下的AI就像2000年时期的互联网,应用陆续涌现,瓶颈也随之而来
11
凉了我照样做生意:不靠“网红”赚钱,才是最理性的选择!
12
太原通报“学校职工举报自己违规调动、吃空饷”:成立调查组
13
“一女学生被多人殴打”:类似问题查处,为何总在公开反映后
14
工作了18年半,不发工资,只打欠条:人已过七旬,何不据实尽快解决?
15
中铁广州串通投标,被公示
16
广西阳朔“20元人民币背景观景台乱收费”?景区回应
17
诚信何在?给活鱼上“麻药”,醉鱼上桌,商业经营岂能没有底线!
18
两高印发指导意见,这些情形可申请民事支持起诉
19
一天失守五个关口!黄金为何跌这么狠?
20
“1元购车”商家拒发货:不管是商家还是消费者,都应从中汲取些什么