搜狗9
关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家1629人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 1773

特朗普:格陵兰岛非常重要 北约若离开了美国啥也不是

澎湃新闻 浏览 3508

雷军怒了!澄清其言论被断章取义

电动知家 浏览 1591

这一次,抖音美妆让36万用户来定义美

时尚COSMO 浏览 1109

何美延玩游戏都会生气,连Anson都对她应激了

老吴教育课堂 浏览 1340

还没从上周财报中缓过来!博通、甲骨文再下挫,AI基础设施板块继续遭抛售

华尔街见闻官方 浏览 1316

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 3743

马卡:多家英超俱乐部有意阿布德,巴萨仍有其部分所有权

懂球帝 浏览 1048

关于格陵兰岛 美国"改口"了:目标是要从丹麦手中"买岛"

参考消息 浏览 3929

男子给女友买的金镯子被放在门口丢了 顺丰只赔200元

潇湘晨报 浏览 4520

哥大新方法:频率指纹揭示AI数学思维盲点

科技行者 浏览 1879

马杜罗社交平台发布照片 配文称"被绑架已11天"

红星新闻 浏览 3696

成功冲乙,厦门壹零贰陆主帅:厦门是一座有足球底蕴的城市

懂球帝 浏览 1865

忘切号了?桑乔社媒发文鼓励自己后,又用自己账号留言

懂球帝 浏览 1942

大衣别这么穿,显黑又显胖!

Yuki女人故事 浏览 1671

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 1943

12月22日发布 零跑D19内饰设计图曝光

网易汽车 浏览 1317

男子驾车撞死一家三口获死缓 被害人家属递交抗诉申请

看看新闻Knews 浏览 3756

奖金1.5万元,破赛事新纪录,张水华拿下2026年第一个冠军

数字财经智库 浏览 1250

清华等联合开发"甜蜜点学习"算法:AI智能体训练效率提升2.5倍

科技行者 浏览 828

“空降”印奇和50亿,阶跃星辰上桌了吗?

字母榜 浏览 917
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1