关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2242人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

影后秦海璐,与二婚丈夫生下一子,如今过的怎样

小小李娱 浏览 2319

拜托,她可是陈妍希诶!

时尚COSMO 浏览 1543

特斯拉三季度净利同比暴跌4成!马斯克透露五大关键进展,为天价薪酬拉票

车东西 浏览 2525

星空相册|今年“个头”最大的“超级月亮”来啦

新华社 浏览 2246

宗馥莉,没有娃哈哈

斑马消费 浏览 2661

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 1665

「寻芯记」上市后首个大动作!摩尔线程公布全功能GPU架构路线图,国产芯片发起生态冲刺

华夏时报 浏览 1939

奥斯瓦尔多:我想看到迪巴拉加盟博卡,但他不大可能去

懂球帝 浏览 1908

特朗普威胁"美军轰炸会更猛烈" 伊朗:美国会后悔的

每日经济新闻 浏览 891

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 10658

帕多瓦诺:我为图多尔感到遗憾;让我选新帅绝对是曼奇尼

懂球帝 浏览 2391

一款车就给吓成那样?某全球车企掌门人:比亚迪,是个巨大的威胁

小李车评李建红 浏览 2237

好久没跟大家线下见面啦,快来找我玩

黎贝卡的异想世界 浏览 1658

12岁男孩烫伤后死亡:死前还在干活 父母均智力残疾

新京报 浏览 6027

瓜帅:我一直尊重裁判从未批评他们,但我必须捍卫我的俱乐部

懂球帝 浏览 1611

巴勒斯坦多派别谴责以方持续违反停火协议

国际在线 浏览 1528

美媒:报告称,东南亚成美国电子垃圾倾倒场

环球网资讯 浏览 2498

伊朗官员提开放霍尔木兹海峡条件

央视新闻客户端 浏览 761

零百加速1.8s 星空计划首款车型将亮相CES

车质网 浏览 1946

姚明将在今年开始正式领取NBA退休金,每月可领约1.3万人民币

懂球帝 浏览 2445

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 2362
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1