搜狗9
关闭广告

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元257人阅读


新智元报道

编辑:桃子 好困

【新智元导读】上海连线迪拜,对话竟丝滑完成!就在刚刚,一款全新AI翻译耳机创造了这个奇迹,精准互译的同时,响应延迟低至两秒。背后的这家公司,又一次用硬核科技让世界惊叹。

刚刚,在上海世界会客厅现场,一部AI翻译耳机成为了全场焦点。

从上海到迪拜,跨越6000多公里,时空第一次在耳畔折叠。

发布会现场,主讲人戴上那副翻译耳机,向迪拜友人发出的问候,瞬间被清晰转译。


身处迪拜的朋友,分别用英语和阿拉伯语进行了交流,AI翻译耳机同样完成了实时互译。

在介绍迪拜塔等身边景点的过程中,迪拜友人说的英语还掺杂着口音,并用到了很多人名、地名等专业名词。

即便如此,AI翻译耳机依旧可以做到丝滑转译。

更惊喜的是,两城的通话内容,还可以联动手机APP,同时高亮呈现,方便回顾理解。


「随身译、随时聊」这六个字背后,是AI同传技术再次以如此轻盈的姿态,降临到每个人身边。

上一次,还是在几个月前的WAIC大会,背后同款AI同传系统,让全场都秒懂了Hinton的伦敦腔。


不论是专业术语,还是深奥的表达,它都做到了即时响应,以符合中文语言习惯精准转译

这款全新AI翻译耳机,是科大讯飞在今天下午重磅发布的新品。

它不仅采用了全新「骨导+气导」设计,还集成了「端到端语音同传」技术,让双城对话无阻。

今天,这道曾经只存在于国际峰会上的「同传光环」,终于化作每个人口袋里的日常魔法。

八项全能冠军,IDC最强背书

这一次,IDC发布的最新报告《中国AI翻译技术评估》,成为印证科大讯飞AI翻译实力的最强背书。

这份报告,全方位梳理了中国AI翻译市场的现状,并对国内5家主流AI翻译厂商,进行了全面评估。

报告中,一共从8大维度展开评估,可以归类为两大层面,分别包括:

技术能力层:AI翻译速度、AI翻译效果、AI翻译专业度、AI翻译拟人度

产品和商业化能力层:研发投入、产品应用成熟度、商业化规模、用户推荐度

令人欣喜的是,科大讯飞以卓越的表现脱颖而出,在这8个维度里均居榜首,更有6项拿下满分,全方位领跑行业,稳坐中国AI翻译技术TOP 1王座。


来源:IDC《中国AI翻译技术评估》

在技术实力上,科大讯飞在AI翻译速度、效果、专业度上拿下满分。

就翻译速度来说,其AI中英同传响应最快可达2秒,刷新人类听感无痕的新纪录。

在医疗、法律、科技等垂类测试中,科大讯飞AI翻译具备了真功夫,可以做到精准翻译。此外,其AI翻译语音播报拟人度、自然度、舒适度业界领先。

在商业规模化上,科大讯飞同样做到了业界第一,实现了「软件+硬件+服务」全场景覆盖。

它拥有业内最完整的AI翻译「产品矩阵」,产品定位明确,适配性强。

比如,硬件产品方面,科大讯飞翻译机等市场占有率持续领先;软件服务方面,翻译SaaS、科大讯飞同传等,已服务千行百业。

当然了,一切成绩离不开用户的支持。IDC报告评测中,科大讯飞AI翻译用户推荐度TOP 1,表明了市场对其前瞻布局的肯定。

具体来说,科大讯飞硬件产品便携性优、操作简单,用户推荐达到满分,行业第一。

这进一步确认了科大讯飞的行业地位,成为市场与用户心智的「中国AI翻译第一品牌」。

八项满分第一,是科大讯飞实打实的成果。而这一次,科大讯飞再次发力了。

在技术向,升级了端到端同传大模型;同时在商业化方面,首发AI翻译耳机新品、翻译机再迭代。

端到端同传重大升级

坚实的技术底座,是一切商业化成果的根基。大会上,科大讯飞「端到端同传大模型」技术再次迎来了全新升级。

2025年,对于科大讯飞而言,是AI同传技术的「高光之年」——

1月15日发布星火语音同传大模型,国内首个端到端同传大模型

7月25日第二次重大升级

10月14日第三次技术飞跃

短短九个月,模型就完成了三次重大迭代,速度之快在AI翻译行业前所未有。


这种快速迭代的背后,是科大讯飞26年来在语音和AI领域的技术沉淀,以及对技术路线的前瞻洞察和坚定投入。

此次升级,主要聚焦在中英同传效果优化与语种战略拓展。

中英同传,领先业界

首先,中英同传效果上再升级,主观体验评分高达4.6分(满分5分),翻译效果领先业界。


不论是多人会议的复杂场景,还是单人演讲的专业场合,AI翻译准确、流畅,有效消除了传统翻译的「碎片化」、「机械感」。

在响应速度上,AI端到端同传持续领跑,首字响应时间低至2秒,达到了人类高阶同传标准,带来「实时同步」的极致体验。

专业词库从上一次的8万扩充至10万+,覆盖了医疗、金融、法律、科技等高壁垒领域,准确率大幅提升。

此外,科大讯飞AI同传合成语音的自然度、拟人度显著提升,用户主观选择倾向达83%。

系统实现了「译」与「说」无缝耦合,翻译结果不仅准确,还如真人般流畅自然。

新增的「声音复刻」功能,仅用一句语音样本,AI即可复刻其音色,相似度超90%。

这一点至关重要,翻译结果用自己的声音播报,仿佛亲口说外语,让沟通更加真实,更具情感连接。

新增阿语、西语同传互译

这一次,「端到端同传」技术升级,还新增了中英与阿拉伯语、西班牙语之间的同传互译。

作为联合国六种官方工作语言之一,阿拉伯语在国际政治、外交、能源、宗教领域的影响力不可替代。

西班牙语,全球第二大使用人数的语言,覆盖欧洲、非洲、拉丁美洲多个国家,是大陆文化与经贸交流的重要纽带。

新增对这两种语言的支持,标志着科大讯飞AI翻译具备了服务更高层级国际事务与更广泛大众市场的能力。

这项突破,将会进一步拓展技术在全球市场应用的深度与广度。


尤其是,在高端国际场合,以及「一带一路」沿线众多以阿语、西语为官方语言国家中,显著提升沟通效率。

值得一提的是,新一代科大讯飞AI翻译耳机,便率先搭载了最新的「端到端语音同传」技术。

全球首发,双城丝滑交流

大会现场,我们看到了,科大讯飞AI翻译耳机让跨越两城不同语言的人丝滑交流,打破了空间的隔阂。


这一切,得益于「端到端同传大模型」的持续进化,由此在准确度、响应速度,还是播报自然度,实现显著突破。

而精准翻译的前提,首先在于「听得准」。

在硬件设计上,科大讯飞AI翻译耳机同样实现了创新突破——采用了「骨导+气导」设计,一个多感融合AI降噪系统。

同时,团队还结合先进的硬件配置与自研AI算法,打造出一套独特的「降噪」解决方案。


在硬件创新上,配备了2个数字硅麦克风+1个骨传导麦克风,可以有效捕获环境音和语音细节,实现精准拾音。

而且,它还采用了麦克风延长杆设计,以30度指向佩戴者,形成最佳拾音角度。

AI翻译耳机还搭载了全新的「降噪算法」,可以选择「近场」和「远场」的声音,实现了:

  • 近场降噪:专注捕捉用户自身的声音,屏蔽周围干扰

  • 远场降噪:清晰提取远距离音源,适用于会议、工厂等嘈杂场景


在通话翻译中,耳机扬声器播放声音时,会产生振动。这些振动容易被骨传导麦克风误认为是用户语音信号,导致输入信号混杂,准确性下降。

最新技术可通过算法分析,准确分离「用户说话的有效信号」与「环境的噪音」。

然后,将噪声精准剔除,确保输入信号的纯净度。

更惊喜的是,在面对面翻译场景中,科大讯飞AI翻译耳机支持双人各佩戴一只耳机,实现实时一人一耳,实时互译。

做到这些还不够,科大讯飞AI翻译耳机还与科大讯飞APP无缝衔接,便于实时查看翻译结果,打通智能翻译的生态。

翻译机2.0升级,使用场景拓宽

除了AI翻译耳机,双屏翻译机2.0也迎来全面升级,这一次最大亮点在于,会议场景增强。

在线字幕功能,不仅局限于会议翻译,还新增了「旁听同传」和「演讲翻译」两大场景支持。

  • 旁听同传:可生成二维码/链接

  • 演讲翻译:支持多设备查看

为了提升听译体验,科大讯飞翻译机还新增了「翻译结果播报」功能,可自主开关并调节语速。

播报时,翻译内容会逐句高亮显示,同步呈现原文、译文,不怕信息遗漏。

针对多人会议、圆桌讨论等复杂场景,翻译机新增了「中英双语讲话人分离」功能。

此外,智能生成会议纪要,灵活分享会议记录,也是翻译机最大亮点,让信息管理更智能,大幅提升会议效率。

现场演示中,主讲人手持翻译机开启「强降噪」功能,有了1米虚拟隔音墙,即便周边四个人用超大声说话,它也能做到精准识别。

同样,翻译机与各种软件联动,可以在平板电脑、会场大屏上,实时查看文字版内容。


一款全新AI翻译耳机,再加上进化后的翻译机,科大讯飞「软硬一体」的产品矩阵再次得到了加强。

这种全栈优势,是国内其他AI翻译厂商无法比拟的。

软硬一体,自主可控,定制适配

在硬件端,科大讯飞已有AI翻译耳机、AI翻译机、AI录音笔等代表性产品。

在软件端,讯飞翻译APP、讯飞翻译SaaS平台、讯飞同传、讯飞听见多语言会议系统,皆在布局之中。

相较之下,通用硬件厂商的做法,往往是「拿来主义」,简单地将第三方模型或算法搭载到硬件上,缺乏针对性的深度优化。

举个栗子,设计一款录音设备,配备基础的麦克风和通用芯片,然后直接采购现成的语音处理模型/API。

这种「拼装」模式,在简单场景中或许能够应付。

但是,一旦面对复杂环境,比如多人会议、嘈杂的户外场景等,就容易露怯。

前端的声音采集环节往往是短板,麦克风阵列缺乏场景化设计,无法有效过滤背景噪音或聚焦目标音源,导致输入音频质量低下。

就算是后端搭载的大模型再强,前端声音没有录清楚,一切都白搭。

更关键的是,这种通用方案缺乏「软硬协同」优化的能力,难以根据用户需求灵活调整,最终产品体验停留在「能用」状态,难以满足高标准用户群体的期待。

想要把用户真心实意服务好,光卖产品不够,还需要深入客户,懂其所需。

反观科大讯飞的自主可控模式,通过软硬件深度适配,从声音采集到算法处理,实现了无缝衔接,确保了性能的全面领先。

在科大讯飞内部,硬件部门和讯飞研究院协同工作,通过深度软硬整合硬件适配定制化模型,做到从产品设计到算法优化的全链条联动。

这就像是为用户量身定制的一道菜,科大讯飞不仅自己挑选了顶级的「食材」(硬件),还精心调配了「烹饪方式」(软件算法),确保每一步贴合用户需求。

由此,科大讯飞AI翻译才能真正做到「用户需要什么,就适配什么」的高标准。

AI翻译,做世界No.1

无论是翻译耳机的面世、翻译机2.0进化,还是端到端同传技术再突破,都是科大讯飞推进「AI翻译」的一系列重要动作。

你或许会问:究竟什么是「AI翻译」?科大讯飞为何选择在此时正式提出?

众所周知,在古老的《圣经》中,巴别塔因语言的分裂让人类四散,沟通的梦想被高墙阻隔。


如今,全球七千多种语言犹如无形壁垒,正阻碍着文化交融与文明对话。

在AI浪潮以惊人速度推动世界互联的今天,人与人之间的交流愈发紧密,而语言障碍正是横亘其中、亟需打破的最后一道边界。

「AI翻译」的提出,是科大讯飞必须要肩负的历史使命。

为什么做「AI翻译」?

· 全球融合大势所趋,重塑语言连接

放眼全世界,人类文明的进步,正源于不同国家、民族与语言文化之间的持续交融与对话。

语言多样性既是人类文明的瑰宝,也构成了沟通「巴别塔」的难题。

正因此,全球翻译市场蓬勃发展,规模也在同步扩大。

权威报告称,预计在2025年,全球翻译服务市场规模达277.8亿美元。截至2029年,该市场规模预计将达342.4亿美元,复合年增长率(CAGR)5.4%。


AI翻译,恰恰顺应了这一趋势,通过AI技术去打破语言壁垒,推动人与人之间的深度连接。

科大讯飞副总裁赵翔在采访中强调,「解决这一问题不仅是技术挑战,更是科大讯飞的历史使命」。

·用户痛点的现实呼唤

「AI翻译」,又植根于用户需求的深刻洞察。

反观国内,中国企业出海热潮高涨,随着「一带一路」倡议,国内企业走向全球,不仅要面对英语国家,还有很多小语种国家。

当前能够精通各种语言的翻译人才,少之又少,人工翻译难以覆盖广泛的语种需求。

此时,AI翻译具备的多语言能力,成为了关键的解决方案。

与此同时,旅游场景的语言障碍日益凸显。如今,中国免签「朋友圈」不断扩大。


截止25年9月,中国已与29个国家实现全面互免签证,并对47个国家实行单方面免签。如今,国外游客入境同比增长超50%。

AI翻译的即时多语种支持,可以为游客提供无缝的体验。

此外,商务、政府等场合对高效沟通的需求,同样迫切。AI翻译可以「不知疲倦」地完整记录对话,确保沟通的准确性与流畅性。

正是在这样的大背景下,「AI翻译」战略应运而生。

三重壁垒

那么,问题又来了,做这件事的人,为什么非科大讯飞不可呢?

在AI浪潮大背景之下,很多互联网巨头均在AI翻译、同传等领域重金投入,科大讯飞的护城河又在哪里呢?

技术、赛道、生态,三种壁垒,铸就起科大讯飞坚固的护城河。

首先,科大讯飞的信心源于深厚的技术积累。

作为语音技术的领军者,科大讯飞不仅承建了中国唯一「认知智能全国重点实验室」,并于2024年荣获「国家科学技术进步奖一等奖」。

这是AI公司中,唯一凭借语音技术获此殊荣。


科大讯飞作为第一单位,获奖项目是《多语种智能语音关键技术及产业化》

「星火大模型」是科大讯飞一切翻译技术的核心底座。自发布以来,它历经多次迭代,每一次都对标世界顶级模型。

更关键的是,星火是唯一完全基于国产算力「飞星二号」训练部署的大模型。这不仅是技术优势,更是战略安全的保障。

在当前环境下,自主可控不是口号,而是科大讯飞每一行代码、每一次训练的坚持。

基于星火,科大讯飞打造的端到端同传技术业内领先,已在WAIC、东盟博览会等国际会议上广泛应用。

当行业还在使用「拼接式」方案时,科大讯飞早在今年1月,就实现了端到端语音同传的工程化和产品化。

这种立体防御体系——「技术顶层设计-产品极致体验-专业领域深耕」,构成了科大讯飞的核心壁垒。

其次,选择「翻译赛道」本身就是护城河。

这一赛道看似拥挤,但真正强大模型与专业翻译、同传场景深度结合,并持续投入的玩家屈指可数。

这片蓝海市场,专业性极强,需要对语境、术语有着深刻的理解。

科大讯飞深谙此道,不走捷径,而是通过对复杂场景的积累,打造不可复制的优势。

平台型巨头拥有流量和生态,它们的战略是「广」,是构建一个包罗万象的AI基础设施和应用市场。

与其他巨头相比,科大讯飞护城河在于「深度」,而非「广度」。

如今,科大讯飞同传已累计服务全球50+国家和地区,助力超40万场次会议,覆盖观众总数超4亿人次。

它已成为国际会议的标配,许多大会甚至以此判断是否「国际化」。这种Know-how积累,不是通用大模型短期能弥补的。

最后,科大讯飞构建了业界最丰富的「全产品矩阵」,覆盖多元化应用场景。

从轻量化APP到智能硬件,再到大型会议系统解决方案,这种软硬一体化的服务,精准满足用户的各种需求。

最关键的还是,软硬一体化适配,数据全流程打通。

同一账号,在翻译APP、翻译机、AI录音笔等多平台间无缝切换,随着使用频次增加,AI对用户习惯的理解加深,优化个性化服务,形成了「涟漪效应」。

数据流转驱动模型迭代,构建自我进化的闭环。

如今回看IDC报告,科大讯飞凭借深厚的技术积累、前瞻性布局,无可厚非地成为AI翻译领域的领头羊。

翻译从来不只是语言、文字的转换,更应是连接世界的纽带。

科大讯飞的愿景是,以翻译为起点,推动全球信息的平等流动,让语言不再成为横亘在人与人之间的隔阂。

如今,在教育、贸易、公共服务、全球科技与创新协作等领域,科大讯飞AI翻译的变革已落地生根。

比如,在教育领域,讯飞翻译机、APP等便捷工具,帮助学生高效学习外语,促进国际教育交流与合作;

在贸易领域,翻译机、翻译耳机等产品精准切入商务谈判、跨国会议场景,提升跨境贸易效率,降低沟通成本等等。

科大讯飞的AI翻译,正打破语言枷锁,成为点亮全球智慧之光。


版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泽连斯基:卢拉的想法与普京的如此一致 这不合适

参考消息 浏览 120991

保罗:我跟加内特交手时每次都像要打架 追梦跟我一样喜欢竞争

直播吧 浏览 13410

最近这件衬衫很火 一定要试试这样穿

她暖 浏览 14416

顶流联动!张雨霏实现愿望,与花花同框,送谭爷爷暖心礼物

天涯沦落人 浏览 13249

《孤注一掷》爆了!可惜片中有两个败笔……

不八卦会死星人 浏览 13839

今夏流行“下衣失踪穿法”这样穿真的时髦炸了!

In风尚 浏览 16919

两场硬仗,一个拐点,蔚来穿越最长谷底

雪豹财经社 浏览 101

iQOO Z7搭载120W 超快闪充 售价1599元起

网易科技报道 浏览 12605

"天价"听花酒藏了多少秘密?业绩洗澡,青海春天说的清吗?

界面新闻 浏览 15895

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 286

《许我耀眼》很爽,但要小心

时尚COSMO 浏览 273

最高续航达610km 江铃羿驰05S上市售9.79万元

网易汽车 浏览 168

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 279

他俩“被迫”会面 “没打招呼,相隔数米”

参考消息 浏览 16709

4天票房过亿口碑却走低,一件更糟糕的事,正在国产爱情片中发生

毒舌电影 浏览 9872

李湘要气炸了!王诗龄封面脚被P成“双右脚”,芭莎无回应惹争议

乌娱子酱 浏览 117

4家企业集体被罚28亿,支付机构深陷收单“跳码”风波

钛媒体APP 浏览 15445

梁洛施晒外出游玩照尽显气质,和李泽楷相处和睦

娱乐团长 浏览 15077

拜登:向乌提供集束弹药只是"过渡行为"

环球网 浏览 13412

被原配曝当小三后,女篮李梦隐藏社交账号

娱絮 浏览 13497

天舟五号货运飞船完成与空间站组合体再次交会对接

人民资讯 浏览 15631
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1