搜狗9
关闭广告

英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,拟下半年发货

华尔街见闻官方1166人阅读

英伟达在CES展会推出新一代Rubin AI平台,标志着其在人工智能(AI)芯片领域保持年度更新节奏。该平台通过六款新芯片的集成设计,在推理成本和训练效率上实现大幅跃升,将于2026年下半年交付首批客户。


美东时间5日周一,英伟达CEO黄仁勋在拉斯维加斯表示,六款Rubin芯片已从合作制造方处回厂,并已通过部分关键测试,正按计划推进。他指出"AI竞赛已经开始,所有人都在努力达到下一个水平"。英伟达强调,基于Rubin的系统运行成本将低于Blackwell版本,因为它们用更少组件即可实现相同结果。

微软和其他大型云计算提供商将成为下半年首批部署新硬件的客户。微软的下一代Fairwater AI超级工厂将配备NVIDIA Vera Rubin NVL72机架级系统,规模可扩展至数十万颗NVIDIA Vera Rubin超级芯片。CoreWeave也将是首批提供Rubin系统的供应商之一。

该平台的推出正值华尔街部分人士担忧英伟达面临竞争加剧,并怀疑AI领域的支出能否维持当前速度。但英伟达保持长期看涨预测,认为总市场规模可达数万亿美元。

性能提升瞄准新一代AI需求

据英伟达公告,Rubin平台的训练性能是前代Blackwell的3.5倍,运行AI软件的性能则提升5倍。与Blackwell平台相比,Rubin可将推理代币生成成本降低至多10倍,训练混合专家模型(MoE)所需GPU数量减少4倍。

新平台配备的Vera CPU拥有88个核心,性能是其替代产品的两倍。这款CPU专为代理推理设计,是大规模AI工厂中能效最高的处理器,采用88个定制Olympus核心、完整Armv9.2兼容性和超快NVLink-C2C连接。

Rubin GPU配备第三代Transformer引擎,具备硬件加速自适应压缩功能,可提供50 petaflops的NVFP4计算能力用于AI推理。每个GPU提供3.6TB/s的带宽,而Vera Rubin NVL72机架则提供260TB/s带宽。

芯片测试进展顺利

黄仁勋披露,全部六款Rubin芯片已从制造合作伙伴处返回,并已通过显示其可按计划部署的关键测试。这一表态表明英伟达正维持其作为AI加速器领先制造商的优势地位。

该平台包含五大创新技术:第六代NVLink互连技术、Transformer引擎、机密计算、RAS引擎以及Vera CPU。其中第三代机密计算技术使Vera Rubin NVL72成为首个提供跨CPU、GPU和NVLink域数据安全保护的机架级平台。

第二代RAS引擎横跨GPU、CPU和NVLink,具备实时健康检查、容错和主动维护功能,以最大化系统生产力。机架采用模块化、无线缆托盘设计,组装和维护速度比Blackwell快18倍。

广泛生态系统支持

英伟达表示,包括亚马逊的AWS、谷歌云、微软和甲骨文云在2026年将率先部署基于Vera Rubin的实例,云合作伙伴CoreWeave、Lambda、Nebius和Nscale也将跟进。

OpenAI CEO Sam Altman表示:“智能随计算扩展。当我们增加更多计算时,模型变得更强大,能解决更难的问题,为人们带来更大影响。英伟达Rubin平台帮助我们持续扩展这一进展。”

Anthropic联合创始人兼CEO Dario Amodei称,英伟达“Rubin平台的效率提升代表了能够实现更长记忆、更好推理和更可靠输出的基础设施进步”。

Meta CEO扎克伯格表示,英伟达的“Rubin平台有望带来性能和效率的阶跃式变化,这是将最先进模型部署给数十亿人所需要的”。

英伟达还称,思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器。包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI等AI实验室正期待利用Rubin平台训练更大型、更强大的模型。

提前公布产品细节

评论称,英伟达今年比往年更早披露新产品的细节,这是该司保持行业依赖其硬件的举措之一。因为英伟达通常在每年春季加州圣何塞举行的GTC活动上深入介绍产品细节。

对黄仁勋而言,CES只是其马拉松式出席活动的又一站。他要在各类活动中宣布产品、合作和投资,均旨在为AI系统部署增添动力。

英伟达公布的新硬件还包括网络和连接组件,将成为DGX SuperPod超级计算机的一部分,同时也可作为单独产品供客户以更模块化的方式使用。这一性能提升是必需的,因为AI已转向更专业化的模型网络,不仅要筛选海量输入,还需通过多阶段流程解决特定问题。

英伟达正在推动面向整个经济领域的AI应用,包括机器人、医疗保健和重工业。作为这一努力的一部分,英伟达宣布了一系列旨在加速自动驾驶汽车和机器人开发的工具。目前,基于英伟达的计算机支出大部分来自少数客户的资本支出预算,包括微软、Alphabet旗下的谷歌云和亚马逊旗下的AWS。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 7726

月销破2万辆 极狐年销翻番在望 摸到准一线门槛

乐逗汽车 浏览 1824

因场地积水严重,欧协联里耶卡vs布拉格斯巴达比赛被迫延期

懂球帝 浏览 1814

世体:坎塞洛、巴尔德和赫拉德-马丁各有特点,首发难以确定

懂球帝 浏览 524

冬天别只穿黑白灰,看看这些“蓝色系”穿搭,清爽减龄又高级

静儿时尚达人 浏览 1300

媒体:美军或捅破一个巨大的马蜂窝 与俄军在伊朗硬刚

新民周刊 浏览 2952

纳帅:尊重马扎加入阿尔及利亚,但选择国家队应出于自豪感

懂球帝 浏览 1622

台媒:英美等技术顾问不敢坐台自制潜艇出海

环球网资讯 浏览 1339

哲凯还是谢什科?鲁尼:伊萨克谢什科二选一我也还是会选后者

懂球帝 浏览 1721

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 1917

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 2916

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 2028

张馨予华丽回归ELLE盛典,25斤重礼服惊艳全场

洲洲影视娱评 浏览 1735

英国防大臣称想"绑架"普京 俄方:痴人说梦

界面新闻 浏览 1060

史上最牛妖股!149个涨停板,暴涨55000%......

中国基金报 浏览 1342

中国核聚变技术获国际原子能机构肯定,“环流三号”亮相聚变能国际大会

上观新闻 浏览 1895

《人之初》大结局,重排演员演技:萨日娜第五,徐百慧第二

娱乐圈笔娱君 浏览 1095

男子网购"山羊绒大衣"实为绵羊毛起诉获赔 卖家已去世

红星新闻 浏览 3547

2026支付宝集福最大亮点:新增“健康福”红包,由蚂蚁阿福发放

澎湃新闻 浏览 945

闫妮姚晨合拍大片,梦回《武林外传》

蕾爸退休日记 浏览 1757

进口车大崩盘,出口车三连冠!中国汽车反杀外国车

象视汽车 浏览 530
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1