关闭广告

谷歌推出开源全栈NPU新架构,旨在实现大模型在终端的低功耗运行

DeepTech深科技120人阅读

谷歌(Google)正式宣布推出Coral NPU,一个面向边缘人工智能(Edge AI)的开源全栈平台。这一平台旨在解决当前边缘 AI 设备面临的核心挑战,使大型、现代的人工智能模型(LLMs)直接嵌入到智能手表、耳机和各类传感器等对功耗极度敏感的微型设备中,并首次实现在智能手表、耳机或传感器等小型设备上实现全天候运行。


(来源:Github Coralnpu)

近年来,云端大模型的强大创造力、推理和辅助能力已经从根本上重塑了我们对技术的期望。谷歌认为,下一个重大的技术飞跃,不在于让模型更大,而在于让智能更贴近我们。

要让 AI 成为真正的贴身助手,主动帮我们规划日程、实时翻译对话、或理解我们的物理环境,它就必须在我们佩戴和携带的设备上运行。这就导向了当前行业的核心挑战:如何将“环境 AI”(ambient AI)植入电池容量极其有限的边缘设备,使其在实现全天候辅助的同时,确保用户数据的绝对隐私。

Coral NPU 的目标就是实现极致的能源效率,让 AI 模型在仅消耗几毫瓦功率的情况下运行,从而摆脱对云端连接的依赖,并从根本上增强设备的隐私保护能力。

谷歌指出,要将 AI 从云端迁移到个人设备,首先要解决三个根深蒂固的难题:一是性能鸿沟,即现代模型所需的庞大算力与微型设备有限资源之间的矛盾;二是碎片化的成本,即面对硬件与软件工具链的严重碎片化,开发者需要为一个充斥着各种专有处理器的、高度碎片化的市场编译和优化 ML 模型,而这一过程极其困难且成本高昂;三是用户信任,面对数据传输至云端处理带来的隐私泄露风险,个人 AI 必须将个人数据的隐私与安全置于首位。

传统上,低功耗边缘设备的开发者面临一个根本性的权衡:要么选择通用 CPU,它们灵活且软件支持广泛,但缺乏针对 ML 工作负载的专用架构,导致性能低下且能效比差;要么选择专用加速器,它们 ML 效率高,但“不灵活、难以编程,且不适合通用任务”。

其次,这种硬件困境被一个高度碎片化的软件生态系统放大了。CPU 和 ML 模块的编程模型截然不同,开发者常常被迫使用专有编译器和复杂的指令缓冲。这造成了陡峭的学习曲线,使行业长期缺乏一个成熟的、能有效支持多种 ML 开发框架的低功耗架构。

传统的芯片设计思路是围绕通用 CPU 构建,再“外挂”一个 AI 加速器。这种架构在处理“常驻”的、持续性的 AI 任务时效率低下。Coral NPU 的出现则开辟了一条新的思路。它不再以 CPU 为中心,而是将负责运行神经网络核心数学运算的“矩阵引擎”置于芯片设计的核心位置。这一神经处理单元(NPU)架构,结合了一个小型的 RISC-V 控制核心 和一个 RVV 1.0 向量单元,未来还将推出量化外乘矩阵单元。

这种以“AI 优先”(AI-first)为先的架构,Coral NPU 旨在实现极高的能效比。其目标性能是每秒执行约 5,120 亿次操作(512GOPS),而功耗则控制在毫瓦级别。这种性能与功耗的平衡,对于需要 24/7 全天候运行 AI 功能且电池容量极其有限的小型 AI 设备而言,堪称一次飞跃。


(来源:Google for Developers)

同时,Coral NPU 还是一个“全栈”平台。为了解决工具链碎片化的问题,谷歌为其配备了一个统一的编译器堆栈。该堆栈基于 MLIR、IREE 和 TensorFlow Lite Micro 等开源技术。其核心优势在于,开发者只需编写一次模型代码,就能在任何基于 Coral NPU 架构的芯片上运行,真正实现模型的跨硬件无缝迁移。这极大地降低了开发门槛,使开发者无需再为每一个品牌的硬件重写和优化代码。

在解决“信任赤字”方面,Coral NPU 的一个核心原则是通过“硬件强制安全”(hardware-enforced security)来建立用户信任。其架构正在被设计为支持像 CHERI 这样的新兴技术,该技术能提供细粒度的内存级安全和可扩展的软件分区。谷歌希望通过这种方法,将敏感的 AI 模型和个人数据隔离在一个“硬件强制的沙箱”中,以有效抵御基于内存的攻击。

谷歌将 Coral NPU 视为边缘 AI 的新开放标准,而这一愿景已开始落地。据悉,芯片设计公司 Synaptics 已经开始采用这种新设计来构建其下一代芯片,证明了该平台不仅仅停留在理论阶段。Coral NPU 的开源和全栈特性,有望催生下一代真正智能且持久续航的边缘设备,从根本上改变用户与可穿戴设备和传感器的交互方式。

参考资料:

1.https://developers.googleblog.com/en/introducing-coral-npu-a-full-stack-platform-for-edge-ai/

2.https://research.google/blog/coral-npu-a-full-stack-platform-for-edge-ai/

3.https://github.com/google-coral/coralnpu

运营/排版:何晨龙

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥巴马带着妻女与好莱坞演员汤姆·汉克斯聚餐

译言 浏览 14108

燕京啤酒股两度踩中代言人舆情:顶流代言的高风险B面

21世纪经济报道 浏览 12646

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 284

“浪姐”朱珠登VOGUE,身材傲人宛若美人鱼

闲聊小神龙 浏览 14650

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 257

《寂静的朋友》全亚洲登陆,梁朝伟出演大尺度镜头,很可能被删减

最爱酷影视 浏览 282

巴拉圭当选总统计划窜台 外交部回应

环球网资讯 浏览 79815

媒体:西方又给解放军戴"不专业"帽子 还有人谩骂

新民周刊 浏览 13688

俞敏洪:看不起“买买买”的嚎叫型直播带货

Tech星球 浏览 13907

陕西一官员被前妻举报学历年龄造假 6处房产来源不明

河北新闻网 浏览 70171

马克·库班抨击OpenAI情色计划:这将会适得其反

鞭牛士 浏览 218

京多安:哈兰德可能是目前世界上最好的前锋 没什么比欧冠更重要

直播吧 浏览 15966

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 1143

打脸华尔街,比亚迪和特斯拉是专业的

Wind万得 浏览 13597

徐静雨:文班在夏联展现了自己的调整力 开始找到隐藏缺陷的方法

直播吧 浏览 13239

被神话的GPT,造不出你的梦中神车

深途 浏览 13796

Rivian二季度营收达11.2亿美元 同比增长208%

界面新闻 浏览 11713

本轮欧冠仅国米取胜,本赛季意甲欧战积分跌落至第8位

懂球帝 浏览 32

男子应聘船员出海严重晕船自缢:一吃就吐 甚至用头撞墙

极目新闻 浏览 817

谢霆锋现实长什么样?路人镜头暴露真实身高,突然理解李诞了

温柔娱公子 浏览 274

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 694
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1