
芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西5月26日报道,在台北国际电脑展COMPUTEX 2025前夕,Arm高级副总裁兼终端事业部总经理Chris Bergey发表主题演讲,分享Arm生态系统如何推动下一波人工智能(AI)浪潮。目前,基于Arm架构的芯片出货量已累计超过3100亿颗,广泛应用于消费电子设备、AI汽车以及AI优先的数据中心。
近日,Chris Bergey与芯东西等媒体进行深入交流。据他透露,Arm预计今年稍晚将推出新的Armv9旗舰CPU(代号Travis),同时下一代GPU(代号Drage)将提供更强性能。他告诉芯东西,Arm GPU重点聚焦边缘侧,针对物联网和终端市场均有GPU产品,同时在汽车领域的GPU进行投入,目前尚未计划对数据中心GPU进行投入。
Travis CPU将带来双位数的IPC性能提升,并将是第一代引入Armv9可伸缩矩阵扩展(Scalable Matrix Extension,SME)的处理器,可进一步加速处理AI工作负载。Drage GPU将能为长时间的游戏和更丰富的多媒体内容提供持续的性能支持。这两款产品的结合将引入面向移动端市场的Arm Lumex CSS解决方案,为未来消费电子设备上的边缘AI性能奠定基础。
Arm已被中国生态系统视为手机高性能GPU的领先提供商,今年加入了Arm精锐超级分辨率技术(Arm ASR),使用户能够在移动设备上实现游戏主机级画质和游戏体验。
一、云侧:预计今年近50%头部云服务算力基于Arm架构
Arm已转型为计算平台公司,从云端到边缘侧等各个应用,在计算能效与能源效率方面展现领导地位。
在云端与数据中心方面,亚马逊云科技(AWS)、谷歌、微软等科技巨头均在持续扩展搭载Arm计算平台的自研数据中心芯片。
AWS曾分享,其超过90%的重要客户(不包括亚马逊)在用Arm先进架构。过去两年,AWS新部署的CPU算力中,有超过50%是基于Arm技术的Graviton芯片。
Arm预计在2025年,出货到头部超大规模云服务提供商的算力中,有近50%是基于Arm架构。
这股动力,来自业界对Arm高效节能计算能力的强烈需求。相比其他平台,头部云服务提供商所采用的Arm架构芯片可实现高达40%的能效提升。
在COMPUTEX期间,NVIDIA也分享了基于Arm架构的NVIDIA Grace CPU的进展。该CPU在包括埃克森美孚、Meta等一系列的实际部署中,为要求苛刻的AI工作负载提供了性能和效率的提升。
Bergey强调说,数据中心的未来将是Arm计算与加速器的紧密耦合。这一趋势在很大程度上建立于Arm生态系统之上。
二、边缘侧:预测今年PC和平板出货量占比超40%
每瓦性能在边缘设备中至关重要。
在去年的COMPUTEX展会上,Arm发布了专为消费电子设备打造的Arm终端计算子系统(CSS),作为旗舰AI智能手机与新一代AI PC的计算平台。
Bergey告诉芯东西,Arm的大部分业务是向整个行业提供标准化产品和平台解决方案,当前随着AI快速演进,芯片设计变得越来越具有技术挑战性,成本变高,产品上市时间愈发关键,此外因摩尔定律放缓,设计过程中对工艺的定制化需求也持续增长,这些驱使Arm推出CSS。
CSS仍属于标准化产品,而非定制化业务。Arm可以为从云端、汽车到终端等不同细分市场的合作伙伴提供CSS,帮助合作伙伴有效提升性能、降低成本,并加快产品上市周期。
除了带来两位数的性能提升之外,终端CSS也为用户带来了实质性效益——应用程序启动更快速、AI 体验更流畅且更持久。
目前全球99%的智能手机都采用Arm架构,对性能、电池续航以及“始终在线(Always-on)”的需求也在不断扩展到其他消费设备市场。
在中国手机市场,Arm正在为联发科技等生态合作伙伴提供前沿CPU和GPU技术,这些合作伙伴正与众多一线手机厂商携手,将搭载Arm技术的优秀手机产品推向市场。
Armv9架构自四年前推出以来,已被全球多款最新的手机与PC采用,为这些设备带来了更出色的AI性能。
对于移动终端设备而言,控制功耗是一个关键考量因素。IPC(每时钟周期指令数)与频率的乘积决定了整个平台的性能。相较于单纯依赖提高频率来提升性能,提升IPC可以更高效地实现性能的增强,同时还能显著改善能耗表现。
据Bergey分享,Arm坚信异构计算是未来的发展方向,目前大多数第三方应用都是在CPU上进行AI开发的,有70%会始终运行在CPU上,而不会迁移到GPU或NPU,也有不少应用借助GPU进行加速。
如今AI PC的设计正越来越接近现代智能手机的形态——轻薄的尺寸、无风扇的设计、全天候的电池续航能力、始终在线的效率,以及无论是视频会议还是视频流媒体,都能享受到卓越的多媒体体验。
近年来,Arm架构在PC与平板市场的需求大幅成长,预估在2025年将占整体出货量的40%以上。全球大多数主流的应用均已推出适用于Windows的Arm原生版本,带来更快速、更强大的AI PC体验,涵盖聊天机器人、生产力工具等核心应用。
联发科技近期推出的Kompanio Ultra SoC,更进一步提升了Chromebook市场的水平,让新一代 Chromebook Plus 设备具备先进AI与多媒体能力。
此外,NVIDIA推出的DGX Spark个人AI超级计算机,将数据中心级别的计算能力带到了桌面级产品。该产品搭载了基于Armv9架构CPU的Grace Blackwell超级芯片,具备支持2000亿参数模型的AI计算能力。
在本届COMPUTEX 上,NVIDIA宣布与宏碁、华硕、戴尔科技、技嘉、惠普、联想和微星等全球领先系统制造商共同打造NVIDIA DGX Spark和DGX Station系统。
三、汇聚超2200万名开发者,Kleidi软件库累计安装超80亿次
Bergey认为,构建AI系统有三个关键因素:
首先,从云端到边缘打造一个无处不在的平台将具有极大的价值,因为很多时候AI是在端侧运行的,但在某些情况下,又希望能够将工作负载转移到云端。因此,拥有一个高度且可移植的平台,对于推动先进技术及产品的实现,以及为现有产品增加新功能,都非常有价值。
二是电力和每瓦性能。AI极为耗电,数据中心能耗从兆瓦级(MW)跃升至吉瓦(GW)级,其中超过50%实际上来自于机架和半导体设备。“每瓦性能”将是关键衡量指标。
三是软件。强大的软件生态进一步催生了更多硬件的发展机会。
在Bergey看来,要在端侧AI中兼顾算力与能效,芯片设计也有三个关键要素:一是内存带宽,二是确保在平台中集成强大、灵活性高的硬件,三是软件。如果没有成熟的软件及其生态系统,要跟上所有行业标准和各种AI框架,将会是一项非常繁重且具有挑战性的工作。
目前,Arm已有超过2200万名开发者在Arm平台上进行开发。Arm持续大力投资软件,协助开发者在开发的过程中降低复杂度、并提高效率。
Bergey补充道,开发者仅需一次开发,就能在整个半导体生态系统中众多采用Arm CPU的SoC上运行。
在去年的COMPUTEX上,Arm发布了Arm Kleidi软件库,让开发者能在各种AI模型与工作负载上实时获得最佳的性能表现。
Kleidi推出后仅一年,已整合至多个主流AI框架中,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN以及ONNX Runtime。
迄今为止,Kleidi已在搭载Arm架构的设备上累计超过80亿次安装,且仍在持续增长中。
结语:AI转型依赖持续创新
Bergey在COMPUTEX主题演讲末尾强调,AI时代是一场千载难逢的机会,能够重新定义科技如何影响世界。但要真正实现这项潜力,仍依赖持续创新,以及与Arm世界级生态系统的深度合作。
过去18个月内,有超过150个涵盖语音、图像、文字与视频生成的基础模型面世。原本只存在于云端的AI助理,如今也正优先在边缘设备上开发,推动AI推理作业由云端转向边缘应用。
推理是AI实际运行并创造价值的环节,是真正驱动未来创新与商业价值的关键。AI agents也正快速增长,这些系统能够独立执行复杂任务、彼此协作,并在大规模下自动运行。这将成为物理AI的基础,使AI从数字世界延伸至真实的物理环境,例如机器人。
据Bergey观察,AI agents方面已经有一些非常有趣的应用场景和非常成功的商业项目或初创公司,两个颇受关注的领域是AI编程和AI客服。物理AI也蕴藏着巨大机遇,一些机器人技术已经落地应用,接下来一到三年,机器人设备有望在自主模式下具备媲美人类操作的表现。
具备可扩展性且高效率的计算,在未来会变得更加重要。
从云端到边缘,Arm的计算平台正处于AI转型的核心。Arm及其世界级生态系统持续在硬件与软件领域不断创新与投入,以实现下一波即将改变数十亿人生活的AI浪潮。