芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西11月19日报道,在今日举行的Arm Tech Symposia年度技术大会上,Arm基础设施事业部产品解决方案副总裁Dermot O’ Driscoll分享了Arm面向基础设施及汽车领域的最新进展及技术创新,并与芯东西等媒体进行深入交流。
期间,Arm深入探讨了AI对计算的需求,并分享了其作为计算平台公司如何通过全面的计算子系统(CSS)、从云到端的软件开发赋能、紧密合作的生态系统三大核心,助力合作伙伴把握AI的发展机遇。
在媒体沟通会上,Driscoll回应了对英特尔AMD近期成立x86生态系统顾问小组的看法:“我们也觉得挺有意思的,英特尔现在才决定要创建一个顾问小组来确保他们的软件可以跨平台运行。我们已经做了30年。”
他看到中国市场对数据中心业务的兴趣愈发浓厚,中国开发者数量增长,对迁移解决方案的需求也在增多。
Arm致力于与行业领导者合作,进一步推动它们在消费市场的业务发展。在Dermot O’ Driscoll看来,大厂需要的不是标准品,而是定制化解决方案,只有Arm可以提供这样的灵活性。
不过他并没有直接回应Neoverse系列的后续规划,而是说Arm一贯只有在技术准备时,才会披露技术路线图。Arm将加强与中国地区合作伙伴的密切合作,开发面向未来业务的产品。
本场大会聚焦生成式AI、边缘AI、大语言模型、Chiplet技术、AI基础设施、智能驾驶等前沿科技,旨在推动AI技术在Arm生态系统中展开进一步的交流与合作,并汇聚了阿里云、联想、小鹏等不同领域的战略伙伴,一展Arm繁荣多元的生态。
联想全球中小企业产品和解决方案总经理郑爱国谈道,联想将Windows on Arm(WoA)视为一项前瞻性的长期战略布局,一方面不断投入以构建领先的产品,另一方面将继续与合作伙伴共同推进这一生态的发展。
一、到2025年,AI+Arm设备将超过1000亿台
AI加速已是时代主线。Dermot O’Driscoll在大会主题演讲中强调,自转型成为计算平台公司以来,Arm通过软硬件深度融合和架构创新,持续在AI时代引领计算变革。
他举了一些中国正在引领全球AI创新的例子,比如今年中国PC市场的AI PC占比有望达到55%、以AI为先的数据中心增幅将达到500%,预计到2032年AI将产生超过1.1万亿美元的产值。
预计到2025年底,全球将有超过1000亿台具备AI能力的Arm设备。
Dermot O’ Driscoll提到发挥AI潜力需要软件和固件、先进代工支持、强大的第三方IP、专业设计服务。
在硬件投资方面,Armv8 64位架构在10多年前发布。进入AI时代,Arm推出了Armv9。
Armv9有两个关键架构SVE2(可伸缩向量扩展)和SME(可伸缩矩阵扩展)。
SVE2在联发科天玑9400等旗舰手机芯片中已部署,进一步加速了开发者和终端用户获益的工作负载,提高了视频和图像处理能力,可提供更好的照片质量、更长的电池寿命。SME建立在SVE2的基础之上,新增了高效处理矩阵的能力,架构专为AI而设计。
Dermot O’ Driscoll谈道,目前市场上大部分创新基于AI训练,预测今后会看到更多关于推理方面的创新。
二、用CSS加速产品上市,助攻Chiplet方案部署
如今,Arm采用更全面的系统级设计思维,专注硬件与软件的协同优化,针对不同应用市场带来对应的计算子系统(CSS),扩展底层技术巩固AI计算需求。
AI比以往任何一代技术都更加耗电、耗内存。为了更好提升Arm计算平台的性能,Arm开发了CSS,以进一步加速产品上市时间,搭配强大的软件解决方案,并在硬件准备好推向市场时即可使用软件。
Arm对CSS的发展充满信心,因为市场需求非常大。在基础设施、汽车领域,Arm都推出了相关产品。无论是汽车、基础设施还是端侧,每个市场的要求不同,Arm会做适应性的调整。
谈到生态领域的成果,Dermot O’Driscoll补充道:“自推出Arm全面设计(Arm Total Design)生态项目一年以来,成员规模已经达到30家。Arm计算子系统和Arm全面设计正推动软硬件的快速发展,让合作伙伴能够轻松打造更广泛、更高级的解决方案,加速推动芯片和AI领域的创新。”
AI发展需要定制芯片,而定制芯片需要通力合作来实现。Arm已通过Chiplet系统架构(CSA)与约50家领先企业展开了合作。
据Dermot O’ Driscoll透露,在基础设施业务方面,Arm有很多合作伙伴成功地部署了Chiplet解决方案。
Arm有专门的标准架构来确保Chiplet有效工作和互联,可形成一个通用生态体系。该公司会帮助早期合作伙伴测试Chiplet解决方案,使其变得更加普遍,进一步提高利用率。
Dermot O’ Driscoll谈道,Arm的一个独特定位是能够实现标准化,与生态伙伴共同制定行业所需的标准。
三、软件是重中之重
软件始终是Arm计算平台的重要组成部分。Arm相信不管在任何硬件平台上,都需要不断优化软件。
在软件方面,Arm今后的投资会更加关注于AI能力的提升,将一如既往地投资创新软件技术,为开发者提供从云到端、高效、易用、无缝的开发体验,赋能软件创新。
Arm能够帮助开发者简化流程,加速产品上市,节约成本。Dermot O’ Driscoll提到了Arm的一些希望:1)在硬件平台中提供加速功能,以便更多合作伙伴借助异构计算的能力;2)提升系统易用性,提高开发效率;3)使开发人员可将更多时间精力放在他们所开发的应用程序上,而无需过多关注硬件细节。
Arm的AI软件生态系统能够确保全球领先的AI框架在Arm上开箱即用,并达到最佳运行水平。
Arm推出的KleidiAI微内核非常易于集成,已经为生成式 AI工作负载带来了显著的性能提升。与参考实现方案相比,在新的Arm Cortex-X925 CPU上,使用集成了 KleidiAI的llama.cpp的Meta Llama 3和微软Phi-3大语言模型的Token首次响应时间加快了190%。
据Dermot O’ Driscoll分享,Arm关注的要点是向市场推出更优化的解决方案,支持产品的快速上市,并提供强大的软件生态系统支持。OEM商非常喜欢这种解决方案,因为他们可以快速打造新产品。
他谈到Arm计算平台能够脱颖而出的一个特点是拥有庞大的开发人员。Arm拥有全球最大的软件开发社区之一,在Arm平台上进行开发的全球开发者数量超过2000万人。Arm在开源社区方面进行了大量投资,同时非常关注和支持中国当地的生态系统发展,比如龙蜥社区。
结语:从底层技术出发,驱动AI计算平台
迄今为止,合作伙伴基于Arm架构的芯片出货量已超过3000亿颗。从大型数据中心中用于训练大语言模型的海量处理器,到全球用户每天接触的端侧AI设备,Arm平台已成为未来AI运行的基石。
低功耗刻在Arm的DNA里。Arm希望向市场提供最高效节能的产品及解决方案,相信能效水平是Arm在基础设施市场取得成功的关键。
Arm的很多客户在使用异构计算。Dermot O’ Driscoll说,Arm的最终目标是,在任何需要异构计算方案的地方都会看到Arm。
作为全球最大的技术生态系统之一,Arm通过包括全面设计(Arm Total Design)在内的众多生态项目,希望协助合作伙伴加速产品上市进程。