Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

智东西(公众号:zhidxcom)
编 | 韦世玮 心缘

导语:Arm发布新GPU架构Valhall,带来全新ISA和计算核心设计,与PC GPU的设计方法更相似。

智东西5月29日消息,美国时间5月26日,Arm在台湾的Computex技术贸易展发布新一代旗舰IP解决方案,包括Cortex-A77 CPU、Mali-G77 GPU和机器学习神经网络处理器(ML NPU)。

英国Arm公司是全球领先的半导体知识产权(IP)供应商,主要提供处理器架构授权,本身不直接从事芯片生产,全球绝大多数智能手机和平板电脑等便携式消费电子产品均采用Arm架构。

延续Arm历年IP的发布节奏,Cortex的发布并不令人感到意外。更让人眼前一亮的当属新一代GPU核,它采用全新架构Valhall。要知道,此前ARM GPU连续三年都采用的都是Bifrost架构。

Arm表示,三款旗舰IP旨在从网络边缘扩展到云端,整体性也均有了显著提升,预计将在2020年正式推出。由此可见,Arm公司正在为5G、物联网和AI等的融合做准备。

一、新CPU核代号Demios:性能提升20%

Arm最新发布的Cortex-A77 CPU代号为Demios。按照Arm的预计进度表, 每一代Arm Cortex系列CPU的CAGR性能都比上一代稳步提升20%至25%。

Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

此前其上一代微架构Cortex-A76 CPU与台积电7nm工艺相结合,为华为麒麟980、高通骁龙855等芯片带来巨大的性能和效率飞跃。

Cortex-A77的核心架构和接口均与Cortex一致,仍采用Arm v8.2架构,支持AArch32和AArch64,旨在与DynamIQ共享单元(DSU)集群内的Cortex-A55 big.LITTLE适配。

Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

其他核心特性还包括:64KB L1指令和数据高速缓存,256KB和512KB L2高速缓存,高达4MB的共享L3缓存。有趣的是,Arm为基础设施Neoverse N1 CPU核设计了1MB L2缓存选项,但选择留在移动CPU IP上较小的配置选项。

Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

Cortex-A77的每时钟指令(IPC,Instructions per lock)性能,相较A76增加约20%,相较2013年推出的Cortex-A15提高了约4倍。

A77预计仍将搭配7nm工艺,且峰值频率和A76一样,都是3GHz。由于预计频率变化不大,这20%的性能提升主要归功于IP的微体系架构的变化。

为了实现IPC的增益,Arm重新设计了微体系结构并引入了一些新功能,通常会增强CPU IP,提高了面积密度,降低成本。

Cortex-A77不仅可以处理通用计算任务,还可以处理大部分设备的机器学习和增强现实/虚拟现实任务。

Arm表示,Cortex-A77的性能与当下主流笔记本电脑相比毫不逊色,并他们希望将来有更多公司采用Cortex-A77来扩展ARM笔记本电脑和便携式电脑的Windows操作系统。

二、新Valhall GPU架构:能效与性能密度均提高30%

Arm新发布的Mali-G77 GPU 采用了全新架构Valhall,此前G71-G76采用的架构均为Bifrost架构。Mail-G77的全新ISA和计算核心设计,更类似于从AMD、英伟达等其他台式机GPU供应商的设计方案,新GPU架构相比Bifrost架构有明显改进,每平方毫米的性能比G76提升了1.2至1.4倍。

Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

相较前代产品,Mali-G77的主要特点包括:能效和性能密度(基于ISO性能和工艺)均提高了30%,GPU上机器学习推理工作负载性能提高60%,这将进一步提高开发人员为移动应用设计更多沉浸式游戏的能力。

更有趣的是,在即将到来的2019年底和2020年,SoC的性能预计将比2019年的器件提高40%。外媒Anandtech认为,下一代SoC预计只有很少的工艺节点改进,因此上述大部分增益都归功于新Mali-G77 GPU的架构和微体系结构的跃进。

三、新AI内核:能效提升2倍以上

除了发布CPU和GPU外,Arm还发布了其最新机器学习神经网络处理器(ML NPU)。

随着AI技术在智能手机中的应用更加丰富,为了减轻CPU、GPU的计算负担,苹果、华为等均在其芯片中打造了专门的神经网络处理器来处理这些任务。

去年Arm曾推出异构机器学习计算平台Project Trilium,包括Arm ML处理器和Arm的开源神经网络软件框架,据称已经出货超过2.5亿台安卓设备。

Arm新一代CPU/ GPU/AI内核发布,性能猛增,GPU架构三年首更新

Arm对ML NPU进行了许多改进,包括将其能效提升2倍以上,达到5 TOP/W,将内存压缩技术提高3倍,同时其8核版本的性能最高可达32 TOP/s。

结语:Arm发力小内核,或缩小与苹果差距

Arm一连发布新CPU、GPU和NPU IP之举,印证其正在着力为5G、物联网、AI和自动驾驶技术提供更高效低能的加速引擎。尤其是此次推出的全新架构Valhall,带来全新的ISA和计算核心设计,使其与其他GPU供应商采用的设计方法更加相似。

此前无论是苹果A12中的GPU还是高通的Ardreno GPU,均在性能和效率方面领先于Arm的Mali GPU。而此次发布的新一代旗舰IP如果进展顺利,应该能缩短与苹果、高通GPU之间的差距,甚至有望超越高通Ardreno GPU,为2020年问世的一大批智能手机提供更好的体验。

原文来自:Arm社区,Anandtech,The Verge,Techcrunch