最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

芯东西(公众号:aichip001)
编译 |  ZeR0
编辑 |  漠影

芯东西11月11日报道,今日凌晨,AMD推出其第四代EPYC(霄龙)服务器CPU “Genoa”,这也是业界首款用于数据中心的5nm x86 CPU。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

新一代EPYC处理器采用Zen 4微架构,核心数最高达96个,时钟速度高达4.4GHz,成为数据中心中首款支持DDR5、PCIe 5.0和CXL 1.1的x86 CPU。其中,旗舰级96核192线程EPYC 9654售价11805美元。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

“数据中心代表着AMD最大的增长机会和最具战略意义的优先事项。”AMD董事长兼CEO苏姿丰说,AMD已建立业界最佳的数据中心CPU路线图,第四代EPYC处理器在性能和能效上均显著提升,这对企业和云数据中心来说,意味着更低的资本支出、运营成本和总拥有成本。

据AMD披露,第四代EPYC将被引入谷歌云计算引擎,微软适用于高性能计算的新虚拟机(VM)预览版也将采用第四代EPYC。甲骨文最新的云基础设施(OCI)E5计算实例同样由第四代EPYC提供支持。

AMD还展示了第四代EPYC与英特尔40核Xeon Platinum 8380服务器CPU的多项内部基准测试数据对比,性能提升优势明显。不过最新EPYC真正的竞争对手英特尔Sapphire Rapids,预计要到将在明年1月正式登场。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

一、5年突飞猛进,AMD要重现服务器CPU辉煌

AMD的服务器业务曾在2009年黯然止步,又于2017年卷土重来。

2003年,凭借K8架构,AMD的皓龙(Opteron)处理器首次进入主流服务器市场。该芯片是AMD第一款可执行x86-64指令集的处理器,且在能效表现上赢过英特尔至强。

原本Opteron盛极一时,压着英特尔打了好几年,结果2006年英特尔重整旗鼓启用Tick-Tock战略之时,AMD自己反而掉了链子——新款Opteron四核K10爆发了会造成系统死当的TLB臭虫事件,致使企业对Opteron处理器失去信任。

另一方面,2006年,AMD斥资54亿美元收购老牌GPU供应商ATI。但烧钱容易赚钱难,此后AMD陷入了三年的财务困难期,到2009年服务器CPU已经被英特尔打得落花流水。

失势的AMD,数据中心业务从此一蹶不振。直到5年,AMD历史上第一位女性CEO——华裔女工程师苏姿丰临危受命掌舵AMD,此后逐步带领AMD重新“杀”回数据中心市场。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

2017年发布的AMD第一代EPYC服务器处理器“Naples”只是热身,随后AMD在制程工艺选择上联手台积电,实现了对英特尔的“超车”。当英特尔还在为实现10nm而努力,2019年发布的第二代EPYC处理器“Rome”和2021年发布的第三代EPYC处理器“Milan”都已经用上了台积电7nm。

根据知名市研公司IDC的数据,AMD用于云服务的x86芯片市场份额从2016年的0%增长到2021年的约29%。

Milan扭转形势后,AMD乘胜追击,今日推出采用5nm工艺的新一代EPYC处理器“Genoa”,并将于明年推出后续衍生产品“Genoa-X”和“Bergamo”和“Siena”。

迄今英特尔仍是服务器CPU市场的绝对王者,但竞争压力正不断攀升。势头渐盛的劲敌AMD,虎视眈眈地试图夺去更多市场。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软▲AMD四代EPYC处理器参数对比(图源:The next platform)

二、5nm96个内核、Chiplet架构

AMD EPYC处理器的命名中,每个数字都有不同的含义。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

第一位数字代表产品系列,第二位数字代表核心数(3代表32核,5代表64核,6代表84~96核),第三位数字是对给定核心数的产品系列的相对性能的评估,第四个数字表示第几代。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

AMD最初推出18个SKU(14个双插槽、4个单插槽),分为三大类,即核心性能、核心密度、平衡和优化。核心性能类核心数从16到48个;核心密度类的核心数从48到96个;平衡和优化类有16~32个核心的选项可供选择。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

根据外媒Tom’s Hardware拍摄的照片,下图最左侧的新一代AMD EPYC处理器Genoa芯片远大于它右边的上一代Milan芯片。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

新一代AMD EPYC处理器采用台积电5nm工艺和Zen 4内核,最多拥有96个核心,并引入了对DDR5内存、PCIe Gen 5、AVX-512、VNNI等的支持。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

与之前第三代Milan采用的Zen 3核心相比,Zen 4核心提供的每时钟指令(IPC)增加了14%。此前Zen 2的IPC比Zen 1高15%,Zen 3的IPC比 Zen 2高19%。而英特尔至强在很长一段时间内的IPC升级幅度在5%~10%之间。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

Zen 4将每个内核的L2缓存增加1倍至1MB。32MB L3缓存在给定CCD的8个核心之间共享。

显著提升核心数量和性能的代价,是随之上涨的能耗。第四代EPYC处理器旗舰机型默认峰值TDP(散热设计功耗)为360W,是迄今为止所有x86服务器处理器中最高的。如果客户想实现最高性能,预计功耗达到400W。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

为了将更多内核塞进一个封装中,AMD继续启用Chiplet设计。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

上一代Milan最多有8个CCD(Core-Complex Die),第四代Genoa将CCD数量增至12个。每个CCD有8个核心,由2个CCX组成,每个CCX包含4个核心。因此Genoa最多可提供96个核心。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

每个CCD上有两个Infinity Fabric 3.0 GMI3端口,但在配备8个或12个CCD的Genoa配置中,每个CCD上仅使用一个GMI3端口。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

Infinity Fabric和原始PCIe的I/O SerDes以32Gb/s通道速度运行,这比Milan使用的Infinity Fabric 2.0链路的18Gb/s通道速度快78%。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

上一代Milan采用的I/O芯片是由格芯制造,新一代Genoa I/O芯片转向了台积电代工,采用6nm工艺制造,支持12通道DDR5内存的传输速率可达到4800MT/s,每个插槽最高6TB,理论峰值内存带宽为460GB/s。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

Genoa的接口数增至128个PCIe 5.0 I/O连接通道,通道混合使用,称为P和G选项,其中P仅运行PCIe,G可以运行Infinity Fabric 3.0协议。P链路有12个通道,3Link配置中有160个通道,4Link配置中有128条通道。支持CXL 1.1协议的64个PCIe 5.0通道最多可支持4 x16设备。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

Genoa也换上DDR5内存,其峰值数据速率能达到8.4Gbps。初版Genoa的DDR5数据速率是4.8Gbps。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

DDR5设备的延迟约为45ns,DDR4设备的延迟约为35ns。Genoa的SoC内存延迟约为73ns,上一代Milan约为70ns。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

同时,为满足客户对更大内存工作负载容量的需求,第四代AMD EPYC处理器支持CXL 1.1+进行内存扩展,“+”代表支持某些CXL 2.0的功能。AMD还为开箱即用的内存扩展模块扩展了用于机密计算的内存加密技术SEV-SNP。

通过“Security by Design”体系,AMD可在x86 CPU中进一步提供更强的安全功能。第四代EPYC处理器系列增强了AMD Infinity Guard,这是一套提供物理层和虚拟层保护的先进功能集。与前代产品相比,第四代EPYC处理器的加密密钥数量是其2倍。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

三、横向对比40核第三代至强,多项测试性能翻倍

AMD提供了对新一代EPYC处理器和上一代英特尔至强(Xeon)进行的各种内部基准测试数据,比较的是市面上已有的Xeon Gold和Platinum处理器。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

使用SPECrate 2017整数吞吐量测试,AMD声称在相同核心数配置中比第三代至强竞品的性能提升44~45%。EPYC 9474F比Xeon Platinum 8380多了8个核心。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

在SPECrate 2017浮点数吞吐量基准测试中,同核数或相近核数下,第四代EPYC性能比第三代至强高73%~81%。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

应用到Black-Scholes期权定价模型上,相较英特尔40核Xeon Platinum 8380,AMD 64核EPYC 9554的性能提高了1.1倍。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

在Autodesk 3D渲染中,相比40核Xeon Platinum 8380,AMD 96核EPYC 9654的渲染速度提升了1.4倍。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

面向高性能计算工作负载,同为32核的情况下,AMD第四代EPYC展示了2倍的天气预报性能、1.6倍的计算流体动力学性能性能和1.7倍的有限元分析性能。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

最后,AMD称相比第三代至强,实现相同性能的情况下,EPYC处理器可减少59%的服务器数量、47%的功耗。

最高96核!AMD最强数据中心CPU炸场,客户包括谷歌微软

结语:服务器CPU之战变得更加激烈

近年来,云计算与数据中心成为半导体最有前景的增长领域之一,服务器CPU的竞争正变得愈发激烈。

第四代EPYC服务器CPU发布后,AMD OEM合作伙伴首批EPYC系统从今天开始接受订购,系统最早在12月进入客户手中。

待到明年1月,第四代EPYC将与其最大竞争对手英特尔第四代可扩展处理器Sapphire Rapids进行正面较量。届时服务器CPU之战将进入新的阶段。

来源:The Next Platform,Hot Hardware,Tom’s Hardware