揭秘英特尔第三代至强处理器中的“黑科技”

智东西(公众号:zhidxcom)
文 | 董温淑

智东西7月29日消息,今天,英特尔公司市场营销集团副总裁,中国区数据中心销售总经理陈葆立与智东西等媒体分享了英特尔第三代至强可扩展处理器Cooper Lake、新一代英特尔傲腾持久内存200系列的产品技术性能细节。

6月中旬,英特尔推出一系列面向AI和分析的战略及最新产品组合。其中,第三代至强处理器和傲腾200系列产品是英特尔面向数据中心业务推出的新品。

一、第三代至强处理器:最多支持8插槽,集成多种“黑科技”

第三代至强可扩展处理器专为植入AI的数据密集型服务而设计,有Cooper Lake和Ice Lake两个系列产品。

Cooper Lake处理器支持4~8个处理器插槽,是当前唯一最多可提供8插槽可扩展性的x86平台。Ice Lake处理器支持1~2个处理器插槽。

在运行图像分类处理任务时,相比上一代产品Cascade Lake,Cooper Lake的计算性能可提高1.93倍。

揭秘英特尔第三代至强处理器中的“黑科技”

Cooper Lake处理器采用最新一代傲腾200系列持久内存,并集成英特尔DL Boost深度学习加速、英特尔Speed Select技术等多种“黑科技”。

在DL-Boost深度学习加速方面,第三代至强可扩展处理器采用VNNI指令集,可支持bfloat16数据格式,实现计算效率与精度的结合。

英特尔技术人员称,bfloat16数据格式是在FP32数据格式和INT8数据格式之间取的折衷,能兼顾保存的数据范围和精度,非常适合训练以吞吐量和精度为关键指标的工作负载。

FP32数据格式即每个数据用32比特来存储,其中有8位保存的是指数、有23位是尾数、还有1位是符号位,可以保存较多图片细节。INT8数据格式指每个数据用8比特来存储,这当中有7位是尾数、有一位是符号位,保存的图片细节较少。

相比之下,bfloat16数据格式用16比特来储存每个数据,其中8位存放指数、7位存放尾数、1位是符号位。

根据英特尔官方数据,相较于采用FP32数据格式,采用bfloat16的第三代至强可扩展处理器能将训练性能提高93%、推理性能提高90%。

揭秘英特尔第三代至强处理器中的“黑科技”

随着企业开拓多样化的业务线、面对不同的工作负载,企业通常需要购买和管理多种类型的服务器,这在客观上增加了企业的总体拥有成本。

为解决这一问题,Cooper Lake处理器集成了SST(Speed Select Technology)技术。SST技术是一种功能集合,可通过提供对CPU性能的更多控制,来提高性能和优化总体拥有成本。

揭秘英特尔第三代至强处理器中的“黑科技”

在四路和八路平台上使用第三代英特尔至强可扩展处理器能实现虚拟机密度扩展,可提供高达224个单位节点内核数、高达2.2倍的5年更新性能改进,有助于降低每内核每小时的成本。

二、傲腾200系列持久内存:解内存容量、成本、时延痛点

存储产品方面,英特尔6月份推出傲腾200系列持久内存产品。

与上一代产品傲腾100系列相比,傲腾200系列实现了25%的内存带宽提升。在数据写入方面,与主流NAND SSD相比,傲腾200系列内存能带来225倍的性能提升。

英特尔第三代至强可扩展处理器Cooper Lake搭载了傲腾200系列内存,其内存容量可达到4.5TB。

运作模式方面,傲腾200系列内存提供“App Direct”和“Memory”两种运作模式。

平台/操作系统/App对高速、大容量内存的访问适用“Memory”模式。如果希望数据在内存中得到保留,则可应用“App Direct”模式。

揭秘英特尔第三代至强处理器中的“黑科技”

通过灵活应用上述两种运行模式,傲腾200系列持久内存可满足使用者对内存容量、价格、工作负载性能的不同需求。

结语:英特尔数据中心产品持续发力AI

第三代至强处理器专为深度学习、虚拟机(VM)密度、内存数据库、任务关键型应用及分析密集型工作负载而设计,在深度学习加速、满足企业用户业务多样化需求方面具备优势。

从产品升级的角度来看,英特尔至强平台持续在计算能力上推陈出新。第三代至强处理器在沿用第二代至强支持的DL Boost指令集的前提下,又在数据精度上进行了优化。据悉,目前,英特尔正与生态合作伙伴进行技术方面的配合,推动第三代至强处理器平台结合实际应用。

此外,英特尔更新一代的至强处理器Sapphire Rapids将于2021年推出,也将延续对bfloat16数据格式的支持,让我们拭目以待。