英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

智东西(公众号:zhidxcom)
文 | 心缘

智东西4月3日消息,今日,英特尔正式发布Agilex FPGA,这一全新FPGA产品与此前英特尔的Stratix系列大不相同,为实现超高敏捷性和灵活性做了大量创新。

英特尔可编程解决方案事业部首席产品营销官Patrick Dorsey表示,这是首款提供广泛内存支持,且可无缝连接到英特尔至强可扩展处理器的内存一致性加速器,也是首款提供从100GB到1TB灵活性和敏捷性的FPGA。

英特尔Agilex FPGA家族分为通用型的F系列、适用于高性能处理器接口和大带宽应用的I系列和适用于计算密集型应用的M系列。其软件已能使用,首款设备将于今年9月上市。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

总体来看,英特尔Agilex FPGA包含如下特性:

1、首款集英特尔各创新技术于一体的FPGA:10nm制程工艺、3D集成、英特尔至强(XEON)可扩展处理器,具有内存一致性(CXL)、112G XCVR、PCIe Gen5、eASIC设备、One API、英特尔Optane DC Persistent Memory支持。

2、任意集成使得FPGA能根据具体应用进行优化和定制,实现更高程度的灵活性和敏捷性。

3、适用于边缘计算、嵌入式、网络(5G/NFV)和数据中心等革命性应用。

另外,Patrick Dorsey还透露,Agilex将被应用于下一代的可编程加速卡,并且英特尔将在今年晚些时候向市场披露其FPGA产品路线图。

一、英特尔自研技术的集大成者

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

作为面向数据领域的FPGA,Agilex有三大特点:处理、存储和移动。

在数据处理方面,Agilex采用英特尔10nm制程工艺和英特尔自研的第2代Hyperflex架构,与英特尔Stratix 10 FPGA相比,性能最高提升40%,能耗最高降低40%,采用FP16配置时DSP性能高达40 TFLOPS。

在数据存储方面,Agilex既有传统的经典数据存储DDR5,也有高带宽存储HBM,并有Optane DC Persistent memory支持。

另外,Agilex FPGA通过计算快速链接(CXL)和至强处理器之间建立起连接,使得它们之间足以建立一种非常紧密的内存一致性,可以实现数据共享,拥有更低延迟和更大内存空间,能够加快包括数据分析、数据库加速和功能即服务在内的各种工作复杂的处理速度。

英特尔可编程解决方案事业部首席产品营销官Patrick Dorsey表示,目前为止,这是第一个也是唯一一个支持这种连接的解决方案。

在数据移动方面,Agilex和英特尔至强处理器间稳定的CXL运行在PCIe GEN5上面,可为400G网络、边缘分析、数据中心工作负载等应用提供高带宽。Patrick Dorsey称,Agilex的数据收发速率可达112G,是目前行业第一。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

二、任意异构3D集成

所谓任意异构3D集成(Any-to-Any Heterogenous 3D Integration),指的是英特尔根据客户或市场的需求,将不同制程工艺、不同功能的小芯片(Chiplet)封装在一起,快速供给客户需求。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

如图中间是FPGA,在它的旁边有一些跟计算有关的接口、存储,客户有需要时就可以把它集成到FPGA上。这使得客户进行数据处理、数据分析的速度加快一倍,更加敏捷、快速和灵活,开发成本也会降低。

当然,异构3D集成的实现,离不开英特尔的“胶水封装”黑科技——嵌入式多芯片互连桥接(EMIB)。这一技术使得英特尔可在同一片基板上连接各种不同类型的小芯片,实现芯片间3D封装互联和无损性能。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

去年英特尔收购了一个公司eASIC,这家公司能快速生产ASIC芯片,使得TTM性能和成本均得到优化。收购eASIC后,英特尔能够按照客户要求高效实现模组定制化或者优化。

不止于此,因为英特尔自己本身也生产ASIC芯片的,又收购了eASIC,使得英特尔有能力可以非常快地来生产FPGA并对其进行优化,并可将二者结合在一起,可在产品的这个生命周期进行灵活优化,同时英特尔也生产IP硬件,对客户来讲非常方便。

三、强调AI应用的加速器

英特尔很多产品都面向AI,英特尔Agilex FPGA与英特尔至强(XEON)、酷睿(CORE)、Nervana、Movidius、Atom系列产品均互补,可实现高达40 TFLOPS的FP 16性能和高达92 TOPS的INT8性能,可配置FP32、BFLOAT 16、 FP16、INT2转INT8等不同DSP。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

其中,只有FPGA支持硬件化的BFLOAT16 & FP16开放式标准,此前已经被谷歌TPU采用。

英特尔还向所有开发人员提供Agilex FPGA开发者工具,专为硬件开发人员打造的Quartus Prime设计工具和为软件开发人员打造的One API。

Quartus Prime可将内存利用率提高15%,编译时间缩短30%,新的工作流和可用性功能提高设计融合速度。

One API提供单一源、异构编程环境,支持常见的性能库API,FPGA支持包括英特尔VTune放大器、英特尔Advisor在内的英特尔软件开发工具。

当前,英特尔软件工具已经可以使用,开发者可以利用这些工具开发出自己的FPGA。Patrick Dorsey表示,其首款设备将于今年9月上市。

四、三大适用市场:云、5G和边缘

到2023年,硅潜在市场规模将超过200亿美元。现在市场发展飞快,英特尔每个客户手上都有海量的数据亟待处理,以促进产品的创新和新兴业务的应用。不同客户面临的问题不同,很难统一每个所需要采用的应用。

英特尔认为客户需要更多定制化、个性化的解决方案,Agilex就是能为客户带来这些定制化解决方案的平台。对此,英特尔将其Agilex主要面向的市场分为三类:嵌入式/边缘,通信基础设施,云/企业。

在嵌入式/边缘,很多客户面临如何将实时数据收集和分析的问题,需要针对当下正在发生的事件、相关的信息进行实时反应,做出实时分析处理。

网络正在进行改变,从云到edge方面需要网络速度非常高,云服务供应商对网络有不同想法,在落实时可能会遇到困难,而通过FPGA,可以让他们能在网络方面实现创新的想法。

数据中心最关注的往通常是功率和总拥有成本(TCO),往往希望同样配置下做更多事,以降低成本。它和之前提到的网络的工作负载不同,是通过与加速器共享内存,使得效率更高。

据介绍,Agilex是首款提供广泛内存支持,且可无缝连接到英特尔至强可扩展处理器的FPGA。

英特尔推全新Agilex FPGA:采用10nm制程,数据收发速率达112G

另外一个和英特尔FPGA产品契合的市场是5G。过去的无线市场往往是由无线硬件组成,现在越来越多跟数据相关,客户希望能很快开始使用5G,然后随着时间推移,一边使用一边优化。

对此,英特尔提供自定义逻辑连续体(customer logic continuum),包括FPGA灵活性、快速优化英特尔eASIC设备、全方位自定义ASIC优化和根据应用选择芯片。Patrick Dorsey表示只有英特尔提供以上所有自定义选项。

结语:Agilex将被应用于下一代的可编程加速卡

不同于此前英特尔Stratix系列,Agilex是全面借助英特尔自身能力的创新FPGA产品,其内置的基础架构、至强处理器、GPU、处理技术、3D封装技术、软件等均来自英特尔。

“现在在我们的研发部门有超过10万人,”英特尔可编程解决方案事业部首席产品营销官Patrick Dorsey说,“接下来,公司会充分利用这项技术,在数据移动、数据存储、数据处理方面迈向下一个台阶。简单来说,我们会用Agilex会做我们下一代的可编程加速卡N3000。”

此外,Patrick Dorsey还在采访中透露,今年晚些时候,英特尔将会向市场披露其FPGA产品路线图。