1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

智东西(公众号:zhidxcom)
文 | 心缘

智东西11月6日消息,在北京举办的英特尔FPGA技术大会上,英特尔发布全球最大容量的全新Stratix 10 GX 10M FPGA。

这是全球密度最高的FPGA,拥有1020万个逻辑单元,433亿颗晶体管,现已量产,即日出货。

全新FPGA针对ASIC原型设计与仿真市场,可加快下一代5G、AI、网络ASIC验证与创新。早先多家客户已经收到英特尔Stratix 10 GX 10M FPGA样片。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

英特尔市场营销集团副总裁兼中国区总经理王锐在致辞中表示,加速器市场2021年超过200亿美元,FPGA市场规模2022年预计将突破75亿美元,英特尔FPGA的重大突破、首批10nm Agliex近日已出货,eASIC产品也得到广泛好评。

一、1020万个逻辑单元,全球密度最高的FPGA

全新Stratix 10 GX 10M FPGA是第一款使用嵌入式多芯片互连桥接(EMIB)技术,将两个FPGA构造晶片在逻辑和电气上实现整合的英特尔FPGA。

它基于现有的英特尔Stratix 10 FPGA架构,通过多颗EMIB技术将两个高密度英特尔Stratix 10 GX FPGA核心逻辑晶片进行连接,在两个晶片间形成多达25920个高带宽连接,每个晶片容量为510万个逻辑单元及相应的I/O单元。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

英特尔Stratix 10 GX 10 GM FPGA拥有1020万个逻辑单元,密度约为Stratix 10 GX 1SG280 FPGA的3.7倍,而后者为原英特尔Stratix 10系列中元件密度最高的设备。

另外,相比GX 2800,Stratix 10 GX 10 GM的计算力提升3.7倍,I/O连接扩展2倍,同等容量下功耗降低40%。

正是借助EMIB Chiplet技术将I/O和内存单元连接到FPGA构造晶片,实现多颗晶片单个封装,可将不同节点、供应商、IP进行“任意”集成,以快速推出新FPGA。这使得英特尔Stratix 10 FPGA家族的规模和种类持续扩张。

二、推动大规模ASIC原型设计与仿真

英特尔Stratix 10 GX 10M FPGA是用于此类应用的最新大型FPGA设备,支持仿真与原型设计系统的开发,适用于耗用亿级ASIC门的数字IC设计,可用于下一代5G、AI、网络ASIC验证。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

ASIC原型设计和仿真市场对当前最大容量FPGA的需求格外急切,多家供应商提供商用现成的(COTS)ASIC原型设计与仿真系统。能将当前最大FPGA用于ASIC仿真和原型设计系统中,将给这些供应商带来巨大竞争优势。

包括英特尔在内的很多大型半导体公司都开发了自定义原型设计和仿真系统,并在流片前用这一系统来验证自身最大规模、最复杂、风险最高的ASSP和SoC设计。

ASIC仿真和原型设计系统可帮助设计团队大幅降低设计风险,因此英特尔FPGA十多年来一直被用做很多仿真与原型设计系统的基础设备。

ASIC仿真和原型设计系统支持很多与IC和系统开发相关的工作,包括:

(1)使用真实硬件的算法开发;

(2)芯片制造前的早期SoC软件开发;

(3)RTOS验证;

(4)针对硬件和软件的极端条件测试;

(5)连续设计迭代的回归测试。

由于芯片制造完成后再修复硬件设计缺陷,成本会非常高昂。

针对这一问题,仿真和原型设计系统旨在帮助半导体厂商在芯片制造前,发现和避免代价高昂的软硬件设计缺陷,从而节省数百万美元。

使用最大型FPGA,能在尽可能少的FPGA设备中纳入大型ASIC、ASSP和SoC设计。

三、英特尔FPGA量身定制从端到云加速

英特尔网络和自定义逻辑事业部副总裁兼FPGA和电源产品事业部总经理David Moore也在大会上表示,英特尔FPGA正持续推动工作负载创新。

这一先进的多功能加速器,具有出色的灵活性,可助力打造高度差异化产品,其卓越的硬件可编程性,能满足不断变化的市场要求和标准。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

FPGA可以预处理高量非结构化数据,成为在线加速器;亦可放在CPU旁边协作处理,成为离线加速器,解决从边缘、网络到云端出现的复杂问题。

英特尔网络和自定义逻辑事业部副总裁兼FPGA和电源产品营销总经理Patrick Dorsey也在演讲期间,总结了英特尔FPGA至关重要的六大特点:可编程、并行处理、高性能、灵活性、低延迟、节能。

他表示,应用加速的挑战在于如何解决高效推理、工作负载优化、实时与确定性、灵活性以及开发方面的瓶颈。

FPGA通过加速算法和最大限度减少瓶颈,增强基于CPU的处理。

英特尔FPGA可有效提升每瓦性能,确保英特尔至强处理器内核提供更高的处理性能,可提供高带宽连接与低延迟并行处理,通过FPGA可编程性提供多功能硬件加速,并且打造开发人员平台来帮助开发者更快上市。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

英特尔提供端到端产品组合,允许用户跨领域进行开发。

在边缘计算方面,英特尔面向视觉加速设计了英特尔Arria 10 FPGA,它能支持100多种深度学习网络加速。

边缘加速需要低功耗的引擎,在英特尔CPU、Movidius VPU与FPGA、OpenVINO的加速组合支持下,能从雷达/监控、视觉分析、智能零售、工业IoT等各种智能化场景,实现各种边缘端的计算加速。

在网络方面,无线或网络功能可实现虚拟化(NFV)加速,增强整体网络的能力。对此英特尔打造了FPGA PAC N3000。

数据中心的多功能加速包括网络、存储与安全等基础设施加速和面向AI应用、视频转码应用、搜索等旁路加速,FPGA配合英特尔CPU提供多功能加速的方案已经存在于数据中心,使得云端工作负载可承担多元化工作任务。

面向云和企业应用加速,英特尔推出了FPGA PAC和英特尔PAC Arria 10 GX来加速数据处理能力。

1020万个逻辑单元、433亿颗晶体管!英特尔推全球最大容量FPGA

针对不同用户的需求,英特尔提供包括FPGA可编程加速卡、英特尔至强CPU的加速堆栈、以及应用专家开发的加速IP。

英特尔加速堆栈会支持快速上市的开发人员平台。底层PAC与软件堆栈经过预验证,可广泛应用于各种服务器。在硬件虚拟化层,使用虚拟机基础设施、容器基础设施共同开发和验证。在操作系统,英特尔加速堆栈支持Linux内核认可FPGA计算资源。在编排级管理,有领先的云/数据中心框架支持FPGA计算资源。

英特尔FPGA已经被用于加速5G网络、AI等各种应用。

例如,英特尔FPGA PAC D5005可助力加速深度语音识别。针对吞吐量优化的系统,英特尔FPGA PAC D5005的功耗比GPU低6倍;针对延迟优化的系统,英特尔FPGA PAC D5005的延迟比GPU低29倍,而吞吐量高出58倍。

英特尔FPGA PAC D5005还被用于加速视频转码、图像处理、网络安全、流传输分析以及金融风险与法规管理。

为加速金融应用,英特尔通过Compute Express Link(Link)改进存储与网络,将数据带宽提升4倍;通过高带宽内存,将内存带宽提升512Gbps;并提供250多个高度优化的库函数,从而扩大规模。

面向视觉加速设计的英特尔Arria 10 FPGA也有很多颇有价值的实绩。

比如,埃森哲打造了视频分析服务平台(VASP),利用埃森哲AI功能与英特尔Arria 10 FPGA监控礁石健康与海洋生物。再比如,日本在企业服务器中使用英特尔Arria 10 FPGA加速堆栈,通过地震破坏恢复帮助恢复国家历史古迹。

总而言之,包括FPGA、eASIC、ASIC在内的英特尔一系列自定义逻辑解决方案组合,凭借可编程性、可扩展性、低时延性、高存储容量等特点,不仅提供更多选择以及跨整个产品生命周期的灵活优化,并且有效帮助客户缩短上市时间,降低总拥有成本。

结语:先进技术结合筑成英特尔核心竞争力

英特尔EMIB技术是今日新推出的最大容量FPGA的核心亮点之一。

不过,它只是多项IC工艺技术、制造和封装创新中的一项,用于制造新FPGA的半导体和封装技术,并非只是为了制造全球最大型FPGA。

这些创新技术只是附加值,关键在于,这些技术使得英特尔能通过整合不同的半导体晶片,包括FPGA、ASIC、eASIC结构化ASIC、I/O单元、3D堆叠内存单元和光子器件等,用于将几乎任何类型的设备整合到封装系统(SiP)中,来满足特定客户的不同需求。

英特尔在众多半导体公司中持续保持领先性的一大利器,也正是基于这些先进技术的彼此结合。