芯东西(ID:aichip001)
编 | 韦世玮

芯东西2月21日消息,据EE Times报道,EE Times正在对美国、欧洲和亚洲共约60家AI芯片创企进行研究,其中既包括重新设计可编程逻辑和多核设计的公司,也有自研全新体系架构的公司,以及使用神经拟态(类脑)和光学计算等未来技术的芯片公司等。

随着神经网络技术的不断发展,业界对加速AI性能的需求越来越高,世界各地亦涌现出了大量的AI芯片创企,持续研发不同的芯片技术。与此同时,这一行业的爆发也吸引了大量的风险投资资金,从而使行业拥有了研发新型计算架构,以及开拓新技术方向的资本。

基于此,EE Times从这来自三大洲的60家AI芯片公司中,选出了最具代表性和发展潜力的十家。根据这些公司产品的定位和应用范围,主要被用在数据中心、终端和AIoT设备这三大领域。以下内容基于EE Times对这十家芯片创企的介绍编译:

一、数据中心:边缘计算应用广泛

若根据应用范围划分,数据中心也属于边缘计算技术的应用领域之一。

什么是边缘计算?它主要在和生成或收集数据相同的位置(或附近)处理数据,涉及网关或集线器设备,以及可加速单个AI应用程序的本地服务器。

从应用上看,数据中心的服务器还能够用来加速医院或医学研究机构中,X射线或CT扫描的图像分类,或者是从工厂车间接收状态数据并进行处理。

1、Graphcore

总部位于英国布里斯托尔的Graphcore一直受到行业关注。在早期一轮融资中,该公司的估值就已超过10亿美元,成为西方首批AI芯片独角兽之一。

性能方面,该公司的IPU(智能处理单元)芯片拥有大规模并行架构,具有1200多个专用内核,每个内核可运行6个程序线程。

与此同时,它还有大量的片上存储器、数百兆的随机存取存储器(RAM),以及45 TB存储器带宽,能够让整个机器学习模型存储在芯片上。

此外,Graphcore的IPU芯片还可用于戴尔服务器中的边缘计算应用程序。

外媒眼中的10大AI芯片创企!寒武纪、地平线在列

▲Graphcore的IPU芯片

2、Groq

Groq由谷歌原TPU核心团队的8名成员成立,目前该公司已拥有70名员工,并筹集了6700万美元资金。

去年,Groq曾发布一款1000 TOPS的芯片架构,专门针对计算机视觉、机器学习和其他AI相关工作负载的性能需求而设计。同时,它的张量流处理器(TSP)主要面向数据中心应用和自动驾驶汽车领域。现阶段,该器件已在PCIe板上采样。

除此之外,该公司还坚持“以软件为先”,其编译器能处理硬件中的控制功能,例如执行计划等。Groq的软件还可精心编排所有数据流和所需时序,以确保计算不会出现停顿,并在编译时完全可预测延迟、性能和功耗。

3、Cerebras

Cerebras以重振晶圆级芯片计划而知名,该计划曾在1980年代被半导体行业所放弃。

该公司研发了一块面积约为46225平方毫米的巨大芯片,将40万个内核与18 GB内存封装在84个处理器块上,能耗达到15 kW。

虽然这些参数看起来过于庞大,但实际上,Cerebras研发这一芯片的目的是用它来替代数千个GPU的工作。

该公司表示,他们已经解决了以往困扰晶圆级设计的问题,例如良率(绕缺陷走线),并研发了可以抵抗热效应的封装技术。

资金方面,目前Cerebras已经筹集超过2亿美元的资金。与此同时,该公司还透露,他们的机架系统已在少数客户的数据中心里开始运行。

外媒眼中的10大AI芯片创企!寒武纪、地平线在列

▲Cerebras的巨型芯片

4、寒武纪

寒武纪是中国最早的AI芯片创企之一,2016年脱胎于中国科学院,由同样出身于中国科学院的两兄弟创立。

寒武纪认为,CPU和通用GPU(GPGPU)指令集在加速神经网络方面缺乏敏捷性,因此他们开发了自己的指令集架构(ISA)。这是一种集成了标量、矢量、矩阵、逻辑和数据的负载存储架构,还拥有传输和控制指令。

寒武纪的第一个产品Cambricon-1A主要面向智能手机和其他终端设备,如无人机和可穿戴设备。此外,寒武纪还发布了边缘计算芯片思元220,性能为8 TOPS、能耗为10 W,进一步填补该公司在边缘计算产品中的空白。

目前,寒武纪是全球最有价值的AI芯片创企之一,至今已筹集2亿美元资金,市场估值达到25亿美元。

二、终端应用:计算机视觉与自动驾驶为主

“终端”是指网络末端的设备,其收集和处理数据都在同一设备内部。终端的产品范围包括安防摄像机、消费电子产品和家用电器等,以及自动驾驶汽车和智能手机等某些可用作网关或端点的设备。

1、Hailo

Hailo成立于2017年,由以色列国防军精锐情报部门的前任成员在以色列特拉维夫成立。目前,该公司拥有约60名员工,已筹集了2100万美元资金。

据悉,该公司的AI协处理器Hailo-8性能为26 TOPS,能效为2.8 TOPS/W,主要面向ADAS(高级驾驶员辅助系统)和自动驾驶应用而设计。

从结构上看,它混合了内存、控制和计算模块,并通过软件分配相邻的模块来计算神经网络的每一层。同时,Hailo-8芯片将于2020年上半年开始实现量产。

外媒眼中的10大AI芯片创企!寒武纪、地平线在列

▲Hailo的AI协处理器Hailo-8

2、耐能(Kneron)

耐能成立于2015年,总部位于美国圣地亚哥。目前,该公司在圣地亚哥和台湾地区共拥有员工150名,已获资金7300万美元。

据了解,耐能的第一代KL520芯片已被几家公司宣布使用,其2019年也实现了数百万美元的营收成绩。

性能方面,KL520芯片还针对卷积神经网络(CNN)进行了优化,在0.5W(相当于0.6 TOPS/W)下运行的性能为0.3 TOPS。同时,它还能应用于IP安防摄像机中的面部识别、智能门锁和门铃。

耐能表示,他们已开始研发用于人脸识别的神经网络,并将它和IP一同用来开发神经处理单元(NPU)。与此同时,该公司的第二代芯片将于2020年夏天上市,能够加速CNN和递归神经网络(RNN)。

外媒眼中的10大AI芯片创企!寒武纪、地平线在列

▲耐能的KL720芯片

3、Mythic

Mythic在2012年密歇根大学成立,如今位于得克萨斯州奥斯汀市。现阶段,Mythic已筹集了8600万美元资金,将用于开发模拟计算芯片。

该芯片基本采用基于闪存晶体管的内存处理器技术,与CPU和GPU相比,Mythic的芯片在功耗、性能和成本方面均有优势。

实际上,内存处理器并不是什么新鲜事物。但Mythic表示,他们已经研发出一种补偿和校准技术,能够消除噪声并实现可靠的8位计算。

此外,Mythic计划出售独立芯片以及多芯片处理卡。由于该设备可以处理30 FPS的高清视频图像,因此Mythic的主要目标市场之一是安防摄像机,以及用于安防摄像机系统的本地聚合器。

值得一提的是,Mythic的CEO Mike Henry在今年的CES 2020上表示,其芯片将很快进入采样阶段。

4、地平线

地平线成立于2015年,目前已经拥有500多名员工,专利超600项。截止2019年底,该公司已筹集6亿美元资金,市场估值高达30亿美元。

地平线的大脑处理单元(BPU)最初是为计算机视觉应用而设计,其第二代BPU拥有64位多指令多数据(MIMD)内核,能处理所有类型的神经网络,还可通过稀疏神经网络来预测目标的运动和场景解析。

据了解,地平线的第三代BPU将为决策算法、深度学习之外的AI提升加速性能。

目前,地平线拥有两条产品线,分别是面向自动驾驶领域的征程系列,以及面向AIoT领域的旭日系列。

第一代征程和旭日系列处理器于2017年12月推出,第二代基于BPU 2.0的芯片也在2019年发布。据称,征程2.0芯片在2 W功率下能够提供4 TOPS的L3/L4自动驾驶性能,并结合了地平线自身的感知算法,实现90%的核心利用率。

外媒眼中的10大AI芯片创企!寒武纪、地平线在列

▲地平线的征程处理器

三、物联网:AI推理性能与低功耗需求高

这一类别的划分包括具有微控制器计算级别的芯片,它们能够在资源受限的环境中以超低功耗运行。

在这一情况下,终端设备上的AI推理性能就显得十分重要,因为它不仅能降低延迟、节省带宽、帮助保护隐私,同时还能节省数据到云射频(RF)传输过程中的能耗。

1、GreenWaves

GreenWaves成立于2014年,总部位于法国格勒诺布尔,是RISC-V开源生态中最早的芯片供应商之一。

该公司在一个超低功耗机器学习应用处理器中,使用了多个RISC-V内核,用于电池供电的传感设备。此外,GreenWaves还依赖其自定义指令集扩展,以方便DSP操作和实现AI加速的最低功耗。

GreenWaves的第二代产品GAP9使用了10个RISC-V内核。其中,一个内核用作结构控制器,剩余九个内核则组成了计算机群,控制器和集群位于单独的电压和频域,因此它们仅在必要时才消耗功率。

同时,该芯片还采用了最先进的FD-SOI工艺技术,以进一步降低功耗。

据GreenWaves提供的数据,GAP9在160×160幅图像上运行预训练模型MobileNet V1时,通道缩放比例为0.25,仅需12ms。

2、Eta Compute

Eta Compute成立于2015年,在美国和印度共拥有35名员工。目前,该公司已筹集1900万美元资金,产品已进入样品阶段。

Eta Compute为超低功耗物联网设备中的AI处理设计了两个核心,分别为Arm Cortex-M3微控制器内核和一个DSP微处理器。

据了解,这两个核心均使用了Eta Compute的动态电压和频率缩放技术,以尽可能低的功率水平运行,而无需使用锁相环(PLL)。

其AI工作负载在软件的分配下,还可在一个或两个核心上运行。同时,该技术能够以100µW的功率预算,将图像处理和传感器融合。

此外,Eta Compute还针对在ECM3532器件上运行的超低功耗应用,对神经网络进行了优化。

文章来源:EE Times