外媒眼中的10大AI芯片创企！寒武纪、地平线在列

芯东西（ID：aichip001）
编 | 韦世玮

芯东西2月21日消息，据EE Times报道，EE Times正在对美国、欧洲和亚洲共约60家AI芯片创企进行研究，其中既包括重新设计可编程逻辑和多核设计的公司，也有自研全新体系架构的公司，以及使用神经拟态（类脑）和光学计算等未来技术的芯片公司等。

随着神经网络技术的不断发展，业界对加速AI性能的需求越来越高，世界各地亦涌现出了大量的AI芯片创企，持续研发不同的芯片技术。与此同时，这一行业的爆发也吸引了大量的风险投资资金，从而使行业拥有了研发新型计算架构，以及开拓新技术方向的资本。

基于此，EE Times从这来自三大洲的60家AI芯片公司中，选出了最具代表性和发展潜力的十家。根据这些公司产品的定位和应用范围，主要被用在数据中心、终端和AIoT设备这三大领域。以下内容基于EE Times对这十家芯片创企的介绍编译：

一、数据中心：边缘计算应用广泛

若根据应用范围划分，数据中心也属于边缘计算技术的应用领域之一。

什么是边缘计算？它主要在和生成或收集数据相同的位置（或附近）处理数据，涉及网关或集线器设备，以及可加速单个AI应用程序的本地服务器。

从应用上看，数据中心的服务器还能够用来加速医院或医学研究机构中，X射线或CT扫描的图像分类，或者是从工厂车间接收状态数据并进行处理。

1、Graphcore

总部位于英国布里斯托尔的Graphcore一直受到行业关注。在早期一轮融资中，该公司的估值就已超过10亿美元，成为西方首批AI芯片独角兽之一。

性能方面，该公司的IPU（智能处理单元）芯片拥有大规模并行架构，具有1200多个专用内核，每个内核可运行6个程序线程。

与此同时，它还有大量的片上存储器、数百兆的随机存取存储器（RAM），以及45 TB存储器带宽，能够让整个机器学习模型存储在芯片上。

此外，Graphcore的IPU芯片还可用于戴尔服务器中的边缘计算应用程序。

外媒眼中的10大AI芯片创企！寒武纪、地平线在列

▲Graphcore的IPU芯片

2、Groq

Groq由谷歌原TPU核心团队的8名成员成立，目前该公司已拥有70名员工，并筹集了6700万美元资金。

去年，Groq曾发布一款1000 TOPS的芯片架构，专门针对计算机视觉、机器学习和其他AI相关工作负载的性能需求而设计。同时，它的张量流处理器（TSP）主要面向数据中心应用和自动驾驶汽车领域。现阶段，该器件已在PCIe板上采样。

除此之外，该公司还坚持“以软件为先”，其编译器能处理硬件中的控制功能，例如执行计划等。Groq的软件还可精心编排所有数据流和所需时序，以确保计算不会出现停顿，并在编译时完全可预测延迟、性能和功耗。

3、Cerebras

Cerebras以重振晶圆级芯片计划而知名，该计划曾在1980年代被半导体行业所放弃。

该公司研发了一块面积约为46225平方毫米的巨大芯片，将40万个内核与18 GB内存封装在84个处理器块上，能耗达到15 kW。

虽然这些参数看起来过于庞大，但实际上，Cerebras研发这一芯片的目的是用它来替代数千个GPU的工作。

该公司表示，他们已经解决了以往困扰晶圆级设计的问题，例如良率（绕缺陷走线），并研发了可以抵抗热效应的封装技术。

资金方面，目前Cerebras已经筹集超过2亿美元的资金。与此同时，该公司还透露，他们的机架系统已在少数客户的数据中心里开始运行。

外媒眼中的10大AI芯片创企！寒武纪、地平线在列

▲Cerebras的巨型芯片

4、寒武纪

寒武纪是中国最早的AI芯片创企之一，2016年脱胎于中国科学院，由同样出身于中国科学院的两兄弟创立。

寒武纪认为，CPU和通用GPU（GPGPU）指令集在加速神经网络方面缺乏敏捷性，因此他们开发了自己的指令集架构（ISA）。这是一种集成了标量、矢量、矩阵、逻辑和数据的负载存储架构，还拥有传输和控制指令。

寒武纪的第一个产品Cambricon-1A主要面向智能手机和其他终端设备，如无人机和可穿戴设备。此外，寒武纪还发布了边缘计算芯片思元220，性能为8 TOPS、能耗为10 W，进一步填补该公司在边缘计算产品中的空白。

目前，寒武纪是全球最有价值的AI芯片创企之一，至今已筹集2亿美元资金，市场估值达到25亿美元。

二、终端应用：计算机视觉与自动驾驶为主

“终端”是指网络末端的设备，其收集和处理数据都在同一设备内部。终端的产品范围包括安防摄像机、消费电子产品和家用电器等，以及自动驾驶汽车和智能手机等某些可用作网关或端点的设备。

1、Hailo

Hailo成立于2017年，由以色列国防军精锐情报部门的前任成员在以色列特拉维夫成立。目前，该公司拥有约60名员工，已筹集了2100万美元资金。

据悉，该公司的AI协处理器Hailo-8性能为26 TOPS，能效为2.8 TOPS/W，主要面向ADAS（高级驾驶员辅助系统）和自动驾驶应用而设计。

从结构上看，它混合了内存、控制和计算模块，并通过软件分配相邻的模块来计算神经网络的每一层。同时，Hailo-8芯片将于2020年上半年开始实现量产。

外媒眼中的10大AI芯片创企！寒武纪、地平线在列

▲Hailo的AI协处理器Hailo-8

2、耐能（Kneron）

耐能成立于2015年，总部位于美国圣地亚哥。目前，该公司在圣地亚哥和台湾地区共拥有员工150名，已获资金7300万美元。

据了解，耐能的第一代KL520芯片已被几家公司宣布使用，其2019年也实现了数百万美元的营收成绩。

性能方面，KL520芯片还针对卷积神经网络（CNN）进行了优化，在0.5W（相当于0.6 TOPS/W）下运行的性能为0.3 TOPS。同时，它还能应用于IP安防摄像机中的面部识别、智能门锁和门铃。

耐能表示，他们已开始研发用于人脸识别的神经网络，并将它和IP一同用来开发神经处理单元（NPU）。与此同时，该公司的第二代芯片将于2020年夏天上市，能够加速CNN和递归神经网络（RNN）。

外媒眼中的10大AI芯片创企！寒武纪、地平线在列

▲耐能的KL720芯片

3、Mythic

Mythic在2012年密歇根大学成立，如今位于得克萨斯州奥斯汀市。现阶段，Mythic已筹集了8600万美元资金，将用于开发模拟计算芯片。

该芯片基本采用基于闪存晶体管的内存处理器技术，与CPU和GPU相比，Mythic的芯片在功耗、性能和成本方面均有优势。

实际上，内存处理器并不是什么新鲜事物。但Mythic表示，他们已经研发出一种补偿和校准技术，能够消除噪声并实现可靠的8位计算。

此外，Mythic计划出售独立芯片以及多芯片处理卡。由于该设备可以处理30 FPS的高清视频图像，因此Mythic的主要目标市场之一是安防摄像机，以及用于安防摄像机系统的本地聚合器。

值得一提的是，Mythic的CEO Mike Henry在今年的CES 2020上表示，其芯片将很快进入采样阶段。

4、地平线

地平线成立于2015年，目前已经拥有500多名员工，专利超600项。截止2019年底，该公司已筹集6亿美元资金，市场估值高达30亿美元。

地平线的大脑处理单元（BPU）最初是为计算机视觉应用而设计，其第二代BPU拥有64位多指令多数据（MIMD）内核，能处理所有类型的神经网络，还可通过稀疏神经网络来预测目标的运动和场景解析。

据了解，地平线的第三代BPU将为决策算法、深度学习之外的AI提升加速性能。

目前，地平线拥有两条产品线，分别是面向自动驾驶领域的征程系列，以及面向AIoT领域的旭日系列。

第一代征程和旭日系列处理器于2017年12月推出，第二代基于BPU 2.0的芯片也在2019年发布。据称，征程2.0芯片在2 W功率下能够提供4 TOPS的L3/L4自动驾驶性能，并结合了地平线自身的感知算法，实现90％的核心利用率。

外媒眼中的10大AI芯片创企！寒武纪、地平线在列

▲地平线的征程处理器

三、物联网：AI推理性能与低功耗需求高

这一类别的划分包括具有微控制器计算级别的芯片，它们能够在资源受限的环境中以超低功耗运行。

在这一情况下，终端设备上的AI推理性能就显得十分重要，因为它不仅能降低延迟、节省带宽、帮助保护隐私，同时还能节省数据到云射频（RF）传输过程中的能耗。

1、GreenWaves

GreenWaves成立于2014年，总部位于法国格勒诺布尔，是RISC-V开源生态中最早的芯片供应商之一。

该公司在一个超低功耗机器学习应用处理器中，使用了多个RISC-V内核，用于电池供电的传感设备。此外，GreenWaves还依赖其自定义指令集扩展，以方便DSP操作和实现AI加速的最低功耗。

GreenWaves的第二代产品GAP9使用了10个RISC-V内核。其中，一个内核用作结构控制器，剩余九个内核则组成了计算机群，控制器和集群位于单独的电压和频域，因此它们仅在必要时才消耗功率。

同时，该芯片还采用了最先进的FD-SOI工艺技术，以进一步降低功耗。

据GreenWaves提供的数据，GAP9在160×160幅图像上运行预训练模型MobileNet V1时，通道缩放比例为0.25，仅需12ms。

2、Eta Compute

Eta Compute成立于2015年，在美国和印度共拥有35名员工。目前，该公司已筹集1900万美元资金，产品已进入样品阶段。

Eta Compute为超低功耗物联网设备中的AI处理设计了两个核心，分别为Arm Cortex-M3微控制器内核和一个DSP微处理器。

据了解，这两个核心均使用了Eta Compute的动态电压和频率缩放技术，以尽可能低的功率水平运行，而无需使用锁相环（PLL）。

其AI工作负载在软件的分配下，还可在一个或两个核心上运行。同时，该技术能够以100µW的功率预算，将图像处理和传感器融合。

此外，Eta Compute还针对在ECM3532器件上运行的超低功耗应用，对神经网络进行了优化。

文章来源：EE Times

一、数据中心：边缘计算应用广泛

二、终端应用：计算机视觉与自动驾驶为主

三、物联网：AI推理性能与低功耗需求高

微信扫一扫：

相关推荐