造出世界最大芯片，AI芯片明星独角兽再获2.5亿美元融资

芯东西（公众号：aichip001）
编译 | 高歌
编辑 | Panken

芯东西11月11日报道，曾造出世界最大芯片的美国AI芯片明星创企Cerebras Systems，最新宣布完成2.5亿美元（约合16亿人民币）F轮融资。

此次融资由Alphawave Ventures和阿布扎比增长基金（ADG）领投。截至本轮融资，Cerebras的融资总额已达7.2亿美元（约合46亿人民币），公司估值超过40亿美元（约合256亿人民币）。

造出世界最大芯片，AI芯片明星独角兽再获2.5亿美元融资 ▲Cerebras Systems WSE处理器

2019年8月，Cerebras的首颗晶圆级芯片WSE一问世便轰动全球科技圈，它由一整片晶圆制成，在46225mm²面积上集成了1.2万亿个晶体管。其2021年推出的二代WSE-2更进一步，采用7nm制程，创下集成2.6万亿个晶体管的新纪录。

相比之下，被业界视作云端AI芯片标杆的英伟达A100 GPU，同样采用7nm制程，总共有540亿个晶体管。

接下来，Cerebras计划将此次融资用于扩大其全球业务和工程师团队，以及设计下一代基于台积电5nm节点的处理器。

一、创业伙伴再上路，投资人称正在重新定义AI的可能性

Cerebras Systems位于美国加利福尼亚州，由Andrew Feldman、Gary Lauterbach等人创建于2015年。

Andrew Feldman和Gary Lauterbach分别是Cerebras Systems的首席执行官和首席技术官，两人的合作时间已经超过12年。

Andrew Feldman有着斯坦福大学的MBA学位，曾多次作为公司高管完成了收购和上市。Gary Lauterbach则是行业中著名的计算机架构师，曾担任SPARC Ⅲ和UltraSPARC Ⅳ微处理器的首席架构师。

2007年，Andrew Feldman和Gary Lauterbach就一起创办了微型服务器公司SeaMicro。2012年，SeaMicro被AMD以3.34亿美元收购，两人也一起加入了AMD。Andrew Feldman在AMD做了两年半的副总裁。

造出世界最大芯片，AI芯片明星独角兽再获2.5亿美元融资 ▲Cerebras Systems首席执行官Andrew Feldman（左）和首席技术官Gary Lauterbach（右）

Cerebras Systems创建至今已完成了6轮融资，总金额达7.2亿美元。早在2016年，Cerebras Systems完成了第一笔6450万美元的融资；次年1月，Cerebras Systems拿下2500万美元的B轮融资；6个月后，再次筹集6000万美元；2018年11月，完成8800万美元的D轮融资。

随着不断地融资，Cerebras Systems也从价值2.45亿美元的公司成为了新的AI芯片独角兽。

2019年，Cerebras Systems完成了E轮融资，公司估值约为24亿美元。如今，新的F轮融资为该公司又筹集了2.5亿美元的资金，而这相当于Cerebras Systems大约6%的股份，其估值已超过40亿美元。

据科技媒体AnandTech报道，这2.5亿美元的融资将会支撑Cerebras未来2-3年的布局，包括在5nm节点上设计芯片和新的内存扩展方案等。目前Cerebras Systems在美国桑尼维尔、美国圣地亚哥、加拿大多伦多、日本东京等地拥有约400名员工，并希望到2022年底扩大到600人，主要增加工程师人数并专注于产品的全栈开发。

Alphawave Ventures的联合创始人兼董事长Rick Gerson称：“Cerebras Systems正在重新定义人工智能的可能性，并在加快制药和生命科学等几个领域的创新方面有着一流的表现。我们很自豪能与Andrew和Cerebras的团队合作，支持他们将高性能AI计算引入全球新市场和地区。”

二、二代处理器具有2.6万亿个晶体管，性能提升超1倍

2019年，Cerebras Systems发布了其第一代WSE芯片，这款芯片具有40万个内核和1.2万亿个晶体管，使用台积电16nm工艺制程。

今年4月，Cerebras Systems推出了第二代处理器WSE-2，具有破纪录的2.6万亿个晶体管（市场上最大的GPU只有540亿个晶体管）和85万颗AI优化内核，大小类似餐盘，采用台积电的7nm工艺。相比于第一代WSE处理器，WSE-2在AI内核数量、晶体管数量、密度、内存带宽等参数上都有着一倍以上的提升。

造出世界最大芯片，AI芯片明星独角兽再获2.5亿美元融资 ▲Cerebras两代处理器参数对比（来源：AnandTech）

和当下的很多芯片不同，Cerebras Systems的WSE-1和WSE-2并不是用晶圆上的一小部分制成，而是将整个直径为300mm的晶圆加工成1颗芯片。虽然这种芯片体积较大，但是由于晶体管和内核的数量、互连优势，相比同等算力的GPU集群，其功耗和所占空间都更小。

传统的GPU集群如果想要达到同等算力，需要数十个几架承载数百甚至数千个GPU芯片。而CS-2只有26英寸高，是标准数据中心机架的1/3。

Cerebras Systems的技术也在医药、天文、科研等多个领域发挥出了作用。

无论是美国阿贡国家实验室、劳伦斯利弗莫尔国家实验室、匹兹堡超算中心、爱丁堡大学超算中心等科研机构还是葛兰素史克、东京电子器件等厂商都成为了Cerebras Systems的忠实客户。

三、参数规模提升100倍，还在云端提供深度学习服务

今年8月24日，Cerebras Systems还推出了世界上首个具备脑规模的AI解决方案。

人脑包含约100万亿个突触结构，而此前最大的人工智能硬件集群大约只有1万亿参数，类似于同等数量的突触，仅有人脑规模的1%。而Cerebras Systems单一的CS-2支持超过120万亿参数，在规模上达到了人脑水平，推动了AI神经网络技术的发展。

阿贡国家实验室副主任Rick Stevens谈道：“Cerebras 的发明将提高100倍的参数容量，它有可能改变行业。我们将首次能够探索大脑大小的模型，开辟了广阔的研究和洞察的新途径。”

该解决方案包括四项核心技术，代号分别为Weight Streaming、MemoryX、SwarmX和Sparsity。

Weight Streaming可以让AI模型参数存储在芯片外，同时提供与芯片相同的训练和推理性能的能力，简化了工作负载分配模型。

MemoryX是一种新的内存扩展技术，可实现2.4 PTAB的高性能内存，支持120万亿的参数模型。

SwarmX是一种高性能、AI优化的通信互连结构，可以互连多达1.63亿个AI内核，跨越192个CS-2系统协同工作，训练单个神经网络。

Sparsity可以让用户选择模型的重量稀疏程度，减少模型处理所需的FLOP算力和时间。

9月16日，美国深度学习云服务商Cirrascale Cloud Services宣布采用CS-2系统和WSE-2处理器。

在其应用中，8GPU服务器比CS-2系统训练自然语言处理NLP BERT模型的时间慢9.5倍。而在训练精度上，用户需要超过120个GPU才能匹配单个CS-2系统的训练精度。

造出世界最大芯片，AI芯片明星独角兽再获2.5亿美元融资 ▲Cerebras Systems系统在机房中

结语：Cerebras Systems开拓巨型芯片路线获认可

需要指出的是，Cerebras Systems的WSE系列芯片并非单纯的放大芯片尺寸。大尺寸芯片需要芯片企业在互连、芯片封装、散热等方面都有着独特的技术和解决方案，这些技术方案也体现在了Cerebras Systems脑规模AI解决方案中。

虽然其芯片的尺寸较大，无法用于PC、移动设备等领域，但Cerebras Systems也向我们展示了巨型芯片的广阔应用前景，其产品可以在超算、云端等机构或企业的方案占据一席之地。而新一轮的融资代表了资本对这一技术路线的认可。

来源：Cerebras Systems、AnandTech

一、创业伙伴再上路，投资人称正在重新定义AI的可能性

二、二代处理器具有2.6万亿个晶体管，性能提升超1倍

三、参数规模提升100倍，还在云端提供深度学习服务

结语：Cerebras Systems开拓巨型芯片路线获认可

相关推荐