Cerebras推出“巨芯”二代:采用台积电7nm制程,和餐盘差不多大

芯东西(公众号:aichip001)
编译 |  高歌
编辑 |  温淑

芯东西4月21日消息,美国硅谷创企Cerebras Systems推出了其新的Wafer Scale Engine 2(WSE-2)处理器,该处理器为超级计算任务而构建,具有破纪录的2.6万亿个晶体管(市场上最大的GPU只有540亿个晶体管)和85万颗AI优化内核,大小类似餐盘,采用台积电的7nm工艺。

这是Cerebras第二次使用整个300mm晶圆制造单颗芯片。这么大的晶圆一般会被切割成数百个独立芯片,Cerebras却将其制成一个芯片。在庞大的体积之下,这种芯片相比同等算力的GPU集群,功耗和所占空间更小。

Cerebras推出“巨芯”二代:采用台积电7nm制程,和餐盘差不多大▲WSE-2与最大的GPU尺寸对比

一、Cerebras估值约24亿美元,创始人斯坦福出身

Cerebras Systems位于美国加利福尼亚州,创建于2016年。该公司专注于深度学习的计算机系统。目前该公司在硅谷、多伦多和东京都有办事处,2019年11月获得了4.75亿美元的E轮融。融资后,Cerebras Systems估值约为24亿美元。

安德鲁·费尔德曼(Andrew Feldman)是Cerebras的联合创始人兼首席执行官,他具有斯坦福大学学士学位和工商管理硕士学位,曾经创办了专注于超高密度计算机服务器业务的Seammicro公司。Seammicro在2012年被AMD以3.57亿美元价格收购。

Cerebras推出“巨芯”二代:采用台积电7nm制程,和餐盘差不多大▲Cerebras联合创始人兼首席执行官Andrew Feldman

2019年,Cerebras曾发布第一代WSE芯片,这款芯片具有40万个内核和1.2万亿个晶体管,使用台积电16nm工艺制程。

二、WSE-2性能参数超竞品几个数量级,良率更高

WSE-2仍由台积电代工,但采用更加先进的7nm工艺。与第一代芯片相比,WSE-2的晶体管数、内核数、内存、内存带宽和结构带宽等性能特征增加了一倍以上。由于WSE-2采用了7nm工艺制程,电路之间的宽度仅有七十亿分之一米。

如此庞大的芯片尺寸带来了WSE-2的大幅性能提升,该芯片的各类性能参数超出竞品几个数量级,能够极大地缩减AI训练时间。

相比竞品GPU,WSE-2芯片的内核数量是其123倍,芯片内存是竞品的1000倍以上,内存带宽是12000倍,结构带宽也增加了45000倍。

Cerebras推出“巨芯”二代:采用台积电7nm制程,和餐盘差不多大▲WSE、WSE-2和英伟达A100GPU性能参数对比

Feldman指出,通过将芯片放大互连,就可以在芯片上保留大量数据。WSE-2相对普通GPU集群,延迟和能耗都会比较低。普通GPU集群在提供相同的算力时,将会需要数十个机架,花费数个月进行配置和编程,功率将高达数百瓦。

WSE-2相对GPU还有很多核心冗余,如果有内核发生故障,单独的故障内核并不影响芯片使用。而在台积电这样的晶圆代工厂中,很少出现连续的内核缺陷,因此WSE-2的良率较高。

三、Cerebras拥有多位重量级客户

国际调研机构Moor Insights&Strategy的分析师Patrick Moorhead认为,WSE-2内核数量带来的性能确实对英伟达的GPU产生了一定挑战。但是英伟达的解决方案更加灵活,几乎可以安装在任何服务器机箱中。

Tirias Research首席分析师Jim McGregor在一封电子邮件中写道,虽然对于数以百万的AI算法来说,Cerebras不像英伟达一样全面,但是Cerebras的解决方案显然已经吸引到了许多客户。

从2019年交付WSE芯片起,在过去的一年里,已经有很多重量级用户使用了Cerebras的产品。

比如美国阿贡国家实验室、劳伦斯利弗莫尔国家实验室、匹兹堡超级计算中心、爱丁堡大学的超级计算中心、葛兰素史克、东京电子器件等。

全球制药巨头葛兰素史克的高级副总裁Kim Branson称赞到,Cerebras增加了编码器模型的复杂性,将训练时间减少到之前的1/80。

在美国最大的科学与工程研究室阿贡国家实验室,CS-1芯片被用于癌症研究,将癌症模型的实验周转时间减少到1/300还少。

Feldman说,Cerebras将在明年公布产品在重型制造、制药、生物技术和军事等领域取得的成就。WSE-2将被集成到CS-2超算系统中,在今年第三季度上市。

结语:Cerebras另辟蹊径展现巨型芯片前景

虽然相比英伟达,Cerebras没有那么全面,但是WSE系列芯片并非单纯的放大。在芯片尺寸如此巨大后,互连技术、芯片封装、散热等问题都会发生很大变化。

Cerebras解决了这些问题,用WSE-2的优点向我们展示了芯片尺寸并非只能越做越小,巨型芯片也存在广泛的应用前景。

来源:VentureBeat、EE Times、IEEE Spectrum