芯东西(ID:aichip001)
编 | 温淑

芯东西6月1日消息,近日,微软机器学习科学家展示了英国AI芯片明星创企Graphcore自研AI芯片的加速效果,该芯片在运行微软新冠肺炎影像分析算法SONIC时表现亮眼,据称能在30分钟内完成NVIDIA传统芯片需5个小时的训练工作量。

两周前,NVIDIA发布了其最新AI芯片A100。Graphcore CEO Nigel Toon称,Graphcore第二代处理器将在今年晚些时候发布,并预计其性能将超过NVIDIA A100。

科技媒体ZDNet认为,在未来,像Graphcore这样的并行计算芯片或可用于支持最先进的神经网络,有可能为NVIDIA等传统芯片巨头带来威胁。

一、Graphcore获超过4.5亿美元风投,或有上市计划

英国AI芯片初创公司Graphcore成立于2016年,总部位于英国布里斯托尔市。目前,Graphcore已经筹集了超过4.5亿美元的风险投资基金,其中包括二月份D轮融资的1.5亿美元。最近一次注资后,Graphcore的估值为略低于20亿美元;截至今年二月份,Graphcore在银行的资产为3亿美元。

Toon透露,Graphcore的投资者包括一些科技公开市场中最大的投资者,比如英国投资管理公司Baillie Gifford,以及微软公司、博世公司、宝马公司和谷歌DeepMind AI部门联合创始人Demis Hassabis等。

Baillie Gifford这样的公司投资了Graphcore,显然是因为预料到我们可能在未来的某个时间点上市。”Toon说。目前,Toon并未透露公司具体上市时间。

二、IPU架构:1216个IPU内核、片上内存带宽45TB/s

现有计算机常按时序执行任务,即先做一件事、然后再做下一件事,而AI算法存在大量重复性简单计算任务,用并行计算效率更高。

对此,Graphcore的智能处理单元(IPU)采用自研大规模并行同构多核架构,包含1216个独立IPU核心。

30分钟训练新冠肺炎影像算法!比GPU快10倍,Graphcore打造超强AI芯片

Graphcore IPU由1216个并行运算的IPU核心组成

随着计算速度需求不断提升,AI芯片还需要更高的内存容量和带宽。

由于从GPU到计算机主存储器的速度远比不了片上内存访问的速度,Graphcore在IPU架构中采用大量片上内存,容量为300 MB,带宽达45 TB/s。

三、30分钟内完成训练,NVIDIA传统芯片需花5小时

在Intelligent Health 2020峰会上,微软机器学习科学家Sujeeth Bharadwaj展示了他对Graphcore芯片的应用。Bharadwaj使SONIC神经网络Graphcore芯片上运行,并将其用于识别新冠肺炎患者的胸透图像。

系统运行结果显示,Graphcore芯片可在30分钟内完成NVIDIA的传统芯片5个小时的训练工作量。

Bharadwaj称,运行结果显示SONIC神经网络Graphcore芯片之间形成了非常强大的协同作用

30分钟训练新冠肺炎影像算法!比GPU快10倍,Graphcore打造超强AI芯片

Sujeeth Bharadwaj展示SONIC神经网络和Graphcore芯片的应用

Graphcore CEO Toon认为,以SONIC神经网络为例,IPU将能够用于开发顶尖AI模型。我认为IPU能够帮助创新者做到的一件事是创建下一代图像感知模型,使它们运行起来更加准确、更加高效。他说。

另外,Toon称,IPU除了被设计用于支持机器视觉这类复杂的算法外,还适用于加速自然语言处理等存在稀疏化的模型。

对于Graphcore IPU的性能,Toon表示出信心,认为第二代IPU有可能超过NVIDIA的A100。

对此,芯片行业媒体Microprocessor Report编辑Linley Gwennap表示怀疑。他认为,NVIDIA的产品的性能标准“远远超过所有的现有产品,其他竞争者难以超越。Gwennap对英特尔收购的Habana也表示看好,他称Habana芯片的基准测试结果优于NVIDIA V100Graphcore的产品。一旦英特尔将其庞大的AI软件栈覆盖到Habana硬件,这种组合将远远胜过任何初创公司的平台。他说。

结语:Graphcore能成为新的AI芯片领跑者吗?

早在神秘的潜心研发阶段,Graphcore就因曾获得微软、宝马、戴尔、三星等巨头的融资而备受瞩目,成为英国盛名在外的AI芯片明星创企之一。

成立仅有4年的Graphcore成长速度已算惊人。其IPU芯片拥有超过1000个独立IPU核,并且激进地采用了大量片上内存单元,同时为AI训练和推理提供超快的加速计算能力。

就最新微软机器学习科学家展示的新冠肺炎影像分析算法示例来看,Graphcore能做到10倍于NVIDIA传统芯片的训练速度,但暂不清楚具体是和哪款NVIDIA GPU进行的比较。

继去年11月与微软达成合作,发布微软云Azure上的IPU预览版外,Graphcore还于今年5月的Wave Summit 2020深度学习开发者峰会上,宣布成为百度飞桨硬件生态圈共建计划伙伴之一,加速机器视觉、自然语言处理等算法模型与硬件的适配与落地。

总体来看,Graphcore在IPU架构上融合了相当多的创新精神,并于过去半年着力将产品推向中美云端AI市场,而Graphcore的AI芯片在落地实践中效果究竟如何,还有待市场的检验。

文章来源:ZDNet