900

华为麒麟970是不是真正的AI芯片?

Lina人工智能 人工智能芯片重磅报道 头条 智东西人工智能芯片系列报道2017/09/04

智东西(公众号:zhidxcom) 文 | Lina 漠影 华为这周末搞了件不大不小的事——发布了“世界首款手 […]

智东西(公众号:zhidxcom)
文 | Lina 漠影

华为这周末搞了件不大不小的事——发布了“世界首款手机AI芯片”麒麟970——各位科技媒体小编都辛苦了,大周六晚上的不是飞去德国跑会就是在电脑前蹲直播,连约会都要改期,好气哦。

咳,言归正传。

16581504528148_.pic_hd

(华为官方推特介绍,“世界上第一款搭载NPU的AI芯片”)

华为为了抢这个“世界第一”着实花了不少心思,作为一个以“自研”为骄傲的企业,本次麒麟970上不仅使用的是别家的(寒武纪的)神经网络处理单元(NPU),智东西还独家获悉到,麒麟970在物体识别方面的一整套嵌入式AI解决方案(从算法+Camera Tuning)都来自中科创达。

此外,据业内人士透露,寒武纪的AI架构在麒麟970上实现的梳理也并非全部是华为海思自研的技术。

这款芯片打造了多少个月?仅是加了一个NPU模块就能叫“AI芯片”吗?为什么华为要这么紧赶慢赶抢“第一”?联发科、深鉴科技等业内人士又是怎么看待麒麟970?……以上种种疑问,智东西将为你一一揭晓。

一、参数轰炸

麒麟970的参数想必大家已经被刷屏了一遍又一遍,但为了文章完整性这里还是不能免俗地需要列一列数据,看过的读者可以直接跳过这段:

屏幕快照 2017-09-04 20.23.09

众所周知,目前九成的手机芯片采用的是ARM的架构,麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,采用了台积电10nm制造工艺,搭载12核高效GPU、8核高性能CPU,4.5G高速LTE Modem,支持LTE CAT.18,最高下载速度可以达到1.2Gbps,与高通目前发布的最强的X20 LTE基带实力相当。

特别值得一提的是,麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。这个架构很厉害,比上一代的Mali-G71性能提高了40%,能效提高了25%。

但如果抛去数据,一个小细节能让你更直观地理解它:在智东西跟某移动端大咖聊天的过程中,他对NPU、10nm统统只是点头微笑,唯有在看到MP12 GPU小小地惊讶了一下。

与此同时,麒麟970拥有两个用于处理图像信息的ISP,能够更快速地响应处理图片,并且能在低光照度环境下对降噪进行优化。

0987

由中科创达提供的智能拍照技术则将自动识别镜头内的物体(比如一朵静止小花又或是一个奔跑的人类),系统根据该物体的属性调整相机参数或是进行主动去糊。

麒麟970会搭载在将于10月16日于慕尼黑发布的华为Mate 10手机上。

二、寒武纪?何方神圣?

既然一直在说“寒武纪”的NPU,那么这个寒武纪究竟是何方神圣呢?

寒武纪科技(Cambricon)是中科院计算所孵化出来的AI芯片创业公司,中科院计算所不仅对寒武纪进行了天使轮融资,同时还给与了长期的支持与投入。8月底,寒武纪宣布完成了1亿美元的A轮融资,投资方为国投创业、阿里巴巴、联想等,一跃成为国内AI芯片届当之无愧的独角兽。

不仅如此,寒武纪的两位创始人也非常神奇——一对出身中科院的兄弟。哥哥陈云霁目前仍在中科院计算所担任研究员,从事基础科技研发,弟弟陈天石则当起了公司的CEO。

10341553176661253359

(弟弟陈天石与哥哥陈云霁)

不过,很长一段时间,寒武纪这家公司一直以“研究性”企业被业内所知,说白了就是没有产品出来。直到去年4月份的世界互联网大会期间,宣告自己的第一款AI芯片产品寒武纪1A流片了,这一点不断拿来背书,新闻联播、人民日报都说了这事;不过之后其产品到底有没有商用,有没有量产,并没有官方说法,按照2016年底寒武纪CEO 陈天石的说法,“芯片从研发、量产到商用,是一个以年为单位的周期,所以在明年,大家将可以在市面上看到使用寒武纪技术的芯片产品,比如在手机、安防监控等智能终端和云端服务器上。”

timg-4

(寒武纪板卡)

不过根据中国科学院计算技术研究所发布的贺信显示,麒麟970芯片上的NPU正是集成寒武纪1A处理器作为其核心人工智能处理单元,实现了手机上本地、实时、高效的智能处理。这也是寒武纪1A真正意义上的一次产品化应用。

不过话说回来,恐怕也只有华为这个量级的土壕,才有能力让寒武纪1A真正产品化,从这一点看寒武纪是抱上了一个不错的大腿。

三、到底什么是“AI芯片”?

上文提到,麒麟970之所以敢叫自己“AI芯片”,最主要的就是集成了寒武纪的NPU(Neural-Network Processing Unit,神经网络处理器。

未标题-1副本

现在所谓的手机处理器,比如高通的835、苹果的A11、麒麟970等,实际上所指的是一个“处理器包”封装在一起,这个计算包专业一点说叫Soc(System-on-a-Chip),高大上的说法是“计算平台”;根据分工不同,很多专用功能的处理单元加进来,比如我们最熟悉的是GPU,现在这个包里的独立单元数量已经越来越大,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等,不同的数据进来,交给不同特长的计算模块来处理,这个NPU就是手机处理器平台新加入的一个擅长神经网络计算的单元,那么到底哪些应用会用到神经网络计算?也就是现在最能代表人工智能计算的一些应用,比如模式识别里的语音、图像(人脸)识别,比如其他会用到深度学习的一些AI应用。

为了让这个深度神经元网络连接更快,“寒武纪1A”还设计了专门的存储结构,以及完全不同于通用处理器的指令集。“它每秒可以处理160亿个神经元和超过2万亿个突触,功能非常强大,功耗却只有原来的1/10。

有时候,有些计算单元会独立出来,不封装在SoC里,比如观察苹果iPhone的主板结构,其Modem模块就一直独立在其A系列处理器模块之外;寒武纪的这个NPU单元之前也是一个独立的处理器单元,只是这次整合封装到了麒麟970的Soc里面。

17601504535391_.pic_hd

(华为海思麒麟970架构)

-098td

(高通835架构和华为海思960架构)

虽然芯片里的CPU、GPU、DSP都可以用来做运算,但是NPU是专门用于神经网络架构计算的,号称比CPU快25倍的同时效率将提高了50倍。有点类似于你想要剪东西,我给你一把剪刀。

至于为什么用的是寒武纪的NPU呢?主要原因是目前国内能做AI芯片级别的公司只有那几家,而寒武纪是中科院出身,和华为的合作自然也是顺理成章。中科院计算自己也表示,计算所自2011年以来就和华为展开合作,组建了“中科院计算所-华为联合实验室”。

不过,也没有说现在其他芯片的CPU+GPU+DSP架构在人工智能应用方面效果差到哪里去了,恰恰相反,现在的众多手机厂商都在这个架构上对AI功能进行优化。从高通骁龙到联发科Helio,无不在人工智能的芯片应用上进行了大力优化。比如高通在骁龙800和600系列芯片上做了一个软件的神经处理引擎,高通也承诺未来也会出专门用来做神经网络运算的核——比如NPU。

be18c909-59d4-4f47-9464-cad39d3d8b6b

所以说,这个NPU,重要,但也没那么重要。以深度学习为例,深度学习分为训练(Training)和推理/应用(Inference)两部分,训练阶段的确需要非常高的计算能力,但在应用层面其实并不需要巨大的计算量——相信没有哪个纯真的用户拿手机去做Training的。

另一方面,AI不AI,最终还是得看应用嘛……需要整个移动AI应用的生态起来了,才能体现出硬件的优势。

同为手机芯片制造商,联发科的一位产品技术负责人也认为,在芯片上集成硬件相对容易,关键还是上层的应用,用户不会在意这个是不是AI,只会在意体验。

虽然华为展示出了三个常见应用方向(AR、计算机视觉、自然语言处理),还动用了开发者网页、开发者工具包、应用商店来招揽开发者,华为消费者业务CEO余承东也在发布会现场承诺,华为将打造一个开放的AI环境,开发者可以直接接入华为NPU功能,也可以通过第三方AI框架接入(目前支持TensorFlow和Caffe)。

不过,就目前来看,移动AI应用开发还很少,华为现场展示的AI功能也集中在降噪、拍照美化等方面,快则快矣,没有什么鸡蛋。在应用缺失的情况下,麒麟970、骁龙835、甚至性能再弱些的芯片使用起来也会让用户感觉相差不大。

四、为了这个“世界第一”煞费苦心

不知道大家还记不记得,去年12月16日,华为旗下手机品牌荣耀推出了2016年最后一款旗舰手机——荣耀Magic。

荣耀总裁赵明在讲述这款荣耀3周年的特殊新产品的过程中,全程未提硬件配置,只谈了这款手机的八曲面外形设计和搭载由华为2012实验室研发4年的人工智能引擎Magic Live。

2345678

除了2012实验室外,华为旗下还有诺亚方舟实验室、高斯实验室、香农实验室,华为没有透露本次麒麟970使用的人工智能技术是否来自这些实验室,但从目前看来主要是这几个部门在研发。

不过,仅从深度学习来说,华为的技术并不算领先。这也是为什么虽然华为海思方面非常想要自研“AI芯片”,但为了来得及抢上这个“世界第一”的名头,最终选择了和寒武纪、中科创达合作。

一位业内人士对此的评价是——“从急促的拍板签下IP核合同,到和Mate 10分开,赶在苹果之前发布这款芯片,时间上感觉有点赶鸭子上架。”

那么华为这个“世界第一”真的要抢得这么急吗?

真的要。

据传言,这次麒麟970的项目做了大概4-5个月,其中包括了寒武纪、中科创达方面的技术整合、以及流片。从速度来说真的很快,一方面是华为干脆果断的行事作风体现,另一方面也侧面证明了这个“世界第一”真的很急。

据了解,台积电下半年的生产线上已经有超过30款“AI芯片”的代工排期了。虽说并不全都是手机芯片,但可以看得出这的确是一股潮流趋势。这一趋势在智东西和业内人士交流过程中也感受颇深。

五、业内声音:AI芯片是趋势

同为手机芯片商,联发科的一位产品技术负责人告诉智东西,“AI芯片”确实是目前的行业趋势之一,随着手机差异化越来越少,久而久之NPU将会变成“大家都得有”的东西。

在智东西此前跟荣耀掌门人赵明的对话中也可以感受到,互联网手机的竞争正从之前的网络营销、网络销售变成更技术化的比拼,在后互联网手机的时代,人工智能正成为核心竞争点之一。

从深度学习芯片层面,与寒武纪类似,国内还有另一家专注于“AI芯片”的明星创企——深鉴科技——虽然说他们做“AI芯片”严格意义上是不对的,他们做的是用于深度学习推理应用(Inference)的FPGA板卡(具体参见智东西此前的深度专访《成立一年估值超10亿 与谷歌飙技术 这位90后CEO如何做到?》)

深鉴科技创始人兼CEO姚颂则认为,不光是手机芯片,整个半导体行业都将受到AI的冲击。随着深度学习的兴起,不同公司所在意的性能重点不同,一个语音公司与另一个安防摄像头公司所用的芯片不同,比如对于语音识别的用户,他们更加关注延迟,而不是单一的增加吞吐量。未来,处理器的架构分类上将会以应用为导向。

结语:我们离AI芯片还有多远?

目前看,华为通过用麒麟970这款手机芯片架构整合NPU,抢到了“AI芯片”这个高位,噱头也好,美名也罢;但还有很多问题值得我们关注:

1、用上了NPU神经网络计算单元的麒麟970到底能发挥多大作用?会给手机体验带来什么改变,是不是“然并卵?”,要等华为Mate 10发布后具体看。

2、麒麟970这套玩法是不是就是真正的“AI芯片”套路,之后无论高通、三星还是苹果的处理器SoC是不是也会用这种在手机芯片SoC上加入类似NPU的计算模块?

3、麒麟970能不能代表华为在人工智能方面的积累,如果是,是不是NPU这样的处理单元也应该一手包办?苹果、三星、高通会一手包办还是采用第三发专攻这一领域的处理器IP方案,这是未来AI芯片产业发展模式走向需要明确的路径。

但总的来说,麒麟970的出现,让AI在手机端开始由软到硬地落地,是人工智能进一步产业化落地的一个典型代表。


 

每日一头条

趋势·深度·犀利·干货,最专业的行业解读

深喉爆料、投稿:guoren@zhidx.com

 

zhidx