智东西(公众号:zhidxcom)
文 | 寓扬

导语:最近半年以来,人工智能的发展重心逐渐从云端向终端转移,相伴而生的是全新一代的计算芯片产业全面崛起。智东西历经数月,首次对包括AI芯片在内的新一代计算芯片全产业链上下近百间核心企业进行报道,覆盖国内外各大巨头玩家、新兴创企、场景应用、代工生产等,全面深入地对芯片产业发展、创新创业进行了追踪报道。此为智东西新一代计算芯片产业系列报道之一。

近期AI芯片成为行业火热的话题,全球至少有45家初创公司正在研发语音交互和自动驾驶芯片,并且至少有5家企业已经获得超过1亿美元的融资。在这个被巨头环绕的芯片行业开始进入变革期,AI芯片成为许多新兴公司、行业玩家实现弯道超车的机遇所在。

杭州国芯是智东西此前关注的一家芯片公司,去年10月底在深圳推出了其首颗语音AI芯片GX8010。今年CES上,杭州国芯也将这款芯片的一些最新成果进行展示,并着手海外市场的推进。

对话杭州国芯CEO黄智杰:AI芯片春节量产 已落地十几家客户

(杭州国芯CEO黄智杰)

近期智东西又与杭州国芯CEO黄智杰展开对话,就这款语音AI芯片的进展、AI事业部的成立、AI芯片研发背后的故事,以及AI芯片行业发展等进行深入交流,看看这家靠机顶盒芯片起家的国产芯片公司在人工智能时代将做出怎样的转变。

一、市场瓶颈下的突围:打造AI芯片

杭州国芯已走过17个年头,属于国内较早的一批芯片设计公司,主力便是机顶盒芯片的研发。据黄智杰介绍,早期他们主要参与做中国数字电视标准的制定及芯片研发,后来又做全球标准的机顶盒芯片,目前机顶盒累计出货量已经接近3亿颗,当前在全球机顶盒芯片市场拥有15%左右的市场份额。近几年该业务的营收可达2~3亿元人民币。

在2010年,杭州国芯还获得工业和信息化部软件与集成电路促进中心(CSIP)颁发的“中国芯”十年成就奖,近几年也多次获得“中国芯”最佳市场表现奖和最具潜质奖,显示出其在机顶盒芯片领域取得的成绩。

可是目前机顶盒芯片市场已经是相对饱和的市场,以前机顶盒领域的“霸主”意法半导体(ST)已经逐渐退出市场。国内机顶盒发展也已陷入瓶颈,目前每年全球机顶盒新增量约在2亿片左右,这个领域基本都是大陆和台湾公司在竞争。

尽管整个市场增量不大,但黄智杰谈到,海外市场尤其是第三世界国家市场增长还很快,潜力还很大,目前杭州国芯的机顶盒芯片主要销售海外市场,已经占到自身机顶盒业务的六七成,因此对于杭州国芯的机顶盒芯片业务发展而言还有较大增长空间。

面对国内机顶盒市场的瓶颈,布局国际化,开拓更多的市场空间是短期内获得快速发展的一条路,但如何布局未来,显然对公司的发展影响更为巨大。在2015年这样一个时间节点,杭州国芯选择了面向物联网领域研发AI芯片这条布局未来的路。

对话杭州国芯CEO黄智杰:AI芯片春节量产 已落地十几家客户

(2018CES杭州国芯AI芯片展示)

黄智杰坦言,首先在机顶盒保持盈利的同时,希望能够扩展新兴业务,布局另外一条产品线,来实现更高的增长;另一方面当时亚马逊推出智能音箱Echo,谷歌发布TPU芯片,也使杭州国芯更加坚定了要走AI芯片的道路。

第三,机顶盒芯片和AI芯片在技术上是相通性。二者在SoC的架构上是一致的,如机顶盒芯片有信号解调、音视频编码解码处理,语音芯片也是信号处理,音视频解码和神经网络也很相近,杭州国芯既有的芯片经验能够助力AI芯片的研发。此外机顶盒芯片市场未来也需要一定的语音功能。

可见,在既有芯片优势,业务扩展、布局未来的需求,物联网设备涌现,更高算力成为需要的行业环境下,杭州国芯在2015年底开始研究AI方向,并在2016年上半年成立AI事业部。

二、AI芯片已落地十几家客户

杭州国芯在去年10月底发布了其首款GX8010语音AI芯片,发布当时已经成功流片。据黄智杰透露,它采用台积电40纳米工艺,现在已在量产阶段,首批的量产规模在十几万片左右,预计春节前后量产芯片就可以供货给客户。

这款GX8010 AI芯片专为物联网应用设计,集成了杭州国芯自主研发的gxNPU神经网络处理器,还集成了ARM Cortex A7 CPU,Hifi-4 DSP等多个处理器,具备低功耗、可离线、可移动的优势。

对话杭州国芯CEO黄智杰:AI芯片春节量产 已落地十几家客户

黄智杰进一步谈到这款芯片有3个亮点:首先神经网络处理器可以做一些离线识别,能够将一些AI的功能在本地实现;其次集成度高,该AI芯片集成了8通道的ADC、麦克风阵列、神经网络处理器、CPU、DDR内存等,这样主板就会更加简单,也降低了主板的物料成本;第三它采用多核异构的架构,能够实现多级唤醒和超长待机,从而实现性能、成本的最优化。

他举例到,现在的智能音箱都是插电的,唤醒主要是在CPU上跑,并且需要一直保持监测状态,待机的功耗就很大。而杭州国芯这款芯片可实现50毫瓦的待机功耗,如果配备一块2000毫安时的电池,日常环境下使用几天也没有问题,这样又扩展了终端设备的使用空间。“全集成、低功耗、本地智能、场景是可移动的”,他又进一步总结到。

而在应用场景中,黄智杰首先谈到去年10月底发布的其实是两颗芯片,除了这颗AI主控芯片GX8010外,还有一颗语音前端芯片GX8008,它可以作为外置声音信号处理单独使用,进而改造现有设备使之语音化。

结合这两颗芯片,杭州国芯可以落地4类场景:1、以智能音箱未代表的智能家居,包括电视、机顶盒、空调等;2、故事机、教育类的智能玩具;3、车载设备;4、家庭机器人。

其中前两类场景可直接使用GX8010语音AI芯片,而像后两类场景,则可以通过GX8008+主控芯片来实现这些设备的智能语音化。

据黄智杰透露,目前智能音箱、机顶盒、智能玩具等几个领域的十几家客户都在使用其芯片进行开发,还有几十家客户也在评估测试。早期开发的客户已经进入尾声,其产品很快也会进入市场。

此外,杭州国芯现在也在跟Rokid、思必驰等算法公司合作,围绕AI芯片进行麦克风阵列、语音识别等算法的开发,并与各家的云平台进行对接。

三、AI芯片背后的故事

作为杭州国芯的第一款AI芯片,其从无到有的过程背后究竟经历了什么?它有哪些优点,又给创始人留下哪些印象深刻的记忆?黄智杰接着又向我们讲述了这款芯片背后的故事。

对话杭州国芯CEO黄智杰:AI芯片春节量产 已落地十几家客户

2016年上半年杭州国芯成立AI事业部,该团队有30多人,主要包括AI芯片的软硬件算法工程师、产品经理和营销人员,由他们进行产品的规划和定义,再由公司的芯片研发团队进行芯片设计。

“如果从AI芯片开始调研到最终发布,大约用了近2年时间,如果从产品立项到产品出来则大约1年时间”,黄智杰回忆到。由于杭州国芯本身就是芯片公司,AI芯片研发中的很多东西可以通用,因此在时间和研发经费上都会相对降低。他还谈到,这颗AI芯片投入的研发费用在5000万左右,但如果是一家创业公司来做投入则会大很多。

接着他情绪略显激动的谈了这款芯片打造过程中印象最深的一件事:产品定位。因为芯片的周期都比较长,一般都需要18~24个月,怎么在立项时就预想到未来发生的事情是比较难的,这也是芯片公司的灵魂。

由于AI芯片对于杭州国芯是一个新事物,并且没有可以参照的东西,在开发过程中其团队借鉴了互联网快速迭代的思维,技术开发和市场同步进行。在迭代过程中也会有需求变更,而芯片需求的变更对芯片厂商而言是一件很痛苦的事情,导致芯片开发团队做的非常辛苦。这也使黄智杰印象尤为深刻。

而最令他自豪的便是神经网络处理器gxNPU的打造,他提了提语调谈到,这个NPU模块的指令集都是杭州国芯自己定义的,做了配套的编译器,正是有了编译器,这款芯片才可以独立运行。此外团队还给它开发了配套的SDK,可以用主流的深度学习框架TensorFlow、Caffe等来方便的开发。

四、只有AI模块远远不够

过去一段时间,寒武纪、地平线、深鉴科技、华夏芯等都推出了自己的AI处理器,也将AI芯片推向一个小高潮。

当提到AI芯片行业时黄智杰谈到,目前的很多神经网络只能算是加速器,而不能称为处理器。简单来讲,加速器中主要的算法仍然在CPU上跑,只是需要加速的部分在加速器上跑;而处理器则是绝大部分算法都在处理器上跑,CPU只是做简单的控制。相对来说,处理器更容易实现高性能、低功耗的运算。

对于AI芯片落地而言,有了神经网络处理器还远远不够。以语音交互为例,NPU解决了激活和本地识别的功能,但在整个语音交互链条中,首先需要麦克风进行拾音,接着麦克风进行信号处理,之后做语音识别,还需要CPU做决策、反馈、输出,具体环节很多,而NPU只是整个芯片很小的一部分。

黄智杰解释到,从系统的角度讲,需要在架构上同时考虑多个模块如何协同工作,如何优化。单从NPU来说,还要围绕硬件建立自己的生态,包括编译器、开发的SDK、对接各种算法开发平台等,这都需要去统筹协调,可见AI芯片的落地单单有NPU模块远远不够。

而AI芯片能够实现高性能低功耗,异构架构起到了一个重要作用,一些公司也将异构计算作为自身产品重要的宣传点。黄智杰认为,以前的算法都是用CPU来跑,当这部分算法特征相对明显时就可以通过其他的加速模块来接管,通过异构计算,可以实现不同模块做专业的事情,这样就能够实现低功耗、高性能、低成本。

但是他也指出,异构计算对企业的难度的相对而言的,异构计算需要从整个系统来考虑,每个IP模块联通后,如何在系统层面把系统带宽、性能、功耗等做到最优化,如何在软件控制层面实现各个模块协同工作,都是比较难的问题。其言下之意,异构计算对于有积淀的芯片公司难度并不大,而对于一些没有芯片积累的公司则会比较难。

杭州国芯在去年的发布会公布的数据表明,通过异构架构跑算法,相对于CPU,可以实现30倍的计算速度,100倍的能效(性能和功耗的对比),且内存消耗只需要原来的1/10。

此外,黄智杰还提到目前一些IP厂商宣称能够处理多少TFLOPS(每秒浮点运算次数)的运算量,但是这么大算力要求最高的是带宽,带宽跟不上性能也无法上去,并且功耗很大,因此很多公司将其停留在IP阶段。

结语:看好语音市场 芯片回归专业化

黄智杰认为2017年语音技术已经有了很大进步,到了可以使用的一个状态,语音交互在2018年爆发是完全有可能的。他还认为,随着BAT等互联网巨头的持续补贴和教育用户,2018年国内智能音箱市场规模达到500~1000万台问题不大。可见他看好语音交互市场,看好语音AI芯片的未来。

当下谷歌、特斯拉都在打造定制芯片,仿佛定制芯片已是时代潮流。但他并不认同定制芯片会是一种趋势,尽管巨头公司自身有很多渠道和需求,可能会自己研发或者定制芯片,但最终一定是回归本身,专业的人做专业的事。另外定制芯片需要有很大的终端设备,没有量的支撑则毫无意义。

近而当谈及语音AI芯片发展的下一步时,他称语音AI芯片未来一定会替代语音芯片,而更低功耗、更低成本的AI芯片,才能够大规模应用。

对话杭州国芯CEO黄智杰:AI芯片春节量产 已落地十几家客户