11291-1

对话联发科游人杰:智能音箱已跨过鸿沟进入快速普及期

寓扬人工智能 智东西人工智能芯片系列报道 智东西智能音箱产业系列报道 智能音箱重磅选题2017/11/29

智东西(公众号:zhidxcom) 文 | 寓扬 芯片端的发展是一个行业成熟的重要标志。今年,智能音箱是一个火 […]

智东西(公众号:zhidxcom)
文 | 寓扬

芯片端的发展是一个行业成熟的重要标志。今年,智能音箱是一个火热的话题,看好与唱衰并存,甚至很多行业内的人也看不清其在国内的发展方向。然而这个市场究竟如何,还要溯本清源看一看芯片端的进展如何,以及他们对于智能音箱市场的看法。

目前智能音箱市场最大的主控芯片提供商就是联发科技(MTK),亚马逊、谷歌、阿里巴巴、百度等都是其客户。于是智东西近期南下走访了联发科副总经理暨家庭娱乐产品事业群总经理游人杰,一场围绕智能音箱、语音芯片与AI芯片的对话就此展开。

一、语音芯片占智能音箱七成市场

联发科主要有两大事业群,一个是无线产品事业群,主要就是手机芯片业务;另外一个就是家庭娱乐事业群,涵盖手机以外的业务。联发科在智能音箱中的语音芯片就来自游人杰所在的家庭娱乐事业群。

11291-2

(联发科副总经理暨家庭娱乐产品事业群总经理游人杰)

结合联发科语音芯片的出货量和他对智能音箱市场的分析,游人杰认为今年智能音箱全球出货量将在2500万~3000万台之间,相比2016年市场规模至少增长了5倍以上。智东西此前也根据产业链各方信息对今年智能音箱市场规模给出3000万台销量的预估,可见与游人杰观点一致。

游人杰称联发科的语音芯片在智能音箱市场中占七成以上市场份额,该业务营收占到整个联科发集团2%~3%。如以今年智能音箱全球3000万的销量来算,那么联发科语音芯片的出货量在2000万片以上。尽管这个出货量对于手机等成熟市场而言并不算大,但对于一个新生的品类来讲,发展已是迅速。“今年芯片出货量比去年多10倍”,反应出游人杰对智能音箱市场的肯定。

对比国际国内两个智能音箱市场,游人杰认为智能音箱在美国已经进入普及期,今年快速增长。但国内智能音箱市场才刚起来,今年算是国内市场的元年,预计明年会有更大的增长。

对于国内今年智能音箱的市场规模,他给出的分析是200万台左右。考虑到在今年1~8月份,国内智能音箱整体销量尚未达到10万台,而阿里天猫精灵又在双十一售出了100万台的销量,那剩下的90万台呢?“国内不是还有双12吗,全供应链都在赶工”,游人杰模糊的透露,似乎在未来一个月中,国内智能音箱市场很有可能围绕“双12”再来一场大战!

通过智东西从产业链获得的消息以及分析,在今年智能音箱市场这个3000万台的“蛋糕”中,亚马逊将占到2000万以上,谷歌会占到大约500万台销量,再加上国内约200万的市场份额,智能音箱这个市场被亚马逊、谷歌、阿里等几个巨头玩家所主导,而他们共同的主控芯片提供商都是联发科。

二、智能音箱发展三个阶段

在游人杰看来,整个智能音箱的发展可以分为三个阶段:

第一阶段是智能音箱的普及期,这一阶段需要巨头公司的补贴,来教育用户培养市场,美国今年基本已经进入普及期,而国内可能会在明年。后期成长的关键是看为用户带来什么新的体验,以及是否发展处了符合用户需求的应用。

第二阶段,语音会演变成新的人机交互界面。随着智能音箱的普及,语音交互为更多人接受,家庭更多的设备都会接入语音。一些很简单的应用,如开关的控制,电灯的控制,考虑成本和功耗,可以使用最简单的物联网芯片。随着越来越多的设备接入语音交互,语音就会演变成新的人机交互界面。

第三阶段,智能设备要有本地服务。要让用户有突破性的体验,就需要把在云端训练好的模型集成到本地去做运算,比如满足设备在本地端进行一些基础交互和简单的控制。这也涉及了端智能、语音AI芯片的话题,将一些常用或者简单的交互直接放到本地去做,进而增强用户体验。

目前来讲整个世界还在第一阶段,而国内更是处于刚起步的状态。对于明年国内智能音箱市场的规模,游人杰乐观的预估为500万台。

此外,他也谈到,根据经验,如果一个产品在全世界有2000万~3000万的销量,就会跨越鸿沟,进入快速普及的成长期。而智能音箱在全球的进展之所以相对较慢,主要受限于各地区语言不通,都需要在云端拿数据做更多的训练。

三、从语音芯片到AI芯片

近期,随着华为麒麟970芯片以及苹果A11芯片的推出,AI芯片开始成为一个热门的话题。但语音芯片能不能算是AI芯片呢?AI芯片的界定边界在哪里?

游人杰认为AI芯片本身要有学习能力,通过数据在云端将模型训练好,这是算法层面;另外,有了深度学习算法模型,还需要在硬件端提供充足的算力来帮助算法做加速,联发科将其称为 AI Processor(AI处理器)。

08101-5

(搭载MT8516芯片的天猫精灵主控面板)

以这个定义来看,目前联发科推出的语音专用芯片MT8516则还不算真正意义上的AI芯片。游人杰谈到这款芯片是目前联发科主推的语音芯片,专为智能音箱而设计。明年联发科还会推出更具竞争力的新语音芯片产品,但并非语音AI芯片。

游人杰认为语音AI芯片是智能音箱发展到第三个阶段的产物,目前我们还处于普及期的第一阶段,语音AI芯片的推出还需要1~2年的时间。此外,由于芯片研发的高昂成本,在芯片量不大的情况下,联发科目前不会将AI模块集成到主控芯片中,而是会做一个单独的模块,来提供AI加速的功能。

游人杰还谈及了联发科的AI策略,联科发内部讲AI分为“轻AI”和“重AI”两类,划分的标准就是对算力的需求。

无论是联发科的语音芯片、移动芯片等都有较强的CPU、GPU模块,凭借良好的运算力和低功耗,直接可以做一些简单的AI功能,这部分称之为“lite AI”(“轻AI”)。

如果本地端需要很强的AI功能,联发科则通过VPU(视频处理器)+DLA(深度学习加速器)的组合来提供强大的运算力。在目前芯片的基础上,加上一个独立的AI处理器模块即可。

相比一款新型芯片研发的高昂成本,在对算力有很大需求的产品上,通过添加一个独立的AI处理器模块,确实可以快速满足产品端对AI能力的需求,并且缓解了芯片产品漫长的研发周期(一般18~24个月)。

此外,游人杰也谈到,考虑到目前已经有智能音箱加入了屏幕,未来也看好语音+屏幕相结合的交互方式,下一阶段会推出一款语音+影像芯片,并且这一想法已经在实验室阶段。

四、做大弹性融合主流生态

谈到AI芯片就必须要谈生态,AI只是一种工具,最终落地到场景应用中涉及芯片(硬件)、嵌入式操作系统、嵌入式算法、场景落地等多个环节,这就决定了AI的落地需要生态的力量。至于如何加入生态圈,游人杰给出的答案是融合主要生态,自身做大弹性。

他表示, 在芯片设计时要考虑兼容几个主要的生态平台,做大自身的弹性,并以开放平台融合巨头玩家的生态。

首先,AI芯片的应用非常广泛,这就决定了芯片要有很好的通用性,这也是出于成本的考量。联发科会把AI芯片的底层做好,把架构定好,做一个芯片开放平台,然后各行各业都可以在此基础上进行开发。

其次在加入AI生态圈时,IC(集成电路)的代码需要写的比以前更加清楚,这样才能方面生态圈其他环节的开发使用。

此外,联发科的芯片设计还会尽可能的符合不同生态圈的标准,在软件和API接口上与生态圈相适应。

但考虑到英特尔、高通都在积极主动的参与到AI生态的构建中,从而获得生态圈更多的主导权,联发科如果只是一味适应他人主导的生态,又是否会遭受来自生态圈同行的挤压呢?

结语:智能硬件推动AI芯片发展

通过游人杰对智能音箱发展三阶段的看法,我们发现智能音箱的发展普及,进而会推动更多智能设备的兴起,并形成新的语音交互界面。而更多智能硬件的出现,处于用户体验以及安全隐私等的考虑,端智能的需求会大量涌现。

这一趋势会推动AI芯片的发展,从而赋予本地更多智能。而在AI芯片中,随着人机交互方式的多元化,语音+影像的AI芯片或成未来芯片的主流。

zhidx