智东西(公众号:zhidxcom)
文 | 寓扬
智东西3月22日消息,今天阿里人工智能实验室(以下称阿里AI Labs)发布AliGenie 2.0语音交互平台,并在此基础上推出视觉应用系统天猫精灵火眼,精灵火眼主要针对儿童市场,可以应用在儿童绘本读书、物体识别等方面。
此外,阿里还发布了一系列春季新品,包括一款路由器天猫路由、一款投影产品天猫魔屏S1,以及更加Mini版的智能音箱天猫精灵曲奇。
(阿里AI Labs负责人浅雪)
会后,阿里AI Labs负责人浅雪、北京研发中心负责人聂再清博士、产品总监释空接受了智东西等媒体的采访,就天猫精灵火眼的推出、带屏智能音箱、推出多款产品逻辑等进行沟通。
一、天猫精灵累计销量达200万台
阿里人工智能实验室负责人浅雪今天穿着一件印有天猫精灵Logo的黑色T恤走上舞台,按照发布会惯例的回顾了天猫精灵智能音箱从诞生到现在走过的8个月历程。
去年双十一的99元大促,可谓让天猫精灵收割了一波眼球,经过前期的宣传酝酿在双十一当天拿下了百万的销量。而今天浅雪再次宣布,上市半年多时间,天猫精灵目前销量已经突破200万台,连接了4500万台家用电器。她顺便又PK了一下亚马逊,亚马逊完成这一任务用了将近2年的时间。
接着浅雪又从技能、智能家居等维度介绍了天猫精灵发进展。目前天猫精灵的技能Skill也逐渐增加到356款,浅雪称这是目前最大的中文技能平台,并有6000多名开发者进行技能开发。
在智能家居方面,浅雪认为智能音箱推动智能音箱推动智能家居进入2.0 时代,由手机控制进入到语音交互。目前天猫精灵已经覆盖8个物联平台,39种品类,72个家电品牌。“在市场、用户、产品之间寻找一个平衡点,从而让它进入更多的家庭中”,浅雪分享了她做智能音箱的理念。此外,天猫精灵X1还获得了2018德国红点设计大奖。
二、推出视觉应用天猫精灵火眼系统
天猫精灵中搭载的就是AliGenie语音交互系统,此次阿里重点宣布该系统升级到AliGenie 2.0。AliGenie 2.0主要在自然语言、机器视觉、多模态交互方面进行升级。
在自然语言方面,阿里AI Labs构建了一个庞大的知识体系,包含5个垂直搜索引擎,20个大类知识图谱,并进行算法升级,具备了主动学习的能力,能够在交互中自我完善。
浅雪称,未来人机交互不应该只有听觉,还应该有视觉、嗅觉等能力,而本次AliGenie重点引入了视觉能力,能够进行图像识别、物体检测、人脸识别。
多模态交互则只通过语音、图像、触摸等多种交互形态的融合,增强人机交互的交流能力。AliGenie2.0还能通过情景感知,则基于你所在的上下文、对话场景自主学习,理解情景需求。
基于AliGenie 2.0平台,阿里推出了天猫精灵火眼系统,这是基于平台视觉能力的应用。
精灵火眼并不是一款硬件,而是一款软件系统。具体而言,用户通过打开天猫精灵手机APP,唤醒“精灵火眼”,就可以通过手机摄像头和天猫精灵相结合的方式使用视觉能力。为了更方便的使用,阿里AI Lab还推出了一个XHolder配件,配件本身是一块塑料板,主要是便于用户使用精灵火眼,有点类似谷歌的 Cardboard。
从浅雪的介绍来看,天猫精灵火眼的应用更加偏重与儿童,并专门为此打造了一款萌萌哒的童音。其应用主要有三个方面。一方面天猫精灵升级了日常的语音交互能力,比如播放你指定的一首歌曲时,能够根据你喜欢的类型“调侃”你,增强了对话能力。精灵火眼还会在手机屏幕上显示萌萌哒的表情,也可以通过触摸进行交互。
第二项应用就是将视觉能力应用到儿童绘本读书上。本次发布会上还来了一些出版社的合作伙伴,原因就是阿里与出版社合作,通过精灵火眼系统识别绘本读物,从而读书给儿童听。浅雪表示,目前天猫精灵火眼已经和全国12家顶级出版社建立了合作,上线了117套儿童绘本。
第三项应用则是“万物识别”,与上面绘本识别不同的是,物体识别更多的是3D物体识别,而非二维的平面。阿里AI Labs产品总监释空现场展示了通过精灵火眼识别菠萝和西兰花等物体,并称阿里会继续推进“万物识别”的能力。有趣的是由于现场网络的不稳定,阿里在第一次现场展示中还上演了一场“乌龙”。
此外我们发现,当释空演示时,由于现场光线太强,特意让灯光师调暗一点灯光,可见复杂光线不单单是天猫精灵火眼,也是行业视觉识别的痛点性问题。
三、三款新品助力春季新品潮
除了升级AliGenie语音交互系统,推出精灵火眼应用,阿里AI Labs还推出了三款新品,分别是天猫路由、天猫魔屏S1以及更加Mini版的智能音箱天猫精灵曲奇。近期正直春季新品发布,昨夜猎豹CEO傅盛狂甩5款机器人,阿里今天也放出了3款硬件产品。
第一款产品是天猫路由,浅雪谈到对于AI来说网络是一个巨大的挑战,正是在天猫精灵的研发过程中遇到了这样的问题,就做了路由器。这款设备的特点主要集中在2点,一方面是天猫路由可以同时支持256款设备同时联网在线;其二是自组网,保证设备不掉网。
第二款设备是天猫魔屏S1投影机,它搭载了AliGenie 2.0系统,可以和天猫精灵一起使用。浅雪介绍到,该投影机1.8米距离就可以投射100吋的大屏观影效果,莫非这是进入无屏电视市场的节奏?
第三款就是之前已经出现在大家视野的更加Mini版的智能音箱——天猫精灵曲奇。它更加小巧只有一个苹果的大小,也符合浅雪做智能音箱的理念,以便更好的融入生活中。此外,它配备了可拆卸的外表,可以根据房间/喜好进行“换肤”。
这三款产品看上去也并无太多特色,不免引起我们的好奇,阿里到底要做什么?会后浅雪解释到,这三款产品是有一定逻辑的,天猫精灵具有语音输出功能,天猫路由用来联网,而投影仪具有输出功能,阿里希望用这样一个Demo来打造人机交互的体验。或许这才是阿里真正的目的,通过这样一套输入输出设备来展示AliGenie系统,吸引硬件厂商使用。
四、关注重点在于AI人机交互
为何阿里此次推出的是一款天猫精灵火眼的系统应用,而非一款硬件呢?我想这是很多人的疑惑,阿里AI Labs产品总监释空解释到,在做火眼系统中内部产生很大争议,最终采用了XHolder配件+火眼的形式来做视觉应用,通过兼容现有的产品来实现,而非做一款带屏的智能音箱。
针对会不会推出带屏的智能音箱,释空从一个产品经理的角度出发谈到,关键看加入屏幕能不能够带来足够的议价。
目前很多公司开始推出带屏智能音箱,比如百度和灵隆科技都会在近期推出。而在浅雪看来屏幕不等于视觉能力,其关注的焦点不是带不带屏幕,而是具不具备AI交互的能力。
通过此次与浅雪、释空等人的沟通,可以看出阿里做硬件的思路更加清晰,主要是通过软硬件的打造发现其中的“坑”。阿里关注的重点仍然在软件在系统,让硬件厂商使用AliGenie系统才是阿里的思路。
而在2018年智能音箱市场规模预期,以及阿里今后在硬件或者系统方面补贴的力度以及侧重方面,浅雪并没有给出答案。
结语:落地AI技术是关键
本次阿里AI Labs重点发布AliGenie 2.0语音交互系统和天猫精灵火眼,让我们意识到,阿里的重点可能一直都在软件系统层面,落地AI技术才是其主要目的。
通过既有的天猫精灵和天猫精灵APP相组合的方式加入机器视觉的功能,正如浅雪所言能够以近乎零成本实现视觉技术的应用,但通过兼容不同手机操作系统的方式能否提供更优质的体验,或许也是一种挑战。