D1-Siri-Voice-Control 副本

中美科技巨头各家“小秘” 你会看上谁?

寓扬头条 智能家庭2017/05/01

智东西(公众号:zhidxcom) 文 | 寓扬 导语:近日,腾讯推出了其语音助手“腾讯叮当”,至此BAT三巨 […]

智东西(公众号:zhidxcom)
文 | 寓扬

导语:近日,腾讯推出了其语音助手“腾讯叮当”,至此BAT三巨头都已入局智能语音助手市场,接下来又将上演怎样的厮杀?还有其它语音助手之间又会有怎样的故事?智能语音助手背后又是怎样的技术逻辑?这个市场到底如何?与我们的智能家居又有何关系?

近期,无论国外还是国内,智能语音助手都是一个相当火热的话题。

在国外,谷歌的Google Home 和亚马逊Echo的斗争十分激烈,一方面不断升级语音助手服务,另一方面不断向第三方开放其语音助手平台。如4月15日亚马逊向第三方授权其Echo的关键语音技术;再如4月20日Google Home 推出其智能音箱可同时支持6人使用,提供个性化服务 。此外,4月23日奔驰也将其新车接入Alexa和Google Assistant,提升其车载系统和对智能家居等的远距离控制。

而在国内,4月14日,乐视推出其语音助手“乐乐”来实现对手机APP的语音操作。4月18日人工智能公司出门问问推出其语音助理“问问”和智能音箱Tichome,并向第三方开放语音平台。4月25日,腾讯推出语音助手“腾讯叮当”,又一巨头入局智能交互领域。

5

随着人工智能和智能家居的发展,以音箱或手机等为硬件的语音助手可能将成为家庭的交互入口,而这背后是整个智能家居产业链和广阔的市场。谁将掌握这个控制中心,谁就赢得了未来。

一、智能语音助手大盘点

目前,语音助手的硬件载体已经开始从智能手机向音箱、汽车、机器人等蔓延。预计这一趋势会愈演愈烈,语音助手将会连接更多的设备,从而成为智能生活的核心控制中心之一。

尽管当下市场上有许多语音助手,但由于语音技术的研发周期长,投入大,行业进入壁垒较高,全球范围内应用成熟的语音助手并不多。知名度较高的有国外谷歌的Google Home、亚马逊的Alexa、苹果的Siri、微软的Cortana小娜,以及尚未谋面的三星Bixby。国内知名度较高的有百度的度秘和科大讯飞的灵犀语音助手。

BAT三巨头在语音助手领域再相遇

就在近日腾讯也推出其语音助手“腾讯叮当”,腾讯表示,其最新人工智能助手腾讯叮当在功能上与亚马逊Alexa相似。而到此,加上百度的度秘和阿里iDST的语音助手,BAT三巨头都进入了智能语音助手领域,可见他们对于语音交互这一大“入口”的认同。

度秘是李彦宏在2015年百度世界大会上推出的机器人助理。依托百度的搜索和智能交互技术,度秘可以通过对话,进而在索引现实的服务和信息的基础上,为用户提供服务。度秘主要的能力集中在美食推荐、电影推荐和生活服务推荐。度秘服务更多的集中在消费上,它连接的是广泛的现实行业,涵盖吃、住、行、玩等方面,这更多的是依托百度搜索能力、百度地图、百度糯米等O2O类的服务。

6

但目前的度秘需要下载手机百度客户端才能使用,也没有语音服务和日常生活提醒等功能。度秘的交互性和趣味性并不强,打开方式也略显麻烦。

阿里的语音助手是由iDST部门开发的,提供实时智能语音识别技术,可实现语音操控、语音搜索、淘宝购物等功能。iDST部门的语音识别技术主要致力于两个方面,一是建立自然语音交互平台,连接更多的终端,获取互联网上的各种服务;二是通过阿里云输出语音能力,帮助合作伙伴去做具体业务。依托YunOS系统,加上阿里在新闻、饮食、地图、娱乐等领域的布局,阿里语音助手可获得强大的数据资源、数据处理能力,以及多元的服务。而未来其将成为阿里商业的交互中心,连接人与商品和服务,提升购物交易的便捷化。

至于刚刚推出的腾讯叮当,根据腾讯科技报道,目前腾讯叮当涵盖的服务很广泛,已经覆盖新闻、体育赛事、票务、快递、音乐、股票、文学、基于LBS的附近资源等领域。如用户对着腾讯叮当说“查询天气”它就会提供当天和以后三天的预报。问及足球比赛结果时,它也会在1秒内给出针对性的答复。

可以看出三家的语音助手服务有重合,也有自己的特色。如度秘在搜索和生活消费上更有优势,阿里语音助手在购物、商务服务上更有优势,而腾讯将在泛娱乐上更有优势。

通过BAT三家的布局,可以看出,他们在打造一个人机交互的入口,无论是在家庭中,还是在个人的工作生活中。通过语音助手来链接其生态中的更多产品,来为消费者提供整合性的服务。而在技术相差不大的当下,谁的连接能力更强,谁的生态更广,无疑更有利于占领当下的市场。

三星Bixby与苹果Siri 将有一战?

早在2011年,苹果就在其iPhone4S上推出了智能语音助手——Siri,随后语音助手也逐渐进入大家视野。随着Siri的不断升级,俨然成为一个生活管家。Siri可以为你查阅信息,充当时间助手、邮件助手,进行歌曲识别,还是算数高手,还可以为你提供生活消费娱乐等服务。此外,随着苹果Homekit智能家居平台的搭建,Siri作为语音助手将在智能家居中发挥更大作用。

2

然而,在今年3月29日的三星S8发布会上,三星推出了其AI语音助手Bixby。在三星S8发布会上,为了和Siri区别开,也为了体现Bixby人工智能特性,三星重点强调了Bixby的内容理解能力和学习能力。

内容理解能力体现在当你告诉Bixby把截图发送给朋友时,如果有多个友人重名,Bixby不会因为不知道发给谁而崩溃,而是会主动询问你到底要发给谁。而在学习能力上,Bixby主要通过积累用户的使用习惯来构建用户的日常使用模式。比如你每天定点用Uber打车,如果今天你忘了,那么Bixby很可能会通过长期观察你的日常而提前帮你在Uber上叫车。

此外,三星还可通过Bixby接入Sumsung Connect来控制三星系的智能家电,以期在智能家居中发挥更大的作用。然而,可惜的是Bixby因为种种原因并未上市,也不被装入三星S8中,而很可能载入三星今年下半年的Note8中。

有趣的是,为Bixby提供技术支持的是三星去年收购的Viv Labs实验室,没错就是苹果Siri缔造者Adam Cheyer、Dag Kittlaus 和 Chris Brigham离开苹果后联合成立的创业公司!作为智能手机市场的两个霸主,三星与苹果也在不断暗自较劲。三星迟迟不推出Bixby,是否为了憋大招?是否为了与苹果在语音助手领域展开一战?一切只能等待。

亚马逊Alexa与Google Assistant的相爱相杀

亚马逊的Echo和谷歌的Google Home是在智能家居中相对比较成熟的两款产品。目前两款产品都已具备超过5000项的技能。

461836677551294639

亚马逊于2014年推出智能音箱Echo,搭载Alexa语音助手,随着不断升级,Echo已成为家庭的交互入口。除了日常生活化的服务外,Echo的主要功能集中在语音购物和对智能家居的控制上。而这也正是亚马逊的野心,建立下一代计算平台,并称为家庭交互的入口。

通过亚马逊Alexa与智能家居设备的连接,你就可以轻松的控制家庭环境,如开关灯、开关窗帘、开关电视等。其独特的麦克风,可以实现较远距离的声音接收。据知乎用户反馈,相比Siri需要掏出手机,按钮触发,并且距离较远就无法听到;Echo的麦克风设计的很赞,可以实现远距离的声音接收,且不需要按钮触发,它会是你的第二老婆!

而Google Home出现的较晚,它于2016年5月份才推出,之后便一直追赶亚马逊的Echo的步伐。此外,Google Home的功能和Echo相差不大,主要用于个人生活和智能家居的控制。Google Home的优势在于其搜索优势和功能更加齐全,而Echo的优势在于购物和更多的第三方接入,以及先发入场优势。

有趣的是,两款智能家居设备,两个语音助手,从出生时仿佛就是宿敌。亚马逊于2015年6月向第三方开放其Alexa语音技术,而不必通过智能音箱Echo;而谷歌在2016年12月才向第三方开放,为的是于亚马逊展开竞争。而在今年,双方在技术和连接上的竞争更加白热化。一方面,双方不断通过各自语音助手整合和连接更多的设备与服务,亚马逊甚至向第三方开放了Alexa核心的麦克风语音技术;另一方面,谷歌也在技术上有所突破,实现一台设备的多人使用,目前可支持6人。

而这背后正是家庭入口的争夺,谁抢占了这个入口,就可以掌控所有信息的输入,以及数据流和消费流,其市场规模和潜力难以想象。

二、智能语音助手的技术逻辑

1950年,计算机科学家阿兰·图灵就在其论文《计算机与智能》中提出了著名的“图灵测试”,这是最早探讨机器智能与人机交互的代表。

在1952年,贝尔实验室研制出首个利用分离技术的实用语音识别设备,能识别出10个英语数字发音。

从1950年开始至今,语音识别技术经历了由小词汇、孤立词汇的识别,到大词汇量、特定声音识别的飞跃发展。然而,语音识别技术只是智能语音助手实现工作的第一步。

4

总的来说,语音助手实现其工作大体要经过三步:其一是前端的语音识别,即将声音转换成文字;其二是自然语言的理解,将文字解读成行为;其三是通过开放API接口等技术来实现行为等操作。

因此,语音助手能否提供强大的服务,主要取决于其技术和连接整合能力。在技术上,主要使用云计算、语音识别、语音合成等AI技术。即在前端面向用户时,主要需要语音识别、语音合成技术。在语音识别时,系统需要把语音转化成文字,这就需要强大的语音库作为支撑,就需要云计算技术。而语音合成则是将反馈的文字结果转化成语音输出。

在后端则是人工智能技术的使用。面对用户的众多请求,语音助手需要通过机器学习(深度神经网络)来不断自我学习,了解用户的说话方式和爱好需求,进而输出个性化的服务。

而其连接整合能力就是指,语音助手将越来越多的设备和服务接入,从而构建自身生态的能力。尤其是在智能家庭中,用户最终获得的是体验和服务,单一设备单一APP控制不是智能家居的追求,智能家居需要的是形成一个生态,形成一个闭环,从而通过一个入口来更便捷的控制所有设备。而这需要语音助手平台一方面开放其语音助手,另一方面也要加强商务合作,来聚合服务。

三、智能语音市场将达百亿

据工业和信息化部电子科技信息情报研究所数据显示,2012年以来,全球智能语音产业规模持续快速增长。2013年,全球智能语音产业规模整体达33.7亿美元,同比增