头

巨头没少烧钱 为何我们对语音控制仍没信心?

四月头条2015/10/02

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

智东西(公众号:zhidxcom)
文 | 四月

从2011年10月4日,苹果在iPhone4s机型上开创性地配置Siri语音控制功能,并相继在2012年宣布支持中文语音识别和互动开始,语音助手浪潮首先在手机端应用掀起。

经过五年的发展,原本通过手动的人机交互模式已衍生出许多口令式应用场景,与此同时,在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式也逐步成为标准性功能配置。

111005_233551_iPhone4TW-01

虽然,语音交互领域俨然被吹捧为又一智能蓝海、智能领域的入口之一,国内外科技大佬也因此没少在其投钱。

然而,回到现实应用场景里,我们当中有多少人真的像手动触屏操作那样信任语音助手?一天中有多少次开启过语音互动功能?从我们身边的用户和自身的使用习惯看,用户对语音操控仍然极度缺乏信任。

当今语音技术格局

5873SP2Y3HG1

从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。

专注于中文语音智能领域而言,以传统的语音技术提供商科大讯飞为首,无论在技术还是市场者占有领先地位,已知的合作厂商如京东微联、锤子科技、长虹、创维、三星等家电厂商;腾讯,百度两大科技巨头也通过其团队实力的优越性展现了后来者居上的姿态;苏州思必驰,捷通华声,云知声等相对较年轻的技术服务商在整体识别率十分抢眼;以及一些背靠其他学术或技术团队的小公司也正在积聚力量。

基础:手机使用场景

2015082017253352406

从iPhone的Siri开始,通过语音助手在手机上实现读短信、介绍餐厅、询问天气、设置闹钟、自然语言输入、调用天气预报、日程安排、搜索资料等功能已不再新鲜,通过后期的技术迭代,学习新的声音和语调,提供对话式的应答等能力也不在话下。

同时,在应用类层面,如微信、新浪微博、语音搜索、365日历、掌阅、91熊猫看书以及各大导航类应用也全面引入了语音识别、语义理解等功能。

潜力:家居物联网

83477D4F0B96C8D955F39B66AA1750FD

随着物联时代的兴起,家居物联这块蓝海市场也吸引了众多科技公司的押注,而其最基本的接入方式。

在国外,三大科技大佬已开始布局,苹果就在今年6月初的苹果全球开发者大会(WWDC)上,推出了自家首个智能家居平台Homekit,其亮点也正是整合了Siri——具有语音控制功能,对于借用第三方应用或其它硬件而实现智能操控的国内智能家居系统无疑更容易打动用户。与此同时,微软近日也宣布将把微软语音助手Cortana引入家庭自动化设备制造商Insteon在Windows Phone的应用程序中。而谷歌早在去年也通过收购收购Nest Labs成功进军智能家居市场,并在今年5月份的谷歌I/O开发者大会上推出了以Android为核心的Brillo系统,以及Google Now新的智能应用功能。

国内市场方面,京东借由DingDong音响的语音交互功能作为物联家居的入口、以及通过类似布丁机器人等家庭机器人的人机语音互动入驻智能家居等模式也屡见不鲜。

所谓的“标配”真的实用吗?

102303458-152435606.530x298

如果仅从配置要求方面而言,如上所述,语音智能技术确实已成为主流,但根据相关数据显示这一功能的使用率并不高。

在大多数情况下,语音交互变成了消遣娱乐的“游戏”,并未成为真正帮助人们操控设备的工具。究其原因,笔者认为主要在以下几个方面:

1. 语音识别率、语义理解力不足。虽然国外有迭代数次的苹果Siri语音助手、以及谷歌、微软等硬实力派的加盟,但据业界人士表示,从目前语音识别率提升至99%甚至100%的路还很长。这主要是语音易受场合、情绪、身体状况、内容上下文等影响的特性决定;

2. 中文语音的复杂性。由于中文的复杂性,其语音、语调、方言等多重因素的影响,造成汉语语音识别比英语在准确性更具挑战,以及在不同的语境内使用不同的字和语气,甚至包括隐语之类的东西,在英文里都是很少有的,所以偏重英文识别性能的外国技术在中文语音识别和语义理解方面显得“水土不服”,而这一点也需我国自主技术厂商的努力;

3. 缺少极为匹配的应用场景。虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;

4. 此外,为使用户更好地实现语音操作的过渡和转化,在语音技术与触控、体感等其他操控方式的结合也显得十分重要,如果简单地将之定位于触摸、按键等主流操作方式的替代品,必将导致较低的市场接受。

总结

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

但不可否认,语音交互已作为人机交互发展的重要方向,正逐步渗入到我们的日常生活与应用当中,引起了智能硬件行业的变革。

而谁能率先为智能语音交互创造更人性化的操作体验,在其算法的准确率、反应时间以及处理性能进行实质性的突破,定将为智能领域的发展创造丰厚的附加值。

Zhidx 智东西PC尾图 640