【嘉宾观点】“语音进化论”干货分享:是音箱,更是家庭助手

【嘉宾观点】“语音进化论”干货分享:是音箱,更是家庭助手

京东智能市场总监 李俊周

请谈一下第一次接触到语音交互的回忆

我记得第一次见到语音识别的产品是IBM的ViaVoice,大概是2001年,那时候在读大学刚买了自己的电脑,发现还有能用语音做输入法的软件可用,当时还需要用一张光盘安装,但结果发现中文输入挺不准确的,速度也比较慢,只能算是一个不太实用的工具。到后来接触是参加工作以后,公司有一天来了一个新的虚拟前台,它其实就有点像今天的机器人,但是样子很普通,下面有一个底座,上面是一个显示器,主机装在下面,访客进来,可以跟它讲话查询公司通讯录的人,然后拨号打电话告诉对方已经到前台了,也说一段话用TTS转成文字,发给对方,这样虚拟的前台,大概是2005年的时候。

再到后来,大概是2013年,真正让我感到语音达到实用水平的是讯飞输入法,有时候即使很随意的讲一些日常口语,它也可以非常准确了。再之后,真正用到觉得智能语音走到我们生活里,成为日常生活中不可或缺的工具的就是叮咚(DingDong)智能音箱。所以我说,第一个比较兴奋的就是叮咚,真正体验到语音交互方式带来的便捷,我相信未来这种方式将成为我们生活应用场景中非常重要的一种交互方式。

您觉得现在看到的叮咚反馈,有什么样的期待我们要去改善的?

前一段时间我看到京东网站上叮咚(DingDong)音箱大概有4000多条反馈,从消费者的反馈来讲,大家的感觉还真的很让人兴奋,很有意思。大家有机会可以去京东上看看,从反馈中可以真正了解消费者的具体需求。

在业内有很多人说智能产品不像以前那么热门了,尤其在今年,可能从业者会觉得不像以前那么受关注了。但是从市场来说,智能产品的销量、品类数量都在快速的增长,很多新产品进入市场的速度越来越快,所以这个行业是在快速发展的。

具体到叮咚(DingDong),它不仅仅是一个音箱,更是一个家庭助手。初期以音箱进入市场,我觉得这跟消费者的期望值,还有场景有很大关系。一个能够语音交互的音箱,还有很多有用、有趣的应用,这样的音箱会让用户很容易感受到智能带来的价值。如果是一个机器人,可能他的期望值不仅仅是听懂说话,要更聪明,甚至要求形状像是一个人型。

今天的音箱,除了音质,还要能够去连接很多的内容,包括像喜马拉雅、咪咕音乐。音箱联网化后,内容就会像电一样,源源不断流入终端。如果再加上很好的语音交互方式,更方便的享受到音乐,用户会觉得,这个音箱真的比别的好很多。

另外还有很多信息服务的功能,需要有很人性化的交互方式。不仅能够准确识别,还需要让产品更有人的属性,这样它的温度就不一样,这个是我们做科技产品一个很重要的东西,这种交互、感觉,很多时候是真正决定能否进入大众市场的因素。

每次交互方式的变化,都会给行业、最终给用户带来非常大的价值。键盘、鼠标、图形界面发明之后,计算机就从一部分专业人士用的大型机,到个人电脑普及;手机也是一样,当有多点触控之后,这个产品让我们进入到了移动互联的新时代。我还记得2007年的时候,第一次拿到Iphone 1的时候,感觉这个东西太智能了,去看网页、收邮件,它能提供的东西让人感觉打开了一个新窗口。
语音也是一样的,为什么这么多人看好语音交互?想想每个人的感官,眼睛看到、耳朵听到,通过触觉感知到的,人跟这个世界的交互方式决定了机器的想象空间,所以说语音交互发展的空间,未来在产品里面所起的作用是非常大的。

未来一个机器人不仅仅是听你表达的意思,可能更多的站在你旁边,就知道你在想什么,就跟你的家庭成员一样。今天的语音,还仅仅是一个开始。

在面向未来语音技术的推广和应用,您的公司主要做的是什么?

京东智能是整个京东在智能化大趋势下的探索、创新的业务,大家对京东固有的印象就是一家电商公司,把商品卖给大家,送到家里。其实,我们希望未来京东做的不仅仅是提供商品,比如在京东平台上提供的智能化设备,通过我们的平台完成设备与设备之间的连接,人与设备的连接,还有服务的连接,达到万物互联,创造一些更好的服务体验。

因为我们看到一个趋势是,我们的生活越来越数字化,比如说可穿戴设备让“健康”数字化,比如说音乐,从磁带到光盘,现在流媒体会越来越流行,还有图书,其实很多的东西都在数字化。数字化的未来就需要去构建一个大的平台生态系统,这个生态系统里所有的智能设备,能够跟用户去交互,有很多的数据产生和使用,同时连接更多的服务。

京东智能在创造未来智能化的生活方式。具体到叮咚,我们现在这个产品其实已经是有很好的开端,是非常创新的品类,这种品类有技术的革新,有新的功能、应用价值,带来一些新的消费价值。
但是对于一个新品类来讲,目前还停留在部分人在使用,还没有到达最普通的消费者,达到家喻户晓,老少皆宜,当然这个也是很大的机会。最关键的是,我们的产品创新,应该往哪些方向去走,技术上的成熟度是不是满足普通消费者的需求。还有很重要的一点,真正找到体现消费者价值的应用场景,做到主流消费市场最需要和普遍的应用场景,大家都在寻找这些东西。有了这些具体的应用场景,并且把产品体验达到一定程度,找准真正的用户价值,再把产品推向市场,让每个消费者去认知、去使用。

还有,这种新的产品进入市场,除了产品创新、用户价值体现之外,还需要技术的合作、服务合作,包括销售渠道,都是很关键的因素。我相信随着大家对技术的研发,对产品功能、设计等等的提升,产品会越来越好,系统也会越来越强大,我相信,再过几年,可能家里的很多设备,都具有这种语音交互的能力,叮咚今天所带来的功能、服务,再过几年会更丰富、更人性化、更强大,甚至还有些是现在还没有看到、想到的。

描述一个你心目中最理想的语音交互的应用场景

我觉得未来的产品,起码在一个不久的将来可以实现的,第一个是从一个机器被动式接收变成主动式的分发,这个是我希望的;第二个,机器的功能达到“千人千面”,可以学习你的习惯、了解你的需求、提供更个性化的服务。另外,可以提供一些自动化的服务,不需要我们参与那么多,让大家更轻松。