【嘉宾观点】“语音进化论”干货分享:做好自有品牌生态链的整合

【嘉宾观点】“语音进化论”干货分享:做好自有品牌生态链的整合

北京方正信息技术有限公司智能+产品部总经理 余斌

请谈一下第一次接触到语音交互的回忆

我第一次接触人工语音大概就是『刷卡太快请重刷』,这是每个人在公交车上都会遇到的最简单平常的人机语音交互了吧。

到后来,我们开始接触APPLE的产品,发现了APPLE的SIRI真是太神奇了,能够与用户交互,用语音的方式来播号,管理手机APP,制定工作日程等等。后来,接触到讯飞的中文语音技术,发现我们中国的讯飞在语音领域的技术并不比SIRI差,而是有过之而无不及的。讯飞语音技术可以完美地解决我们中国人在汉语言的语音控制交互,同时将人机输入指令进行真正的应用落地。

去年开始,我们北大方正集团的下属公司,北京方正信息技术有限公司和京东之间制定了一项新的战略合作方向,其中就包括智能语音的叮咚(DingDong)品牌系列产品。叮咚(DingDong)这样产品的出现,让我们意识到语音智能产品的市场潜力巨大,而且很接市场地气。语音指令用平常的对话方式说出来,叮咚(DingDong)都能听得懂,理解得了。比如,在学语的幼龄孩童口齿发音并不十分清楚,有的讲话语速也较成人快,往往大人一遍也听不清,但叮咚(DingDong)却也能听得懂,并做出正确的指令反应,播放儿童故事、儿歌、天气、答知识等等。人工语音在未来的市场上,的确大有可为。

就我个人理解,人工语音技术现在是一种更方便更具未来感的操控方式。但这不仅仅停留在对设备产品的控制部分,而是要更侧重于控制指令后面所能对接的用户服务,及对这些垂直的服务综合整合的能力。如果只是简单的从触摸控制到说话语音控制的技术转换,这样产生的使用价值是有限的、偏向的,用户的粘性度也是远远不够的!如何能将语音、服务、分析、PUSH能力整合到一起,才是语音技术背后真正的杀手锏!为我们的消费者与用户群提供真正便捷舒适的生活!

语音交互在未来是什么样的地位?

语音语义确实很难。中文是博大精深的,老外们都觉得最全世界最难学的语言之一就是我们的中文。比如夏天时能穿多少穿多少,冬天能穿多少穿多少,两个语义完全不同。我们的叮咚(DingDong)是整合了讯飞的技术与京东的平台服务所落地的跨时代语音智能产品,让广大消费者眼前一亮。众所周知,漫威的电影IRON MAN里有一个超智能管家“贾维斯”,能独立思考,会帮助钢铁侠处理各种事务,计算各种信息,平常也是用语音来与主人控制交流一切的。而我们现在所做的事,就是将这一电影中的场景在未来实现到每个人的身边,可以让每个人成为钢铁侠,都可以拥有属于自己的智能管家。

现在,我们还需要一步步地往前,需要市场前端人员把叮咚(DingDong)这样的好产品,通过我们的渠道能力,带给中国以至全球更多的用户,带给每个会使用中文语言交流的消费者。在用户数据不断累积的基础上,再去垂直定制细分化的服务内容。真正满足每个年龄段,每个层次人群的个性化需求,幼儿陪伴、老人陪护,基础教育改革等等,真正融入千家万户的生活中。大家试想一下这样的场景,在家中烹饪,抬手突然发现酱油用完了,自言自语了一下,这时候叮咚(DingDong)就在旁边自动语音提示,自动进行您的京东订购记录查询,询问主人,您是不是还用上次采购的品牌酱油,是不是选用京东到家服务,30分钟内就可以为您送货到家。多贴心,多实用。

语音所提供的内容也很重要,拿最基本的音乐服务举例,想听一首《南山南》,目前智能语音会帮你准确找到这首歌,并且播放。然后,播放后,它还会继续播放其它各种版本不同人唱的《南山南》。当然,这并不是机器理解有误,而是作为使用者的人类,有时他的语言表达出来,也并不具备明确指向性,能和所调用的内容完全符合。其实使用者可能想要听民谣,可能是表达想要听中国风的音乐,可能是想在入睡前想来点适合睡眠的音乐。所以,我们目前解决了版权和曲库,解决了播放问题,但在音乐内容整合细分化上,在这种用户服务上的深层需求,还需要整个研发团队去不断钻研和整合。

在未来,我们每个人的声纹可以在叮咚(DingDong)上识别。在语音服务上,每个人的声纹与指纹一样,设定好不同权限后,机器与后台就能根据声纹来判别不同的用户,调用不同的云数据,分辨不同的用户喜好,做出更为准确、贴心、个性化的智慧服务。

我们方正现在也在IT行业中与大量品牌的3C产品与智能硬件打交道。其中不乏一些尖端的黑科技类产品。今天中国市场,乃至全球市场,有很多大咖级的品牌方厂商都在想尽方法做自有品牌产品的生态链,布局智慧家居,对传统家电的智能整合。这是一个未来的准趋势!

现状是几乎任何品牌商都想制定自己的标准,让自己的标准再去成为行业的标准。但基于用户思维与使用习惯的考虑,如果我们为了用身边的这些大小家电,电器设备,而导致我们的手机里需要安装,充满着成百成千的不同品牌的APP,而这些设备又不能很好的串联起来,场景使用缺失,想像这样的使用感受,究竟是智能还是反智能?这个绝对是有悖于我们真正去使用智能产品的方法。所以我个人认为,人工语音技术应用在入口与解决方案等方面才是发展的趋势,所以我们投入了,我们对这样的未来寄于厚望!

中文语音,科大讯飞绝对是此领域中的佼佼者,而中文也是一个能覆盖全球的语言,华人在全球覆盖率也毋需再提。所以我们在叮咚(DingDong)的产品上,整合京东平台的资源与服务,与国内各品类的优质3C数码、家电产品等品牌携手共进,全面地整合,形成一个强大的硬件、软件及服务的产品球,把它推向全球市场,这也是我们重点合作的战略方向。

在面向未来语音技术的推广和应用,您的公司主要做的是什么?

北大王选教授一项伟大发明让中国人告别铅与火跨入光与电,创立了今天的方正,方正集团业务领域涵盖IT、医疗医药、房地产、金融、大宗商品贸易等产业,海内外共有六家上市公司。员工3.5万余人,总资产超过1500亿元。北京方正信息技术有限公司也是属于方正集团旗下全资子公司,注册资金2亿元,有近500名员工(含店面人员),归属于方正信息产业集团(方正IT),是专注于IT分销和零售管理的服务商,依托APPLE产品,满足广大企业用户和个人用户的多样性需求,也是Beats、Bose、叮咚(DingDong)、安普、康普、EPSON、Canon、安讯士、博世、施耐德、宝施玛、OKI、等众多IT品牌的全国总分销商,全国建立广泛的合作伙伴关系,拥有上千家渠道打造优质的分销和零售“生态系统”,近三年保持平均超过50%的速度增长。

在日新月益的IT市场,我司不仅是传统IT市场中的平台,专注致力于该领域市场的供应链增值。如何将我们的终端与用户信息回返,贴合行业中的特定修改的产品需求,反馈给我们的合作品牌与上游厂商,一起来研发出市场上大家想要的产品,真正地解决消费者的痛点,真正把我们的语音产品做到更接地气,销售市场落地。

在面向未来语音技术的推广和应用,您的公司主要做的是什么?

科技发展日新月异,我时常在想,高科技类的消费类电子产品也好,智能类产品也好,一定是和人的生活息息相关,是回归生活本质的,而这些也是我们一直所关注的。一艘核动力航母的技术革新,是科技进步,但对于我们老百姓的日常生活来讲并没有太大关联度。而我们现在所遇见的语音技术的发展,能够真正将我们身边的生活进行质的改变,获取知识与信息等等生活方式变得更为便捷,生活场景化更为舒适。而这些,是我们与各位一起努力,在1-2年内就能看到的未来。

我们希望,随着我们的语音技术的推广和应用越来越广泛,人类的生活会越来越美好。