搜狗推出“知音”引擎 除输入法还应用到了车载导航

智东西(公众号:zhidxcom)
文 | 四月

8月3日消息,搜狗推出旗下语音交互引擎“知音”,这是一款基于深度学习算法的智能语音引擎,具有理解与思考能力。据介绍,“知音”具有识别速度快、纠错能力强、支持复杂多轮对话及匹配的服务能力。在搜狗看来,基于语义结构系统结构、搜狗垂直类应用的用户数据结合,是“知音”引擎的重要差异化优势。

产品优势

搜狗推出“知音”引擎 除输入法还应用到了车载导航

据介绍,在实际场景应用中,“知音”具有以下三点优势:
1、在语音识别方面,解决用户在说话过程中因语速过快而导致的吞音问题,语音识别错误率相对下降30%以上,语音识别速度提升3倍。
2、在语音交互过程中,支持用户修正错误的识别结果,可以使用自然语言进行改错,例如,用户可以说,把“张”修改为立早“章”,或者可以说,修改为文章的“章”。
3、在语音理解方面,支持多轮对话,处理更复杂的用户交互逻辑,比如用户提出要去首都机场,机器可以反馈,“是去T1还是T2”,当用户确定航站楼,它会提问,是出发还是接人。

搜狗语音交互技术中心负责人王砚峰介绍,在今年3月份针对搜狗、讯飞、百度三家的语音引擎的第三方评测中,搜狗与讯飞能力持平,整体领先百度。

搜狗推出“知音”引擎 除输入法还应用到了车载导航

资源积累

活动现场,搜狗CTO杨洪涛介绍,搜狗从2012年开始研发智能语音技术,并在2013年进行深度学习探索,目前搜狗的智能语音技术已经应用到搜狗全线产品中。搜狗在线语音输入法语音助手请求次数超过1.4亿次, 用户每天使用率占8%。依托于深度学习的语义理解,搜狗语义引擎较2013年应用之初错误率降低了60%,较2015年降低了30%。

要提高语义理解能力需要基于优质的、大规模材料,据杨洪涛现场表示,而搜狗输入法用户每天能产生的预料规模达到11.7万小时。他强调,这比当前任何语音技术团队所使用的预料规模都要大。此外,搜狗表示正在通过端到端的模型、主动积累错误反馈、线上部署GPU加速等手段促进机器语义理解的智能性。

在具体应用层面,搜狗也强调了垂直类产品的场景化应用特性。

结语

凭借搜狗输入法、搜狗地图等应用的大批量用户数据基础,搜狗语音引擎在训练数据方面具有较强优势。活动尾声,杨洪涛表示出搜狗语音的开放态度,但他强调搜狗并不会做成平台类的语音引擎,仅会筛选部分垂直类场景化应用合作方。据杨洪涛透露,现阶段已达成的合作包括基于车载导航的四维图新。

受限于场景和语音背景的复杂多变,通用型的语音引擎现阶段并不能满足用户预期。将注意力和资源集中到某个痛点场景下攻破,不失为一条有效之路。

搜狗推出“知音”引擎 除输入法还应用到了车载导航