搜狗推出“知音”引擎除输入法还应用到了车载导航

智东西（公众号：zhidxcom）
文 | 四月

8月3日消息，搜狗推出旗下语音交互引擎“知音”，这是一款基于深度学习算法的智能语音引擎，具有理解与思考能力。据介绍，“知音”具有识别速度快、纠错能力强、支持复杂多轮对话及匹配的服务能力。在搜狗看来，基于语义结构系统结构、搜狗垂直类应用的用户数据结合，是“知音”引擎的重要差异化优势。

产品优势

据介绍，在实际场景应用中，“知音”具有以下三点优势：
1、在语音识别方面，解决用户在说话过程中因语速过快而导致的吞音问题，语音识别错误率相对下降30%以上，语音识别速度提升3倍。
2、在语音交互过程中，支持用户修正错误的识别结果，可以使用自然语言进行改错，例如，用户可以说，把“张”修改为立早“章”，或者可以说，修改为文章的“章”。
3、在语音理解方面，支持多轮对话，处理更复杂的用户交互逻辑，比如用户提出要去首都机场，机器可以反馈，“是去T1还是T2”，当用户确定航站楼，它会提问，是出发还是接人。

搜狗语音交互技术中心负责人王砚峰介绍，在今年3月份针对搜狗、讯飞、百度三家的语音引擎的第三方评测中，搜狗与讯飞能力持平，整体领先百度。

资源积累

活动现场，搜狗CTO杨洪涛介绍，搜狗从2012年开始研发智能语音技术，并在2013年进行深度学习探索，目前搜狗的智能语音技术已经应用到搜狗全线产品中。搜狗在线语音输入法语音助手请求次数超过1.4亿次，用户每天使用率占8%。依托于深度学习的语义理解，搜狗语义引擎较2013年应用之初错误率降低了60%，较2015年降低了30%。

要提高语义理解能力需要基于优质的、大规模材料，据杨洪涛现场表示，而搜狗输入法用户每天能产生的预料规模达到11.7万小时。他强调，这比当前任何语音技术团队所使用的预料规模都要大。此外，搜狗表示正在通过端到端的模型、主动积累错误反馈、线上部署GPU加速等手段促进机器语义理解的智能性。

在具体应用层面，搜狗也强调了垂直类产品的场景化应用特性。

结语

凭借搜狗输入法、搜狗地图等应用的大批量用户数据基础，搜狗语音引擎在训练数据方面具有较强优势。活动尾声，杨洪涛表示出搜狗语音的开放态度，但他强调搜狗并不会做成平台类的语音引擎，仅会筛选部分垂直类场景化应用合作方。据杨洪涛透露，现阶段已达成的合作包括基于车载导航的四维图新。

受限于场景和语音背景的复杂多变，通用型的语音引擎现阶段并不能满足用户预期。将注意力和资源集中到某个痛点场景下攻破，不失为一条有效之路。

产品优势

资源积累

结语

相关推荐