搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

智东西(公众号:zhidxcom)
文 | Lina

智东西8月8日消息,今天,搜狗推出了一款实时语音转文字速记工具“搜狗听写”,使用了搜狗知音引擎的长时语音转写技术,为文字工作者提供会议、采访、写作等场景下的速记要求,用户可以在App商店免费下载。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

根据搜狗听写产品经理牛露云介绍,搜狗听写包括“听写”和“转写”两种模式:“听写”模式可在录音的同时给出实时识别结果;“转写”模式则可在离线状态下录音,录音完成后一次性获取文字结果。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

(搜狗听写产品经理牛露云)

此外,搜狗听写还提供边听边改(保存录音后,可以边听录音边修改文字)、根据语义自动添加标点、支持文本/语音标重点、多客户端同步、信息分享等功能,并且在人的说话音量低至30分贝时,依然可以识别。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

于此同时,搜狗听写也将推出Windows版,专注大会场景的实时速记;并且根据记者、作家、自媒体的需要,搜狗听写下一步将连接搜狗输入法的个人词库,引入“蜜糖还是毒药”、“赚得盆满钵满”等个性化词汇。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

(搜狗语音交互技术中心技术总监陈伟)

根据搜狗语音交互技术中心技术总监陈伟介绍,搜狗听写使用了搜狗知音引擎的长时语音转写技术,从立项到现在,错误率已经下降了30%。在声学模型方面,采用了端到端深度神经网络技术Deep LC-CLDNN+CTC技术,转写模式则使用了Deep CNN+CTC的方式,语言模型基于T级海量输入法文本数据使用神经网络进行建模。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

(搜狗公司语音交互技术中心总经理王砚峰)

搜狗公司语音交互技术中心总经理王砚峰表示,搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互+知识计算”的技术战略。发展一年之后,目前已经完善了引擎架构:基于搜狗输入法和搜索引擎两个入口,以大数据+深度学习为基础,上层建造语言AI+语音AI+图像AI,再延伸至对话、翻译、TTS、OCR、识图等。搜狗的语音识别技术服务的日访问量也从2015年的0.55亿次/日 一路发展到2017年的2.6亿次/日。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造

王砚峰表示,在未来一年里,搜狗AI将会在更多的产品落地:1、可穿戴、车载、客厅场景内自主研发更多硬件;2、进一步推广AI云平台;3、在更多用户垂直场景下,推出更多用户产品。

其实,目前市场上已经有同类的产品,比如讯飞录音宝等,搜狗听写跟其他家的差异点在哪里呢?在回答智东西的这个问题时,王砚峰表示,搜狗听写与其他的差异在于两点:1、其他产品不能像搜狗听写那样支持长时间录音+免费转写支持;2、搜狗听写更面向垂直场景,在记者采访、作家写作等场景下进行了功能优化(比如加入远程蓝牙标注重点技术),为用户带来更好的产品体验。

搜狗推出语音转文字工具“搜狗听写” 专为作家/记者打造