搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

智东西(公众号:zhidxcom)
文 | 李水青

导语:搜狗牵手录音笔老牌玩家并开放听写服务,用AI解决录音笔产业三大痛点。

录音笔一直是一个不火爆但很稳定的市场。但从2015年到2017年,全国录音笔销量以蜗牛速度仅从425万台增至432万台。虽然没有跌势,但不免引起人们的警惕——当年MP3是如何消失在人们的视野中的?

危机也意味着转机,软件技术起家的互联网公司搜狗从中看到了契机。在发布的AI录音笔获得了不错的销量之后,搜狗通过用户数据洞察发现,录音笔的主要使用场景竟然不是大家常识中的“采访”,而是会议培训等商务场景!

为此,搜狗认为基于特定场景录音笔大有可为。比如,利用AI录音笔为用户提供转写服务和智能编辑服务,这是搜狗已经落地实践了的。但是,要变革产业,还有很多事情搜狗难以独自完成,于是搜狗决定联合行业伙伴。

昨天,搜狗宣布开放其核心技术能力“搜狗听写”服务,并牵头爱国者、万城集团、索尼录音笔、Newmine纽曼四家录音笔行业头部企业成立AI创新联盟。

搜狗CEO王小川说,搜狗很少自称AI公司,但作为一家底色是技术型公司的互联网公司,AI是我们的技术之一。凭借输入法和搜索引擎的数据积累和多年来的AI技术战略布局,搜狗语音日均被使用6亿次,搜狗语音转写文段准确率高达95%。

搜狗CTO杨洪涛说,搜狗开放的听写服务更像是录音笔OS,它不同于市场上众多同类服务的原因,主要是它既提供转写、云端、智能编辑等强大的中台服务,还凭借搜狗输入法提供快速接入和硬件匹配的便利。

而AI创新联盟更是将互联网公司和录音笔硬件厂商聚在一起,共同探讨用户数据下的体验需求,提出软硬一体的AI录音笔解决方案,进而建立新型的录音笔生态。

一、录音笔行业式微?用AI切入会议培训场景试试

近年来,录音笔行业开始增长变缓。从2015年到2017年,全国录音笔销量从425万台增至432万台,增速迟缓。2015年到2018年的行业复合增长率为-1.57%。

录音笔行业主要面临三大痛点。首先,产品功能单一,市面上已有产品主要从音质、存储及电量上提升产品性能,服务体验无亮点;其次,一些用户选择手机、Pad等终端替代录音笔设备;最后,行业整体增速缓慢,产业链条发展动力不足。

瞄准了行业的痛点,搜狗在2018年入局录音笔行业,想打一场逆风翻盘仗。搜狗CTO杨洪涛回顾,从二十世纪30年代的老式磁带到70年代的数字录音与存储,再到九十年代随身数码录音笔诞生,录音笔的形态虽然发生了巨大变革,但是录音需求和录音设备长久存在。

今年3月,搜狗发布了新一代AI录音笔C1。这款录音笔身上被杨洪涛的团队寄托了三大待验证的猜想,或者说三种可能满足用户升级体验的特征。

首先,这款产品要有超强收音,搜狗采用双麦阵列和自研算法来实现降噪、还原人声。除了录音,这款录音笔还有免费文字转写功能,转写准确率高达95%。最后,考虑到传统的产品往往没有很好的考虑到办公会议等使用场景,C1录音笔还能够进行在线编辑、一键分享、实时互译、云端存储。

C1翻译笔上市首日销量超2万台,并且成为当季最主流的录音笔产品。与此同时,杨洪涛和他的团队惊喜的发现,在2018年,录音笔在知名电商平台上的访客量竟然开始增长了,在2017年,这条增长曲线还可怜的让人唏嘘。

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

杨洪涛表示,我们当然不敢说这是搜狗的功劳,但我们看到了录音笔还被大家强烈地需要。于是,昨天搜狗还顺势发布了C1录音笔的炫彩版,以满足不同人群对产品调性的需求。

C1录音笔畅销数据的背后暴露了大多数人对录音笔行业存在误解。大多数人可能认为,录音笔的主要使用场景是记者、编辑等人员的采访工作,但是这份首次基于国内用户真实数据调查的录音笔行业报告却告诉我们并非如此。

报告显示,录音笔最常用的场景是会议,占44%,与培训场景结合构成占比68%的商业场景,而被寄予厚望的采访场景仅占21%。另外,数据表明,有60%的用户每周会超过3次使用录音笔,41%的用户每次使用超过10分钟,这意味着录音笔产品的粘性其实很高。

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

杨洪涛认为,当你在企业会议中录音,需要的可能是快速地整理出纪要并保证数据隐私安全;而学习培训录音场景中,你可能需要反复单句听,以复习知识点。这些信息能为产品开发带来很多新的思路。

从数据和用户体验的角度出发,杨洪涛发现录音笔行业还有很多价值可以挖掘,它现在只是需要冲破一个天花板。但是,他发现仅凭搜狗一家难以完成所有的事情。

于是,“开放搜狗核心听写服务”的想法诞生了。

二、开放搜狗核心听写服务,更像录音笔OS

杨洪涛说,搜狗开放的不是技术,而是服务。服务包含了优秀的转写技术,同时还有搜狗输入法的接入、负载着用户输入习惯及词库信息的输入法账号、多端同步编辑服务等等。

具体来说,一是优秀的转写技术,准确率达到95%,每日6亿次访问量被市场证明的语音识别技术。

二是搜狗输入法接入,目前搜狗输入法在PC端占有99%的市场份额,在手机端用户日活超4.5亿。合作商可以基于搜狗输入法庞大的用户基数,使用户很方便地把录音笔连在搜狗的PC输入法、手机输入法上,使用多种功能。

三是统一的输入法帐号。用户在输入法里留下很多个人的输入习惯、个人的词库、同事的名字、行业术语等。统一的输入法帐号可以使用户获得更准确的转写内容。

四是多端同步编辑,五是云存储服务。搜狗认为用户的录音和文稿是个人资产,利用腾讯云服务提供放心的存储,并使得用户可以随时调用。

搜狗的做法与市面上做的AI技术输出的公司不太一样。

搜狗公司AI交互技术中心总经理王砚峰表示,搜狗在做一个类似于OS的概念,就是录音笔OS。而市面上的公司大多只做技术服务接口。

王砚峰说,搜狗做的其实是两件事,一是完善中台服务,包含账户管理、转写技术、云同步功能、智能编辑等更强大的AI功能;二是为了合作伙伴更方便地接入搜狗AI能力,无论是需要连接手机的还是连接PC的录音笔,都能快速地接入到搜狗听写平台。

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

▲搜狗听写服务的开放图

三、王小川:不自称AI公司,但技术底色浓厚

搜狗做出这样的决定是有底气的。

搜狗CEO王小川说,搜狗很少自称AI公司,但作为一家底色是技术型公司的互联网公司,AI是我们的技术之一。

搜狗公司的AI发展路径一致很清晰,坚持“自然交互”与“知识计算”双驱动。落实到具体产品上,主要为语音交互系统知音OS和知识计算平台深智引擎。换句话说,落实在信息表达和信息获取两个层面。

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

目前,搜狗输入法语音请求峰值超过7亿次。在从文字走向语音的道路上,搜狗一挥手获得了巨大的市场份额。同时,搜狗的AI语音合成功能、搜狗分身都在今年成为AI界的重要新闻。

搜狗分身功能成为搜狗的一项技术壁垒。搜狗分身主播可以模拟一位不存在的主播播报新闻,而全球首个搜狗分身客服已经被平安落地使用。

在信息获取上,搜狗致力于让信息获取更精准。传统的搜索引擎是通过关键词来获得结果,但搜狗通过其立知系统,可以基于问题进行答案提取。同时,搜狗还支持60多种语言的实时翻译。

据王小川介绍,早在2017年,搜狗汪仔机器人作为《一战到底》的终极Boss,让人三分,关掉了抢答等功能,人类才能和汪仔对决。

王小川表示,总的来说,目前机器在表达和获取信息上,做的还是基础的事情。机器在语音识别、图像识别上可以取代人,在问答、对话、机器翻译上则是辅助人。对搜狗来说,前者目前仍主要用于手机端,今后扩展到其他的终端潜力巨大,而后者可以被应用于许多垂直领域。

对搜狗来说,以语音和图像识别技术为核心,并将对话问答技术接入以搜索和输入法为主要产品,这些已经落地。进而推出智能硬件、问答系统、医疗产品、智能助理等产品的发展,仍有待落地。

在技术研发方面,搜狗深入研究了神经网络机器翻译技术,在国际学术赛事WMT2017 中获得中英机器翻译全球第一;在NLPCC 2018,搜狗知音荣获语义理解比赛双料冠军;搜狗还结合语音识别和唇语识别两种技术,使得噪声条件下的语音识别准确率提升30%以上。

四、AI创新联盟:软件商与硬件商共同“老瓶换新酒”

虽然搜狗的AI语音实力足够硬核,但是要提升用户体验,要从手机等终端手中夺回录音笔市场,要重构录音笔行业的商业模式,绝非搜狗一公司之力可为。

搜狗转而牵头联合爱国者、万城集团、索尼录音笔、Newmine纽曼四家录音笔行业头部企业成立AI创新联盟。

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

索尼消费电子营业本部音频产品部总监翁国雄认为,录音笔的场景其实非常值得玩味。在日本有人买录音笔用来录鸟叫的声音,一些美国用户用来做日记。作为专注于硬件和音频的发展的头部厂商,索尼也对近年来需求的下降保持警惕。

录音笔会否面临十年前的MP3一样的被历史淘汰的命运?北京纽曼腾飞科技有限公司董事长王洪峰说:“录音笔不像移动电源、蓝牙耳机市场那么大,传统录音笔似乎到了衰老期,必须要变革。”

王洪峰认为:“从横向来看,MP3当年很火却短短几年被替代掉,这是因为它只有听歌这一小单功能,OPPO、索尼等强化音乐功能的手机一上市,MP3就进入了穷途末路。”

“录音笔产品也相似,手机等设备都有录音功能,但这一功能目前还没有被加强。一旦加强,许多低端的录音笔将被取代。”对此,万城集团总裁张少逸也认为,高端的录音笔产品问题不大,低端产品将慢慢被取代。

“从纵向来看,专业化、智能化、AI化能为录音笔产业开辟新的天地,搜狗‘老瓶装新酒’,能使很多人抛弃旧的录音笔,转向新录音笔。”王洪峰说。

爱国者电子科技有限公司销售副总裁郑鹏说:“我是用着搜狗输入法长大的,现在手机上点评都是用搜狗语音识别工具完成的。爱国者和搜狗其实有“爱搜狗”计划。”

通过牵头AI创新联盟,搜狗或许为硬件商和AI技术商提供了一个新的窗口。郑鹏表示,爱国者有26年研发、生产、销售的经验,和搜狗可谓强强联合。张少逸也认为搜狗和索尼录音笔的合作是“珠联璧合”。

谈到联盟的预定机制,杨洪涛表示,它更像一个AI体验联盟。“更多的是聚焦利用AI技术在场景中的应用,理解用户体验,把背后的思考拿出来讨论,这也是受到各大厂商的欢迎的原因吧。”

搜狗开放听写服务!用AI赋能录音笔产业,远离MP3的式微命运

结语:搜狗联合老玩家开辟新模式,产业AI化新范式

搜狗选择开放听写平台并建立AI产业联盟可能改变录音笔产业的命运。录音笔产业虽然现在仍在增长,但是一旦手机等终端开始强化录音功能,录音笔也可能面临MP3一样的式微命运。

搜狗开放其转写、智能编辑、云端存储等服务,并联合产业头部厂商来做这件事,有利用通过整个生态的作用,来解决智能笔行业的“功能单一”、“易被手机取代”等痛点,甚至从根本上变革产业。

搜狗“老瓶装新酒”的做法以及可能的变革目前来看对新老玩家都是有益的,索尼智能笔、纽曼等智能笔厂商都十分支持搜狗的这些举措。对用户体验及使用场景的深入挖掘,用AI赋予录音笔产品不可替代性,甚至更新产业的商业模式让新老玩家一起赚钱,这都是互利共赢的事情。

随着AI落地进入深水期,互联网公司不再满足于通过算法来实现单点式功能,而是越来越有能力结合数据、技术和C端优势,通过联合产业、平台开放,在细分领域构建生态以创造更大的价值。这可以说是产业AI化的很好范式了。