苹果谷歌微软火拼语音控制 手里的王牌都有啥

智东西(公众号:zhidxcom)
文 | 十四

当老派的小伙伴都还沉浸在对《星际迷航》的向往中时,新派的小孩已经逐渐步入语音控制的时代了。

语音控制是基于语音识别的程序应用,技术目的在于实现去操作界面化,实现完全语音控制,成为智能助手,乃至私人管家。虽然不论是硅谷三巨头,或是业界新生代,还是坊间小公司,都还不能实现全面的语音控制,并在其对电池消耗方面束手无策。但技术的开发和进步俨然带来新的曙光,一场语音控制产业战正拉开帷幕。

苹果谷歌微软火拼语音控制 手里的王牌都有啥

OK Google:优势与隐患并进

全面语音控制功能与应用深度整合,需要在系统层面而非仅仅在API调用层面完成。这一点,谷歌显然具有相对的技术先机。另外,在大数据索引(Googe Search)和仿神经网络深度计算(DeepMind)的优势下,谷歌的语音识别也显得更为灵活。

OK Google语种丰富,能够理解部分俚语、谚语,可调用谷歌地图进行定位导航,最新还开通了离线功能。同时,其也能应用于Android、Chrome以外的设备,并被逐渐整合入谷歌智能家居(Nest)系列产品。

不过,OK Google也被质疑窃取用户隐私、存在程序黑匣、默认保存大量语音数据——前日,开源网页浏览器Chromium被曝,会在后台默认自动安装音频解码应用,监听、记录环境中的所有声音,存在严重的用户隐私威胁。谷歌辟谣称此为Debian系统的个别行为。

当然,OK Google(Google Now)或好或坏,对于国内用户而言,并没有半毛钱关系。

苹果谷歌微软火拼语音控制 手里的王牌都有啥

Siri:苹果自己也能玩的挺好

惯例,苹果并不是这一产业的技术担当,其大部分网络服务都运行在英特尔和AMD的服务器芯片上,但这些处理器并不太适合运行Siri 。

然而,苹果自己还是能玩的很好。今年的WWDC上,Siri成了多项应用程序背后的大脑,帮助用户完成基于环境的搜索,或是通过Apple Watch回复电子邮件。

日前的HomeKit智能家居系列也引入了Siri,进行开关灯、调节温度、运行咖啡机等智能的语音指令。苹果软件业务负责人Craig Federighi宣称,Siri的单词出错率只有5%,苹果将会把Siri的更多功能开放给开发者使用。

苹果谷歌微软火拼语音控制 手里的王牌都有啥

Cortana:微软的谜之取向

微软官博宣布,语音控制程序Cortana(小娜)将出现在Windows 10界面,融入Office 365作为“私人秘书”帮助用户获取文件,发送Email,并展示即将到来的会议等。这一举动颇具微软的一贯风格,去你的大数据索引,去你的文科生设计感,咱们就是要正正经经滴工作学习。

谷歌和微软是最早一批实现自然语言搜索的科技公司。不同于OK Google基于复杂数字图像处理芯片(GPU),微软的语音识别则是基于特定任务的可编程门阵列芯片(FPGA)。

不过,日前谣传微软打算收购AMD,或暗示Cortana打算投入仿生神经网络系的智能语音识别及深度计算的阵列。

苹果谷歌微软火拼语音控制 手里的王牌都有啥

大战在即?

对于语音控制这一领域,技术方面,仿生神经网络可能更具前景。而应用方面,智能化设备将不可避免地,发起一场大战。

几乎所有的智能设备都在引入语音控制的功能,包括国内外的智能手机、智能手表、智能家居、无人驾驶、家用/工作电脑等各个产业。它描述的是一种更为快捷、流畅的人机沟通和指令下达方式。

恰如谷歌工程师所言,不管OK Google还是Siri,一款优秀的语音控制程序,需要随时处理各项或明确,或潜在的个人事务,自动总结用户生活习惯,提供的个性化服务。

苹果谷歌微软火拼语音控制 手里的王牌都有啥