在围棋上打败人类之后,计算机在打字上再次夺魁

智东西(公众号:zhidxcom)

文|十四

计算机已经在国际象棋、问答游戏(Jeopardy)和围棋方面打败了人类。现在,在与计算机的又一场PK中,人类又输了——打字。

现在的语音识别软件,经过一代代的改良,已经能够更快更准确的在移动设备上输出文本内容,比我们自己用键盘敲字还快。

这是一项来自斯坦福大学、华盛顿大学和百度合作的研究:不论是英文还是汉语,计算机似乎在打字方面更胜一筹。百度首席科学家吴恩达(Andrew Ng)表示,打字这件事本身就不是针对人类的天性来设计的,比起用手指在手机键盘上敲字,语音显然是更符合人类的交流方式。

研究人员设置了一场竞赛,参赛者包括32名人类,年龄由19到32岁不用等,他们的对手是百度的深度语音项目(Deep Speech 2)。

人类选手轮流说话,然后给iPhone输入短语文本,比如“安全扣(buckle up for safety)”,或者“戴着布满珠宝的皇冠(wear a crown with many jewels)”,“这人就是个祸害(this person is a disaster)”啥的。

在围棋上打败人类之后,计算机在打字上再次夺魁

然后,研究者发现,语音识别系统实现了人类打字的三倍速。斯坦福大学的计算机科学家James Landay表示:“它能做到这种程度,超出了我的预料。快三倍!要是大家都知道这个事实,大家一定马上用它来打字了。”

实际上,语音识别软件仍然是一个被唱衰的玩意儿。这可能是因为人们使用它的感觉。比如苹果的Siri,这个让人又爱又恨的私人助手,老是回答不上来很多基本问题。

这次的研究中,斯坦福大学、华盛顿大学和百度的研究院并没有深究语音识别软件的查询技能,而是针对,或者说放大了软件的语音识别的能力。该软件敲英语的错误率比人类低了20.4%,敲汉语的错误率比人类更是低了63.4%之多。

Landay表示:“人们玩Siri的时候,可能有这种感觉,啊,它都不能给我正确的回答。于是,人们也就不觉得通过语音识别来输入文本,发送短信或者邮件,是一个好方法。”但事实上,语音识别软件完全已经能在这方面做的很好。

回溯到上世纪90年代,当时的研究结果表明语言识别软件的打字准确率远低于人类用键盘打字。而事实上,这主要是因为当时多变的俚语和房间里的噪声造成了一些影响。

这几年来,有一些原因改变了这一状况︰ 就像更多像素的智能手机摄像头,可以看到更多,内置麦克风,能听得更好。超级计算机处理数据的方式也变得更有效,也就是最近大热的”深度学习”。

现在,计算机已经能够接触更多的数据,并借此进行学习训练。就那百度来说,它已经搜集了五年的人类音频信息,而这个搜集过程至少会持续到2021年。

根据科技投资人,互联网女皇Mary Meeker的调研报告2016 Internet Trends Report显示:去年,全美65%的智能手机已经用上了私人助手。很多科技公司,比如谷歌和亚马逊认为,自然语言处理将成为产品发展的主要动力,于是要求和聘用大量该领域的专家和研发人员,并加大在这个领域的投入。