智东西(公众号:zhidxcom)
编 | 李水青

智东西8月14日消息,近日,马里兰大学研究者开发了一个新的语言处理模型数据集,其中涵盖1,200多个计算机难以解答的问题。据称,该数据集能帮助语言处理系统理解更深层次的语义。

只要你和Siri、小爱同学等语音助手对过话,你会发现要让计算机真正理解人类语言,还有很长的路要走。机器往往只能理解语句的表层含义,无法理解复杂的表述及深层含义。因此,计算机系统需要引入更复杂的话题进行训练,以提升“语言理解能力”。

马里兰大学的研究人员设计了一个平台,在平台上输入问题,不仅会得到机器的回答,还会看到机器回答的“思考过程”,了解是哪些词句触发了机器的“联想”。

团队进而开发了涵盖1,200多个问题的数据集,用以训练出更加先进的语言处理模型。这1200多个问题对人类来说可能很简单,却能难倒目前最好的机器对答系统。该成果发表在《计算语言学协会学报》(《Transactions of the Association for Computational Linguistics》)期刊上。

一、机器语言处理的痛点:知其然不知所以然

“当前,大多数能回答问题地计算机系统都无法被解释,人们只知道它会给出某个答案,却不知道它为何会给出这个答案。但是,经过研究,我们能够解读计算机真正理解的内容。”

目前,在大多数机器答疑系统中,都是人只负责提问,机器只负责回答。这种方法的问题是,当人们输入问题时,他们不知道问题的哪些具体要素会使计算机感到混淆。当计算机接收问题时,他们要么只理解到字面意思,要么理解错误或输出一些无意义的话。

Boyd-Graber和他的团队致力于开发人类和计算机共同确认问题的新方法。团队创建了一个计算机平台,用以揭示了当人们向计算机提出问题后,计算机在想什么。然后,根据机器的思考局限,人们可以进一步编辑完善问题,进而获得更加完备的答案。Boyd-Graber是该论文的作者之一,在马里兰大学高级计算机研究所和信息研究和语言科学中心任职。

二、破获机器理解的线索词,微调问题获得答案

在团队设计的平台中,当人们输入问题,计算机对问题的相关“联想”就会按顺序出现在屏幕上,同时标注出引起猜想的单词。

例如,如果提问者写道“哪位作曲家的Haydn主题变奏曲受到Karl Ferdinand Pohl的启发?” 系统给出正确的回答“Johannes Brahms”,并且界面会标记“Ferdinand Pohl”这个词,以表明是这个短语触发了对应“联想”。

获得了这些信息之后,提问者可以进一步调整问题措辞,使计算机避免“读错题”。在这个例子中,提问者紧接着将“Ferdinand Pohl”改为“维也纳音乐厅的档案保管员”,这导致计算机回答不出来这个问题。

通过人机合作,研究团队开发了1,213个计算机难题。这些问题对计算机来说很难,经测试,在这些问题上,即使是当前最强大的计算机系统都会输给人类。

三、理解机器思考方式,训练机器学习算法

“三四年来,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄。”马里兰大学计算机科学研究生、该论文的共同作者Shi Feng说,“但是,从学术领域来探讨这个问题,我们的论文还是学界第一篇。”

研究人员表示,这些问题不仅可以作为计算机科学家的新数据集,使其更好地了解自然语言处理的不完美之处,还可以作为改进机器学习算法的训练数据集。

研究人员将这些问题分为两大类,六小种。

第一类是语言现象。首先是释义,例如“从悬崖跳跃”应该理解为“做出重大抉择”;然后是分散注意力的语言;最后是意外的背景。

第二类涉及推理技巧。首先是需要逻辑推理和计算的线索;然后是问题中元素的心理三角测量;最后是综合多个部分以形成结论。

结语:让机器从树叶看到森林

“人类可以更多地概括并看到深层次的联系。”Boyd-Graber说,“他们可能不像计算机一样拥有近乎无限的记忆力,但他们有看到树叶背后的森林的能力。

“编录计算机语言处理的疑难问题,有助于训练出更高级的语言处理模型。这样,我们才有可能促进计算机学着像人类一样对话。”

Boyd-Graber认为,在达到这个目标前,我们还有很长的路要走。但是,这项工作提供了一个令人兴奋的新工具,它能辅助计算机科学家实现这一目标。

“我们正在制定未来几年的研究议程,以促进计算机更好地回答问题。”Boyd-Graber说。

文章来源:Sciencedaily