自然语言处理技术如何解读手语?国外研究者谈四大解法

智东西(公众号:zhidxcom)
编译 |  李慧楠
编辑 |  江心白

智东西8月16日消息,据外媒Tech Xplore报道,在计算语言学协会(ACL)第59届年会上,一篇名为《将手语纳入自然语言处理》(Including Signed Languages in Nature Language Processing)的论文获得了最佳主题论文奖。

论文中写道,由于当前手语处理(SLP)模型的局限性,为了应对手语被纳入自然语言处理(NLP)面临的挑战,创作者们提出4点方案:(1)采用有效的手语标记方法;(2)开发基于语言的模型;(3)收集更多现实世界的手语数据;(4)研究的每一步都与失聪人社区保持合作。

据了解,NLP技术包括文本生成、文本分析、自动摘要、智能问答、机器翻译、知识库构建、深度学习算法、语音识别与聊天机器人等,这些技术能更好地促进了人们相互交流。但NLP研究通常只关注口语交流,几乎不包含全球200多种手语。据悉,全球依赖手语交流的人群约有7千万人。

参与论文创作者有:Kayo Yin、Amit Moryossef、Julie Hochgesang、Yoav Goldberg、Malihe Alikhani。创作们分别来自于卡内基梅隆大学语言技术研究所、巴利兰大学、加洛得大学语言系、艾伦人工智能研究所、美国匹兹堡大学计算机与信息学院。创作者们发表这篇论文是希望能够改变手语不被重视的现状,并且他们还呼吁NLP研究需要包含手语研究。

自然语言处理技术如何解读手语?国外研究者谈四大解法

论文链接:https://arxiv.org/abs/2105.05222

一、标记器无法完整解读手语,研究者们展开技术合作

研究者们在论文中写到,虽然手语和口语在运用上有所不同,由于两者都表达了自然语言的语法、语义,因此NLP的基本理论可以扩展到手语。NLP应用程序通常依赖低级工具,如标记器和解析器,因此他们将邀请专家对核心NLP工具进行更多的研究。

“我们还需要NLP研究者与手语研究者携手合作,如果我们只看计算机视觉效果,就无法完全理解手语的含义。”论文创作者Yin说道。当人们使用手语时通常也会运用面部表情和身体动作,这些动作一次性传达很多文字。同时,手语中也包含便捷语,这些便捷语类似于口语中的指代词。

Yin称,很开心他们的论文受到好评,吸引更多人关注手语。在巴黎综合理工学院(École Polytechnique in Paris)读书期间,她在一家流浪者收容所做外联工作。在那里,她看到一名失聪妇女非常艰难地与他人沟通,那是她首次对手语产生兴趣。于是她开始学习法语手语,并将手语翻译作为本科研究一部分。

二、手语未广泛采用书面形式,缺乏语言可能性探索性

手语的表现形式对SLP模型来说是一个重大挑战,与口语不同,手语并没有被广泛采用书面形式。目前手语的表现形式有视频、注释、动作姿势、书面符号等。

自然语言处理技术如何解读手语?国外研究者谈四大解法

▲带有视频帧、姿态估计、注释、书面符号的美国手语,英文翻译为:你叫什么名字?

同时,在构建SLP模型时,也往往缺乏对手语语言可能性的探索。因此,研究者们邀请CV社区(CV Community)的研究人员与NLP研究者进行合作,因为CV社区在视觉处理方面拥有更专业知识。

除此之外,研究者们还致力于在NLP中开发更有价值的工具来研究SLP模型。为了更好保证研究的准确性,研究者们与失聪社区进行合作,不仅可以收集更多的数据来构建模型,还能让手语使用者最大受益。

三、口语主导环境影响下,手语研究逐渐被忽略

“然而,在以口语为主的社会中,聋哑人经常被鼓励使用唇读或文本来交流。将手语排除在现代语言技术之外,这进一步抑制了手语的发展。”创作者们在论文中写道。

Hochgesang是一位研究手语的聋人语言学家,她称在攻读学位时,几乎没有任何文献、语言学课程和NLP研究提到过手语研究。在语言研究中,口语似乎就代表了人类语言,而其他类型语言则被忽略了。

“就我个人而言是很难过的,那些语言研究完全忽略了我的研究方向。然而,如今关于手语研究情况仍然没有太多改善。更好改变现状的方法是更多人参与研究。”Hochgesang说。

结语:手语研究需要被重视

当今时代,很多人认为手语是专为聋哑人士所用,但其实手语也是有声语言的重要辅助工具,只不过对聋哑人士来说,手语是主要沟通工具。在日常生活中,人们也经常会用简单手势或者面部动作等来替代口语,不过更复杂手语动作可能需要专业的训练来习得。

在人类语言发展史中,手语的使用甚至早于口语,手语的功能更是不可忽视的。但由于地域文化差异等,手语的也有很多种类,如何建立更好更标准化的手语值得人们思考。同时,作为人类语言的一种表达方式,关于手语的研究也需要被重视。

来源:Tech Xplore