智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
ChatGPT风靡,它展现出来的能力让一些岗位面临危机感,内容创作工作者首当其冲。这之中,翻译人员作为典型的文字工作者,如何在大模型时代快速拥抱技术,变“恐惧”为动力?AI的飓风会颠覆翻译行业吗?
智东西4月3日报道,今天下午,在2023中国翻译协会年会上,首届全国翻译技术大赛正式启动。前沿技术突飞猛进的当下,翻译工作者的工作模式发生了“翻天覆地”的变化。
▲ “首届全国翻译技术大赛”正式启动
大赛由中国外文局、全国翻译专业学位研究生教育指导委员会指导,中国翻译协会、中国外文局翻译院、大连外国语大学主办,百度翻译作为承办单位之一。
作为首个如此高规格的全国翻译技术大赛,与此前的翻译比赛不同,本次大赛聚焦译后编辑能力考查。除了以选手的翻译结果好坏作为评判标准外,本次比赛还会以百度智能文档翻译平台相关技术和产品为工具,增加了对选手使用机器翻译技术的评判。
首届全国翻译技术大赛官网:
https://fanyi.baidu.com/competition
当下诞生的文心一言、ChatGPT等生成式AI产品背后都是依靠深度学习技术和大模型技术的发展,这些技术和产品正在对各行各业产生各种各样的深刻影响,翻译行业同样如此,前沿技术正在改变这一行业的工作范式, 科技赋能翻译行业、赋能国家翻译能力建设已是大势所趋,“人机共译”创新工作模式亦是中国超500万译者需要重点关注的趋势。
一、AI技术+翻译的平衡点,人机共译成为趋势
前有能聊天、能撰稿、能翻译、辅助创作的先进生产力工具ChatGPT、文心一言,后有微软、谷歌将大型语言模型集成至办公全家桶,内容创作工作者的工作方式正在被重塑。这也让很多打工人发出疑问,“未来,我的工作会不会被AI替代?”。
与此同时,机器翻译技术的进步一直与翻译人员是否会被取代如影随形,毋庸置疑,随着技术的进步,机器翻译的效果会越来越趋向于专业人士翻译的高质量内容,但与专业的翻译人员相比,在短期内这种差距不会消失。
在这一背景下,一个关键问题摆在翻译行业面前,机器翻译和纯人工翻译的模式应该如何共存?回答这个问题,我们需要从目前这两种翻译模式的优缺点说起。
纯人工翻译的优势在于翻译的流畅度、还原度都有较高保障,但相比于“以秒为单位速出结果”的机器翻译来说,人工翻译的时间成本更高,再加上前沿技术的发展诞生了越来越多的各行各业专业名词,翻译人员的学习压力也进一步加重。
因此,机器翻译技术的极速发展给人工翻译带来了一定紧迫感。
另一方面,机器翻译除耗时短外,还能通过模型自学习涵盖不同行业的专业知识,对于新信息的接收速度更快。不过,人们对于机器翻译的不信任感仍然存在,且有大量实际研究证明,机器翻译对于语言中的情感理解、文字组织能力都有一定欠缺。
综合来看,纯人工翻译与机器翻译可以实现优势互补,人机共译的新翻译模式应运而生。
这种翻译模式的出现,不仅革新了翻译人员的工作模式,也给翻译行业提出了新的注解,其在机器翻译与人工翻译之间找到了一个更好的平衡点,合理运用前沿技术的基础上保证翻译的质量。
由此可见,诸如机器翻译等前沿技术的发展并不是一定要颠覆整个翻译行业,而是转变成辅助人工的生产力工具,作为一种能有效提升人工效率的存在。
二、百度智能文档翻译平台化身先进生产力工具
翻译行业从业者工作模式的变革,必然伴随着工具的进一步革新。
以此次大赛为例,百度翻译为大赛提供翻译技术和比赛平台支持,参赛选手采用百度智能文档翻译平台提供的技术和服务,这一平台是以机器翻译为核心的新一代智能自学习文档翻译平台,可谓是人机共译工作范式下的工具集大成者。
▲首届全国翻译技术大赛官网-百度智能文档翻译平台
人机共译模式下,翻译人员做的工作更像是成为机器翻译文本的编辑,因此,人机共译模式不仅要考察机器翻译能力,更为重要的是人与机器的协作是否流畅、便捷。
1、囊括4万+个翻译方向,能化身各行业“翻译专家”
百度智能文档翻译平台支持全球200多个语言互译、超4万个翻译方向,并且拥有学术、新闻、生物医药、金融财经等多个专业领域翻译模型,使得翻译效率提升100% ,在专业领域该平台的翻译准确率超过90%。
当在翻译平台上传关于学术期刊和机器人研究的相关文章时,百度智能文档翻译平台的翻译速度并没有受到文章翻译类型等影响。在描述“软体机器人模拟毛虫运动方式”时,其文字部分使用短句将英文中的长句分开,更符合中文的阅读习惯。
▲上为“机器人”相关PDF文件,下为“学术论文”研究相关Word文件
2、支持多类型文档上传,支持实时编辑+格式一比一对应
该平台对于上传的文档限制较小,支持Word、Excel、PPT、PDF等多种格式文档。
进入翻译工作台后,该平台会为用户提供整页预览和逐句对照两种模式,右上角会有编辑译文与导出按钮,方便翻译人员对其中部分措词进行修改、完善。
并且对于PDF版本的学术论文,其译文界面还会完全对照原文的格式。
3、6大一级领域+40个二级领域,权威高效的专业术语
还有一点与其他翻译工具不同的是,这一平台内置了百度翻译术语库和全国名词委术语库。在提交文档界面,该平台会为用户提供“术语提示”功能,其中包含工程科学、基础科学、生物医药等6个一级领域及40个二级领域,基本覆盖有翻译需求的不同行业。
翻译人员遇到更为前沿的学科内容或不熟悉的技术领域时,这一工具可以为翻译人员提供相关参考,省去翻译人员额外检索查证的时间。
即使前期没有选择相应“术语参考”领域,智能文档翻译平台也会根据用户划词的内容去定位相应行业。
4、机翻+译后+自学习,翻译助手“专业性”渐趋人类
如一些专有名词通常在论文中会有英语简写表述,但很多情况下这些专有名词在不同行业中的意义完全不同。以GPT这个词为例,在AI领域其意义是文本生成模型,而在医药领域GPT是谷丙转氨酶。
比如,如果翻译人员有特定研究领域,且相关专有名词有一定的重复性,在编辑译文的过程中,智能文档翻译平台还会根据用户修改的译文进行自学习,并在之后的翻译文件中优化翻译结果,使得机器翻译的结果与理想译文不断趋近。
综上所述,百度智能文档翻译平台将机器翻译(MT)、译后编辑(PE)、模型自学习纳入其翻译体系,能够大幅提升人机共译模式的工作效率及效果。
百度智能文档翻译平台与人工翻译、机器翻译两种模式的契合,使其成为人机共译时代的“重量级”先进生产力工具。
三、十余年AI全栈技术布局,深度学习、大模型提升机翻流畅、准确度
从更宏观的角度来看,机器翻译概念诞生至今已经超过70个年头,随着深度学习及大模型技术的发展,这一技术的产业化格局正在被重塑。
此次2023中国翻译协会年会4月4日的翻译技术主题论坛上,百度翻译还将联合中国外文局翻译院、中国翻译协会翻译技术委员会共同发布《2023机器翻译技术及产业应用蓝皮书》。
▲《2023机器翻译技术及产业应用蓝皮书》
技术的发展正在为翻译行业注入新鲜血液,随着机器翻译技术的不断变革,主流机器翻译方法也在不断迭代。在深度学习技术发展的背景下,能模拟人类翻译过程的神经网络机器翻译出现,2015年百度发布全球首个互联网神经网络机器翻译系统,使得翻译效果在语言表示、语义理解和译文生成等方面都有显著提升。
面向未来,正如蓝皮书所说,以ChatGPT、文心一言(ERNIE Bot)为代表的新一代预训练模型技术在语言理解与生成,特别是低资源、长篇章以及多模态的场景应用中表现出强大能力和发展潜力,与人的互动性和反馈学习能力不断增强。
因此,机器翻译在当下已经呈现出强大的产业化生命力。该技术在企业智能化升级、行业数字化建设等场景中的应用正在不断普及。以中石化全球战略为例,百度企业级智能翻译平台可以支持其全球化战略的庞大翻译需求。
▲百度智能文档翻译平台应用场景示意
这背后,离不开百度在深度学习与机器翻译领域的前瞻布局。
追溯至2010年,彼时深度学习仍处于发展初期,百度就已经开始布局深度学习,并于3年后建立全世界首个深度学习研究院(IDL)。今年2月,全球市场调研机构IDC发布的数据显示,2022年下半年,百度已经稳居中国深度学习平台市场综合份额第一。
在机器翻译领域,百度十余年来在多语言机器翻译、神经网络机器翻译、跨模态机器翻译等方面持续突破。目前,百度翻译已形成核心技术领先、产品矩阵丰富、产业应用广泛的发展生态。
当下,大模型和生成式AI时代的到来,正在为机器翻译留下新的注解。
与此同时,机器翻译的技术变革带来的应用扩展,也为翻译人员提出了更高的要求。可以看出,前沿技术的突破是不可逆转的发展趋势,作为翻译工作者如何在当下拥抱前沿技术,找到平衡点,是置身于行业中的工作人员与掌握前沿科技的科技大厂都需要关注的事情。
结语:机器翻译技术、应用大飞跃,为翻译行业开辟新赛道
人机共译已经成为当下翻译行业从业者的趋势,随着机器翻译在翻译质量、系统性能、实用性、规模化应用等方面均取得了较大飞跃,与人工翻译的契合度越来越高。
与此同时,技术的发展与进阶中,势必会对各行各业产生影响,这一背景下,翻译工作者更快拥抱前沿技术,并将其化身为真正的生产力工具才能在前沿技术发展的浪潮中站稳脚跟。