智东西(公众号:zhidxcom)
文 | 李水青

导语:这款翻译机懂得神曲《生僻字》,不窃取用户的个性特征数据。

智东西8月8日消息,西班牙当地时间8月5日,科大讯飞发布了讯飞翻译机3.0 Lite。同时,球星武磊签约科大讯飞,成为其首位品牌代言人,讯飞翻译机也成为皇家西班牙人足球俱乐部官方翻译合作伙伴。

2016年,科大讯飞推出了讯飞晓译翻译机,在国内开辟了这一新品类。2019年5月,讯飞翻译机已更新至3.0,能进行中文与58种外语互译,覆盖全球近200个国家和地区,支持离线翻译、方言翻译、行业AI翻译和拍照翻译等等。其中,离线翻译效果达到大学英语六级水平。讯飞翻译机3.0 Lite则会新增西班牙语的离线翻译,以便于用户在没有网络的情况下也能自由交流。

今天,在讯飞翻译机的媒体沟通会上,智东西提问了关于“外语译中文”的技术难点和用户数据处理的隐私问题。科大讯飞翻译机业务总经理翟吉博表示,目前主要的技术难点是“小语种数据匮乏”;而在用户隐私方面,讯飞翻译机则利用数据脱敏技术,以大数据集的形式对用户数据的共性进行学习,而不会关注用户数据的个性情况。

讯飞翻译机3.0 Lite发布:离线翻译识别率高达95%,精通7种专业翻译
▲讯飞翻译机的发展历程

一、离线翻译识别率高达95%,精通7种专业翻译

科大讯飞翻译机业务总经理翟吉博表示,翻译机的场景是极其多样化的。场景既涉及使用者的语言、语音、习惯,又涉及环境的嘈杂程度,还涉及翻译内容的多样性。根据不同的场景,讯飞翻译机将“听得清”、“听得懂”、“译得准”、“发音美”作为其四大标准。

从环境的复杂性来说,人们常在国外的展会现场、商场等场所使用翻译机。对此,讯飞翻译机对麦克风和扬声器进行深入优化,新款3.0版本使用4颗阵列式的麦克风和双扬声器,应对声音的干扰。

从内容的适应性来说,讯飞翻译机对产品进行专业细分和训练,可覆盖到医疗、金融等7个专业领域。比如“Mad doctor”,讯飞翻译机不会将这个医疗词汇错翻为“疯医生”,而会翻译为“精神病医生”。

从使用者多样性来说,讯飞翻译机独家支持方言和民族语言翻译,满足国人说话习惯。

在离线翻译方面,科大讯飞推出新一代离线翻译。具体来说,其离线语音识别引擎使用新一代端对端混合离线语音识别神经网络架构,离线识别率高达95%。离线翻译引擎采用自适应低精度翻译模型加速技术,支持的词库规模扩大一倍。讯飞翻译机还将四核处理器升级到八核处理器,使得性能翻倍。

讯飞翻译机3.0 Lite发布:离线翻译识别率高达95%,精通7种专业翻译
▲讯飞翻译机3.0升级离线翻译功能

在拍照翻译方面,新版本可以解析复杂版面。讯飞翻译机的新一代的拍照翻译,搭载了包揽CPR国际大赛三项大奖的OCR技术,可自动对焦,并采用3.1寸高清视网膜屏幕,使清晰度翻倍。

二、小语种数据不足是技术难点,数据脱敏以保护用户隐私

在采访环节中智东西问道,我们知道讯飞翻译机3.0在“中文-外语”方面非常快速和准确,那么在“外语-中文”的翻译效果上,讯飞从那些方面做优化,有什么技术难点?

科大讯飞翻译机业务总经理翟吉博表示,主要技术难点在于相关外语的可用数据不足。讯飞翻译机通过深度学习技术进行学习,需要相对较多的数据。在“中文译外语”方面,用户基础广泛,数据积累充足。但是,在“外文译中文”方面,用户数据积累仍有挑战。

比如,各国人说英语的口音不一样,但其只能通过很少的数据来提炼这些“口味英语”的特点,如何将各种口音都涉及到,这是非常难的。

当智东西接着问,随着用户隐私问题日益受到关注,讯飞翻译机是否会将用户日常产品使用中产生的数据存储下来,用以训练语言处理模型?

对此,翟吉博介绍,讯飞翻译机处理用户数据的方式和搜索引擎的原理相似,是以大数据汇集方式进行。所有的用户数据都会通过脱敏技术进行处理,以全集形式形成大数据集,对模型进行训练。讯飞翻译机提取的是数据的共性,而非个性。

讯飞翻译机3.0 Lite发布:离线翻译识别率高达95%,精通7种专业翻译
▲科大讯飞翻译机业务总经理翟吉博先生

当有记者问到讯飞是否打算做一款翻译APP?翟吉博表示,其实讯飞翻译机已有公众号和小程序可以提供翻译功能。据称,讯飞翻译机也有APP,其定位主要是以人际语言对话翻译为主,而不是文字翻译。

这实际上涉及翻译算法和硬件载体的关系问题。在智东西和翟吉博先生的场下沟通中,翟先生表示,讯飞也正在探索翻译耳机、手机软件等多种载体,它们适用于不同场景。比如,耳机的优势往往在于多轮复杂对话,而不太适用于短对话;智能手表则暂时不太适用于做成翻译硬件,因为手表的用途目前还是以视觉方面的应用为主。

三、可翻译抖音神曲《生僻字》,情感传达仍需优化

在圆桌会谈中,知名作家曾鹏宇先生表示,讯飞翻译机为其母亲的出国旅游大增便利。曾先生说自己是英语专业毕业,本来不太信任翻译器。但经过母亲的体验,他发现讯飞翻译器在点菜、游览、问路、聊天等场景都很好用。借助讯飞翻译机,当母亲讲到好笑的内容,对话者会有反应,也开怀大笑。

曾先生的测评涉及“信达雅”效果、语种、离线翻译等多方面。翻译的“灵珠”是诗词和成语,这是最难的部分。有趣的是,增先生测试了抖音神曲《生僻字》,其翻译机可以将歌词都翻译出来。他测试了五言和七言律诗,都是秒翻,虽然难以达到原诗的意境,但信息可以立马传达。

果壳网吃货研究所所长玉子桑先生表示,他在今年去了东南亚和咖啡农进行交流,讯飞翻译机助他做到沟通无障碍。他甚至可以和当地咖啡农、果农砍价。他认为,有了讯飞翻译机,从此不需要花时间去学用不了太多次的小语种,就可以去小国家旅游。

讯飞翻译机3.0 Lite发布:离线翻译识别率高达95%,精通7种专业翻译
▲嘉宾在交流讯飞翻译机的体验感受

对此,翟吉博表示,用户代表的体验符合讯飞翻译机的初衷:“世界聊得来”。这也是代言人武磊所说的:“让世界听到中国声音。”

翟先生说:“翻译是非常复杂的事,人们在交流时其实要结合许多常识、文化背景。机器目前做的只是比较简单的语言翻译。因此,在涉及到情感方面,讯飞翻译机还是有挑战的。

另外,讯飞翻译机的“中文译外语”的效果要比“外语译中文”的效果更好。因为使用者会对自己的表达方式更加习惯,但是当使用者要用机器配合对方讲话,就没那么习惯了。因此讯飞翻译机在这方面还有很多地方可以提升。

曾鹏宇分享道,曾遇到了同音异形词识别难的问题,但是3.0版本似乎在识别上有改进。比如,结合上下文,讯飞翻译机3.0已可以区分“星星”和“猩猩”。

在访谈的结尾,讯飞翻译机还推广了其“全民体验官活动”。讯飞翻译机想以此获得用户使用中的问题反馈,进而改进产品。用户只需要关注“讯飞翻译机”公众服务号,即可了解活动详情。

结语:迭代技术,深入场景洞察

翻译机用户使用频率越高,服务调用次数越多,需要比其他硬件产品花费更大量的服务器成本。目前来看,翻译机仍是一个强技术导向、强应用场景的产品,这意味着背后在数据、算法等层面大量的研发投入,而消费者主要看重的是翻译机在不同场景是否好用。

国内翻译器玩家大致可分为两类,一类是科大讯飞、百度、搜狗等自身掌握AI核心技术的企业;另一类是一些消费电子领域的硬件公司,他们大多依托外部技术落地翻译机产品。

科大讯飞具有强大的技术代差和深入的场景洞察,以此在国内翻译机市场中居于领导地位。科大讯飞不仅通过签约足球明星来网罗更多的目标受众,更通过切入具体场景的洞察力进而快速迭代技术,为产业同行提供了具有参考性的经验。