一起游 手游攻略 新游动态 机器翻译的五大应用:降低错误率,实现信息获取无障碍

机器翻译的五大应用:降低错误率,实现信息获取无障碍

时间:2024-06-10 19:06:46 来源:网络整理 浏览:0

当前机器翻译的研究目标并不是实现完美的翻译,而是尽可能的降低机器翻译系统的错误率。

本文将向您介绍机器翻译的五大应用。

1.信息获取

相比于其他翻译系统, 将机器翻译技术带给了更多的用户。它直接为需要翻译任务的用户提供翻译服务。当人们试图在互联网上搜索信息时,可能会看到外语网页,比如解决计算机问题的芬兰语网页,或者解释如何购买巴黎地铁票的法语网页。这时,你只需要点击“翻译此页面”按钮,就可以看到翻译成英语或其他你熟悉的语言的网页(见图 1)。

▲图1 自动翻译的网页,巴黎地铁的法语信息和机器翻译成英文的结果(由RATP提供)

能将所有语言的网页链接起来,更难得的是,它还能将英文内容翻译成其他语言。我们知道,英语仍然是互联网上的主导语言(比如在海量的 页面中),而一些非常有价值的内容,比如前沿的科学信息,在其他语言中可能没有相关的介绍。

用户对于互联网跨语言信息获取技术也有着明确的定位和期待,用户在使用机器翻译时其实知道翻译是机器生成的,因此当发现错误和不流畅时,会将其归咎于技术的限制而非信息发布者的问题。

将机器翻译应用于信息获取也是美国大部分研究资金的主要驱动力,其中一个获得资助的项目(最近的是 DARPA)提出了一个典型的挑战:在国外发生灾难时,救援人员需要了解受害者所说、所写和所发的推文,以获取生存信息。

与此同时,机器翻译还有许多商业应用。专利律师需要知道专利权利要求的中文版本,记者需要了解国外的发展,对冲基金经理需要获取影响公司盈利能力的任何语言信息。

即使是低质量的机器翻译也能发挥作用。了解文档的主旨就足以判断其是否相关,只有相关的文档才需要交给语言专家进行更详细的翻译。

但这种信息获取方式也存在一个问题,在翻译过程中,用户需要检测译文是否偏离了原文原本的语义,用户可以通过分析语法错误、语义逻辑错误等线索来检测。然而,错误的翻译可能会误导用户。误译导致的信息传递错误是神经机器翻译中值得关注的重要问题。神经机器翻译有时更注重流畅度而忽略保真度,导致输出和输入的语义完全不匹配。因此,如果译文只是由机器翻译模型输出,那么显示翻译置信度分数以表明译文的可靠性就成为一个重要因素。

2. 人工辅助翻译

翻译是一个庞大的行业,但机器翻译的质量并不令人满意,因此客户不会为它们支付太多费用。高质量的翻译依赖于以目标语言为母语的专业翻译人员,最好是该行业的专家。翻译行业主要由语言服务提供商组成,他们通常将翻译工作外包给自由译者。

虽然机器翻译无法与专业译员的质量相媲美,但它可以提高译员的效率。翻译人员曾经依赖纸笔的工作方式在 20 世纪 90 年代随着翻译记忆工具的引入而发生了改变。我们可以将翻译记忆工具视为可搜索的平行语料库。当需要翻译一个句子时,该工具会搜索以前翻译的语料库,找到最相似的句子,并将其与译文一起呈现给译员。当专业译员定期为同一客户工作并翻译重复内容(例如年度报告、法律合同和包含大量重复文本的产品描述)时,他们可以更快地完成翻译。

让专业翻译人员接受机器翻译系统是一个漫长的过程,目前尚未完全完成。对于某些类型的翻译工作,机器翻译系统并不是一个有用的工具,例如,营销信息的翻译必须考虑到目标国家文化的细微差别,文学和诗歌的翻译也是如此。但对于许多传统的翻译任务,机器翻译仍然有帮助。

机器与人类合作的早期形式是机器翻译系统将原始输出提供给专业翻译人员,然后由专业翻译人员进行修改,这被称为机器翻译的后期编辑。图 2 比较了专业翻译人员在有和没有机器翻译帮助的情况下的翻译速度。研究表明,翻译效率提高了 42% 至 131%。在这个价值数十亿美元的行业中,这些翻译效率的提高产生了巨大的影响。

▲图2 使用机器翻译可以提高翻译效率(以每小时翻译的单词数量来衡量)。该结果来自(Plitt & ,2010)的一项研究,该研究使用构建的翻译系统对多个语言对进行了实验。

研究人员一直在努力让机器翻译更具适应性和交互性。适应性意味着机器翻译系统向译者学习。当译者逐句翻译文档时,新生成的句对就成为机器翻译系统所需的新训练数据。这是训练机器的最佳方式,因为新的训练数据包含正确的风格和内容。从技术角度来看,我们需要构建一个能够根据新输入的训练句对快速更新和调整的机器翻译系统。

交互式机器翻译又称交互式翻译预测,是一种协作模式,机器翻译系统向译者提出建议,如果译者不采纳该建议,则更新之前的建议。因此,机器不再提供源语言句子的静态翻译,而是根据专业译者的选择进行预测。

3. 沟通

机器翻译广泛应用的第三个领域是通信。它可以直接促进两个不同语言的说话者之间的对话,但也带来了许多新的挑战。它需要与语音处理等其他技术相结合,才能顺利实现自然交流。用于通信的机器翻译必须非常快,翻译过程甚至必须在说话者说完一句话之前就开始,以避免停顿。

(1)Skype翻译

微软在这一领域最雄心勃勃的项目之一是将机器翻译集成到 Skype 中。这个想法是,你可以在 Skype 上翻译你讲英语而你的朋友讲西班牙语的对话。

由于语音已经可以通过计算机传输,因此需要对语音进行额外的处理。仔细研究这个问题可以发现三个不同的步骤:(1)对输入的语音进行语音识别,即转录为文本;(2)机器翻译;(3)对翻译后的文本进行语音合成。理想情况下,语音合成还能够重现原始语音的重音和情绪极性,甚至可能重现说话者的原始声音。然而,在大多数实际应用中,语音合成步骤经常被忽略,经常错误的翻译被输出到屏幕上供大家阅读,而不是大声朗读给大家听,因为这样更容易让人接受。

口语通常比书面语使用的词汇量少,但现有的双语平行文本翻译语料库往往与口语的语言风格不匹配,口语与书面语的差异很大,口语更多地使用代词“我”和“你”,以及相应的动词形态变化、疑问句、不流利和重新开始等不合语法的表达、更口语化的语言和俚语。事实上,不合语法甚至语无伦次的语言现象非常严重,以至于你可能不想复习日常讲话的记录。对话式翻译系统的开发人员发现使用包含电影和电视字幕的语料库来训练模型非常有用 (Lison & ,2016)。

(2)聊天翻译

沟通不只是语音传输。聊天论坛也成功整合了机器翻译功能,用户可以用自己的语言输入问题和答案。聊天论坛从免费娱乐到客户服务,大部分关于使用不同语言的担忧都出现在这里。聊天文本中还有其他独特现象,例如表情符号、俚语缩写和频繁的拼写错误。

聊天翻译的质量标准并不像机器翻译那样高。如果机器翻译系统出现错误,交流的另一方很可能会注意到并指出错误,并试图澄清其含义。然而,一些错误也可能让他们感到被冒犯。

(3)旅游翻译

当你去国外旅行时,翻译的需求就变得更加明显。旅行翻译器的概念在《银河系漫游指南》中广为流传,其中的翻译器是一种名为“”的设备,可以放在耳朵里翻译传入的声音。

如今的翻译工具比上述工具更进了一步。典型的应用是手持设备或手机应用程序。旅行翻译所用的实际技术与前面讨论的语音和聊天应用程序类似。如果设备具有语音翻译功能,则在屏幕上显示口语文本也很有用,这样说话者就可以验证他所说的内容是否被正确理解。

鉴于上述技术的不完善,以及环境噪声和计算资源有限(云计算是一种选择,但它会增加额外的延迟)等其他因素,最强大的旅游翻译系统仍然基于文本翻译,语音识别只是作为附加功能。

旅游翻译还有一个有趣的应用方向:图像翻译。想象一下,当你来到一家餐厅,看到菜单上写满了难以辨认的文字和难以理解的符号时,你只需用旅游翻译应用的相机功能拍下照片,翻译系统就能将图片中的文字翻译成所需的语言。这类移动应用早期版本的翻译组件非常简单,仅使用词典进行翻译,但也添加了一些不错的其他功能,例如在翻译中模仿原文的字体(见图3)。

▲图3 德文标牌及图片翻译结果

(4)讲座翻译

第一个将语音翻译用于讲座翻译的大学是卡尔斯鲁厄理工学院(Fügen 等,2007;等,2018)。尽管讲座翻译中的声学条件更好,说话风格更标准,但融合语音识别和机器翻译时面临的所有主要挑战仍有待解决。

在这些方面,早期的尝试不仅将语音识别后的文本发送到机器翻译模块,还着眼于更紧密的集成,例如发送编码不同识别路径分数的 n-best 替代翻译列表或单词网格,然后让机器翻译系统使用额外的上下文信息来消除语音信号中的错误。然而,这项研究并没有太大的收获,人们发现只发送和处理 1-best 识别结果往往是最好的,同时保持简单的流水线处理方法。

集成过程中的另一个有趣挑战是书面文本包含标点符号,而口语中没有标点符号。此外,数字在文本中通常写为阿拉伯数字(例如 15),而语音识别可能会将其识别为实际的口语单词(“ ”)。

(五)手语翻译

最后一个有趣的翻译挑战是手语翻译。聋人群体自发地使用丰富的手势和面部表情来表达口语所能传达的内容。手语有几种被广泛接受的标准,例如美国手语 (ASL)。手语有一些有趣的特点,比如指向空间中的某个点,然后指回该点,以建立一个共同的参考框架。

视频手语翻译是一项有趣的挑战,它远远超出了机器翻译的范围,需要复杂的图像识别。书面手语翻译取得了一些成功,但总体而言,这仍然是一个令人兴奋的未解问题。

4.自然语言处理的管道系统

包括机器翻译在内,自然语言处理最近已经发展到可以用于很多实际应用的程度。其中一些应用早在机器翻译之前就已经非常成功,比如文本搜索(如谷歌);一些是目前研究的重点,比如个人智能助理(如亚马逊的 Echo);还有一些应用在未来仍可期待,比如客服对话系统、复杂问题的问答系统,或者令人信服的辩论系统。

像人类一样说话的机器具有巨大的潜力,但将其转化为实际应用并跟踪其进展却具有挑战性,例如,我们经常将机器性能与人类性能进行对比。与自然语言处理的其他应用相比,机器翻译是一项相对明确的任务,我们可以用它来衡量进展,尽管专业翻译人员对句子准确翻译的标准仍存在分歧。其他任务,如评估文档摘要的连贯性或评估开放域聊天系统的性能,则没有明确的定义。

机器翻译也有可能成为更大的自然语言处理应用的一部分。以跨语言信息检索为例。如果我们不仅在 上搜索英文网页,还在其他语言的网页上搜索潜在相关内容,会怎么样?这将需要某种形式的查询翻译、网页翻译或两者兼而有之。美国国家情报高级研究计划局 (IARPA) 最近启动了这样一个跨语言信息检索项目,在低资源数据(如斯瓦希里语、他加禄语和索马里语等)的条件下增加了更困难的跨语言检索任务。

更进一步,跨语言信息提取不仅需要在文本集合中找到相关信息,还需要提取遵循特定语义模式的核心事实。例如,查询一组多语言新闻文章:“找出上个月的和列表”。我们希望系统不仅返回相关信息,还返回一个格式化的表格,其中包括所涉及公司的名称、事件日期、货币支付或股票转换等。

每个应用对于机器翻译系统的性能可能有特殊的要求。以查询项的翻译场景为例,输入的句子可能只有 1 到 2 个单词。我们不能再依靠句子的上下文来消除歧义,而是可以利用用户的搜索历史来消除歧义。同时,不同的应用可能有不同的要求。例如,要找到所有相关文档,就需要更高的召回率。对于外文文档中的特定单词宝贝鱼在线翻译,翻译系统的首选翻译可能与查询项不匹配,但该单词的其他候选翻译可能与查询项匹配。如果我们希望这份文档仍能被检索到,我们可能需要给翻译一个可信度的置信度分数。

5.多模式机器翻译

在本文讨论的流水线处理范式中,机器翻译仍然是一个单独的模块,以文本作为输入,以文本作为输出。人们对多模态机器翻译的兴趣也越来越浓厚,其中输入不仅是文本,还有来自其他模态的附加信息。最具代表性的任务是图像标题翻译,其中标题本身可能存在歧义,但图像的相关内容可以消除标题的歧义。例如,标题“女孩戴帽子”需要翻译成德语(见图4),其中需要区分时尚的装饰帽或防晒帽(德语Hut)和冬天戴的保暖帽(德语Mütze)。示例中的图像信息可以消除这种歧义。

▲图4 将图片标题“女孩戴着帽子”翻译成德语:由于图片中展示的是一顶冬帽,因此标题中的“帽子”一词被翻译成“Mütze”,而不是“Hut”。这张图片清楚地显示了这种差异。

视频字幕翻译是多模态翻译中的一大挑战,同样,视频上下文信息可能提供重要的参考线索,而视频信息中长期保持一致的故事信息可以提供历史上下文信息,这也对翻译有益。

字幕翻译有其独特的挑战,例如屏幕空间有限,观众的阅读时间有限。翻译后的字幕不能太长,这可能需要删除一些信息,但仍需确保可读性。一个困难的问题是,较长的字幕通常会被拆分成多个字幕以呈现在连续的屏幕上,因此必须在翻译之前将它们连接起来,并以适当的方式再次拆分以满足屏幕限制。

回到语音翻译,我们还可以设计一个翻译模块,不仅可以在语音识别后翻译文本,还可以使用原始语音信号作为输入。一些重要的细节,包括口音,对于正确理解输入语音至关重要,可能会对翻译产生影响。因此,对于多模态机器翻译,我们必须构建一个新的神经网络架构,使模型能够关注输入词序列之外的其他信息。

标题:机器翻译的五大应用:降低错误率,实现信息获取无障碍
链接:https://yqqlyw.com/news/xydt/7634.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭

阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭[多图],阴阳师4月22日更新的内容有哪些?版本更新

2024-06-10
四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址

四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址[多图],2021四川电视台经济频

2024-06-10
湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口

湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口[多图],湖北电视台生活频道

2024-06-10
小森生活金币不够用怎么办?金币没了不够用解决方法

小森生活金币不够用怎么办?金币没了不够用解决方法[多图],小森生活金币突然就不够用的情况很多人都有,金币没

2024-06-10