通用(基线)神经机器翻译解决方案的领导者

Trusted Translations 开发的技术流程集成了谷歌、微软、亚马逊、DeepL 等基准机器翻译(MT),及其他具备翻译记忆库(TM)的服务器与译后编辑服务,旨在以业界最优的翻译质量实现高产量输出。根据客户的要求和说明,我们将基线 MT 解决方案与我们的质量控制流程相结合,以提供高准确度的可靠翻译。这一专有流程可显著缩短交付周期、降低成本,并同时保持极高的翻译质量。

通用机器翻译引擎触手可及

通用机器翻译引擎(有时也称 “GMTE”)指可在几乎无需人工干预的情况下对文本进行源语与目标语互译的软件程序。虽然上述各个基线引擎的构建方式不同,但大多数都将用于翻译通用内容,而不涉及专用术语——因此被称为通用机器翻译解决方案。其中最为热门的便是谷歌翻译、Systran、微软翻译器、微软 Hub 及亚马逊。

基线引擎可以出色地对相对基本的内容进行全面理解。但是,时至今日,定制化引擎仍具有竞争优势。也就是说,即使原文极为简单,仅由 GMTE 输出的译文中也存在一些不可避免的错误,因此不可将其用于专业用途。

综上可知,基于客户目标及项目性质,GMTE 可以作为翻译流程的一个有效组成部分。Trusted Translations 学习了 GMTE 的使用并根据客户的需求和目标对其进行集成。如果我们认为某些项目适合在其翻译流程中集成 GMTE,我们将与客户对这一选择进行讨论,并为其设计一套集成 GMTE、翻译记忆库服务器、人工翻译(HT)与审校优势的解决方案。

翻译记忆库服务器与通用 MT

翻译记忆库服务器(“TMS”)在输出时会采用部分已由人工翻译的句段,因此在使用 GMTE 时借助“TMS”可提高翻译输出的整体质量。沿用此类翻译内容有助于确保质量,这一点在译文对客户专用风格指南的忠诚度上有所体现,而在术语库并不充分、无法作为强大资产的情况下,这一方式甚至有助于提升术语准确度。其中一种针对内容准备工作流的可用配置是运用 TMS 先行对每个句段进行初步翻译。若步骤一中不存在相同或相似句段(完全模糊匹配),则将采用通用机器翻译引擎对内容进行翻译。

目前的绝大多数 TMS 都允许您同时完成上述两步。最后,从翻译记忆库或纯粹的机器翻译输出中产生的双语内容也可交由专家级译后编辑人员进行编辑;也就是由一位接受过专业培训的译员对 MT 输出进行处理。此外,人工译后编辑结果将添加至 TMS,以提高未来翻译的质量。

通用机器翻译的人工译后编辑

与单一的人工翻译相比,利用 GMTE 可以显著提高译文输出速度。如具备充分的处理能力,您可以在数天内翻译数亿单词。尽管近期存在关于 MT 输出质量是否能与 HT 输出相抗衡的争论,总体而言,人们对于最终输出结果的质量的担忧不无道理。其中一项解决方案便是通过在工作流程中添加人工译后编辑来解决这一问题。加入人工译后编辑流程的确会减少周转时间,但可以大幅提高译文质量,找出 GMTE 中存在的问题。

通用机器翻译引擎、翻译记忆库服务器与
人工译后编辑工作流

由于机器翻译解决方案仍处于初级阶段,Trusted Translations 会根据每个项目的不同特点采用不同的处理方式。然而,基于以往经验,我们成功开发并测试了几个集成机器翻译的工作流。以下为集成了 GMTE、翻译记忆库与人工译后编辑解决方案的常见工作流。

如上所示,翻译内容将历经 API 或其他集成方式的所有步骤。每个内容句段将历经 TMS 和通用机器翻译引擎,最后至译后编辑环境。也就是说,翻译记忆库服务器或通用机器翻译引擎生成的每个句段译文将在线上译后编辑环境由我们的专业译后编辑人员在基于云的译后编辑环境内进行线上译后编辑。该流程可为多种语言同时运行。该流程可即时进入译后编辑环境。由人类译后编辑任务产生的反馈结果将自动更新至 TMS 中。

通用 MT 与定制化 MT

利用通用机器翻译引擎和翻译记忆库服务器,并使用人工译后编辑而非人工翻译(从零开始)和审校,可显著降低成本。同时,交付周期也显著缩短。这一方案的缺点在于质量低于人工翻译,且机器翻译引擎缺乏定制化机器学习引擎一般进行学习与自我提升的动态能力。