实现高效准确的跨语言交流一直是开发机器翻译(MT)的推动力。早在 20 世纪 50 年代,翻译就已成为一项实验性的工作–翻译是计算能力的首批应用之一–到了 21 世纪,翻译已成为一种可行的生产力工具。
而在今天,人工智能驱动的机器翻译工具正在彻底改变全球商业运营。DeepL是其中领先的MT提供商之一,一个神经机器翻译(NMT)来自德国的技术提供商。在本指南中,我们将探讨DeepL的工作原理、优缺点以及在专业翻译项目中使用它的最佳实践。
概述
什么是DeepL?简要概述
DeepL于2009年在德国成立,名为Linguee,是一个在线词典,旨在创建一个神经机器翻译系统,可以产生比传统统计机器翻译(SMT)质量高得多的翻译。DeepL的工程师应用了最新的深度学习技术——该公司因此得名——根据Linguee数据库中的现有数据训练模型。自2017年以来,DeepL变得非常受欢迎-十亿多人至今已使用其服务。它提供支持28种语言,有650种可能的翻译组合。用户可以在DeepL的免费和付费版本之间进行选择,也可以在web界面和独立翻译器之间进行选择。免费版适合个人使用,付费版为商家提供更多功能。然而,DeepL不再仅仅是一项翻译服务。它现在也尝试了人工智能重点是文本生成。其最新产品DeepL Write于2023年初推出,目的是成为英语写作助手,并超越Grammarly等竞争对手。
DeepL是如何工作的?
并非所有的机器翻译都是一样的,随着时间的推移,系统变得越来越复杂。直到2016年,机器翻译系统要么是基于规则的——依赖于大量手工制作的规则——要么是统计的——基于多语言语料库(大量平行文本),以基于单词或基于短语的方式进行翻译,寻找统计模式。现在大多数主流MT系统都使用神经网络。这叫做神经机器翻译这是一种端到端学习的形式,程序的神经网络在生成输出句子时会在每一步考虑整个输入句子,而不是翻译术语两侧的几个单词。DeepL是NMT系统的一个例子——由于深度学习算法,它产生的翻译比统计MT引擎产生的翻译更像人类。它的网络架构也使它能够从大量数据中学习并适应新的环境。
DeepL特性分析
如前所述,DeepL的核心优势在于其NMT系统,与传统的统计MT方法相比,它能够产生更准确、听起来更自然的翻译。让我们来看看它的一些最突出的功能:
- 多语言支持:DeepL支持多种语言之间的翻译,包括英语、西班牙语、法语、德语、中文、日语等等。用户可以在不同的语言对之间无缝翻译文本,而不需要单独的工具。
- 上下文意识:DeepL采用的AI引擎可以理解输入文本的上下文,旨在确保翻译在上下文中更加准确,并保持预期的含义。这在处理惯用表达和复杂句子时是有益的。
- 翻译质量:DeepL以其对某些语言对的翻译质量而闻名,受到用户的高度评价。它掌握上下文和提供精确翻译的能力受到专业人士和语言爱好者的重视。
- 翻译插件和桌面应用程序:DeepL提供浏览器插件,可以与各种应用程序集成,包括Microsoft Office,方便直接文本翻译,而无需使用程序,或者您可以在最流行的操作系统中下载其桌面应用程序。
- 文档翻译功能:除了文本翻译,DeepL还允许用户上传整个文档进行翻译,为处理多语言内容的个人和企业提供了一个有用的功能。
- 数据隐私:DeepL总部位于德国,受欧盟数据保护法管辖。虽然该公司没有透露DeepL的免费机器翻译工具是如何处理数据的,但它明确表示,所有DeepL Pro用户都可以享受所有翻译的安全和加密连接,一旦翻译完成,数据不会存储在他们的服务器上。
- API集成:DeepL提供了一个API,使开发人员能够将其翻译服务集成到他们的应用程序、网站或服务中,为最终用户提供无缝的翻译体验。
DeepL的主要竞争对手有哪些?
机器翻译工具的宇宙是巨大而多样的。除了DeepL之外,一些最著名的MT提供商包括:
谷歌翻译
谷歌翻译于2006年推出,2016年从统计模型转向NMT模型——比DeepL推出早几个月。它支持133种语文并且可以免费使用(除了使用API来翻译您自己的网站,或者如果您超过500,000个字符每月)。其高度可访问的界面和直观的设计使其成为业余用户的热门选择。此外,它可以翻译整个网站,图像和语音。
Systran翻译
Systran成立于1968年,是市场上第一个商业MT软件。Systran也是唯一一家拥有用于神经机器翻译和神经序列学习的开源生态系统的公司:OpenNMT。Systran翻译支持50多种语言,用户可以添加自己的词汇表、字典和语料库来个性化输出。
Microsoft翻译器
Microsoft Translator集成到Bing(微软的搜索引擎)中,并作为微软Office应用程序的内置功能,于2009年推出,基于最新的神经网络技术和基于注意力的模型。如今,它也可以作为独立的移动应用程序用于iPhones和Android设备。它支持100多种语言并支持语音和文本翻译。
亚马逊翻译
该领域最年轻的玩家之一,亚马逊翻译于2017年发布。它使用神经机器翻译引擎,并在其短暂的生命周期内取得了令人印象深刻的性能水平。用户需要一个AWS帐户来访问亚马逊翻译提供的一系列功能——定制(术语和并行数据)、编码术语和批量翻译(亚马逊S3),等等。
腾讯机器翻译
腾讯机器翻译(TMT)是该市场的最新进入者之一。它目前支持10种语言,并结合了神经和统计机器翻译模型。腾讯机器翻译尤其以其中文功能而闻名,已获得人类评价最高记录分数英汉翻译和汉英翻译的最高自动分数。
DeepL vs谷歌翻译:哪个更好?
DeepL比谷歌翻译好吗?与其他问题一样,这个问题的答案取决于上下文和用户的特定需求。一般来说,DeepL通常被视为比Google Translate更准确的MT引擎。也就是说,它确实有一些限制:DeepL的语言选择比谷歌的更有限,要访问它的全部功能——比如保留原始格式的完整文档翻译或在正式和非正式注册之间进行选择的能力——你需要一个高级帐户。DeepL提供的一个用户无法从Google Translate获得的功能是,可以在输出框中点击任何翻译的单词,快速查看替代翻译。如果您选择了与DeepL建议的翻译不同的翻译,文本的其余部分将自动更新以反映您的选择。从安全角度来说,在免费版本的情况下,Google Translate和DeepL都会保留你翻译的文本的历史。相比之下,DeepL Pro提供了世界领先的数据保护标准,并在翻译后立即删除您的文本。这使得它特别适合敏感内容。总的来说,两家提供商都为机器翻译提供了有用的解决方案。如果你只是在寻找一个便宜、易用、语言选项广泛、不需要定制的翻译工具,那么谷歌翻译可能是更好的选择。另一方面,如果您需要可以定制的高度准确的翻译,并且需要确保您的数据得到保护,那么DeepL可能是更好的选择。
评估DeepL的准确性和性能
众所周知,确定机器翻译引擎的准确性具有挑战性。结果会根据所涉及的语言对、你要翻译的文本类型(高度技术性的财务文档不同于博客文章)以及你需要的定制水平而有所不同。此外,因为语言是动态的,像作者的意图这样的因素是无法衡量的,所以准确性有了一个相对的定义。例如,对一部小说的语法和标点符号准确性的期望将不同于对社交媒体帖子的期望。也就是说,基于网络上的普遍情绪,用户报告说DeepL往往相当准确,尤其是当涉及到欧洲语言对时。DeepL自己的实验证明了这一点。然而,由于该公司呈现数据的方式可能会被视为有偏见,更可靠的准确性指标是用户反馈——这往往是积极的,主要表现在:
- 习语和俚语的解释与对等
- 自然性
- 寄存器敏感翻译
最终,每个用户都需要在尝试了DeepL在他们的用例中的表现之后做出自己的决定。好消息是,免费版本可以让你做到这一点,而不会产生任何成本。
DeepL的利弊
像DeepL这样的神经机器翻译系统打开了一个充满可能性的世界。作为领先的NMT技术供应商之一,DeepL可以:
- 相当准确:它可以理解单词和短语的更广泛的上下文,以产生更准确和流畅的翻译,并随着时间的推移而改进。
- 快速学习:你可以通过自动化过程快速训练神经网络,不像传统的机器翻译所需的昂贵和大量的手工方法。
- 灵活且易于集成:通过API、扩展和插件,您可以将它集成到大多数浏览器或软件中,并将其应用于许多内容文件格式。
- 可定制:您通常能够通过术语数据库、特定于品牌的词汇表和其他数据源定制DeepL的输出,以改善结果。
- 成本效益:像任何其他NMT引擎一样,DeepL能够以极低的成本实现高度准确和快速的翻译。
- 可扩展:当您的翻译需要扩大规模时,DeepL可以帮助您轻松满足不断增长的需求。
话虽如此,尽管DeepL的发展已经达到了很高的高度,但几乎没有任何机器翻译引擎可能是完美的——DeepL在赶上人类水平的准确性之前还有一段路要走。未来几年DeepL会继续提高多少还有待观察,也很难预测。目前,它仍然缺乏人类水平的技能,如:
- 问问题
- 理解语境
- 识别源文本中的错误
- 抓住讽刺
- 创造性翻译
- 做出深思熟虑的选择
- 做研究
- 观察一致性
- 保证完整性
- 故意遗漏或包含信息
- 添加注释或注释
虽然机器翻译引擎处理这类任务的能力仍然有限,但在不久的将来,人工后期编辑仍可能是任何翻译工作流程的重要组成部分。
利用DeepL进行专业翻译:最佳实践
当使用DeepL进行机器翻译时,重要的是要坚持使用用例,在不影响质量的情况下,您可以从中获得最大收益。其中包括:
- 低能见度或低流量内容,如内部备忘录、网站页脚、电子邮件、用于情感分析的社交媒体帖子等。
- 重复性技术内容这只需要是可操作的,就像指导手册一样——如果可能的话,让人工翻译对这些内容进行后期编辑,以避免任何用户体验问题。
- 低风险含量这不需要完全准确或遵循复杂的法规——一个很好的例子是用户生成的内容,如产品评论,消费者通常不期望高质量。
- 易腐内容物,如聊天或电子邮件支持信息、客户查询等。
- 大量内容周转时间很短,例如数百个产品描述需要快速上线。
- 经常修改的内容-考虑功能和信息更新。
这些用例中的大多数都需要光机器翻译后期编辑(MTPE)以确保准确性和清晰性,如果内容不是关键任务,您甚至可以使用原始输出。一些其他类型的内容需要更高的准确性,将需要更多的时间密集的后期编辑。其中,我们发现:
- 产品名称:它们信息量大且简洁,往往包含专有名词和多义词,词序通常相对自由,这可能会造成歧义。
- 不同语法的语言对之间的翻译:例如,日语和西班牙语涉及单词和短语的重新排序,这使得格式良好的句子对机器翻译引擎来说更具挑战性。
- 影响客户体验的中等可见性内容:知识库、常见问题解答、警报等。需要尽可能准确,以实现高效客户支持的目标。
- 后端SEO元信息:一些SEO元素,如图像替代文本和标题,可见性较低,但需要技术优化,如目标语言关键字,以提高搜索排名。
如何利用翻译技术充分利用DeepL
本地化平台等现代翻译技术彻底改变了企业管理、翻译和交付多语言内容的方式,成为高效全球扩张的推动者。这些工具从端到端简化了整个过程。这些解决方案中的大多数还集成了机器翻译引擎,允许用户在他们已经使用的同一界面中将大量文本快速转换为目标语言,以将内容拉入、翻译、审阅和导出回原始系统。仅生产率的提高就很显著,当与首先利用MT相关的成本节约相结合时,由此产生的投资回报可能是惊人的。相比之下,当您将MT作为一个独立的引擎,与您的内容不在同一个系统中时,您实际上给翻译过程增加了一层额外的复杂性——想想手动上传文件或下载结果的麻烦就知道了。由此产生的瓶颈、脱节的工作流程以及缺乏对整个流程的可见性不可避免地会影响翻译的交付时间和准确性。以DeepL为例,它是一个完全托管的MT引擎企业翻译管理系统例如短语TMS。该系统自动为每项工作使用最佳的机器翻译引擎,其基于人工智能的解决方案过滤掉不应该翻译的内容:
- 无需担心技术设置:只需将开关切换到“开”,就会自动为您的语言启用引擎,并允许您立即开始利用它的强大功能。
- 仅对最适合的内容使用DeepL:尽管DeepL是一个非常强大的引擎,但这并不能保证——并不是所有的领域和语言对都会以同样的方式从中受益。Phrase的自动选择功能允许您一次启用多个MT引擎,并自动将它们分配给最符合其功能的内容。
- 利用词汇表:您可以管理您所有的机器翻译词汇表和术语,DeepL将使用它们来确保您所有的翻译都符合您公司的风格。这也适用于其他集成MT引擎。
- 享受跨引擎的无限MT后期编辑:虽然DeepL提供了无限的MT作为一个独立的解决方案,但使用短语TMS,您可以享受所有完全管理的引擎的相同好处。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:李溢泉