了解机器翻译 (MT) 和生成式人工智能翻译之间的主要区别,以及哪一种适合您.
第一次尝试机器翻译是在 1954 年,当时IBM 701 计算机或 “电子脑 “自动将 60 个句子从俄语翻译成英语,证明机器翻译是可能的。尽管研究耗时,费用不菲,但这为未来的语言翻译铺平了道路。
几十年后的 2006 年,谷歌推出了谷歌翻译。尽管翻译并不完美,但语言专业人士认为它方便易用。
虽然谷歌翻译的性能已经提高了十倍,但机器翻译仍然存在很多不确定性,许多语言专业人士认为仍然需要人工翻译。
然而,随着 ChatGPT 等人工智能生成技术迅速重塑翻译行业,我们不禁要问:全球企业完全依赖 “电子脑 “翻译的时代终于到来了吗?
要回答这个问题,首先需要了解机器翻译和生成式人工智能翻译是如何工作的。
注: 在本文中,我也将生成式人工智能翻译称为 “人工智能翻译”。
MT 和生成式人工智能翻译背后的技术
机器翻译遵循一套预定义的规则
机器翻译的工作原理是分析大量双语数据中的模式,并根据某些单词和短语在不同语言中同时出现的概率生成译文。
人工智能翻译将学习从一项任务转移到另一项任务
生成式人工智能翻译比机器翻译更进一步。较早的人工智能翻译工具 从海量数据中学习,提高了对语言的语境理解,从而产生了更流畅、更符合语境、更像人类的翻译。后来,零样本翻译技术出现了,像 ChatGPT 这样的新型人工智能模型可以用少量数据解决复杂问题。
“斯坦福大学计算机科学教授卡洛斯-盖斯特林(Carlos Guestrin)在 2022 年 11 月举行的智能应用峰会上说:“大数据不再是优先事项。
后退,后退,什么是零样本?
少量或零次翻译 “是指人工智能模型可以利用迁移学习(从一项任务中学到的知识在相关任务中重复使用)生成从一种语言到另一种语言的良好翻译,即使它从未被教过在某些语言对之间进行翻译。
MT 翻译与人工智能翻译的比较:利弊
现在,您已经了解了机器翻译和生成式人工智能翻译的工作原理,让我们来看看它们的优缺点。
机器翻译(MT)的优势
速度和成本效益
机器翻译的主要优点之一是速度快、成本效益高。它可以在短时间内处理大量内容,对于需要快速翻译而又不需要花费巨资的组织来说,MT 是一个非常有价值的工具。
可供所有人使用
谷歌翻译和DeepL等机器翻译工具都是免费开源的,因此人人都可以使用。这些工具还具有 API,因此您可以将它们与各种在线平台和应用程序集成,让用户只需点击几下,就能在现有工具堆栈中轻松翻译文本。
精通标准术语
机器翻译可以轻松识别并准确翻译常用术语和表达,尤其是在有特定行业术语的领域。这种一致性和精确性在法律、金融或技术等领域尤为重要,因为在这些领域,行话的统一性和准确性至关重要。
机器翻译(MT)的缺点
在处理复杂内容方面有困难
机器翻译擅长处理简单的文本,但在处理复杂的内容时往往力不从心。翻译习惯用语、文化细微差别和技术术语会给 MT 系统带来挑战,导致翻译文本不准确和意义缺失。
没有上下文理解
传统的机器翻译系统在很大程度上依赖于预定义的规则和词典,这意味着它在处理新领域或专业领域时会遇到困难。由于 MT 系统是逐字翻译而不考虑上下文,这往往会导致翻译错误。对于有许多同形异义词(拼写或发音相同但含义不同的词)的语言来说,尤其如此。
缺乏一致性
机器翻译在保持译文一致性方面可能会遇到问题,尤其是在大型项目中。如果用不同的术语来翻译同一个词或短语,就会造成混淆和误解。
对资源较少的语言和语言对而言不准确
在翻译鲜为人知的语言时,机器翻译并不十分准确。有些语言没有足够的数据供机器翻译系统学习,因此翻译质量会下降。语言对也是如此。在使用机器翻译工具时,您可能会注意到从一种语言翻译到另一种语言的准确性较低,例如从英语翻译到法语与从西班牙语翻译到法语。
生成式人工智能翻译的优势
学习和发展
人工智能翻译的关键优势之一是其不断学习和发展的能力。通过不断分析训练数据,人工智能翻译系统可以提高准确性,跟上不断变化的语言环境。人工智能还可以在特定行业的数据集(如医学或法律)上进行训练,从而生成更准确、更相关的翻译。
处理复杂语言
人工智能翻译的一个令人兴奋的方面是它能够破译更复杂的语言。它能理解俚语、口语和文化参考,从而提供更准确、更像人类的翻译。
根据上下文进行翻译
一些生成式人工智能翻译工具使用上下文(也称为提示)来提供具有上下文的准确翻译。您可以为生成式人工智能提供语境,如品牌声音、语气、行业、受众等,这样您的翻译不仅更准确,而且更符合品牌形象。
翻译记忆库 (TM)
生成式人工智能系统比 MT 系统更具一致性。通常情况下,您可以向 MT 系统提供常用翻译术语词汇表,但您必须不断用新术语更新词汇表。而人工智能则能记住现有术语并自动存储新术语。
快速批量翻译
生成式人工智能可以在几分钟内翻译大量具有上下文关联的内容。这意味着您可以更快地完成时间紧迫的翻译和本地化项目。
为低资源语言提供更准确的翻译
建立在零镜头学习基础上的生成式人工智能模型可以学习识别未见内容,并以更高的准确率翻译低资源语言。低资源语言是指可用于学习的数据较少的语言。
具有成本效益
虽然实施和维护人工智能翻译系统需要成本,但从长远来看,它们可能更经济,尤其是当需要定期翻译大量内容时。
生成式人工智能翻译的缺点
语言例外
虽然人工智能模型可以学习规则和模式,但它们可能难以应对这些规则的例外情况,而这些例外情况在许多语言中都很常见。这些语言上的不一致给翻译的准确性带来了极大的困难。
不适合专业领域
在法律或医疗等领域,准确性是最重要的,语言也很复杂,人工智能翻译可能不够可靠或准确。你可以对一些生成式人工智能模型进行微调,但这仍是一项正在进行中的工作,而且如上所述,这是一项艰巨的任务。
隐私问题
生成式人工智能系统可以存储或记录翻译的数据,用于未来的改进和训练。这可能会让医疗保健、法律或金融等行业的用户感到担忧,因为这些行业的隐私法规非常严格,所涉及的数据也是高度机密的。因此,在使用人工智能翻译工具时,选择一个注重数据安全的合作伙伴非常重要。
翻译偏见
生成式人工智能翻译模型的中立性取决于其训练或学习的数据。如果数据包含固有偏见,如性别、地区或种族偏见,人工智能本地化系统在翻译时可能会无意中复制这些偏见。这种延续和扩大现有偏见的风险可能导致误译和误解,尤其是在全球传播背景下,这可能会造成问题。 为了尽量减少翻译中的偏差,需要对人工智能的培训和学习进行密切监控和管理。
机器翻译和生成式人工智能的未来
随着技术的发展和更多工具的出现,翻译专业人员将能以更实惠的价格更快地完成工作,同时保证质量。
虽然生成式人工智能翻译需要克服一些挑战,比如低资源语言的不准确性和翻译偏差,但我们不能忽视人工智能翻译模型在理解上下文、细微差别甚至文化参考方面的强大功能。
最终,人工智能翻译模型将提供与人类翻译几乎毫无区别的翻译。
但它不会完全取代人工翻译。反正现在还没有。即使是最先进的人工智能翻译服务,在与人类处理语言的方式相匹配方面仍有很长的路要走。
有一点是肯定的。人工智能翻译技术发展迅速,也更容易获得,因此我们可以预见人工智能翻译将在未来几年得到广泛应用。
我应该用什么来翻译:MT 还是生成式人工智能?
在选择机器翻译还是生成式人工智能翻译时,有几个因素需要考虑:
- 预算
- 速度
- 准确性
机器翻译仍然是翻译大量非关键内容的一种快速、经济有效的方法。 但是,如果您需要更准确、更符合语境、更符合品牌的翻译,那么人工智能翻译就是您的最佳选择。
一些语言专业人士已经根据翻译内容,在翻译过程中结合使用机器翻译、生成式人工智能、人工翻译和后期编辑。下面是一个快速分解表,帮助您决定选择哪种组合:
- 复杂/高风险翻译。是的。人工智能和人工翻译,人工后期编辑和语言质量保证
- 中等风险翻译。是的。 带有人工后期编辑和语言质量保证的人工智能翻译
- 非关键/最低可行性翻译。是的。具有人工智能语言质量保证功能的机器翻译
https://lokalise.com/blog/machine-translation-vs-ai-for-translation/
(机器翻译,轻度译后编辑,仅供参考)
编辑:方文娟
咨询要点:本文探讨了机器翻译(MT)和生成式人工智能翻译(AI翻译)的区别,分析了它们的优缺点,并提供了选择适合翻译工具的建议。