人工智能在翻译中的力量:Smartling的研发突破

分享

其他推荐

在两年的大部分时间里,生成式人工智能一直是人们最关心的问题。现在,各行各业和各职能部门的高管都要求他们的团队寻找使用其来降低成本或提高效率的方法。但问题是,AI真的在翻译中起作用吗?

在过去的18个月里,Smartling将我们的研发工作集中在找出答案上。具体来说,我们想知道人工智能是否能帮助我们提供世界上质量、成本、速度和体验最好的翻译解决方案。

答案?响亮的“是”!人工智能正在发挥作用,而且正在大规模发挥作用。但是,并不是每个应用程序都是赢家。

AI如今在翻译领域发挥着什么作用?

当大型语言模型(LLMs)首次出现时,公司开始测试它们,作为机器翻译的直接替代品。然而,尽管这个用例有潜力,但仍有一些问题需要解决,以确保一致的性能。

我们的R&D团队评估了几个跨多种语言和质量指标(即双语评估研究、多维度翻译质量指标、翻译编辑率等)的大语言模型和机器翻译。该实验表明,使用大语言模型进行所有语言的翻译,自动质量评估指标表明机器翻译引擎在翻译质量上仍然优于大语言模型。最重要的是,机器翻译是一种比使用大语言模型更经济实惠的翻译方法。

虽然大语言模型还不是翻译的最佳选择,但我们的团队开始看到它们在机器翻译输出的自动后期编辑和评估方面大放异彩。人工智能不是机器翻译的替代品,而是机器翻译的强大补充。

特别是,以下被证明是人工智能的强大应用:

  • 模糊匹配修复
  • 术语表术语插入
  • 编辑工作量评估
  • 形式
  • 消除性别偏见

凭借这些知识,我们开始为客户开发和部署新的人工智能解决方案。它始于人工智能驱动的人工翻译,这是一种翻译解决方案,汇集了Smartling的专业语言学家和人工智能技术,以一半的成本和两倍的速度提供高质量的翻译。

然后,客户开始问我们,他们是否可以与他们的第三方语言服务提供商一起使用我们的人工智能功能。所以我们答应了。

人工智能翻译工具包简介

Smartling的人工智能翻译工具包提供了一套人工智能翻译功能,旨在显著降低翻译成本,提高语言学家的表现,而不牺牲质量。我们正在向所有人提供我们的人工智能技术,这些技术已经为我们支持人工智能+人工译员的客户提供了令人难以置信的输出,包括:

  • 人工智能模糊匹配修复:将翻译记忆库匹配率提高多达35个百分点,从而大幅节约成本并提高质量。
  • 人工智能词汇表术语插入:将你的术语表术语无缝嵌入到内容中,保证上下文和语法的准确性。
  • 编辑工作量评估:根据达到人类质量的预期工作量对翻译进行分组。Insights可以在我们的工作流自动化中使用,将字符串分配给特定的语言学家,或者完全绕过人工审查。

让我们深入了解这些特性以及支持它们的研究。

深潜:人工智能模糊匹配修复

如今,利用翻译记忆库是一种标准做法。然而,人工智能模糊匹配修复通过使用大语言模型来修复和平滑通常不会被用来节省成本的字符串,将传统方法向前推进了一步。

例如,在下图中,您可以看到源文本和翻译记忆库匹配仅相差一个单词。使用常规翻译记忆库时,源文本通常需要完全重新翻译。但是,通过模糊匹配修复,大语言模型能够识别差异并提供修复的翻译。建议的翻译现在有资格享受模糊匹配折扣,让客户更好地利用他们的翻译记忆库,并减少语言学家的工作量。

人工智能翻译工具包——人工智能模糊匹配修复

虽然在概念上,这听起来是一个非常酷的功能——我们的R&D团队希望确保它的工作。更重要的是,他们希望确保它以成本、质量或速度改进的形式提供真正的价值。

为了做到这一点,他们将相同的内容翻译了两次——一次打开人工智能模糊匹配修复,一次关闭人工智能模糊匹配修复。他们根据输出翻译和最终人工翻译的人工翻译编辑率评估了这两种情况。我们想看看有多少字符串在模糊匹配修复后不需要人工干预。

人工智能模糊匹配修复结果

研究发现,人工智能模糊匹配修复将翻译记忆匹配增加了35个百分点,并且在各种语言中相当一致。这意味着客户可以对更多内容使用翻译记忆库,从而节省大量成本并提高一致性。

深度挖掘:人工智能术语表术语插入

翻译的另一个标准做法是术语表术语插入。传统的方法是简单地将源文本和目标文本中的术语删除并替换为术语表中的相关术语。然而,当这些术语表术语与整个句子的数字计数、词形变化或其他语法元素不一致时,这往往会引入新的流畅性问题。

 通过人工智能词汇表术语插入,大语言模型用于使术语表术语的插入更加顺滑,确保上下文和语法的准确性。例如,在下面的图片中,您可以看到词汇表术语“publicación”的传统应用在整个字符串中引入了语法错误,其中相关的形容词现在有了不正确的音调变化(primer vs.primera)。在大语言模型的帮助下,插入适当的形容词形式并消除错误。

人工智能术语表术语插入

根据我们的研究,大语言模型可以对形态正确的词汇表插入的数量产生巨大的影响。当测试俄语和西班牙语内容时,人工智能术语表术语插入功能将正确插入的数量分别增加了25%和17.5%。这是不再需要人工修复的内容。

深入研究:编辑工作量评估

我们的编辑工作量评估技术根据达到人类质量的预期工作量对翻译进行分组。所有字符串都与我们的专有提示符一起发送到大语言模型,大语言模型根据以下条件评估字符串:

  • 语法正确性
  • 流利度
  • 语义连贯
  • 词汇准确度
  • 质量检查
  • 风格指南(对每个客户都是独一无二的)

这些分组(级别1、级别2和级别3)可以在动态工作流自动化中使用,以便根据预期的工作量来处理字符串。例如,一家公司可以将需要大量编辑的字符串分配给更有经验的语言学家,或者完全绕过人工审查需要很少或不需要编辑的字符串。客户还可以使用我们的”编辑工作量估算”折扣,为高绩效样本创建折扣等级。

编辑工作量评估

这有可能为公司节省大量时间和成本,尤其是那些大量使用人工翻译工作流程的公司。它还能让团队更深入地了解他们的翻译过程。

革新你的翻译策略

我们已经看到人工智能致力于扩大杠杆作用,提高术语表术语插入的准确性,应用正式性,等等。然而,需要大量的时间和研究来确定人工智能可以最有效并提供强劲投资回报的地方。这就是像Smartling这样的合作伙伴的帮助,所以你不必独自去做。

我们战略的一个重要组成部分是我们在R&D的投资,以确保我们能够提供业内最全面的LanguageAI™解决方案。我们在生成式人工智能方面拥有多项专利,我们的工程团队仅在过去一年就在令人震惊的3300个生产版本中交付了70多个主要功能或增强功能。

这是真正确保人工智能解决方案提供世界上最好的质量、成本、速度和体验所需要的。

了解更多有关我们最新研究的信息,以及我们在全球就绪会议上下一步要探索的内容:研究揭示——现在点播。

(机器翻译,轻度译后编辑,仅供参考。)

原文链接

编辑:张媛媛

Was it helpful ?