谷歌与Welocalize合作测试其自适应翻译大语言模型解决方案

分享

其他推荐

谷歌最近与著名的语言服务提供商Welocalize合作,严格评估其新的自适应翻译大语言模型(LLM)解决方案。这家合资企业是谷歌通过先进的人工智能(AI)技术增强机器翻译(MT)的持续承诺的一部分。

该合作伙伴的研究强调了卓越的大语言模型输出的潜力,有望超越传统方法增强翻译的可访问性。值得注意的是,与其他评估技术相比,谷歌的自适应翻译系统表现出了卓越的流畅性和定制的写作风格,以满足客户的偏好。

Welocalize在这方面与谷歌联手,对谷歌的自适应翻译大语言模型解决方案进行了详细的案例研究。这一合作标志着Welocalize成为研究这些先进模型的先驱。

这项联合研究仔细研究了自适应翻译的早期阶段,这是谷歌翻译API 高级版中的一项新功能。该功能集成了专门针对文本翻译进行微调的大语言模型,为用户提供了一种快速、直接的方法来实时优化翻译输出,更紧密地符合他们的文体需求和特定用例。研究结果表明,这种方法可以带来更高质量的大语言模型产出,提高超越传统方法增强翻译的可访问性。

适应性翻译在提高机器翻译中的作用

大语言模型改变了机器翻译,它更加灵活并且引入了上下文理解。谷歌利用这一进展,将针对特定翻译任务进行微调的生成式人工智能模型整合到他们的翻译API中。这些专用模型是Google基础模型的衍生品,旨在根据特定客户需求定制翻译,并可通过Translation API Advanced在公共预览版中访问

Welocalize与Google合作研究的视角

Welocalize人工智能工程主管Mikaela Grace分享了她对合作的见解:“我们与谷歌的联合研究反映了我们对人工智能驱动的本地化创新的承诺。这种利用大语言模型进行适应性翻译的尝试为提高大语言模型产出带来了令人兴奋的可能性,有可能改善传统工作流程之外的高质量翻译。”

研究目标和方法

Welocalize的研究旨在比较谷歌自适应翻译大语言模型解决方案与其定制和通用机器翻译系统的性能。这项研究包括选择具有跨各种语言对和内容类型的小数据集的现有模型。它通过保持相等的数据量,确保了Adaptive和AutoML方法之间的公平比较。该研究包括通过不同数据大小的预览定制Google Adaptive的三个迭代,并涉及详细的人工评估。

主要成果和意见

研究表明,自适应翻译方法在准确性、流畅性、风格和遵守当地惯例方面优于传统方法,关键错误更少,并增强了对客户风格的定制。然而,传统的机器翻译模型尤其是AutoML,在处理术语和标签方面表现出色。值得注意的是,具有较小示例集的自适应翻译在总体充分性和流畅性方面得分最高,而自适应翻译中较大数据集在准确性、流畅性和风格方面明显优于AutoML。

Google的自适应解决方案特别适合于具有最少客户端特定术语、低定制数据以及注重风格的内容类型。相比之下,传统的机器翻译模型,如AutoML,对于需要精确术语的技术写作更有效。

自适应翻译性能的深入分析

  • 当使用大约20,000个片段时,自适应模型在准确性、流畅性和风格方面远远超过了谷歌的定制神经网络机器翻译。
  • 自适应模型擅长从这个相对较小的数据集适应客户风格,而不会影响准确性。
  • 当用更小的数据集进行微调时,自适应模型在准确性和客户风格方面远远优于通用谷歌。
  • 特定于客户的术语是自适应模型的主要缺点。

五种模式的评价与比较
对五个模型的评估和比较涉及使用1-5的Likert量表评估充分性和流畅性,其中1代表翻译较差5代表翻译完美。

结论和未来方向

这项广泛的研究证明了谷歌的自适应翻译大语言模型在需要高流畅性和风格适应的场景中的有效性,同时确定了在处理客户特定术语方面需要改进的地方。

作为高级翻译API的一部分,自适应翻译有助于与各种翻译管理系统(TMS)和计算机辅助翻译工具集成,从而提高工作流程效率。我们鼓励翻译管理系统和计算机辅助翻译工具开发人员更新他们的插件以包含这一新功能,让客户从这一技术进步中受益。

Welocalize的高级人工智能项目经理伊莱恩·奥柯伦(Elaine O’Curran)评论说:“自适应模型对一般、营销和创意内容特别有效。但是,在术语自适应得到完善之前,我们建议不要将自适应翻译用于大量使用专业术语的项目,如用户指南或带有大量UI引用和特定于客户的术语的帮助文章。”

O’Curran补充说,“自适应模型的最大数据量是30K个句子,这对于我们传统的定制机器翻译模型来说相对较小。我们最初的假设是,传统的机器翻译难以处理小数据集,自适应翻译将是一个可行的替代方案。这一令人鼓舞的结果表明,即使有传统机器翻译有更大的数据集,自适应翻译也可能取代传统的机器翻译。例如,我们计划通过营销内容来进一步探索这一点。”

使用大语言模型的自适应翻译代表了获得更高质量大语言模型输出的潜在途径,这可以提高传统工作流程之外的高质量翻译的可访问性。自适应翻译不需要任何即时工程,将更容易集成到现有的工作流程中。

针对大语言模型替代方案,对当前机器翻译解决方案进行持续的基准测试和评估,对于企业保持领先地位并从新兴的GenAI全球内容解决方案中受益至关重要。这项创新将使高性能且经过调优的机器翻译得到更广泛的应用。

原文链接 

 

(机器翻译,轻度译后编辑,仅供参考。)

编辑:曾钰璇

Was it helpful ?