随着人工智能翻译在全球范围内的使用率呈指数级增长,人们越来越关注如何确保其产出符合品牌标准并满足客户的特定需求。实现这一目标的有效方法之一就是使用定制机器翻译(MT)引擎。通过利用公司的语言资产,如翻译记忆库、风格指南、勿译列表和词汇表,这些引擎可以进行定制,以优化产出,从而实现品牌合规性和质量。
然而,关键问题仍然是:定制引擎对翻译质量和品牌一致性等方面的实际影响是什么?它们真的值得投资吗?Smartling AI 领导人 Olga Beregovaya 和 Alex Yanishevsky 在最近的 Smartling 网络研讨会上探讨了这些问题以及更多。请继续阅读对话中的一些主要观点。
- 在生成式人工智能(GenAI)时代,为什么要使用机器翻译(MT)?事实胜于雄辩。
虽然有关 GenAI 的热议可能表明业界已经从 MT 转向 GenAI,但数据却显示了相反的情况。在 Smartling 基准评估中,MT 的表现仍然优于 GPT4 等大型语言模型,BLEU 分数一直较高,编辑距离也较低。尽管如此,GenAI 仍然可以在翻译工作流程中发挥重要作用(见本列表第 X 项)。
- 定制引擎可提供更高质量的输出。时期。
训练有素的引擎与未经训练的引擎相比,不仅 BLEU 分数平均高出 18%,而且其输出所需的编辑量也比通用引擎少 22%。这些更高质量的产出需要人工译员更少的审核,从而使翻译团队能够更高效地工作。更有效的是,当与动态模糊匹配修复或形式切换等自学习人工智能功能相结合时,与通用引擎或 GenAI 本身相比,定制引擎能持续提供更高质量的输出。
- 定制引擎训练的黄金法则: 垃圾进,垃圾出。
训练 MT 引擎需要上传语言资产,如风格指南和词汇表,但 “上传并祈祷 “的方法只能使引擎的质量提高到一定程度。因此,人工智能界有句俗话叫 “垃圾进,垃圾出”。MT 引擎更喜欢用它们能理解的语言(TMX 文件)格式化的清晰、明确的条目。有效的定制培训需要采用高度细化的方法来上传语言内容,您的团队可以对引擎的培训内容和培训方式进行大量控制。
确保引擎与时俱进。
培训自定义引擎就像保持正确的牙齿卫生一样。如果不定期检查,就会形成蛀牙并造成损害。同样,随着您业务的增长,您的自定义引擎也需要定期更新新的术语、信息和风格指南,以继续提供准确的输出。
- LLM + 定制引擎: “非此即彼 “还是 “兼而有之”?
我们的答案是:两者兼而有之!
与传统 MT 相比,单靠 LLM 可能无法持续提供更高质量的输出,但它们在完善和增强 MT 输出的特定任务(如格式转换、遵守风格指南和受众角色调整)方面表现出色。
Smartling 的最新创新产品人工智能翻译工具包利用 LLM 的强大功能优化 MT 输出。AI Fuzzy Match Repair 和 Glossary Term Insertion 等动态功能使用 LLM 来纠正语法错误并确保品牌一致性,从而提高 MT 翻译的质量。
- 一切都取决于投资回报率。
要确定定制引擎培训是否适合您的翻译工作流程,关键在于投资回报率。如果您已经拥有一个强大的翻译记忆库,其中包含了您计划在未来翻译的大部分内容,那么通用 MT 引擎就可以满足您的翻译需求,而无需投资定制引擎。但是,通用引擎可能不具备特定领域或语言的词汇。如果是这种情况,定制引擎培训是一项值得投资的项目,可以简化您的翻译工作流程。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:张媛媛