在一篇发表于2024年1月2日的文章中,谷歌研究人员罗家明、科林·切里和乔治·福斯特比较了机器翻译(MT)与人工翻译(HT),并发现MT比HT更倾向于“保守”。
作者解释说,当翻译在结构上与源句子不同时,就会出现翻译差异。这可能是由固有的跨语言差异或译者的特殊偏好造成的。他们表示,这些差异自然发生在翻译过程中,可以很容易地在人工翻译中找到,包括那些用于训练MT系统的翻译。他们还强调,HT中存在的这些差异长期以来一直被视为是MT面临的重大挑战,最近的研究表明HT中存在大量的翻译差异。为此,他们进行了实验来评估MT和HT在形态句法差异方面的区别,了解这种区别的来源,并探索HT中的翻译差异如何影响MT质量。实验在三种语言对中进行:英语—法语、英语—德语和英语—汉语,使用WMT数据集。
保守的机器翻译
结果显示,MT比HT更“保守”,表现出更少的形态句法多样性,更多的趋同和一对一。他们还观察到,当原文具有不太常见的结构时,MT往往与HT不太相似。作者将这种差异归因于波束搜索的使用,这使MT偏向于更收敛的模式。当收敛模式在训练数据中频繁出现(大约50%的时间)时,这种偏差最为突出。文章作者表示:“这可能是因为模型已经看到了足够多的模式,给它分配了相当大的概率质量,但仍然有足够的不确定性,人类会经常选择其他模式,”。此外,即使在HT中不常见,MT中收敛模式的频率也会增加,这可能表明当前MT架构中存在更固有的结构偏差。最后,他们研究了HT中形态句法差异的存在如何影响MT质量,并发现,对于大多数形态句法差异,它们在HT中的存在与MT性能下降相关,这对MT系统提出了更大的挑战。作者强调,“这是第一部以如此精细的粒度呈现HT与MT的比较视角的作品,涵盖了数千种形态句法结构”,并表示他们有兴趣将相同的分析应用于大型语言模型(LLM)的机器翻译系统,并了解LLM翻译不同于传统MT模型产生的翻译。
机器翻译,轻度译后编辑,仅供参考;编辑:陈驭格。