在2024年1月2日发表的一篇论文中,谷歌研究人员Jiaming Luo、Colin Cherry和George Foster比较了机器翻译(MT)和人工翻译(HT)中的形态句法差异,发现MT往往比HT更“保守”。
作者解释称,翻译差异发生在译本在结构上与源语句不同的情况下。这可能是由于跨语言的固有差异或译者的特异偏好所致。他们表示,这些差异在翻译过程中自然发生,并且可以在人工翻译中轻松找到,包括用于训练机器翻译系统的翻译。
他们还强调,长期以来人工翻译中存在的这些差异一直被视为机器翻译的关键挑战,最近的研究已经证明了人工翻译中翻译差异大量存在。
为了达到这个目的,他们进行了实验证明机器翻译(MT)和人工翻译(HT)在形态句法差异方面的差异,理解这种差异的来源,并探讨了人工翻译中的翻译差异如何影响机器翻译(MT)质量。实验使用WMT数据集,在三种语言对(英语-法语、英语-德语、英语-中文)上进行。
保守的机器翻译
结果显示,相较于人工翻译(HT),机器翻译(MT)更加“保守”,表现出较少的形态句法多样性、更多的收敛模式和更多的一对一对齐。他们还观察到,当源语言中的常见结构较少时,机器翻译与人工翻译相似性较低。
作者将这种差异归因于束搜索的使用,这使得机器翻译偏向于更加收敛的模式。当训练数据中频繁出现收敛模式时,这种偏见最为显著,约占50%。作者表示:“这可能是因为模型已经看到足够的模式以分配相当的概率质量,但仍存在足够的不确定性,因而人类经常会选择其他模式。”
此外,如果文本在人类翻译中不常见的话,机器翻译使用收敛模式的频率也会增加,这可能表明目前机器翻译结构上存在更为固有的偏见。
最后,他们调查了人工翻译中的形态句法差异如何影响机器翻译的质量,并发现在大多数情况中,人工翻译中的形态句法差异与机器翻译性能下降相关,给机器翻译系统带来更大的挑战。
作者强调:“这是首个以如此精细的粒度呈现人工翻译与机器翻译对比视角的工作,涵盖数千种形态句法结构”,并表示他们有兴趣将相同的分析应用于基于大型语言模型(LLM)的机器翻译系统,以查看LLM翻译与传统机器翻译模型产生的翻译之间的差异。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:刘煜珍