在一篇发表于2023年10月24日的研究论文,来自上海交通大学和腾讯人工智能实验室强调了单词级自动补全(WLAC)在计算机辅助翻译(CAT)中的重要性并提出了提高其性能的有效途径。
传统上,WLAC在“计算机辅助翻译中起重要作用 “,作为旨在提高效率的翻译人员可用的工具。正如研究人员所指出的,“有效的自动完成功能有可能减少翻译过程中至少60%的击键次数。”然而,他们发现了确定一个好的自动完成建议的现有标准中的一个关键缺陷。这种基于给定源上下文的目标词的最大似然估计(MLE)的标准经常导致次优结果。
主要问题是在预测期间依赖参考翻译不切实际,因为它不是实时可用的。这一挑战促使研究人员质疑WLAC的本质,并探索可以解决这一根本问题的替代方案。
作为回应,他们引入了一种新的方法来增强WLAC系统。他们提出了一个宽松的标准,用经过训练的输出来代替参考翻译机器翻译(MT)系统。这一调整使标准在推理过程中更加实用,允许实时调用。但是,该团队并没有停止重新定义标准。他们介绍了WLAC和机器翻译。通过一起训练这些模型,他们利用了互利,隐含地提高了完成两项任务的性能。“通过联合训练这两个模型,我们使它们能够从彼此的知识中相互受益,并提高各自的任务完成的质量,”研究人员说。
值得注意的是,联合训练方法不仅表现出优越的性能,而且在模型大小方面也表现出优势。研究人员展示了他们的方法优于提交给WMT2022 WLAC共享任务的顶级系统,同时模型尺寸明显更小。
然而,他们承认,他们的发现对其他语言的普遍性可能会有所不同,需要对多种语言进行进一步的实验,以全面了解他们联合训练方法的有效性。他们还建议探索他们的方法在资源较少情况下的性能,作为未来研究的一个重要领域。
机器翻译,轻度译后编辑,仅供参考。
编辑:张梓琦