哒哒~
新的一则热点追踪来啦!
随着机器翻译的火热运用
其方法也得以丰富多样
其中被称为DecoMT的方法引起关注
该方法可简化对亲属语言的翻译
并为此类语言填补了关键性空白
一起往后看看~
一组研究人员在2023年10月23日发表的一篇论文中介绍了一种新的机器翻译(MT)方法,该方法可简化对亲属语言的翻译。
这些亲属语言属于同一语系,具有相同的语言学特征,例如单词顺序以及词汇相似性。作者表示,这种被称为DecoMT(机器翻译的分解提示)的方法侧重于简化对此类语言的翻译。
更具体地说,DecoMT将“复杂”的翻译过程划分为“更简单、更易于操作的子任务”,而不是一次性翻译整个句子。然后通过大型语言模型(LLM)的少量提示来解决这些子任务。
DecoMT的核心概念是“单调对齐”,这是亲属语言的常见特征,即源语言中的单词顺序会保留在目标语言中。这一特性使DecoMT能够将翻译过程分解为一系列词块(word chunk)翻译。每一词块被独立翻译,然后组合起来,最终形成译句。这种方法与直接翻译整个句子的传统机器翻译方法形成鲜明对比。
作者解释道,DecoMT运用两个阶段来翻译词块。第一阶段侧重于独立每个翻译词块,第二阶段则在考虑上下文的情况下进行语境翻译。这种增量方法确保在翻译每个词块时都考虑到先前翻译的词块,从而实现更准确、更流畅的翻译。
DecoMT的一项“关键创新”是语境翻译,对每部分词块都进行增量翻译。通过采用这种循序渐进的方法,DecoMT旨在提供更准确的翻译,同时保持正确的单词顺序。
作者说:“我们认为,通过将LLM从重新排序中解放出来并专注于子句结构,可以实现更准确的翻译,特别是针对长句。”
对DecoMT的有效性进行了跨不同语系的各种相关语言对评估。评估包括自动评估法以及人工评估法。
这些评估结果表明,DecoMT在各种语言对中的表现优于现有机器翻译方法。特别值得注意的是,它在低资源语言中具有优势。
尽管这项研究利用谷歌的mT5进行独立词块翻译以及语境翻译,但作者强调,这种方法可能也适用于其他自回归LLM。“目前,我们使用mT5进行独立词块翻译以及语境翻译。但值得注意的是,任何自回归LLM都可能用于独立翻译。”作者表示。
从经济以及社会的角度来看,DecoMT的重要性不容低估。据作者称,亲属语言在机器翻译中常被忽视,而这种方法为此类语言的翻译填补了一项关键性空白。
他们强调,大量的商业活动和社会交流发生在使用两种亲属语言的邻近地区之间。他们指出:“在这些情况下,由于两步推理也可能导致级联错误,因此通过第三种语言(如英语)进行枢轴翻译(pivot translation)可能会使翻译效率低下。”
作者强调,在一个以全球商业互动和社交互动为特征的世界中,特别是在使用亲属语言的地区,DecoMT具有“简化贸易和增强社会联系”的潜力。
期待后续推文吧~
特别说明:本文内容选自Slator官网,仅供学习交流使用,如有侵权请后台联系小编删除。
– END –
摘译编辑:李春郁
推文编辑:李昔林