如何通过自我反思教会大语言模型翻译

分享

其他推荐

在 2024 年 6 月 12 日的一篇 的一篇论文中 来自腾讯 AI 和哈尔滨工业大学的研究人员介绍了 TasTe,这是一种用于教学大型语言模型的方法。 大型语言模型 (LLM) 通过自我反思进行翻译。

其主要理念是让 LLM 生成初步翻译(即草稿),对自己的翻译进行自我评估,并根据评估结果进行改进。

研究人员解释说,LLM 在各种自然语言处理任务中都表现出了卓越的性能,包括 机器翻译 (MT)。 然而,它们的翻译质量仍然无法与有监督的神经机器翻译(NMT)系统相提并论。

为解决这一问题,作者提出了 TasTe 框架(通过自我反思进行翻译),通过纳入自我反思过程来提高 LLM 的翻译能力。

这一过程包括两个阶段。 在第一阶段,LLM 会被提示生成初步翻译(即草稿),同时对这些翻译进行质量预测。 质量预测的形式可以是 “好”、”中 “和 “差 “等标签,也可以是 0 到 100 的分数。 这一自我评估步骤可以让模型评估自己的输出质量。

在第二阶段,LLMs 会根据第一阶段的质量预测来完善这些初步译文,从而生成最终译文。 哈尔滨工业大学助理教授刘学波在接受 Slator 采访时说,存在严重错误的低质量译稿需要进行大量修改,存在轻微错误的中等质量译稿需要进行适度调整,而错误极少或没有错误的高质量译稿则几乎不需要修改。 “他补充说:”通过让模型根据草稿质量进行修改,我们可以有效地纠正明显的错误,防止错误传播的误导,以免影响原本准确的译文,从而保障整体翻译质量。

整个过程可以看作是一种自我反思,与人类在处理复杂任务时常用的 “尝试-评估-改进 “方法如出一辙。

自动后期编辑工具

他们使用 WMT22 基准评估了 TasTe 在四个语言方向(德语 </> 英语和中文 </> 英语)的表现。 他们发现,TasTe 通过有效利用自我评估来提高翻译质量,其表现优于现有方法。

此外,他们还测试了这种方法是否可用于评估其他系统生成的翻译,并将其改进为一种 自动后期编辑 (APE) 工具. 他们发现 “TasTe 不仅可以作为单一 LLM 的有效推理框架,还可以作为 APE 工具,以增强其他翻译系统生成的翻译。.”

(机器翻译,轻度以后编辑,仅供参考)

原文链接

编辑:刘煜珍

Was it helpful ?

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注