机器翻译译后编辑丨《机器是否可以取代人类思考?——基于ChatGPT与有道翻译的对比研究》文献推介
湖南大学 王湘玲 罗雨曦 王律 OpenAI 2022年末推出一款智能聊天工具ChatGPT,引发了全球知识界和教育界的深刻思考:它是否会取代人类思考?它与方兴未艾的机器翻译相比有何差异性?本文通过分析中国高校英语学习者在进行文学和非文学翻译任务时,运用ChatGPT进行交互式译后编辑和基于国内主流机器翻译——有道翻译——进行机器翻译译后编辑的表现,发现(1)使用ChatGPT完成文学和非文学文本的译后编辑时间均比基于有道机器翻译译后编辑长;(2)使用ChatGPT完成两种文本类型译后编辑任务的认知努力均低于有道翻译,且使用两种工具进行文学文本的译后编辑任务时,认知努力均较非文学文本低;(3)使用ChatGPT进行译后编辑形成的译文在准确度、流利度和风格方面的得分均高于有道翻译。本研究期待为AI时代中国高校学生提供英语学习工具借鉴,同时也可为机器翻译译后编辑理论与实证、机器翻译伦理与安全研究提供思考。 关键词:ChatGPT;有道翻译;译后编辑;认知努力;翻译质量 推荐语 本文就多个维度对传统MTPE及ChatGPT交互式译后编辑进行了对比。其中,本文提及的“译后编辑认知努力”这一维度尤为值得关注。它包含时间努力、技术努力和认知努力三个方面。其中,时间努力指译后编辑的任务时长;技术努力指键盘操作活动的多少;而认知努力则指“译者在处理和弥补机器翻译固有缺陷时所需的心理和努力”。认知努力不但包含识别机器翻译错误的心理努力,也包含为理解原文所作的努力,如查阅专业词汇、写作背景或捋清主从句逻辑关系等。很多时候,认知努力会影响甚至决定事件和技术努力,是研究译后编辑认知努力的主要对象。 在减少译后编辑认知努力上,ChatGPT交互式译后编辑对比传统MTPE有三大优势: ChatGPT具备校对和润色译文的功能。当需要调整译文句式或选择更地道的词汇时,ChatGPT能通过查询平行文本来满足这些要求。 作为一款大型网络检索工具和对话式语言模型,ChatGPT能比传统搜索引擎更快、更准确地提供问题答案。相较而言,使用传统MTPE需要进行额外的检索步骤,找到相应专业词汇后再进行翻译和编辑,增加了时间和精力的消耗。 在正式翻译前,ChatGPT可快速提取原文主旨大意,减轻译者的阅读理解负担。 考虑到认知努力存在较大的个体差异,本文的三位研究者主要采用主观评分的方式对基于ChatGPT交互式译后编辑和有道MTPE的认知努力进行评估,并发现被试在ChatGPT交互式译后编辑中的认知努力明显低于有道MTPE,表明ChatGPT交互式译后编辑能减少译者认知努力,提高翻译效率。 近年来,预训练语言模型如ChatGPT等生成式人工智能的出现,极大推动了机器翻译的前沿研究。与传统的基于规则的机器翻译及统计机器翻译等方法不同,ChatGPT作为一种端对端的神经网络模型,不需要手动构建翻译规则和特征,可以通过预训练及微调更高效、准确地生成连贯、自然的文本,且基于其人机交互“问答”形式产生了“交互式译后编辑”这一崭新的译后编辑模式。 为了进一步探索ChatGPT作为翻译工具的潜力,本文选择国内主流机器翻译——有道翻译进行机器翻译译后编辑(以下简称有道MTPE),并将其与ChatGPT的交互式译后编辑(以下简称ChatGPT交互PE)进行对比。在实验中,将有学生译者分别使用这两种译后编辑模式翻译文学及非文学文本,本文将观察学生译者的翻译过程及结果,对比两种译后编辑模式在任务时长、认知努力及翻译质量这三个方面的差异。 2.1 被试 本研究的被试为22名非英语专业学生。被试平均年龄为19.2岁,均以汉语作为母语,英语作为第二语言,平均英语学习年限为9.44年。他们的英语水平非常接近,且都没有在翻译公司的专业翻译经验,但都有使用翻译软件的经验,在课上也掌握了ChatGPT使用的基本规则。 2.2 实验材料 本研究选取的文学文本取自《新目标大学英语综合教程》的两篇文章,非文学文本则取自The Economist的两篇文章。四篇文章分别用于ChatGPT交互PE和有道MTPE任务,翻译方向为英译汉。研究者对四个文本的文本长度、平均句长等指标进行了测量,以保证其文本难度具有可比性。 2.3 研究工具 本研究综合运用了录屏软件、回溯报告及问卷调查等多种研究手段。在数据收集过程中,研究者运用了EVCapture软件进行屏幕录制。 2.4 实验流程 四篇文章的翻译工作分别由两组人员操作。正式实验包含两个阶段:(1)对于两个文学文本(文本1和文本2),文本1由第一组进行ChatGPT交互PE,第二组进行有道MTPE;文本2由第二组进行ChatGPT交互PE,第一组进行有道MTPE。每组完成译后编辑后,需提交译文并填写后测问卷。(2)被试继续完成两个非文学文本(文本3和文本4)的译后编辑,分组与任务顺序与文学文本一致。 表1 实验安排 3.1.1 任务时长 任务时长是指被试在每个任务中花费的总时间。图1显示,无论是对于文学文本还是非文学文本,被试在ChatGPT交互PE中花费的任务时长均多于有道MTPE,但没有明显差异。 这一发现与拉斯卡尔等人的研究结论一致:在处理挑战性任务时,如使用标准提示进行低资源机器翻译,ChatGPT的效果十分有限。相较之下,有道MTPE可针对翻译任务进行特定优化,以实现更出色的表现。另外,为保证译后编辑的准确性、流利度与译文风格,ChatGPT受试须完成“机器产出译文”“受试思考及下指令”“机器思考”等多次来回交互,使交互次数及单次交互时间均多余有道MTPE。与此同时,网络波动也更容易对ChatGPT交互PE的性能产生影响。 图1 任务类型和文本类型对任务时长的交互效应 3.1.2 认知努力 图2显示,对于两种文本类型,被试在有道MTPE中花费的认知努力均高于ChatGPT交互PE,尤在非文学文本中最为明显。这一结果表明ChatGPT能减少译者的认知努力,其原因应在于ChatGPT在润色译文、检索资料等功能上的明显优势。 图2 任务类型和文本类型对认知努力的交互效应
本研究以22名非英语专业学生为被试,从任务时长、认知努力、译文质量三个方面,对英译汉过程中ChatGPT交互PE和有道MTPE的效果进行了对比。研究发现: 就任务时长而言,对于两种文本类型,采用ChatGPT交互PE模式所需的时长均长于有道MTPE。 在认知努力上,相较于有道MTPE,使用ChatGPT交互PE所需的认知努力更低。 在翻译质量方面,ChatGPT交互PE在准确度、流畅度和风格的评分均高于有道MTPE。 总体而言,除了在任务时长上表现出的劣势,ChatGPT交互PE总体优于基于有道的机器翻译译后编辑,且对文学文本的效应更为显著。
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
翻译技术教育与研究——机器翻译译后编辑专题组致力于普及机器翻译译后编辑(MTPE)相关知识,追踪国内外机器翻译译后编辑教学与研究动态!