机器翻译:语言学习和翻译发展新动力
——《所有人的机器翻译:在人工智能时代为用户赋能》评介
武汉科技大学 肖志清 李静霞
一、引 言
人工智能时代,各类翻译技术蓬勃发展。机器翻译技术,作为人工智能的终极目标之一,自20世纪30年代发展至今,已取得突破性进展。其中,神经机器翻译近年来更是占据主流,成为翻译学科的关注热点(侯强、侯瑞丽 2021: 54)。然而,机器翻译的持续发展在促进翻译技术应用、重塑翻译行业的同时,也深刻影响着语言学习和翻译(Kenny 2022: v),其带来的许多潜在问题亟待解决。
《所有人的机器翻译:在人工智能时代为用户赋能》(Machine Translation for Everyone: Empowering Users in the Age of Artificial Intelligence)一书由爱尔兰都柏林城市大学Dorothy Kenny教授主编,Language Science Press于2022年出版。该书聚焦机器翻译在语言学习和翻译中的作用与问题,旨在帮助提升机器翻译“临时用户”(occasional users)以及译员和准译员两类群体的“机器翻译素养”(Bowker & Ciro 2019)。本文在对该书各章内容进行概述的基础上,简评其特点和贡献以及对人工智能时代机器翻译研究的启发意义。
二、内容概述
该书共收录9篇文章,由Dorothy Kenny等11位机器翻译及其相邻学科领域的国际知名学者联合汇编,每篇文章涉及的论题互有差异又互相联系。9篇文章各自独立成章,专业性和阅读难度逐次递增。
第一章论题为“欧洲、多语与机器翻译”(Europe, multilingualism and machine translation),由巴塞罗那自治大学的Olga Torres-Hostench撰写。欧盟现有24种官方语言且高度重视语言多样性,采取了多项行动促进多语的发展。然而,其多语政策的实施受到语言学习和迁移的限制。在此背景下,文章认为,机器翻译可以作为促进欧洲多语的工具,帮助节省语言学习和迁移的时间,同时强调语言政策设计的必要性,既要认识机器翻译在促进多语方面的潜力,也不能忘记机器翻译在质量和伦理等方面带来的挑战。
第二章论题为“人与机器翻译”(Human and machine translation),由本书主编Dorothy Kenny撰写。作者首先概述了翻译以及机器翻译的定义。了解翻译是认识机器翻译的基础,明确机器翻译的作用和潜在问题有助于提升用户的机器翻译素养。由此,该章进一步梳理了人工智能、机器学习和机器翻译之间的关系,介绍了基于规则的机器翻译、数据驱动的机器翻译(分为统计机器翻译和神经机器翻译)的工作原理,并简要评论了几类特定的机器翻译系统和机器翻译引擎的相关概念。最后,作者总结认为,尽管旨在实现翻译自动化的神经机器翻译迅速崛起,但其仍依赖经人工验证的翻译材料作为训练数据,并需要有能够理解源文本和目标文本的人对其译文进行评估和改进。
第三章论题为“如何选择合适的神经机器翻译解决方案:机器翻译质量评估”(How to choose a suitable neural machine translation solution: Evaluation of MT quality),由格勒诺布尔·阿尔卑斯大学的Caroline Rossi和Alice Carré共同撰写。虽然当前机器翻译的迅速发展使其译文流畅度大幅提升,但由此一来,其翻译错误也愈加难以发现。文章首先介绍了神经机器翻译使用和评估的一般方面,然后具体阐述了如何结合隐私和保密因素以及机器翻译译文比较来选择合适的机器翻译引擎,以达到特定的翻译目的。机器翻译译文比较可以基于人工评估、自动评估和译后编辑努力测量。文章的后半部分聚焦机器翻译译文的人工评估和自动评估两个方面,着重探讨了使用机器自动评估指标体系的方法。作者指出,尽管机器自动评估指标体系存在一定局限,但如果理解得当并与人工评估相结合,将会产生良好的使用效果。
第四章论题为“机器翻译文本选择和准备:服务于全球读者的译前编辑和写作”(Selecting and preparing texts for machine translation: Pre-editing and writing for a global audience),由巴塞罗那自治大学的Pilar Sánchez-Gijón和都柏林城市大学的Dorothy Kenny共同撰写。基于作者的观点,尽管相较之前的技术,神经机器翻译提供的译文流畅度和准确性都有所提升,为产出高质量译文节约了时间成本,但想要在所有目的语中尽可能获取质量最高的机器翻译初始译文,并使译文适用所有的目的语读者,依靠的不仅是前一章节所提到的机器翻译系统质量,还有源文本的适用性。为此,该章引入了译前编辑的概念,“即通过对源文本的编辑,使之更加适用于机器翻译和全球的目的语读者”(Kenny 2022: 81)。在这一概念的基础上,文章探讨了译前编辑与神经机器翻译之间的关系,并针对适用于机器翻译的文本体裁和领域提出了建议。译前编辑的附加价值,即“编辑出适合多语言出版的文本内容”(Kenny 2022: 100),是该章强调的核心观点。此外,该章还从词汇选择、结构和风格、参考因素三个方面对译前编辑的应用提供了指导,并具体介绍了译前编辑所需的工具和资源以及应用条件。
第五章论题为“如何处理机器翻译错误:译后编辑”(How to deal with errors in machine translation: Post-editing),由都柏林城市大学的Sharon O’Brien撰写。为了得到高质量的机器翻译译文,除了利用前一章节所述的译前编辑来避免译文错误的发生,还需借助译后编辑识别并修改错误。该章聚焦译后编辑过程,探讨的主要话题包括译后编辑的定义和分类、译后编辑标准及准则、译后编辑界面、译后编辑努力测量、译后编辑者资质及培养。在机器翻译持续发展的背景下,译后编辑者资质及培养开始受到越来越多国内外学者的关注。该章作者总结了de Almeida和O’Brien(2010)的观点,认为好的译后编辑者应该掌握翻译技能、工作高效,遵守准则并且对机器翻译技术持有正确的态度,同时简要列举了目前国外部分高校的译后编辑能力培养模式。
第六章论题为“伦理与机器翻译”(Ethics and machine translation),由都柏林城市大学的Joss Moorkens撰写。翻译技术因人而生,又赋能于人,因此,所有与翻译技术相关的问题都可看作与“人”相关的问题(Kenny 2017: 1)。翻译伦理指翻译的主动行为人在翻译活动中所遵循的道德准则(许宏 2012: 52)。该章围绕机器翻译的伦理问题,通过举例说明的方法,从数据所有权、数据使用许可、数据分配、个人数据隐私以及机器翻译评估中的伦理问题五个方面引导读者思考机器翻译系统发展过程中翻译数据的使用涉及的法律和伦理问题,并从翻译利益相关者及风险和责任两个角度出发,分析了专业工作流程中机器翻译使用存在的伦理问题。同时,该章还指出机器翻译对可持续性和多样性的贡献,并进一步拓展了翻译伦理的概念,探讨了计算机作为伦理主体的话题。通过对机器翻译系统开发和使用中相关选择和固有风险的论述,该章旨在帮助用户在使用机器翻译的过程中“做出明智且合乎伦理标准的决定”(Kenny 2022: 123)。
第七章论题为“神经机器翻译原理”(How neural machine translation works),由西班牙阿利坎特大学的Juan Antonio Pérez-Ortiz、Mikel L. Forcada和Felipe Sánchez-Martínez共同撰写。该章主要论述了神经机器翻译原理,涉及众多计算机领域的专业概念和技术细节。为了使读者全面了解机器学习和人工神经网络原理,作者首先比较了人工翻译过程和神经机器翻译过程,在此基础上,介绍了包括人工神经元、人工神经网络、人工神经元的层、神经机器翻译、神经网络训练和神经网络泛化在内的人工神经网络相关概念。文章探讨了自然语言处理领域中非语境的词嵌入的基本原则并对transformer模型和循环模型这两类最常用的神经机器翻译模型的内部工作原理进行了整体性描述。章末,作者还补充说明了词与子词、(神经机器翻译系统训练)终止准则及指标和集束搜索一系列次要主题,帮助读者更好地了解系统相关知识。
第八章论题为“定制化机器翻译”(Custom machine translation),由西班牙Prompsit语言工程公司的Gema Ramírez-Sánchez撰写。定制化机器翻译和通用机器翻译是根据机器翻译用途划分的一组相对概念,该章开头首先对这两项概念进行了区分,然后将研究焦点转移至定制化机器翻译上,重点回答了机器翻译定制化过程中如何控制预期以及定制化神经机器翻译涉及哪些专业角色两个问题。作者还巧妙运用寓言说理的方式类比剖析了现实学习过程,并进一步介绍了实现机器翻译引擎定制化的两种方式,即通由数据的定制化方式和通由技术的定制化方式。该章结尾从可用工具、定义定制化机器翻译策略的关键因素、获取正确数据的途径、系统训练前的数据准备、定制化模型训练和定制化模型测试6个具体方面出发,为读者提供了实现机器翻译定制化的实践经验。
第九章论题为“面向语言学习者的机器翻译”(Machine translation for language learners),由格勒诺布尔·阿尔卑斯大学的Alice Carré、都柏林城市大学的Dorothy Kenny、格勒诺布尔·阿尔卑斯大学的Caroline Rossi以及巴塞罗那自治大学的Pilar SánchezGijón和Olga Torres-Hostench共同撰写。第一章浅论了机器翻译对促进语言学习的重要性,多章铺垫之后,该章对这一话题进行了更加具体深入的探讨。作者指出,尽管机器翻译在二语和外语学习中扮演的角色一直存在争议,但在特定条件下,机器翻译的战略整合可能会对语言学习有益。该章在阐述机器翻译在语言学习中扮演的角色之前首先讨论了翻译在语言学习中扮演的角色,接着介绍了在语言学习中使用机器翻译的基本技巧并提出了基于语言和基于情境的两种使用范式。同时,该章还将机器翻译与在线词典和在线语料库进行比较,强调了这些工具各自的优势。最后,作者以机器翻译的错误分析作结,提倡读者利用神经机器翻译的潜能,并将其纳入二语和外语学习的课堂之中。
三、简评
人工智能时代,机器翻译正在逐渐改变专业翻译的面貌。对机器翻译特点、原理和问题的把握可以帮助用户更好地利用其优势,提升机器翻译素养和能力。该书囊括了机器学习、神经机器翻译、译前和译后编辑、机器翻译伦理、定制化机器翻译等多个机器翻译领域热点话题,内容全面详实,语言生动易读,不失为语言学习者、语言教师、翻译教师、准译员、职业译员和翻译技术研究者等人群进行机器翻译学习、教学和研究的宝贵资源。具体而言,该书的特点和贡献主要体现在以下三个方面。
(一)指导机器翻译学习,促进欧盟多语发展
为指导机器翻译学习,该书各章以提出问题、解决问题为行文思路,在帮助读者了解机器翻译领域潜在问题的背景信息和概念知识的基础上,提出相应的建议及解决方案,有利于读者更好把握机器翻译的实际应用。此外,该书还具有明显的读者导向。部分章节提供了丰富的配套资源和讨论话题,积极引导读者拓展思考。尽管该书收录的9篇文章作者各不相同,但都尽量保持语言、内容和结构的一致性和相关性,做到了始终以读者为中心,方便读者系统学习机器翻译前沿知识。
根据欧盟委员会(2007)的定义,“多语”指社群和个人在日常生活中涉及多于一种语言的能力,双语能力也包含在内(安宁、郑咏滟 2020: 474)。该书作为欧盟“伊拉斯谟+”计划支持下“MultiTraiNMT:多语公民机器翻译培训”项目的一部分,开篇两章即点明语言学习和翻译是欧盟多语的两大支柱(Kenny 2022: v),希望发挥机器翻译在语言学习和翻译中的促进作用,从而更好地推动和维护欧盟多语发展。近年来,多语研究者开始关注语言学习对学习者质的改变(徐锦芬、潘晨茜 2021: 50)。多语制和多语教育在现代教育规划和改革中受到越来越多的重视(郑咏滟、刘维佳 2021)。本书的写作背景和出发点为国内外教育领域进一步促进多语发展提供了有效思路。
(二)着力机器翻译教学,提升语言学习效率
目前全球范围内,教师对机器翻译在语言课堂上的使用依旧存在排斥心理,但语言学习者使用机器翻译进行辅助学习的现象已经十分普遍(Kenny 2022: 189)。翻译技术背景下,教师教学观念层次在培养学生翻译能力过程中发挥突出作用,科技赋能翻译教学,有必要从树立一线教师技术信念开始(由建伟等 2021: 48)。为此,该书提供了丰富的技术信息及观点,对机器翻译教学的主要作用体现在:一方面,帮助语言教师和翻译教师等教学人员纠正对机器翻译的认识误区,重新认识机器翻译在语言学习中的重要性,从而树立正确的技术信念;另一方面,帮助教学人员积累教学资源和能力,提升现代教育信息和技术素养,更好地驱动教学行动。
有关机器翻译与语言学习的探讨贯穿全书始末,第一章中,作者简要谈论了机器翻译对促进语言学习的重要性,认为机器翻译可以为语言学习者提供资源、节省时间,从而帮助他们习得多种语言。而在最后一章中,作者详细解答了为什么要在语言学习中使用机器翻译以及如何在语言学习中使用机器翻译的问题。因此,通过加强机器翻译教学促进语言学习是一方面,该书还有利于语言学习者更好地了解机器翻译相关知识,理性看待并合理利用机器翻译这一工具,从而成功将机器翻译与语言学习进行战略融合,提升语言学习效率。
(三)拓展机器翻译研究,助推翻译技术应用
该书中,11位来自不同国家和机构的代表性学者围绕机器翻译相关问题与读者进行了一场深刻对话。书中既包含目前研究较为成熟的话题,如译后编辑、翻译质量评估等,也包含研究较少、值得学界进一步探索的话题,如机器翻译伦理、定制化机器翻译等。该书介绍了这些话题的基本信息和最新成果,研究者可在其基础上就自己感兴趣的话题进行深入思考和研究。另外,书中呈现的话题的研究思路也为研究者提供了可资借鉴的思维范式,依据这一范式,研究者可以发掘机器翻译领域其他未知且具有研究价值的话题,为机器翻译研究贡献更多新成果。
从最初的“机械大脑”到如今的深度学习神经网络机器翻译模型,机器翻译的发展离不开众多学者不懈的创新与探究。机器翻译这一新兴产业,无论在应用还是科研领域都享有良好的发展前景(高璐璐、赵雯 2020)。但总的说来,好的理论最终要在实践中验证,正如书名“在人工智能时代为用户赋能”所示,机器翻译研究最终是为了促进机器翻译技术的应用,从而为人类服务。机器翻译作为代表性翻译技术,是近年来翻译技术领域追踪的研究热点(王华树、刘世界 2022),其面对的困境和问题,具备的优势与劣势与其他翻译技术有着一定程度的相似性。因此该书在介绍机器翻译技术落地应用的同时,也有助于推动其他翻译技术的进步与应用。
然而,该书也存在些许不足之处,主要体现在以下两点:第一,写作背景限于欧盟多语的发展,缩小了其应用范围。该书对机器翻译与语言学习和翻译之间的关系的探索,最终目的是更好地促进和维护多语发展。但在当今时代,语言学习和翻译的价值绝不仅限于对欧盟多语的支持作用,还应拓展到社会、经济和文化等其他诸多层面。第二,囿于文章篇幅,书中对某些观点的举例说明较不充分。例如,第九章末尾,作者希望通过提出一些活动来阐述如何发挥神经机器翻译的潜力并将其纳入二语和外语的课堂之中,因此对错误分析这项活动进行了具体探讨,虽然讨论内容较为充分,但从总体上看,单单对一个例子加以解释说明仍使得对应观点的例证支撑稍显单薄。
四、结语
人工智能时代,翻译的“技术转向”愈加显著(王华树、刘世界 2021),对语言学习者和翻译用户的机器翻译素养以及技术运用能力提出了更高要求。《所有人的机器翻译:在人工智能时代为用户赋能》的出版恰逢其时,为国内外读者了解并运用机器翻译技术搭建起了一座坚实的桥梁。机器翻译有利有弊,扬长避短,方能发挥其优势。该书瑕不掩瑜,是一本系统学习机器翻译相关知识的最新指南。
特别说明:本文仅用于学术交流,如侵权请后台联系小编删除,因字数限制,省略参考文献。
引用参考格式:肖志清, 李静霞. 机器翻译:语言学习与翻译发展新动力——《所有人的机器翻译:在人工智能时代为用户赋能》评介[J]. 外文研究, 2023, 11(02):100-104+110.
– END –
转载来源:中国知网
编辑:何帅
审核:李长庭 陈欣怡 杨瑾