如今,人工智能的时代大势引发了深刻的技术革命、教育变革和数据革命,同时翻译技术也成为了翻译教学和实践中不可分割的部分,进一步推动了语言服务行业和高校教育的创新变革,促进了技术与人的和谐共生。为提升语言服务行业各方对翻译技术的认识和应用能力,加强语言服务人才的技术素养,加速语言技术成果的高效转化,整合当前优质和有效的翻译技术资源,推动翻译技术与翻译教学的融合发展,促进政、产、学、研的协同创新,WITTA翻译技术教育研究会(TTES)特别策划了【大咖专栏】,本期专栏将聚焦“机器翻译和译后编辑”,对话业界和学界的专家教授,聆听业内名家的精彩观点,洞见未来翻译技术发展趋势。
本期专访嘉宾是北京语言大学外国语学部高级翻译学院硕士生导师、国家级和北京市一流本科专业翻译(本地化方向)专业负责人韩林涛老师。让我们来听听他对译后编辑的看法。
程
在人机共生时代,您认为文科生应如何学习机器翻译?
韩
(来源:https://github.com/NiuTrans/MTBook)
如果一周学一章,一个学期下来正好学十八周。
我们再来看世界翻译技术教育联盟(WITTA)翻译技术教育研究会在2019年推出的《机器翻译与译后编辑》教学指南:
显然这门课程就更“文”一些了,少了很多“模型”,多了很多“技能”、“工具”和“方法”。所以,对于翻译专业的文科生而言,按这门课程的内容来学习机器翻译要更实际一些。
以上两门课程一武一文,前者更偏向于机器翻译的原理,后者更偏向于机器翻译的应用。
一个人工智能学院的学生毕业后进入翻译公司,老板说“我想拥有一套机器翻译系统”,于是这位同学会打开一台电脑,部署一套开源的神经机器翻译源代码,然后瞪着水盈盈的大眼睛问老板:您的数据在哪儿?
一个高级翻译学院的学生毕业后进入翻译公司,老板说“我想拥有一套机器翻译系统”,于是这位同学会打开一台电脑,打开某个计算机辅助翻译工具的页面,然后瞪着水灵灵的大眼睛问老板:十几个机器翻译系统,您想选哪一个?
不知道大家有没有看懂这两个例子,如果你学机器翻译的目的是想造一个新的机器翻译引擎,那么可以去人工智能学院,神经机器翻译模型是现成的,优化神经机器翻译模型的技术是现成的,网上开源的小规模双语数据也是现成的,学完之后可以直接用开源的机器翻译模型来部署一套新的机器翻译,也可以自己依据神经机器翻译的算法来从零做一套机器翻译系统。你可以过不了四六级,但这不影响你开发出一套有模有样的在线机器翻译系统,然后起个酷炫的名字发布到网上供别人免费使用。但慢慢你会发现,你渴望更多的双语高质量数据,没有更多的数据你没法进一步提高机器翻译的质量;慢慢你会发现,你需要更大的模型更好的硬件,否则也没办法进一步提高机器翻译的质量。
但如果你学机器翻译的目的是为了用更快的速度完成更多的翻译任务,那么你可以去高级翻译学院,那里有人告诉你怎样的机器翻译引擎适用于怎样的领域,那里有人告诉你怎么去修改低质量的机器翻译结果。你可以完全不懂编程,但这不影响你在一个精密的计算机辅助翻译工具去自如的切换不同的机器翻译引擎,你可以在翻译完几十万字后对不同的机器翻译引擎评头论足,你可以构建一整套机器翻译应用于某个具体领域的语言服务解决方案,然后给这套解决方案起个酷炫的名字去说服你的客户购买你的语言服务。但慢慢你会发现,你渴望机器翻译系统能够根据你的质量反馈意见来优化它未来的翻译结果,否则你只能重复修改一样的错误;慢慢你会发现,不仅机器翻译的质量还有很大问题,你自己的中外文水平也有很大问题,限制你翻译业务发展的反而是你自身的语言水平。
当然,也有一部分人,他们既没有去人工智能学院学过机器翻译,也没有去高级翻译学院学过机器翻译,但也有不少与机器翻译有关的雄论。对文科生而言,两种类型的课程都可以去学习,如果你还是本科生,不妨趁年轻都深入学习一下;如果你还是研究生,不妨先照着机器翻译与译后编辑课程的大纲学习如何让机器翻译质量的变得更好,然后再花点时间去了解机器翻译的原理。但我奉劝大家,没有学这两门课程之前,切勿瞎说。
程
韩
我们建议长期从事某个翻译实践的个人或企业对该领域的不同机器翻译系统产品进行定时定量的翻译质量评估。质量评估的方法优先采用国内外通用的翻译质量评估模型,如MQM、DQF等。针对翻译质量评估的结果形成专门领域的机器翻译译后编辑指南,如中国翻译协会本地化服务委员会推出的《技术文档机器翻译译后编辑入门手册》。根据此类指南再选定多款常用的计算机辅助翻译工具(如国外的、国产的、线上的、客户端的等),针对不同计算机辅助翻译工具的功能特点编制机器翻译译后编辑工作流程。从而为未来的翻译实践做好相应准备,针对翻译实践的文本特点、客户需求、人员组成等快速构建适应的机器翻译译后编辑流程。
程
韩
问题一:缺乏足够的翻译实践项目
纯粹的翻译类课程往往以翻译能力提升为主,许多高校甚至没有足够的翻译类课程,有些高校则没有足够的翻译实践项目,无法在实战中接触机器翻译译后编辑流程,所以这些高校对机器翻译课程的诉求并不强。
问题二:缺乏能够讲解机器翻译的师资
与计算机辅助翻译课程早期普及面临的问题类似,能够针对翻译专业文科生讲解机器翻译原理和应用的师资严重匮乏。虽然现在市面上可以找到许多机器翻译的教材和视频资源,但均不是以翻译专业文科生作为授课对象来讲解,因此这些资源无法直接为翻译专业授课教师所用。机器翻译的原理涉及线性代数、概率论、微积分等数学知识,且原理部分即便能够以通俗易懂的方式讲解清楚,翻译专业授课教师也难以给学生演示这些原理是如何应用于实际的机器翻译系统开发的,所以翻译专业授课教师仅能将机器翻译作为一个工具,重点讲解如何开展机器翻译的译后编辑。
程
韩
如果高校能够引入大量真实的机器翻译译后编辑项目,就会倒推高校在既有的计算机辅助翻译课程中纳入机器翻译相关的课程资源,进而形成机器翻译译后编辑课程,最终形成完整的机器翻译课程。
对于BTI而言,本科阶段应当尽早在大一开设数学基础课程,讲解线性代数基础、概率论基础、微积分基础,并在大一阶段开设Python课程,以此为未来开设机器翻译课程打好基础;本科阶段最早可在大三开设自然语言处理基础课程,并在其中嵌入机器翻译的原理,教会学生如何部署一个简单的开源机器翻译引擎;本科生不必过早接触机器翻译译后编辑课程。
对于MTI而言,绝大部分进入研究生阶段的同学在过去的四年间并没有足够的数学基础、编程基础和自然语言处理基础,因此并不能在研一阶段充分理解机器翻译的原理,所以可以在开设计算机辅助翻译课程的前提下,开设机器翻译译后编辑课程,帮助学生了解如何评估机器翻译的质量、如何在计算机辅助翻译工具中应用机器翻译、如何管理机器翻译译后编辑项目等;对于学有余力的研究生,可以进一步讲解机器翻译的原理,帮助他们进一步分析机器翻译的优缺点成因。
程
韩
韩林涛
北京语言大学外国语学部高级翻译学院硕士生导师,担任国家级和北京市级一流本科专业翻译(本地化方向)专业负责人。在校主讲本科阶段和研究生阶段术语学、翻译项目管理、计算机辅助翻译、数据库原理、翻译与本地化实践、翻译项目管理等课程,长期致力于探索“翻译”与“技术”的深度融合之道。著有《译者编程入门指南》,由北京市教委评为北京高校优质本科教材。在语料库研究方面,韩林涛担任冬奥术语平台项目负责人,参与设计研发支持八个语种的在线术语检索和管理平台;新冠疫情爆发后,韩林涛研制了在线多语种疫情平行句库Bicovid.org,并将该平台的核心代码开源发布,可以实现多语种平行句库的上传、审核、管理、发布和查询。
转载来源:翻译技术教育与研究
作者:程黛圆