中外云翻译平台的对比研究——以YiCAT和Mesource为例
肖志清 陈嘉慜
摘要:计算机辅助翻译(CAT)工具可以集成各类资源和功能,能在翻译过程中为译员和团队赋能。大数据时代,在互联网技术和云计算技术的基础上,CAT工具不断迭代升级,已从最初的单机版CAT软件发展到了如今的云翻译平台。本文以YiCAT和Memsource作为中外云翻译平台的代表,从界面设计、翻译项目管理等方面对两款云翻译平台进行了综合对比,并探讨了两者在资源集成和功能创新上的差异,对比研究的结论为:YiCAT易用性强,适合CAT工具的入门用户,而Memsource功能强大,适合本地化需求大的进阶用户。通过对比两款云翻译平台的功能异同,希望本研究不仅能够有助于研究者加深对云翻译平台功能及特色的认识,还能为云翻译平台本地化和未来技术发展指明方向。
关键词:CAT工具;云翻译平台;YiCAT;Memsource;特色功能;软件本地化
来源:译苑新谭 New Perspectives in Translation Studies ISSN 2691-6649 October 2022
肖志清,武汉科技大学外国语学院讲师,硕士生导师。研究方向:翻译技术、笔译理论与实践。电子邮箱:xiaozhiqing@wust.edu.cn。
陈嘉慜,北京语言大学高级翻译学院英语笔译专业研究生。研究方向:本地化管理、翻译技术。电子邮箱:catherine_cjm@163.com。
基金:本文系中国教育部产学合作协同育人项目“基于 YiCAT 的笔译教学与实习实践基地建设”(编号:202102483031)和武汉科技大学教学研究项目“后疫情时代翻译技术实验室云端化建设探索”的阶段性成果。
计算机辅助翻译(CAT)工具自诞生以来不断迭代升级。现如今,在单机版CAT软件已然十分成熟的基础上,一些翻译技术公司将互联网技术和云计算技术应用于语言服务行业,将其与翻译技术结合,构建起了以软件即服务(SaaS)为应用模式的云翻译平台。以云计算为基础架构的云翻译平台将会引领时代的潮流(王华树, 2015: 133)。Memsource作为其他国家的云翻译平台代表,面世之后市场占有率不断攀升,被美国著名语言行业调查机构卡门森斯公司(Common Sense Advisory, CSA)评为“最可行的翻译管理系统”;而上海一者旗下的YiCAT作为中国云翻译平台代表,被CSA评为能与全球TMS平台同台竞技的“未来竞争者”(Sargent & DePalma & Toon, 2019: 4-5)。中外云翻译平台谁能赢得更多译者的青睐?各类型译者该如何进行选择?云翻译平台开发者该如何进一步优化和推广云翻译技术?本文将模拟一个译后编辑项目,对比中外两大云翻译平台YiCAT和Memsource在界面设计、译前处理、质量保证、机器翻译和特色功能中的异同,并提出有关本地化发展战略及未来发展趋势方面的建议,以期回答上述问题。
学界对CAT工具的界定有两种观点。广义上来讲,所有在翻译过程中可能会帮助到译者的电子工具都可以称作CAT工具;狭义上来讲,只有以翻译记忆库为核心的专为提高翻译效率而设计的计算机辅助翻译系统才能称作CAT工具(徐彬、郭红梅、国晓立, 2007: 79; 王华树, 2014: 92; 张霄军、王华树、吴徽徽, 2013: 10)。其他国家的学者和机构倾向于选择广义的CAT工具进行分类,分类依据一般是工具的功能,Quah(2006)将其分为语言工具、翻译工具和本地化工具,而TAUS报告则将其细分为了17个类别(Massardo & van der Meer & Khalilov, 2016: 15-27);但大部分中国学者一般会基于服务的提供形式或是工具的架构对狭义的CAT工具进行分类,比如周兴华(2015)将其分为单机版CAT软件、服务器版CAT软件、免费在线CAT软件和云翻译软件四类,而陈善伟则将其分为单机系统、基于服务器或基于互联网的网络系统(包含基于云端的系统)和混合系统(带有机器翻译功能的计算机辅助翻译系统或带有翻译记忆功能的机器翻译系统)(陈善伟, 2014: 247; Chan, 2015: 167)。
(二)计算机辅助翻译工具对比研究综述
中国学者已对不同类型的CAT工具进行了对比研究,对象主要集中在单机版CAT软件和云翻译平台上。
在云翻译平台尚未成熟时,一些学者对比了不同单机版CAT软件。徐彬等(2007)粗略地对比介绍了Trados、Déjà Vu、Wordfast和雅信CAT。朱玉彬和陈晓倩(2013)在功能性和易用性上对Trados、Déjà Vu、Wordfast和雅信CAT进行了对比,发现Trados适合翻译公司或大型机构的专职译员,Déjà Vu适合团队协作的自由译者,Wordfast适合常翻译Word文档的译者,而雅信CAT适合术语积累少的译者。周兴华(2016)系统比较了Trados、memoQ、Déjà Vu和Wordfast在协作翻译时的功能差异,分析得出单机版CAT软件无法实时共享翻译记忆库和术语库的结论,从而推荐使用云翻译平台。
随着越来越多的学者意识到协同翻译和实时共享资源的重要性,不少学者开始将单机版CAT软件和云翻译平台进行对比。周兴华(2015)基于翻译协作模式,对单机版CAT软件、服务器版CAT软件、免费在线CAT软件和云翻译软件进行了对比,认为云翻译软件是最灵活高效的,但存在数据安全性等问题。杨相苹和张发勇(2019)分析了Trados和YiCAT在项目管理、术语管理和翻译记忆上的不同,认为“云翻译是一个不可逆转的趋势”。吴婷和祁文慧(2019)在项目管理、语料管理和翻译流程上对比研究了Trados和译马网,认为两类软件各具优势。肖志清等(2021)基于译前、译中和译后的各个流程对memoQ和YiCAT进行了对比,结论认为:单机版CAT软件适合熟练译者,云翻译平台适合初学者和团队。
还有学者对不同云翻译平台进行了对比。周兴华等(2016)对Memsource Cloud和MateCat两款云翻译平台进行了功能述评和教学探讨,发现前者更适合团队协作,后者更适合自由译者。朱姝和韩启群(2019)从翻译处理、语料管理和协同翻译三方面对比了译马网、云译客和YiCAT三款中国云翻译平台的异同,认为云译客适合独立作业的自由译者,而YiCAT适合有在线对齐需求的译者。吴雨鸽(2017)从团队管理、语料管理、项目管理和任务处理方面对译马网和Smartling进行了对比分析,研究认为前者适合小型企业和本地化项目,后者适合大型企业和本地化项目。
(三)研究简评
中国学者对计算机辅助翻译工具进行的对比研究已取得了一定的成果,但仍有以下几点不足:(1)部分研究没有结合具体的翻译项目论述,存在“纸上谈兵”的问题;(2)基础性的功能对比居多,大部分研究对比的是CAT工具的一些基础操作,而对术语干预、译后编辑分析等更高阶、更实用的AI功能对比研究不足;(3)不少学者热衷于对比研究单机版CAT软件,对当今日益流行的云翻译平台(例如Memsource和YiCAT)关注度不够。在中外云翻译平台“你方唱罢我登场”的当下,其功能特色、本地化发展战略和未来发展趋势等问题更值得学界关注。
YiCAT是由上海一者信息科技有限公司自主研发的云翻译平台,2018年正式发布,旨在为用户提供更高效的翻译与本地化解决方案。自上线以来,YiCAT在多语言大数据检索分析和人工智能机器翻译等领域持续创新,获得多方认可,2020年入选翻译与本地化行业权威的全球市场研究和国际咨询公司Nimdzi Insights LLC TMS名单。Memsource是由总部位于捷克的Memsource公司开发的云翻译平台,2012年正式面向大众开放。发展至今,Memsource融合人工智能技术,协助全球企业和语言服务行业实现了大规模多语言内容的自动本地化,顺应了语言服务行业的市场需求。
本文选择YiCAT高校正式基础版和Memsource旗舰版,以《Memsource机器翻译报告》(PDF文件)作为材料,模拟一个译后编辑项目,以整个项目流程为基础对比YiCAT和Memsource在界面设计、译前处理、质量保证、机器翻译和特色功能等方面的异同。
界面设计是指“通过协调界面各构成要素,优化人与界面信息交流手段及交流过程,以提高人与界面交流的效率、实现用户需求的系统性设计”(姜葳, 2006: 9)。本文从主界面和编辑器界面两方面来对比两个平台的异同。
(1)主界面:语言本地化方面,YiCAT现阶段主要面向中国译者与机构,界面语言只有中英文两种;而Memsource所属公司总部位于捷克,且已成立日本团队和美国团队,界面语言包括英文、中文、波兰语、斯洛伐克语等18种大小语种,能覆盖更多语言社区,国际化和本地化程度显然更高。
菜单栏导航方面,YiCAT设置了“控制面板”“我的任务”“项目管理”“语言资产”“成员管理”“T币账户”和“工具箱”,并新增了“考试中心”和“课程管理”模块,可以方便管理项目和成员、组织课堂教学和测试等等,体现了翻译管理系统平台化、整合化、智能化等发展趋势;而Memsource只将“Memsource Translate”单独列为基础模块外的一栏内容,其他功能都放在“设置”中,操作步骤稍显烦琐,没有完全践行简易性的设计原则。
菜单栏中,YiCAT和Memsource都包含对特定时段项目数据的分析功能,分别在控制面板栏和主页中。YiCAT的控制面板包含项目概况、语种概况和团队概况三块内容,分析结果用图标和数字显示;而Memsource的主页包含机器翻译、费用、词等多项数据,各个主控面板可自由增减,体现了个性化定制的特点,且有可视化工具Kibana web接口的支持,分析结果显示为各类图表,可视化程度更高,平台交互性也更强。
图1 YiCAT控制面板与Memsource主页界面对比(左侧为YiCAT,右侧为Memsource)
(2)编辑器界面:与主界面的连接方面,YiCAT中,除了在项目管理中打开文件会在新标签页中打开,其他情况下,编辑器会默认在同一标签页打开,这样会使得用户在完成编辑后手误关闭标签页,导致最后需重新打开平台;而Memsource会在新的标签页中打开编辑器,关闭后不会影响主界面,这样的操作逻辑更合理。
语言方面,YiCAT编辑器的界面语言默认跟随主界面语言设置;而Memsource编辑器界面语言只支持英文,暂不支持其他语言设置,在界面语言本地化方面存在缺陷,这可能会使一些潜在的中国用户望而却步。
人性化设置方面,YiCAT可设置普通、护眼和夜间三种个性化视图模式,以适应用户在不同环境下的需求,有效缓解视觉疲劳,且字号也可更改,有小、中、大、特大四种选项;相比而言,Memsource并没有相关设置,人性化设置上稍显欠缺。
(二)译前处理
(1)文件导入:支持的格式方面,YiCAT和Memsource均支持的文件格式共有30种,涵盖了办公文件、本地化文件、网页文件、技术写作文件、压缩包文件等大部分常用格式。此外,YiCAT还支持其他21种文件格式,其中包括Memsource不支持的CAD工程文件格式;Memsource另外还支持40种文件格式,其中近半数为本地化文件格式,说明其适合本地化需求大的进阶用户。
导入前,本文首先使用YiCAT工具箱中的“PDF转Word、PPT、Excel”将Memsource机器翻译报告的PDF文件转换为Word文档,转换效果良好,除行间距不同、背景图案颜色有变化等小问题之外,文本大体上没有问题。
为减少编辑器中的标签,YiCAT的项目设置中提供了“清洗格式”这一功能,可清除原文中部分标签,以简化翻译过程;Memsource的文件导入设置中也有相似的“最小化标签数”功能,但与YiCAT不同,该功能可以对比所得文件和原文件,以防删除必要标签,设计更严谨。
导入效果方面,YiCAT将一些标签直接转化为了文本样式,稍显杂乱;而Memsource呈现的原文相对更加整洁一些,“最小化标签数”功能掌握的度会更适当一些。
(2)任务分配:文件切分方面,YiCAT仅支持按句段分和按字数分两种方式;Memsource可支持四种分割方式,分别为“分成x部分”“每x个句段”“在特定句段之后”和“每x字”,更能适应一些特殊的分配需求。
分配方式上,YiCAT通过邮件和平台消息的形式发送任务通知,邮件语言仅支持中文;Memsource会自动以发送者的首选语言作为默认语言创建任务邀请的邮件模板,模板可编辑和新建,新建模板语言为当前的界面语言。
此外,Memsource还支持发送任务邀请给多位译员。发送任务邀请的时间间隔设置成“同时”时,默认所有译员同一顺位;时间间隔设置成x分钟或x小时时,只有当第一顺位译员在设置时间内无回应时系统才会发送任务邀请给第二顺位译员,以此类推,其间若第一顺位接受任务,任务就会停止发送。利用这一设置,项目经理能够按照译员与项目的匹配度优先分配任务给最佳译员,并在最佳译员未及时回应时第一时间通知候补译员,有利于项目的快速推进。
(三)质量保证
(1)质量保证选项:选项设置方面,YiCAT共有30个质量保证规则可供勾选,还可选择“轻微/一般/严重”三种错误级别。Memsource将33个QA项目分成了语言的、术语、格式和标记、工作流、自定义检查和其他选项六大类,但分类稍显不科学,类别名称不完全平行;此外,除去一些可以填写的项目外,大部分项目都可以勾选“即时QA”和“可以忽略”,这样的设置相较YiCAT的三种错误类型而言实用度更高。
选项内容方面,对比发现,YiCAT中有20个质量保证规则可以与Memsource的QA项目对应,有多项是多对一的形式,项目描述更加具体,且YiCAT中所有质量保证规则都属于Memsource的前三大类,也就是说,Memsource比YiCAT多考虑了工作流和其他选项中的几个方面。此外,Memsource还支持用户自定义检查。用户可以设置项目标题,并添加原文和译文的正则表达式,从而根据所需的特定规则来添加QA。因此,Memsource在质量保证选项方面灵活度更大。
图3 Memsource和YiCAT独有的质量保证选项对比
(2)导出文本效果:翻译项目质量保证效果的呈现方式即为文本的翻译质量,其中不仅包括语言质量,还包括格式质量(Makoushina, 2007: 2)。从两个平台所导出的译文文本的格式质量来看,它们都能保持原文格式。Memsource导出的文档除背景图案存在一些小错误外,字体和格式保持得很好;而YiCAT中导出的译文在字体样式、文本换行和图表内文字位置等方面稍显逊色,且出现原文数字消失的现象,格式质量相对差一些,后期所需的排版时间更长。
(四)机器翻译
(1)机器翻译引擎集成:YiCAT目前共集成了18款机翻引擎,其中包括谷歌翻译等通用领域机器翻译,阿里翻译(电商、医疗)等垂直领域机器翻译引擎,以及Tencent TranSmart交互式机器翻译等新一代机器翻译引擎;而Memsource除Memsource Translate外没有直接可用的机翻引擎,罗列出来的39种都需要额外的API密钥。但经查证,其中的一些引擎(例如DeepL)是不支持网页版翻译器API服务的。因此,在机翻引擎集成方面,YiCAT更胜一筹。
(2)机器翻译优选:为使译员能在翻译不同类型的文本甚至句段时匹配到最为准确的机翻引擎,YiCAT和Memsource分别开发了YiCAT优选和Memsource Translate。YiCAT优选集成了十余款中外机器翻译引擎,旨在使每一句原文匹配到最为准确的机翻引擎,从而确保全篇译文质量达到最优;而Memsource Translate在默认配置下,只整合了谷歌翻译、微软翻译和亚马逊翻译三款机翻引擎,且不同于前者,Memsource Translate的目的是找到每一项工作的最佳机翻引擎。
调用结果方面,由于YiCAT优选没有统计功能,故笔者在除去非译元素和过短的句段后共采取到有效样本句段101个,借助GT4T翻译器,得出了各引擎命中最佳引擎的数量(若YiCAT优选译文与多个机翻译文相同,则每个机翻引擎命中数量加一),结果如图4所示,YiCAT优选调用亚马逊翻译最多,约占半数,最少的是微软翻译;而Memsource Translate是可以显示各款机器翻译引擎的字符消耗数的,Memsource Translate在本项目中调用的都是谷歌翻译,而YiCAT优选调用谷歌翻译的数量只占不到一成,说明两者在AI算法上存在很大的差异。
图4 各机翻引擎命中YiCAT优选得出的最佳机翻引擎的数量统计图
译文质量方面,YiCAT优选所选出的译文质量堪忧。一方面,由于AI智能算法仍未完全成熟,导致调用的译文错译现象严重,例如将长度单位“mm”译为“MM”等;另一方面,因调用机翻引擎过多,译文上下表达不一致,例如“post-editing”在译文中有多达三种译法(此处未开启术语干预功能)等,全文翻译质量不但没有提升,反而有下降态势。
相对地,由于Memsource Translate调用的都是谷歌翻译,因此没有出现上下文表达不一致的问题。对于单个句段的译文质量,Memsource还带有Machine Translation Quality Estimation(MTQE)功能,该功能可以评估每个句段所调用的机翻译文,得出100%、99%、75%和无分数四种机器翻译匹配值,分别代表了无须译后编辑、轻微排版错误、需要一些译后编辑和机翻译文质量差四种评估结果,用户在译后编辑时可根据每个句段的机器翻译匹配值来判断该句段所需的译后编辑量,相较YiCAT优选而言更智能,能一定程度上减少译者在机译选择和译后编辑上的认知负荷。
包括云翻译平台在内的所有CAT工具设计均有同质化倾向,但YiCAT和Memsource也有如下一些独有的功能。
(1)YiCAT的术语干预:系统可在调用机器翻译结果时,根据已启用的术语库,将术语翻译自动应用到机翻译文中。
如图5所示:左侧,术语干预功能启用前,机器翻译结果中post-editing译为“后期编辑”,而MT output译为“MT输出”;而右侧是启用了术语干预功能后的机器翻译结果,post-editing和MT output都按照术语库中所对应的译法改为了“译后编辑”和“机器翻译输出”。
图5 YiCAT术语干预功能启用前后效果对比(左侧为未启用术语干预功能)
由此看来,术语干预功能可以有效提高术语机翻结果的准确度,确保了译文表达的一致性,大大减轻了译者手动查找替换术语的负担,提升了翻译和审校的工作效率和翻译质量。
(2)Memsource的译后编辑分析:可用于了解目标文本中翻译记忆库的使用情况,以及机器翻译和非译元素的译后编辑程度。
在本测试项目中,因Memsource无专门的译后编辑工作流步骤,故译后编辑分析计算的是翻译文本与审校文本之间的差异。译后编辑分析前,可选择是否分析翻译记忆库、机器翻译和非译元素的译后编辑程度。翻译记忆库的译后编辑分析与其他CAT工具中的翻译记忆分析类似。机器翻译方面,若启用,译后编辑百分比与MTQE得出的匹配值无关,只与编辑量有关,计算方式与翻译记忆模糊匹配值计算方法相同;若不启用,译后编辑百分比即为MTQE得到的匹配值。非译元素方面,若无编辑,译后编辑百分比为100%,一旦编辑,百分比会降至0-49%。
通过译后编辑分析报告(见图6),用户可得知实际的译后编辑工作量或审校工作量和编辑时间(单位为秒),并辅以净计费率,做出更精确的薪酬计算。
图6 Memsource译后编辑分析报告
(一)云翻译平台的中国本地化建议
Memsource作为“全球语言服务行业使用最多的”云翻译平台(周兴华、王传英, 2020: 121),在中国的知名度和市场占有率却不高。Memsource若想在中国市场立足,除加强软件语言本地化之外,还需从服务器和校企合作两方面下手。
服务器方面,由于Memsource的服务器不在中国,访问距离过远导致访问速度变慢,尤其是夜间的高峰时间,打开编辑器的时间竟有19.8s之长,非常影响中国用户体验。因此,Memsource若想扩大中国市场,需先通过转换国际专线、租用中转服务器等手段解决访问速度问题,才有进一步的可能。
校企合作是扩大市场的有效方法之一,且其作用可延续多年。Memsource可仿效中国的YiCAT、译马网、试译宝等平台,通过联合高校共建翻译实验室、开展普及性讲座、举办译后编辑比赛、提供实习岗位等方式提高平台的知名度(王华树, 2012: 62),让学生译员了解、试用并信任其平台,从而提高用户黏度。
(二)云翻译平台的总体发展趋势展望
未来云翻译技术的发展主要会有四种趋势,分别为整合化、智能化、专业化和安全化。
(1)整合化,即各种功能、资源和翻译辅助工具都会整合到一个集成性云翻译平台上。从最初只有模糊匹配和编辑功能的CAT工具到现在内部功能已不限于翻译领域的云翻译平台(王华树, 2014: 94),整合化趋势十分凸显。未来,云翻译平台可能将功能拓展至口译领域,将语音识别等功能也纳入进来。此外,中外各大平台也会相互借鉴学习,整合其他平台中有价值的翻译及辅助翻译功能、资源和工具,提高自身的可用度,以此增加用户数量。
(2)智能化,即云翻译平台的功能与人工智能技术在更深层次上相互融合。现阶段,各大云翻译平台虽有不少功能涉及人工智能技术,但通过项目验证表明,这些功能尚处于弱人工智能阶段。未来,各大云翻译平台将继续融合“以大数据和语料库技术为基础,以机器学习、深度学习等为核心的人工智能新技术”(周兴华、王传英,2020: 128),不断更新功能背后的AI算法,以给用户带来更好的使用体验。
(3)专业化,即云翻译平台的适用领域及其所集成的机翻引擎会更具有针对性。不同领域的文本对于翻译技术的需求是有不同偏向的,现阶段,云翻译平台所声称的对文本领域的普适性仅适用于专业性不强的文本,机器翻译与许多领域的结合也仍停留在比较浅层的层面(屈哨兵, 2020: 289)。未来,各大云翻译平台会采取差异化发展战略,专攻少许甚至单个领域,使平台内的功能和资源更适配于特定的垂直领域,同时,平台也会集成更多深耕于同一领域的机翻引擎,最终向真正的“人助机译”——强人工智能迈进。
(4)安全化,即云翻译平台用户的隐私和语料数据被窃取和泄露的风险会更低。现阶段,人工智能技术发展引发的数据需求和隐私保护之间的矛盾给云翻译平台带来了巨大的压力(王华树、王鑫, 2021: 13),且各平台对上传至云端的数据的保护级别也不高。未来,各大云翻译平台会利用私有云、数据加密技术等手段保证用户数据不被非法窃取和泄露,以此提高用户信任度。
总的来说,中国的YiCAT易用性强,且辅助工具和机翻引擎集成量大,是译者CAT工具入门的最佳选择之一;而捷克的Memsource功能强大,能满足用户多元化的翻译及本地化需求,是进阶用户青睐的平台。各类译员在选择前必须深入了解它们的功能特色,才能找到最适合自己和所从事翻译领域的平台,提高翻译的质量和效率。相应地,中外各大云翻译平台也需跟上人工智能等技术的步伐,不断完善本地化应用,提高智能化程度,注重数据安全性,以此扩大市场份额,从而为中国乃至全世界的译者提供更加整合化、智能化、专业化和安全化的云翻译平台。
特别说明:本文发表于《译苑新谭》2022年第2期,第100-110页,推文分享已获作者授权,限于篇幅,此处省略参考文献,引用请以期刊版为准。本文仅用于学术交流,如有侵权请后台联系小编删除。
– END –
导图作者及编辑:祝蕙兰