读书报告|2024计算机辅助翻译技术发展与应用蓝皮书 (文末附全文)
以下文章来源于国际翻译动态 ,作者袁圣 马维
国际翻译动态
✦
✦
✦
2024计算机辅助翻译技术发展与应用蓝皮书
阅读报告
图片来源:2024中国翻译协会年会“新时代翻译技术创新发展论坛”圆满举办 (aticicg.org.cn)
一、翻译数字化智能化升级已成为时代之需
在当今数字化、信息化时代的背景下,翻译行业数字化和智能化的升级已成为十分重要的问题。首先,翻译作为国际传播的关键:在全球化和国际竞争日益激烈的背景下,翻译不仅是文化传播的桥梁,也是提升国家软实力和国际话语权的关键。国家领导人强调了加强国际传播能力的重要性,翻译在此过程中扮演着至关重要的角色,尤其是在讲好中国故事、传播中国声音方面。其次,新技术推动翻译行业发展:随着信息技术和人工智能的快速发展,翻译行业也迎来了新的发展机遇。新兴技术如生成式人工智能在翻译领域的应用,为提升翻译质量和效率提供了新的动力。国家鼓励创新驱动发展战略,强调科技自立自强,翻译行业的技术革新是提升国家科技竞争力的一部分。最后,当前翻译行业正逐步采用人机协作的模式,以提高翻译工作的质量和效率。中国翻译协会的报告显示,越来越多的翻译项目开始使用机器翻译技术。教育体系也在适应这一变化,加强翻译技术的教学和实操能力培养,以培养能够适应新技术要求的复合型翻译人才。
二、计算机辅助翻译概述
计算机辅助翻译(Computer-Aided/Assisted Translation, CAT)在广义上涵盖了所有能够协助译员完成翻译工作的计算机工具,包括但不限于文字处理、格式转换以及电子词典等。在狭义上,计算机辅助翻译特指那些专为提升翻译效率、优化翻译流程而设计的专业计算机辅助翻译软件/系统。计算机辅助翻译的核心之一是翻译记忆技术。译员可借助计算机辅助翻译软件/系统积累术语、建立和完善记忆库等,从而在后续翻译工作中提高翻译质量和效率。
计算机辅助翻译包含以下核心功能:
1
翻译记忆(Translation Memory)
存储和检索已翻译过的句子或片段,提高翻译效率。
2
语料对齐(Alignment)
建立源语与目标语词、短语、句、段等相同语言单位间的对应关系。语料对齐是依据现有翻译资源建立翻译记忆库的过程。
3
术语管理(Terminology Management)
集中管理和维护术语,确保整个翻译项目中术语的一致性和准确性。
4
机器翻译(Machine Translation)
利用自然语言处理算法和大量语料数据自动将源语言文本翻译成目标语言。
5
译后编辑(Post-editing)
审查和修改机器翻译结果等步骤。
6
流程管理(Process Management)
流程管理可以提升翻译流程的自动化和标准化水平。典型的计算机辅助翻译流程包括文档预处理、切分与分析、翻译与编辑、质量保证、审校、后处理与导出等。
7
项目管理(Project Management)
包括需求分析、任务分配、进度规划、资源管理(如翻译团队、翻译记 忆库、术语库等)、质量控制和最终交付。
总结来说,本章描绘了翻译行业在新时代背景下的发展趋势,即通过数字化和智能化升级,利用新技术提升翻译工作的质量和效率,并通过人机协作模式推动行业的现代化发展。
计算机发展历程大致分为四个时期,分别如下:
1.萌芽期 1967-1983
机器翻译研究发展式微,基于语料库和统计学的翻译技术研究逐渐兴起。文本检索翻译与多层次的计算机辅助翻译系统的设想被提出。
2.稳定发展期 1984-1992
翻译系统:翻译支持系统(TSS)出现。1984 年,世界上最早的两家计算机辅助翻译公司——塔多思(TRADOS GmbH)和 STAR 集团(STAR Group)成立。两家公司分别发布MultiTerm 与 Star Transit 。
3.迅猛发展期 1993-2002
翻译技术和工具的应用更加多样化,语料对齐、机器翻译及项目管理等功能逐步完善。1999 年,第一个国产计算机辅助翻译系统——雅信 CAT 上市,标志着中国自主研发的计算机辅助翻译技术走向商用。
4.蓬勃发展期 2003 年至今
众多软件/系统开始采用独立操作界面(不再作为文字处理软件的插件),支持在 Microsoft Windows、macOS、Linux 等多种计算机操作系统中使用,可以兼容几十种文件格式。2006 年,计算机辅助翻译取得巨大进步,具备了自动质量检查、译文匹配、用户界面本地化等新功能。此外,各种项目整合与翻译管理解决方案相继出现。大数据,人工智能时代相继到来,各种计算机辅助翻译的功能更加便捷。
CAT系统通常包括以下层次:
用户交互层
提供用户界面和文件导入导出支持。
功能服务层
包括项目管理、翻译记忆库管理、术语库管理、机器翻译、质量保证和资产管理。
数据管理层
涉及数据库系统、资源索引与检索引擎、实时更新与增量索引。
底层技术支撑层
包括预处理与后处理、API接口与集成。
基础设施层
涉及硬件环境和云服务。
CAT软件/系统的四种产品形式:
桌面应用
安装在本地计算机上,支持离线工作。
在线/云端解决方案
基于Web的在线翻译环境,便于团队协作。
插件或集成式工具
为特定软件或需求开发的插件。
定制化企业级系统
根据企业需求定制的大型翻译管理系统。
三、发展现状
经过60多年的发展,计算机辅助翻译在系统性能、实用性等方面都实现了较大飞跃,在助力翻译任务管理提质增效等方面发挥着越来越重要的作用。目前计算机辅助翻译的发展和应用主要呈现以下四大特点:
1.助力降本增效,获得行业认可
在翻译记忆、机器翻译和术语管理等功能的加持下,计算机辅助翻译软件/系统可以有效提升翻译质量和效率、确保译文一致性并降低翻译成本,在国际贸易、信息技术、装备制造、文化交流、金融财经等领域得到广泛应用。
2.功能日趋完善,满足多重需求
面对新的形势和需求,计算机辅助翻译的项目管理、资源管理和用户管理等功能日渐完善。推出团队版本,支持快速分配翻译任务,在保证译文质量的同时大幅提升翻译管理效率。此外,行业领先的计算机辅助翻译软件/系统除了还支持srt、xliff、html、idml等50余种文件格式,极大满足了用户的不同需求。
3.应用场景丰富,适用更多领域
得益于语音识别、图像识别等技术的进步,计算机辅助翻译不再局限于文本,由于计算机辅助翻译的翻译记忆和术语管理等功能可以有效保证译文术语和风格一致,因此被广泛应用于新闻报道、学术会议和游戏/软件/网站/多媒体本地化等场景,除了笔译,计算机辅助翻译也逐渐应用至口译工作中。
4.融合人工智能,持续提升质效
计算机辅助译软件/系统与神经网络机器翻译系统和人工智能大语言模型深度融合,不仅可以自动选择更合适的译文风格并确保译文术语和风格的一致性,提供更流畅自然的翻译结果,提高译文质量,而且还能通过智能审校功能进一步提升审校工作效率,降低审校人员工作强度。
四、计算机辅助翻译在行业中的应用
当前,在全球化向纵深发展和信息技术革命加速演进的多重因素影响下,翻译行业蓬勃发展。随着技术的进步,计算机辅助翻译在翻译行业的应用越来越普遍。它通过文件格式解析、翻译记忆、术语管理和质量检查等功能,有效提升了翻译的质量和效率,同时降低了成本。CAT技术已成为翻译项目管理和本地化工作的标配,对企业收益增长有显著帮助。根据调研问卷,近80%的受访翻译企业管理者频繁使用CAT工具,并且将译员使用CAT工具的能力作为重要评价因素。目前,使用计算机辅助翻译软件/系统的能力已成为企业招募译员的重要评价因素,也逐渐成为翻译人才进入市场的必备技能之一。计算机辅助翻译在拓展国际市场、赋能协同管理、促进业务增长、驱动行业发展等方面发挥着重要作用。
1.助力本地化工作开展,拓展国际市场
根据 RWS 集团发布的《全球沟通零距离”2023年报告》,88%的受访者认为展示文化洞察力对于品牌全球化发展非常重要,71%的受访者表示更信任进行了在线业务本地化的品牌。这充分表明了开展本地化工作的重要性,而翻译正是本地化的关键要素之一。以小米为例,面对全球增长与产品拓展带来的巨大本地化挑战,小米自2020年起开始使用计算机辅助翻译工具,并将其与翻译管理系统集成,利用翻译记忆和术语管理功能避免重复工作并提高译文一致性,使用技术驱动的翻译流程为本地化项目赋能,有效提升了翻译生产效率以及流程自动化水平和可视化程度。同时,小米还在构建业务门户网站,旨在让所有员工和合作伙伴在使用技术术语、品牌名称及其他术语时都能从术语库受益。
2.提升多语种翻译效能,赋能协同管理
国际工程和国际贸易的翻译项目中,通常要将文件翻译为十几种甚至几十种语言,且对翻译质量,交付时间等要求较为严格。在这种情况下,传统的“单兵作战”翻译模式显然无法满足项目需求,多人协作逐渐成为主流,这就对团队的项目管理等能力提出了更高要求。
3.实现翻译流程自动化,促进业务增长
为提升工作效率,用户可以将这些语言技术工具与内容生成、存储和接收系统或运营、管理和治理平台集成。随着品牌在欧洲市场的快速发展,为应对电商网站多语种内容建设需求,宝拉珍选函需一个能与其客户关系管理平台集成、可以实现翻译流程自动化、同时兼具翻译记忆功能的翻译系统以缩短翻译周期并降低成本。宝拉珍选仅用两天就在其丹麦语网站成功部署了计算机辅助翻译工具和翻译管理系统。此后,宝拉珍选翻译工作的自动化程度显著提高。在计算机辅助翻译工具和翻译管理系统的帮助下,宝拉珍选在丹麦的销售额强势升,四个月内达到三位数增长。
4.推动各领域翻译提效,驱动行业发展
调查报告显示2022年翻译行业整体工作量呈上升趋势,然而,行业译员数量却并未增长,从业10年以上的译员人数较2020年还减少了约10%。在这种情况下,利用技术驱动翻译行业数智化升级已迫在眉睫。以法律翻译为例,由于法律翻译对术语和文风的严苟要求,专业翻译团队往往需要耗费大量时间和精力才能确保译文质量和术语一致性。随着工作量不断增加,传统翻译模式逐渐无法满足业务需求。为了应对翻译需求,该事务所开始使用计算机辅助翻译工具和协同平台赋能翻译工作。翻译记忆库和术语库可以直接提供经过审核的译文,既保障翻译质量,又提升工作效率。协同平台可以让所有译员都能实时共享翻译记忆库和术语资源。此外,遇到紧急任务时,整个翻译团队可以使用在线编辑器同时处理同一文档,实时更新翻译进度
五、计算机辅助翻译发展面临的挑战
1.我国自研产品与海外产品存在差距
国外计算机辅助翻译软件/系统以其先进的技术、稳定的性能和丰富的功能赢得了译员更多青睐。相比之下,我国自研的计算机辅助翻译软件/系统由于起步较晚,在技术和功能上还存在一定差距。比如金融、电信等领域单位及党政机关对计算机辅助翻译软件/系统的需求日趋增长。因此国内翻译技术企业应进一步加大技术研发力度,推出功能更加完善的国产计算机辅助翻译软件/系统。
2.非通用语种资源建设亟待加强
随着“一带一路”倡议的深入实施,我国与“一带一路”沿线国家交往日益密切,而现有术语库等工具的内容主要以汉语和英语为主。根据《关于计算机辅助翻译使用情况的调研问卷》反馈的数据,有近30%受访者认为现有非通用语种资源难以满足翻译需求(图9。数据资源是推动计算机辅助翻译等技术发展的关键要素,非通用语种内容资源的建设和共享是需要行业各方携手破解的难题。
3.用户体验仍有提升空间
随着计算机辅助翻译软件/系统的广泛应用,人们对用户体验的关注度越来越高,而现有计算机辅助翻译软件/系统还不能完全满足翻译实践需求和译员使用习惯。根据《关于计算机辅助翻译使用情况的调研问卷》反馈的数据,分别有约60%,的受访者认为计算机辅助翻译软件/系统应“优化操作界面,提高友好性和易用性”、“完善翻译记忆库和智能匹配功能”等方面功能体验。
4.数据安全需引起更多重视
计算机辅助翻译在翻译项目中的应用不断深化,而很多翻译项目包含敏感信息或商业机密,如何保障数据安全和用户隐私成为行业关注的重点。例如,用户在云端服务器存储的术语库和翻译记忆库可能遭受黑客或病毒攻击导致数据泄露,在线计算机辅助翻译平台上的机器翻译功能存在滥用用户语料进行机器学习和模型训练的潜在风险等。
5.计算机辅助翻译教学与行业脱节
尽管用人单位非常看重译员使用计算机辅助翻译软件/系统的能力,但目前翻译人才培养单位对计算机辅助翻译相关内容的教学仍有所欠缺,与行业需求脱节。
六、计算机辅助翻译发展趋势和建议
(一)发展趋势
人工智能驱动个性化翻译
计算机辅助翻译软件/系统将与神经网络机器翻译、生成式人工智能等技术融合,结合译员风格、项目特性以及目标受众特征,提供个性化翻译建议和优化方案。
云技术与协同翻译深度融合
通过与云计算技术深度融合,计算机辅助翻译软件/系统将实现大规模数据的存储和共享,方便用户远程协作,实时更新翻译内容和进度。同时,云平台趋向轻量化、SaaS化和生态化发展,将实现翻译项目管理、资源分配、资产管理和用户权限管理的高度集成。
技术堆栈的多元化与集成化
随着技术生态日益丰富,未来计算机辅助翻译技术堆栈将更加多元化,涵盖自然语言处理、深度学习、云计算、大数据分析、区块链等诸多前沿技术。同时,各类技术的集成化应用将变得愈发重要,这种集成化不仅体现在技术层面,也体现在业务流程层面。
翻译质量评估与自动优化
依托人工智能驱动的质量保证和质量评估功能,计算机辅助翻译软件/系统将不仅能对翻译结果进行拼写、语法、术语一致性等基础检查,还能生成客观量化的评估结果,并利用深度学习模型进行语义层面的质量评估和自动优化,为用户提供更深层次的指导和反馈。
(二)发展建议
1.加强国产自研,打造国产翻译技术服务生态体系
中国翻译协会、中国外文局翻译院等行业协会和机构应进一步加强顶层设计,着力深化翻译实践与技术研发方的跨领域协同协作,构建自主研发的核心翻译技术,打造国产翻译技术服务生态体系。
2. 推动标准建设,引导和规范翻译技术发展应用
为更好发挥计算机辅助翻译技术效能,应聚焦制约其发展的难点、痛点问题,结合最新技术发展动态,着力建设并不断完善计算机辅助翻译质量评价、人机协作模式、数据安全、技术伦理等方面的标准规范,并推动形成层级分明、覆盖面广、科学合理的标准体系框架。
3. 统筹汇聚语料,为翻译技术发展提供数据支撑
中国翻译协会、中国外文局翻译院等行业协会和机构应当充分发挥行业引领作用,联合国际传播、翻译实践、人才培养、技术研发等各领域主体,打破数据资源孤岛局面,统筹汇聚各方优势语料数据,推动各方资源共建共享,建设高质量、大规模、多语言、细领域的语料库、术语库和知识库。
4. 提升技术素养,加快计算机辅助翻译普及应用
翻译人才培养单位应加强计算机辅助翻译理论和实践课程的师资和硬件配备。中国翻译协会、中国外文局翻译院等行业协会和机构可以借助短视频、图文海报等新媒体手段,结合视频课程、线上教学、论坛沙龙、研修培训等形式,开展更深层次的计算机辅助翻译推广与普及活动,组织针对译员、教师、学生等不同层面的计算机辅助翻译技能培训,扩大计算机辅助翻译技术辐射范围;举办翻译技术赛事活动,以赛促学、以赛促教、以赛促建。
5. 深化融合发展,挖掘翻译技术发展更多可能性
随着大语言模型的不断优化与迭代,计算机辅助翻译技术研发方应把握技术潮流和发展机遇,通过技术融合应用加速推动翻译行业的数字化、智能化升级转型,为跨语言交流与全球化发展提供更加高效、智能的解决方案。
群内会定期推送语言服务行业最新动态、活动预告、竞赛通知📝等内容~
欢迎你的加入🥰!