当朋友和家人听说我最近在做的工作后,都会问两个问题:人工智能会不会取代口笔译员的需求?语言行业消失会不会让你失业? 过去几年里,光是问第一个问题,就能把整个房间气氛冷场。特别是媒体对圈内人的报道,说译员不过是比清理劣质机器翻译结果的看门人要好点的工作,而这说的基本没错。
长期以来,CSA Research对于这个命题持有不同的观点。 CSA Research将人类视为全球通信的核心,既是母语以外语言和媒介的适应方,最重要的,也是通信的目标对象。 人类对信息的获取,要求通信的内容是切题的、相关的、信息丰富的、最新的。 机器有助于通信的及时性,但人类通过多年来发展的各种流程、技术、算法,来保持机器具备品牌性和可理解性。
对于机器在交谈中的应用,我通常会舍弃某些十年前左右的流行语——无人值守项目管理、小型人工智能、能响应和负责任的机器翻译、以人为本、增强笔译和口译、本地化和全球化成熟度、文本到符号、后本地化时代。 此外,还有CSA Research普及的其他流行语——质量评估、自动化内容丰富、智能内容等。
CSA Research始终坚决地劝阻人们把“我们提供了不起的笔译和口译”作为语言行业的价值主张挂在嘴边。 相反,我们将这类交付方式描述为海量数字内容所实现的两大变革。这些数字内容需要被处理成各种其他形式和语言,以满足和人类交流的必要条件。 我们对2024年市场规模进行了初步估计,预计高达547.2亿美元。该数字将加速器和挑战因素皆考虑在内(“虽然名义值恢复增长,但2024仍将是艰难的一年)。
除此之外,后文将把上述概念放在更大的背景下进行探讨。 我将从前高科技时代开始,概述硅和镓对语言领域的影响,并回顾三个世纪前,推动今天语言行业进入后本地化时代的相关概念的产生。 文内将重要的想法或概念用粗体表示。
最初出现的是碳基语言专家
当两个或两个以上说不同语言的人聚在一起时,笔译员和口译员就出现了——因此,它们是两个最古老的职业。 以下是它们几千年来的发展简史:
- 古代语言学家的原型,他们一般独立工作,主要依靠自身的双语大脑,除了羽毛笔和纸莎草纸之外,没有其他工具来翻译古代卷轴,也没有坐在说不同语言的人之间的翻译椅。 后来,他们有了双向词典、特定行业词汇表、其他书面文本等资源的帮助,可以根据需要查阅。 然而,由于口译员是实时翻译,他们查阅这些辅助资料的时间较少。
- 后来,翻译文件的制作变得越来越容易,因为打字机取代了人工书写,而且出现了轻松擦除打印内容的Corrasable®铜版纸,以及Wite-Out®涂改液(在我读研期间,PC电脑还没出现,人们把涂改液称为“赎罪液”)来覆盖错误内容。 最后,Selectric®高尔夫球(球形打字头)打字机既能原处修改,又能用多种语言打字。 再到后来,这些机械设备被文字处理器、个人电脑、苹果电脑取代,它们都能按需打印,重复编辑翻译文本中的错误。 口语口译员受益于改进的通信系统,能够进行更多的远程电话和视频口译,但他们仍然在很大程度上进行的是实时工作,没有安全保障。
大量的硅和镓提高了碳基专业人员的工作能力
扩大计算机技术和内容数字化技术在语言行业的应用,能提高口笔译的生产率,降低错误率,优化工作流程,从而提高工作质量。 想想这些能让笔译员和口译员变得像仿生人的元素,就像美国上世纪70年代的电视连续剧一样,用《六百万美元先生》的标语,“我们有技术。 我们能人变得更好。 更好,更强,更快。” 2017年,我们写了些文章,有关人工智能如何整合各种技术,提高语言学家能力,提高他们的效率,并帮助他们产出更好的成果。 值得庆幸的是,增强翻译(augmented translation)不需要电子人植入才能实现。
- 随着机器和计算机辅助工具逐渐减轻翻译的负担,专注语言领域的软件供应商采用数字化的生产力辅助工具进行创新,如翻译记忆库、术语数据库、词汇表,以及计算机协助的或辅助的翻译工具(CAT),减轻译者的认知负担。 在20世纪90年代末和21世纪初,TMX、XLIFF、TBX、SRX等标准格式,就编纂了上述工具的格式,在计算能力相对较弱,存储有限的时代,这些标准基本上就固定了。 这就让这些标准格式越来越无法适应当今不断变化的内容需求,除了TBX这个有争议的例外。
- 口译员的同行用CAT工具来减少工作量,他们推动使用计算机辅助口译(CAI)工具,比如词汇表管理、实时术语辅助、译后语言资产管理等,而口译员则能从中受益。 他们受益于支持更多按需功能的更快计算设备,但基本的和未解决的人体工程学挑战,却限制了他们的使用(“对自动口译的认知“)。
- 关键任务的同声传译在1945年纽伦堡审判中以IBM Hushaphone Filene-Findlay系统的形式推出(又名国际翻译系统)。 口译员同时将诉讼翻译成多种语言(英语、法语、德语、俄语),以便法官、律师、被告、证人、其他与会者可以用他们的语言跟踪诉讼进度。 Hushaphone系统最终让同声传译,以及后来的远程口译得以广泛使用。
- 机器翻译(MT)遵循了类似国际地缘政治的实际应用方法,例如在1954年的Georgetown-IBM实验中,将60个句子中的250个俄语单词翻译成英语。 这些高度基于规则的机器翻译(RBMT),在21世纪初被数据驱动的统计机器翻译(SMT),近年来又被神经机器翻译(NMT)所取代。 两者都属于人工智能(AI)的范畴。 NMT是通向如今普及的ChatGPT大语言模型(LLM)的桥梁——这两种技术都使用了结构和功能相似的转换器模型,实现它们神奇的生成能力。
支持这些不同语言转换技术的要数基础组件,例如翻译管理系统(TMSes),中间件,连接器,以及人工智能驱动的工作流自动化等新兴技术类型。 这些方案可协同操作,并为企业提供多语种服务,支持包括各种内容和文档管理系统,可输出各种内容类型的内容创建软件,以及大量适用于各项业务、策划、娱乐及其他一切功能的平台和生态系统等。
当然,还有一些组织能支持语言转换,比如本地化团队、新兴的LangOps团队、语言服务供应商,以及与其他企业团队(如开发、营销、客户关怀)合作的专业服务提供商。
注:由于本文篇幅较长,本期内容分已为两个部分。第一部分主要介绍计算机技术和内容数字化技术在语言行业的应用;第二部分将探讨后本地化时代,以及数字化及转型对语言行业的影响。欲了解完整内容,敬请移步《魔鬼词典——语言服务版(2)》。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:张湄婕