在上篇文章中,主要介绍计算机技术和内容数字化技术在语言行业的应用,本期将讨论后本地化时代,以及数字化及转型对语言行业的影响。欲了解上文内容,敬请移步《魔鬼词典——语言服务版(1)》。
为什么要趁现在? 三个世纪的数字化,使后本地化成为可能
去年,CSA Research预测,我们称为“后本地化时代”的出现,不是因为“本地化”已经过时,而是因为一系列实现性技术和不断革新的实践方法,改变了对语言转换讨论的性质。 大量的内容被数字化并可用于转换,结合强大的计算平台,提供了文本内容处理的新途径,翻译只是可以在书面内容上执行的许多转换之一。 口语也可以演变成许多其他形式和格式。
图:数字化带来的质量提高、性能优化、内容创新
深入挖掘今天的热门技术,总能收获不少启发,尤其是当我们看到今天数字化转型的种子,早在18世纪初便已深埋于土。 在戈特弗里德·威廉·莱布尼茨于1703年发表的《Explication de l’Arithmétique Binaire》(二进制算术)中,阐述了0和1如何为数字表示奠定了基础。 在《约翰逊字典》(1755年版),塞缪尔·约翰逊为莱布尼茨的“二进制算术“添加了词条,该术语因此得到普及。 将近一个世纪后的1854年,乔治·布尔在《思维规律的研究》中赠予世人布尔代数。 剩下的是01101000 01101001 01110011 01110100 01101111 01110010 01111001——除了这些概念转换为今天的数字化转型的方式:
- 尽管数字化早期根基可以追溯到上述研究成果,但直到20世纪70年代末,随着国际商业机器公司和西门子等企业推动大规模数字计算的运用,以及随后的向数字表示的转变,数字化才成为主要的技术驱动力。 随着20世纪80年代个人电脑普及,数字化成为内容生成的规范。 在数字化时代,如果内容没有被数字化,就好像它不存在一样。
- 数字化的概念既建立在二进制内容普及的基础上,推动商业、工程、科学、政府、其他组织转型的效率和创新。 在过去的十年或二十年间,管理咨询公司麦肯锡向大企业和大政府推销了数字化转型这个商业主张。但这个概念本身却可以追溯到1949年克劳德·香农发表的关于信息论的奠基著作,即《通信的数学理论》这是我在研究生院学习计算语言学的重要内容。
这对语言行业意味着什么?
数字化和数字化转型的结果,彻底改变了语言行业。在过去几十年中,语言行业受益于业务数据信息化过程的碰撞、信息目的和机器学习两方面内容日益增长的杠杆作用、GPU的巨大处理能力,以及处理这一切的数据农场。 后本地化时代建立在数字化转型的基础之上,能够随着自动化程度的提高,提供许多语言相关和语言支持的功能。
简单来说,后本地化就是语言行业的数字化,数字化数据的透明性为语言行业带来巨大机遇——或者正如莱布尼茨所惊叹的那样,“所有操作都非常简单,根本不需要猜测或尝试任何东西。” 语言行业变化带来的挑战,可以通过语言运营(LangOps)来解决,其核心理念是使语言成为组织所做的一切工作的核心组成部分。
在语言交易中,人类参与者必须要适应新世界秩序——他们的角色将从文字的骑师、牧羊人、MT看门人,变为让所有语言、所有形式的通信,能够满足通信链路另一端的信息消费者的要求的保障者。 随着语言行业和企业内部本地化团队回顾之前做的选择,他们将会将会发现更多的机会,这些机会涉及到各种不同的语言学领域,如社会语言学、文化语言学、可访问性语言学、包容性语言学等,并且这些内容以音频、视觉和文本等多种形式呈现,逐渐扩大了个性化形式的选择范围。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:张湄婕