我们总结了人工智能语言技术的最新发展,以及语言模型对翻译的影响。
随着我们即将迎来ChatGPT发布的第二个周年纪念日,我们认为现在是评估生成性人工智能(GenAI)对翻译的持续影响的好时机。
在2022年11月发布后,据报道,ChatGPT在短短五天内就达到了一百万用户。有人说ChatGPT席卷了全球,这是一种轻描淡写的说法。很快就有人预测,数百万人将失去工作,而作家和翻译家将首当其冲。
幸运的是,情况并非如此,尽管生成式人工智能正在影响我们使用和翻译语言的某些方面,但最大限度地发挥其价值仍处于早期阶段。
超越炒作
根据学者的说法,新技术在首次发布时通常会伴随着一个“炒作周期”。随着人们对技术能力的认可,人们的期望值也随之飙升,随后是一段普遍失望的时期,因为技术并没有达到过高的期望,最后,随着技术的进步开始产生实质性影响,人们的期望值也逐渐趋于平稳。
显而易见的是,生成式人工智能仍在快速发展。语言模型的规模不断扩大,并不断获得新的功能。最新版本的 GPT 被认为使用了1.75万亿个参数,远远超过了原始版本。参数越多,词与词之间的联系就越多,创造语言的可能性就越大。
那么这对翻译有什么好处呢?在考虑生成式人工智能在行业中的多语言应用之前,让我们来看看人工智能在为消费者提供翻译方面带来了哪些明显的变化。
人工智能正在推动翻译扩展
今年夏天,谷歌宣布在其 “翻译 ”模型中增加 110 种语言。这些语言包括粤语和旁遮普语等广泛使用的语言,以及超过二十种在非洲使用的语言。此外,还增加了马恩岛语、西西里语和罗曼尼语等濒危语言。在这一过程中,谷歌使用了人工智能的大型语言模型 PaLM 2,这也是迄今为止其翻译能力的最大提升。
谷歌希望其机器翻译能够 “打破语言障碍,帮助人们建立联系,更好地了解周围的世界”。在这方面,数字世界中可以使用的语言数量不断增加是十分重要的,这使得这些语言更加贴近生活,并有助于保护那些面临消亡的语言。
DeepL的德国的机器翻译专家也将生成式人工智能引入了他们的技术中。今年夏天,DeepL 首次宣布将其专门为翻译开发的大型语言模型(LLM)架构集成到其最新模型中。
所有大型科技公司都在继续投资开发人工智能驱动的翻译,微软也在专注于扩大其提供的语言数量,而Meta的目标则是利用其Llama 3.1模型征服多模态翻译。
对语言功能的需求在不断增长
随着技术的进步,我们也能享受到技术带来的好处。翻译功能正在迅速成为我们每天使用的设备的一项预期功能。
我们正在使用智能手机来帮助我们理解其他语言,苹果和三星都将翻译作为一个关键的卖点。三星最新推出的 “翻盖 ”手机拥有 “实时翻译 ”功能,并承诺 “用户再也不会在外国城市感到迷茫”。还有许多其他的“口袋”翻译器也可以使用,承诺减少我们在旅行或结识新朋友时可能遇到的语言障碍。
用我们喜欢的语言访问网站也变得更加简单。通过使用浏览器扩展或插件,我们可以轻松切换语言,并广泛了解网页上的内容。同样,网站的实时视频翻译也变得越来越普遍,微软最近宣布,人工智能正被用于通过实时字幕和配音,实现在线口语内容的同步翻译。
人工智能驱动的翻译是否符合预期?
正如之前提到的“炒作周期”所预测的那样,随着语言技术的加速发展,人们对自动翻译的期望也在不断提高。随着对语言访问需求的增长,融合了人工智能的翻译产品的数量也在增加。
然而,我们必须记住,我们所需要的翻译类型在很大程度上取决于我们的交流目标。在上述许多情况下,用户只需基本掌握文本或说话者的意思。虽然知道去火车站的最快路线或伦敦最好的寿司餐厅,在当下是有帮助的,但这不是一个高风险的情况,稍微不准确的翻译也不会造成太多问题。但如果涉及到您的健康或法律问题,翻译准确无误的回复无疑是至关重要的。
大型语言模型所固有的问题,如容易产生幻觉、重复有害和不准确的信息或侵犯版权等,都是有据可查的,但这些问题尚未得到解决,而且也会影响其译文。虽然使用生成式人工智能技术进行翻译的增长令人印象深刻,但在翻译真正重要的时候,仅依靠这些模型无法实现理想的结果。
大型语言模型和商业
在职场中,大型语言模型逐渐开始找到它们的角色。随着企业及其员工开始了解生成式人工智能的优点及其最有效的使用场景,趋势已经开始显现。人们发现它在起草电子邮件、编写Excel公式或制作简单的说明文档等工作,是最有帮助的。使用它来完成与产生想法或文本相关的任务是很常见的,而节省时间和金钱则是其主要动机。
在所有流行的使用案例中,人类总是密切参与整个过程,监督任务和结果。
在翻译方面,生成式人工智能目前可以为企业提供内部多语言沟通的便利,或帮助理解另一种语言的长篇复杂文件的要点。目前的研究还表明,大型语言模型的翻译能力可以超越传统的机器翻译,而且它能更好地生成听起来更自然、更符合语境的语言。然而,如果没有经过精心调整的工作流程和人工干预,大型语言模型无法生成完全可信的翻译。与所有语言技术一样,在高风险场景中,人工、机器和良好规划的结合仍然是翻译的最佳方案。
语言服务提供商和生成式人工智能
语言行业已经开始将人工智能技术整合到其现有使用的工具中,特别是CAT(计算机辅助翻译)工具和翻译管理系统。调整使用大型语言模型也可以帮助提高翻译质量,实施客户品牌风格和术语,并优化整体工作流程。
简而言之,生成式人工智能技术在翻译环境中变得越来越普遍,语言服务提供商正在利用它来提升他们的流程。服务供应商知道如何调整技术,为客户获得最佳效果,利用生成式人工智能也不例外。结合新技术和现有技术与人类专业知识,仍然是发展的最佳方式。
随着“炒作周期”进入整合阶段,企业和语言供应商现在对生成式人工智能的功能及其使用方式有了更清晰的了解。虽然人类的角色正在发生转变,以适应技术的发展,但工作岗位并没有丢失,而是转移到了适合人类独特技能的工作岗位上,并由人类来创造最大价值。
显而易见的是,人工智能在翻译领域展现出令人兴奋的能力,但它仍在不断发展,并将永远如此。要想有效利用人工智能,就必须将其视为有助于提高翻译效率的工具,而不是一站式多语种解决方案。
(机器翻译,轻度译后编辑,仅供参考)
编辑:杨帆
审校:王云菲