最近,围绕ChatGPT的炒作已经席卷了各大新闻频道和生活的各个领域。各大科技公司发现,如今,采用自然语言处理(NLP)和机器翻译(MT)策略早已过时。为了等待对ChatGPT的审判结果,他们已经冻结了大部分人工智能的预算。然而,由于最近Open AI发布的一连串公告似乎来势汹汹,这种局面是否会平息还是个未知数。当然,现在世界上每个以翻译及本地化为生的人也想知道:这一在人工智能领域奇迹般的新突破对他们的职业或业务意味着什么。是时候让翻译自动化用户协会(TAUS)发声了。
从乐观变革到小心谨慎
众所周知,TAUS 是革命性的技术乐观主义者,尤其是在机器翻译领域。在翻译行业几乎没人相信机器翻译有什么实际用途时,我们就已经开始提倡机器翻译了。然而,这次我们倾向于采取不同的立场。对于ChatGPT 和大型语言模型创造的奇迹来说,太多的炒作、太高的期待可能会掩盖过去十年获得的伟大成就。如果我们想确保对机器翻译的投资有所回报,那么采取一种更加谨慎保守的做法似乎更明智、更可取。
得不偿失
翻译行业花了约二十年的时间,才习惯了依靠机器翻译作为生产力工具来应对不断增加的工作量。六年前神经机器翻译领域取得突破,自此,许多企业才开始投入人力和技术,建立自己的机器翻译部门。机器翻译目前已被广泛采用,用于将大量内容翻译成其他语言,使得其他语言的使用者能够阅读这些内容。现在我们实现了这一目标,而我们中的一些人却被ChatGPT 的炒作冲昏了头脑,过于兴奋,质疑我们是否仍需要机器翻译系统和相关专家。“我们最好解雇这些人,淘汰这些旧技术,完全转向像 ChatGPT 这样的大型语言模型,不是吗?”如果我们与这些激进者走得太远,很有可能会得不偿失。最好的方法是将两者结合起来:将大型语言模型的力量融入我们现有的工作流程和模型中,让其真正发挥作用。并且,不要将未来完全押注于大型语言模型的强大力量,正如我们在2022 年 6 月这篇文章《机器翻译:我们可以做得更好》中所写的那样。
ChatGPT 适用于翻译
在某些情况下,ChatGPT 确实可以成为改变游戏规则的因素,推动新流程、新应用和收入的发展。我们可以看到,已经有公司推出了全新的商业模式或在本地化领域引入了以前无法想象的创新成果。
- 内容生成。ChatGPT 可以低成本且快速地生成营销或客户支持内容。然后,分层服务提供商(LSP)可以在此基础上增添多语言人工撰写和编辑服务,为全球客户提供快速且高效的创新服务。
- 模型训练生成合成数据。构建更好的机器翻译引擎和其他人工智能模型需要高质量的训练数据。ChatGPT 现在可作为更高效的合成数据生成平台。TAUS 已经开始利用ChatGPT来定制质量预测模型。 (训练风险管理模型。)
- 支持多语言问答。以正确的方式向模型提问,可以提升支持应用程序中问答的翻译质量,但这只适用于有限的高资源语言(有大量双语平行数据可供训练的语言)。
- 附加机器翻译插件。当然,在 Intento、Trados 等流行翻译平台中,ChatGPT 已作为一种机器翻译插件用来进行翻译。也许这不太具有变革性,但为什么不尝试一下呢?
- 质量评估。正如汤姆·科可米(Tom Kocmi)和克里斯蒂安·费德曼(Christian Federmann)在微软所试验的那样, 在他们基于GPT 的估算指标进行的评估( GEMBA )中,GPT为提供了一种前景广阔的新方法来评估翻译质量。
ChatGPT 不适用于翻译
不可否认,人工智能的加速突破从根本上影响着翻译行业的未来,但我们也应该脚踏实地,认识到目前存在的不足。以下是 ChatGPT 目前还不适合在整个本地化行业广泛应用于翻译的原因。
- 语言覆盖范围非常有限。ChatGPT 可以翻译十到二十种高资源语言,但也仅限于此。而且对于这些少数的语言,ChatGPT 更适用于从其他语言翻译为英语,然而市场需求最多的却是从英语翻译成其他语言。
- 成本高出一个数量级。配置 ChatGPT所需 的 IT 基础设施成本比运行当前机器翻译引擎的服务器成本高出许多倍。原因在于,ChatGPT 需要使用图形处理器(GPU),而 机器翻译则使用 中央处理器(CPU)。因此,改用 ChatGPT 等大型语言模型在很大程度上有悖于节约成本的初衷。此外,对于大多数需要进行翻译的“普通”用户来说,根本没有足够的 GPU 容量可用。
- 无法根据需求定制。ChatGPT 就像一个黑匣子,无法轻松地根据我们的需求和应用程序进行调整或定制。而针对具体案例及客户来优化系统和定制应用程序,不正是我们作为本地化行业运营商能真正发挥作用的地方吗?但是,我们却能通过神经机器翻译做到这一点,并仍有很大的提升空间。