你不会用电锯来切面包。而且,你也不可能在每天的通勤中跳上一级方程式赛车,因为现在已经有了更多实用的替代方案。既然神经机器翻译已经为您提供了人工智能的力量,为什么还要投资于全新的、高度复杂的技术,如大型语言模型来翻译您的内容呢?
几个月来,每个人都在谈论生成式人工智能和大型语言模型(LLM)及其对数百个不同行业(包括我们)的潜在影响。在我们的世界里,这意味着很多人都在提问:人工智能能否进行翻译和本地化。
答案是肯定的,但这并不是大型语言模型最近才具备的能力。多年来,人工智能一直是神经机器翻译(NMT)等翻译技术的核心组成部分,为世界各地的组织实现了安全、准确的大规模翻译。
随着大型语言模型的引入,我们在这里看到了两种形式的人工智能,它们都具有不同的优势和能力。那么,您应该使用哪种方法来翻译和本地化您的内容呢?
每项任务都有适合的工具
尽管标题如此,但这并不是两种技术相互对立的例子。事实上,用于大型语言模型的 Transformer 最初是为神经机器翻译创建的。实际上,在有些情况下,神经机器翻译是正确的工具,而在有些情况下,大型语言模型可以给您带来最好的结果。无论您想实现什么目标,成功与否都取决于您是否知道哪种工具最适合这项工作,并以正确的方式加以应用。
让我们分析几个常见的使用案例,看看神经机器翻译和大型语言模型在哪些方面最有用,并了解其原因。
- 神经机器翻译:特定领域的翻译。 对于像技术、法律和生命科学这样的行业,准确度是至关重要的,并且许多内容使用特定领域的术语,因此一个专门的、自适应的神经机器翻译解决方案会胜出。培训和微调定制的大型语言模型以满足特定需求是可能的,但这是一种高成本的方法。
- 大型语言模型:高度细致的原始文本。 由于大型语言模型不断从语境中学习并完善自己的成果,它们开始在翻译具有文化表达和个体细微差别的复杂内容方面显示出真正的实力。如果没有人类语言学家的参与,一些机器翻译解决方案在处理不寻常的隐喻和特殊短语时可能会遇到困难,这使得直接翻译变得困难。
- 神经机器翻译:多语言翻译。 许多全球性组织的关键部门分散在世界各地。例如,法律团队可能在美国,而欧洲的研发实验室和生产设施在中国。经过多年的发展,神经机器翻译解决方案可以提供广泛的语言覆盖范围(例如,我们的解决方案可翻译 60 多种语言),而迄今为止,大型语言模型主要是使用英语资源进行培训。例如,OpenAI 的 GPT-3 接受了超过 90% 的英文文本培训。
- 大型语言模型:大规模翻译需求。 要使大型语言模型真正有效,它们背后需要大量的处理能力。但如果有合适的资源,他们可以在几分钟内批量翻译大量内容,同时考虑到上下文。由于生成式人工智能允许用户快速创建大量内容,因此大型语言模型可能是满足翻译需求的最佳选择。
- 神经机器翻译:安全的嵌入式翻译功能。通过应用程序接口(API),企业几乎可以在其业务的任何地方嵌入神经机器翻译功能。例如,Language Weaver 的客户已经在使用神经机器翻译隐藏字幕、实时客户服务互动和产品文档。由于 Language Weaver 是企业级解决方案,因此安全性极高,而最流行的大型语言模型(如 OpenAI 的 ChatGPT)虽然可以免费使用,但却有可能暴露业务数据。
- 神经机器翻译和大型语言模型:提高翻译质量。 我们正在利用自己的大型语言模型为我们的神经机器翻译输出添加一个自动后期编辑阶段,将各种技术结合起来,形成一个更完整的人工智能驱动的翻译流程。根据人类语言专家制定的质量规则,我们的大型语言模型可以自动迭代翻译文本,在必要时提高准确性。这样可以减少审稿人的工作量,加快整个工作流程。
一直以来都是人工智能——而且它一直在发展
关于神经机器翻译和大型语言模型的个别使用案例,我们还可以继续探讨很久很久。但归根结底只有一个简单的问题:这一切的核心都是由人工智能驱动的,就像任何技术一样,这两种技术只有在正确的实施过程中才会有效。
本地化行业仍处于探索如何将大型语言模型和生成式人工智能功能融入翻译难题的早期阶段。我们很容易被炒作所迷惑,但重要的是,我们要专注于使工具与需求相匹配。
在大多数情况下,神经机器翻译可提供组织应用所需的精度、覆盖范围和功率组合。一些神经机器翻译解决方案,如我们自己的 Language Weaver,已经集成了自适应、上下文感知功能和大规模处理能力,这些功能正吸引着决策者使用大型语言模型。
如果您有兴趣深入了解这两种技术的比较和它们的相似之处、不同之处和综合潜力,我们将在即将举行的网络研讨会“超越喧嚣:了解人工智能驱动的机器翻译”上进一步讨论这个话题。
(机器翻译,轻度译后编辑,仅供参考)
编辑:杨帆