大语言模型的出现及其后续发展标志着语言服务行业的一个重要的转折点。这些创新技术有可能彻底改变翻译、本地化和内容创作,为语言专业人士和企业带来了诸多可能性。大语言模型在语言服务行业的应用场景十分广泛,其效果也令人惊喜。从内容创作和改写到摘要创作和多语种支持,大语言模型已经展示了其在提升效率和生成高质量输出方面的价值。然而,平衡大语言模型的优势和人的专业知识以及文化差异也至关重要,才能确保译文内容准确,符合语境。
“鉴于大语言模型平台的快速发展,如果没有专门的工程师就很难在个别使用案例中测试审查模型质量。再加上将大语言模型与其他技术相结合的众多选项,就需要探索GPT类模型的团队给予特别关注。”
——Laszlo Varga,Nimdzi Insights
展望未来,语言服务行业必然会迎来一系列挑战。质量与准确性,数据隐私和安全,微调与定制,道德考量和监管环境,这些都是需要解决的关键问题。
机器翻译vs.大语言模型
很多语言行业专家想当然地认为自动翻译(尤其是机器翻译)是生成式AI和大语言模型的主要应用案例。然而,不得不提的是虽然机器翻译已经存在了几十年,但大语言模型并不是专门为翻译训练的。大语言模型并非只用翻译数据进行训练,经过训练,它们一定会生成一个答案,不管这个答案是否合理。此外,大语言模型还会生成虚假信息,这些信息有时带有偏见色彩或内容有害,有时缺乏逻辑推理能力和事实准确性。这样得特性和能力并不完全符合传统翻译技术的标准要求。
资料来源: ChatGPT和大语言模型 – 本地化中的虚实分离
当前,大语言模型提供的潜在应用范围远不止以翻译为主的系统,还包括(但不限于):
-
不同类型的质量保证,包括质量评估
-
自动译后编辑
-
重写或改写机器翻译输出
-
术语提取(多语言)
-
创译或改编
-
自动编辑翻译记忆库
大语言模型为语言技术领域带来了两大新的资产。一方面,它们能够结合上下文和参考数据。另一方面,它们擅长遵循自然语言描述的指令。二者结合使其功能强大,为增强型机器翻译提供了无限可能。例如,通过利用词汇表、风格指南以及大量针对特定客户或项目的说明,大语言模型可以生成完美的性别包容性翻译。此外,大语言模型还拥有在不完全依赖平行语料库的情况下生成翻译的潜力。在使用特定语言对或领域缺乏足够平行数据时,这种通用性和灵活性显得尤为宝贵。但仍需注意,目前大语言模型还不能直接取代传统机器翻译。尽管擅长生成高质量内容,但仍可能出现错误或缺乏特定领域的知识。
“自动翻译的未来在于将大语言模型的通用性和机器翻译的可持续性协同起来。自动翻译便充分利用了二者的长处,并结合人的专业知识,为语言服务行业提供了绝佳的应用案例。此外,它还能兼纳其他传统流程,例如创作、审核和质量保证等。”
——Jourik Ciesielski,Nimdzi Insights
生成式AI
大语言模型能够协助内容创作、改写和任务总结。可以通过特定数据训练,来适应行业专业术语、写作风格甚至品牌声音。这种通用性不仅局限于翻译,还为内容生成和本地化提供了新的契机。正如我们在 语言 AI名录一文中所解释的,所有的生成式大语言模型都是生成式AI,但它们能生成的内容不止局限于文字。诸如Midjourney、Stable Diffusion、DALL-E和Bing Image Creator这样的扩散模型可以通过输入文字或图片来生成图像。
资料来源: 语言AI名录
此外,会话AI的能力正在推动2023年全球联系中心市场显著增长,多语言聊天机器人受到了空前欢迎。然而,研究显示,虽然聊天机器人已占有一席之地,但大多数客户还是更喜欢和人工代理交流,尤其对于需要同理心和理解力的复杂问题来说。当然,之前的很多研究,例如Nimdzi自己的 Underwear项目都可以证明,会客户母语的聊天机器人还是相对更能引起客户共鸣。从更宏观的角度来看,有研究预测,到2025年,大多数企业将不仅用生成式AI来辅助交流,还用它来写作和编辑。企业正采用它来解决特定的业务问题,从而获得竞争优势。企业领袖也开始意识到,这些技术能力的日臻完善,将可能对企业运作带来革命性且深远的影响。生成式AI无疑正在改变我们行业的工作方式。在Nimdzi2023年对语言服务行业的采访中,很多从业者都承认已经在日常工作中使用了生成式AI,比如润色销售邮件,或几分钟内做出营销演示文稿和幻展板。其他人则不仅限于个人使用,还借助 sintetic.ai 或custom.mt等公司将其运用在例如“企业搜索”的平台上(将一个组织的整个知识库转化为一个可以根据组织的数据给出相关回答的交互平台),并从中受益。
“当本地化技术已经成型、发展速度放缓并接近停滞之际,生成式AI 带来了一股淘金热:投资者向初创公司的投入了超过210亿美元,而谷歌、苹果、英伟达等科技巨头的投资额可能更高。如果你不乘上这波浪潮,你就错过了我们这代人最大的变革机遇之一。”
——Konstantin Dranch,Nimdzi Insights 的 Custom.mt
RWS还给出了另一个可以利用内部知识库的工作示例。除了他们为Trados Studio开发的 OpenAI Translator之外,RWS还在他们的社区论坛中设置了一个智能知识访问框。为了提供高质量答案,他们用Trados文档库中全面而有条理的的解决方案数据库来训练大语言模型。现在用户访问RWS社区网站和聊天机器人互动时,其实就是在利用大语言模型,这样用户就不用再花时间搜索阅读文档。人们只用问问聊天机器人就可以知道怎么在Trados产品中执行各种操作。除了社区网站,RWS还将该功能内置到了产品平台中。