我最近偶然发现一个表情包:“保持冷静,不要再解释 AI 不会取代翻译”。虽然这个模式可能有点 2000 年,但它是正确的。
让我们试试不同的方法。我将鼓励你不要把生成式人工智能和现有语言服务之间的明显交集看作是一种单向效应或一种结束,而是作为一个良性循环手段,使更多人负责任和公平地使用生成式人工智能技术。
不要认为人工智能是一种可以用来替换、增强或永远荼毒翻译过程的东西,而是把它看作一个新的手段(因为没有更好的词),这将需要语言专家的持续服务来实现它的道德使用。
负责任地使用人工智能与平等的机会
在支持和反对的事实、警告、观点和预测中,关于负责任地使用人工智能的大问题仍然是一个非常紧迫的话题。就在我们说话的时候,世界各地正在通过立法,关于如何监管和实施使用生成式技术的安全、隐私、公平和透明的新政策。
这项技术的好处是巨大的,潜在的滥用风险也是巨大的。开发生成式人工智能应用编程接口(API)的公司正在投入大量资金来做好这件事。在英语和其他语言中,“现在进入语言行业是多么令人兴奋的时刻啊”,每个人都在说。
非英语语言在人工智能中的代表性不足:对社会的新挑战,对语言学家的机遇
对于非英语国家的人来说,这可能并不奇怪,但事实是在负责任地使用人工智能方面,有很高比例的努力是针对作为语言1的英语的。持续的过程,如对内容进行评级、分类、过滤和审核,包括提示和响应,都从语言1开始。因此,理想情况下,在不久的将来,这种努力的大部分将被——或正在——本地化为其他语言,希望能够将相同的类别应用于其他语言和文化。
现在等一下。这是一种新的内容类型,具有非常具体的需求和用例,将用于设定基调和培训未来的类似案例吗?这种内容类型需要翻译、改编和重新分类吗?我们能区分原创内容和翻译内容吗?这有关系吗?我很想详述哲学含义,但这可能不是对的地方(或者是吗?)。
事实证明,作为语言专家——或者更好的是,作为使用多种语言的专家——我们不仅在确保语法、句法和术语的正确使用方面处于独特的地位,而且在实施安全指南和培训大型语言模型(LLMs)以识别对非英语语言有偏见、暴力、有毒或有害的内容方面也是关键角色,这些内容–这并不奇怪——在生成式人工智能中仍然代表性不足。对于这些观众来说,不言而喻,这个过程中会涉及到大量的改编和本地化。
简而言之:我们对用例、偏见以及大型语言模型如何工作了解得越多,我们就能更好地为这些新兴服务提供服务。
大型语言模型哪里会出错,语言学家如何提供帮助?
人工智能语言模型中有许多错误和偏见的例子。语言学家和专家的作用对于纠正错误和确保负责任地使用技术至关重要。我们来分析一下AI最常见的一些问题。
边缘情况:边缘情况是指训练数据中没有很好展示的不寻常、罕见或异常情况。这些情况可能会导致生成式人工智能API的性能受到限制,例如模型过度自信、对上下文的误解或不适当的输出。我们能做什么?对响应进行标记和分类。重写回答以符合目的。
模型幻觉、基础训练和真实性:制作的内容可能缺乏现实世界知识、物理属性或准确理解的基础训练和真实性。这种限制可能导致模型幻觉,这是指技术可能产生听起来合理的输出,但实际上是不正确的、不相关的、不适当的或无意义的。了解技术如何工作并能够标记这些情况是至关重要的。虽然有人可能会说,一个以英语为母语的人可以做到这一点,但训练有素的语言学家在完成这一任务和其他类似任务方面处于独特的地位。
数据质量和调整:输入应用程序的提示和/或数据的质量、准确性和偏差会对其性能产生重大影响。如果用户输入不准确或不正确的数据或提示,生成输出可能会显示次优性能或错误的模型输出。我们能做什么?创建模型提示以增加良好回答的范围。
偏置放大:语言模型可能会无意中放大其训练数据中的现有偏见,导致输出可能会进一步强化社会偏见和对某些群体的不平等待遇。我们能做什么?标记并重写。
语言质量:大多数基准(包括所有的公平性评估)都是用英语进行的。我们能做什么?检查目标语言或多语言模型中的语法、术语、句法和流畅性的输出。语言模型可能为不同的用户提供不一致的服务质量。例如,由于训练数据中的代表性不足,文本生成对于某些方言或语言变体可能不那么有效。非英语语言或代表性较少的英语语言变体的表现可能更差。你没感觉到这里的机会吗?
公平基准和分组:公平工作侧重于性别、种族、民族和宗教轴线上的偏见,但只对英语数据和模型输出进行分析。其他少数群体和语言的代表性可能不足,需要进一步投入。我们能做什么?标记并引入新内容。翻译内容以增加少数群体在大型语言模型中的代表性。审查内容的包容性和可访问性。
有限的领域专业知识:API可能缺乏对高度专业化或技术性主题提供准确和详细响应所需的知识深度,从而导致表面或不正确的信息。对于专门的、复杂的用例,API应该根据特定领域的数据进行调整,并且在有可能对个人权利产生重大影响的环境中必须有有意义的人工监督。我们能做的:为中小企业提供代表性不足(我很想说是目标)的语言。
输入和输出的长度和结构:API可以处理各种各样的内容类型和结构,但是它们有长度和结构限制,这可能会导致模型性能不佳。语言专家能做什么?根据内容类型审查和验证内容的正确结构,包括字符限制和非英语语言的特色信息(即帖子、推文、广告、文章、横幅、摘要)。
语言学家的光明未来
当仔细观察时,似乎人类对生成式技术的使用在有效和负责任的沟通、话语合法化、保护弱势群体和防止暴力言论方面,正在为新的挑战打开大门。生成技术的大规模实施使得在许多国家以多种语言应对这些挑战变得至关重要,既要采用全球性的方法,也要采用非常地方性的方法。全世界的语言学家们,不要害怕!还有许多(新的)工作要做。你有一个关键的角色要扮演,让它有价值!
(机器翻译,轻度译后编辑,仅供参考。)
编辑:王云菲