在大型语言模型时代,语言学还重要吗?

在2024年5月9日的一篇论文中,苏黎士大学的朱里·奥皮兹与乔治城大学的希拉·韦恩和内森·施耐德一起,讨论了在大型语言模型(LLMs)主导的时代,语言专业知识在自然语言处理(NLP)中的重要性。

作者解释说,虽然机器翻译(MT)以前严重依赖语言学家,但现在情况已经发生了变化。“语言学不再是我们构建自然语言处理系统的前沿和中心,”他们说。随着LLMs的出现,它可以生成流畅的文本,而不需要专门的模块来处理语法或语义一致性,NLP中对语言学专业知识的需求受到质疑。作者并不认为LLMs的兴起意味着语言学与NLP相关性的终结。他们强调,设计系统如何运行只是研究、开发和部署NLP技术的整个过程的一部分。他们说,“NLP(仍然)在几个方面依赖于语言学,或者语言学思维可以照亮新的方向”。

作者确定了语言学对NLP贡献的六个主要方面,概括在首字母缩略词REDIENS中。

语言学专业知识通过数据选择和管理、数据注释(黄金标准注释)和语料库创建来帮助开发NLP任务的资源,从而确保数据集的质量和多样性,从而确保系统的良好行为。

他们说:“语言专业知识对于从结构上收集和记录语言数据是相关的。”

这种语言知识在为机器翻译建立平行语料库时也很重要。作者还强调了注释者的高级语言学知识的重要性,指出“需要训练有素的语言学家来最大限度地提高机器翻译参考文献的质量。”语言知识对于设计有效的人类评估、通过关联人类判断和自动度量分数之间的一致性来判断自动度量的质量(“元评估”)以及识别挑战系统的语言现象(如回指或方言变异)是必不可少的。

人的评价的关键作用

作者强调了人类评估在可靠评估该领域状态方面发挥的“关键作用”——特别是在系统不断改进的情况下——元语言知识在人类评估研究中是必不可少的,以确保有效的错误分析和质量评估。此外,语言学理论方面的专业知识是必要的,因为对于模型来说可能更具挑战性的特定语言现象需要被理解以便被识别。“语言学有助于获取系统的指纹,在特定类别中评估系统,并通过将观察到的行为与可解释的语言类别结合起来,促进对复杂模型的理解,”作者说。

低资源设置

语言专业知识不仅对于收集数据以保存低资源语言至关重要,对于有效开发这些语言的技术也至关重要。作者强调了语言敏感监督在为资源不足的语言开发语言技术中的重要性。语言敏感监督包括通过对语言原则和文化背景的深刻理解来监督和指导语言技术的发展。这确保了以尊重和符合目标社区的语言和文化规范的方式开发技术。

可解释性和可解释性

语言学为自然语言处理提供了一种适当的元语言,作为表达观察和阐述解释的通用语言。这种通用语言有助于简化对复杂NLP过程的讨论。“语言学为NLP提供了一种重要的元语言来表达观察结果,比如关于模型预测和假设解释,”他们说。

语言研究

语言学和相关领域是自然语言处理的应用领域。语言研究人员,甚至那些不是计算语言学家的人,形成了一个推动NLP任务和工具开发的“用户群”。与前几个类别不同,前几个类别展示了语言学如何对自然语言处理做出贡献,这一类别是双向的:学习语言激发了自然语言处理工具的发展,而这些工具则有助于进一步的语言研究。提交人指出,该清单并不详尽。他们的目的是提供一个总体概述,而不是详细的分析。他们强调,语言专门知识很有价值,但不是处理语言数据和系统的唯一或最关键的方面。他们展示了语言学如何与其他形式的专业知识相结合,为特定项目和更广泛的领域做出贡献。“我们希望这项研究将促进未来的工作,利用语言学和计算机科学家之间的合作和联系,目的是在不同领域的自然语言处理进展,”他们总结道。

机器翻译,轻度译后编辑,仅供参考。

编辑:陈驭格

原文链接