窥见人类语言项目内部:一位本地数据收集者之旅
对凯瑟琳·考纳基的访谈:作为本地语言数据收集者弥合语言分歧。
于二零一九年,TAUS推出人类语言项目(Human Language Project),旨在为服务不足的地区弥合数字语言鸿沟。我们与来自世界各地的贡献者合作,为各种机器翻译(MT)、机器学习(ML)和人工智能(AI)应用生成、注释、译后编辑和评估文本以及语音数据。今天,我们通过采访语音数据项目的当地数据收集者来深入了解该项目的内部工作方式,该语音数据项目利用人工数据,专注于语音数据,为语音识别和基于语音的人工智能应用程序创建包容性数据集。加入我们,探索人类语言项目及其专门的本地数据收集者之一Kathleen Kownacki的卓越工作。凯瑟琳有几年的翻译经验,拥有语言学学士学位,热爱马戏艺术。 HLP:这是你第一次做本地数据收集员吗?
K:是的,这是我第一次担当类似身份,但是当我了解了本地数据收集员的角色描述,并将其与我自己和我的背景进行比较时,我认为我会非常适合这个角色。
HLP:你觉得这份工作怎么样?
K:我真的很喜欢。这份工作不仅符合我对理想工作的多个预期,还让我进入了一个陌生的领域,我觉得这有助于我成长。
HLP:这是一个具有挑战性的角色吗?为什么?
K:的确是,从非常好的方面来说。虽然严格来说这不是一份销售工作,但我发现自己要经常接触熟以及陌生人,试图激发他们的兴趣。然而,弄清楚如何最有效地营销这个项目是一个挑战。所以,建立联系需要一点努力,尤其是当我并不总是得到回应的时候。我有时还不得不处理技术问题,比如偶尔需要重新录制演讲者的讲演,这增加了挑战。然而,一个独特的挑战是通过录音帮助参与者,特别是那些可能有阅读障碍的人。我最终采用了一些策略,比如用手指跟随或者提供一个声音预览,我发现这些技巧有助于在录音过程中让他们保持冷静和精确,这让我很激动。对我来说非常重要的一点是,这个过程是可及的,对任何参与的人来说都是一次愉快和肯定的经历。
HLP:你觉得和HLP团队的合作怎么样?
K:在我们的整个合作过程中,HLP团队根据我的反馈,积极响应并且不吝于变革它们的运营方式。这极大地帮助了我的录音工作,同时让未来的录音工作变得更容易,我知道我的诉求有被听到。
HLP:你对对这类角色感兴趣的人有什么建议?
K:我的一点建议是花时间与关键组织建立联系。一个地方的一个突破最终可以打开许多扇门。很神奇的是,在拓展联系网络的过程中加入一点个人风格会让结果有所不同。例如,我给一个健康中心的主任发了一封电子邮件,打了一个(或者三个)电话,都没有得到回复。但是因为有一天下午我又亲自去了那个健康中心,我最终和那个主任有了一次半偶然的会面,一旦我们有了面对面的个人接触,原本没有希望的局面就扭转了。此外,如果可以的话,让自己沉浸在你试图招募志愿者的地方。就我而言,当我在一个老年中心等待与潜在参与者交谈时,我参加了正在进行的老年健身班,因为我被允许课间休息时在那里招募志愿参与者。课堂上的活力让我感到敬畏,而我愿意与班上的老年人一起参与活动也确实有助于培养与他们中一些人的信任,这种信任为我带来了更多有意参与我的项目的人,让他们更加开放和愿意参与。最后,不要低估用更传统的方式推广项目,比如海报和传单——它们确实有效。正是通过这种传统的方式,我找到了几个愿意参加的人而且是他们主动来找我的!
(机器翻译,轻度译后编辑,仅供参考)
编辑:胡跃