人类语言项目助力伊博语的数字化表达

人类语言项目助力伊博语的数字化表达

参与人类语言项目提供的语言数据项目会带来新的职业机会。

早在2019年TAUS启动了人类语言项目,努力弥合数字代表较少的语言和方言的语言数据差距。我们与来自世界各地的贡献者合作,为各种MT、ML和AI应用生成、注释、译后编辑和评估文本和语音数据。语言覆盖范围没有限制,从一开始,HLP就非常关注长尾语言,这些语言经常被数百万人使用,但在语言服务市场中的代表性较低。我们致力于尼泊尔语、僧伽罗语、库尔曼吉语等语言的数据创建,班巴拉语的语音收集,以及最近尼日利亚语言伊博语、豪萨语和约鲁巴语的翻译项目。

对于一些贡献者来说,参加HLP带来了新的职业机会。其中一人是Onyekachi Raphael Ogbu,他的母语是伊博语,住在尼日利亚。他最近从大学毕业,目前担任伊博语翻译、转录员、画外音艺术家和在线导师。

 HLP伊博项目是他的第一个有偿翻译任务。“我决定报名参加,因为我对伊博语及其表现形式充满热情。伊博语的电子数据匮乏;自然地,这种语言更需要在主流世界有更多的代表性。这让我为HLP项目做出了贡献。”

 当被要求描述他在HLP的经历时,Onyekachi回答说:“我喜欢任务的内容来自不同的行业,这使得翻译人员可以灵活地展示他们来自不同专业的技能。每一个新任务都是一次新的冒险,字数也正适宜,只要有足够的时间去完成它们。不过,这有点挑战性。伊博语在网络世界资源匮乏,需要深入的研究甚至需要创造新词的能力,以提供正确的,或至少接近正确的翻译。”

 这个HLP项目是Onyekachi迄今为止参与的最大、收入最高的项目。伊博语翻译项目也没有听起来那样容易,常常会遇到几乎没有参考资料的情况。由于翻译人数众多,大多数客户提供的报酬很少,因为他们知道即便如此低的报酬译员们仍然会为此争破头。HLP项目确保了翻译人员的意见会被听到,参与该项目的每个人都得到平等对待。”

         Onyekachi补充道,“事实上,我能够为自己买一台新的笔记本电脑,并用我从这个项目中获得的收入开始做服装生意。在完成HLP项目后,我决定认真对待语言服务,通过转录、画外音等其他服务进一步发展我的翻译技能。”

 据教科文组织的数据,尼日利亚29种次要语言已经灭绝,另有29种次要语言濒临灭绝。联合国教科文组织世界语言图集将伊博人列为“有灭绝风险”(potentially vulnerable)。

 “殖民化、快速全球化和移民正在将我们的语言逼到绝境”,Onyekachi说。“数字再现非常重要。当你发现语言很重要时,你会被鼓励更多地使用你的语言。增加代表性将有助于增加语言发展所需资源的开发和生成。参加HLP项目感觉就像是在为一件真正伟大的事情做贡献,一件将造福于我的子孙后代的事情。我也感到被赋予了力量。”

 三月,微软增加了13种新的非洲语言,包括伊博语、约鲁巴语和豪萨语。支持伊博语作为源语和译入语的机器翻译也被更多的MT提供商提供。Onyekachi希望看到更多专注于加强非洲语言数字再现的倡议。“涉及长尾语言的倡议有助于促进语言发展。HLP和其他平台可以从用尼日利亚语言提供网站开始,并组织与尼日利亚本土语言和其他非洲语言相关的项目(网络研讨会、活动、对话)。重要的是,涉及语言的平台在其资源和计划中也要反映语言的多样性。”

(机器翻译,轻度译后编辑,仅供参考)

编辑:胡跃

原文链接