谷歌宣布其免费翻译工具新增110种语言,这是该工具18年历史上最大的一次扩展,现在支持全球超过6.14亿人使用的语言。
新增濒危欧洲语言
据欧洲新闻报道,新增语言中包括几种濒危的欧洲方言,如西西里语 (Sicilian)、曼克斯语 (Manx)、布列塔尼语 (Breton) 和罗姆语 (Romani)。
曼克斯语是马恩岛上的凯尔特语,1974年随着最后一位母语者的去世几近灭绝,但通过岛上的复兴运动,现在已有数千人掌握此语言。
布列塔尼语在法国布列塔尼地区使用,罗姆语在欧洲大约有460万人使用,这些语言现在都为谷歌翻译所支持。
新增的意大利方言包括西西里岛的西西里语和威尼斯的威尼斯语 (Venetian)。此外,谷歌翻译也支持北欧的北萨米语 (Northern Sámi),这进一步扩大了其欧洲语言的覆盖范围。
扩展非洲语言
此次更新中约四分之一的新增语言来自非洲,这是谷歌迄今为止最大的非洲语言扩展。新增语言包括丰语 (Fon)、刚果语 (Kikongo)、卢欧语 (Luo)、嘎语 (Ga)、斯瓦蒂语 (Swati)、文达语 (Venda) 和沃洛夫语 (Wolof)。
阿法尔语 (Afar) 是一种在吉布提、厄立特里亚和埃塞俄比亚使用的音调语言,是此次新增语言中收到最多志愿者贡献的语言。
增加主要世界语言
谷歌还新增了几种主要的世界语言,如备受用户期待的粤语。由于粤语在书写上与普通话有复杂的重叠,一直以来用户呼声很高。此外,巴基斯坦最常用的旁遮普语 (Punjabi) 和北非的柏柏尔语 (Tamazight) 也被纳入支持范围。
AI和机器学习技术驱动
此次扩展得益于谷歌先进的AI和机器学习技术。自2016年以来,谷歌一直使用神经网络算法,这一算法受人脑启发,通过分析模式、上下文和语言结构,提供自然流畅的翻译。
谷歌最新的PaLM 2大型语言模型在这次更新中发挥了关键作用。这个模型的多语言、推理和编码能力经过进一步提升,能够有效学习与其他语言密切相关的语言,如与印地语相关的阿瓦德语 (Awadhi) 和马尔瓦迪语 (Marwadi),以及法语克里奥尔语,如塞舌尔克里奥尔语 (Seychellois Creole) 和毛里求斯克里奥尔语 (Mauritian Creole)。
谷歌还采用零样本机器翻译技术 (Zero-Shot Machine Translation),使AI模型在未见过样本的情况下就能学习翻译新语言。
该技术在2022年被应用,帮助增加24种新语言,并将继续助力谷歌翻译达成覆盖全球1000种最常用语言的目标。
(机器翻译,轻度译后编辑,仅供参考)
编辑:田逸云