谷歌宣布,它的谷歌翻译产品在其历史上首次同时发布了超过100种语言,其语言覆盖范围几乎在一夜之间翻了一番,从133种语言增加到243种。
这些语言涵盖了从很少有母语使用者的小型土著语言到拥有超过1亿母语使用者的主要世界语言,将其翻译覆盖范围扩大到世界人口的8%。
谷歌将这一扩展归功于其最新的大型语言模型PALM2。据谷歌去年发布的研究报告显示,PALM2的翻译效果比谷歌翻译还要好。
谷歌的高级软件工程师Isaac Caswell表示,谷歌利用PaLM 2“更有效地学习彼此密切相关的语言,包括接近印地语的语言,如阿瓦迪语和马尔瓦迪语,以及法国克里奥尔语,如塞舌尔克里奥尔语和毛里求斯克里奥尔语。”
然而,该公司认识到在其产品中添加这些新语言的挑战,“地区品种,方言,[和]不同的拼写标准”等在推出新语言时要考虑的因素,该公司正在积极研究。
“我们的方法是优先考虑每种语言中最常用的变体。随着技术的进步,随着我们继续与语言学家和母语人士合作,随着时间的推移,我们将支持更多的语言品种和拼写惯例。”Caswell表示。
在新语言宣布后,用户们纷纷涌向社交媒体平台X,对他们的母语可用性表示很兴奋。伊班语是一种马来亚-波兰语,只有不到300万人以其为母语。一名以伊班语为母语的人在推特上说,虽然翻译还可以改进,但“对于一种刚刚在谷歌翻译中推出的语言来说,这已经相当令人印象深刻了。”
两个月前,谷歌翻译搁置了“贡献”功能,该功能允许人们“改进翻译”并提出替代方案。
作为其1000种语言计划的一部分,该公司计划利用人工智能进一步扩大其语言覆盖范围——该计划致力于通过使用人工智能技术来支持世界上使用最多的1000种语言。
机器翻译,轻度译后编辑,仅供参考。
编辑:陈驭格