合作旨在通过收集和构建亚洲的低资源语言数据集来增强企业语言模型市场的竞争力。
2024年5月9日,首尔:AI数据解决方案提供商和集成语言平台Flitto(CEO Simon Lee,KOSDAQ 300080)9日宣布,与专注于大型语言模型的AI公司Upstage签署谅解备忘录(MOU),进行AI语言数据的构建。
两家公司将为亚洲低资源语言合作收集和建立数据集,如泰语、日语、老挝语和高棉语,目标是增强大型语言模型(LLMs)的性能。
该协议包含几个关键点。▲合作构建韩国LLM排行榜Ko-LLM基准数据集。▲合作运营多语种LLM排行榜。▲通过建立和利用低资源语言数据实现LLM本地化。▲通过数据供应加强合作伙伴关系,建立业务整合的小型语言模型(sLLM)。
两家公司围绕语言人工智能开发的战略合作有望在不久的将来产生切实的成果。
通过这种合作关系,Flitto旨在利用其语言数据扩展能力和先进的人工智能技术,积极促进语言模型的发展。他们在语言数据构建方面的广泛专业知识,包括构建多语言并行语料库和提供无版权问题的文本、图像和语音数据集,预计将为人工智能数据提供商提供坚实的竞争优势。
Upstage的战略是确保高质量、低资源的语言数据,并扩展其预先培训的LLM Solar的语言支持,以开发专门针对各种地区语言(包括东南亚)的定制模型。Solar目前支持韩语和英语,计划在今年年底扩展到日语和泰语。
Flitto首席执行官西蒙·李(Simon Lee)表示:“低资源语言的训练已经成为大型语言模型性能的一个关键因素。”他补充说,“通过两家公司的合作,我们旨在展示高质量人工智能数据和先进技术之间的协同作用如何能够积极影响国内的生成式人工智能生态系统。”
Upstage首席执行官Sung Kim强调,“与语言模型推动的生成式人工智能热潮一起,确保高质量的语言数据是一项重要任务,”他补充说,“通过我们与Flitto的合作,Upstage将努力建立先进的数据集,使更广泛的全球观众能够体验生成式人工智能技术带来的创新。”
8日,在首尔江南区的Flitto总部,Flitto首席执行官Simon Lee(左三)和Upstage执行副总裁Soon-il Kwon(左四)在人工智能语言数据建设谅解备忘录签字仪式上与两家公司的员工合影留念。
*照片的其他信息:(从左至右)Flitto产品战略组负责人Ki-young Shin、Flitto传播组负责人Chung-won Park、Flitto首席执行官Simon Lee、Upstage执行副总裁Soon-il Kwon、Upstage首席研究工程师Chan-jun Park、LLM业务开发和销售主管Min-sung Kim。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:王云菲