信息格式工作组(MFWG),是Unicode通用区域数据存储库(CLDR)的子组,开发了软件本地化的行业标准,宣布了信息格式2的初始版本。
信息格式框架已被全球大量软件应用程序使用,并考虑不同语言的复杂特性——如语法、屈折和性别——以输出在目标语言中语法正确的本地化文本。
信息格式2(MF2)的发布是该框架二十多年来的首次更新,使软件开发人员能够在现代软件编码中容纳本地化、国际化和全球化概念。
这是因为信息格式2将信息的可翻译部分组织成逻辑段落,无需嵌套或过多的代码。
Unicode消息格式工作组主席Addison Phillips告诉Slator:“我们设计MF2是为了在资源格式和运行时格式之间具有可移植性,希望能得到广泛采用。”
“关于信息格式2的有趣之处在于我们努力使语法可嵌入。没有Unicode转义、字符转义或ASCII引号。我们的语法避免了这些问题,”他补充道。
至于专门从事软件本地化的语言学家的好处,菲利普斯补充说,翻译人员“无需更改地区特定字段,因为它们会自动格式化。”
大型语言模型(LLMs)在软件本地化中的作用
菲利普斯告诉Slator,关于大型语言模型(LLMs)及其对软件本地化的影响,存在着“多个维度”。
虽然对于现代界面中使用大量用户生成内容或运行时生成文本的许多本地化问题都有合理的解决方案,但菲利普斯表示,总体而言,LLMs“过大,无法在许多设备或应用程序中运行”,使质量管理“困难”。
此外,他提到,并非每个LLM都定制用于每种语言和地区。
在LLMs在软件本地化中的潜在用例上,菲利普斯告诉Slator“在消息管理和创建中会有一定作用。但目前,例如使用LLMs来变异性别,过于庞大,难以合理处理。”
承上启下
菲利普斯希望MF2能“更好地承上启下”。该框架的语法设计中内置了扩展机制,并包括了不断发展的功能注册表,等等。
虽然MF2目前处于技术预览阶段,但软件开发人员现在可以部署MF2并提交初步反馈,然后在2024年秋季获得批准发布。
(机器翻译,轻度译后编辑,仅供参考)
编辑:刘煜珍