机器翻译市场正在成熟吗?

分享

其他推荐

 成熟的行业或行业内分支的一个标志是公司为迎合特定的行业分支而发展。当各种公司和产品在21世纪初兴起去专门迎合翻译人员时(我这里指的不是翻译环境工具,而是会计工具、转换应用等东西。),我认为这是“我们”已经到来的标志。我们足够重要,以至于公司实际上可以通过为我们构建工具来维持下去。谈到这一点,机器翻译(MT)空间是如此有趣。大多数机器翻译开发者的名字并不主要因为构建机器翻译引擎而为人所知,这并不是偶然的(想想微软、谷歌、Yandex、百度、Naver、亚马逊等。)。这些公司可能会出售其机器翻译服务的访问权限,但单靠商业可能无法证明构建和维护它们的成本是合理的。结合这些公司的主要目的——在所有这些情况下都是加强他们的核心产品(最常见的是他们的搜索引擎)——建立一个机器翻译引擎,然后作为某种额外的好处出售是有意义的。当然,也有例外。虽然DeepL一如既往地神秘,但我认为假设它现在盈利可能并不牵强。像Systran、KantanMT和其他一些公司也苟且盈利。关键是,尽管机器翻译和我们大多数人的职业生活有很大关系,但很少有产品是有利可图的。也有许多尝试,要么自动选择机器翻译,如现已解散的FairTradeTranslation,要么验证后期编辑的水平,如瑞士译后编辑分数。翻译自动化用户协会(TAUS)多年来提出了许多机器翻译方法,但通常最终都被放弃了。然而,当有新产品试图从稍微不同的角度来解决这个问题时,我总是很感兴趣,或者更正确地说,顽固地再次尝试过去没有成功的东西。Achim Ruopp是Polyglot Technology的创始人兼首席执行官,这是一家小公司,提供一种他们称为MT Decider的产品。它的前提非常简单,但可能对某些人很有帮助。大多数译者都以某种方式使用机器翻译。有时是客户决定使用什么引擎,但有时由我们决定。绝大多数翻译人员在主要的引擎之间进行选择,而无需任何定制。(我知道也有例外,但总的来说,我相信这是真的。)一些译者对当前哪个引擎是所讨论的语言组合的最佳可用引擎,以及它是否是像英语>西班牙语或英语>德语(反之亦然)这样的语言组合有很好的看法,这些观点可能会在一段时间内保持教育性,因为这些大型语言组合的输出质量不会发生太大变化。对于较小的语言组合,这可能不同。例如,如果您使用芬兰语、立陶宛语或哈萨克语工作,相应机器翻译引擎的输出可能会逐月有很大差异。为什么?因为引擎被训练的语料库相对较小,并且与竞争引擎相比,任何添加都可能对机器翻译输出的质量产生重大影响。或者我们再举一个例子。假设您运行一家中型语言服务提供商,该提供商经常需要使用20多种语言,而您希望使用机器翻译(无论以何种身份)。显然,您不知道哪种引擎最适合每种语言对。因此,您可以订阅在大型机器翻译引擎(目前:微软、谷歌、亚马逊和DeepL)上运行测试的季度报告,这些报告将提供所述引擎输出质量的当前读数。每个引擎和语言组合都用两个不同的评估系统进行测试:备受争议的BLEU(双语评估替补)和更新的COMET(翻译评估的跨语言优化指标),后者本身基于神经系统。这些系统在评估输出方面并非完美无缺,但它们能够检测到从一个报告到下一个报告的变化,这才是真正有趣的地方。(除非你使用像Intento这样昂贵得多的系统,否则这也是不可用的——Intento最近告诉我,Intento实际上不再关注较小的提供商)。作为个人翻译,你可以花29美元购买两种语言组合的季度订阅。作为语言服务提供商,所有48种可用语言组合的费用为299美元。您可以在我链接的多语言技术网站上看到可用语言和其他信息的列表。我想Achim最终会解决一些缺点。(例如,目前无法对定制引擎或特定域进行评估。)但是,再说一次,如果系统中有吸收,我相信会有改进。

原文链接

 

(机器翻译,轻度译后编辑,仅供参考。)

编辑:曾钰璇

Was it helpful ?