01基于实例的机器翻译|Example-Based Machine Translation
《中国大百科全书》(第三版·网络版)发布了黄国平博士撰写的“基于实例的机器翻译”词条。现转录如下,以资交流。
基于实例的机器翻译指通过修改最相似的翻译实例的途径完成翻译的机器翻译技术。1984年由日本机器翻译专家长尾真提出。简称EBMT。
长尾真认为,人们在翻译简单句子时并没有做语言的深层分析,而是先将句子分解为几个片断(短语),借助已有片断的翻译,将分解的每个片断翻译成目标短语,最后将这些短语组合起来,形成一个长的句子。所以基于实例的机器翻译的基本思想是在已经收集的双语实例库中找出与待翻译部分最相似的翻译实例(通常是句子),再对实例的译文通过由替换、串删除以及串增加等一系列变形操作来实现翻译。
基于实例的机器翻译可以分为三大部分:将实例划分为片断、确定各个片断的翻译、重组片断。对齐的双语语料库是最重要的知识库之一。实例的粒度越大,当翻译用到时,其效果则越理想,但另一方面,粒度越大,能够直接使用的可能性又越小。因此,在实例的粒度选择上,应该考虑一定程度的平衡。
02作者简介
黄国平,博士,腾讯翻译负责人,腾讯AI
Lab专家研究员,毕业于中国科学院自动化研究所,研究方向为机器翻译、自然语言处理。长年专注于交互翻译的研究与应用,在ACL、AAAI、IJCAI、EMNLP等人工智能领域顶级会议与TASLP等顶级期刊发表论文20余篇。
03文献来源
原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享。
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。
翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!
转载来源:《中国大百科全书》(第三版网络版)