MTPE知识手册 | 机器翻译的应用
机器翻译属于“自然语言处理”领域的应用。自然语言处理(Natural Language Processing, NLP)是计算机科学和人工智能领域的一个重要方向,旨在实现人与计算机之间用自然语言进行有效通信。机器翻译在自然语言处理中的应用非常广泛,包括但不限于舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、图像文字识别等方面。
机器翻译还可以进一步细分为专门性的翻译,如法律机器翻译、医学机器翻译、生物机器翻译、石油机器翻译、航天机器翻译等。这些专门性的机器翻译在特定领域的准确率更高,能够更好地满足专业需求。本部分将重点分享机器翻译在法律领域和医学领域的应用,并举出实例帮助大家了解有关机器翻译的使用方向,并且将其和所学内容相结合,帮助实现技术进步。
随着生成式人工智能,尤其是ChatGPT的功能日益强大,这可能会给法律行业带来翻天覆地的变化。专家笃定,机器翻译未来将融入法律行业。机器翻译或许能够帮助律师更快速、更高效地开展工作。
在当前时代背景下,机器翻译作为一门融合了多个领域的交叉学科,致力于“借助计算机实现从一种自然语言文本到另一种或多种自然语言文本的翻译”,这一功能迎合了广大用户的需求,便利了跨语言、跨文化的沟通,因而在法律翻译领域也发挥出了更加显著的作用。
(1)翻译记忆:在神经技巧翻译中,如何根据源句从翻译记忆库中检索最相似的翻译记忆,以及如何将检索到的翻译记忆更好地融入到模型中都是重要的研究内容。
(2)翻译模板构建:首先,使用词性标注器对文本进行词性分析,对文本中的每个词语进行标注。然后对文本进行命名实体识别,识别出特殊词汇,并将这些特殊词汇使用标签进行替换。
(3)模型建立:包括基于语义和结构相似性的检索模型和引入语义和结构信息的翻译模型。
(4)实验与分析:建立数据集和实验参数,研究完毕后对结果进行分析。
通过以上步骤,能够建立一个较为完整且科学的翻译记忆库,将所需要的大量重复出现的内容储存其中,对于日后法律内容的翻译会起到良好的参考作用。
总之,机器翻译的出现为法律翻译工作者在追求翻译效率和质量方面提供了强有力的支持,推动了社会技术化建构和法治化建设。特别是翻译记忆库的建立,有助于实现法律语言的标准化和规范化。然而,我们也必须重视人机之间的平衡关系,以确保翻译工作的整体质量和可靠性。
在医学领域,机器翻译技术正逐渐成为提高翻译效率和准确性的重要工具。代表技术爱特曼(Atman)自主研发的医学机器翻译引擎,是基于亿级生物医学语料训练而成,在医学翻译领域极具专业性和技术实力。 医学机器翻译引擎通常需求较多,需要应对各种医院内的突发状况,所以功能要求也较高,包括文字翻译、文档翻译、在线协同审校等,覆盖了医学通用、药物警戒、医疗器械、药品制造与控制、临床、非临床、医学法规等多个子领域。 (1)统一内容:内容包括时间和具体表达,机器翻译的时间往往较为单一,而英国美国时间撰写方式是不同的,所以需要译员自行校对,进行统一。 (2)修改内容:修改的内容具体包括缩略语、词汇、时态、人称等。例如,因为在医学病例中,为了节省时间,症状通常都缩略写就,在翻译时就需要译者手动将症状名称补全后翻译。 (3)增补内容:由于医学英语中常常缺乏主语,导致目的语读者无法完全理解指向对象,所以译员需要将主语梳理清晰后补全;有时还需要将背景信息补充完整,以避免阅读障碍。 (4)重组内容:因为句子在机器翻译后容易出现逻辑结构混乱的现象,这就要求译者将原有的句子、词序和段落都进行检查和修改,以求达到整体上逻辑通顺的效果。
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
翻译技术教育与研究——机器翻译译后编辑专题组致力于普及机器翻译译后编辑(MTPE)相关知识,追踪国内外机器翻译译后编辑教学与研究动态!