毫无疑问,机器翻译可以为小型私营公司和大型跨国公司节省大量时间,但其结果是否可靠呢?复杂的语句往往会生成没有意义的语句,文体上的细微差别会丢失,文化上的微妙之处也会被遗漏。这在文学翻译中更具挑战性,因为文学翻译对创造性表达和细微差别的要求极高。若几乎每五个句子都需要修改,该怎么办呢?这就是机器翻译译后编辑(MTPE)的用武之地。
如今,译后编辑已不仅仅只由专业译员和编辑人员进行人工纠错。它是一个自动化流程,其中大型语言模型(LLMs)发挥着关键作用。LLMs不再依赖劳动密集型的人工纠错,而是承担起完善译文的任务。有了LLMs的译后编辑功能,不仅可以纠正明显的错误,还能增强文风,使文本更加自然、易读。且经过大量数据集的训练,这些模型还能够“理解”语言,而不仅仅是匹配单词。
结果如何?节省时间和成本,提高质量,当然还有生成听起来像人工翻译的译文。当今时代,时光似金,使用LLMs进行译后编辑已成为所有机器翻译系统的必要步骤。
机器翻译的步骤
机器翻译过程包括以下几个阶段:
文本分析。系统将文本分解为单词、短语和句子等组成部分,并试图“理解”语法结构和上下文,从而在目标语言中选择正确的对应词。但在此过程中可能会出现错误:机器可能会误解复杂的结构或模棱两可的词语,从而影响之后的翻译。
选择翻译选项。系统会自动为每个单词和短语选择最合适的对等词。问题是这一过程往往是机械性的:机器并不总是考虑上下文,或者根本就不考虑上下文,从而导致错误的选择,尤其是对于同音异义词或惯用表达而言。
生成最终文本。机器将翻译好的部分组合成一个连贯的文本。在这一过程中,即使每个单独的元素都翻译正确,最终也可能会在句法(不正确的词序)、风格(机械和毫无生气的语气)和逻辑(句子之间失去联系)层面出现问题。
例如,将英文句子“I saw her duck when the ball was coming towards her. She reacted quickly to avoid getting hit.”翻译为法语。
英文单词“duck”既可以指动物,也可以指动作。而自动翻译系统可能会输出如下内容:“J’ai vu son canard quand le ballon arrivait vers elle. Elle a réagi rapidement pour éviter d’être frappée.”而这一句子毫无意义。
正确的版本应该是“Je l’ai vue se baisser quand la balle arrivait vers elle. Elle a réagi rapidement pour éviter d’être frappée.”
如果没有译后编辑,译文可能仍然是一团乱麻,失去了原意和文化背景。因此即使是最强大的机器翻译算法也需要进一步完善。
常见的机器翻译错误
语法错误:自动翻译经常包含时态不匹配、介词、冠词或大小写的错误使用,尤其是在有许多细微差别的复杂句子中。
英文:The teacher was proud of her student.
机器翻译:Le professeur était fier de son étudiante.(使用了阳性形容词“fier”,而非阴性形容词“fière”)。
更正:Le professeur était fière de son étudiante.
语法错误:机器可能会在句子中错放单词,尤其是当源语言和目标语言的结构不同时,这使得文本不自然且难以理解。
英文:He found a sacred book in the old library.
机器翻译:II a trouvé un sacré livre dans la vieille bibliothèque.(此处“sacré”意为“神圣的”,应放在名词之后。把它放在名词之前,意思就变成了口语中的 “该死的”)。
更正:II a trouvé un livre sacré dans la vieille bibliothèque.
语义错误:机器翻译可能会误解单词或短语,尤其是多义词,从而导致翻译错误和意义扭曲。
英文:The bank is next to the river.
机器翻译:La banque est à côté de la rivière.(“bank”一词被译为金融机构,而在此处的意思是“岸边”)。
更正:La berge est à côté de la riière.
文体错误:机器翻译往往无法保留原文风格,使正式文本过于简单,非正式文本过于正式,从而破坏了文本的语气和流畅性。
英文:Hey, how’s it going?
机器翻译错误:Bonjour, comment ça va ?(译文过于正式)。
更正:Salut, ça va ?
文化错误:成语、谚语和文化典故往往按字面意思翻译,使目标受众感到困惑或可笑。
英文句子:It’s raining cats and dogs.
机器翻译错误:II pleut des chats et des chiens.(习语被字面翻译,导致对法国读者来说没有意义)。
更正:II pleut des cordes.
这些错误清楚地表明,即使是最先进的机器翻译系统也无法完全取代人工翻译,只有NMT译后编辑才能确保翻译的高质量和准确性。
LLM译后编辑算法
LLMs使用先进的算法对机器翻译进行深入分析和增强,从而达到曾经只有人类才能达到的准确度。这一过程从模型评估源文本的上下文、结构和含义开始,识别单词和句子之间的语义联系,以捕捉自动翻译器的错误。
源文本分析。LLMs不只是逐字翻译,它们还能“理解”上下文。这些模型可以分解复杂的短语,检测多义词,并对其进行正确解释,从而减少误译,避免直译。
翻译校正。接收文本后,LLM会调整语法、改进语法并完善短语的自然流畅性。且经过大量数据的训练,它不仅能识别明显的错误,还能识别风格或逻辑上细微的不一致之处。
LLM在翻译完善中的作用
大型语言模型(LLMs)彻底改变了机器翻译的译后编辑方法。但是,MTPE 服务在哪些方面优于传统的人工译后编辑呢?LLMs拥有处理文本的独特方法,而不仅仅是纠错。他们可以增强文本的整体意义和连贯性,使其更流畅、更符合逻辑。
样式改编。想象一下,编辑在审阅数百页的文章时,一丝不苟地查找错误并完善文体。LLMs不仅可以纠正错误,还可以根据所需的文体(从正式到对话)调整文本。对于语气和情感细微差别都很重要的文章,这一点尤为重要。人工编辑既费时又费钱,而LLMs可以立即实现这一目标,确保全文风格一致。
语法修正。人类必须仔细重读并检查每一个语法细节,而 LLMs几乎可以立即纠正错误。复杂的时态变化、大小写和介词都会自动处理,从而大大加快处理速度。
提高可读性。我们都曾遇到过自动翻译后的繁琐复杂句子,手动完善此类结构需要时间和技巧。然而,LLMs可以毫不费力地将复杂的短语转化为自然易懂的句子,使文本更易于阅读。
专业词汇。在传统的编后工作中,译员经常要花时间为复杂的术语寻找正确的对应词,而这并不是每个编辑都熟悉的。经过大量文本训练的LLMs可以自动识别上下文并输出准确的术语,从而避免了人工搜索。LLMs的主要优势之一是保持词汇的一致性。如果同一概念在翻译的不同部分使用了不同的术语,模型会选择正确的匹配词,以确保整个文本的统一性和逻辑流畅性。
语境。多义词和多义性的表达对任何编辑来说都是噩梦,需要仔细阅读才能避免错误。LLMs可以快速准确地处理这些问题,根据上下文选择正确的含义,避免误解。他们不仅能修正单个词语,还能在更广泛的文本中分析句子的含义。这样,他们就能提出修改意见,提高译文的准确性和目标受众的清晰度,避免过于直译或失去原意。
人工译后编辑一直被认为是黄金标准,但它需要大量的时间、耐心和专业知识。LLMs不仅能更快地完成任务,而且准确性很高。编辑可能需要多次重读文本才能捕捉到细微的差别,而LLMs则能立即看到全貌。LLMs承担了大部分工作,节省了时间和资源,尤其是在翻译大量文本时。
翻译质量的衡量标准
在众多用于评估翻译质量的指标中,有两个指标比较突出:BLEU和 COMET。它们各有特点,适用于不同的任务。
BLEU(Bilingual Evaluation Understudy Score)是一个经典的指标,也是最著名的指标之一。它通过计算目标语言中匹配的单词和短语,将翻译文本与参考文献进行比较。BLEU的优势在于简单快捷。但是,它不考虑意义深度、语境或文体特征,这可能会导致一些不能准确表达原意或听起来不自然的文本获得较高的BLEU分数。
COMET(跨语言优化翻译评估指标)是一种更现代、更先进的指标,它不仅考虑单词匹配,还考虑源文本和译文之间的语义和上下文连贯性。COMET擅长捕捉语义联系,可以评估翻译的更复杂方面,但仍具有局限性。
翻译指标的局限性
虽然BLEU和COMET是有用的工具,但它们并不总能展现全貌,尤其是在处理编辑后的文本时–无论是人工还是在LLMs的帮助下。这些指标可以评估词语匹配度和词语转换的准确性,但它们并不能囊括一切–风格、可读性和文化上的细微差别仍然无法体现。例如,一篇文本可能在COMET上得分很高,但在目标受众看来仍然很不自然,接受度很低。
译后编辑需要做的往往不仅仅是纠错,还需要根据特定的语境对文本进行调整,增强其流畅性,并调整其语气。在这方面,任何衡量标准都无法取代细心的编辑或深入的分析。要进行真正的定性评估,自动系统尚无法考虑的主观因素是必不可少的。
LLM编辑后文本的人工评估
尽管自动评估技术不断进步,但专业编辑的敏锐眼光是无可替代的。在算法纠错的同时,经验丰富的编辑还能识别机器经常忽略的细微文体差别,从而增添人情味。他们会仔细选择单词和短语,确保文本感觉自然,并符合目标语言的语境。当语气和风格至关重要时,这种对细节的关注尤为重要。
目标受众的直接反馈是评估MT译后编辑质量的重要方法。调查和问卷有助于确定文本与读者的共鸣程度、听起来是否自然以及是否符合他们的期望。用户可以提供可读性方面的见解,突出难读的部分,并评价文本的整体风格和含义。这种反馈是对技术评估的补充,提供了更感性和人性化的视角。
通过专业编辑的工作和用户的反馈,人工评估方法共同为编辑后的成功提供了更深入的理解。自动衡量标准提供了量化数据,而人工评估则捕捉到了文本如何被真正感知的全部丰富内容和细微差别。
Lingvanex译后编辑解决方案
Lingvanex结合尖端技术和大型语言模型 (LLMs) 的功能,为机器翻译译后编辑服务提供强大的工具。这些解决方案可帮助公司根据具体任务和需求调整翻译,从而提高翻译质量。接下来,让我们详细了解LLMs如何处理翻译成法语的文本的译后编辑工作。
原文:
I recently started a new job at a large multinational company. The office is located in the heart of the city, and the commute is quite convenient for me. My team consists of people from different countries, which makes every day interesting as we exchange ideas and perspectives. However, the workload has been heavier than I anticipated. I sometimes find it difficult to keep up with all the deadlines, especially since my previous job was much more relaxed. Despite the challenges, I’m learning a lot, and I appreciate the opportunity to develop new skills. I’m also getting used to the company’s culture, which emphasises teamwork and collaboration. Hopefully, I will find a better work-life balance soon.
使用Lingvanex Translator翻译为法语:
J’ai récemment commencé un nouvel emploi dans une grande entreprise multinationale. Le bureau est situé au cœur de la ville, et le trajet est assez pratique pour moi. Mon équipe est composée de personnes de différents pays, ce qui rend chaque jour intéressant lorsque nous échangeons des idées et des perspectives. Cependant, la charge de travail a été plus lourde que je ne l’avais prévu. J’ai parfois du mal à respecter tous les délais, d’autant plus que mon emploi précédent était beaucoup plus détendu. Malgré les défis, j’apprends beaucoup, et j’apprécie l’opportunité de développer de nouvelles compétences. Je m’habitue aussi à la culture de l’entreprise, qui met l’accent sur le travail d’équipe et la collaboration. Espérons que je trouverai bientôt un meilleur équilibre entre vie professionnelle et vie privée.
使用Lingvanex的LLM进行译后编辑后的文本:
Je viens de commencer un nouvel emploi dans une grande entreprise multinationale. Le bureau est situé en plein centre-ville, ce qui facilite mon trajet. Mon équipe est composée de personnes issues de divers pays, ce qui rend chaque jour intéressant grâce aux échanges d’idées et de perspectives. Cependant, la charge de travail s’avère plus importante que je ne l’avais anticipé. Je peine parfois à respecter tous les délais, car mon précédent emploi était bien moins exigeant. Malgré ces défis, j’apprends beaucoup et je suis reconnaissant de pouvoir développer de nouvelles compétences. Je m’adapte également à la culture d’entreprise, qui encourage le travail d’équipe et la collaboration. J’espère trouver prochainement un meilleur équilibre entre vie professionnelle et vie privée.
结果:总的来说,Lingvanex翻译的文本是正确的,但仍存在一些不自然的短语,经过译后编辑之后,这些短语被成功地修饰了。将语法结构“J’ai récemment commencé”替换为“Je viens de commencer”,对于讲法语的人来说,文本更加口语化和自然。新的语法结构表示工作刚刚开始,更符合语境。“au cœur de la ville”在技术上是正确的,但用“en plein centre-ville”来描述办公室在城市中的位置听起来更自然。“lourde”一词被替换为“importante”,后者听起来更专业,在风格上也更好地反映了工作量的大小。在短语“J’ai parfois du mal”中,用“peine”代替动词,使文字更加流畅。将短语“Espérons que”简化为“J’espère”,使其更加个性化和直接,改善了文章的风格。
原文:
Coral reefs are some of the most diverse and valuable ecosystems on the planet. They provide habitat for thousands of species and protect coastlines from erosion. However, coral reefs are highly sensitive to changes in water temperature, acidity, and pollution. Climate change has led to widespread coral bleaching, where the coral expels the algae living in its tissues, causing it to turn white. This process weakens the coral, making it more susceptible to disease and death. Protecting coral reefs is vital not only for biodiversity but also for the millions of people who rely on these ecosystems for food, income, and coastal protection.
使用Lingvanex Translator翻译成法语:
Les récifs coralliens comptent parmi les écosystèmes les plus diversifiés et les plus précieux de la planète. Ils fournissent un habitat à des milliers d’espèces et protègent les côtes de l’érosion. Cependant, les récifs coralliens sont très sensibles aux changements de température de l’eau, d’acidité et de pollution. Le changement climatique a conduit à un blanchissement généralisé des coraux, où le corail expulse les algues vivant dans ses tissus, les faisant devenir blanches. Ce processus affaiblit le corail, le rendant plus sensible aux maladies et à la mort. La protection des récifs coralliens est vitale non seulement pour la biodiversité mais aussi pour les millions de personnes qui dépendent de ces écosystèmes pour leur alimentation, leurs revenus et leur protection côtière.
使用Lingvanex的LLM进行译后编辑后的文本:
Les récifs coralliens comptent parmi les écosystèmes les plus diversifiés et les plus précieux de la planète. Ils offrent un habitat à des milliers d’espèces et protègent les côtes de l’érosion. Cependant, les récifs coralliens sont très sensibles aux changements de température, d’acidité et de pollution de l’eau. Le changement climatique a entraîné un blanchissement généralisé des coraux, où le corail expulse les algues vivant dans ses tissus, les faisant devenir blancs. Ce processus affaiblit le corail, le rendant plus sensible aux maladies et à la mort. La protection des récifs coralliens est vitale non seulement pour la biodiversité, mais aussi pour les millions de personnes qui dépendent de ces écosystèmes pour leur alimentation, leurs revenus et leur protection côtière.
结果:译文总体不错,但需要做一些更正。将“fournissent”替换为更符合语境的 “offrent”,使文字更流畅自然。在“les récifs coralliens sont très sensibles aux changements de température, d’acidité et de pollution de l’eau”这句话中,译后编辑在提到污染和酸度之后添加了“de l’eau”这一说明,从而提高了清晰度。对语法进行了小的调整:将“blancs”改为“blanches”,以便与“algues”一词的性别一致,因为这个名词在法语中是复数和阴性的。此外,LLM还在“mais aussi”前加了一个逗号,这符合法语标点符号规则,使文本在语法上更加合理。
因此,我们可以看到,在LLMs的帮助下进行的译后编辑大大改善了文本的风格和自然度。更正不仅解决了语法和标点符号错误,还加强了语句的流畅性和结构,并选择了更自然的法语短语。
Lingvanex在译后编辑方面的优势
LLM集成,提高质量:Lingvanex与LLMs集成,实现翻译的自动译后编辑。这意味着复杂的短语、特定的术语和语法错误不仅能得到基本的纠正,还能根据上下文和风格进行修改,使译文尽可能自然、准确。
根据客户需求量身定制:Lingvanex解决方案的主要特点之一是能够完全适应客户的具体需求。每个行业和企业都有独特的翻译要求,Lingvanex则充分考虑到了这一点,为每项任务提供定制解决方案。
支持多种格式,易于集成:Lingvanex支持多种文件格式,是适用于各种工作流程的灵活工具。与现有系统和流程的无缝集成,为公司节省了时间和资源。
高级数据安全:在大多数公司将数据保护放在首位的时代,Lingvanex确保了高度的安全性。所有翻译都按照最严格的数据保护标准进行处理。
LLM译后编辑的未来
使用LLMs进行译后编辑的未来大有发展。技术正在不断发展,会变得更加智能和准确,从而使译后编辑更加快速和高效。我们即将迎来这样一个时代:翻译过程中的人工干预将减少到最低程度,尤其是在处理大量文本时,人工干预的需求将会降至最低。
LLM技术仍在快速发展,其主要特点之一是能够进行微调。这些模型可以根据特定公司或项目的数据进行训练和调整,使译后编辑更加精确和个性化。每一次新的迭代都会提高它们理解上下文、调整风格和处理特定行业术语的能力。这为大幅减少对人工工作的依赖铺平了道路,尤其是在翻译大量文本时。
然而,尽管取得了这些进步,人工在译后编辑中的作用并不会消失,只会不断演变。人工将更多地成为监督者,监督最终产出,而不再进行实际编辑。
(机器翻译,轻度译后编辑,仅供参考)
编辑:杜曼曼
审校:张媛媛