百度翻译、DeepL、Google翻译、LanguageX和ChatGPT对比 |
一、机器翻译基础
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。
机器翻译发展经历了四个阶段:
a.词典翻译阶段:早期的机器翻译系统主要采用词典翻译方法,即将源语言和目标语言的词汇进行对应,实现简单的翻译。但是由于句法结构复杂、语义多义性等问题,这种方法在实际应用中存在着很大的局限性。
b.规则翻译阶段:随着计算机技术的发展,规则翻译方法逐渐成为机器翻译的主流。该方法使用人工编写的语言规则来实现翻译,能够处理一些比较复杂的语言结构,但需要耗费大量的人力和时间编写规则,并且无法涵盖所有的语言现象。
c.统计翻译阶段:统计翻译方法是在大规模双语语料库的基础上进行翻译,通过分析源语言和目标语言之间的概率模型,寻找最优翻译结果。这种方法具有良好的自适应能力,能够根据不同领域和语言对语料库进行训练,取得了很大的成功。
d.神经网络翻译阶段:神经网络翻译是近年来机器翻译的新兴技术,它利用深度学习模型对双语语料进行训练,从而实现更加准确、流畅的翻译结果。该方法不需要手工设计规则,能够自动学习特征表示,并且在一些测试中已经取得了比较好的效果。
机器翻译的SWOT分析:
目前市面上有众多翻译软件,例如百度、有道、阿里、DeepL、Google翻译、火山翻译等。以下主要是对比百度翻译、DeepL、Google翻译、LanguageX和ChatGPT在功能和翻译质量上的差异。
二、功能对比
2.1 文档、图片、网址及特定领域翻译
百度翻译:https://fanyi.baidu.com/?fr=pcPinzhuan
特点:支持输入文字、上传文档、网址和图片翻译
进入百度翻译官网后,可以直接粘贴字段到相应的位置进行翻译。如果想要翻译文档或图片,则需要先登录才可以使用该功能。
登录之后,我们就可以上传文件和图片进行翻译。上传文件有两种方式:一是直接将文档拖拽到第一张图片的方框中;二是选择“文档翻译”中的“上传文件”。
(1)文档翻译:
文档格式和大小要求:支持上传10MB以内的doc, docx, pdf, xls, xlsx, ppt, pptx, txt, wps格式的文件
以docx文件为例:
文件上传完成后,需要选择翻译设置。选择语言方向,百度翻译支持中文译为英语/日语/韩语,或者英语/日语/韩语译为中文,语种无法交叉。
翻译模型下的细分领域和翻译文档内图片需要是会员才能使用。
文档翻译好之后会呈现为整页预览的格式,逐字对照版需要是会员。
注意:文档译文无法选中复制!!!
翻译好的文档可以导出,但是只有一次免费机会。
(在线编辑译文同样是会员功能)
(2)图片翻译:
(图片翻译的优点是:会提示重点词汇以及推荐相关知识。)
(3)网址翻译:(无需登录)
将网址复制到方框内,点击“翻译”,该网址就会被翻译成相应的目标语
(4)特定领域翻译:
可以根据文本类型,在右边选择相应的领域,但是百度翻译所提供的领域比较有限,只有4个细分领域。可以选择特定领域,与通用领域的翻译进行对比。
举例:翻译一段电子科技领域的文本,分别选择通用领域和电子科技领域进行翻译:
(对比这句话在通用领域和电子科技领域的翻译,电子科技领域的翻译更加精简更准确。)
DeepL: https://www.deepl.com/translator
特点:支持输入文字、上传文档
进入DeepL官网后,将需要翻译的文字粘贴至相应位置,即可进行翻译:
点击译文中某个单词,可以查询到该单词及其派生词的意思,而且会提供其他译法
(1)文档翻译:
DeepL支持pdf, docx, pptx格式的文件,大小不超过5MB
上传文档的方式也有两种:一是将文件拖拽至翻译方框内;二是选择“翻译文件”-“从你的电脑上选择”想要翻译的文件。
以docx文件为例:
点击“目标英语(英式)”
译后的文档:
和百度翻译的文档翻译不同(只能预览,无法复制与下载),DeepL文档翻译完成后可以直接下载到电脑上,但不是双语对照的版本
Google翻译(需要科学上网):
特点:支持输入文字、上传文档及网址翻译
(1)文字翻译:输入字数不超过5000字
(2)文档翻译
支持格式:docx, pdf, pptx或xlsx文件,大小不超过10MB,pdf文件不超过300页。
google翻译文档只能通过“文档”-“浏览您的计算机”上传文件。
点击“翻译”
“下载译文”,和DeepL一样,文档翻译好之后,会直接下载到电脑上
(3)网站翻译:
经过多次尝试,Google翻译虽然提供这个功能,但是无法翻译网站。中文网站经过翻译仍然是中文,英文网站翻译后也依旧是英文。
LanguageX:https://languagex.com/
特点: 支持输入文字、上传文件
需要注册登录后才能使用:
每次输入字数不超过2000字
可以选择红色方框内的工具进行翻译,显示各个工具的翻译差异,如下图所示:
(1)文档翻译:
支持docx, doc, rtf, xlsx, xls, ppt, pptx, srt, txt, csv, xliff, xlf, sdlxliff, sdlxlf, pdf格式的文件,大小不超过10MB。
点击在LanguageX左栏的“翻译项目”,可以上传文件。将文件推拽至相应的位置(如果需要翻译多个文件,可以点击“继续上传”)【LanguageX可以最多上传10个文件,单个文件最大不超过10MB】
文件上传好之后,点击“下一步”。
(上传多个文件时要注意源语一致!)
选择“机器翻译引擎”
选择译入语和译出语
点击“下一步”
点击“开始翻译”
点击“查看”
点击“去翻译” (操作步骤稍微有一点繁琐)
可以编辑译文,编辑好之后,可以确认并锁定译文,
编辑译文后,会显示“译者翻译进度”
支持QA检查(但是没有用)
下载译文或原文,可以下载为TMX格式
(2)特定领域翻译:
LanguageX支持多种领域翻译,如军工无人机、财务报告、影视字幕等。【还可以创建个性引擎,但免费版只能创建一个个性引擎】
以法律翻译为例,点击左侧的“翻译引擎”-“个性引擎”-“+”
“翻译风格”中,可以选择“正式语气”和“口语化”,“直译”和“意译”,自定语言风格
准备好之后,就可以进行训练
法律翻译引擎创建好之后就可以去使用该引擎
例:翻译《中华人民共和国反恐怖法》中的几条法规,选择“法律翻译”引擎进行翻译。
例1:国家反对一切形式的恐怖主义,依法取缔恐怖活动组织,对任何组织、策划、准备实施、实施恐怖活动,宣扬恐怖主义,煽动实施恐怖活动,组织、领导、参加恐怖活动组织,为恐怖活动提供帮助的,依法追究法律责任。
对比官方译本,法律翻译引擎的翻译在结构上基本一致,只有用词上的细微差别。
例2。国家不向任何恐怖活动组织和人员作出妥协,不向任何恐怖活动人员提供庇护或者给予难民地位。
对比其他翻译结果,“法律翻译”引擎的翻译结果体现了法律英语的特点:法律条款中shall非常常见。
ChatGPT:特点:虽然无法上传文档、无法翻译图片和网址,不支持特定领域翻译,但是可以输入指令,要求译文符合某个领域的语言特色,但有时候结果不尽如意。
2.2术语库定制及记忆库创建
百度翻译:
特点:支持术语库定制(需要先登录才能使用),不支持创建记忆库
选择“文档翻译”下的“术语定制”
点击“创建”,然后导入术语库。【百度翻译支持txt, xlsx和xls格式的文件】
术语文件导入成功后,命名该术语库,确定语言方向,然后“创建”。
非会员最多可以上传两个术语库,每个术语库的术语对不超过10条
可以进入术语库,修改、删除或编辑库中的术语
可以导出术语为txt,xlsx格式
DeepL:
特点:可以添加术语库,但是不能添加中英术语。免费版:可以添加1份术语表,最多10个条目。不支持创建记忆库
以英日为例,点击“术语表”。
选择语言对,添加术语
继续添加
注意:只能逐条添加术语,且术语不能导出
Google翻译:不支持术语库定制和创建记忆库
Languagex:支持术语定制及创建记忆库
(1)术语定制方法一:
“翻译引擎”-先选择源语和译入语
再开启“术语定制”,每个语言方向最多添加20个术语
定制术语,逐条输入术语
手动输入术语,然后点击“✔️”
(2)术语定制方法二:
上传已经做好的术语表文件,格式支持xls/xlsx/tbx/sdltb
点击“翻译记忆”-“术语库”
“新建术语库”
输入名称、选择语言对,并上传术语文件
然后保存
“查看”创建好的术语库,可以将其下载为TBX或Excel格式
免费版的术语库无法干预机器翻译结果
(3)创建记忆库:
点击“翻译记忆”,选择“记忆库”,“新建记忆库”
LanguageX创建记忆库支持的文件格式有:xls, xlsx, tmx和sdltm,最大10MB
文件上传完成后保存
ChatGPT:可以通过输入指令,要求ChatGPT以tmx格式输出
2.3 翻译记录查询
百度翻译:
特点:支持翻译记录查询,展示最近10条记录
DeepL:不支持
Google翻译:支持
LanguageX:不支持
ChatGPT:支持
2.4 功能对比小结
三、翻译质量对比
3.1词汇
3.1.1 专业术语翻译
Example
1:
ST: The draft is acceptedby the negotiating bank.
(商业术语:draft: 汇票;accept: 承兑;negotiating bank:议付行,押汇行)
Example 2:
ST: Lymph
nodes are often enlarged but are not tender.
( tender:在医学领域常译为:触痛的)
3.1.2 文化负载词的翻译
文化负载词:具有某种文化特征和特有事物的词、词组和习语,反应了该文化在特定的历史背景和发展进程中逐渐积累起来的有别于其他民族和文化的独特的生活、工作和娱乐方式。
Example 1 :
ST:过去村民办红白事,讲排场、比阔气,相互攀比造成铺张浪费严重
百度翻译:在句子中无法准确翻译文化负载词,单独的词语反而可以正确翻译
DeepL:在句子中无法准确翻译文化负载词,单独的词语反而可以正确翻译
Google翻译:单独的词语翻译不全面,但是在句中翻译正确
LanguageX:单独的文化负载词和置于句子中的文化负载词均未正确翻译
ChatGPT:单独的文化负载词和置于句子中的文化负载词均能正确翻译,且解释清楚详细
Example 2:
ST: 这时,我不管三七二十一,拔腿就跑。
百度翻译:词语理解正确,但有语法问题。
DeepL:词汇理解基本正确,有语法问题。
Google翻译:词汇理解基本正确,语法正确。
LanguageX: 词汇理解完全错误,有语法错误。
ChatGPT:词汇理解完全正确,语法正确,且能够准确捕捉语境信息。
Example 3
a visit from the stork: the
birth of a baby
3.2 语法
Example 1
ST: 接着,他继续设想,鸡又生鸡,用鸡卖钱,钱买母牛,母牛繁殖,卖牛得钱,用钱放债,这么一连串的发财计划,当然也不能算是生产的计划。
百度翻译:主语和谓语不一致,中途偷换主语。
DeepL: 语法基本可以接受,但which could be bred中的bred不能作后一个定语从句的先行词。
Google翻译:主语和谓语不一致,中途偷换主语。
LanguageX: 主语和谓语不一致,中途偷换主语。
ChatGPT:语法完全正确,且对原句进行了拆分,解决了原句每个小句主语不同的问题,符合英文表达习惯。
Example 2:
ST: But the
idea that the journalist must understand the law more profoundly than an
ordinary citizen rests on an
understanding of the established conventions and special responsibilities of
the news media.
百度翻译:通过添加指示代词将长句拆开,符合中文语法。
DeepL:结构过于复杂冗长,不太符合中文语法表达。
Google翻译:结构过于复杂冗长,不太符合中文语法表达。
LanguageX:结构过于复杂冗长,不太符合中文语法表达。
ChatGPT:添加指示代词,基本符合中文语法。
3.3 语义
Example 1 :
ST: He
always insists on putting in his
two cents whether we want his opinion or not!
( To
share one’s opinion or point of view for whatever it may be worth, generally
when it is unasked for.)
Example 2
ST: 还是苟活着吧。勉强凑合着吧。忍字高忍字高,忍字头上一把刀。
3.4 实体识别
Example 1:
ST: The ANHPRC has made contributions to the
research on and publicity of the history of New China, and to the education on
it as well since its founding 30 years ago.
(ANHPRC: the
Association of National History of the People’s Republic of China 中华人民共和国国史学会,简称国史学会)
Example 2:
State Councilor and Foreign Minister Qin Gang sent
a letter to the reception marking the 78th anniversary of the League of Arab
States (LAS) and the 30th anniversary of the Mission of the LAS in Beijing,
extending warm congratulations to the LAS and all friends from the Arab world.
(the Mission of the
LAS in Beijing:阿盟驻华代表处)
3.5 翻译质量小结
四、总结
功能上,Google翻译和DeepL没有百度翻译和LanguageX齐全。百度翻译和LanguageX也各有所长,例如,百度翻译可以翻译文档和网页,LanguageX却不行,但是百度翻译很多功能需要升级到会员才能使用。LanguageX更像一个集合型翻译工具,可以对比诸多工具的翻译结果,创建术语库和记忆库。
翻译质量上,ChatGPT表现最佳,在各个方面都明显优于其他几个工具,LanguageX表现最差,错误理解原文以及译文不符合译入语表达规范的频率较高,其他几个工具翻译质量在各项指标的表现都不太稳定,各有优缺点。
综上,LanguageX提供的功能种类最多但翻译质量较差,ChatGPT对文本的把握最准确、译文质量较高,但主要通过对话进行指令操作,功能有限。译者可以根据自己的需求进行综合选择,发挥主观能动性,以机器翻译的译文作为参考,进一步思辨分析、严谨查证,从而提高自己的翻译效率和翻译质量!
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
– END –
原文来源:北外CAT课程展示-孙久媚 祁雯雯
推文编辑:李丹