基于ChatGPT的机辅翻译
(三)ChatGPT辅助长文本翻译:immersive_translate
各位小伙伴大家好呀!如今,随着ChatGPT的普及和多场景灵活应用,我们的工作学习获得了更多的便利和效率。在语言领域,我们可以利用它进行知识问答、文本翻译、译后编辑、辅助原文理解以及数据分析等。平时在翻译方面,不管是文学还是非文学体裁文本,我们似乎也开始习惯经常向ChatGPT投喂Prompt来处理译文。
使用ChatGPT之后,我们可能都会发现,一般情况下,ChatGPT这样的大语言模型(LLM)翻译优势明显。正如今年2月由微软团队发表的一篇论文How Good Are GPT Models at Machine Translation? ——A Comprehensive Evaluation指出的那样: “GPT systems can produce highly fluent and competitive translation outputs even in the zero-shot setting especially for the high-resource language translations”,即——在零样本设定下GPT系统也可为高资源语言生成高度流利且具优势的译文。这里的高资源语言就包括汉语和英语等语言。
不过,由于ChatGPT字符数量的限制,平时我们使用ChatGPT进行翻译或分析时所输入的文本字数也比较有限。据OpenAI官网:(https://platform.openai.com/docs/models/gpt-4)显示,在GPT 3.5模型系列里,我们常用的GPT-3.5-turbo模型最大字符数为4096;在GPT-4模型系列里,付费版的GPT-4最大字符数为GPT-3.5-turbo的两倍——8192字符。因此,在处理长文本时,或许很多伙伴会自行将文本分为好多部分,然后将每部分分别放在聊天框内等待ChatGPT输出结果。这样一来,过程显得繁琐和费时。
那么,有没有办法一次性让ChatGPT单次处理大量字符甚至为小说篇幅的文本呢?
根据“ChatGPT在口笔译中的应用与实战公益沙龙”中“基于ChatGPT的机辅翻译”分享内容,小编已经推出了两个系列推文:
目前小编正在更新第三个系列ChatGPT辅助长文本翻译,并分三次推文介绍三个有关ChatGPT的长文本翻译工具——
immersive_translate和bilingual_book-maker等两个GitHub项目和Superpower ChatGPT扩展插件。
今天的主题是(三)ChatGPT辅助长文本翻译:immersive_translate
本次介绍的是第一个基于ChatGPT的长文本翻译工具——immersive_translate。该工具源于GitHub项目,为AI 驱动的双语网页翻译扩展插件,我们可直接使用其搭载的不同翻译引擎进行翻译,也可调用ChatGPT和Deepl等工具的API KEY进行翻译。
Immersive_translate主要使用场景为网页翻译,如浏览外文网站时可实时生成双语对照翻译。也可用于制作双语 ePub 电子书、翻译本地 PDF 文件、翻译HTML/txt 文件、翻译本地字幕文件等。
需要翻译网页时,只需打开插件界面,选择源语和目的语,以及翻译引擎(如OpenAI),之后点击“翻译”按钮便可进行翻译:
以下是利用immersive_translate插件的OpenAI引擎翻译《经济学人》网页一篇新闻效果:
如需翻译txt/epub/pdf等文件,可点击插件-更多选项,选择相应功能,如翻译txt文本,可选择“翻译HTML/txt文件”:
若要保存译文,可右键点击“另存为”,以html格式保存。保存在桌面后,可修改“html”后缀名为“docx”,之后打开文件,便为可编辑的word格式双语对照文件: