一文解决原文(rpr)标签翻译难题!

分享

其他推荐

最近有好多客户伙伴和朋友伙伴经常来问我一个问题:原文中有很多标签,尤其是 rpr 的标签,影响了译员翻译。如果是以前,我可能会直接回复:这是源文档的问题,建议做译前处理。

——可,这并不解决客户的问题。

如果我是客户,我下一个问题肯定会接着问:“我知道问题,怎么解决。”(是的,问题不重要,先解决问题比较重要。)

所以,今天我就来分享:翻译原文中的标签到底是怎么来的?如何处理和解决?

要解决这个问题,首先我们得问:标签是哪来的?

 

一、标签是哪来的?

首先我们要明确一点:memoQ 作为一款专业的 TMS(翻译管理系统) 工具,如果源文档没有,它不会平白无故生成标签。就像我们做翻译,原文没有,译员不能平白无故造,这不忠实。

所以,标签哪里来的?——肯定是来自于源文档。——来自于源文档的什么呢?

 

1.1 标签的分类

我会把标签分为两类:

(1)结构化标签,用于关联文档的特定结构或元素。

如下图所示:emphasis标签对就是结构化标签。

关于结构化标签,我前面讲 XML 时其实讲过。

详见:认识XML文档(二)XML的元素、标签、文本、属性和实体如何翻译单语XML文档?

(2)格式标签,用于维持源文档的外观和布局,比如文字加粗、倾斜、下划线和字体等。

如下图所示:原文的一句话,Go global with memoQ ,分别用了不同的颜色。那,有小伙伴可能会想:我就是一个做翻译的,我为什么要区分格式化标签和结构化标签呢?不要着急,继续往下看。

其实,不论是结构化标签,还是格式化标签,我们都可以综合分为两类:

  • 翻译时,要保留的标签;
  • 翻译时,可以不要的标签。
那么问题继续来了:哪些标签要保留呢?哪些标签又可以不要呢?请你记住:
  • 结构化标签,必须保留。
  • 格式化标要不要,取决于源文档和客户要求。

1.2 为什么要保留结构化标签?

结构化标签描述了文档的逻辑结构和布局,例如段落、标题、列表等。这些标签是文档的核心组成部分,它们定义了文档的基本框架。
  • 有些文件,尤其是代码文件,如果译文中没有标签对,你的译文就少了东西,甚至会导致程序无法运行。前两天我跟另一个客户在聊天时,就提到了一下关于保留格式化标签的重要性。
  • 对于 Office 系列的文档而言,如果结构化标签丢失,翻译结束就无法导出译文。所以很多小伙伴之前出现过”已翻译XML与原文的结构不一致”,导致译文无法导出。——不是一次,是很多很多很多次~
因此,保留格式化标签,是为了:
  1. 保持内容完整性:丢失或更改结构化标签可能导致文档的逻辑结构和流程被破坏,从而使最终翻译的文档难以理解或使用。
  2. 可访问性:许多结构化标签还对辅助技术(如屏幕阅读器)有特殊意义,保留它们有助于确保所有用户都能访问内容。

1.3 如何处理格式化标签?

格式化标签用于控制文档中文本的外观,例如字体、颜色、对齐方式等,因此它们对文档的整体意义和结构的影响较小。
所以,是否保留格式化标签,取决于:
  1. 源文档的目的和风格:如果源文档的格式对传达其意图和风格至关重要,则应保留这些标签,比如上标下标。如果影响较小,就不需要。
  2. 客户要求和期望:有些客户可能希望翻译后的文档保留原文档的所有格式,而另一些客户可能不关心格式问题。在开始翻译项目之前,了解客户的具体要求是非常重要的。——这就是客户要求交付的质量。
  3. 工具和平台的兼容性:使用的翻译工具和目标平台可能会影响格式化标签的处理。有些工具可能能够轻松保留这些标签,而其他工具可能会导致问题。
如下图所示,我并不需要保留译文的格式(像有些公司确实是重新译后排版),那么翻译时就可以不保留译文的标签。这时导出的译文就会变成:
总之,理解并正确处理结构化和格式化标签是翻译过程中的关键步骤。
保留结构化标签以确保文档的逻辑完整性和可访问性,而格式化标签的处理则应灵活考虑源文档的性质、客户要求和工具的能力。
正确的标签管理不仅有助于保持源文档的原始意图和风格,而且还可以确保翻译后的文档具有专业的外观和功能。
在这个过程中,我们要通过与客户和项目团队紧密沟通,从而了解项目的具体需求和期望,也有助于确保对这些重要元素的正确处理。
(从总之后面,我是我请 GPT 写完后改了改,谢谢 GPT。)
好,说完了标签的重要意义。我们看,怎么处理。

二、如何处理原文中的标签?

前面讲了,标签有:
  • 要保留的,
  • 和不保留的。

2.1 翻译时,如何保留标签

其实前面讲过,对于要保留的标签,我们需要保证译文标签和原文标签一致,
  • 既要保证原文标签在译文中数量一致,如原文有几个标签,译文就要有几个标签;
  • 又要保证译文的标签对与原文一致,原文中的和要形成一对标签对。
从而保证译文和原文的格式和链接一致。
要保证译文标签和原文标签一致,可以进行如下操作:复制和插入标签。
详见:如何处理原文中的标签

2.1.1 复制标签

方法一:用快捷键复制标签。
你可以直接将原文标签进行复制,粘贴在译文标签所在位置处:
Step 1: 选中原文标签,按下Ctrl+C,或者右键选择复制;
Step 2: 把鼠标放在译文位置,按下Ctrl+V,或者右键选择粘贴。
方法二:复制下一个标签序列。
你也可以点击菜单栏”快速访问”或”编辑”中的”复制下一个标签序列”按钮,然后即可在译文句段处把标签对一组一组插入。在这个案例中:
  • 第一组标签序列是第一个标签;
  • 第二组标签序列是第二和第三个标签;
  • 第三组标签序列是最后一个标签;

2.1.2 插入标签

如果你不喜欢用键盘快捷键,你也可以使用”插入标签”,将标签按顺序插入在译文位置:
Step 1: 点击菜单栏”快速访问”或”编辑”中的”插入标签”按钮,然后即可在译文句段处看到有个标签的小标识。
Step 2: 然后就可以直接按顺序插入标签了。

2.1.3 删除标签

如果译文标签插入错误呢?我可以删除标签,再重新插入嘛对不对~
删除标签,你可以:
  • 直接删除即可;
  • 如果你点击了”插入标签”按钮,你还可以把鼠标放在要删除的标签上,即可在标签上出现如下图所示的按钮,点击该标签,即可删除。

2.1.4 如何判断标签是否在正确位置呢?

标签插入在正确位置后,你会在下方预览区看到插入后正确的格式。
如果标签位置不对,你也可以根据下方预览区做出判断。

2.2 如何处理不需要保留的标签?

如下图所示,如果我的原文导入后是这样的:
这样的 rpr 标签其实不需要保留。怎么处理呢?
对于不需要保留的标签,我有两个方案供参考:
(1)导入 memoQ 前,做译前处理:通过对源文档进行一些优化,减少一些不必要的标签和复杂性,比如Excel表格的清除格式;
(2)导入 memoQ ,借助 memoQ 进行译前处理:如果不想做译前处理,可以在memoQ中,通过查找替换删掉。这个要用正则了~。
我们逐个来看。

2.2.1 导入 memoQ 前,通过译前处理清除标签

其实如果做译前处理,有很多方法。
(1)对于 Excel 文档而言,我可以通过“清除格式”、“清除规则”、“格式刷”等方式,来进行译前处理。比如下图我就是通过“清除格式”+“清除所选单元格规则”,只处理了 D 列原文列的格式。
(2)对于 PPT 文档而言,我也可以借助一些插件。比如 TransTool 这样的工具。
如下图所示,我可以在 ① 加载项 中 -> ② 选择我的 Transtool -> ③ 根据需求选择哪些标签要清除 -> ④ clean tags。
清除完成后,我们发现格式发生了一些变化:
处理后的这个文档 -> 另存 -> 导入至 memoQ,肯定就减少了这些格式化标签呀~
另存另存!!!不要完全替换源文档!!!!永远要保留一份源文档!!!记住!!!
但,有时候,你可能没有这样的工具,或者,你嫌麻烦。所以,你还可以借助 memoQ 做译前处理。
这里还有两种情况:
  • 翻译开始前,
  • 翻译已经开始或者完成后。

2.2.2 翻译开始前,借助 memoQ 清除标签

如果还没开始翻译,那就简单了。既然不要格式,那就两部走:
  1. 快速将原文复制到译文 ->
  2. 一键清除全部标签。
具体操作为:
Step 1:Ctrl+Shift+A全选文档所有句段 -> Ctrl+Shift+S快速将原文复制到译文。
我已经很熟练了,所以我这个操作用了 2 秒。如果你不熟练,去学:快速将原文复制到译文
Step 2:Ctrl+F8一键清除所有标签。
”编辑“ -> 标签 -> 标签命令下面,也可以看到快捷键。
然后导出译文,那么导出的译文不就是等于是译前处理后的原文嘛~
我可真机智。
但,如果你更有经验,比如我,立马就会想到:
  • 即使没开始翻译,对于游戏和应用程序本地化而言的文档,如果原文列和译文列是一列,没问题。因为我译文直接替换原文列了。
  • 可,如果是多语言的 Excel,原文列译文列都不在同一列,怎么办?
  • 或者其他格式的文本的话,翻译已经开始了,已经有译文了,我肯定不能复制到译文呀,怎么办?
再来推荐两个方法。(其实我脑子里不止,不过我觉得这篇文档的思路,对你应该够了。)

2.2.3 翻译开始后或者翻译完成后,借助 memoQ 清除标签

在这里,我们可以借助memoQ的用正则表达式查找和替换原文标签的功能,来实现。
在正式操作前,一名专业的项目经理,一定要记得~什么来着~
——是的!风险管理!!!万一操作有问题,怎么还原~所以:
操作前风险管理:
Step 1:创建快照,这样即使误操作,可以还原。
  • 选中该文档 -> 统计/准备 -> 版本 -> 创建快照;
为该快照取个名字:
万一有问题,可以通过该版本还原:
Step 2:导出双语文档,同样留备份:
  • 选中该文档 -> 导出下拉菜单 -> 导出双语 -> 导出。
Step 3:线上项目需要签出处理:签出/打开本地副本即可。
做好准备后,就可以用正则表达式查找和替换原文标签。
具体操作为:
Step 1:开启替换原文的功能:在 ① “选项” -> ② “翻译” -> 开启 ③ “原文句段允许替换”的功能 -> ④ “确认” 即可。
详见:memoQ 中如何批量替换错误的原文内容?
Step 2:打开要处理的文档 -> 按两次Ctrl+F 打开“高级查找和替换功能” -> 勾选”使用正则表达式查找和替换“ -> 输入要查找的原文正则和译文正则 -> 替换全部。
关于正则查找替换,详见:正则篇(三):用正则在CAT中查找和替换
以替换rpr标签对为例。
第一次查找替换先处理rpr的开标签:
  • 查找
  • 替换:什么都不填,空。
第一次查找替换前:
第一次查找替换后:
第二次查找替换再处理rpr的关闭标签:
  • 查找*?>
  • 替换:什么都不填,空。
第二次查找替换前:
第二次查找替换后:
同理,你还可以处理其他格式标签。比如这里:fill-sd、font、size、strike、eff-*等;
你可以自己思考咯~

2.2.4 可能存在的问题:

1. 我怎么知道有哪些标签呢?
  • 随便找一个译文有标签的句子 -> 点击菜单栏“标签命令” -> 编辑行内标签
  • 即可在行内标签名称看到原文所有的标签名字。
如果译文为空,可以复制原文至译文,再执行后续操作即可;
2. 我怎么知道哪些标签可以删,哪些不能删呢?
需要 PM 或者负责处理源文档的小伙伴来认为判断。推荐尝试的方法是:
找几个涵盖对应标签的句子,译文删掉改标签,导出译文后,对照译文和原文查看是否会影响。
总之,方法总比困难多~

好啦,希望你上内容可以帮到你,有用可收藏~

 

特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。
– END –

 

转载来源:职业译员玩转翻译技术 

转载编辑:陈柯淼

Was it helpful ?

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注