PDF中的术语转换

其他推荐

新时代·新技术·新译者 | 山西大学·博硕星睿《翻译技术》校企共建课程掠影

2025年9月1日

当译者的笔被算法握住——翻译技术伦理的“十诫”与全球治理的新篇章

2025年9月1日

到2035年还会有多少译员？（文末领取英文报告）

2025年9月1日

人工智能赋能基础教育应用蓝皮书

2025年9月1日

【全年班·开学礼】最后一天：翻译技术全年班开学特惠！直降1000元，翻译新手也能成大神

2025年9月1日

明德大学宣布将逐步停招部分蒙特雷研究生项目

2025年9月1日

翻译产品说明书时，需要注意哪些细节？

2025年9月1日

翻译小白闯译界（三）：游戏本地化探险——以《DOTA2》为例

2025年9月1日

Zoom公司称 AI 翻译模型可以通过实时学习变得更强大

2025年9月1日

2025年翻译技术秋季开学打卡活动 | 免费名额有限，先到先得！

2025年9月1日

Luna
6 11 月, 2023
8:17 下午

PDF中的术语转换

1.1 案例描述

描述翻译中常见的情景，需要利用高效的技术与工具解决翻译实践中常见的术语问题。

例: 如何去除图 1-1 中高亮部分，仅保留三语对照术语并将 PDF 中的术语对照表转化为相对应的可编辑的 Excel 表格形式

图1-1 PDF术语表（案例）

1.2 解决步骤

1.2.1 使用工具

使用 ABBYY FineReader PDF 进行内容筛选及格式转化

这里使用的是 ABBYY FineReader PDF for Mac 试用版，使用 Windows 系统电脑的同学可以下载 ABBYY FineReader PDF for Win

下载地址：https://www.abbyychina.com/xiazai.html

1.2.2 具体步骤

（1）

打开软件，在首页上传文档中的文档语言，避免出现乱码等情况

图1-2 ABBYY FineReader PDF for Mac 新建任务页面

（2）

点击文档语言菜单栏，可以直接输入要选择的语言，不用下滑找选项浪费时间

图1-3 选择目标识别语言

（3）

选择转化为 EXCEL 电子表格

图1-4 选择转化格式

（4）

选择需要打开的文件

图1-5 选择目标文件

也可以在主页面左上角选择添加页面（见图 1-6），点击导入图像上传需要转换的 PDF 文件（虽然选项叫做导入图像，但可以上传各种格式的文件）

图1-6 添加页面

（5）

识别文档

软件可以根据 PDF 文档内容自动识别文档

图1-7 识别文档

（6）

管理文档页面

打开页面后在左侧任务栏鼠标右键点击可以管理文档页面

图1-8 管理文档

其中分析文本选项可以使 ABBYY FineReader PDF 分析文档结构，标记包含文本、图像和表格的区域。每个将每个区域都用特定的颜色突出显示。本案例中主要涉及表格格式，其他情况可见图 1-9。

图1-9

ABBYY FineReader 使用以下区域类型标记文档：

文本（以绿色突出显示）
此区域的内容将识别为文本。
图片（以红色突出显示）
不会识别此区域的内容，而是在结果文档中按它们的原始状态重新创建。
表格（以蓝色突出显示）
在识别此区域的内容时会考虑到表格的结构。
背景图片（以棕色突出显示）
不会识别此区域的内容，而是在结果文档中将它们重新创建为背景。

可以看到在案例中，软件自动将上传的 PDF 文档识别为文本（绿色）和表格（紫色）

图1-10 案例中的区域识别结果

鼠标右键选择更改区域类型可以将选中区域更改为其他类型，如从文本区域更改为表格区域（见图 1-11）

图1-11

（7）

编辑筛选需要导出为 Excel 表格的内容，删除不需要的内容

点击删除区域选项，则页眉“北京冬奥组委对外联络部”文本不在 OCR 识别与导出范围内，文档页脚处的页码使用同样的处理方式（见图 1-12，图 1-13）

图1-12 如何删除区域

图1-13 删除后页面

（8）

下面来去除图 1-14 红圈内不需要的内容，在左侧工具栏选择绘制识别区域（见图 1-15）

图1-14 如何去除红圈内不需要的内容

图1-15 点击绘制识别区域

（9）

拖动上边界至想要保留的部分（见图 1-16）

图1-16 拖动上边界

编辑后页面如图 1-17，图 1-18 所示，只保留了三语术语对照部分

图1-17 编辑后页面（1）

图1-18 编辑后页面（2）

（10）

点击主页面上方导出

图1-19 导出

（11）

选择需要转化为的格式及其他所需选项，点击下一步

图1-20 转化格式选项页

（12）

保存设置选择为所有页面创建一个文档

图1-21

（13）

导出结果如图 1-22

图1-22 excel中导出结果

（14）

此时发现图 1-22 的表格中存在空白行，可以使用 Excel 批量去除空白行。F5 键打开定位窗口，选择定位条件

图1-23 定位条件页

（15）

点击空值，确定

图1-24 定位条件选项

（16）

Excel 会将空白部分自动标灰并选中

图1-25 选择定位后Excel表格自动标灰

（17）

鼠标右键选择删除整行

图1-26 删除空行

（18）

最终成果

图1-27 Excel中的最终成果

特别说明：本文仅供学习交流，如有不妥欢迎后台联系小编。

– END –

原创来源：北外CAT课程展示-章瑶

推文编辑：李丹

Was it helpful ?

还有问题？我们能帮忙吗？