本期课程主要内容包括:
- 术语技术与翻译实践
- 语料技术与翻译实践
- 术语库建设方法与应用
- 语料库建设方法与应用
- 语料库与术语库应用实训
首先,世界博士介绍了语料库建设与应用的完整流程,包括语料采集、语料加工和检索应用三个大的方面。在语料采集方面,世界博士主要介绍了自动化采集语料与人工采集语料,并分享了自动化采集语料的各种实用工具。在语料加工方面,世界博士主要从语料预处理、语料对齐、格式转换、分词赋码等方面进行了介绍并分享了对应的工具使用方法。在检索应用方面,世界博士主要介绍了语料技术与翻译实践、语料技术与翻译/语言研究。
01、语料采集
在语料采集方面,世界博士介绍了八爪鱼采集器、Teleport Ultra、TextForever、火车头采集器、Python等自动化语料采集工具以及人工采集语料的方法。
02、语料加工
03、语料检索应用
在语料技术与翻译实践方面,世界博士讲解并带领大家实操BFSU ParaConc、CUC_ParaConc、Search and Replace等自建语料库辅助翻译实践/词典编纂的工具。
世界博士以案例驱动的方式重点介绍并带领大家学习如何使用LancsBox,包括主题词索引(KWIC)、搭配图解(GraphColl)、词汇模块(Words)、检索词分布(Whelk)和N元结构(N-Grams)等内容。
本部分中,世界博士首先对术语库常见格式类型进行了讲解,包括CSV格式、XML格式、TBX格式、JSON文件等;并分享了术语库建设常见的两种路线。
- 路线1:术语提取/抽取(平台/工具)——SDL MultiTerm 2021 Desktop(创建术语库)——SDL MultiTerm 2021 Convert(转换术语文件xlxs——xml)——导入术语库;
-
路线2:Glossary Converter(一步到位)。
世界博士就上述两种常见方式演示了如何利用SDL MultiTerm 2021 Desktop、SDL Multiterm 2021 Convert、Glossary Converter等软件进行术语文件转换。