本文将分享第五章第一节 单语语料库中,语料库检索工具Sketch Engine其系统功能以及其如何应用。希望能够对大家有所帮助。它们分别是:
(二)案例演示
1)如何使用Word Sketch?
2)如何进行单词辨析?
3)如何查找同义词?
4)如何创建新的语料库?
5)如何提取语料库的关键词和术语?
目前该书可在各大购物平台购买,也可在微信阅读上免费阅读,欢迎大家一起阅读学习!
语料库检索工具Sketch Engine能够基于大量的真实文本,根据语法成分自动提取词语的搭配规律,识别罕见或新兴的用法。Sketch Engine支持单词概览、单词辨析、单词搭配、同义词查找、语料索引、建立语料库等丰富的核心功能,被应用于词典编撰、语言教育和翻译研究等多领域。另外,该工具也能基于网络资源或本地文档,自建特色语料库,提取单词表。首先,以默认选择BNC语料库为例,该工具的操作面板如图6-1所示。
Linggle的基图6-1 Sketch Engine的操作面板础界面
(1)操作面板中选中”Word Sketch”,在”Basic”选项页面上直接输入想要查找的单词,也可以通过”Advanced”界面进一步限制所搜内容的词性(Part of speech)、出现的最低频率(Minimum frequency)、文本的来源类型(Text types)等,如图6-2所示。
图6-2 Sketch Engine中”Word Sketch”的输入界面(高级功能)
(2)以在”Basic”下检索”cooperate”为例。检索后页面上出现该单词的概览,包括其常搭配的修饰词、宾语、主语等,如图6-3所示。
图6-3 Sketch Engine中”cooperate”的单词概览
(3)点击某一选项卡右上角第一个图标,可显示该部分搭配在上下文中的语境。点击某一搭配的右方选项,也可显示来源语料,如图6-4和图6-5所示。
图6-4 Sketch Engine中查看语境的图标
图6-5 在Sketch Engine中查看”cooperate”的上下文语料
(1)操作面板中点击”Word Sketch Difference”,输入两个需要辨析的单词,以”collaborate”和“cooperate”为例,检索面板如图6-6所示。 图6-6 Sketch Engine中”Word Sketch Difference”的检索界面
(2)检索后,如图6-7所示,界面以同义词、主语、谓语、修饰词等分类比较两者不同的搭配习惯。两个单词分别代表绿色和红色,颜色从中间由浅到深两极分化,颜色越深则表示该搭配越常见。通过基于实际语料的单词辨析,用户可以反思自己的用法误区,让写作表达更地道。 图6-7 Sketch Engine中”cooperate”和”collaborate”的辨析结果
操作面板中点击”Thesaurus”,输入想要检索的单词或词根。以检索”acquire”为例,检索结果以词频降序排列,如图6-8和6-9所示。 图6-8 Sketch Engine中“Thesaurus”的图标
图6-9 在Sketch Engine中检索”acquire”同义词的结果
Sketch Engine能基于网络资源或本地文档,自建新的语料库。该功能入口如图6-10所示。 (1)点击“NEW CORPUS”新建语料库后,设置新语料库的属性,包括命名、选择“Single Language Corpus”或“Multilingual Corpus”为单语或双语语料库,选择源语言,或对该语料库进行必要的说明。现以创建与Audiovisual Translation(视听翻译)有关的单语语料库为例,如图6-11所示。
图6-11 在Sketch Engine中设置新建语料库的属性 图6-12 在Sketch Engine中为新建语料库添加文本 (3)若基于网络资源获取文本,用户可以选择输入类型,包括“Web search”(网络主题搜索)、“URLs”(网页内容搜索)、”Website”(全网站搜索)。“Web search”指输入3至20个与主题相关的词或词组,该工具会随机组合3个词为单位,放到Bing引擎内搜索,将相关文本纳入语料库;“URLs”指输入一个或多个网址,网页内容纳入语料库;“Website”指输入某个网站(可带具体分支),其下所有内容(不多于2000个网页)纳入语料库。用户能展开选项卡,进一步限制搜索范围。现以选择“Web search”为例,如图6-13所示。 图6-13 在Sketch Engine中为新建语料库设置网络文本相关属性
(4)该工具会筛选出相关网页,供用户进一步选择文本来源,如图6-14所示。 图6-14 在Sketch Engine中为新建语料库筛选网络文本来源 (5)文本加载完成后,用户可以进一步点击左下“Extract Keywords& Terms”,提取新语料库中的关键词和术语,如图6-15所示。 图6-15 Sketch Engine中新建语料库的文本加载完成界面 (1)以第四点新建的语料库“Audiovisual Translation”为例,点击提取关键词和术语后,结果如图6-16所示。 图6-16 在Sketch Engine中提取语料库关键词和术语的结果
(2)点击右上角下载按钮,可以将提取结果导出为cvs, xls, xml格式,或将该界面导出为pdf格式,如图6-17所示。 图6-56 在Sketch Engine中导出语料库关键词和术语的提取结果
以上就是本文的全部内容,欢迎大家阅读原书,共同学习!
– END –
翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!
原文作者:李伟泽
推文编辑:李舒蓉