以Sketch Engine为船遨游语料海洋(一)

Sketch Engine是一款基于云计算的强大的语言学习和文本分析工具,专为语言学家、语料库语言学家、译者和语言学习者而设计。其目标在于帮助用户轻松检索大量文本,并通过先进的语料库技术提取所需信息。官网地址https://www.sketchengine.eu/

作为如此一个得力的语言学习和语料处理助手,我们怎么能不了解一下呢!接下来,跟着小编一起小学习一下几个它的主要功能吧!

微信图片_20230817145255.png

01单词画像|Word Sketch

单词画像是从成千上万的使用实例中收集信息,提供相应的单词分类搭配,并附有实例链接。这一功能可以为用户提供非常详细的语境来展示某一词的使用和搭配,并且会附上它的出处。

具体操作:首先,我们要在图上红框中选择适合的语料库(本文以BNC语料库为例),之后在蓝框输入想要搜索的单词(如:environment),然后GO!就会出现搜索结果。

注意:所有搜索输入的必须是lemma(词目)。

微信图片_20230817145256.png

图片展示了部分汇总。可以看到,从左到右5栏分别汇总了与environment搭配的修饰词(computing等),以environment修饰的名词和动词(circular等),以environment为宾语的动词(protect等),以environment为主语的动词(influence等),environment后连接频率较高的词(development)。

 

02单词画像差异|Word Sketch Difference

单词画像差异是单词画像功能的扩展。它能为两个微信图片_20230817145256_1.png单词生成单词画像,并对它们进行比较,从而轻而易举地观察使用中的差异。也就是说,单词画像是从语料库中提取单词搭配及使用的情况,而单词画像差异则是对比两个词义相近的词的搭配使用,并呈现对比结果。

具体操作:在图上红框里输入你想对比的两个单词,继续GO就可以看到结果啦!

微信图片_20230817145256_2.png

微信图片_20230817145256_3.png

上图展示了部分汇总。绿色代表与great有关的项,红色代表与best有关的项。可以看出,上图三栏中,从左到右对比了greatbest连接的词(small/coach等),以greatbest为宾语的词(peter/set等),以及以greatbest为宾语的词(thank/fall等)。而且,该功能以颜色差异表示频率。如上图,越靠近蓝色,与great搭配频率越高;越靠近红色,则与best搭配频繁更高。

 

03 同义词库|THESAURUS

Sketch Engine中的同义词库是通过分析数十亿文本语料库的巧妙算法自动生成的。这意味着,在语料库足够大的前提下,可以为语料中的几乎任何单词生成同义词库。

具体操作:同样在图上红框里输入你想查找的单词,然后GO就出结果啦!

微信图片_20230817145256_4.png

微信图片_20230817145257.png

这里以单词“gain”为例搜索,可以发现很多与“gain”相关的词语。但是相信你也发现了,图上并不是所有词都是“gain”的同义词,例如图中的“lose”。所以要提醒大家,这里的同义词并不是狭义上的同义词(近义词),而是意义相似的词以及可能出现在相似语境下的词。

举个例子,狭义上的同义词,也就是近义词,可以是significantimportant;而这里的同义词可能是指teacoffee

本期小编介绍了Sketch Engine主要功能的其中三个,其余主要功能介绍请关注我们的后续更新噢!

想要了解更多的话请大家移步官方教程网址,文末已附上供大家参考学习:https://www.sketchengine.eu/quick-start-guide/choose-corpus-lesson/

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

– END –

翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!

原文作者:张一孟

推文编辑:侯亦君

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注