刘世界:6节语料库专题课,从入门到精通

AIGC时代人工智能蓬勃发展,为语料库研究注入了新的动力,语料库建设与应用成为当前学界关注的热点话题。

本次专题课将采用讲师讲解案例驱动实践操作相结合的方式,全面介绍语料库的核心概念、基础知识与研究方法,探讨语料库完整的建设流程,以案例驱动的方式引导学员学习语料库分析工具的应用

同时探索基于编程的语料数据应用,帮助学员在实践中掌握如何利用编程技术进行语料数据的复杂处理和多元分析,旨在辅助高校外语师生掌握语料库建设与研究方法、技术及理念,更加深入地借助语料库开展语言数据驱动的相关研究。

 

1.授课主题

 AIGC时代的语料库建设与应用专题课程:基础与进阶

 

2.招生对象

  • 翻译学/语言学相关专业的师生
  • 采纳语料库驱动范式的研究者
  • 从事语料文本挖掘相关研究者

 

3.课程安排

(1)第一讲:语料库核心概念与基础知识

  • 语料库的定义、作用与分类

  • 语料库相关概念梳理与辨析

  • 语料数据加工处理基本流程

  • 语料库应用与研究常用工具

(2)第二讲:语料库建设流程与实操演示

  • 语料的采集与清洗

  • 语料的对齐与转换

  • 常用标注工具实操

  • 常用检索工具实操

(3)第三讲:案例驱动的语料库分析工具应用(一)

  • 案例驱动的AntConc应用与实操

  • 案例驱动的WordSmith Tools应用与实操

  • 案例驱动的LancsBox应用与实操

  • 案例驱动的Sketch Engine应用与实操

(4)第四讲:案例驱动的语料库分析工具应用(二)

  • 案例驱动的Wmatrix应用与实操

  • 案例驱动的Coh-Metrix应用与实操

  • 案例驱动的COCA应用与实操

  • 案例驱动的BNC应用与实操

(5)第五讲:基于编程的语料数据应用探索与实践(一)

  • ChatGPT辅助Python编程入门

  • 编程辅助下的语料预处理实操

  • 词频统计与关键词提取

  • 词汇密度/复杂度计算

  • 语料数据视图化方法

(6)第六讲:基于编程的语料数据应用探索与实践(二)

  • 词向量训练

  • 文本分类与情感分析

  • 信息抽取与命名实体识别

  • LDA(Latent Dirichlet Allocation)主题建模

  • 文本聚类分析

 

4.专题课程收获

  • 全面梳理语料库核心概念与基础知识
  • 轻松掌握语料库建设流程与重要工具
  • 熟练运用语料分析工具解决实际问题
  • 探索编程辅助的语料数据处理及分析

5.授课讲师

刘世界

上海海事大学外国语学院工学博士在读,《翻译搜索指南》副主编,在《外语教学》《上海翻译》《外语电化教学》《外语教学理论与实践》《北京第二外国语学院学报》《中国科技术语》及The Interpreter and Translator Trainer(SSCI,A&HCI)等期刊发表论文10余篇,参与国家级、省部级科研项目多项,主持在研项目1项(上海海事大学2022年研究生拔尖创新人才培养项目),拥有计算机软著2项(含上海海事大学海事英语辞典检索平台),获得美国项目管理协会(PMI)项目管理专业人士(PMP)资格认证。研究方向:海事术语抽取与文本挖掘、翻译技术。

 

6.授课时间

小班教学,欲购从速,满20人即开课(报名截止日期:8月25日

 

7.课程定价

【全价】1199元/人

【限时早鸟价】2023年8月14日前报名,959元/人(8折)

【团报优惠】3人组团报名,839元/人(7折);5人组团报名,719元/人(6.5折)

【老学员专属优惠】839元/人(7折)

【学生优惠】全国高校在校生凭学生证享5折优惠,即600元/人

【VIP会员限时优惠】

7月28日起,首次购买VIP学习荟会员,本次工作坊600元购;VIP学习荟老学员专享优惠价:719元

8.报名渠道

报名链接:https://ulruj.xet.tech/s/2zang8

9.报名咨询

咨询链接:https://xeaje.xet.tech/s/14NbYB

 
-END-
编辑:Amelia

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注