数字人文文化分析领域及大语言模型应用前景解析 ———马修·威尔肯斯博士访谈
马修·威尔肯斯 杨晓燕
摘 要
使用数字人文方法的文化分析,是将数学、统计学和社会科学的定量方法应用于大规模、复杂的社会和文化数据集分析的一类研究。文章是对该领域的活跃学者——康奈尔大学信息科学系副教授马修·威尔肯斯博士的采访,探讨内容包括领域现状、研究经验、未来展望、教育思想等。马修·威尔肯斯博士认为,数字人文文化分析的方法和技术具有可迁移性,但要避免普遍化和泛化的冲动,该领域仍然面临技术和观念两方面的挑战,尤其是观念上的,比如,文化进化等文学历史问题无法依靠细读解决、某些量化研究的内核仍然是人文主义等观点仍然难获接受。观念变革的艰难将使人文学科内部的数字人文研究出现停滞,目前已有迹象,而增长将出现在信息科学等技术学科中。与此同时,当前发展迅速的大语言模型和AI 生成内容(AIGC) 在文化分析领域有很大的应用潜力,人文学者与大语言模型的开发者合作将是一个重要趋势。
关键词
数字人文; 文化分析; 数字人文学者; 专业信息学; 大语言模型; AIGC
作者简介
马修·威尔肯斯(Matthew Wilkens),康奈尔大学信息学院信息科学系副教授; 杨晓燕(通讯作者),荷兰格罗宁根大学计算语言学博士研究生,Email:xiaoyan.yang@rug.nl。
虚拟博物馆:数字人文与博物馆学的交叉研究对象
伯纳黛特·伯德曼 高妍/ 译
摘 要
对于最近出现的一种建立虚拟博物馆的趋势,各种机构迅速做出了回应,这篇文章的目的是通过关注虚拟/数字博物馆的特点来了解其本质。文章从这样一个假设出发,即虚拟空间和/或虚拟博物馆中的博物馆表征可以扩展传统或实体博物馆空间,从而增强对访客的吸引力及其体验。因此,文章从博物馆学和数字人文的角度,将虚拟博物馆作为一个交叉学科和跨学科的研究对象,并试图确定其是否产生了学术和实践的影响;还分析了对实际博物馆工作和访客需求的预期影响,特别是相对于博物馆在危机时期需要完成的任务。
关键词
虚拟博物馆; 数字博物馆; 在线展览; 数字人文; 博物馆学
作者简介
伯纳黛特·伯德曼( Bernadette Biedermann),格拉茨大学博物馆副馆长、高级研究员,Email:bernadette.biedermann@uni-graz.at; 高妍(译者),中国人民大学哲学院美学专业研究生,Email: 2021104613@ruc.edu.cn。
数字人文时代古典文学文献辑佚路径的实验与思考
唐 宸 张 萍
摘 要
数字人文时代的古典文学文献辑佚对学者提出了两方面的要求。一是要延续传统辑佚学、目录学和版本学的经验,主动对接数字人文领域最新技术方法。在辑佚准备阶段,应结合目录学传统经验明确文献范围;在深挖拓展阶段,应利用GIS 和社会网络分析等数字人文手段获取更多线索;在录入校勘阶段,应长期关注辑佚对象,反复利用最新数据库和资料开展续辑和校勘;在辨伪定本阶段,应灵活运用传统“知人论世”法与数字化考据方法。二是要灵活运用各种数据库与工具。针对检索型数据库,需要预先设置关键词,并结合辑佚所得随时增补调整。在现有检索型数据库中,地方志数据库的辑佚潜力最大,值得加强利用;针对尚未全文化的影像型数据库,可自行编制专题性索引或建设题录数据库,从而为辑佚工作建立新的增长点。此外,一些习见常用的其他领域数据库如知网、读秀等,有时也能为辑佚工作提供意想不到的帮助。
关键词
数字人文; 辑佚学; GIS; 社会网络分析; 数据库
作者简介
唐宸,安徽大学文学院副教授,Email:tangchen@ahu.edu.cn; 张萍,安徽大学文学院学生。
基于关键词提取的文化遗产信息资源知识抽取方法
彭 博
摘 要
在文化遗产信息资源数量爆炸式增长的态势下,能否高效抽取非结构化数据构成的文化遗产信息资源中的知识,影响着是否能更有效传播和弘扬优秀传统文化。文章以文化遗产信息资源文本为研究对象,提出将其按来源分类,根据不同的知识分布特点选取针对性的关键词提取方法,获得关键词后在知识图谱中检索文化遗产实体与关系,完成知识抽取的路径。实验结果表明,研究所确立的分类关键词提取方法在多个阈值条件下较其他方法有较大提升,能够较好地抽取非结构化数据中的文化遗产知识。
关键词
知识抽取; 关键词提取; 文化遗产; TF-IDF; LDA
作者简介
彭博,华中科技大学建筑与城市规划学院工程师,pbresearch@sohu.com。
明钱榖《纪行图册》、张复《水程图》之大运河现地研究与GIS呈现(之二)
简锦松 廖泫铭 王 勇 张淑君 唐 宸 严 程 谢定纮
摘 要
钱榖《纪行图册》以王世贞隆庆四年(1570) 六月《适晋纪行》为蓝本,绘成仓山小祗园至扬州扬子桥三十二幅;张复《水程图》因王世贞于万历二年(1574)二月入领太仆之役,附舟而北,绘成邵伯至通州水程五十二幅。两卷皆以写实为之,在明人画中堪称独绝。文章以现地研究法进行三项处理:一、此次王世贞北行,正在隆庆新河既成,泇河之议方生的明代大运河变动期,文章将二人所经过之水程全部数字化;二、钱榖自言“维欲记其目前真境”,文章利用明清旅行日记、方志、古今地图及笔者现地考察所得,将各图逐一解说,指出图面所绘内容,验证画者写真实践的程度;三、此八十余幅之价值,如同发现一大箱明代的拍摄影带,文章发挥其自身的影像本色,形象化地指出明代大运河的真正面目。
关键词
数字人文; 明代大运河; 现地研究; 钱榖《纪行图册》; 张复《水程图》
作者简介
简锦松,台湾中山大学中文系特聘教授; 廖泫铭,台湾中研院人社中心研究副技师; 王勇,东莞理工学院中文系讲师; 张淑君,上海大学硕士,江西省农村信用社联合社; 唐宸,安徽大学文学院副教授; 严程,清华大学人文学院讲师; 谢定纮,台湾大学中文系博士研究生。
近世日本研究的数字化转向
周睿琪 管凡谊
摘 要
2022 年12 月2—4 日,“近世日本研究中的数字化转向”国际研讨会在剑桥大学举行。“近世日本”是目前日本数字人文研究中进展最为迅猛、成果最具代表性的领域之一,该次会议一定程度展示了日本数字人文研究现阶段的特征。OCR 技术、IIIF 框架、GIS 系统、数码高倍显微镜等数字技术、工具的应用,推进了近世日本研究基础问题如手写体文字识别与认读的研究,在美术、文学、出版文化、历史地理等领域都产生了优秀成果,并促进了资源开放共享和传统学术的焕新。与此同时,仍然有尚待解决的技术难题、数字资源适用性问题,以及研究环境、观念、伦理的挑战。该次会议所体现的一些取向对中国数字人文学界也有一定的启示,如重视门户网站建设、服务更广泛人群的意识等。
关键词
近世日本; 数字人文; 会议综述; OCR; IIIF; 门户网站; 数字人文教育
作者简介
周睿琪,香港城市大学中文及历史学系硕士研究生,中国人民大学数字人文研究院学生研究员; 管凡谊,东京大学人文社会研究科硕士研究生。
《数字人文研究》2023年第2期
版式|高歌
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。
– END –
转载来源:数字人文研究