(1)打开 GetDict.exe,导入【葡语词典.mdx】词典文件,将词典转出为 TXT 文件
(2)使用 EditPad Pro 编辑器打开刚导出的 TXT 文件,观察内容结构,查找替换去除冗余代码
图2 EditPad Pro编辑
(3)将提取的中葡双语粘贴到 Excel 表格中,表头分别设置为 zh-CN 和 pt-PT
图3 导出的中葡对照表
对更加复杂的词典文件,采用同样方法将提取的中英双语粘贴到 Excel 表格中,结果如图所示,仅能将英文部分分列出来,尚无法将其词性、音标、释义、例句等项分列。
对于这种情况,我们可以使用AI来剔除冗余信息,首先选取部分词条,转为txt文件,因为大部分AI不接受excel插件
图7 TXT文件格式
将该文件输入Claude2-100k,并提出明确指令,分列中文、英文、词性信息,形成excel,即可得到如下所示结果。
-
案例不要存在知识产权问题 -
案例不要出现敏感话题
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
– END –
原创来源:北外CAT课程展示-周昱龙 陈嘉铭
推文编辑:李丹