基于SCI论文语料库的中医涉新冠疫情术语调查及英译分析

术语翻译
01
关于文章
原文标题 | 基于SCI论文语料库的中医涉新冠疫情术语调查及英译分析
原文刊登 | 《中国科技术语》2023年第3期
基金项目 | 2022年广东省本科高校教学质量与教学改革工程建设项目“数据驱动学习在高阶《医学英语》教学中的探索与实践”(粤教高函【2023】4号);广东省哲学社会科学“十三五”规划2020年度学科共建项目“粤港澳大湾区中医文化外译与疫后传播研究:基于健康医学的文化互联”(GD20XWY15);广东省哲学社会科学“十三五”规划 2020 年度学科共建项目“19世纪来华传教士中医译介活动及其影响研究”(GD20XWY20)
02
内容摘要
本研究建立了涵盖3007篇关于新冠感染SCI论文摘要的语料库,通过自然语言处理工具Sketch Engine,根据词目、词汇密度及词汇覆盖率等多维量化指标,找出中医SCI语料库区别于西医SCI语料库的高频术语并进行词汇特点和英译分析,从受众角度考量海外读者在理解相关中医学术译文方面是否存在问题,存在什么问题,以及如何在未来的中医英译实践中改进这些问题,以进一步提升中医海外传播的实效性。
00
引言
中医药文化是中华文化的优秀代表,进一步推进“一带一路”走出去倡议,迫切需要带动中医药海外创新发展,截至“十三五”期间,中医药已传播至196个国家和地区,国际上建立了至少1000 多个中医药机构和民间学术组织,学术交流活动日益频繁。2020年1月30日起,随着世界卫生组织宣告新冠疫情上升为国际事件,中医药海外传播的重要性上升到全新的历史高度。疫情传播至 200 多个国家和地区,多国一度寻求中国的帮助,希望中国分享抗疫经验。临床证据表明,在疫苗投入使用之前,中医药在预防、治疗和康复等环节中发挥了重要作用。这些宝贵的经验及成果存在巨大的国际学术交流需求与价值。
翻译是对外传播的基本途径,也是国家对外宣传的必要手段。而翻译的实效如何,海外读者能否正确理解和接受,直接决定中医科学在海外传播的广度与深度。只有传播信息到达受众并被受众接受,传播才有效果和意义离开读者,任何文本都无实际意义可言,更谈不上文本的接受和效应因此,研究中医英译语料库的受众考量,具有重要时代意义。
01
文献综述与研究设计
 
文献调查显示,目前国内中医翻译领域的研究存在以下特点与不足:研究内容的主要载体是中医典籍英译文本;研究语料主要来自《黄帝内经》和《伤寒杂病论》两部典籍;研究主题侧重翻译技巧(占比75.75%),仅少数研究对医学英语翻译进行了错误分析(占比6.06%);研究对象涉及语料库的研究仅占1.23%;双语平行语料库建设研究匮乏。此外,受众角度分析中医翻译实效性的研究不多,有学者从全球图书馆馆藏量、被引频次、海外读者评论等维度调查中医典籍的海外接受现状,发现“中医药典籍的国内译本在海外的接受现状不容乐观”,另有学者进行了中医药对外传播的受众研究,亦得出“中医药走出国门提升了中国的国际影响力,但‘走出去’的程度仍不尽彻底”等相似的宏观结论。因此,本研究拟结合文本与读者的紧密关系,以当下具有代表性和权威性的中医抗新冠疫情SCI论文摘要语料库为载体,以提高中医对外传播的受众效果为目的,及时找出目前中医英译实践中的迫切问题并提出具体的改进措施。
词汇是语言产出的基本驱动单位。词汇量越大,语言输出效果越好。大数据表明,随着文本长度和难度的增加,词汇量是不断增长的,然而当词汇量到达4000左右的时候,核心词汇量的变化就不大了。因此,从文本分析角度研究翻译的实效性,只要探讨核心词汇的翻译基准即可。
语言学史上出现过两个关于词汇的基本单位,分别是词族(word family,包括头词及其屈折形式和派生变化)与词目(lemma,仅包括头词及其屈折形式)。基于语义在翻译研究中的重要地位,本研究以词目为基准。词汇密度是语义的重要体现,词汇密度即文本中实词所占的比例,实词指所有携带意义的单词。 
关于核心词汇的确定,本研究遵循词频为先、词汇覆盖率为主的原则。词频即词目在语料库中出现的频率,分为绝对频率和相对频率。相对频率也叫平均降频(average reduced frequency,ARF),计算词目在语料库不同文本中平均出现的频率,比绝对频率更能体现词目在语料库中的价值。词汇覆盖率指“一组代表语料库的基于频率的单词列表覆盖文本所有单词的比率”。当词汇覆盖率到达95%/98%时,读者才能基本/充分理解目标文本。
02
研究方法
2.1 检索方法及纳排标准

在三大英文数据库PubMed、EMBASE、Web of Science中检索主题为“Chinese medicine”和“covid19”的文献,起止时间为建库至2022年4月30日。排除重复文献后设置语种为英语,中国作者(第一作者名字为拼音)共发表文献1007篇,选其摘要文本(共包含238 946英文字数)作为研究文本。另外在Web of Science中, 检索主题词为“covid19”,设定作者为英美作者(来自Harvard University/London University),选出前2000篇热点核心论文(共包含741 486英文字数)的摘要,作为参照文本。

 

2.2 数据提取及分析
应用Sketch Engine数据分析工具对以上摘要语料库的研究文本和参照文本进行交叉对比分析,“摘要是对一篇论文的精练总结,与主题相关性最强,涵盖了一篇论文最核心的词汇,选择摘要库作为聚焦语料库可使检索出的备选词目更具相关性,减少人工筛选的工作量”。
通过Sketch Engine 的关键词(Keywords)功能对研究文本和参照文本进行交叉对比,将“focus on”设置为保持系统默认值1,即检索的词将聚焦在参照文本中罕有或几乎不使用的词汇,该设置一般用于术语提取,这里用于提取研究文本中的高频但同时却是参照文本中完全不使用或罕见的术语级词汇进行系统分析;按照98%词汇覆盖率设定最低频率为5,单词术语以词目(lemma)形式显示。
接下来,对从以上操作获得的3229条词目进行逐一人工检查,包括但不限于排除语料库工具自动识别产生的少量错误和无关词汇,如地名(China, Wuhan等);合并多词表达中部分因短语分割等错误形成的词目,如Artemisia和annua两个词目合并为“青蒿素”同一含义;归类近义词的不同英译,如麻黄有ephedra、Ephedra sinica、ephedrae等不同词目。不确定词目通过Sketch Engine 检索结果页面的索引行,查看词目在研究文本中的上下文,并通过检索参照文本的相关词目上下文进行对比分析。
03
结果与讨论
3.1 中医抗新冠疫情SCI论文摘要高频术语的词汇特征
通过上述研究,可以发现(见表1),新冠感染主题下研究文本的词汇密度即实词所占比例(48.89%)比参照文本的词汇密度(44%)高4.89%,尤其是前者的词目、名词、形容词密度(4.96%、3.06%、1.10%),均明显高于后者(1.85%、1.06%、0.53%)。虽然早期研究认为,当词汇覆盖率达到 95%时,读者对文本的理解可以得到显著提高,但若要显著提高对学术文本的理解,词汇覆盖率需要达到98%词汇覆盖率指的是所有单词的比率,而研究文本仅在实词词目覆盖率方面就比参照文本高了4.89%,若算上虚词及同一个词目的屈折和派生变化,这个数字至少要高几倍。这个结果意味着,尽管是具有丰富的同主题背景知识的目标读者,亦面临词汇覆盖率不足的困境,难以完全理解研究文本中的中医学术内容。国外有学者认为,因为中医某些内容无法被西方理解,因此不被认同理解是传播的基础,要进行有意义的中医国际传播,则有必要对这些影响目标读者充分理解中医学术文本的高频词目进行定性分析,通过分析这些词目的英译特点及问题, 进一步提高中医学术文本的翻译质量,从而提升中医的海外影响力。

 

3.2 中医抗新冠疫情SCI论文摘要高频术语的英译特征

研究发现,纳入词目中占比最多的是中成药名、中药方名,共占26%。在对以上名称进行英译时,大部分译者(68.57%)采取了音译+意译的方式。
译者把中成药名分为:(1)药物通用名称部分,用拼音进行音译;(2)剂型部分,通过描述药物用途或制剂性状,进行意译。如喜炎平注射液(Xiyanping Injection),玉屏风散(Yupingfeng Powder),疏风解毒胶囊(Shufeng Jiedu Capsule),逍遥丸(Xiaoyao pills),复方银花解毒颗粒(Fufang-Yinhua-Jiedu Granules)。中药剂型词汇的高频英译(按ARF高低排序)见表2。

在翻译中药方名时,亦是首先音译方名,然后用意译来描述中医术语“方”的内涵,如化湿败毒方译作Huashi Baidu Formula/Recipe等。在中医英译实践中采用音译+意译来翻译中成药名与中药方名,有利于推进中医药的全球化发展。“比照西医、求同存异”,牛喘月教授提出了这一中医翻译原则参考西医医药体系,药物包括:(1)通用名称“generic name”,为药物的化学名称;(2)商品名称“brand name”,为厂商的注册商标名称目前我国对西药通用名称的翻译广泛使用音译,如阿司匹林(aspirin),布洛芬(ibuprofen),阿奇霉素(azythromycin)等。音译药物的通用名称能快速实现药品名称的规范统一,杜绝出现同一种药物多种译名的混乱现象。因此将连花清瘟这个通用名称进行音译,具有较好的“回译性”, 便于中医药的国际传播与交流;将中医特有的中药剂型进行意译,有利于促进中医药文化的推广与传播。

3.3 中医抗新冠疫情SCI论文摘要高频术语的英译问题
然而,研究文本中仍然存在“长期以来影响中医翻译健康发展的用词不统一”问题,不利于中医用语英译的国际标准化发展,亦影响中医学术的传播质量。
首先存在的英译问题为用词不统一。如舌苔的英译有coating(ARF=4.06, F=24)和fur(ARF=2.33, F=10)。中医术语“方”的英译亦出现了分化(见表3)。
其中formula词族中的屈折变化有两个,分别是formulas(33.33%, 52/156)和formulae(19.87%, 31/156)。按照医学英语名词性后缀的相应规律,以-a结尾的单词复数应为-ae,但实践中也常写作不规范的formulas。Formulation是formula的派生变化,两者区别犹如urination(排尿)和urine(尿液),前者指过程,后者指成品。
根据《传统医学名词术语国际标准》《中医基本名词术语中英对照国际标准》,“方剂”这一中医术语的标准英译应为formula,prescription和recipe均为该术语定义的解释/描述两个标准均未出现formulae这个复数形式。根据韦氏字典,formula的涵盖范围更广,既有prescription的意思,也有recipe之意,从字典给出的例句还可看出,formula比recipe更具科学性,如奶粉配方milk formula,菜谱则为recipe。
研究数据亦表明,统一用formula翻译“方剂”这一术语是大势所趋。表3显示formula词族的绝对频率值与平均降频率值均远大于其他词汇。进一步分析发现,文本中以上词汇出现的上下文还出现以下规律:用于翻译某种特定的中成药方、中药成方或名方的时候,如连花清瘟方、化湿败毒方等,formula(F=45)的频率远远高于prescription(F=3)、recipe(F=2)或formulation(F=1)。而在表达方剂总称的时候,formula和prescription经常替换使用,如TCM formulae/prescription,herbal formulae/prescriptions等。
第二个英译问题为音译不统一。研究发现,当音译的中文字数大于等于4时,音译出现分化。如连花清瘟的音译有Lianhua Qingwen(71次),Lianhuaqingwen(17次),LianhuaQingwen,Lian Hua Qing Wen,Lianhua-Qingwen,LHQW,LH,LQ,LQC。当音译的中文数量小于4时,音译都能实现基本统一,如血必净注射液(Xuebijing injection),逍遥丸(Xiaoyao Pills)等。中医名词英译应遵循唯一标准,无论音译的源语数量出现任何变化,标准都不能变。若要统一标准,这里应该用Lianhuaqingwen(LHQW)。和Lianhua Qingwen相比,同是拼音,对于目标读者来说都是生词,无非是一个生词和两个生词的区别,缩略语四个字母可提高药名的辨识度,并且可以对其全称进行音节区分,因此是较为合理的选择,同时也是目前中医翻译实践中需做较大改进的地方。
第三方面,研究中还发现存在少量误译现象,包括高频术语的误译(见表4)。
首先,中药剂型(汤剂、颗粒、胶囊)的完全音译会使目标读者无法通过拼音认识到中药炮制的先进工艺,不利于中医药的国际传播。Nigel Wiseman指出用greasy来翻译腻(苔)是错误的,“greasy 是油脂、油滑的意思,slimy 才正确”最后,汤剂译作soup、连花清瘟译成lotus clearing plague等,均不利于中医知识的正确传播。连花指的是连翘、金银花,而不是莲花(lotus)。汤剂的标准译名应为decoction,该词的ARF为70.03,而tang的ARF仅10.11,说明在中医药的对外传播过程中,剂型术语的英译较为接近规范化、统一化的目标。而中药名的英译则译法较多,有学者调查国内外《方剂学》教材中出现的英译方剂名称发现,国内的翻译注重方剂内涵(意译),但回译性差;国外的翻译则侧重方名的字面意义(直译),出现很多语义偏离现象,而本研究对象中连花清瘟的翻译则是大部分(92.86%)采用音译,其中Lianhua Qingwen占比72.45%,回译性强,且容易实现用词统一。
04
结语
本文从语料库语言学视角出发,运用自然语言处理技术,构建了同一主题下中医学术英语和西医学术英语语料库进行交叉对比的语料库,总结当前新冠疫情背景下中医学术传播实践中的不同高频术语英译版本,分析其词汇和英译特点,并提出问题与相应的改进措施,以促进中医学术传播的实效。
李照国教授呼吁,“用词不统一,解释不一致等弊端到了非解决不可的时候了”本研究进一步用语料库数据说明,“用词不统一”不仅阻碍英译中医用语在国外的标准化发展,还会影响目标读者对中医学术的充分理解,影响中医在海外的传播质量。
参考文献
作者简介
丘晓媛(1983—),硕士,广州中医药大学讲师,研究方向为中医翻译与传播、医学英语教学。主持省部级项目1项,主编教材2本,发表期刊论文4 篇。
通信方式:
summersnow@gzucm.edu.cn
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。
– END –
转载来源:中国科技术语
转载编辑:馨月

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注