当前,以机器翻译为代表的翻译技术深刻改变着传统行业的翻译模式和流程,在翻译实践中发挥的重要作用日益凸显。随着新一代预训练模型技术的发展与应用,机器翻译事业发展蓝图愿景悄然升级。
党的二十大报告着力强调,“必须坚持科技是第一生产力”“创新是第一动力”,要深入实施“创新驱动发展战略”,“开辟发展新领域新赛道,不断塑造发展新动能新优势”。新时代新征程新使命,机器翻译技术迎来全新的发展机遇期。为进一步推动语言服务行业和产业各方对机器翻译技术的研究应用,为机器翻译技术产业化发展提供更加全面、系统、科学的理论支持,百度翻译和中国外文局翻译院智能翻译实验室经充分调研,联合编写了《2023机器翻译技术及产业应用蓝皮书》(以下简称“《蓝皮书》”)。《蓝皮书》在2023中国翻译协会年会“未来已来:翻译技术主题论坛”上,由中国外文局翻译院、中国翻译协会翻译技术委员会、百度翻译联合发布。
《2023机器翻译技术及产业应用蓝皮书》️️️️️️️️️️️️️️️️️️️️️️️️️️
《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。
《蓝皮书》共分五章:第一章阐述了在国际传播能力建设及国家翻译能力建设中,使用以机器翻译为代表的翻译技术的必要性。习近平总书记多次在国际国内重要场合讲述翻译故事,充分肯定翻译工作对中国走向世界、世界读懂中国的积极贡献。机器翻译等翻译技术的发展对翻译行业起到了巨大推动作用,在许多场景应用中表现出强大能力和发展潜力。翻译行业各方应积极探索和推进人工智能、大数据、虚拟现实等技术在习近平新时代中国特色社会主义思想对外宣介、对外翻译出版中的应用。
第二章系统介绍了机器翻译的发展历程、发展态势及面临的挑战。自1947年机器翻译的设想被提出以来,出现了基于规则的机器翻译、统计机器翻译及神经网络机器翻译三种机器翻译方式。目前,神经网络机器翻译是主流的机器翻译方式。受技术革新与社会发展等诸多因素影响,机器翻译逐渐呈现规模化、多领域化、多语言化及跨模态化的趋势,其应用场景不断扩大。在现阶段,机器翻译技术在译文质量、鲁棒性和容错能力、低资源语种翻译能力、多模态融合技术能力及标准建设等五方面仍需继续加强。
第三章介绍了产业级机器翻译系统和产品形式。产业级机器翻译系统通常具有多领域、多语言、跨模态的全面翻译能力、基于飞轮效应的持续进化能力、核心技术自主研发能力及全生命周期安全保障能力等技术特征。在形成成熟的产品和应用前,面向产业的机器翻译系统应经过模型训练、部署发布等环节,同时应始终保证数据和系统安全。机器翻译产品有三种划分方式,即按照模态划分、按照载体划分及按照系统部署划分。按照模态划分,主要有文本翻译、语音翻译、图像翻译等;按照载体划分,主要有电脑端、移动端以及多种形式的智能硬件产品;按照系统部署划分,主要有在线部署和离线部署。
第四章通过实际应用案例展示了现阶段机器翻译产业现状。目前,机器翻译的产业应用呈现出高质量、多语言、跨模态、定制化等特点。《蓝皮书》通过列举机构与企业使用机器翻译的实例,阐述了机器翻译在赋能企业全球化发展、助力行业数字化建设、助力中华文化“走出去”及赋能跨语言国际交流等方面发挥的积极作用。
第五章展望机器翻译的发展趋势,并对机器翻译未来发展提出建议。在新技术发展浪潮下,机器翻译将在跨语言理解及生成能力提升、低资源语言翻译能力加强、机器翻译系统的灵活性及智能交互能力提升以及机器翻译应用场景和领域拓展等方面取得新突破。为推动机器翻译产业良性发展,应尽快建设我国自主研发的机器翻译系统,加快高质量、大规模语料库搭建,加强翻译技术标准建设,加大翻译技术普及力度,培养复合型翻译人才,通过跨学科融合协作不断推动翻译技术迭代升级。
《蓝皮书》得到了来自政产学研各界专家学者的指导关注,希望能对机器翻译技术研究和行业应用有所启发和借鉴。
文章来源:中国外文局翻译院智能翻译实验室