1. 基础知识
1.1 语音识别概念
语音识别是将人类的声音信号转化为文字或者指令的过程([1])。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,其研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域([2])。
1.2语音识别分类
2. 发展趋势
90年代之后语音识别与自然语言处理相结合发展到基于自然口语识别和理解的人机对话系统。与机器翻译技术相结合逐步发展出面向不同语种人类之间交流的直接语音翻译技术。语言识别技术在中国的发展
我国的语音识别研究工作一直紧跟国际水平国家也很重视并把大词汇量语音识别的研究列入“863”计划由中科院声学所、自动化所及北京大学等单位组织研究开发。目前国内也涌现出了诸如科大讯飞和北京捷通等专业研究和开发语音识别产品的高科技公司([3])。
3. 主流工具
语言转写:
字幕生成:
3.1 具体案例应用
工具1:AppTek
描述:
主要功能:
1.自动语音识别 (Automatic speech recognition ASR)
2.文段切分字幕生成
具体实例:
We should meet tomorrow at the booth at 2 pm.
We (person) should meet tomorrow (date) at the booth (location) at 2 pm (time).
We (person) should (modifier) meet (action) tomorrow (date) at the booth (location) at 2 pm (time).
We (person) should (modifier) meet (action) tomorrow (date) at the booth (location) at 2 pm (time—13:00:00 UTC).
-
We should meet tomorrow at the booth at 2 pm.
-
How about Tuesday?
-
How about Tuesday? (Tuesday=Nov.21)
Step 7: Sentiment Analysis
- We should meet tomorrow at the booth at 2 pm.
- How about Tuesday?
- You know that’s not possible! (sentiment: negative)
工具2:IFlytek(科大讯飞)
操作步骤:
注:科大讯飞转写准确度也有待加强,在上下文语境充分的情况下,也会出现“识别错误”“语法错误”等基础错误。如图中的:COVID-19被识别成了Covey 19;If compared to the developed countries around the world被转写成了It compared to the developed countries
在软件转写准确性有待提高的情况下,人工后续的编辑成本就会上升。
4. 总结与启发
语音识别技术未来市场潜力巨大。目前已广泛应用在日常生活中的语音操作、人机交流等领域。对于翻译从业者来说,语音识别技术的发展可以实现口语识别技术、翻译技术和语音合成技术等([4]),帮助译者降低部分认知和输出负荷,进而提升翻译的效益和整体质量。
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
– END –
原创来源:北外CAT课程展示-张莹玥
推文编辑:张莹玥