实时语音对语音AI翻译正式商用

分享

其他推荐

自2023年中期以来,实时语音对语音翻译(S2ST)在多个商业应用中迅速普及。

 

大型多模态语言模型,如Meta的SeamlessM4T和谷歌的AudioPaLM,帮助减少端到端口语转换(即端到端语音翻译,或E2E-ST)中的延迟。

 

越来越多的语言AI研究者专注于S2ST,多个学术和私人团队致力于提高模型准确性,包括将低资源语言纳入考虑。

然而,所有这些研究如何转化为现实世界的实际应用呢?以下是最近五个实时商务语音对语音翻译应用的简要介绍:

 

商务会议 

Microsoft Translator与Teams会议和通讯应用集成,通过Azure AI服务支持超过30种语言的实时语音翻译。该应用可以通过支持的双语培训文档、调整文档、测试文档、短语词典和句子词典进行定制。

 

现场活动和会议

Google翻译具有一项功能,可以在现场活动中通过翻译多个参与者的语音实现双向交流InterprefyKUDO也具有实时AI语音翻译功能,包括不同语言的多方向转换。

零售和酒店业

S2ST用于翻译顾客和酒店、餐厅工作人员之间的对话。通常通过在设备上运行的应用程序实现,如手机或平板电脑。商业产品的例子是SoundHound AI Voice AI Concierge,支持25种语言。

 

医疗保健

为医疗机构提供语音技术的现有供应商已经开始为其客户实施语音对语音翻译。这类技术提供商的例子是Orion Labs,他们通过Push-to-Talk 2.0平台为医院提供实时语音翻译等服务。

客户服务 

在诸如交通系统等场景中,多语言客户服务对于顺畅运营至关重要。例如,巴黎市委托辅助公司Ava开发了一个系统,利用平板上的S2ST,地铁客服代理可以用来协助非法语使用者。该系统将在2024年奥运会期间进行最终测试。

(机器翻译,轻度译后编辑,仅供参考。)

原文链接

编辑:刘煜珍

Was it helpful ?