来自亚马逊 AWS 在 AWS 机器学习博客 题为 “使用 Amazon Translate、Amazon Bedrock 和 Amazon Polly 进行视频自动配音”。 这是 AWS 发布的一系列详细说明如何使用各种亚马逊技术的最新文章。
在 AWS 博客首页只要用户愿意专注于使用亚马逊语言处理技术,亚马逊就会提供大量免费资源。 亚马逊的免费内容确实非常丰富,其中一些非常具体的教程(连同免费数据集)可用于整个任务流,以构建一个完整的亚马逊栈应用程序。
对于这篇关于 机器配音AWS 研究人员与 MagellanTV纪录片流媒体服务,以及 任务云. Mission Cloud 是一家云服务管理公司,代表 AWS 担任顾问,推荐在亚马逊技术上执行的解决方案。
Magellan TV 向 Mission Cloud 寻求经济实惠的自动配音解决方案。 在教程中,研究人员首先介绍了 Mission Cloud 的建议,即使用 Amazon Translate、Amazon Bedrock 和 Amazon Polly 为流媒体平台的视频自动配音提供经济高效的解决方案。
级联处理
博文介绍说,这一过程包括使用 Amazon Translate 对视频字幕进行初始翻译,然后使用 Amazon Bedrock 进行后期编辑。
对于视频字幕,用户可以使用电子表格这样简单的工具来收集音频输入,然后将文件上传到亚马逊简单存储服务(Amazon S3)桶。 这将触发获取配音视频文件和翻译字幕文件的整个过程,首先是 机器翻译 (MT) 使用亚马逊翻译。
亚马逊基岩(Amazon Bedrock,通过来自多家人工智能公司(不仅仅是亚马逊)的单一应用程序接口提供基础模型)被用于提高 MT 的输出质量以及音频和视频的自动同步。
帖子说,下一阶段,人类编辑将使用亚马逊增强型人工智能(Amazon Augmented AI)进行审核。 随后,使用亚马逊 Polly 为视频生成合成声音。 整个过程中,AWS Step Functions 负责管理在 AWS Lambda 或 AWS Batch 上运行的不同流程步骤。
(机器翻译,轻度译后编辑,仅供参考)
编辑:刘煜珍