AWS提供一步一步的AI配音教程

亚马逊AWS的一组研究人员在AWS机器学习博客上发布了一篇教程,题为“使用亚马逊翻译、亚马逊基岩和亚马逊Polly的视频自动配音”。这是AWS发布的一系列详细操作指南中的最新一篇,这些指南描述了如何使用各种Amazon技术。

在AWS博客主页下的不同博客上,有大量的免费资源,只要用户愿意专注于使用Amazon语言处理技术。亚马逊的免费内容确实非常丰富,其中一些非常具体的教程(以及免费的数据集)可以用于构建一个完整的亚马逊堆栈应用程序的整个任务流。

在这篇关于机器配音的最新博客文章中,AWS的研究人员与纪录片流媒体服务商麦哲伦电视(MagellanTV)和Mission Cloud合作。Mission Cloud是一家云服务管理公司,代表AWS提供咨询服务,推荐在亚马逊技术上执行的解决方案。

麦哲伦电视台向使命云寻求经济实惠的自动配音解决方案。在教程中,研究人员首先将Mission Cloud的推荐描述为一种具有成本效益的解决方案,用于流媒体平台的视频自动配音,使用Amazon Translate, Amazon Bedrock和Amazon Polly。

级联处理

这篇博文描述了这个过程,包括使用亚马逊翻译(Amazon Translate)对视频字幕进行初步翻译,然后使用亚马逊Bedrock进行后期编辑。

对于视频字幕,用户可以使用简单的电子表格来收集音频输入,然后将文件上传到Amazon simple Storage Service (Amazon S3)。这触发了获得配音视频文件和翻译标题文件的整个过程,从使用亚马逊翻译的机器翻译(MT)开始。

Amazon Bedrock(通过来自多个AI公司的单一API提供基础模型,而不仅仅是Amazon)用于提高机器翻译输出质量和音频和视频的自动同步。

该帖子称,下一阶段将涉及人工编辑使用亚马逊增强人工智能进行评论。接下来是使用Amazon Polly为视频生成合成声音。与此同时,AWS步骤函数管理不同的流程步骤,运行在AWS Lambda或AWS Batch上。

(机器翻译,轻度译后编辑,仅供参考。)
编辑:陈驭格

原⽂链接

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注