亚马逊AWS的一组研究人员在AWS机器学习博客上发布了一篇教程,题为“使用亚马逊翻译、亚马逊基岩和亚马逊Polly的视频自动配音”。这是AWS发布的一系列详细操作指南中的最新一篇,这些指南描述了如何使用各种Amazon技术。
在AWS博客主页下的不同博客上,有大量的免费资源,只要用户愿意专注于使用Amazon语言处理技术。亚马逊的免费内容确实非常丰富,其中一些非常具体的教程(以及免费的数据集)可以用于构建一个完整的亚马逊堆栈应用程序的整个任务流。
在这篇关于机器配音的最新博客文章中,AWS的研究人员与纪录片流媒体服务商麦哲伦电视(MagellanTV)和Mission Cloud合作。Mission Cloud是一家云服务管理公司,代表AWS提供咨询服务,推荐在亚马逊技术上执行的解决方案。
麦哲伦电视台向使命云寻求经济实惠的自动配音解决方案。在教程中,研究人员首先将Mission Cloud的推荐描述为一种具有成本效益的解决方案,用于流媒体平台的视频自动配音,使用Amazon Translate, Amazon Bedrock和Amazon Polly。
级联处理
这篇博文描述了这个过程,包括使用亚马逊翻译(Amazon Translate)对视频字幕进行初步翻译,然后使用亚马逊Bedrock进行后期编辑。
对于视频字幕,用户可以使用简单的电子表格来收集音频输入,然后将文件上传到Amazon simple Storage Service (Amazon S3)。这触发了获得配音视频文件和翻译标题文件的整个过程,从使用亚马逊翻译的机器翻译(MT)开始。
Amazon Bedrock(通过来自多个AI公司的单一API提供基础模型,而不仅仅是Amazon)用于提高机器翻译输出质量和音频和视频的自动同步。
该帖子称,下一阶段将涉及人工编辑使用亚马逊增强人工智能进行评论。接下来是使用Amazon Polly为视频生成合成声音。与此同时,AWS步骤函数管理不同的流程步骤,运行在AWS Lambda或AWS Batch上。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:陈驭格