牛津大学出版社的Oxford Languages欣然宣布,将提供人工管理的发音数据给美国科技公司 WellSaid Labs,以助于解决人工智能语音生成复杂问题,并让内容创作者对配音偏好有更多的控制权。
WellSaid Labs是一个值得信赖的人工智能语音平台,以文本到语音(TTS)产品的形式提供大规模的人工智能语音生成。最近,WellSaid Labs 在其平台上推出了一个新颖的 Respelling 系统,使用户能够定制和塑造配音中特定单词的发音,帮助用户将文本变成更逼真、更人性化的声音。
开发新颖的 Respelling 系统是为了解决目前文本到语音平台用户体验方面的难题。如Oxford Languages案例研究所述,“文本到语音转换平台的用户通常需要一个标准化的发音指南,比如国际音标(IPA)。为了提升用户体验,WellSaid Labs开发了一个更直观、更易使用的Respelling系统,并将其直接嵌入到他们的深度学习TTS模型中。”
这种解决方案需要提供覆盖面广、发音准确的英语单词的语言数据。在这方面,Oxford Languages的发音数据集非常适合 WellSaid Labs 推出的业界首创的 Respelling 系统。
“我们与世界领先的词典出版商 Oxford Languages 合作,超越了传统的单词转录来源,大大丰富了 WellSaid Lab 的训练数据语料库,并获得了更多关于每个单词的语境,最终让我们的人工智能语音更接近人类水平。这一合作将WellSaid Labs 的尖端技术与 Oxford Languages 的著名语言专业知识结合在一起,在人工智能语音生成方面取得了突破性的进展,” WellSaid Labs 在其博客中写道。
(机器翻译,轻度译后编辑,仅供参考)
编辑:武娇阳