OpenAI发布全新的GPT-4o高级语音演示——它能教你学一门外语

分享

其他推荐

尽管OpenAI确认ChatGPT的高级语音功能要到今年晚些时候才会推出,但他们一直在展示未来的功能。这次的演示展示了GPT-4o在语言教学方面的强大能力,它可以教用户学习葡萄牙语。

GPT-4o在今年早些时候的OpenAI春季更新中首次亮相,展现了令人惊叹的高级语音功能。他们还透露了一些视觉和屏幕共享功能,但这些功能要到今年晚些时候甚至可能到明年初才会推出。

最初演示的一个重要卖点是GPT-4o充当实时翻译设备的能力,但从一些新演示中我们看到,它也可以成为一个非常出色的语言教师。这是我在当前语音模型上已经有过的一些体验,但新模型会更加优秀。

在OpenAI的一段新视频中,一位母语为英语的学习者和一位基础葡萄牙语学习者使用ChatGPT来提高语言技能。他们在不同的时刻要求它放慢速度或解释术语——它都完美地完成了这些要求。

使用GPT-4o学习语言

新款ChatGPT-4o的高级语音功能令人激动之处在于它具备原生的语音对语音能力。与之前需要先将语音转换为文本并反向转换为语音的模型不同,这款新模型能够自然地理解你所说的话。

这种原生理解语音和音频的能力带来了许多令人兴奋的功能,包括支持多种语言、模仿不同口音或改变语速、音调和语音活力,使其成为完美的语言教师。

其原生语音能力使其能够听取你的发音,分析你说话的方式甚至你的口音。然后,它可以根据所听到的内容提供直接反馈,而不是通过评估转录文本来判断。

此外,GPT-4o还具有出色的推理和解决问题的能力,因此它可以在更隐蔽的方式下识别出你的错误。

我们还看到了GPT-4o的哪些功能?

关于新款高级语音功能有多个演示,包括一些未正式发布的演示。其中一个演示显示,它能够在讲故事时生成音效,另一个演示揭示它能够使用多种不同的声音。

在OpenAI的油管官方视频中,我们看到它可用作数学老师。在视频中,它在iPad上工作,屏幕共享,AI在数学问题的每个方面提供建议和信息。

高级语音模式,特别是原生理解语音的能力,感觉是自OpenAI在2022年11月为其GPT-3模型推出聊天界面以来,人工智能领域最重大的飞跃之一。

(机器翻译,轻度译后编辑,仅供参考)

编辑:田逸云

原文链接

Was it helpful ?

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注