尽管OpenAI确认ChatGPT的高级语音功能要到今年晚些时候才会推出,但他们一直在展示未来的功能。这次的演示展示了GPT-4o在语言教学方面的强大能力,它可以教用户学习葡萄牙语。
GPT-4o在今年早些时候的OpenAI春季更新中首次亮相,展现了令人惊叹的高级语音功能。他们还透露了一些视觉和屏幕共享功能,但这些功能要到今年晚些时候甚至可能到明年初才会推出。
最初演示的一个重要卖点是GPT-4o充当实时翻译设备的能力,但从一些新演示中我们看到,它也可以成为一个非常出色的语言教师。这是我在当前语音模型上已经有过的一些体验,但新模型会更加优秀。
在OpenAI的一段新视频中,一位母语为英语的学习者和一位基础葡萄牙语学习者使用ChatGPT来提高语言技能。他们在不同的时刻要求它放慢速度或解释术语——它都完美地完成了这些要求。
使用GPT-4o学习语言
新款ChatGPT-4o的高级语音功能令人激动之处在于它具备原生的语音对语音能力。与之前需要先将语音转换为文本并反向转换为语音的模型不同,这款新模型能够自然地理解你所说的话。
这种原生理解语音和音频的能力带来了许多令人兴奋的功能,包括支持多种语言、模仿不同口音或改变语速、音调和语音活力,使其成为完美的语言教师。
其原生语音能力使其能够听取你的发音,分析你说话的方式甚至你的口音。然后,它可以根据所听到的内容提供直接反馈,而不是通过评估转录文本来判断。
此外,GPT-4o还具有出色的推理和解决问题的能力,因此它可以在更隐蔽的方式下识别出你的错误。
我们还看到了GPT-4o的哪些功能?
关于新款高级语音功能有多个演示,包括一些未正式发布的演示。其中一个演示显示,它能够在讲故事时生成音效,另一个演示揭示它能够使用多种不同的声音。
在OpenAI的油管官方视频中,我们看到它可用作数学老师。在视频中,它在iPad上工作,屏幕共享,AI在数学问题的每个方面提供建议和信息。
高级语音模式,特别是原生理解语音的能力,感觉是自OpenAI在2022年11月为其GPT-3模型推出聊天界面以来,人工智能领域最重大的飞跃之一。
(机器翻译,轻度译后编辑,仅供参考)
编辑:田逸云