OpenAI刚刚用GPT-4o杀死了谷歌翻译

分享

其他推荐

在OpenAI春季更新上,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)推出了GPT-4o,这是一款新的旗舰机型,通过文本、图像和音频的“omni”功能丰富了其套件,承诺在未来几周内迭代推出,以增强开发者和消费者产品。

“他们正在发布一个文本——音频——图像组合模型,在一个单一的神经网络中处理所有三种模式,然后如果你要求它,它可以作为一个特例进行实时语音翻译,”前OpenAI计算机科学家Andrej Karpathy说,他很快对发布做出了回应。

“新的语音(和视频)模式是我用过的最好的计算界面。感觉像电影里的AI,我还是有点惊讶这是真的。OpenAI首席执行官萨姆·奥特曼表示:“达到人类水平的响应时间和表达能力是一个巨大的变化。”他希望将‘通用基本计算’带给世界上的每个人。

此外,他说最初的ChatGPT暗示了语言界面的可能性;“这个新事物给人的感觉是完全不同的。它快速、聪明、有趣、自然、很有帮助。”

奥特曼说,对着电脑说话对他来说从来都不是很自然。“现在自然了,”他说,对未来人们将使用计算机做比以往更多的事情充满希望。

GPT-4o真正有趣的是,它将很快提供给ChatGPT Plus(带有一些个性化功能)和ChatGPT免费用户。“我们是一家企业,会发现很多东西可以收费,这将有助于我们为(希望)数十亿人提供免费、出色的人工智能服务,”奥特曼说。“感谢Jensen和NVIDIA团队为我们带来了最先进的GPU,使今天的演示成为可能,”Murati在闭幕词中说。与此同时,OpenAI总裁兼联合创始人Greg Brockman也展示了人机交互(甚至人机——计算机),让用户一瞥AGI之前的氛围

介绍GPT-4o,我们的新模型,可以实时推理文本,音频和视频。

它非常通用,玩起来很有趣,并且向更自然的人机交互形式(甚至是人机交互)迈出了一步:pic.twitter.com/VLG7TJ1JQx

—格雷格·布莱克曼(@gdb)2024年5月13日

RIP谷歌翻译?

在GPT-4o实时翻译能力的演示中,该模型在英语和意大利语之间进行了无缝翻译,体现了其复杂的语言适应性。许多人认为OpenAI的这一新功能很可能会取代谷歌翻译

“OpenAI刚刚用他们的实时翻译器杀死了Google Translate(响应延迟接近0),”Fraser

与此同时,发布EVI(移情语音界面)的Hume AI也感受到了压力,让他们今天推出了API,以及其他未来的改进。

Was it helpful ?