要点
-
OpenAI周一推出了一种新的人工智能模型和其广受欢迎的聊天机器人ChatGPT的桌面版。
-
新型号叫做GPT-4o。
-
OpenAI技术主管米拉·穆拉蒂(Mira Murati)在一次直播活动中表示:“这是我们第一次在易用性方面真正向前迈出一大步。”
OpenAI周一推出了新的人工智能模型和桌面版ChatGPT,以及更新的用户界面,这是该公司扩大其广受欢迎的聊天机器人使用的最新努力。
技术主管米拉·穆拉蒂(Mira Murati)在一次直播活动中表示,此次更新将GPT-4带给了所有人,包括OpenAI的免费用户。她补充说,新型号GPT-4o“快得多”,在文本、视频和音频方面的能力有所提高。OpenAI表示,它最终计划允许用户与ChatGPT进行视频聊天。
“这是我们第一次在易用性方面真正向前迈出一大步,”Murati说。
由微软支持的OpenAI被投资者估值超过800亿美元。该公司成立于2015年,面临着在寻找赚钱方法的同时保持在生成式人工智能市场顶端的压力,因为它在处理器和基础设施上花费了大量资金来构建和训练其模型。
GPT-4o中的o代表omni。Murati说,新模型允许ChatGPT以更高的速度和质量处理50种不同的语言,它还将通过OpenAI的API提供,使开发人员今天就可以开始使用新模型构建应用程序。
她补充说,GPT-4o的速度是GPT-4 Turbo的两倍,成本是后者的一半。
OpenAI团队成员展示了新模型的音频功能,例如,要求它在公开演讲前帮助某人冷静下来。OpenAI研究员Mark Chen表示,该模型能够“感知你的情绪”,并补充说,该模型还可以处理用户打断它的情况。该团队还要求它分析用户的面部表情,以评论这个人可能正在经历的情绪。
“嘿,怎么了?我怎样才能点亮你今天的生活?”当一个用户问候ChatGPT时,它的音频模式这么说道。
根据一篇博客文章,该公司计划在未来几周内测试语音模式,ChatGPT Plus的付费用户可以提前使用。OpenAI还表示,新模型可以“在232毫秒内响应用户的音频提示,平均320毫秒,这与人类在对话中的响应时间相似。”
陈展示了模特讲睡前故事的能力,并要求它改变语调,使其更具戏剧性或机器人性。他甚至让它唱这个故事。
此外,该公司表示,OpenAI的新模型可以充当翻译,即使在音频模式下也是如此。陈展示了该工具的能力,可以在穆拉蒂说英语的同时听他说意大利语,并在他们交谈时翻译成各自的语言。
团队成员还展示了该模型解决数学方程和帮助编写代码的能力,使其成为微软自己的GitHub Copilot的更强竞争对手。
对于OpenAI来说,此次发布是该公司自8月份人工智能聊天机器人业务层ChatGPT企业启动以来最大的公告之一。OpenAI首席运营官Brad Lightcap当时告诉美国消费者新闻与商业频道(CNBC),该工具开发了“不到一年”,并得到了20多家不同规模和行业的公司的帮助。
OpenAI、微软和谷歌正在引领一场生成式人工智能淘金热,因为似乎每个行业的公司都在竞相将人工智能聊天机器人和代理添加到关键服务中,以避免被竞争对手甩在后面。本月早些时候,OpenAI的竞争对手Anthropic宣布了其有史以来第一个企业产品和一个免费的iPhone应用程序。
根据PitchBook的数据,2023年,近700笔生成式人工智能交易的投资达到创纪录的291亿美元,比上一年增长了260%以上。该市场预计在十年内收入将超过1万亿美元。
一些业内人士对未经测试的新服务进入市场的速度表示担忧,学者和伦理学家对该技术传播偏见的趋势感到苦恼。
ChatGPT在2022年11月推出后,打破了当时的记录,成为历史上增长最快的消费应用,现在每周活跃用户约1亿。OpenAI表示,超过92%的财富500强公司正在使用该平台。
穆拉蒂在周一的活动中表示,OpenAI希望“从技术中去除一些神秘主义”。
“在接下来的几周内,我们将向所有人推出这些功能,”她说。
周一的一篇博客文章称,新模式将于周二首先向ChatGPT Plus和Team的客户推出,然后稍后向企业推出。从周一开始,ChatGPT的免费用户也可以使用它,但有使用限制。ChatGPT Plus的用户将拥有比免费用户多五倍的消息容量,ChatGPT团队和企业的客户将有更大的使用限制。
穆拉蒂在直播活动结束时感谢英伟达首席执行官黄仁勋,感谢他的公司提供了必要的图形处理单元(GPU)来支持OpenAI的技术。
“我只想感谢令人难以置信的OpenAI团队,也感谢Jensen和Nvidia团队为我们带来了最先进的GPU,使今天的演示成为可能,”她说。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:王云菲