在微软和OpenAI的首席执行官们最近的一次谈话中,山姆·阿特曼透露,ChatGPT-5预计将对其语音、图像以及最终的视频功能进行重大更新。
在他的“Unfunfuse Me”播客中,比尔·盖茨和阿特曼探索了人工智能的未来,包括其改进的推理能力和一般可靠性。“多模态将是重要的,”阿特曼说,暗示未来人工智能可以执行越来越复杂的任务,并有可能重塑各个行业,包括编程、医疗保健和教育。
人们正在期待ChatGPT的下一次迭代(成为GPT-5)。这种先进的大型语言模型被视为实现人工通用智能(AGI)发展道路上的一个重要里程碑,使机器能够模仿人类的思维过程。
以下是对GPT下一版本的期待。
什么是ChatGPT-5?
OpenAI说ChatGPT-5“将是一个最先进的语言模型,让你感觉像是在和一个人而不是一台机器交流。”
GPT-5标志着该公司的下一代生成式预训练Transformer model语言模型。OpenAI声称它代表了自然语言处理能力的重大进步。凭借其更像人类的理解和生成文本的能力,GPT-5可以改变我们与机器交流的方式,并自动化许多与语言相关的工作。
会有ChatGPT-5吗?它能做什么?
正如阿特曼所建议的,ChatGPT-5已经作为其前身GPT-4的更新版本在开发中。这个OpenAI首席执行官表示,“目前,GPT-4只能以极其有限的方式进行推理,其可靠性也是有限的,”因此,目标是改善其当前的功能。
GPT代表“生成性预训练Transformer model”,是一种基于深度学习的语言模型,旨在产生类似人类生成的文本。它拥有更多的自然语言处理技能,并在众多应用程序中得到广泛应用。
除了可靠之外,阿特曼还认为“可定制性和个性化也非常重要。
“人们希望从GPT-4中得到非常不同的东西;不同的风格,不同的假设——我们会让这一切成为可能,”他补充道。
阿特曼强调,GPT-5利用个人数据的能力,包括理解电子邮件、日历细节、约会安排偏好以及与外部数据源集成,将是关键的进步之一。
多模态人工智能旨在学习和使用各种内容类型,如图像、音频、视频和数字数据。OpenAI表示,GPT-4是一个多模态模型,能够处理文本和图像输入,但它仅限于生成文本形式的输出,GPT-5将使用更多数据进行训练。
“我们发送了图像和音频信息,它的回应比我们预期的要强烈得多。我们将能够更进一步,但也许最重要的进步领域将是推理能力,”阿特曼在他的播客中告诉盖茨。
OpenAI已经表示它正在开发一个“超级智能”助手为用户运行计算机。据说它可以与微软和谷歌自己的人工智能工作场所助手竞争,但这些程序据说还处于起步阶段。
ChatGPT-5什么时候发布?
然而,阿特曼没有透露其发布的具体日期。去年11月,他在英国《金融时报》表示,团队正在开发大型语言模型,但没有说明何时会完成。
今年2月在迪拜举行的世界政府峰会(WGS)上发表讲话时,阿特曼重申ChatGPT-5“将变得更智能”“这并不是说这种模式会变得更好,而是因为我们会让它们都变得更聪明,它的各方面都会得到提高,”他继续说道。他还对彭博社表示,他希望该公司“慢慢来”,并确保它能够推出一款他们感觉“良好并负责任”的产品。
3月19日,阿特曼再次更新了GPT-5的状态,在播客中告诉莱克斯·弗里德曼,“我们将在今年发布令人惊叹的机型。我不知道该怎么称呼它。”
OpenAI首席执行官还暗示GPT-4和GPT-5之间的能力将大幅提升,表示这两种型号之间的差异将与GPT-3和GPT-4之间的升级一样大。
去年秋天,阿特曼至少在两个场合肯定了OpenAI正在积极开发GPT-5。
最初的确认是在去年9月,他的前风险投资公司Y Combinator校友聚会上的一次演讲中,两名与会者证实了这一点。在那次活动中,阿特曼表示,GPT-5及其继任者GPT-6“已经稳操胜券”,暗示他们的发展是有保证的,他们将超越以前版本的能力。
ChatGPT-5会免费吗?
虽然ChatGPT有一个免费版本,但尚不清楚ChatGPT-5是否需要订阅——就像它的前身ChatGPT4一样。ChatGPT Plus订阅计划每月20美元,为用户提供独家优惠,包括在高流量期间的优先访问,更快的回应速度,使用插件的能力,以及独家访问GPT-4。
用户还可以访问其内部的人工智能图像模型DALL E。需要注意的是,当前的语言模型训练和维护已经很昂贵了。这意味着当GPT-5最终发布时,访问它可能需要订阅ChatGPT Plus或Copilot Pro。
最终,GPT-5的发布可能会让GPT-4变得更加负担得起和容易获得。过去,GPT-4的高成本让许多用户望而却步。然而,一旦它变得更便宜并广泛可用,ChatGPT处理编码、翻译和研究等复杂任务的能力可能会显著提高。
机器翻译,轻度译后编辑,仅供参考。
编辑:严覃瑶