点击蓝字 关注我们
2024年12月4日,美国当地时间,OpenAI宣布自12月5日起启动为期12个工作日的特别活动,计划每天通过直播公布一项全新的AI功能或产品。消息一出,那技术圈直接就 “炸开了锅”!因为这次持续12天的发布会不仅是OpenAI技术更新的展示,也是AI产业未来格局的重要信号。
话不多说,赶紧来瞅瞅前 6 场发布会都刮起了哪些 “AI 旋风”!
Day 1 o1模型全面升级
o1Pro版、ChatGPT Pro、多模态融合
OpenAI推出o1 Pro模型,这是o1 Preview版的升级版,拥有更快的速度、更强的智能、以及更佳的指令遵循能力,还能支持文本。与o1 Preview版相比,o1 Pro版犯重大错误的频率降低了34%,思考速度提高了50%。在数学、竞赛编程等方面都有显著提升。
o1 Pro版模型的订阅服务费用为200美元/月(约1500RMB/月),是目前最贵的大模型。它提供对OpenAI最佳模型(包括o1、GPT-4.0和高级语音模式)的无限访问权限,以及一个名为“o1 Pro模式”的新功能。发布会上还展示了o1的多模态能力: 通过一个关于太空数据中心散热器面积计算的例子,演示了o1能够处理图像和文本信息,并进行快速的多模态推理能力。
Day 2 RFT引领模型深度进化
o1正式发布、RFT技术、应用拓展
o1模型正式推出,并融入ChatGPT和API,具备预思考特性。强化微调技术(RFT)亮相,采用强化学习算法,少量数据就能将模型能力从高级进阶到专家级,满足特定需求。RFT优势尽显,在多行业和科研领域应用广泛。伯克利实验室借此提升罕见病基因预测准确率。用户仅需提供数据和评分器,平台包办训练,o1 Mini经RFT后在基因预测任务表现超 o1模型,OpenAI还将扩大RFT访问计划。
Day 3 Sora强势发布
Sora、视频生成、文本驱动
Sora 作为新型视频生成工具正式登场,依据文本或图像,快速产出高质量1080p视频,时长可达20秒,在创意、教育、社交等领域潜力巨大。Sora的设计理念是让视频制作变得更加简单和直观,用户只需输入相关的文本描述,系统便会自动生成相应的视频。Sora大幅简化了视频创作的流程,推动AI视频创作迈向新高度。
Day 4 交互新篇:画布功能
Canvas画布、文本编辑、代码运行
ChatGPT “画布 – Canvas” 功能上线,类似 Word 编辑器,支持与GPT实时互动写作,且能直接运行代码。该功能免费向网页端用户开放,除代码运行稍慢外,其他功能完备。用户可编辑GPT生成内容,如学习计划等,还能批改文章、生成并调试代码,提升创作与学习效率。
Day 5 苹果生态接入ChatGPT
苹果集成、Siri融合、便捷交互
ChatGPT全面接入苹果生态,Siri可调用其回答问题,在手机和Mac端均适用。当使用苹果手机拍照时,用户可即时唤起ChatGPT,针对画面中的内容展开询问,这种即时性极大地简化了人机交互的流程,例如在旅行场景中,它摇身一变成为智能导游,为用户提供丰富且精准的景点信息。而在Mac端,Siri与ChatGPT的协同更是展现出强大的办公助力功能,Siri能够读取用户正在浏览的文件,并借助ChatGPT的智能分析与总结能力,将复杂的文档内容提炼为关键信息,从而使ChatGPT完美化身智能助手,全方位提升用户的工作效率与信息获取能力,为数字化生活与工作带来全新体验。
Day 6 高级视听交互来袭
视听交互、实时通话、屏幕共享
ChatGPT高级语音视觉功能上线,支持与用户视频通话,能识别用户的动作与展示内容,记住物体颜色等信息,分析手写便签和广告等。屏幕共享功能可助用户解决PPT、代码、表格等问题,化身智能帮手。语音模式涵盖50多种语言与9种逼真语音,其背后的GPT-4o模型不仅可以将语音转换成文本,还可以理解和标记音频的其他功能,例如呼吸和情感。
同时,OpenAI宣布,圣诞期间还推出圣诞老人限定语音,节日拉满氛围!第一次用还不限额度哦~
以上就是OpenAI 前6场发布会的亮点内容啦!从模型的优化升级、功能的创新拓展,再到与各平台的深度融合,每一步都彰显着人类智慧与科技力量的完美结合。这些新突破、新应用不仅是技术上的迭代,更是为我们打开了一扇扇通往未来无限可能的大门。
各位亲爱的朋友们,抓紧时间多多尝试,我们也会继续关注未来几天发布会的新功能,持续为大家带来新的内容。
扫描右侧二维码关注
<语言服务融智新视野>