OpenAI最新动态:优化微调API,丰富定制模型计划

分享

其他推荐

OpenAI正在研发并推出新功能帮助开发人员能更多地控制微调公布与OpenAI共同定制模型的新方法。

开发人员可以使用多种技术,提高模型性能,减少延迟,提高准确性,降低成本。无论是通过检索增强生成(RAG)来扩大模型的知识库,通过微调定制模型的行为,还是构建具有新的特定领域知识的定制训练模型,我们已经开发了一系列选择方案来支持我们客户的AI实操。今天,我们推出了新功能,给开发人员提供更多用API对模型微调的控制权限,并推出更多合作方式,与我们的AI专家和研发人员组成的团队共同搭建定制模型。

微调API新功能

我们于2023年8月为GPT3.5推出了自助微调API。自那以后,数千家组织使用我们的API训练了成百上千个模型。微调可以帮助模型深入理解内容,增强模型现有知识,以及针对特定任务的能力。此外,还有更多的例子显示,我们的微调API还能让模型在单个提示词中。实现比微调之前更高质量的结果,同时降低成本和延迟度。微调的常见用途包括训练模型,更好地生成特定编程语言中的代码,按特定格式总结文本,或基于用户行为定制个性化内容。

例如,全球性求职匹配和招聘平台Indeed,希望简化招聘过程。为实现这个目标,Indeed推出了一项功能,即向求职者发送个性化推荐,突出显示基于他们的技能、经验、偏好的相关职位。他们微调了GPT-3.5 Turbo模型,生成质量更高和更准确的解释。结果,Indeed通过将提示词中的token数量减少80%,降低了成本和延迟度。基于此,他们得以从每月向求职者发送不到一百万条信息,增加到发送约两千万条信息。

今天,我们推出了新功能,增加开发人员对自身微调工作的控制,包括:

  • 基于epoch的检查点创建:在每个训练epoch期间,都自动产生一个完整的微调模型检查点,减少了后续重新训练模型的需求,尤其是在过拟合的情况下。
  • 对比playground一个新的并排playground的UI界面,用于比较模型的质量和性能,允许对多个模型的输出进行输出,或根据单个提示词微调snapshot。
  • 第三方集成:支持与第三方平台(从本周开始与美国机器学习性能可视化工具开发商Weights &Biases)的集成,开发人员可以将详细的微调数据共享给堆栈的其他部分。
  • 全面的验证指标:能够计算整个验证数据集(而不是抽样批次)的损失和准确性等指标,更好地了解模型质量。
  • 超参数配置:能够从仪表盘配置可用的超参数(而不仅仅是通过API或SDK)
  • 微调仪表板改进:包括配置超参数、查看更详细的训练指标和从以前的配置重新运行作业的能力

扩展定制模型计划

微调辅助

去年11月的首届全球开发者大会DevDay上,我们展示了一个定制模型计划,旨在为特定领域训练和优化模型,并与一批精益求精的内部研发人员合作。至今,我们已经与数十位客户进行沟通,评估他们的定制模型需求,同时改善我们的计划,进一步优化表现。

今天,我们正式将微调辅助服务作为定制模型计划的一部分进行推出。辅助微调是我们技术团队共同完成的一项工作,他们大规模应用利用除了微调API以外的技术,例如额外的超参数和各种参数高效微调(PEFT)等方法。这对于需要帮助建立高效训练数据管道、评估系统,以及为最大化模型在特定用例或任务下的性能,定制参数和方法的组织来说,尤有帮助。

例如,韩国电信运营商SK Telecom,为超过3000万订阅者提供服务,他们希望定制一个电信领域的专家模型,作为客户服务的初步关注“员工”。他们与OpenAI合作微调GPT-4,提高其在韩语电信相关对话中的性能。在几周的时间里,SKT和OpenAI在电信客户服务任务中,实现了颇具意义的性能提升——对话总结的质量提高了35%,意图识别准确性增加了33%,同时,微调后的模型与原GPT-4相比,满意度评分从3.6增加到4.5(满分为5)。

定制训练模型

在某些情况下,企业需要从零开始训练一个了解其业务、行业、或领域的专用模型。完全定制训练的模型,需要使用新颖的中期和后期训练技术,修改模型训练过程的关键步骤,进而从特定领域中输入新知识。成功企业所使用的完全定制训练模型,通常拥有大量的专有数据——数百万个例子或数十亿个token,他们想用这些数据来教模型新知识,或复杂特殊的行为,以适用于高度特定的用例。

例如,为律师定制AI法律工具的公司Harvey,与OpenAI合作创建了一个定制训练案例法大语言模型。尽管基础模型在推理方面表现强劲,但缺乏进行法律工作所需的大量法律案例历史和其他相关知识。在测试提示词工程、RAG、微调之后,Harvey与我们的团队合作,为模型增加了所需的深度上下文——相当于100亿token的数据量。从特定领域的中期训练到自定义后期训练过程,我们的团队修改了模型训练过程的所有步骤,并且纳入专家律师的反馈。最终的模型在事实回应上提高了83%,律师们比较喜欢定制模型的输出结果,相对于GPT-4,喜好率高达97%。

模型定制化的未来

我们相信,在未来,绝大多数组织将开发定制化的模型,这些模型将个性化其行业、业务、用例。通过利用定制模型的多种技术,各种规模的组织都可以开发个性化的模型,从他们的AI实施中实现更具意义且独特的影响。关键是要清晰地界定用例,设计并实施评估系统,选择合适的技术,准备好随时间推进而迭代更新,使模型达到最佳性能。

借助OpenAI,大多数组织可以通过自助微调API快速看到简单易懂的结果。对于任何需要更深入微调其模型或为模型注入新的、特定于领域的知识的组织,我们的定制模型计划可以提供帮助。

访问我们的微调API文档,开始微调我们的模型。如需更多信息帮助定制您用例的模型,请联系我们。

(机器翻译,轻度译后编辑,仅供参考。)

原文链接

编辑:张湄婕

Was it helpful ?

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注