2023年顶级大型语言模型:最佳LLMs指南

分享

其他推荐

在开发者、 AI 专家以及主流应用中,对更高性能的大型语言模型(LLMs)的需求正在加剧。这些模型正推动着生成式 AI 技术的激增,如微软 Copilot、Zoom Companion AI 和谷歌 Duet 等产品所示。现在涌现出许多新开发的私有或开源 LLMs ,增强了人机交互。这篇文章汇编了一些最优秀的LLMs。不同的用户对最佳LLMs的标准不同。开发人员经常寻求开源模型提供定制模型,而日常用户更喜欢为编码或创意写作等特定任务定制的模型。今年值得关注的LLMs 包括:

  1. BLOOM:作为BigScience的多语言模型,BLOOM以多语言文本生成而闻名。它是一个开创性LLM,拥有超过1000亿个参数。
  2. Claude:Anthropic的Claude提供了一系列文本处理功能,有两个版本:更轻、更快的“Claude Instant”和更全面的标准Claude。
  3. Cohere:这家 AI 初创公司提供一系列 LLMs,以其强大和准确性著称,被 Jasper 和 Spotify 等公司使用。
  4. Falcon:科技创新研究所的 Falcon 系列,尤其是 Falcon 180B,在语言任务中表现出色。
  5. GPT(OpenAI):GPT是一个广为人知的LLM,支持ChatGPT。最新版本 GPT-4 是一个多模态模型,能够处理文本和图像。
  6. LaMDA:谷歌大脑的 LaMDA 是一系列以其会话能力而闻名的 LLMs,支持谷歌的 Bard AI 机器人。
  7. LlaMa:Meta 的基础 LLM,LlaMa有多种规模可供 AI 研究使用。
  8. Orca:由微软开发的 Orca,在 130 亿参数的训练下,在推理基准测试中表现出色。
  9. PaLM:谷歌的 PaLM 及其最新版本 PaLM 2,在高级推理任务中脱颖而出,有多种规模可供选择。
  10. Phi-1:微软的 Phi-1 旨在提供 Python 编程帮助,展示了小型 LLMs 在特定任务中的潜力。
  11. 通义千问(Tongyi Qianwen):阿里巴巴云的专有模型,Tongyi Qianwen,将其技术嵌入云产品中,能够将文本转换为图像和视频。
  12. Vicuna 33B:基于 LLaMa 的开源 LLM,Vicuna 33B 是一个在 330 亿参数上训练的回归模型。
  13. Gopher:由谷歌 DeepMind 开发的 Gopher,在理解和事实核查任务上表现卓越。
  14. Guanaco:从 LLaMa 微调而来的 Guanaco 模型,是特别适用于现代聊天机器人的开源解决方案。
  15. MPT-30B:Mosaic ML 的 MPT-30B 是 LlaMA 模型的开源竞争者,以其编码支持而闻名。
  16. 30B-Lazarus:CalderaAI 的 30B-Lazarus 是 LlaMA 模型的增强版本,在文本生成上表现出色。
  17. FLAN-T5:FLAN-T5 以其零次和少次学习能力而闻名,能够处理超过 1000 个任务。

LLM 领域正在快速发展,包括开源和专有模型。随着生成式人工智能解决方案越来越受欢迎,这个动态领域继续扩大。

原文链接

(机器翻译,轻度译后编辑,仅供参考)
编辑:王隽雅

Was it helpful ?