2023年顶级大型语言模型：最佳LLMs指南

在开发者、 AI 专家以及主流应用中，对更高性能的大型语言模型（LLMs）的需求正在加剧。这些模型正推动着生成式 AI 技术的激增，如微软 Copilot、Zoom Companion AI 和谷歌 Duet 等产品所示。现在涌现出许多新开发的私有或开源 LLMs ，增强了人机交互。这篇文章汇编了一些最优秀的LLMs。不同的用户对最佳LLMs的标准不同。开发人员经常寻求开源模型提供定制模型，而日常用户更喜欢为编码或创意写作等特定任务定制的模型。今年值得关注的LLMs 包括：

BLOOM：作为BigScience的多语言模型，BLOOM以多语言文本生成而闻名。它是一个开创性LLM，拥有超过1000亿个参数。
Claude：Anthropic的Claude提供了一系列文本处理功能，有两个版本：更轻、更快的“Claude Instant”和更全面的标准Claude。
Cohere：这家 AI 初创公司提供一系列 LLMs，以其强大和准确性著称，被 Jasper 和 Spotify 等公司使用。
Falcon：科技创新研究所的 Falcon 系列，尤其是 Falcon 180B，在语言任务中表现出色。
GPT（OpenAI）：GPT是一个广为人知的LLM，支持ChatGPT。最新版本 GPT-4 是一个多模态模型，能够处理文本和图像。
LaMDA：谷歌大脑的 LaMDA 是一系列以其会话能力而闻名的 LLMs，支持谷歌的 Bard AI 机器人。
LlaMa：Meta 的基础 LLM，LlaMa有多种规模可供 AI 研究使用。
Orca：由微软开发的 Orca，在 130 亿参数的训练下，在推理基准测试中表现出色。
PaLM：谷歌的 PaLM 及其最新版本 PaLM 2，在高级推理任务中脱颖而出，有多种规模可供选择。
Phi-1：微软的 Phi-1 旨在提供 Python 编程帮助，展示了小型 LLMs 在特定任务中的潜力。
通义千问（Tongyi Qianwen）：阿里巴巴云的专有模型，Tongyi Qianwen，将其技术嵌入云产品中，能够将文本转换为图像和视频。
Vicuna 33B：基于 LLaMa 的开源 LLM，Vicuna 33B 是一个在 330 亿参数上训练的回归模型。
Gopher：由谷歌 DeepMind 开发的 Gopher，在理解和事实核查任务上表现卓越。
Guanaco：从 LLaMa 微调而来的 Guanaco 模型，是特别适用于现代聊天机器人的开源解决方案。
MPT-30B：Mosaic ML 的 MPT-30B 是 LlaMA 模型的开源竞争者，以其编码支持而闻名。
30B-Lazarus：CalderaAI 的 30B-Lazarus 是 LlaMA 模型的增强版本，在文本生成上表现出色。
FLAN-T5：FLAN-T5 以其零次和少次学习能力而闻名，能够处理超过 1000 个任务。

LLM 领域正在快速发展，包括开源和专有模型。随着生成式人工智能解决方案越来越受欢迎，这个动态领域继续扩大。

2023年顶级大型语言模型：最佳LLMs指南

分享

其他推荐

从翻译视角看跨文化词汇的流转 | Typhoon 一词的由来

翻译时，警惕这些“假朋友”！（一）

阿里巴巴AI实时翻译拓展至119种语言

2025年语言行业趋势展望 | 未来何处？

“AI赋能翻译教育”系列专访 | 对话黑龙江大学孙超院长：探秘DTI建设与课程创新

Loc World专栏 | 利用人工智能提升本地化质量与效率（文末PDF领取）

【王华树教授团队推荐】人工智能领域50本精选书单（收藏）

即将开课｜大语言模型赋能外语专业教育创新研修班【西安】

翻译院校篇 | 罗格斯大学

如何为译文“赋魂”？

Was it helpful ?

领先技术，赋能语言服务

2023年顶级大型语言模型：最佳LLMs指南

分享

其他推荐

Was it helpful ?

需要什么帮助？