高昂的人工智能训练成本一直是采用人工智能的一大障碍,阻碍了许多公司实施人工智能技术。根据 2017Forrester 咨询报告,48% 的公司强调,高昂的技术成本是不实施人工智能驱动解决方案的主要原因之一。
然而,最近的发展表明,人工智能训练成本正在迅速下降,预计未来这一趋势将持续下去。根据 2023 ARK 投资大创意报告,类似于 GPT-3 级性能的大型语言模型的训练成本从 2020 年的 460 万美元骤降至 2022 年的 45 万美元,每年下降 70%。
让我们进一步探讨人工智能训练成本下降的这一趋势,并讨论导致这一下降的因素。
人工智能训练成本随着时间的推移发生了哪些变化?
根据最近的 ARK Invest 2020 研究,目前,深度学习模型的训练成本比摩尔定律快 50 倍。事实上,在许多使用案例中,运行人工智能推理系统的相关费用已大幅降低到几乎可以忽略不计的水平。
此外,在过去几年中,训练成本每年下降十倍。例如,2017 年,在公共云上训练一个像 ResNet-50 这样的图像分类器的成本约为 1,000 美元,但到 2019 年,这一成本已大幅下降到约 10 美元。
这些发现与 2020年的一份报告相吻合。该报告发现,自 2012 年以来,训练一个人工智能模型执行相同任务所需的计算能力每 16 个月就会减少 2 倍。
此外 ARK 报告 强调了人工智能训练成本的下降。报告预测,到 2030 年,GPT-3 级模型的训练成本将降至 30 美元,而 2022 年则为 45 万美元。
GPT-3 级性能的训练成本 2023 ARK 投资大创意
导致人工智能训练成本下降的因素
随着人工智能技术的不断改进,人工智能模型的训练变得越来越便宜和容易,从而使更多的企业可以利用这些技术。包括硬件和软件成本以及基于云的人工智能在内的几个因素,促使人工智能训练成本不断下降。
下面我们就来探讨一下这些因素。
- 硬件
人工智能需要成本高昂的专业高端硬件来处理大量数据和计算。英伟达(NVIDIA)、IBM 和谷歌等公司提供 图形处理器 和 TPU 来执行高性能计算(HPC)工作负载。高昂的硬件成本使得人工智能难以大规模普及。
不过,随着技术的进步,硬件成本正在降低。 2023 ARK 投资报告根据莱特定律预测,人工智能相关计算单元(RCU)的生产成本(即人工智能训练硬件成本)每年应降低 57%,到 2030 年,人工智能训练成本将降低 70%,如下图所示。
人工智能训练硬件成本 ARK 投资 2023 大创意
- 软件
人工智能软件训练成本可年均降47%,通过提高 效率和可扩展性。软件框架如 TensorFlow 和 PyTorch 使开发人员能够在分布式系统上以高性能训练复杂的深度学习模型,从而节省时间和资源。
此外,像 Inceptionv3 或 ResNet 和迁移学习技术允许开发人员对现有模型进行微调,而不是从头开始训练,因此也有助于降低成本。
人工智能软件训练成本 2023 年 ARK 投资大创意
- 基于云的人工智能
基于云的人工智能训练可按需提供可扩展的计算资源,从而降低成本。通过 “即用即付 “模式,企业只需为计算资源付费。此外,云提供商还提供预建的人工智能服务,可加速人工智能训练。
例如 Azure 机器学习 是一种基于云的预测分析服务,可快速开发和实施模型。它提供灵活的计算资源和内存。用户可以快速扩展到数千个 GPU,以提高计算性能。它允许用户通过网络浏览器在预配置的人工智能环境中工作,消除了设置和安装开销。
人工智能训练成本下降的影响
人工智能训练成本的降低对各个行业和领域都有重大影响,可提高创新能力和竞争力。
下面我们就来讨论其中的几个方面。
- 大规模采用先进的人工智能聊天机器人
由于人工智能成本的下降,人工智能聊天机器人正在崛起。尤其是在 OpenAI 的 ChatGPT 和 GPT-4 (生成式预训练转换器)之后,希望开发具有类似或更好功能的人工智能聊天机器人的公司数量明显激增。
例如,在 2022 年 11 月发布五天后,ChatGPT 就积累了 100 万用户。虽然目前大规模运行该模型的成本约为每次查询 0.01 美元,但根据赖特定律预测,到 2030 年,类似 ChatGPT 的聊天机器人应用将以更低的成本大规模部署(估计运行十亿次查询的成本为 650 美元),每天可能处理 85 亿次搜索,相当于谷歌搜索的水平。
每十亿次查询执行人工智能推断的成本 ARK Invest Big Ideas 2023
- 生成式人工智能的使用增加
人工智能训练成本的下降导致了生成式人工智能技术开发和应用的激增。 2022 年,在 DALL-E 2、Meta Make-A-Video 和 Stable Diffusion 等创新生成式人工智能工具的推动下,生成式人工智能的使用大幅增加。2023 年,我们已经见证了以 GPT-4 为代表的突破性模型。
除了图像和文本生成,生成式人工智能还在帮助开发人员编写代码。 GitHub Copilot 等程序可以帮助开发人员在一半的时间内完成编码任务。
完成编码任务所需的时间 ARK Invest Big Ideas 2023
- 更好地利用训练数据
人工智能训练成本的降低有望更好地利用机器学习训练数据。例如 ARK 2023 投资报告 表明,到 2030 年,训练一个参数和标记(token)分别是 GPT-3 (1750 亿个参数)57 倍和 720 倍的模型的成本预计将从 170 亿美元降至 60 万美元。
在这个低成本计算的世界里,数据的可用性和质量将是开发高级机器学习模型的主要限制因素。然而,训练模型将开发出处理约 162 万亿个单词或 216 万亿个标记的能力。
(机器翻译,轻度译后编辑,仅供参考)
编辑:胡跃