如果你本月关注谷歌I/O发布会、OpenAI的春季更新或微软Build,你可能会听到人工智能代理这个术语在上个月出现了很多次。AI代理正迅速成为科技领域的下一个大事件,但它们到底是什么呢?为什么突然每个人都在谈论AI代理?
谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)在谷歌I/O发布会上描述了一个人工智能系统,它可以代表你归还一双鞋。微软宣布了可以像虚拟员工一样独立工作的Copilot人工智能系统。与此同时,OpenAI推出了一个人工智能系统,GPT-4 Omni,它可以看,听、说。在此之前,OpenAI首席执行官萨姆·奥特曼(Sam Altman)告诉《麻省理工科技评论》,乐于助人的代理拥有该技术的最佳潜力。这些类型的系统是所有人工智能公司都试图实现的新基准,但这说起来容易做起来难。
简单来说,AI代理只是独立做一些事情的AI模型。就像《钢铁侠》里的贾维斯,《星际穿越》里的塔斯,《2001:太空漫游》里的HAL 9000。它们比我们熟悉的聊天机器人更先进,它们不仅仅作出响应——还会采取行动。首先,谷歌、微软和OpenAI正试图开发能够处理数字动作的代理。这意味着他们正在教人工智能代理在你的计算机上使用各种API。理想情况下,AI代理可以按下按钮,做出决策,自主监控频道,并发送请求。
“我同意未来是代理的时代,”Echo AI创始人兼首席执行官Alexander Kvamme说。他的公司建立了人工智能代理,这些AI代理可以分析企业与客户的对话,并就如何改善这种体验提供见解。“业界已经讨论这个话题很多年了,但还没有实现。这是一个很难解决的问题。”
Kvamme说,一个真正的代理系统需要独立地做出几十个或几百个决定,这是一件很难自动化的事情。例如,要退回一双鞋,正如谷歌的皮查伊解释的那样,人工智能代理可能需要扫描你的电子邮件来寻找收据,提取你的订单号和地址,填写退货单,并代表你完成各种行动。在这个过程中,有很多你想都没想过的决定,但你是下意识地做出的。
正如我们所看到的,即使在受控环境中,大型语言模型(large language models,简称LLMs)也不是完美的。奥特曼最近喜欢说ChatGPT是“难以置信的愚蠢”,他并没有完全错。当你要求LLMs在开放的互联网上独立工作时,他们很容易出错。但这正是包括Echo AI在内的无数初创公司以及谷歌、OpenAI和微软等大公司正在努力的方向。
如果你可以数字化地创建代理,那么创建与物理世界一起工作的代理就没有太大的障碍。你只需要把这个任务编程给机器人。然后你真的进入了科幻小说类似的东西,因为人工智能代理提供了给机器人分配任务的潜力,如“接受餐桌订单”或“在这个屋顶上安装所有的木瓦”。我们还有很长的路要走,但第一步是教人工智能代理做简单的数字化任务。
在人工智能代理的世界里有一个经常被谈论的问题:确保你设计的代理不会做得太好。如果你建立了一个代理来退回鞋子,你必须确保它不会退回你所有的鞋子,或者退回你Gmail收件箱里所有有收据的东西。虽然这听起来很傻,但有一小群人工智能研究人员担心过于坚定的人工智能代理可能会给人类文明带来厄运。我想当你在创作科幻小说时,这是一个合理的担忧。
而乐观主义者们,如Echo AI,他们相信这项技术将使人有自主感。人工智能领域的这种分歧非常明显,但乐观主义者看到了人工智能代理的解放效应,这可与个人电脑相媲美。
Kvamme说:“我非常相信(代理)将要解决的许多工作是人类不愿意做的。”“在人们的生活中,时间有更高的价值。但同样,人们必须适应这种改变。”
人工智能代理的另一个用例是自动驾驶汽车。特斯拉和Waymo目前是这项技术的领先者,汽车使用人工智能技术在城市街道和高速公路上行驶。虽然比较小众,但自动驾驶技术是人工智能代理的一个相当发达的领域,我们已经看到人工智能在现实世界中运行。
那么,怎样才能让我们实现人工智能可以归还你鞋子的未来呢?首先,底层人工智能模型可能必须变得更好、更准确。这意味着ChatGPT、Gemini和Copilot的更新可能会先于功能齐全的代理系统。人工智能聊天机器人仍然必须克服他们巨大的幻觉问题,许多研究人员找不到解决这个问题的答案。但是代理系统本身也需要更新。目前,OpenAI的GPT商店是开发代理网络的最大努力,但即使这样也不是很先进。
虽然先进的人工智能代理肯定还没有出现,但这是当今许多大大小小的人工智能公司的目标。这可能会让人工智能在我们的日常生活中变得更加有用。虽然这听起来像科幻小说,但目前正有数十亿美元被用来使代理成为现实。然而,对于那些努力让聊天机器人可靠地回答基本问题的人工智能公司来说,这是一个很高的承诺。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:李旭媛