Anthropic,一个由OpenAI的部分叛逃者创立的创业公司,声称其新聊天机器人Claude 3为人工智能世界开辟了新天地。3月4日发布的这个最新人工智能聊天机器人的表现优于ChatGPT和谷歌Gemini的最先进的模型,它有可能在人工智能界占据首位。Anthropic发布了三个模型——Opus,Sonnet和Haiku——性能从高到低。
3月4日,Anthropic在一篇博客文章中说:“Opus向我们展示了生成式人工智能的外部极限。Claude 3 Opus是我们最智能的模型,具有市场上最佳的性能以处理高度复杂的任务。它能以非凡的流畅性和类人般的理解力处理开放式提示和看不见的场景。”
Anthropic发布的Claude 3重申了这家由达里奥·阿莫迪和丹尼拉·阿莫迪兄妹领导的初创公司在人工智能领域的世界领导者地位。新模型带有Anthropic的”宪法AI“(Constitutional AI)功能,旨在降低聊天机器人的危害性。然而,与以前的模型相比,Claude 3对有争议问题的拒绝率更低,现在的价格也很低。
编码是人工智能最受欢迎的早期用例之一,Claude 3在这方面最明显地优于ChatGPT和Gemini。Claude Opus在零镜头编码方面的成功率为85%,相比之下,GPT-4的成功率为67%,Gemini为74%。Claude在推理、解决数学问题和基础知识(即大规模、多任务的语言理解项目,Massive Multitask Language Understanding,简称MMLU)方面也胜过竞争对手。然而,更便宜、更快的Sonnet和Haiku也可以与OpenAI和谷歌最先进的模式相媲美。
Anthropic的宪法人工智能等功能在该领域越来越重要。上个月,Gemini生成了有争议的回答,谷歌首席执行官桑达尔·皮查伊称之为“完全不可接受”的种族问题,因此暂停使用Gemini的功能。
在Gizmodo对Claude Opus(每月定价20美元)的首次试验中,人工智能聊天机器人似乎可以与行业领导者相媲美。聊天机器人能够进行高级推理,并且能解决问题。面对有争议的问题,Claude 3也比Gemini和ChatGPT回答得更好。
然而,Anthropic有一些其他公司没有的限制。与一些竞争对手不同的是,该公司不提供图像生成功能,而这一功能正成为人工智能聊天机器人的标准。Claude也不能获取实时知识或网上冲浪。其知识库截止为2023年8月。
使用聊天机器人时,Claude 3的低拒绝率显而易见。与Gemini不同,Anthropic的聊天机器人可以轻松回答关于种族、平权运动和热门政治话题的棘手问题。虽然聊天机器人不会发表意见,但在给出平衡的答案方面,Anthropic的聊天机器人比其他机器人做得更好。这些保障措施是Anthropic的创建者们关注的重点,也是他们离开OpenAI的主要原因。
人工智能创业公司的竞争越来越激烈。Anthropic与亚马逊合作,通过零售巨头亚马逊网络服务的人工智能平台——亚马逊Bedrock提供人工智能聊天机器人服务。2月26日,微软宣布与法国人工智能初创公司Mistral建立新的合作伙伴关系,同时继续与OpenAI建立更紧密的合作关系。
通过发行Claude,Anthropic向竞争对手发出了一个信号,动摇了OpenAI作为人工智能界长期领导者的地位。OpenAI发布ChatGPT-4大约有一年了,所以我们可能用不了多久就会看到期待已久的GPT-5如何应对Claude 3的发展。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:李旭媛