本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。



编译| 铭滟
编辑 | 徐珊

智东西7月13日消息,据彭博社报道,生成式AI创企Anthropic公司今天发布了其最新的人工智能模型Claude 2,用户可以通过API以及新的公开测试网站claude.ai进行访问。

Claude 2以大语言模型为基础,可用于总结、搜索、回答问题和编码等书面任务。新发布的Claude 2可以生成比其前身Claude 1.3更长的响应文本。



▲图为Claude 2主界面

一、新版本逻辑推理能力更强、输入输出文本更长

此次新发布的Claude 2较其前身主要包括以下几点:

第一,在不同的测试中,较之Claude 1.3,Claude 2性能约有3%至15%的提升。Claude 2在编程能力、数学能力和推理能力方面比Claude 1.3有所提升。例如,Claude 2在律师资格考试的多选题部分得分比为76.5%,高于Claude 1.3的73.0%。在GRE阅读和写作考试中,Claude 2的得分超过了90%的应届毕业生。它能通过美国医师执业考试的多项选择题部分。在Codex人类级Python编码测试中,它的编程能力更强,获得71.2%的得分比,而Claude 1.3为56%。

第二,Claude 2的输入和输出文本更长。用户可以在每个提示中输入多达100K的tokens(约为75万英文单词,40万中文汉字),这意味着Claude可以处理数百页的技术文档甚至一本书。Claude 2现在也可以输出更长的文档,一次性可以写几千个tokens(约为几千字英文单词或汉字)。

第三,Claude 2公开测试网站。Claude 2可以通过新的公开测试网站claude.ai进行访问,这使得更多的用户可以直接免费体验Claude 2。

用户使用后会发现,Claude的响应速度较快。并且在聊天中,用户可以上传最多5个每个10MB大小的文档,也可以直接在聊天窗口中输入网址进行分析。

二、35人团队专项研发,耗时超2个月

Anthropic是一家由少数前OpenAI员工于2021年创立的人工智能初创公司,该公司定位为构建更安全的聊天机器人。Anthropic总裁兼联合创始人Daniela Amodei表示,在Claude 2的开发中,Anthropic已经花费了至少两个月的时间。除此之外,有一个由30到35人的团队专门负责AI模型的工作,共计有150人为其提供支持。



▲图为Anthropic总裁兼联合创始人Daniela Amodei

比起其他聊天机器人,Anthropic希望Claude能更稳定且不易被用户的话语引导。他们希望Claude尽可能减少一些冒犯性话语或内容生成,这也是ChatGPT类聊天机器人的痛点。该公司也表示,相较于市面现有聊天机器人而言,其测试表明Claude 2对用户一些刻意引导的话语,都能给出较为合适的回应。

Amodei表示,Claude 2“主观上感觉比旧版本好一点”。但她也表示,当今世界上的所有语言模型都存在许多未知的因素,没有一种语言模型能够100%解决机器人用虚假信息进行回应的问题。“Claude 2也是如此。我们也知道它并不完美,仍有其局限性。”

结语:大模型竞赛已进入白热化阶段

总之,Anthropic推出的Claude 2以其在多个基准测试中的改进、支持中文以及新增的附件上传功能,为用户提供了一个强大且便利的免费聊天机器人。并且,依照Anthropic官方说法,未来Claude 2的输入文本长度将翻倍。

此次发布,Claude 2将与OpenAI旗下的ChatGPT展开一场激烈竞争,而Claude 2的公开免费、超强逻辑、超长文本等能力也直击ChatGPT的公众关注重点。两家“内卷”,或许将为人工智能领域带来了新的发展机遇。