共计 1706 个字符,预计需要花费 5 分钟才能阅读完成。
作者 | 周愚
编辑 | 邓咏仪
Anthropic,这家OpenAI的主要竞争者,近日又有了重要进展。
在美国时间7月11日,这个由OpenAI前高管创办的人工智能公司,隆重推出了最新的AI模型Claude 2及其网页测试版。该网页测试版现阶段可以免费使用,并支持中文交流,不过目前仅限于美国和英国的用户。
据悉,Claude 2的企业API定价与Claude 1.3一致,每生成1000个单词的费用约为0.0465美元。Anthropic希望在接下来的几个月内,能够将Claude 2推广到全球用户。
Claude 2的一个显著改进是其输入的长度限制,达到了10万token,这几乎是目前市场上可用的模型中最大的。10万token的容量使得Claude 2能够一次性处理大约75000个单词,这相当于数百页的技术文档,甚至是整本书籍。
另外,该模型在编程、数学和推理能力方面也有显著提升。在Codex HumanEval(Python编程测试)中,Claude的得分从1.3版本的56.0%提高至2版本的71.2%。在小学数学问题(GSM8K)、多学科问答(MMLU)以及科学问题(ARC-Challenge)等测试中,Claude 2的表现同样有了显著进步。

与Claude 1.3相比,Claude 2同样具备文档搜索、总结、代码分析和编写等功能。
根据官方网站的示例,用户只需上传待分析的文档,并发出相关指令,Claude便能自动阅读并作出反应。在示例中,上传的两个pdf文件总计近300k,包含超过83000个token,而Claude 2依然成功完成了任务。
36氪尝试用中文向Claude 2发送指令并输入了一份英文文档。虽然Claude 2提供了相对清晰的答案,但可以明显感觉到其翻译腔,尚未达到自然中文对话的流畅程度。

阅读pdf并解答问题。

此外,Anthropic在其研究论文中指出,Claude 2具备支持20万token上下文的潜力,但目前尚未向外界开放。
为了进一步测试Claude 2的中文处理能力,36氪向其提出了一道高难度的“谐音梗”问题。起初,Claude 2显然未能捕捉到问题的真正含义,仍在努力给出符合逻辑的答案。
当36氪提供正确答案——“巴黎世(是)家”后,Claude 2虽然意识到这道问题可能是个“谐音梗”,但随即开始了一番颇为离奇的回答。
参考文章:AI 写作软件颠覆传统写作!全新工具助你轻松打造优质内容
Claude 2:交互式编程的新突破
在代码方面,官方展示了一种方法,利用Claude 2在静态地图上添加交互动态效果。用户只需将地图的JavaScript文件输入聊天框,便可以请求Claude 2分析代码的功能,随后再输入希望实现的新功能,Claude 2则会自动生成相应的代码。
36氪也尝试用中文向Claude 2提问,请求生成一个五子棋游戏的代码。虽然Claude 2迅速生成了可运行的代码,但在胜负判断逻辑上仍然存在不足。不过,Claude 2提供了相应的解释,鼓励用户继续扩展其他代码。

分析代码功能。
参考文章: 汕尾 AI 写作新动态曝光!独特功能应用掀创作界热议

生成新代码。
参考文章: 用 AI 写作软件免费生成高质量论文,助力学术创作的必备利器!

此次更新还包含了最新的数据集,这些数据包括网站内容、第三方授权数据以及2023年初用户自愿提供的信息。与此形成对比的是,OpenAI的ChatGPT在未联网的情况下,其数据集仍停留在2021年底。
不过,Anthropic的上市负责人Sandy Banerjee在接受TechCrunch采访时指出,Claude 2与其前身1.3在模型方面并无本质区别,而是“不断迭代的模型开发方法所带来的成果”。
截至目前,Anthropic声称已有“数千名客户”以及一批合作伙伴。谷歌作为公司的投资者之一,已承诺投资3亿美元,以换取该公司10%的股份。
此外,Anthropic表示将继续致力于大模型的研发,预计在未来两年内公司需要约50亿美元的资金,其中大部分将用于计算资源的投入。

