共计 1326 个字符,预计需要花费 4 分钟才能阅读完成。
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
OpenAI最近推出了免费的GPT-4.1,而Anthropic也有了新的进展——
最新版本的Claude Sonnet及Claude Opus正在开发中!

据《The Information》报道,新模型的突出特点是“极限推理”(Extreme reasoning)。
这个功能的核心在于,它通过推理与工具使用之间的动态循环,使得问题处理更加智能化。
预计这一新版模型将在接下来的几周内推出。
参考文章: 如何让你的 iPhone 8 顺利进入恢复模式并解决常见问题?

接下来,让我们更深入地探讨这个新功能的具体细节。
Claude的“极限推理”能力
如前所述,这一功能并不只是提供简单的答案。
当模型面临挑战时,它不会立刻给出解答,而是会停顿、重新分析当前的问题,并在必要时进行策略调整。
而且,这一过程仿佛是人类的思维过程:若模型察觉到自身陷入了困境或答案不够准确,它会自动调整其思路。
当涉及到代码生成的任务时,模型会主动验证所生成的代码,并在发现问题时进行修正,而并非只是简单地返回结果。

参考文章: 独家西瓜写作 AI 工具大放异彩!创作灵感源泉内幕首次揭秘
新的模型确实正在进行实际测试
从曝光的特性来看,新的架构设计更具适应性,能够满足各种任务和场景的需求,同时显著减少了对人工监督的依赖。
该模型具备深入反思上下文的能力,不再仅依赖于统计数据进行语言生成。
这样的协作式推理能力,使得新模型的思维方式与人类更为接近,它不仅仅是个“计算器”,更像是具备推理能力的合作者。
然而,针对这些爆料,有网友对此表示怀疑,认为存在夸大其词的可能性。
不过,另一些网友回应称,这一消息源自The Information,相对来说还是可信的。

参考文章: 所谓的 AI 写作靠谱吗?揭开它能否改变你写作习惯的真相!
除了这些信息,还有网友陆续分享了一些实际测试的证据。
他们发现在Claude的测试中,出现了一个名为Claude Neptune的模型,并且有人将其称作“疑似是Claude 3.8”,其最大tokens数达到了128k。

Anthropic公司宣布了一项新的计划,旨在对其更新版本进行全面的压力测试。这一举措被称为“对更新版本进行压力测试”,旨在确保新模型的稳定性与可靠性。

对于即将推出的Claude新版模型,大家都充满期待,未来的发展值得关注。
相关链接:
[1]https://x.com/kimmonismus/status/1922664649213771807
[2]https://x.com/chetaslua/status/1922488051336401401
[3]https://x.com/bindureddy/status/1922655363599389053
[4]https://www.theinformation.com/articles/anthropics-upcoming-models-will-think-think
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态

