笑忘心 发表于 2025-5-15 23:50

新版Claude曝光:“极限推理”成最大亮点

O家(OpenAI)刚免费上线GPT-4.1,A家(Anthropic)这边也被曝出新消息——新版Claude SonnetClaude Opus,已经在路上了!https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0515%2Fef519608j00swaai3001ed000u000drm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

这一消息来自The Information,根据它的说法,新版模型最大的亮点,就是“极限推理”(Extreme reasoning)。简单来说,这个新功能是通过在推理和工具使用之间建立动态循环,能够更智能地处理问题。预计新版模型将在未来几周内发布。接下来,我们深入了解一下这个新功能。
可以“极限推理”的Claude
正如刚才我们提到的,这个功能并不是简单地回答问题。例如模型在遇到困难时不会直接给出答案,而是会暂停、重新评估问题,并在必要时调整策略。而且类似人类思考的过程,如果模型发现自己陷入困境或答案不准确,它会自动调整方向对于生成代码的任务,模型会自动测试生成的代码,并在发现错误时进行修正,而不是简单地输出结果。从曝光的特性来看,新模型的架构更加适应不同的任务和场景,减少了对人类监督的依赖。模型能够结合上下文进行深度反思,而不仅仅是基于统计的语言生成。这种协作式推理,让新模型更接近于人类协作者的思维方式,能够像人类一样进行推理,而不仅仅是作为“计算器”。不过毕竟爆料,有网友对此持怀疑态度,认为有炒作的嫌疑。但也有网友回应称,这是来自The Information的消息,还是比较靠谱的信源。
确实有个新模型在实测了
除了这个信源之外,也有网友陆续发出一些实测的证据。他们发现了Claude在偷偷实测一个叫做Claude Neptune的模型,并且称它“疑似是Claude 3.8”(最大tokens数达到了128k)。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0515%2F6e7301a1j00swaai3000xd000u000fgm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

而Anthropic这边,官方也发布了一项正在进行的计划,称是“对更新版本进行压力测试”https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0515%2Fe78d34a1j00swaai30032d000u000qfm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

对于新版Claude的模型,我们可以期待一波了~
https://x.com/kimmonismus/status/1922664649213771807
https://x.com/chetaslua/status/1922488051336401401
https://x.com/bindureddy/status/1922655363599389053
https://www.theinformation.com/articles/anthropics-upcoming-models-will-think-think
页: [1]
查看完整版本: 新版Claude曝光:“极限推理”成最大亮点