发布日期:2025-03-06 05:43 点击次数:52
[CNMO科技消息]2月25日,根据新智元报道,Anthropic祭出首个混合推理Claude3.7Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型比o3-mini、DeepSeekR1要强上不少,堪称AI编码领域新王者。

根据介绍,Claude3.7Sonnet是Anthropic推出的首款混合推理模型,也是Claude系列中迄今为止最智能的模型,几乎能够及时响应,并进行可扩展的、逐步的思考。

Claude3.7Sonnet能够产生几乎即时的响应或逐步展示思考过程的详细步骤,这些步骤对用户是可见的。API用户还可以精细控制模型的思考时间。在编码和前端网页开发方面,Claude3.7Sonnet得到显著提升。除此之外,他们还推出了一款名为ClaudeCode的命令行工具,用于智能体编码。

目前,ClaudeCode仅作为有限的研究预览版提供,它使开发人员能够直接从他们的终端将大量的工程任务委托给Claude。
在多项基准测试中,「扩展思考」模式加持下的Claude3.7Sonnet,在数学、物理、指令执行、编程等刷新SOTA。相较于上一代Claude3.5Sonnet,数学、编码能力提升10%以上。除了数学,Claude3.7Sonnet(64kextendedthinking)几乎完全碾压o3-mini,DeepSeekR1,与Grok3不相上下。可以说,Claude3.7Sonnet完全是一个最强“软件工程AI”。在SWE-bench上,其还创下了70.3%的高分。

值得一提的是,Claude3.7Sonnet目前已经在Claude.ai平台上线,Web、iOS和Android用户皆可免费体验。
