思考和编码能力超越DeepSeek-R1？Claude推出的全球首个混合推理模型什么样

siyushenqi.com • 2025 年 8 月 13 日下午9:50 • 行业动态 • 阅读 303

会思考的Claude。

作者丨汪酱

编辑丨火狐狸

就在今日凌晨（北京时间），Anthropic投下了两个“王炸”。

一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型，两种思考模式，既能快速响应用户提问，也能如DeepSeek一般展示深入的推理过程。

二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库，并且可以一次性完成超45分钟以上的人工任务，开发、编码、测试流程全包揽，在代码能力的完整性和完成性上远超其它大模型。

会思考的Claude 3.7 Sonnet

自DeepSeek上线以来，我们已经料想到AI大模型赛道会有源源不断的活水涌上来，只不过无论上涌的速度，还是能力的追赶，都太快了。Claude 3.7 Sonnet正是其中一个。

根据Anthropic官方的解释，他们认为推理是前沿模型的一种集成能力，而不是完全独立的模型，因此Claude 3.7 Sonnet和市场上其他推理模型有所不同，它既是一个普通的LLM（能够生成文本并理解语言模式），同时也是一个推理模型（能够将复杂的问题拆解成一个个步骤，显示出其达成最终解决方案的思维路线）。

（图：让其写五个世界上任何地方都找不到的原创笑话，Claude 3.7 Sonnet展示了思考过程）

值得一提的是，根据AWS生成式人工智能副总裁Vasi Philomin表示，Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益，比如可以构建更为复杂的GenAI驱动的应用程序。

（图：Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色，扩展思维在数学和科学上有显著提升）

根据早期测试显示，Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性，能力甚至超过OpenAI o1和DeepSeek R1。

（图：该测试评估了AI模型解决现实世界中软件问题的能力，Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能）

此外，当通过API使用Claude 3.7 Sonnet时，用户还能够控制预算进行思考，比如给其提供一个token的数值，告诉它思考不得超过该数量的token，就能够一定程度上控制预算（目前最高输出限制为128K个token），但需要注意的是，这一方式也会影响模型回答的速度和答案的质量。

安全性方面，Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性，因此减少了45%的“不必要拒绝”，这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。

从其目前的模型形态来看，对于企业级使用者更加友好。目前，Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划，比如免费版、专业版、团队版、企业版，同时不仅能通过Anthropic API接入访问，还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问，除免费版外的所有版本均支持扩展思考模式。

至于定价，无论哪种模式，其API定价均保持不变（和前代的模型一致），输入100万个token收费3美元，输出100万个token收费15美元（其中包括思考过程中使用的token）。相比之下，我们发现OpenAI o3-mini（早于Claude发布的能推理的模型）要更加便宜，输入定价1.1美元/1M token，输出为4.4美元/1M token。

写代码“神器”：Claude Code

虽然Claude 3.7 Sonnet的编码能力已经很强了（经官方测试），但Anthropic还是想将编码能力进一步拉高，进而推出了Claude Code这一专门的智能编程工具。目前，这一工具的功能还在持续优化中，因此尚未正式上线，仅作为研究预览版限量开放，并将根据用户反馈来进行改进。

根据Anthropic官方表示，Claude Code的定位是一个AI编程助手，能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是，Claude Code能直接理解开发者的代码库，并且无缝集成到开发环境之中，经过测试，Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作，极大降低人工成本。

结语

自DeepSeek推出后，AI大模型赛道无疑已经拉响了军备竞赛警报，各大科技公司纷纷加大投入，加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini，凭借其出色的性能和灵活性，在多个应用场景中展现出了强大的竞争力。而现在，Claude 3.7 Sonnet的横空出世，更是将这场竞赛推向了一个新的高潮。

这场AI大模型的军备竞赛，不仅能推动技术的快速发展，同时也将在更多领域发挥关键作用，从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是，在这场竞赛中脱颖而出的AI模型，无疑也将成为各个行业的首选工具，为行业的数字化转型和智能化升级提供强有力的支持。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.siyushenqi.com/32910.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

13.7K 文章

0 评论

425 问题

17 粉丝

私域神器：海外私域营销拓客软件

中国做题家，撑起美国AI

上一篇 2025 年 8 月 13 日下午9:50

阿里云视频生成大模型万相2.1重磅开源

下一篇 2025 年 8 月 13 日下午9:50

行业动态

OpenClaw数据隐私与合规性管理策略

OpenClaw平台提供强大的数据处理功能，但不自动满足全球隐私法规要求。企业需在数据存储、加密和审计等环节主动采取措施，以确保符合GDPR、CCPA等法律规定，同时降低潜在的法律和合规风险。

siyushenqi.com
2026 年 3 月 10 日
177000
行业动态

微信支付宝，开打Agent

微信、支付宝先后上线官方支付MCP（Model Context Protocol）Server，把“下单-支付-查单”封装成一句自然语言，争夺AI Agent时代的支付入口主导权。

siyushenqi.com
2025 年 8 月 13 日
294000
9月黑马飙升榜 |《羊了个羊》热度席卷非洲

三消游戏《羊了个羊》强势出圈，相似产品在非洲市场表现如何？

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
336000
行业动态

WhatsApp广告投放策略与效果评估

WhatsApp广告投放策略用户隐私保护与广告投放个性化广告投放效果评估与关键指标与其他平台的整合 WhatsApp广告投放策略 WhatsApp广告投放策略旨在为广告主提供一个高效且符合用户隐私要求的广告平台。随着隐私保护意识的不断提高，WhatsApp通过强化数据安全和个性化广告投放来优化广告效果。其广告投放策略不仅注重提高广告的触达率，还考虑了…

siyushenqi.com
2025 年 12 月 27 日
250000
行业动态

年收入超亿美元，出海AI营销新势力赴港IPO：高增长背后的平衡与挑战

冲击资本市场，也意味着需要在更公开、透明的环境中接受市场检阅。

siyushenqi.com
2026 年 3 月 18 日
150000
行业动态

三周赚了50万，已有卖家在Wildberries爆单

Wildberries持续深耕中国市场，释放更多红利。

siyushenqi.com
2025 年 8 月 12 日
332000
TapTap测试8.1分，这款新作会成为年轻人第一款动森like手游吗？

近日，TapTap旗下已有144万预约的自研手游《心动小镇》开启二测。《心动小镇》的出现很惊喜，通过此次测试，有不少玩家称之为最好的“种田手游”，或许其将成为同类作品中的强力竞争者。

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
355000
《王者荣耀》国际服开测，小乔、安琪拉建模发生更改

《王者荣耀》国际服于7月13日晚在墨西哥开启封闭测试，且测试版本仅对有限数量的Android用户开放。

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
360000
行业动态

小扎发布虚拟聊天AI，竟「1:1复刻」Character.AI？用户吐槽：设定太老土了

Meta的AI产品化之路，第一步可能就是先抄Character.AI的虚拟角色聊天功能。更多消息，周三Meta Connect大会揭晓。

siyushenqi.com
2025 年 8 月 13 日
314000
行业动态

OpenClaw项目在GitHub上成长与社区动态

OpenClaw，这个在GitHub上迅速走红的项目，凭借其创新性和开放的开发精神吸引了全球开发者的关注。从最初的概念到如今的爆发式增长，OpenClaw不仅仅是一项技术成果，更是全球开发者社区互动和合作的典范。在本文中，我将带领大家一起走进OpenClaw的成长历程，探讨它的技术架构，社区动态以及未来的可能发展。 OpenClaw项目概述项目背景与目标 …

siyushenqi.com
2026 年 3 月 10 日
186000
行业动态

WhatsApp协议号的技术特点与应用场景

技术概述与协议定位核心技术特性解析协议体系与运行机制典型应用场景分析常见问题在全球即时通信系统中，通信安全与隐私保护已经从附加功能演进为基础能力。WhatsApp 协议号正是在这一背景下形成并持续演进的通信技术体系。它并非单一算法或接口，而是一整套围绕实时消息传递、身份标识、加密交换与会话管理所构建的协议集合，为大规模用户环境下的稳定、安全通信提供…

siyushenqi.com
2025 年 12 月 27 日
304000
行业动态

Meta首个"超级智能"模型亮相

Meta发布首个原生多模态推理模型Muse Spark，由重组后的AI团队开发，支持工具使用、可视化思维链和多智能体协调，采用闭源模式并计划商业化。

转自扬帆出海
2026 年 4 月 10 日
110000
行业动态

OpenClaw支持的平台与通讯工具一览

OpenClaw提供跨操作系统的支持，能够整合多种AI模型和通讯工具，实现信息和任务的高效管理。它适合个人和团队在多平台环境中优化工作流程，提高协作效率和信息流动的顺畅性。

siyushenqi.com
2026 年 3 月 9 日
367000
行业动态

自养号如何降低速卖通采购砍单风险？

在速卖通平台上，砍单问题一直是让卖家们头疼的难题。砍单不仅会导致订单流失，还可能影响店铺的信誉和客户满意度。尤其是对于一些依赖自养号进行采购的卖家来说，砍单问题更是需要重点关注。自养号作为一种常见的采购方式，虽然在操作上具有一定的灵活性，但也容易因为操作不当而引发砍单。因此，卖家们需要深入了解砍单的原因，并结合自养号的特点，采取有效的应对策略，以解决砍单问题…

siyushenqi.com
2025 年 11 月 17 日
217000
行业动态

从 App Annie 全球移动游戏指数看俄罗斯游戏市场

本周，我们来看看俄罗斯的手机游戏世界。

siyushenqi.com
2025 年 8 月 26 日
326000
行业动态

接连四次自降身价，美国版美团混得到底有多惨？

估值缩水80%、IPO遥遥无期……

siyushenqi.com
2025 年 8 月 24 日
327000
行业动态

WhatsApp群发号的内容分发优化策略

精准受众定位内容个性化增强用户互动数据分析与反馈定期优化策略精准受众定位 WhatsApp 群发号的成功与否，首先取决于其能否精准定位目标受众。精准受众定位是内容分发策略的基石，通过分析受众的兴趣、行为、地理位置等多维度数据，确定最具潜力的用户群体。精准的受众定位可以大幅提升信息传递的有效性和用户参与度。案例：某品牌通过 WhatsApp 群发号…

siyushenqi.com
2025 年 12 月 29 日
285000
2020全球手游市场及中国手游出海分析

《2020全球手游市场研究报告》内容涵盖：全球手游市场概览、全球游戏玩法分析、全球手游IP发展、中国出海手游分析、全球手游地区分析等五大部分。

siyushenqi.com
2025 年 8 月 25 日 • 行业动态
332000
行业动态

美国退役四星上将，加入OpenAI董事会

6月14日凌晨，OpenAI在官网宣布，美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长，Paul M. Nakasone（中曾根）加入董事会和安全委员会。

siyushenqi.com
2025 年 8 月 13 日
287000
行业动态

刘强东、美团王兴杀向海外

美团Keeta年内已覆盖沙特20城、计划再进阿联酋等5国，并携Keemart试水即时零售；京东拟185亿元并购欧洲消费电子巨头Ceconomy，刷新中国电商出海纪录。

siyushenqi.com
2025 年 8 月 13 日
335000
拉丁美洲电子商务创下历史新高，美客多成大赢家！

COVID-19促使购物者在线上购物，但并非所有电子商务平台都是一样表现突出。

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
355000
行业动态

SHEIN诉Temu侵权和窃密，涉数万产品

SHEIN在美国哥伦比亚特区地方法院对拼多多和Temu发起诉讼。

siyushenqi.com
2025 年 8 月 5 日
376000
金山世游的这款新品，让我找回了20年前的快乐

由比瑞柏恩研发、金山世游发行的《全民泡泡超人》在6月1日正式上线，首日便斩获了App Store免费榜和Tap Tap热门榜第一，之后更是在端午节假期间连续稳坐榜首5天

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
361000
新加坡推出新电商认证计划，努力破解消费者投诉难题

新加坡消费者需要一个更安全的网络购物环境

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
366000
增长186%，阿里国际站又出大招，海外“直播风暴”即将来袭！

海外直播成跨境新趋势

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
394000
行业动态

扛不住了，180亿独角兽准备卖身

挑战英伟达未半而中道崩殂？

siyushenqi.com
2025 年 8 月 13 日
306000
行业动态

2025，“微短剧+”要“起飞”

2025年1月4日，国家广播电视总局办公厅发布《关于实施“微短剧 +”行动计划赋能千行百业的通知》，从多方面助力微短剧发展，使其迎来新机遇，有“起飞”之势，为微短剧行业注入了强劲动力，推动其在内容创作、产业融合等方面实现更大突破。

siyushenqi.com
2025 年 8 月 17 日
294000
行业动态

海外询盘转化全流程分析与高效落地页优化策略

海外询盘转化的全流程拆解以用户行为为核心的需求洞察高效落地页的系统化优化策略持续优化：数据驱动与A/B测试机制海外询盘转化的全流程拆解海外询盘转化并非单一页面或单次行为的结果，而是一个由流量获取、访问承接、信息传递、信任建立到最终行动触发所构成的完整链路。若将这一过程比作一条生产线，任何一个环节的效率下降，都会直接影响最终的转化“产出”。因此，从全…

siyushenqi.com
2025 年 12 月 30 日
304000
行业动态

苹果下架“套壳ChatGPT”的AI应用后，什么才是适合中国创业者的好方向？

8月1日，有消息称根据苹果AppStore官方通知，中国区应用商店所有应用不允许提供ChatGPT相关服务，有提供的应用需要下架整改，包括opencat在内的数十个AI应用被下架

siyushenqi.com
2025 年 8 月 14 日
404000
行业动态

SHEIN重仓的拉美市场，电商玩家们怎么入局

SHEIN重仓的拉美市场，电商玩家们怎么入局

siyushenqi.com
2025 年 8 月 12 日
323000