思考和编码能力超越DeepSeek-R1?Claude推出的全球首个混合推理模型什么样 siyushenqi.com • 2025 年 8 月 13 日 下午9:50 • 海外营销 • 阅读 41 会思考的Claude。 作者丨汪酱 编辑丨火狐狸 就在今日凌晨(北京时间),Anthropic投下了两个“王炸”。 一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型,两种思考模式,既能快速响应用户提问,也能如DeepSeek一般展示深入的推理过程。 二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库,并且可以一次性完成超45分钟以上的人工任务,开发、编码、测试流程全包揽,在代码能力的完整性和完成性上远超其它大模型。 会思考的Claude 3.7 Sonnet 自DeepSeek上线以来,我们已经料想到AI大模型赛道会有源源不断的活水涌上来,只不过无论上涌的速度,还是能力的追赶,都太快了。Claude 3.7 Sonnet正是其中一个。 根据Anthropic官方的解释,他们认为推理是前沿模型的一种集成能力,而不是完全独立的模型,因此Claude 3.7 Sonnet和市场上其他推理模型有所不同,它既是一个普通的LLM(能够生成文本并理解语言模式),同时也是一个推理模型(能够将复杂的问题拆解成一个个步骤,显示出其达成最终解决方案的思维路线)。 (图:让其写五个世界上任何地方都找不到的原创笑话,Claude 3.7 Sonnet展示了思考过程) 值得一提的是,根据AWS生成式人工智能副总裁Vasi Philomin表示,Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益,比如可以构建更为复杂的GenAI驱动的应用程序。 (图:Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学上有显著提升) 根据早期测试显示,Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性,能力甚至超过OpenAI o1和DeepSeek R1。 (图:该测试评估了AI模型解决现实世界中软件问题的能力,Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能) 此外,当通过API使用Claude 3.7 Sonnet时,用户还能够控制预算进行思考,比如给其提供一个token的数值,告诉它思考不得超过该数量的token,就能够一定程度上控制预算(目前最高输出限制为128K个token),但需要注意的是,这一方式也会影响模型回答的速度和答案的质量。 安全性方面,Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性,因此减少了45%的“不必要拒绝”,这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。 从其目前的模型形态来看,对于企业级使用者更加友好。目前,Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划,比如免费版、专业版、团队版、企业版,同时不仅能通过Anthropic API接入访问,还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问,除免费版外的所有版本均支持扩展思考模式。 至于定价,无论哪种模式,其API定价均保持不变(和前代的模型一致),输入100万个token收费3美元,输出100万个token收费15美元(其中包括思考过程中使用的token)。相比之下,我们发现OpenAI o3-mini(早于Claude发布的能推理的模型)要更加便宜,输入定价1.1美元/1M token,输出为4.4美元/1M token。 写代码“神器”:Claude Code 虽然Claude 3.7 Sonnet的编码能力已经很强了(经官方测试),但Anthropic还是想将编码能力进一步拉高,进而推出了Claude Code这一专门的智能编程工具。目前,这一工具的功能还在持续优化中,因此尚未正式上线,仅作为研究预览版限量开放,并将根据用户反馈来进行改进。 根据Anthropic官方表示,Claude Code的定位是一个AI编程助手,能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是,Claude Code能直接理解开发者的代码库,并且无缝集成到开发环境之中,经过测试,Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作,极大降低人工成本。 结语 自DeepSeek推出后,AI大模型赛道无疑已经拉响了军备竞赛警报,各大科技公司纷纷加大投入,加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini,凭借其出色的性能和灵活性,在多个应用场景中展现出了强大的竞争力。而现在,Claude 3.7 Sonnet的横空出世,更是将这场竞赛推向了一个新的高潮。 这场AI大模型的军备竞赛,不仅能推动技术的快速发展,同时也将在更多领域发挥关键作用,从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是,在这场竞赛中脱颖而出的AI模型,无疑也将成为各个行业的首选工具,为行业的数字化转型和智能化升级提供强有力的支持。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/32910.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 11.2K 文章 0 评论 298 问题 16 粉丝 私域神器:海外私域营销拓客软件 中国做题家,撑起美国AI 上一篇 2025 年 8 月 13 日 下午9:50 阿里云视频生成大模型万相2.1重磅开源 下一篇 2025 年 8 月 13 日 下午9:50 相关推荐 海外营销 腾讯网易急入局,桌崽留存超豆包,游戏新世代由AI队友开启 AI技术正从辅助制作工具转变为游戏的核心玩法,成为玩家在游戏中的“助手”和“队友”。 siyushenqi.com 2025 年 8 月 13 日 53000 海外营销 美团终于上线了AI外卖助手 米鲁旨在通过智能推荐和聊天功能提升用户点餐体验,目前处于内测阶段,功能也有待完善。 siyushenqi.com 2025 年 8 月 13 日 86000 海外营销 风口上的AI玩具:创业蓝海还是资本赌局? 大厂高管、资本与个人创业者集体涌入,AI玩具销量年增超200%,2028年国内市场有望破300亿元。 siyushenqi.com 2025 年 9 月 11 日 42000 海外营销 米哈游《原神 》移动端2个月吸金近4亿美元,日均超过600万美元 Sensor Tower商店情报数据显示,自9月28日全球同步上市以来,米哈游《原神》移动端2个月预估收入达到3.93亿美元。 siyushenqi.com 2025 年 8 月 26 日 72000 海外营销 TikTok电商折戟印尼,树大招风? 中国电商出海,政治风险是最大变量。 siyushenqi.com 2025 年 8 月 12 日 55000 海外营销 为什么同样是玩游戏,TA居然喜欢看广告? 从贴吧论坛到TapTap,越来越多游戏社区里的玩家开始热衷于对广告的讨论。 siyushenqi.com 2025 年 8 月 25 日 67000 海外营销 300万活跃用户、75%自然增长,这款印度TOP1“银发社交APP”靠什么圈住老年人? 银发们有自己的社交搭子。 siyushenqi.com 2025 年 8 月 26 日 66000 海外营销 2022最后一个月,日本市场又杀出个小爆款? 这款手游打的策略,显然是国内厂商最熟悉的影游联动,只是影游联动早已不新鲜,放到今年底二游大战的日本市场,居然还能把一款产品推到小爆。 那么是影实手游做的扎实,还是IP和推广上有什么花活儿? siyushenqi.com 2025 年 8 月 24 日 59000 海外营销 华人内卷大模型 中国科技大厂都希望能早点拿到芯片。 siyushenqi.com 2025 年 8 月 14 日 42000 海外营销 辟蹊径找客户,让你订单不断 找客户是外贸业务员的永恒话题,大家每天都在围着客户转,不停地找邮箱、发开发信,希望能够碰到一两个客户。 但是绝大多数的业务员还是不善于旁敲侧击地找客户,他们还是喜欢直接搜索采购信息,然后找到采购邮箱。诚然,采购信息针对性强邮箱一般是采购的负责人直接使用,如果时效性再强一些,只要你的条件合适,一般都能有不错的效果。 但是,大家都在找采购信息,一条信息可能被几百… siyushenqi.com 2024 年 9 月 20 日 501000 海外营销 暴击!亚马逊FBA配送费叒涨了,1月17日生效! 亚马逊美国站发布了销售佣金和物流费用的变更通知,宣布将调整亚马逊美国站物流配送费用,并于2023年1月17日起生效。 siyushenqi.com 2025 年 8 月 13 日 43000 海外营销 去东南亚找增长洼地!看到希望,看到虚妄 中国的跨境电商从业者们正前赴后继的涌入东南亚。 siyushenqi.com 2025 年 8 月 13 日 51000 海外营销 连续6天霸榜泰国第一,美图靠“蝴蝶裙变装”市值暴涨143亿港元 蓝色蝴蝶裙带火美图。 siyushenqi.com 2025 年 8 月 17 日 51000 海外营销 苹果下架“套壳ChatGPT”的AI应用后,什么才是适合中国创业者的好方向? 8月1日,有消息称根据苹果AppStore官方通知,中国区应用商店所有应用不允许提供ChatGPT相关服务,有提供的应用需要下架整改,包括opencat在内的数十个AI应用被下架 siyushenqi.com 2025 年 8 月 14 日 57000 海外营销 知乎版GPT正式发布 知乎所处的环境和阶段,丝毫不容许任何懈怠。快则生,慢则死。 siyushenqi.com 2025 年 8 月 14 日 51000 海外营销 4年之后,腾讯最初的“3A梦”破灭了吗? 即便是在腾讯内部,NExT也是一个特立独行的存在。 siyushenqi.com 2025 年 8 月 24 日 65000 海外营销 SHEIN 超越 Zara 成为全球最受欢迎的时装零售商 根据比价网站Money.co.uk分析的关键词数据,SHEIN已经取代 Zara 成为全球搜索次数最多的时装零售商。 siyushenqi.com 2025 年 8 月 13 日 42000 海外营销 私域神器每周合作精选No.129|海外社交寻公会代理;二次元APK端找海外发行;海外发行商寻休闲游戏;投资寻海外游戏制作团队 本期精选的合作类型涵盖海外社交寻公会代理;二次元APK端找海外发行;海外发行商寻休闲游戏;投资寻海外游戏制作团队等。接下来就一起看看吧~ siyushenqi.com 2025 年 8 月 17 日 55000 海外营销 Shein和Temu为何在多个国家遭遇监管挑战? 欧盟委员会正在考虑对电子商务平台的收入征收新税,并可能对每件商品征收行政处理费,此举特别针对Shein和Temu等跨境电商平台。 siyushenqi.com 2025 年 8 月 5 日 61000 海外营销 9918捕鱼、捕鱼次时代 9918捕鱼、捕鱼次时代 siyushenqi.com 2025 年 8 月 25 日 63000 海外营销 在国风领域坚持了20年之后,这款游戏想要玩点不一样的 对于一款长线运营的产品来说,20年可能是一个可望而不可即的数字,而对于《大话西游》这个IP来说,20年已然成为一段辉煌的历史。 siyushenqi.com 2025 年 8 月 25 日 71000 海外营销 1个月给“男人们”砸了3亿,这款游戏凭什么让女性疯狂? 玩家:砸锅卖铁也养不起的男人 siyushenqi.com 2025 年 8 月 24 日 70000 海外营销 1瓶+120亿种配方=1亿美金!Function of Beauty的定制洗护之路 年销售额1亿美金!120亿种配方的洗护品牌如何挑战传统大牌? siyushenqi.com 2025 年 8 月 13 日 53000 海外营销 揭秘Shopee:仅成立五年,为何能够反超Tokopedia、Lazada? 5年踌躇满志,Shopee在东南亚实现“反杀” siyushenqi.com 2025 年 8 月 13 日 49000 海外营销 从石油到代码:中东的世纪转型 中东国家的世纪转型,中国公司的冒险乐土。 siyushenqi.com 2025 年 8 月 12 日 43000 海外营销 横山克加盟,B站游戏这款异世界策略攻防手游值得期待吗? 2021年的最后一个月,B站游戏曝光了今年在二次元产品矩阵上的收官之作——《光隙解语》 siyushenqi.com 2025 年 8 月 25 日 69000 海外营销 6月《王者荣耀》继续领跑全球手游市场,MOBA类游戏热度不减 2024年6月的全球手游市场表现依旧活跃,其中腾讯的《王者荣耀》和多款MOBA类游戏在全球下载量和收入方面取得了显著成绩。 siyushenqi.com 2025 年 8 月 18 日 57000 海外营销 张一鸣又出爆款了 字节跳动在国内外多次尝试进入“种草”市场,尽管之前的产品未能成功,但Lemon8在海外的成功可能预示着与小红书的直接竞争。 siyushenqi.com 2025 年 8 月 17 日 45000 海外营销 电商巨头业绩大PK,哪些平台赚到了钱?|Q3财报汇总 2023年第三季度,哪些电商平台交出的答卷最受瞩目? siyushenqi.com 2025 年 8 月 12 日 53000 海外营销 Resolution Games COO:跨平台游戏不会阻止人们接触VR,反而会扩大受众范围 在今年3月下旬召开的游戏开发者大会(GDC 2023)期间,瑞典游戏公司Resolution Games的联合创始人兼COO Paul Brady接受了外媒GamerBraves的采访。 siyushenqi.com 2025 年 8 月 24 日 73000 发表回复 请登录后评论...登录后才能评论 提交