思考和编码能力超越DeepSeek-R1?Claude推出的全球首个混合推理模型什么样 siyushenqi.com • 3天前 • 海外营销 • 阅读 7 会思考的Claude。 作者丨汪酱 编辑丨火狐狸 就在今日凌晨(北京时间),Anthropic投下了两个“王炸”。 一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型,两种思考模式,既能快速响应用户提问,也能如DeepSeek一般展示深入的推理过程。 二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库,并且可以一次性完成超45分钟以上的人工任务,开发、编码、测试流程全包揽,在代码能力的完整性和完成性上远超其它大模型。 会思考的Claude 3.7 Sonnet 自DeepSeek上线以来,我们已经料想到AI大模型赛道会有源源不断的活水涌上来,只不过无论上涌的速度,还是能力的追赶,都太快了。Claude 3.7 Sonnet正是其中一个。 根据Anthropic官方的解释,他们认为推理是前沿模型的一种集成能力,而不是完全独立的模型,因此Claude 3.7 Sonnet和市场上其他推理模型有所不同,它既是一个普通的LLM(能够生成文本并理解语言模式),同时也是一个推理模型(能够将复杂的问题拆解成一个个步骤,显示出其达成最终解决方案的思维路线)。 (图:让其写五个世界上任何地方都找不到的原创笑话,Claude 3.7 Sonnet展示了思考过程) 值得一提的是,根据AWS生成式人工智能副总裁Vasi Philomin表示,Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益,比如可以构建更为复杂的GenAI驱动的应用程序。 (图:Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学上有显著提升) 根据早期测试显示,Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性,能力甚至超过OpenAI o1和DeepSeek R1。 (图:该测试评估了AI模型解决现实世界中软件问题的能力,Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能) 此外,当通过API使用Claude 3.7 Sonnet时,用户还能够控制预算进行思考,比如给其提供一个token的数值,告诉它思考不得超过该数量的token,就能够一定程度上控制预算(目前最高输出限制为128K个token),但需要注意的是,这一方式也会影响模型回答的速度和答案的质量。 安全性方面,Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性,因此减少了45%的“不必要拒绝”,这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。 从其目前的模型形态来看,对于企业级使用者更加友好。目前,Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划,比如免费版、专业版、团队版、企业版,同时不仅能通过Anthropic API接入访问,还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问,除免费版外的所有版本均支持扩展思考模式。 至于定价,无论哪种模式,其API定价均保持不变(和前代的模型一致),输入100万个token收费3美元,输出100万个token收费15美元(其中包括思考过程中使用的token)。相比之下,我们发现OpenAI o3-mini(早于Claude发布的能推理的模型)要更加便宜,输入定价1.1美元/1M token,输出为4.4美元/1M token。 写代码“神器”:Claude Code 虽然Claude 3.7 Sonnet的编码能力已经很强了(经官方测试),但Anthropic还是想将编码能力进一步拉高,进而推出了Claude Code这一专门的智能编程工具。目前,这一工具的功能还在持续优化中,因此尚未正式上线,仅作为研究预览版限量开放,并将根据用户反馈来进行改进。 根据Anthropic官方表示,Claude Code的定位是一个AI编程助手,能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是,Claude Code能直接理解开发者的代码库,并且无缝集成到开发环境之中,经过测试,Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作,极大降低人工成本。 结语 自DeepSeek推出后,AI大模型赛道无疑已经拉响了军备竞赛警报,各大科技公司纷纷加大投入,加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini,凭借其出色的性能和灵活性,在多个应用场景中展现出了强大的竞争力。而现在,Claude 3.7 Sonnet的横空出世,更是将这场竞赛推向了一个新的高潮。 这场AI大模型的军备竞赛,不仅能推动技术的快速发展,同时也将在更多领域发挥关键作用,从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是,在这场竞赛中脱颖而出的AI模型,无疑也将成为各个行业的首选工具,为行业的数字化转型和智能化升级提供强有力的支持。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/32910.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 5.8K 文章 0 评论 296 问题 16 粉丝 私域神器:国内海外私域营销拓客软件 中国做题家,撑起美国AI 上一篇 3天前 阿里云视频生成大模型万相2.1重磅开源 下一篇 3天前 相关推荐 海外营销 全球封锁俄罗斯背后:中国商家的意外财富 曾经的“俄罗斯倒爷”,如今又重出江湖了! siyushenqi.com 2025 年 8 月 5 日 10000 海外营销 美国供应商拒绝降价,Temu处境有点艰难 受关税限制后,Temu被迫转向美国本土供应商,但多数卖家因亚马逊“最低价格协议”拒绝提供同款低价商品,要求Temu必须销售差异化或独家产品。 siyushenqi.com 2025 年 8 月 5 日 12000 海外营销 从《Axie Infinity》的游戏机制来解读区块链游戏 链游整个产业链主要可以分成以下几个参与方,即游戏开发者、打金工会、公链和玩家,其中公链旨在建立一个全球化、去中心、跨平台、高流通性、资产价值统一保障的游戏发行与泛游社群深刻交融的生态系统。 siyushenqi.com 2025 年 8 月 3 日 13000 海外营销 亚马逊或上线低价商店!向Temu卷起? 近期据业内爆料,亚马逊正在秘密筹备一个新项目,名为“低价商店”。该项目采用的是邀请制,类目聚焦在白牌低价时尚家居生活用品,招商几乎对标Temu。 siyushenqi.com 2025 年 8 月 6 日 12000 海外营销 “国货之光”白猫出海要点:产品力、本土化、差异化 当打工人结束一天的工作,拖着疲惫的身体回到家后,无奈地看到椅子上、沙发边或是床尾堆着没洗的衣服时,得益于现代科技的便利,可以尽情地把它们塞到洗衣机里,按下按键,随着水流声,片刻后就能听到它们在洗衣机里滚动的声音。 siyushenqi.com 4天前 6000 海外营销 日本总务省:中国对ChatGPT等生成式AI应用,全球第一 主要查看了日本公民对ChatGPT、Coplilot、Midjourney、Stable Difusion、Gen-2、MusicGen等10多种生成式AI的应用情况,同时对美国、中国、英国和德国的全球主流使用国家进行了横向调查和对比。 siyushenqi.com 3天前 7000 海外营销 国服已有版号,外服上线不到1年,“二次元先帝”还是倒下了 初代《扩散性百万亚瑟王》由SE开发、盛大代理,2013年国服上线后迅速走红,创下单月收入3000万的佳绩,成为早期二游市场的现象级产品。然而,该IP后续作品生命周期普遍较短,国服大多在1至4年内停运,未能持续保持竞争力。 siyushenqi.com 1天前 4000 海外营销 拉丁美洲电子商务创下历史新高,美客多成大赢家! COVID-19促使购物者在线上购物,但并非所有电子商务平台都是一样表现突出。 siyushenqi.com 3天前 7000 海外营销 张一鸣和黄峥,谁才是白牌之王? 抖音电商正无限逼近拼多多。 siyushenqi.com 4天前 5000 海外营销 羊驼进化成鲸鱼,Meta把对齐「自动化」,Humpback击败现有全部LLaMa模型 数据质量很重要 siyushenqi.com 3天前 6000 海外营销 辟蹊径找客户,让你订单不断 找客户是外贸业务员的永恒话题,大家每天都在围着客户转,不停地找邮箱、发开发信,希望能够碰到一两个客户。 但是绝大多数的业务员还是不善于旁敲侧击地找客户,他们还是喜欢直接搜索采购信息,然后找到采购邮箱。诚然,采购信息针对性强邮箱一般是采购的负责人直接使用,如果时效性再强一些,只要你的条件合适,一般都能有不错的效果。 但是,大家都在找采购信息,一条信息可能被几百… siyushenqi.com 2024 年 9 月 20 日 458000 海外营销 专访执御副总裁陈瑜:中国卖家如何成为中东电商“头号玩家”? 中国跨境出口电商在疫情催化下,进一步成熟发展和扩张,无论东南亚、还是欧美市场,到如今都是红海市场。那么,在新一年中,如果问,哪里存在“电商蓝海”? siyushenqi.com 3天前 8000 海外营销 海外开发者谈丨论折叠屏时代手游设计 如何讨好这一批最多金的大R用户 手机厂商现在的屏幕是越来越不按套路出牌 siyushenqi.com 2025 年 8 月 3 日 16000 海外营销 中东独立站电商时机成熟没?到底能不能上车? 与其说是独立站,不如直白一些称它为“DTC”,即Direct To Consumer直面消费者。 siyushenqi.com 3天前 6000 海外营销 社交产品出海买量?ASA才是硬核装备 2020下半年到现在,社交产品整体买量呈逐步上升的趋势,且市场也逐渐成熟,社交头部玩家格局相对稳定,中腰部产品呈现多元化和垂直细分的发展趋势,所以,行业内的竞争更加聚焦于抢占存量市场和用户使用的时长上。 siyushenqi.com 2025 年 8 月 3 日 13000 海外营销 年营收近60亿!他做独立站只不过1年时间 “从代工厂向品牌转型,并成为全球领先的骨传导耳机品牌,韶音用了近10年的时间” siyushenqi.com 4天前 6000 海外营销 行业观察丨全球首个跨渠道应用营销平台ironSource Luna 即将亮相 全球首个跨渠道应用营销平台——ironSource Luna即将面世 siyushenqi.com 4天前 8000 海外营销 破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍 ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。 siyushenqi.com 3天前 5000 海外营销 沙特才是中东最大的电商市场,占比份额45% 沙特经济顾问Nouf Al-Ghamdi表示:沙特在2020年电子商务指数中在20国集团和第49名之间排名全球第11位。 siyushenqi.com 3天前 7000 海外营销 梁文锋和杨植麟再“撞车” 梁文锋所在的DeepSeek和杨植麟所在的月之暗面在大模型领域展开激烈竞争。DeepSeek于4月30日上线了数学定理证明专用模型DeepSeek-Prover-V2,参数规模达671B,性能显著提升;而月之暗面在4月中旬推出了Kimina-Prover,参数规模较小,性能在某些测试上稍逊一筹。 siyushenqi.com 3天前 6000 海外营销 7.16广州丨私域神器联手潮游圈 多个活动引爆2022游戏出海季 7.16日,潮游圈携手私域神器于广州举办“虎运当头·潮游无界——2022潮游圈系列活动” siyushenqi.com 2天前 6000 海外营销 百度AI上线社交服务 高手往往最能拿捏人性。 siyushenqi.com 3天前 8000 海外营销 中东母婴电商Mumzworld被沙特Tamer集团收购 以下文章来源于ePanda出海中东,作者春天列车,内容仅供网友参考学习。扬帆出海欢迎行业优质稿件投稿。 6月28日,Tamer Group宣布正在收购中东母婴产品电子商务平台 Mumzworld,但是没有 siyushenqi.com 3天前 6000 海外营销 Kimi创始人杨植麟最新分享:关于OpenAI o1新范式的深度思考 规模定律之后,大模型发展的下一个范式是强化学习。 siyushenqi.com 3天前 6000 海外营销 百万一台,DeepSeek带火一门新生意 过去一个月,国产算力一体机市场迎来爆发,众多厂商加速布局。一体机集成了CPU、GPU、存储器、操作系统、AI软件平台和模型算法,能够满足企业对AI的高性能需求。目前,包括华为昇腾、中科曙光、浪潮信息等超60家厂商正在加速部署一体机。 siyushenqi.com 3天前 6000 海外营销 5月,上海、成都产品&运营线下沙龙来约! 作为一个充满竞争的行业,产品经理们需要不断掌握新的技能和趋势来保持竞争力。随着AIGC技术的发展,产品设计、产品运营模式和产品AIGC趋势都不断考验着产品经理的能力,不断带来新的机遇和挑战。与此同时,产品经理们在职业生涯中也会遇到各种各样的问题和困境。 siyushenqi.com 3天前 5000 海外营销 出货量超过华为,排名全球第4!抢眼的营收背后谁是“推手”? 打着国潮、国货标签的中国品牌又火了,不同的是,这些火出国门的本土品牌还加速了国货出海时代的到来。 siyushenqi.com 3天前 6000 海外营销 一家做建筑设计的海外游戏公司,推出了一款“扫雷Rogue塔防”? 融合创意值得参考。 siyushenqi.com 1天前 7000 海外营销 破除洗脑包:应用内广告才不是洪水猛兽 你知道手游玩家对游戏的热情有多高涨吗? siyushenqi.com 2025 年 8 月 3 日 20000 海外营销 《饥荒》《缺氧》开发商宣布,被腾讯收购多数股权 今天,外媒传来消息,知名加拿大独立游戏开发商Klei Entertainment已将自己的多数股份交于腾讯手中,不再“独立” siyushenqi.com 3天前 5000 发表回复 请登录后评论...登录后才能评论 提交