中国又一款大模型登顶!外媒:“又一个DeepSeek时刻”

7 月 18 日,万亿参数 MoE 模型 Kimi K2 在权威榜单 LMArena 中位列全球开源第一、总榜第五(前四均为闭源),获社区 3000+ 票支持。

摘要

K2 在编程(SWE Bench Verified)、智能体(Tau2)、工具调用(AceBench)三大基准刷新开源 SOTA,能力对标甚至超越 Claude Opus 4、GPT-4.1,且成本更低。

7 月 11 日开源后 6 天,Hugging Face 下载破 10 万、点赞 1400+,《自然》称其再现“DeepSeek 时刻”,硅谷与全球社区高度关注。

英伟达黄仁勋点名表扬;已接入 OpenRouter、VS Code 等主流开发平台;公司 2023 年 4 月成立,由清华“90 后”杨植麟博士领军,此前因长文本 Kimi 模型快速出圈。

K2 继承并优化 DeepSeek-V3 架构,展示国内模型“互相借鉴、持续迭代”的生态;西方媒体认为中国已逼近模型性能前沿,并质疑西方在开源赛道的落后。

7月18日,国际权威大模型排行榜LMArena揭晓最新排名:北京月之暗面科技有限公司(以下简称“月之暗面”)研发的万亿参数开源模型Kimi K2强势登顶全球开源模型榜首! 同时,Kimi K2获得了超3000张社区投票,在大模型竞技场的总榜上排名第五。


在所有大模型排名中,kimi-k2排名第五,前四模型均为闭源模型

据了解,月之暗面成立于2023年4月,总部位于北京市海淀区知春路,公司致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能。创始人杨植麟博士本科毕业于清华大学,是国内顶尖的AI研究者,被誉为“中国大模型90后第一人”。2024年,月之暗面因推出了具备长文本分析和AI搜索功能的Kimi模型而迅速走红,吸引了大量用户关注。

Kimi K2是月之暗面于今年7月11日正式发布并同步开源的最新一款具备更强代码能力、更擅长通用智能体任务的专家混合架构基础模型,在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等基准性能测试中,均取得开源模型中的SOTA成绩(指在特定任务或基准测试中取得当前最佳表现),展现出在代码、智能体、数学推理任务上的领先能力。


Kimi K2的发布引发了硅谷及全球开源社区的高度关注,发布6天,已在开源平台HuggingFace上收获10万+下载,1400+点赞。全球最大开源AI平台Hugging Face联合创始人托马斯评价称:“来自中国的Kimi团队在过去几个月推出的系列模型令人印象深刻,K2更是挑战了闭源模型的极限。”


月之暗面的优异表现也获得了英伟达创始人黄仁勋的关注,在北京参加链博会期间接受媒体采访时,对DeepSeek、阿里巴巴Qwen、Kimi等中国大模型给予高度评价。



英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。


美国消费者新闻与商业频道CNBC指出,Kimi K2不仅超越了Claude Opus 4,还优于GPT-4.1,且具备更低的使用成本。“中国正在不断逼近甚至达到模型性能的绝对前沿。”美国知名AI研究员内森·兰博特在其研究网站上表示,“西方已在开源模型方面进一步落后。”

目前,Kimi K2已接入OpenRouter、Cline、Visual Studio Code等国际主流开发平台。值得一提的是,据Kimi团队成员刘少伟在知乎上的分享,Kimi K2继承了DeepSeek-V3的架构,并在后者基础上进行增加专家数量、减少注意力头数量等调整,最终实现了较强的性能。这也显示出,中国的开源模型已经形成良好生态,在互相借鉴中持续进步。

本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/32324.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 4天前
下一篇 4天前

相关推荐

发表回复

登录后才能评论
联系我们

联系我们

+86 132-7601-9273

在线咨询: QQ交谈

邮件:siyushenqi@gmail.com

工作时间:周一至周日 9:00-18:30

添加微信
添加微信
WhatsApp Telegram email Email
分享本页
返回顶部

私域神器:一站式全网全渠道拓客营销软件
销售热线:173 5412 3667 (←点击添加微信)