阿里开源Qwen 2，最强中文大模型之一！

siyushenqi.com • 2025 年 8 月 13 日下午11:24 • 行业动态 • 阅读 121

Qwen2一共有5种预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。

6月7日，阿里巴巴正式开源了大模型——Qwen2。

Qwen2一共有5种预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。

github地址：https://github.com/QwenLM/Qwen2

huggingface地址：https://huggingface.co/Qwen

在线demo：https://huggingface.co/spaces/Qwen/Qwen2-72B-Instruct

与相比Qwen1.5，Qwen2的性能实现大幅度提升。例如，本次发布的所有模型都使用了GQA，以便让大家体验到GQA带来的推理加速和显存占用降低的优势。

上下文长度方面，所有的预训练模型均在32K tokens的数据上进行训练，并且研究人员发现其在128K tokens时依然能在PPL评测中取得不错的表现。

但对指令微调模型而言，除PPL评测之外还需要进行大海捞针等长序列理解实验。在该表中，根据大海捞针实测结果，列出了各个指令微调模型所支持的最大上下文长度。而在使用YARN这类方法时，Qwen2-7B-Instruct和Qwen2-72B-Instruct均实现了长达128K tokens上下文长度的支持。

阿里表示，本次对Qwen2投入了大量精力研究如何扩展多语言预训练和指令微调数据的规模并提升其质量，从而提升模型的多语言能力。尽管大语言模型本身具有一定的泛化性，但还是针对性地对除中英文以外的27种语言进行了全面增强。

测试数据方面，在针对预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，例如，Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B，主要益于预训练数据及训练方法的优化。

研究人员全面评估了Qwen2-72B-Instruct在16个基准测试中的表现。Qwen2-72B-Instruct在提升基础能力以及对齐人类价值观这两方面取得了较好的平衡。

相比Qwen1.5的72B模型，Qwen2-72B-Instruct在所有评测中均大幅超越，并且了取得了匹敌Llama-3-70B-Instruct的表现。

在小模型方面，Qwen2系列模型基本能够超越同等规模的最优开源模型甚至更大规模的模型。相比近期推出的最好的模型，Qwen2-7B-Instruct依然能在多个评测上取得显著的优势，尤其是代码及中文理解上，成为最强中文大模型之一。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.siyushenqi.com/33822.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

12.6K 文章

0 评论

425 问题

17 粉丝

私域神器：海外私域营销拓客软件

降价潮背后：大模型落地门槛真的降了吗？

上一篇 2025 年 8 月 13 日下午11:24

AI降噪耳机，可在嘈杂人群中单独通话，看一眼锁定目标

下一篇 2025 年 8 月 13 日下午11:25

行业动态

一周要闻 NO.79丨阿里AI大杀器上线即登榜；爆款短剧单款日投流超20万美刀；祷告类App闷声发财

一起看看这周有哪些出海圈值得关注的大事记吧！

siyushenqi.com
2025 年 8 月 14 日
133000
有着36年历史的《伊苏》，交出了适合入坑的新作

早在《伊苏10》发售前，玩家社区里诸如“哪一部最适合入坑”的问题已经多了起来。

siyushenqi.com
2025 年 8 月 19 日 • 行业动态
158000
雷火UX | GDC2022演讲实录：《逆水寒》的艺术实践——舞蹈与游戏间的细语

《逆水寒》是由网易雷火研发的一款大型多人在线角色扮演游戏，讲述北宋末年一段惨烈的大追捕，并牵扯出江湖恩怨、朝堂纷争、帮派仇杀、感情纠葛、市井百态等北宋生活画卷。

siyushenqi.com
2025 年 8 月 25 日 • 行业动态
151000
近10亿元被“清零”，PayPal账户“封停潮”还在继续！中国卖家该如何追回货款？

从3月以来，网传中国卖家被PayPal划走的资金恐有10多亿元！

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
178000
行业动态

私域神器：如何通过Telegram矩阵提高外贸企业的客户互动

提高客户互动效率增强客户关系管理支持多语言沟通实现精准市场推广促进客户反馈收集提高客户互动效率随着外贸企业竞争的加剧，客户互动的效率成为了决定企业成功的关键因素之一。Telegram矩阵提供了一个强大的平台，使外贸企业能够在多种渠道和设备上实现快速高效的客户互动。通过即时消息、机器人自动化和推送通知，企业能够在最短时间内响应客户需求，大大提高了沟…

siyushenqi.com
5天前
12000
行业动态

《哪吒2》出品方宣布开发3A游戏

光线传媒在2024年度业绩说明会上宣布启动3A游戏项目，计划三年内推出首款作品，并可能同步开发新项目。此举旨在利用其影视IP资源和技术优势，开拓国产3A游戏市场。

siyushenqi.com
2025 年 8 月 17 日
130000
行业动态

蒙古国进口中国的产品有哪些？蒙古国进出口贸易现状

2024年，中蒙双边贸易总额1299亿元（同比增长11.2%）。其中，我国从蒙古进口977亿元（同比增长5.8%），我国向蒙古出口322亿元（同比增长31.4%）。我国贸易逆差655亿元。那么，2024年我国向蒙古出口了哪些产品？从蒙古进口了哪些产品？一、我国向蒙古出口的主要产品我国向蒙古出口的商品广泛，有4000余种（海关HS8位编码），主要品类整理…

siyushenqi.com
2025 年 11 月 17 日
83000
行业动态

过完618，我把用AI客服的店给拉黑了

AI与人的交接棒至关重要。

siyushenqi.com
2025 年 8 月 13 日
119000
在国内如何注册谷歌邮箱？

在国内如何注册谷歌邮箱？

siyushenqi.com
2025 年 8 月 3 日 • 行业动态
146000
行业动态

国外年轻人都用哪些APP购物？Z世代热门电商APP排行榜

你是否听说过TikTok、Discord、Kik或Bitmoji？如果你是Z世代(1997年至2012年出生的人)，那么你很可能使用过这些应用程序。

siyushenqi.com
2025 年 8 月 13 日
145000
行业动态

灵犀互娱《三国志·战略版》总收入突破10亿美元

Sensor Tower商店情报数据显示，灵犀互娱《三国志·战略版》在全球App Store和Google Play的预估总收入突破10亿美元大关。

siyushenqi.com
2025 年 8 月 25 日
217000
行业动态

WhatsApp广告投放效果追踪与数据分析

WhatsApp广告投放增长迅速数据分析提升广告效果用户参与度显著提高转化率优化策略有效多种工具支持数据追踪 WhatsApp广告投放增长迅速 WhatsApp的广告投放正迎来迅速增长，企业和品牌开始认识到在这一平台上进行广告投放的巨大潜力。随着WhatsApp日活跃用户数的不断攀升，广告主们逐渐将这一平台作为新的营销渠道，尤其是在移动广告的推广过程…

siyushenqi.com
5天前
19000
最强AI芯片H200？黄仁勋又在挤牙膏了

英伟达又赢麻了。

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
129000
行业动态

AI独角兽估值狂飙：20亿美元背后的泡沫警钟

成立仅两年的AI招聘网站Mercor完成1亿美元B轮融资，估值达到20亿美元（约合人民币145亿元），是五个月前估值的8倍。Mercor由三位00后创始人创立，他们退学创业，利用AI大模型简化招聘流程，迅速成长为百亿级别独角兽。

siyushenqi.com
2025 年 8 月 13 日
140000
行业动态

跨境年中大促开打，Temu正面狙击亚马逊

7月是跨境电商的促销黄金档，各大平台密集上阵，展开流量争夺战。亚马逊Prime Day首次延长至四天（7月8日至11日），SHEIN于6月23日进行全球夏促，TikTok Shop美区年中大促定档7月7日至19日，沃尔玛大促于7月8日启动，Temu的“Temu Week”从6月28日延续至7月19日。

siyushenqi.com
2025 年 8 月 5 日
148000
行业动态

私域神器每周精选 No.70｜急招海外投放优化师游戏发行寻独代合作

本期精选的合作类型涵盖海外投放优化师招聘、游戏发行寻独代合作等。接下来就一起看看吧~

siyushenqi.com
2025 年 8 月 19 日
140000
行业动态

解码Shein财报：许仰天再度后退，新加坡总部资产大幅飙升

2024年Shein新加坡总部营收破370亿美元、同比增约20%，却因销售费用与竞争加剧，净利润降至11亿美元、下滑逾15%。

siyushenqi.com
2025 年 11 月 19 日
54000
行业动态

DeepSeek打破英伟达“算力霸权”

随着AI推理需求的爆发，ASIC（专用集成电路）芯片逐渐成为算力革命的主导力量。与通用GPU相比，ASIC在推理场景中具有更高的效率和更低的成本，因此吸引了包括DeepSeek、OpenAI、阿里、百度、字节跳动等在内的众多科技巨头纷纷投入自研。ASIC的崛起被视为打破英伟达“算力霸权”的关键力量，其市场规模有望达到900亿美元。

siyushenqi.com
2025 年 8 月 13 日
122000
行业动态

亚马逊做LP，1.5亿美元要投给女性、同性恋等特殊创业者

创业，“九死一生”，而对特殊创业者而言，更是难上加难。

siyushenqi.com
2025 年 8 月 13 日
147000
高人上课：游戏靠数据驱动，如何避免掉进数据陷阱？

竞争越来越激烈的游戏市场，数据分析能力对于一款产品的重要性越来越高，而且同行们接触到的数据也越来越多。

siyushenqi.com
2025 年 8 月 26 日 • 行业动态
195000
行业动态

SHEIN式柔性供应加速卖家产品创新出海，卖家开年爆款销量翻倍

2024跨境电商火热开局，中国卖家在SHEIN平台上抢跑新年商机。

siyushenqi.com
2025 年 8 月 12 日
134000
行业动态

《龙族幻想》《梦幻诛仙》原制作人创业，融资千万美元开发AI游戏

IDG领投、祖龙跟投

siyushenqi.com
2025 年 8 月 18 日
138000
行业动态

美国增加关税对外贸行业的影响有哪些？

美国增加关税对外贸行业的影响是多方面的，具体包括以下几个方面： 1. 出口成本上升关税增加：美国提高关税后，中国出口到美国的商品成本上升，导致中国企业的利润空间被压缩。价格竞争力下降：由于关税增加，中国商品在美国市场的价格可能上涨，削弱了其价格竞争力，可能导致市场份额下降。 2. 贸易量减少需求减少：由于价格上涨，美国消费者和企业可能减少对中国商品的需求，导…

siyushenqi.com
2025 年 3 月 12 日
631001
行业动态

百万一台，DeepSeek带火一门新生意

过去一个月，国产算力一体机市场迎来爆发，众多厂商加速布局。一体机集成了CPU、GPU、存储器、操作系统、AI软件平台和模型算法，能够满足企业对AI的高性能需求。目前，包括华为昇腾、中科曙光、浪潮信息等超60家厂商正在加速部署一体机。

siyushenqi.com
2025 年 8 月 13 日
122000
正规军入局互动影游这款标榜“我都要！”的产品长啥样？

百亿美金级别的出海短剧市场，要迎来一场“完美”共振了

siyushenqi.com
2025 年 8 月 18 日 • 行业动态
149000
FB类似Snapchat的“消失模式”功能登陆Messenger和Instagram

Facebook周四宣布，其类似Snapchat的“阅后即焚”新功能 "消失模式"

siyushenqi.com
2025 年 8 月 26 日 • 行业动态
179000
GEO优化3年内难成气候，但谁不布局谁吃亏

大概就只能想到这么多……

siyushenqi.com
2025 年 8 月 18 日 • 行业动态
138000
公司曾获腾讯投资，这款Furry游戏能成为二次元黑马吗？

美少女真的不吃香了？

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
177000
当陌生人交友遇上MBTI 海外年轻人迷上16型人格恋爱学

全球年轻人上头的“人格恋爱指南”

siyushenqi.com
2025 年 8 月 3 日 • 行业动态
123000
行业动态

2023年4月中国手游发行商全球收入排行榜

Sensor Tower商店情报平台显示，2023年4月共40个中国厂商入围全球手游发行商收入榜TOP100，合计吸金近20亿美元，占本期全球TOP100手游发行商收入40%，详细报道如下。

siyushenqi.com
2025 年 8 月 24 日
135000