最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

siyushenqi.com • 2025 年 8 月 13 日下午11:39 • 海外营销 • 阅读 93

在官方博客中，Meta 表示：「直到今天，开源大语言模型在功能和性能方面大多落后于封闭模型。现在，我们正在迎来一个开源引领的新时代。我们公开发布 Meta Llama 3.1 405B，我们认为这是世界上最大、功能最强大的开源基础模型。迄今为止，所有 Llama 版本的总下载量已超过 3 亿次，我们才刚刚开始。」

刚刚，大家期待已久的 Llama 3.1 官方正式发布了！

Meta 官方发出了「开源引领新时代」的声音。

Meta 创始人、CEO 扎克伯格也亲自写了篇长文《Open Source AI Is the Path Forward》，阐述为什么开源对所有开发者、对 Meta、对世界都是好事。

此次发布的要点包括：

最新的系列模型将上下文长度扩展到了 128K、增加了对八种语言的支持，并包括顶级开源模型 Llama 3.1 405B；
Llama 3.1 405B 独树一帜，Meta 官方称其可与最好的闭源模型相媲美；
此次发布还提供了更多与模型配合使用的组件（包括参考系统）来将 Llama 打造为一个系统；
用户通过 WhatsApp 和 meta.ai 就可以体验 Llama 3.1 405B 了。

地址：https://llama.meta.com/

各位网友可以下载尝鲜了。

Llama 3.1 介绍

Llama 3.1 405B 是首个公开可用的模型，在常识、可操纵性、数学、工具使用和多语言翻译等方面可与顶级 AI 模型相媲美。

Meta 表示最新一代的 Llama 将激发新的应用程序和建模范式，包括利用合成数据生成来提升和训练更小的模型，以及模型蒸馏 —— 这是一种在开源领域从未达到的能力。

与此同时，Meta 还推出了 8B 和 70B 模型的升级版本，支持多种语言，上下文长度达到 128K，推理能力也更强。最新模型支持高级用例，例如长篇文本摘要、多语言对话智能体和编码助手。

举例来说，Llama 3.1 可以将故事翻译成西班牙语：

当用户提问「有 3 件衬衫、5 条短裤和 1 条连衣裙，假如要旅行 10 天。准备的衣服够不够？」模型能够快速的进行推理。

长上下文：对于上传的文档，Llama 3.1 能够分析和总结最多 8k token 的大型文档。

编码助手，对于用户要求，可以快速编写代码：

此外，Llama 3.1 405B 的开发者还发推文「剧透」，表示开发 GPT-4o 一样集成语音和视觉能力的模型还在开发中。

Meta 还对开源协议进行了更改，允许开发人员使用 Llama 模型（包括 405B）的输出来改进其他模型。此外，为了兑现开源承诺，从今天开始，Meta 将这些模型提供给社区，用户可以在 llama.meta.com 和 Hugging Face 上下载。

下载地址：

https://huggingface.co/meta-llama
https://llama.meta.com/

模型评估

Meta 在超过 150 个基准数据集上进行了评估，此外，他们还进行了广泛的人类评估。

实验结果表明，旗舰模型 Llama 3.1 405B 在一系列任务中与领先的基础模型包括 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 具有竞争力。此外，8B 和 70B 小型模型与具有相似数量参数的闭源和开源模型具有竞争力。

模型架构

作为 Meta 迄今为止最大的模型，使用超过 15 万亿个 token 训练 Llama 3.1 405B 是一项重大挑战。为了实现这种规模的训练，Meta 优化了整个训练堆栈，并在超过 16,000 个 H100 GPU 上训练，使该模型成为第一个在此规模上训练的 Llama 模型。

为了解决这个问题，Meta 在设计上做出了以下一些选择，重点保持模型开发过程的可扩展性和简单性。

选择了仅进行少量调整的标准解码器 Transformer 模型架构，而不是混合专家模型，以最大限度地提高训练稳定性。
采用迭代后训练程序，每轮都使用监督微调和直接偏好优化。这使 Meta 能够为每轮创建最高质量的合成数据，并提高每项功能的性能。

与之前版本的 Llama 相比，Meta 提高了用于预训练和后训练的数据数量和质量，如为预训练数据开发更仔细的预处理和管理管道，为后训练数据开发更严格的质量保证与过滤方法。

正如语言模型 scaling laws 所预期的那样，Meta 新旗舰模型优于使用相同程序训练的较小模型。Meta 还使用 405B 参数模型来提高较小模型的后训练质量。

为了支持 405B 模型的大规模推理产出，Meta 将模型从 16 比特 (BF16) 量化为 8 比特 (FP8) ，有效降低了所需的计算要求，并允许模型在单个服务器节点运行。

指令和聊天微调

Llama 3.1 405B 努力提高模型响应用户指令的实用性、质量和详细指令遵循能力，同时确保高水平的安全性。

在后训练阶段，研究团队通过在预训练模型的基础上进行几轮对齐来构建最终的聊天模型。每轮都涉及监督微调（SFT）、拒绝采样（RS）和直接偏好优化（DPO）。

研究团队使用合成数据生成来产生绝大多数 SFT 示例，并多次迭代以在所有功能上生成越来越高质量的合成数据。此外，研究团队还采用了多种数据处理技术，以过滤这些合成数据，达到最高质量，并可以跨功能扩展微调数据量。

Llama 系统

Llama 模型一直是作为 AI 系统的一部分而存在的，可以协调多个组件，包括调用外部工具。Meta 旨在超越基础模型，让开发人员能够灵活地设计和创建符合其愿景的定制产品。

为了在模型层之外负责任地开发人工智能，Meta 发布了一个完整的参考系统，其中包括多个示例应用程序以及新组件，例如 Llama Guard 3（一种多语言安全模型）和 Prompt Guard（一个 prompt 注入过滤器）。这些示例应用程序是开源的，可以由开源社区构建。

为了与行业、初创公司和开源社区进行更广泛的合作，帮助更好地定义组件的接口，Meta 在 GitHub 上发布了针对「Llama Stack」的评论请求。Llama Stack 是一组标准化接口，用于构建规范的工具链组件（微调、合成数据生成）和智能体应用程序。这有助于更轻松地实现互操作性。

与封闭模型不同，Llama 模型权重可供下载。开发人员可以根据自己的需求和应用程序完全定制模型，在新数据集上进行训练，并进行额外的微调。

使用 Llama 3.1 405B 进行开发

对于普通开发者来说，部署 405B 这样大规模的模型无疑是一项挑战，它需要大量的计算资源和专业技能。在与开发者社区的交流中，Meta 意识到，生成式 AI 的开发不仅仅是给模型输入 prompt。他们期望所有开发者都能在以下领域充分开发 Llama 3.1 405B 的潜力：

实时和批量推理
监督式微调
测试和评估模型在特定应用中的性能
持续预训练
检索增强生成（RAG）
函数调用
合成数据生成

发布即日起，Llama 3.1 405B 模型的所有高级功能都将开放，开发者们可以即刻上手。开发者们还可以探索更高阶的工作流，例如基于模型蒸馏的合成数据生成。这次升级，Meta 还无缝集成了合作伙伴 AWS、NVIDIA 和 Databricks 提供的解决方案，以实现更高效的检索增强生成（RAG）。此外，Groq 已经为在云端部署模型进行了低延迟推理的优化，也对本地系统进行了类似的性能提升。

Meta 这次还为 Llama 3.1 405B 内置了「工具大礼包」，内含 vLLM、TensorRT 和 PyTorch 等关键项目，从模型开发到部署「开箱即用」，一步到位。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.siyushenqi.com/33978.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

11.6K 文章

0 评论

420 问题

16 粉丝

私域神器：海外私域营销拓客软件

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒

上一篇 2025 年 8 月 13 日下午11:39

几十秒生成一个游戏角色，AI技术狂卷3D大模型

下一篇 2025 年 8 月 13 日下午11:39

海外营销

内容运营迎来新赛点，开发者该如何发力游戏社区？

随着玩家总数增长放缓，人口红利正在逐渐消失，整个游戏市场已然步入了存量阶段。

siyushenqi.com
2025 年 8 月 3 日
94000
海外营销

首测即获得TapTap9.5分，这款游戏会不会是下一个二次元爆款？

最具电影感的手游。

siyushenqi.com
2025 年 8 月 25 日
112000
海外营销

如何追踪ACH付款：完整指南

掌握ACH付款追踪技巧，能助您更从容管理电子支付事务。只要理解ACH追踪号码的作用，并依照以上步骤操作，便能高效应对付款延误、错误或欺诈问题。虽然ACH交易稳定可靠，但如PhotonPay光子易这类平台，凭借先进追踪工具和多币种支持，为全球支付提供了强大替代方案。

siyushenqi.com
2025 年 8 月 6 日
99000
海外营销

聊聊出海中东智能家居市场

智能设备扩展到无数技术，例如可以通过智能手机或自动驾驶汽车控制的灯、摄像头和百叶窗。

siyushenqi.com
2025 年 8 月 13 日
97000
海外营销

爆款收入增长162%之后，点点互动开始发力中轻度游戏了？

点点互动的《无尽冬日（Whiteout Survival）》在国内外市场均取得了巨大成功，收入同比增长超过162%，这为公司提供了探索新领域的底气。

siyushenqi.com
2025 年 8 月 17 日
96000
海外营销

AI练习生里的「星二代」

当前AI应用像练习生一样，虽然被寄予厚望，但尚未真正走进大众生活，缺乏国民级偶像产品。

siyushenqi.com
2025 年 8 月 13 日
76000
海外营销

四年前的黑马，如今仍能登上畅销Top 3

这个五一假期，我被《明日方舟》淹没了。

siyushenqi.com
2025 年 8 月 24 日
101000
海外营销

《盗贼之海》Steam销量破100万，PC已成主机游戏不可忽视的平台？

种种迹象显示，越来越多的主机游戏正在选择“投靠”PC平台，而且效果着实不差。

siyushenqi.com
2025 年 8 月 13 日
91000
海外营销

Flat Ads、CM.com、Vonage确认入驻PAGC 2024 | 第四届全球产品与增长展会！

恭喜Flat Ads、CM.com、Vonage作为展商入驻第四届全球产品与增长展会。

siyushenqi.com
2025 年 8 月 18 日
104000
海外营销

腾讯投资了一家TapTap预约超40万的二次元CP

腾讯再出手投资游戏公司。

siyushenqi.com
2025 年 8 月 25 日
111000
海外营销

“拿捏”Z世代？印度本土电商巨头Flipkart又有新动作！

近日，印度电商巨头Flipkart在其应用程序中推出了一个新兴的时尚购物平台——Spoyl，以此为“Z世代”提供更多的购物选择。

siyushenqi.com
2025 年 8 月 13 日
85000
海外营销

网易一连曝出3款“放置卡牌”，光美术就吊打一众厂商？

在AFK成功后，众多厂商纷纷入局放置品类，网易也不例外，网易就海外接连测试了三款放置卡牌类游戏，其中欧美幻想题材的《Castle Caper》无论是美术还是玩法框架都颇为完整。

siyushenqi.com
2025 年 8 月 24 日
228000
海外营销

富二代转向独立站创业，5万月薪招主播

大码服装确实是一条具有潜力的赛道，这两年国内已经有不少品牌走出国门抢占其红利。Molly了解到，国内的大码女装品牌BloomChic在近几月的独立站流量出现大幅增长，站内流量已经超百万。

siyushenqi.com
2025 年 8 月 13 日
83000
海外营销

消费降级下，一款财务应用正在让250万人实现“变相赚钱”

年轻人的“无效省钱”有救了。

siyushenqi.com
2025 年 8 月 17 日
80000
海外营销

Sora到底发布不发布，这事可能并不重要了

AI大模型的发展已经进入了一个更缓慢的迭代节奏，尽管有声音声称“没有墙”，但行业内普遍感觉到了发展的瓶颈。

siyushenqi.com
2025 年 8 月 13 日
90000
海外营销

单品类爆量破2亿！TikTok Shop美区9月总榜单出炉

TOP小店营业额超半亿。

siyushenqi.com
2025 年 8 月 12 日
107000
海外营销

海外社媒私域怎么搭建？品牌如何提升用户粘性？

随着海外社媒流量竞争日益激烈，单纯依靠自然曝光或广告投放已经很难支撑品牌的持续增长。越来越多的品牌开始重视海外私域流量的搭建，目的是降低获客成本、增强用户粘性、提升复购率和用户生命周期价值（LTV）。那么，海外社媒私域到底该如何布局？品牌又该用什么方法真正提升用户粘性？这篇文章给你全流程拆解。一、为什么海外社媒私域越来越重要？在传统社交平台，如Faceb…

siyushenqi.com
4小时前
3000
海外营销

超越国界：Sandsoft的全球游戏增长愿景丨对话Sandsoft首席执行官

寻找2025游戏出海行业的新锚点。

siyushenqi.com
2025 年 8 月 17 日
89000
海外营销

2022年12月全球热门移动游戏收入TOP10

2022年12月腾讯《王者荣耀》在全球 App Store 和 Google Play 吸金近2亿美元，蝉联全球手游畅销榜冠军

siyushenqi.com
2025 年 8 月 24 日
107000
海外营销

9个月实现百万收入，晚餐经济联动线上社交爆火欧美

线上+线下结合，“高净值”用户付费的效率社交应用勇闯红海市场。

siyushenqi.com
2025 年 8 月 17 日
90000
海外营销

面对 AGI，「推荐算法」还能怎么变？

和任何技术一样，「算法」同样在不断进化。

siyushenqi.com
2025 年 8 月 13 日
81000
海外营销

OpenAI反对美国SB-1047法案，会杀死开源大模型！

OpenAI向美国加州参议员Scott Wiener写了一封反对SB 1047法案的信。

siyushenqi.com
2025 年 8 月 13 日
82000
海外营销

沐瞳擅长的不只有MOBA

沐瞳凭借MOBA游戏《决胜巅峰》在海外市场取得巨大成功后，开始尝试拓展更多新品类游戏，如西幻塔防卡牌游戏《潮汐守望者》、二次元卡牌游戏《银与绯》以及自走棋游戏《Magic Chess: Go Go》等，以打破外界对其“只擅长MOBA游戏”的固有印象。

siyushenqi.com
2025 年 8 月 17 日
98000
海外营销

马斯克开设AI游戏工作室：怒怼政治正确，称要让游戏再次伟大

马斯克对游戏的热爱始于少年时期，他13岁时就开发并销售了自己的第一款电脑游戏《Blastar》。此后，他还为其他杂志和游戏公司开发过游戏，并在游戏公司实习过。

siyushenqi.com
2025 年 8 月 17 日
89000
海外营销

一家大厂2个月内连测10款新品，出海赛道要卷上天了

好像停不下来了一样。

siyushenqi.com
2025 年 8 月 24 日
105000
海外营销

Google Play Console beta 版全新发布

自 Play Console 发布以来，我们不断见证着用户社区的成长，从一人一铺开始逐步成为拥有数百个 Google Play Console 用户的大型公司，变化可谓一日千里。

siyushenqi.com
2025 年 8 月 26 日
96000
海外营销

扒了修仙游戏的前世今生后，我们发现了这个机会点所在

所有的爆发，都有积累。

siyushenqi.com
2025 年 8 月 25 日
109000
海外营销

突发！亚马逊评论政策重大调整

亚马逊评论政策再一次迎来重大调整！

siyushenqi.com
2025 年 8 月 13 日
93000
海外营销

百万人追捧99美元的AI项链，创始人学雷军做营销，做“硬件+社交”估值5000万美元

AI项链想做人类的朋友，先回答三个问题。

siyushenqi.com
2025 年 8 月 13 日
96000
海外营销

在Steam商店卖了超过1100万份后，《糖豆人》怎样延续成功？

《糖豆人：终极淘汰赛》(下文简称《糖豆人》）是2020年游戏行业的最大黑马之一

siyushenqi.com
2025 年 8 月 25 日
99000