OpenAI发布GPT-5，免费使用

siyushenqi.com • 2025 年 8 月 13 日上午11:40 • 行业动态 • 阅读 334

GPT-5采用内嵌式三位一体集成架构，由GPT-5-main、GPT-5-thinking、实时决策的路由机制和GPT-5-mini组成。

摘要

GPT-5在数学、编码、视觉感知和健康领域表现大幅超越前代模型。在健康领域，GPT-5-thinking在HealthBench Hard评估中得分从31.6%提升至46.2%；数学方面，2025年美国AIME测试中无工具得分94.6%，使用Python可达到99.6%，Pro专业版+Python可达100%；在SWE-bench软件测试中，GPT-5达到74.9%，超过前代模型。

GPT-5在编码和开发方面表现出色，能够快速开发游戏、财务分析模板、学习应用等，甚至几分钟内生成数百行代码。即使是不懂代码的用户也能通过提示词快速开发出所需应用。

GPT-5在特定潜在错误领域表现优异，挑战性对话幻觉率较OpenAI o3降低超8倍，高风险场景错误率较GPT-4o降低超50倍，在全球健康背景适应方面零失误。

从发布当天开始，GPT-5向所有Plus、Pro、团队及免费用户推出，企业和教育用户将在一周后获得访问权限。免费用户达到使用限额后会自动切换至GPT-5-mini版本。

今天凌晨1点，OpenAI进行了技术直播，发布了全球科技圈期待已久的GPT-5。

GPT-5首次使用了内嵌式三位一体集成架构，彻底颠覆了前代模型的独立运行模式，一共由3个核心模型组成，分别是处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking 深度思考模型、实时决策的路由机制，还有一个是额度使用完后启动的mini版本。

实时决策的路由机制是主要创新，该机制会根据对话类型、复杂程度、工具需求以及你的明确意图，快速决定使用哪个模型，相当于马路中的“交通指挥员”，会用最适合的模型来解决适合你所提出的问题。

路由机制会持续接受真实信号的训练，包括用户切换模型的情况、对回应的偏好率以及测得的正确性等，其性能会随着时间不断提升。

值得一提的是，免费版ChatGPT也可以使用GPT-5，不过会有额度限制，达到限制后可使用GPT-5-mini版本。

根据OpenAI公开的测试数据显示，GPT-5在数学、编码、视觉感知和健康的表现全部大幅度超越前代，成为目前最强大模型。

在健康领域，通过HealthBench评估体系对GPT-5模型家族进行了全面测试，涵盖HealthBench、HealthBench Hard和HealthBench Consensus等多个维度，并与前代OpenAI模型进行对比。

结果显示，GPT-5-thinking在该领域的表现大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。其中，在HealthBench Hard这一挑战性评估中，其得分从o3的31.6%提升至46.2%成为目前最佳。

数学方面在2025年美国AIME测试中无工具得分94.6%，使用Python是99.6%，如果是Pro专业版+Python可达到100%，同样大幅度超过了o3模型。

在SWE-bench软件测试中，GPT-5启动思考模式下达到了74.9%，超过了o3的69.1以及4o的30.8，成为目前最强编码模型。

这里有一个小插曲，OpenAI在直播介绍GPT-5的SWE-bench测试数据时，o3的图表高度是错误的，居然和4o的一样。

安全与幻觉方面，在特定潜在错误领域，GPT-5-thinking 的挑战性对话幻觉率较 OpenAI o3降超8倍，高风险场景错误率较GPT-4o降超50倍，在全球健康背景适应方面零失误。

在应用场景方面，编码是GPT-5最突出的核心能力，只需要几句话就能自动快速完成应用的开发，例如，输入提示词：创建的单页应用是一个名为 “Jumping Ball Runner” 的游戏，以单个 HTML 文件呈现。游戏目标是让玩家操控球跳跃越过障碍物，尽可能长时间地生存下去。

这款游戏具备多项特色功能，包括随着游戏进行不断加快的速度、最高分记录功能、重试按钮，以及为各类动作和事件配备的趣味音效。在视觉设计上，用户界面色彩丰富，搭配视差滚动背景，营造出层次感和动态效果；游戏角色采用卡通风格设计，造型有趣，观赏性强，旨在让所有年龄段的玩家都能从中获得乐趣。

也可以制作交互式内容来解释像伯努利效应这样的复杂概念，在几分钟内就能生成数百行代码。

GPT-5只用了5分钟就快速开发了一个财务分析模版，而使用传统方法要花费好几个小时。

只需要几句提示词，就能制作一个可交互式的类塔防游戏，还可以选择与不同的角色对话，增加可玩性和动作。

也可以用GPT-5几分钟自动开发一个学习法语的网络应用，功能需求包括一个类似贪吃蛇的游戏，游戏中有老鼠、奶酪和法语单词。

GPT-5在开发应用程序、绘制图表、解读代码、开发AI Agent方面非常出色，不会任何代码的路人也能快速开发出自己想要的应用。

训练数据方面，与OpenAI之前的模型一样，GPT-5的训练数据来源广泛，包括互联网上公开的信息、与第三方合作获取的信息，以及用户或训练师生成的信息。为了确保数据的质量和降低潜在风险，采用了严格的数据处理流程。

包括先进的数据过滤技术，用于减少训练数据中的个人信息，同时通过Moderation API和安全分类器，防止有害或敏感内容的使用。

在训练方法上，GPT-5的推理模型，包括GPT-5-thinking、GPT-5-thinking-mini和GPT-5-thinking-nano采用了强化学习技术。这些模型在训练过程中被教导在回答问题之前先进行思考，先生成一个内部的思考链，然后再向用户做出回应。通过这种方式，模型能够学习到如何优化思考过程，尝试不同的策略，并识别自己的错误。

从今天开始，GPT-5开始向所有 Plus、Pro、团队及免费用户推出，企业和教育用户将在一周后获得访问权限。Pro、Plus 和团队用户还可通过ChatGPT 登录，在Codex命令行界面（Codex CLI）中使用 GPT-5 进行编码。

与 GPT-4o 相同，免费用户与付费用户在 GPT-5 访问权限上的差异体现在使用量上。Pro 订阅用户可无限使用 GPT-5，并能访问 GPT-5 Pro。

Plus 用户可将其作为日常问题的默认模型放心使用，使用额度显著高于免费用户。团队、企业和教育客户也能将GPT-5 作为日常工作的默认模型轻松使用，其宽松的使用限制让整个组织都能便捷地依赖 GPT-5。

关于 ChatGPT 免费用户，完整的推理功能可能需要几天时间才能全面推出。一旦免费用户达到 GPT-5 的使用限额，系统将自动切换至 GPT-5-mini版本，这是一个更小、更快且仍具备强大功能的模型。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.siyushenqi.com/32379.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

13.7K 文章

0 评论

425 问题

17 粉丝

私域神器：海外私域营销拓客软件

AI给的情绪价值：是共鸣，还是陷阱

上一篇 2025 年 8 月 13 日上午11:40

Agent成了腾讯AI最大的牌面

下一篇 2025 年 8 月 13 日下午1:59

行业动态

PAGC2024短剧出海峰会精华回顾丨在百亿市场破局，短剧出海如何少踩坑多增长？

自2023年短剧产品在海内外市场迎来爆发式需求以来，越来越多的中国短剧团队开始走向海外，他们擅长打磨优质剧本，具备丰富的拍摄经验，对海外市场有长足的探索。

siyushenqi.com
2025 年 8 月 18 日
279000
行业动态

海外社交平台内卷小游戏，开发者该如何选择？

YouTube、Meta、TikTok和Discord等头部社交平台相继推出或升级了小游戏板块，覆盖网页端到iOS、Android的多平台支持，并开启内购变现功能。

siyushenqi.com
2025 年 8 月 17 日
308000
行业动态

百度的面子和里子

百度搜索已全量上线DeepSeek满血版，用户可通过百度APP进入AI搜索并体验。这一动作发生在微信接入DeepSeek并开放测试后仅两天，表明百度对守住搜索入口的决心。百度此次全面接入DeepSeek的力度极大，覆盖所有用户。

siyushenqi.com
2025 年 8 月 13 日
288000
行业动态

日卖5万件，情人节商品热度上升！TikTok Shop美国小店(1.22-1.28)新榜

本期（2024年1月22日—1月28日）TikTok Shop 美国站“品类周榜”及“店铺周榜"销量数据分析，帮助卖家及时了解 TikTok Shop 美国小店最新市场现状，掌握选品趋势。

siyushenqi.com
2025 年 8 月 12 日
409000
行业动态

111%半死老游突然蹿红，半年爬升至畅销榜第17

111%「合作塔防」上线半年籍籍无名，近月靠调宣最高冲到韩iOS畅销第17，稳定TOP50。

siyushenqi.com
2025 年 12 月 23 日
301000
上线三周下载量破250万、七日留存率45%，答题游戏又复活了？

在久无波澜的答题游戏品类又溅起了水花，一款叫《Trivial Royale》的答题游戏上线后相继占领了各英美市场的游戏下载榜

siyushenqi.com
2025 年 8 月 26 日 • 行业动态
333000
行业动态

私域神器每周精选 No.22｜株式会社提供出海日本推广服务手游新品寻海外发行

本期精选的合作类型涵盖多款精品手游发行、资源合作等。接下来就一起看看吧~

siyushenqi.com
2025 年 8 月 24 日
341000
全民Party产品总监王亮：聚焦K歌App赛道从6个维度打磨出海产品力

9 月 8 日，由扬帆出海主办的「PAGC 2021 产品与增长大会」在深圳拉开帷幕。本次大会邀请了游戏、电商、社交、应用等行业领域的多位大咖，共同讨论在后疫情时代背景下的互联网出海，助力中国企业走出国门，布局海外。

siyushenqi.com
2025 年 8 月 3 日 • 行业动态
450000
行业动态

Lazada大促引爆东南亚，低价商品成消费者首选

见微知著，一叶知秋。

siyushenqi.com
2025 年 8 月 12 日
306000
行业动态

阿里巴巴发布通义千问系列最新旗舰模型

阿里巴巴于北京时间周四凌晨发布了通义千问系列的最新旗舰模型Qwen2.5-Omni，这是一款端到端多模态模型，能够处理文本、图像、音频和视频等多种输入，并通过生成文本和合成语音提供实时流式响应。

siyushenqi.com
2025 年 8 月 13 日
301000
行业动态

还在追赶直播带货风口的人，被培训收割了

随着直播带货行业的兴起，各种培训机构和个人纷纷推出高价课程，承诺学员通过培训能够快速实现高收入。

siyushenqi.com
2025 年 8 月 5 日
332000
行业动态

数据分析丨美国电商及零售业发展趋势及大爆品类预测

近日，有外媒针对疫情之下美国的电商及零售业发展做出了预测

siyushenqi.com
2025 年 8 月 13 日
322000
行业动态

字节大模型全员会，朱文佳和吴永辉一起聊了方向、组织和开源

3月18日上午，字节跳动豆包大模型部门（Seed）召开全员会，由朱文佳（负责模型应用）和吴永辉（负责AI基础研究）共同主持，明确了部门未来的目标和工作重心。

siyushenqi.com
2025 年 8 月 13 日
308000
“跨境蹦床第一股”诞生！全民健身潮，藏着什么淘金秘笈？

“健身器材”出海，如何与全球巨头掰手腕。

siyushenqi.com
2025 年 8 月 13 日 • 行业动态
320000
3个月完成两轮融资欢澄互娱CEO:用互动游戏再造社交类App的3.0时代

率先做出改变的人，才有可能成为头部玩家

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
344000
行业动态

推特会退出印度吗？

印度政府于2000年出台的《IT法案》是处理印度网络犯罪和电子商务的主要法律

siyushenqi.com
2025 年 8 月 25 日
339000
行业动态

“联名”Apple Watch，登上多国健康健美榜Top10，电子宠物又进化了？

接盘“Q宠”，难！

siyushenqi.com
2025 年 8 月 17 日
331000
IGG出人意料的一年：发布了超18款产品，投资超13家游戏公司

2020年可以说是IGG着重发力多个细分赛道的一年，年内推出了18款游戏。

siyushenqi.com
2025 年 8 月 25 日 • 行业动态
388000
行业动态

一家总被网友担心死掉的公司融资千万元，要做一个有“自我”的AI二次元女友

用 10 亿级定向数据把开源底座重训成“蕾伊”专属权重，把性格、价值观、行为模式写进模型本身，形成不可 prompt 重置的独立人格。

siyushenqi.com
2025 年 12 月 26 日
224000
AIGC+影视股：行至阶段性分化路口，影视工业概念有望被加速，长期或调整产业链条 | 「共同虚拟」行研库

随着A股年报、一季报逐步拉开帷幕，传媒板块到了一个阶段性的分化路口。行情的集中爆发普遍集中于3月中旬起市场对于AIGC的关注扩散至传媒应用场景。随着国产大模型接连发布，市场关注点逐步从技术层面延展至应用层布局、场景落地。而好莱坞AI初创公司Runway发布文字生成视频模型Gen-2等信息，进一步催化市场的“映射”逻辑，推动传媒板块阶段上行。

siyushenqi.com
2025 年 8 月 14 日 • 行业动态
320000
前Twitter创始人力荐Damus Web3社交应用的春天将至？

火遍全网的Damus只是一个开始 Web3社交产品们将向巨头发起挑战

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
379000
手游海外市场发行增长37%，海外扩张还在继续

手游海外发行一直以来都是国内不少游戏厂商的发展之路，相较与国内手游市场的残酷竞争。

siyushenqi.com
2025 年 8 月 26 日 • 行业动态
376000
行业动态

爆款率不足5%？海外短剧「无利润繁荣」如何破局？

尽管2025年6月短剧应用全球下载量达8459万次，收入达1.93亿美元，但头部平台如昆仑万维、中文在线等仍处亏损状态，行业整体面临高成本、低爆款率和长回本周期的结构性困局。

siyushenqi.com
2025 年 8 月 15 日
328000
行业动态

手把手教你做游戏，ChatGPT将开启“全民开发者”时代？

“全民开发者”时代来了？

siyushenqi.com
2025 年 8 月 14 日
304000
行业动态

千亿美金规模，月入50万美金！打好拉美市场攻坚战的四个“发力点”

拉丁美洲复杂多变的文化与地理环境，让一般电商企业不敢贸然涉足。

siyushenqi.com
2025 年 8 月 13 日
294000
行业动态

DeepSeek正开发高级AI Agent模型，硬刚OpenAI

新模型主打“最小化提示”，可在用户指令极少的情况下自主完成多步骤任务，并具备基于过往行为自我学习与持续优化的能力，目标在今年第四季度发布。

siyushenqi.com
2025 年 9 月 5 日
398000
行业动态

Allegro上线轻小商品配送计划，卖家成本难题迎刃而解

扶持商家顺利卖货，是Allegro扩张之路上必不可少的关键一步。

siyushenqi.com
2025 年 8 月 12 日
325000
行业动态

重磅！Llama-3，最强开源大模型正式发布！

Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型。

siyushenqi.com
2025 年 8 月 13 日
264000
合金弹头玩着玩着，嗅到了一丝MMO味道

两个循环核心：养成→战斗循环；“技巧、经验”循环

siyushenqi.com
2025 年 8 月 24 日 • 行业动态
397000
行业动态

张勇吹哨，戴珊率先革大淘宝的“命”

张勇的这场赌局，需要戴珊和整个阿里全力以赴，才能最终取胜

siyushenqi.com
2025 年 8 月 13 日
322000