不服不行,ChatGPT加持下OpenAI的文生图模型又碾压对手了 siyushenqi.com • 2025 年 8 月 13 日 下午10:45 • 海外营销 • 阅读 46 DALL·E 3 来了。 作者|薛良Neil 多模态与大模型该如何更好结合是人工智能目前一个非常热门的研究方向,OpenAI刚刚发布的文生图模型DALL·E 3向所有人展示了一个最会做大模型的公司是如何看待和试图解决这个问题的。 DALL·E 3的升级点可以分为两部分,首先它是一个更好、更精确的文生图模型。 更好是相比DALL·E 2而言,更精确则意味着DALL·E 3对提示词有着更好的理解能力。 相同提示词下,DALL·E 2(左)和DALL·E 3生成效果对比。 换而言之,你不需要再绞尽脑汁成为一个提示词prompt大师了。OpenAI在介绍DALL·E 3的页面宣称,目前的文生图应用总是倾向于忽略用户给出的描述词,这强迫大家每个人都要去学着搞prompt,DALL·E 3克服了这一点。 比如下面这个例子。prompt中涵盖的各种要素,无论主次与否,比如行人、满月、斗篷乃至蒸汽朋克风格的电话,都被DALL·E 3精准还原了出来。 官方还给出了更多的案例,体现DALL·E 3出色的理解能力,简单放几张如下。 土豆国王俯瞰着它的王国。 灵感来自荔枝的球形椅子。 卷发像暴风一样飘扬,服装像大理石和瓷器碎片组成的旋风一样的舞者。 心脏里的微小宇宙。注意基座上镌刻的英文,这反映出DALL·E 3已经拥有了生成文字的能力。 这些天马行空的形容都被DALL·E 3很好的捕捉,但仅仅描述词理解能力的提升还不是DALL·E 3的升级重点,真正的杀手锏是OpenAI直接把DALL·E 3集成到了ChatGPT中!这种集成不是简单的在对话框或者提示词中放上工具的入口,而是用ChatGPT的语言能力帮助DALL·E 3理解和生成更准确的图片。 换而言之,DALL·E 3被大模型赋能,在这个基础上,图片和文字的模态实现自由转换。 OpenAI用一个非常生动的例子诠释了这种自由转换。用户首先让DALL·E 3生成一个“超级向日葵刺猬”(好吧,我知道没有人知道那究竟是什么)。 在ChatGPT的优化帮助下,DALL·E 3精准领会了用户的意思。生成的图片不仅画风多样,而且内容准确。要注意这是在只有很少的提示词的情况下做到的。 由于和ChatGPT集成在了一起,DALL·E 3拥有思维链能力。你可以给这只刺猬起个名字,然后ChatGPT会记住这一点,在接下来的交互中,DALL·E 3始终知道Larry是谁。 你可以继续像同人类对话一样,用自然语言来同DALL·E 3进行交互。比如你可以说,“能让我看看Larry的房子吗?”或者“为什么它这么棒(super-duper)?”,ChatGPT会通过文字和图片来给你答案。 正在生成和Larry有关的贴纸。 最终,这些内容可以被总结汇编成一个图文并茂的睡前故事。 连OpenAI的CEO都忍不住夸,这个宣传视频真的还怪可爱的。 迈出多模态自由转换的第一步 DALL·E 3和ChatGPT的结合能力让人震惊,有网友已经直接给 MidJourney点蜡烛了。 相比基于Discord的MidJourney,自然语言显然是更好的交互方式,OpenAI用ChatGPT辅助用户使用DALL·E 3的过程不仅包括了对用户意图的解读,还将具有一定智能的大模型将思维链引入其中,图片生成始终沿着用户的prompt指示进行,在多轮对话中体现出了很好的一致连贯性。 但DALL·E 3绝不仅是交互方式的革新,它背后反映的OpenAI在跨模态应用上的潜力更值得注意。 OpenAI以大模型能力闻名,但它也是最早尝试用文本作为条件引导图像生成的公司,在DALL·E 2的前身GLIDE中,OpenAI训练了一个35亿参数文本条件扩散模型,文本条件信息的嵌入正是来自transformer模型。 可以说,GLIDE的成功第一次让扩散模型“真正出圈”,因此,尽管目前我们很难知道DALL·E 3的技术细节,但有鉴于它在demo中展现出来的实力,有理由相信OpenAI在大模型中积累的经验同样也被应用在了DALL·E 3的开发中。 OpenAI的独特优势让大模型在交互方式和开发过程都与DALL·E 3实现了紧密结合,这恐怕是其它公司所不具备的企业护城河,借助大语言模型的智能来推动多模态之间的转换,我们已经在DALL·E 3看到了一个多模态大模型的雏形。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/33227.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 11.2K 文章 0 评论 298 问题 16 粉丝 私域神器:海外私域营销拓客软件 狂飙284天后,一批「模仿」ChatGPT的创业公司或将倒闭 上一篇 2025 年 8 月 13 日 下午10:45 小扎发布虚拟聊天AI,竟「1:1复刻」Character.AI?用户吐槽:设定太老土了 下一篇 2025 年 8 月 13 日 下午10:45 相关推荐 海外营销 2023年亚马逊大事件盘点:首次延长黑五网一大促时间,正式向中国卖家开放巴西站 亚马逊2023年的变与谋。 siyushenqi.com 2025 年 8 月 12 日 46000 海外营销 微软裁员9000人背后的 “AI残酷物语” 2025年微软裁员9000人,40%为开发者;全球科技巨头(IBM、谷歌等)数万个技术岗位因“AI战略重组”消失,初级编码岗位首当其冲。 siyushenqi.com 2025 年 8 月 13 日 53000 海外营销 2024年中国手游出海收入榜与发行商收入榜 – 《菇勇者传说》等多款新游增长亮眼,点点互动等多个发行商收入创历史新高 2024年全球手游收入反弹4%至809亿美元,重返上升通道。海外市场App Store和Google Play手游收入则增长超过5%至662亿美元,比2019年高出31%。 siyushenqi.com 2025 年 8 月 17 日 58000 海外营销 东南亚市场,跨境电商的“梦魇”? 硬币的另一面,充满变数。 siyushenqi.com 2025 年 8 月 12 日 52000 海外营销 妙鸭相机创始人最新创业项目曝光,AI播客赛道会是昙花一现? AI播客,一个门槛极低的创业赛道? siyushenqi.com 2025 年 8 月 13 日 70000 海外营销 你的GPT跟ChatGPT可能只差了一个DPU “人类永远不会嫌网络太快,就像永远不会嫌高铁太快,你只会嫌它慢,希望它更快些。” siyushenqi.com 2025 年 8 月 14 日 41000 海外营销 品类趋势:时尚、美妆、3C科技在TikTok有哪些新商机? 新常态下的新消费变化。 siyushenqi.com 2025 年 8 月 13 日 48000 海外营销 奥运季来了!看淘宝直播如何定义 “什么是淘宝女主播” 这是一群本可以靠脸吃饭的人,但是他们偏偏要靠专业。 siyushenqi.com 2025 年 8 月 13 日 46000 海外营销 7天卖出10万份,这条红海赛道杀出一款以小博大的国产新品 有趣的解决思路。 siyushenqi.com 2025 年 8 月 24 日 67000 海外营销 “拿捏”Z世代?印度本土电商巨头Flipkart又有新动作! 近日,印度电商巨头Flipkart在其应用程序中推出了一个新兴的时尚购物平台——Spoyl,以此为“Z世代”提供更多的购物选择。 siyushenqi.com 2025 年 8 月 13 日 50000 海外营销 微软开源AI Agent大更新,重塑智能体!多层级更强架构 自微软开源AutoGen以来,在GitHub上已获得超37000颗星,成为AI Agent领域应用最多的框架之一。但随着开发者快速增长,出现了API效率低下以及调试和干预功能有限等问题,同时开发者对AI Agent自动化行为的可观测性、控制能力、多层级Agent之间的协作有了更高需求,因此微软对AutoGen进行了大更新,发布了0.4版本。 siyushenqi.com 2025 年 8 月 13 日 66000 海外营销 爆款题材融合热门玩法,“重生爽文”小游戏冲榜 本篇文章统计微信小游戏、QQ小游戏、抖音小游戏、硬核小游戏以及App Store和Google Play上的新游爆款,并按照分类制作表格,将游戏排名情况等信息公布。 siyushenqi.com 2025 年 8 月 18 日 61000 海外营销 京东死磕低价,拼多多奉陪到底 黄峥:你可以说我low,但你无法忽视我。 siyushenqi.com 2025 年 8 月 5 日 60000 海外营销 冲入畅销Top11,这可能是目前最好的横版肉鸽动作手游 在难度、玩法、付费方式上适配手游玩家和市场,有效拓宽了产品的玩家受众面。《霓虹深渊:无限》或许是目前为止最适合移动平台的横版肉鸽动作游戏。 siyushenqi.com 2025 年 8 月 24 日 71000 海外营销 AI真·炼丹:整整14天,无需人类参与 现在制药这事,人类要靠边站了。 siyushenqi.com 2025 年 8 月 13 日 55000 海外营销 App隐私追踪权限管理功能已在iOS 14.4 Beta 1中启用 此前为了给应用开发者和广告商一定的缓冲时间,苹果曾推迟了新版隐私政策的启用日期。 siyushenqi.com 2025 年 8 月 25 日 61000 海外营销 短期高估、长期低估——微信接入DeepSeek的冷思考 微信接入DeepSeek的方式较为仓促,产品体验粗糙,缺乏历史记录、上下文联动、文件上传功能等,更像是一个独立的入口,而非深度融入微信核心功能。这种接入方式更像是“纸糊上去的”,而非真正的深度整合。 siyushenqi.com 2025 年 8 月 13 日 54000 海外营销 冲上美亚第一!亚马逊这一产品卖到断货 史上最卷黑五?亚马逊或发力低价赛道同Temu对抗! siyushenqi.com 2025 年 8 月 12 日 59000 海外营销 给外贸客户交货期要延迟,该怎么处理? 一份订单,只有到了交货期,才算是完成了,交货期的问题,也是一件很麻烦的事情。最普遍的交付问题就是延迟交付。 发货的及时与否将直接影响到顾客的业务和顾客对我们的印象。在这一环节中,要注意到怎样处理交货延误问题,以防止这一环节对双方的合作产生不利的影响。 一、如何预防 最好的办法就是把它扼杀在摇篮里。在大部分情况下,如果我们足够谨慎,我们可以将这个问题降低到最少… siyushenqi.com 2024 年 9 月 20 日 568000 海外营销 从SHEIN,看到中国制造和品牌出海的新时代 在这个以增长为最大诉求的时代里,“走出去”无疑是企业的必修课。 siyushenqi.com 2025 年 8 月 6 日 56000 海外营销 《我的阿勒泰》能否拯救文旅短剧? 最近,治愈系文旅剧《我的阿勒泰》火了。 siyushenqi.com 2025 年 8 月 18 日 56000 海外营销 PAGC 2025 | 再度来袭!万人+出海展会5月与您相聚广州! PAGC 2025定档,5.21—5.22广州,不见不散! siyushenqi.com 2025 年 8 月 17 日 49000 海外营销 《App Annie大中华区业务负责人 戴彬:把握2021年移动经济三大趋势,提升移动时代竞争力》 基于对移动市场的长期洞察,App Annie总结了移动经济在 2021 年发展的三大新趋势。 siyushenqi.com 2025 年 8 月 3 日 53000 海外营销 国产大模型即将决战 未来之战。 siyushenqi.com 2025 年 8 月 13 日 48000 海外营销 一IAA短剧平台杀入日本应用总榜TOP20,疑似中国出海应用 日本短剧市场热闹起来了。 siyushenqi.com 2025 年 8 月 17 日 49000 海外营销 海外社媒营销与 SEO:外贸网站的双重增长引擎 海外社媒营销与 SEO:外贸网站的双重增长引擎是一个非常有价值的主题,尤其对于依赖国际流量的外贸企业而言。以下是针对这一主题的深入解析框架,帮助理解两者如何协同驱动增长: 一、海外社媒营销的核心价值 1.快速流量获取 – 通过Facebook、Instagram、LinkedIn、TikTok等平台触达精准海外用户。 – 利用短视频、… siyushenqi.com 2025 年 7 月 31 日 96000 海外营销 data.ai 5 月中国游戏厂商及应用出海收入 30 强:《Arknights》收入增幅最大,环比增长 164% 2023年5月中国游戏厂商及应用出海收入30强榜单出炉 siyushenqi.com 2025 年 8 月 18 日 52000 海外营销 斥资1.5亿溢价收购亏损公司,小熊电器要在海外再造“徕芬”和“usmile”? 1.5亿买亏损公司,是赔是赚? siyushenqi.com 2025 年 8 月 5 日 91000 海外营销 双IP加持下 这款无厘头的卡牌类手游迅速在越南打开市场 乌龙院+蘑菇头,无厘头游戏席卷越南 siyushenqi.com 2025 年 8 月 24 日 66000 海外营销 几千家体验店,拯救不了VR产业? 2023年,VR体验店还能赚到钱吗? siyushenqi.com 2025 年 8 月 13 日 42000 发表回复 请登录后评论...登录后才能评论 提交