AI生成视频:有点惊艳,有点离谱 siyushenqi.com • 3天前 • 海外营销 • 阅读 6 AIGC的最后一块拼图,要拼上了? AI生成的视频,正在入侵互联网。 此前,我们已经见识了完全由AI制成的科幻预告片《Trailer:Genesis》,以及用AI合成的《芭比海默》预告片。这两部脑洞大开的片子,让我们见识了AI的神奇。 现在,越来越多AI视频工具正在被开发出来,批量制造短视频和电影片段,其生成效果让人惊叹,使用门槛却低到“令人发指”。 比如用Pika生成的这个: 用Runway Gen-2生成的这个: 以及用Neverends生成的这个: 不需要复杂的代码,也不需要深奥的指令,只需要一句话,或者一张图片,AI就能自动生成动态视频。如果想修改,同样只需要一句话,指哪改哪。喜欢做视频的同学,再也不用四处找素材、熬夜剪辑了。 在创投圈,视频生成类AI正在取代大语言模型,成为近期最热门的赛道。前段时间出圈的Pika,给这团火又添了一把柴。 AI视频这阵风,能吹多久? AI生成视频,这次有点东西 用AI生成一段视频不是什么难事,区别在于生成什么样的视频。 经常剪视频的人可能知道“一键成片”,在剪映等视频工具里输入脚本,系统可直接生成与脚本匹配的视频;在一些数字人平台上传一张照片,AI生成一个数字人,在口播时能自动对口型。 这是AI,但不是我们今天讨论的AI。 本文提到的AI生成视频,指的是生成有连续逻辑的视频,内容之间有关联性与协同性。它不是根据脚本把图片素材拼接成视频形式,也不是用程序驱动数字人“动手动嘴”。它更接近于“无中生有”,实现难度更高。 比如以下这段视频,就靠一句指令生成: 视频中的汽车、树叶、光影,是AI靠自己的知识储备和经验“画”出来的,或者说是“瞎编”的。当然,是根据用户的要求“瞎编”。 再看以下这段视频,就靠一张静态图片,AI自动拓展成视频。 图片中的人物、船只、水流本来都是静止的,AI将它们变成了动态。 AI还可以对原视频进行扩充,把场景“补”齐,比如从只有上半身扩充到全身,以及构造出人物背后的全景。这跟最近很火的AI扩图有点像,AI根据自己的理解,以小见大,以树木见森林。 以上三种生成视频的方式,就是现在流行的AI视频“三件套”:文生视频、图生视频、视频生视频。简言之,无论是文字、图片还是视频,都能作为原始素材,通过AI生成新的视频。 从技术角度,这依托跨模态大模型。在输入端,输入自然语言、图像、视频等形式的指令,最后都能在输出端以视频的形式呈现。 生成只是第一步,后续还能用AI修改。 请看X网友发布的一段视频: 视频截图 这个视频体现了两个重要的功能:一键换装,一键增减物品。这也是Pika在1.0版本上线时重点介绍的功能。在Pika的宣传片中,只需要一句话输入指令,就能给猩猩戴上墨镜,给一位行走中的女士换装。 这其中的厉害之处不在换装,而在换装的方式——用自然语言的方式下指令,且整个过程非常丝滑,毫无违和感。通过AI,人们能够轻松编辑并重构视频的场景。 AI还能改变视频风格,动漫、卡通、电影,通通不在话下,比如将现实中的实拍镜头转换为卡通世界,它的效果跟P图软件的滤镜有点像,但更高级。 现在用AI生成的视频,已经能达到以假乱真的效果,国内还有一批公司在研发更新的技术。 这两排人物,每排的六个人动作都一模一样,就像“一个模子里刻出来的”。没错,它们就是通过人物静态图片,绑定骨骼动画生成的。 这是阿里研究院正在进行的一个项目,叫Animate Anyone,它能让任何人动起来。除了阿里,字节跳动等公司也在研发类似技术,且技术迭代很快。 效果很好,但别高兴太早 用简单的自然语言让AI生成定制化的视频,给行业带来的兴奋跟去年的ChatGPT差不多。 文生视频的原理与文生图像类似,但由于视频是连续的多帧图像,所以相当于在图像的基础上增加了时间维度。这就像快速翻动一本漫画书,每页静止的画面连起来,人物和场景就 “动”起来了,形成了时间连续的人像动画。 华创资本投资人张金对「定焦」分析,视频是一帧一帧构成的,比如一帧有24张图片,那么AI就要在很短时间内生成24张图片,虽然有共同的参数,但图片之间要有连贯性,过渡要自然还是很有难点。 目前主流的文生视频模型,主要依托Transformer模型和扩散模型。通过Transformer模型,文本在输入后能够被转化为视频令牌,进行特征融合后输出视频。扩散模型在文生图基础上增加时间维度实现视频生成,它在语义理解、内容丰富性上有优势。 现在很多厂商都会用到扩散模型,Runway的Gen2、Meta的Make-A-Video,都是这方面的代表。 不过,跟任何技术一样,刚开始产品化时让人眼前一亮,同时也会有一些漏洞。 Pika、Runway等公司,在宣传片中展示的效果非常惊艳,我们相信这些展示是真实的,也的确有人在测试中达到类似的效果,但问题也很明显——输出不稳定。 不论是昨日明星Gen-2,还是当红炸子鸡Pika,都存在这个问题,这几乎是所有大模型的通病。在ChatGPT等大语言模型上,它体现为胡说八道;在文生视频模型上,它让人哭笑不得。 瀚皓科技CEO吴杰茜对「定焦」说,可控性是文生视频当前最大的痛点之一,很多团队都在做针对性的优化,尽量做到生成视频的可控。 张金表示,AI生成视频确实难度比较大,AI既要能理解用户输入的语义,图与图之间还要有语义连贯性。 AI生成视频的评估标准,通常有三大维度。 首先是语义理解能力,即AI能不能精准识别用户的指令。你让它生成一个少女,它生成一个阿姨,你让一只猫坐飞机,它让一只猫出现在飞机顶上,这都是理解能力不够。 提示词为 A cat flying a plane,Cartoon style 其次是视频生成效果,如画面流畅度、人物稳定性、动作连贯性、光影一致性、风格准确性等等。之前很多生成的视频会有画面抖动、闪烁变形、掉帧的问题,现在技术进步有所好转,但人物稳定性和一致性还有待提高。我们把一张马斯克的经典照片输入给Gen-2,得到的视频是这样的: 马斯克的脸怎么变得这么有棱角了?还有,这个手是怎么回事...... 另外,画面主体的动作幅度一大,就很容易“露馅”,比如转动身体的少女一会儿是瓜子脸一会儿是大饼脸,或是奔跑中的马甩出“无影腿”。 还有一点是产品易用度。AI生成视频最大的变革之一,是大幅降低了使用门槛,只用输入很少的信息就能实现丰富的效果,过去视频工作者用PR、AE制作视频,要在复杂的操作界面点击各种按钮,调节大量参数,现在你只用打字就可以了。 产品是否易用,是技术能否大规模普及的一个重要前提。AI扩图最近被人们“玩坏”,也是因为操作简单,但效果感人。当普通小白也能像P图一样P视频,那离爆款产品诞生就不远了。 就当前而言,以上三项指标已有很大进步,尤其是刚上线不久的Pika1.0,各方面表现均衡。但输出不稳定依然是共性问题。 视频时长也是一大限制。现在主流的文生视频产品,正常生成的视频时长一般在3到4秒,最长的没有超过30秒。生成视频的时间越长,对AI的理解、生成能力要求越高,露馅的概率也越大。 因此很多人不得不使用“续杯”的方式,同时还得结合其他素材,才能实现理想效果。而在《芭比海默》《Trailer:Genesis》这两部预告片中,作者用到了Midjourney(处理图像)、Gen-2(处理视频)、CapCut(剪辑视频)等多种工具。 吴杰茜表示,当前市面上的AI文生视频产品,生成的视频时长最多也就十多秒,瀚皓科技即将推出的产品试图做到生成任意时长,比如15秒短视频、1分钟左右的短剧,这也能成为一个差异化的特色。 所以就当前而言,想靠AI直接生成一整部大片,还有点早。 争抢AIGC的最后一块拼图 在AIGC的各大细分赛道中,AI文生视频被认为是最后一块拼图,是AI创作多模态的“圣杯”。整个行业的热潮,已经逐步从文生文、文生图,转向了文生视频领域。 成立于2018年的美国公司Runway,一度引领AI生成视频浪潮。它在2023年2月推出的Gen-1,主打视频转视频,能改变视频风格;3月推出的Gen-2,实现了用文字、图像或视频片段生成新视频。 Gen-2将生成视频的最大长度从4秒提升到了18秒,还能控制“镜头”,用“运动笔刷”随意指挥移动,一度是文生视频领域最先进的模型。 Runway的创始团队有很强的影视、艺术背景,因而客户主要是电影级视频编辑和特效制作者,他们的技术被用在了好莱坞大片《瞬息全宇宙》中。2023年下半年,Runway完成一笔过亿美元的融资,公司估值超过15亿美元。 最新玩家是Pika,这家公司由两个在美国读书的华人女博士退学创办,公司成立仅8个月,员工4人。Pika进展神速,11月底发布的全新文生视频工具Pika 1.0,在各大社交媒体迅速走红。再加上创始人爽文大女主的人设,被国内媒体疯狂报道。 一位AI创业者对「定焦」说,Pika采用了差异化的打法,主打动画生成,规避了AI生成视频在逼真度和真实性方面的缺陷。另外Pika在正式推出1.0版本之前,已经在discord积累了一定数量的用户。 除了这两家公司,AI视频领域的玩家还有Stability AI,它最知名的产品是文生图应用Stable Diffusion,11月刚发布了自己的首个文生视频模型Stable Video Diffusion;Meta发布了Make-A-Video;Google推出了Imagen Video、Phenaki。 中信建投制图 国内的进展相对慢一些,还没有明星产品出现。已经推出或正在研发文生视频应用的公司有右脑科技、生数科技、万兴科技、美图等。 其中,右脑科技的视频功能在8月开启内测申请。这是一家年轻的公司,2022年9月才成立,已获得获得奇绩创坛、光速光合的投资。生数科技在2023年3月才成立,由瑞莱智慧RealAI、蚂蚁和百度风投联合孵化。 也有一些公司擅长蹭热点,无论主动或被动。 Pika被媒体热炒那几天,A股上市公司信雅达股价暴涨,连续6个交易日接近涨停,累计接近翻倍。这仅仅是因为Pika创始人郭文景为信雅达的实控人郭华强之女,而这两家公司没有任何业务往来,信雅达也没有AI视频生成类相关产品和业务。 炒概念,一直都是资本市场的惯常操作。 360集团在2023年6月发布大模型产品时,顺带也演示了文生视频功能,号称“国内首个实现文生视频功能的大模型产品”“ 全球最先进的人工智能技术之一”。当然,这些自封的称号有多少人会信、这些产品有多少人会用,我们不得而知。 在图片领域有优势的美图,也在Pika上线后一周内,发布了视觉大模型MiracleVision4.0版本,主打的功能就是AI视频。不过,这些功能目前尚不可用,得到2024年陆续应用到美图秀秀等产品中。 AI行业太嘈杂,我们常常搞不清,哪些公司是做产品,哪些是来炒股的。 抛开这些杂音,AI文生视频技术本身是好的,有望推动生产力革命,加速AIGC技术产业化的进程。中信证券认为,文生视频有望率先在短视频和动漫两个领域落地,短视频制作中的传统实拍模式有望被生成式技术替代。 或许用不了多久,短视频就不再需要真人出镜、拍摄和录制。这不仅仅指口播场景,而是任何你能想象得到的场景,以及大量你想象不到的形象。随之而来的,是AI生成的视频大举入侵互联网,AI像流水线一样批量制造短视频,短视频的游戏规则也要变了。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/33356.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 6.1K 文章 0 评论 296 问题 16 粉丝 私域神器:国内海外私域营销拓客软件 谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney! 上一篇 3天前 20倍压缩比!微软提出大模型提示压缩框架LLMLingua 下一篇 3天前 相关推荐 海外营销 DTB市场成亚马逊和沃尔玛新宠,卖家可冲的新蓝海 在亚马逊推出其Amazon Business计划8年后,近期,沃尔玛也正式推出Walmart business,以吸引更多的企业用户。 siyushenqi.com 4天前 7000 海外营销 巨人网络发布行业首个DeepSeek原生游戏玩法 巨人网络旗下游戏《太空杀》接入DeepSeek大模型,首创“内鬼挑战”玩法,开启灰度测试,未来将面向全量用户开放。这是首次将DeepSeek大模型能力深度应用于游戏玩法创新,以AI驱动核心玩法,重塑游戏的竞技和交互体验。 siyushenqi.com 2小时前 0000 海外营销 年增长超200%!靠手机支架年收1亿美金的3C配件大卖 骑行热红遍全球,这个独立站靠卖手机支架年收1亿美金! siyushenqi.com 4天前 9000 海外营销 卖狗绳给老外也能年入3亿,现在要上市了 温州源飞宠物玩具制品股份有限公司首发申请上会,拟登陆A股。一旦成功,源飞宠物将成为“宠物牵引用具第一股”。 siyushenqi.com 4天前 9000 海外营销 Google 百度正式官宣 ChatGPT 竞品!能否颠覆搜索引擎已经没那么重要 搜索引擎迎来真正的挑战 siyushenqi.com 3天前 5000 海外营销 黄仁勋如何抗过DeepSeek冲击? 英伟达在人工智能基础设施领域占据主导地位,其成功不仅源于强大的技术,还在于一种独特的商业逻辑——专注于核心业务,避免分心。这种理念自公司成立以来一直推动其显著增长,使其成为全球市值最高的公司之一。 siyushenqi.com 3天前 8000 海外营销 2025 年,AI 的大风浪与大机会 2025年AI技术研发并未遇到瓶颈,反而以更快的速度进步,年初的Sora和O1等大模型激发了行业对AI大模型范式的新思考。 siyushenqi.com 3天前 7000 海外营销 这一政策真香!安克等大卖拿到上亿 专家预测跨境电商仍将是外贸下半年增长的新亮点。 siyushenqi.com 4天前 3000 海外营销 知乎版GPT正式发布 知乎所处的环境和阶段,丝毫不容许任何懈怠。快则生,慢则死。 siyushenqi.com 3天前 6000 海外营销 价格拉平之后,电商平台新一轮暗战已经开始 低价给电商平台留下了什么。 siyushenqi.com 2025 年 8 月 5 日 13000 海外营销 一周要闻NO.141丨小红书正式进军跨境电商;华谊兄弟清仓英雄互娱获利约9100万;Meta与台积电合作测试首款自研AI芯片 一起看看这周有哪些出海圈值得关注的大事记吧! siyushenqi.com 2天前 8000 海外营销 提前免费!百度连发两款模型 百度推出了两款新的大模型,文心大模型X1和文心大模型4.5。文心X1是一款深度思考模型,具备更强的理解、规划、反思和进化能力,支持多模态和多工具调用。文心4.5则是一款原生多模态基础大模型,擅长多模态理解和语言生成,且在逻辑推理、代码能力等方面有显著提升。这两款模型已在百度多个产品中上线,并且目前免费。 siyushenqi.com 3天前 6000 海外营销 谷歌搜索引擎全面揭秘!近百份文档泄露,博主爆肝数周逆向工程 继5月的文件泄露事件后,谷歌的搜索引擎又被掀了个底朝天。 siyushenqi.com 2天前 7000 海外营销 顶级品牌、出圈爆款都有谁? 知名美妆购物网站Look Fantastic发布2022年美容趋势报告。 siyushenqi.com 4天前 6000 海外营销 中国的AIGC,都去哪“捞金”了? 全球爆火的AIGC,看上去似乎摸索到了赚钱的途径。 siyushenqi.com 3天前 7000 海外营销 无论实力还是勇气,现在的人类都能爆杀AI! 4月21日,知名CG画师阮佳发布微博,向AI发起正面挑战,让大家使用AI在30分钟之内对他提供的草图进行细化,然后来与他的完稿进行对比。 siyushenqi.com 3天前 6000 海外营销 AI 生产力工具竞速,进入产品力比拼阶段 移动互联网发生过的,很可能会在 AI 领域再发生一遍。 siyushenqi.com 3天前 4000 海外营销 突发!亚马逊美国站又限制补货,卖家正在抢建发货中…… 美国站又限制了! siyushenqi.com 4天前 6000 海外营销 外贸必修课:2024年内卷的外贸市场如何突围 对于一个外贸从业者或者创业者而言,外贸营销策略尤为重要。一个明确而有效的外贸营销策略可以帮从业者或者创业者在2024年激励的国际外贸市场竞争中取得绝对优势,实现可持续发展。其中包括产品定位、市场调研、目标市场定位、行业竞品分析、营销计划、私域神器获客渠道等等。 显而易见,作为外贸人你要明确你的对手在哪里?和对手比你的优势是什么?劣势又是什么?面向目标市场的定… siyushenqi.com 2024 年 5 月 20 日 550000 海外营销 玩过《影之刃零》之后,我感觉梁其伟想捅破国产武侠天花板 不会是下一个XXX,而是第一个《影之刃零》。 siyushenqi.com 1天前 4000 海外营销 内容版图再扩张,美团内测外卖版小红书 美团在北京、上海等地测试名为“本地在吃”的服务,该服务嵌入在美团APP的外卖服务中,类似于外卖版的“小红书”,允许用户和KOL分享外卖订单,帮助其他用户发现商品和商家。 siyushenqi.com 2025 年 8 月 6 日 11000 海外营销 Temu全托管强制开广告 Temu要求全托管卖家签署推广服务条款开通广告,否则无法登录后台,但许多卖家的产品链接尚未恢复,无法进行有效推广,这让卖家们感到不满。 siyushenqi.com 2025 年 8 月 5 日 13000 海外营销 价值20亿美元的AI社交新贵?米哈游、腾讯争相投资MiniMax 婉拒Sora?中国AI大模型企业更爱社交出海。 siyushenqi.com 3天前 7000 海外营销 激进的可灵背后是一个内敛的快手 对于在AI时代秉持内敛型战略的企业而言,「世界模型」只是遥远而美妙的幻境,更现实的三步走计划可以概括为优化已有功能、探索AI原生功能、实现用户的AI化。 siyushenqi.com 3天前 7000 海外营销 最稳的他出最猛的招,2025出海大潮上演“八先过海” 2025年2月,美国关税政策的剧烈波动让外贸商家经历了一场“过山车”。美东时间2月1日,特朗普政府宣布取消800美元以下中国包裹的免税政策,导致中小出口企业成本上升、利润压缩。然而,2月7日该政策又被暂时冻结,恢复免税额度,但未来政策仍存在不确定性,促使商家寻找新的破局之道。 siyushenqi.com 2025 年 8 月 5 日 19000 海外营销 小红书开源了首个多模态大模型dots.vlm1 dots.vlm1 是 hi lab 首个开源的多模态大模型,基于 12 亿参数 NaViT 视觉编码器 + DeepSeek V3 MoE,兼顾视觉理解、推理与纯文本任务。 siyushenqi.com 4天前 7000 海外营销 2024电商的机会在线下 马云:未来十年,没有电子商务一说。 siyushenqi.com 4天前 8000 海外营销 声网母公司Q2财报:总营收3420万美元,10季度以来首次实现同比增长 财报显示,本季度 Agora, Inc. 实现总营收3420万美元,同比增长0.5%。这也是在2021年Q4之后,10个季度以来 Agora, Inc. 首次实现营收同比增长。 siyushenqi.com 2天前 7000 海外营销 Unity Grow 中国区广告投放业务总负责人 Linda Wu 确认担任 PAGC 2025丨第五届全球产品与增长展会 游戏出海增长峰会演讲嘉宾! Unity Grow 中国区广告投放业务总负责人 Linda Wu 确认担任 PAGC 2025丨第五届全球产品与增长展会 游戏出海增长峰会演讲嘉宾! siyushenqi.com 1小时前 2000 海外营销 渴望“活在过去”,TikTok再掀“怀旧复古潮”! 潮流是个圈,兜兜转转都会回到原点。 siyushenqi.com 4天前 8000 发表回复 请登录后评论...登录后才能评论 提交