智东西(公众号:zhidxcom)
作者 | 李水青
编辑 | 心缘
当下,各路生成式AI工具落地如火如荼。
据全球知名数据机构SimilarWeb统计,2024年9月,稳居全球第一的ChatGPT网站月访问量环比增长18.71%,达到31.24亿次。同时,聊天机器人Gemini、虚拟角色伴侣Character.AI、AI写作工具Notion AI等AI工具月访问量也都稳定在超1亿次,各个赛道展现出百花齐放的态势。
然而,看似火热的AI视频生成产品赛道,却透出丝丝的寒气。
虽然新玩家还在不断进入,但一线行业大佬已经带头“警告”。近日,百度董事长兼CEO李彦宏在2024年Q3总监会上说:“Sora这种视频生成的投入周期太长,10年、20年都可能拿不到业务收益。无论多么火爆,百度都不去做。”
而聚焦产品落地形势,Sora还没有正式推出,炙手可热的AI视频生成“代餐”已经热度骤降。
据SimilarWeb统计,位居全球前列的AI视频生成企业Luma AI网站在9月的总访问量仅为1181万次,环比下跌38.49%;红极一时的Pika在9月总访问量仅110.8万次,环比下跌9.78%。
再看看上半年其他几家存在感较强的种子选手,被称为AI视频生成领域的“老大哥”的Runway在9月流量仅755.8万次,不及ChatGPT的1/400;我国知名AI创企爱诗科技推出的PixVerse在9月总访问量为407.7万次,不及ChatGPT的1/700。
▲部分AI产品9月全球总访问量情况(数据来自SimilarWeb,智东西制图)
一边,Meta、字节、快手等互联网大厂都相继入局,推出Movie Gen、Kling AI等竞品;智谱AI、Minimax等大模型创企也推出了智谱清影、Video-01等新模型,让“内卷”的竞争更具紧迫感;另一边,AI视频生成工具之间差异化越来越小,小头部们用户增长乏力已成为不争的事实,增长压力一天高于一天。
Sora仍是“期货”,而类Sora产品已经遇到肉眼可见的瓶颈,面临入秋转寒的生存挑战。
一、8个月Sora“祛魅”:期货难产、负责人跳槽、实际体验不佳
今年2月,横空出世的Sora一举将AI视频赛道变得炙手可热。
彼时,相比Runway、Pika、PixVerse等在2023年6月-11月扎堆入场的视频模型,Sora不仅对文本理解更深刻,可以准确地呈现提示词,而且能在一个生成的视频中创建多个镜头,准确地保留角色和视觉风格,生成长达1分钟的质量惊艳的视频,让无数人惊叹:“以后可能不需要人拍电影了!”
然而8个月后的今天,OpenAI仍未推出Sora,Sora两位负责人之一却在10月4日宣布跳槽去了谷歌DeepMind,这款“期货”产品正在逐渐被人们遗忘,社交媒体的讨论热度和人们的期待程度都已经骤降。
近期的种种迹象,表明OpenAI在当时亮出这款视频模型时,并没有准备好。
在Sora发布后,有一小部分红队测试人员和艺术家可以使用Sora。但据外媒The Information近期报道,一些试用了Sora的电影制作人体验并不太理想。
首先,Sora生成的视频在呈现提示词上不够准确。例如,电影制作人帕特里克·塞德伯格 (Patrick Cederberg)说,他必须让模型生成数百个短片,才能找到一个可用的短片。换句话说,Sora的使用非常困难。
其次,生成视频耗时久、一致性保持不足。比如另一位试用者称,他最初需要10多分钟才能生成一段时长约1分钟的短片,而且Sora也很难在整个视频片段中保持相同的风格,物体和角色保持一致更加困难。
此外,“恐怖谷”效应多发。一位与OpenAI高管交谈过的人士称,Sora生成的视频总是包含奇怪的物理现象,比如凭空出现一把椅子,或者错误地解剖分割事物。换句话说,市面上AI视频生成工具有的“翻车”场面,Sora也都有。
这表明,Sora在技术层面仍存在缺陷和不成熟,至少与市面上已发布的产品相比,没有展现出太大优势。
一边Sora“难产”的迹象日益明显,另一边Sora项目团队也面临动荡,为Sora的如期出世增添了极大不确定性。
10月4日,Sora项目负责人蒂姆・布鲁克斯(Tim Brooks)在社交平台X上官宣离职,加入谷歌DeepMind。“我将加入谷歌DeepMind致力于视频生成和世界模拟器!”布鲁克斯说。这很有可能将Sora的炮弹安到了谷歌视频生成模型Veo上,成为进攻OpenAI的强力火炮。
▲Sora两位负责人之一Tim Brooks发文宣布跳槽去了谷歌DeepMind
而就在不久前的9月26日,OpenAI首席技术官米拉·穆拉蒂(Mira Murati),以及在o1模型、GPT-4o、GPT-4v模型的开发过程中扮演了重要角色的研究副总裁巴雷特·佐夫(Barret Zoph)与首席研究官鲍勃·麦克格卢(Bob McGrew)也宣布离职。技术领头人一个接一个离开,让Sora研发项目的进展变得前途未卜。
研发部门灵魂人物的离开,很可能改变Sora的研发方向和节奏。
实际上,OpenAI已传出正在重新训练Sora,目的就是为了让Sora在正式发布时还能保持优势。
9月底,一位与OpenAI高管交谈过的人士向外媒称,OpenAI正在训练新版Sora,希望它能快速生成质量更高、时间更长的视频。这位人士称,为了训练Sora,OpenAI收集了数百万小时的视频作为训练数据,高分辨率,并包含多种风格和主题。
然而这个重新训练的Sora什么时候能跟大家见面?答案似乎是遥遥无期。
无论是Sora体验和技术本身的缺陷,还是Sora项目团队的动荡,亦或是“回炉重造”的消息,都指向Sora的优势可能已经不保,也意味着AI视频生成同行的机会在变大。
一边,OpenAI的Sora的进展“秋风萧瑟”;另一边,其他AI视频生成行业看到了自家产品的可乘之机,“热火朝天”地发新品和招揽用户。
二、同行加速占领AI视频生成市场,创企与巨头热战,但寒潮已来
Sora日益降温,AI视频生成同行在2024年夏天已快速占领市场,开启多轮热战。
在国外,当Sora还是一个“饼”,Runway、Pika、Luma AI、Stability AI等创企已经把好用的AI视频生成工具免费给用户用,Meta、谷歌等硅谷科技大厂们也试图动摇Sora的根基。
AI视频生成领域“老大哥”Runway9月的新品已将视频生成时长延长至40秒,几乎追平Sora展示的效果;Luma AI比Sora效果更真实还免费,在SimilarWeb统计的全球AI产品访问量为AI视频生成类工具排名第一;Pika也在2024年10月已推出Pika 1.5,更真实的运动效果和大屏幕镜头堪称惊艳……
Meta于11月推出了自带配音的文生视频模型Movie Gen,直接用一个完整的评测体系宣告自己打败Sora;谷歌已从团队层面削弱Sora的战斗力,Sora项目两位负责人之一已于近期加入谷歌DeepMind,为自家AI视频生成工具Veo注入火力……一把又一把火越烧越旺。
▲Meta发测试结果证明自家Movie Gen赶超Sora
在大洋彼岸的中国,AI创企和科技巨头也已推出多款“中国造Sora”,在刚刚过去的夏天开启了一轮轮热战。
爱诗科技、生数科技、智象未来、Morph Studio、智谱AI、Minimax等AI创企都已推出了公众可用的AI视频生成工具,免费策略、功能更新、玩法创新轮番轰炸;科技大厂阿里、字节跳动、快手、腾讯等也都入场搅局,对这一市场虎视眈眈。
快手推出的可灵AI在全球现象级爆红,字节推出的即梦AI凭借CapCut(剪映)已成为许多短视频博主创作必备工具,爱诗科技推出的PixVerse率先打开国际市场并多次迭代,生数科技的Vidu初步打入动漫影视圈……其中后发制人的快手7月推出的可灵AI在2024年8月访问量达1448万,环比增长591.54%,位列全球AI产品流量排行榜第32位,在AI视频生成赛道排名仅次于Luma AI。
总之,在Sora静默的这半年多里,同行正加速占领AI视频生成市场。
▲部分热门AI视频生成产品/模型进展情况
AI视频生成赛道的战况在盛夏推至顶峰,但大战入秋后的结果如何?
就在产业和市场猝不及防之际,一场寒潮已经悄然潜入,不少红极一时的类Sora产品热度骤降。
今年9月,根据InfoQ等科技媒体联合推出的AI产品榜·全球降速榜,上榜的前五名中有两名都是AI视频生成工具:Luma AI 9月网站Web访问量为12.13M,环比下降38.49%,位居第二;Viggle 9月网站Web访问量为2.85M,环比下跌36.13%。
▲AI产品榜·全球降速榜(图源:InfoQ)
而正如前文提到,据第三方平台AIGCRank援引全球知名数据机构SimilarWeb数据,众多全球AI产品2024年8月访问量继续上涨。排名前20的AI产品中,除了月访问超20亿的“常青树”ChatGPT,还有AI搜索引擎Perplexity、虚拟角色JanitorAI、PDF工具Liner等多个领域的黑马,却未出现一个AI视频生成工具。
▲全球AI产品2024年8月访问量榜单(图源:AIGCRank)
前50名单中仅出现了排名22的Luma AI,但访问量仅1920万,环比下跌14.9%。按照这样的趋势,这棵独苗在下个月统计中很有可能被踢出前50名。
▲全球AI产品2024年8月访问量榜单(图源:AIGCRank)
当然,一些新晋AI视频生成产品的增长还是不错的,比如快手推出的Kling AI(可灵AI)海外版9月出海总榜Top1,几乎从零开始月访问量达1765万次;生数科技7月在全球上线的Vidu 8月100倍增长,增速高达14158.35%。
然而,这些产品的用户体量还是比较小,如何增长到Luma AI那样的水平,并克服后者还未克服的瓶颈,是新入局者打响第一炮后不得不面对的问题。
而科技巨头那边,情况也并没有看起来的那样乐观。
无论是国外的Meta、谷歌,还是国内的阿里、字节、腾讯等,布局AI视频生成赛道步伐都比较谨慎。它们大多数没有推出全民级的消费产品,而是以试水为主。背后,无疑是在衡量算力及数据的巨额投入,与亲自做AI视频生成的收益是否成正比。
这不禁让人思考:AI视频赛道入秋,大厂们的余粮也不足了?
三、视频大模型为何始终发布雷声大,落地雨点小?
当下,整个类Sora产品市场正进入一个调整期。
类Sora产品赛道的瓶颈已经展露出来。在亲自体验多款AI视频生成工具并与多位消费者交流之后,笔者认为,当下类Sora产品主要存在共性问题在于技术成熟度不足。具体表现在:
1、生成视频时长限制。很多人用到的AI视频生成工具仅能生成4-5秒的视频,对于需要完整表达内容的创作者来说过于短暂,难以进行影视创作等商业化支持。即便一些平台的视频生成时间已经接近1分钟,但仍然存在前后一致性、动态不足等问题。
2、功能更新突破性不足。过去一段时间,多家AI视频生成厂商都对功能进行密集迭代,但大多是“锦上添花”而缺乏跃进式体验升级。比如Pika推出了唇形同步功能LipSync、AI配音工具Sound Effects、风格选项等新功能,但并未给用户带来突破性的体验,出现“同质化”趋势。
3、等待时间过长。比如在Luma AI的Dream Machine发布后,由于大量用户涌入使用,服务器压力过大,很多用户需要排队等待数小时才能得到生成的视频,从而大大消耗了用户的耐心,让体验打折扣。从企业角度来说,提供AI视频生成服务是一项远比聊天机器人更耗费算力的工作,成本压力大。
4、高昂的付费价格。虽然各家AI视频生成工具都推出了免费服务,但大多都有次数和质量的限制。以Dream Machine为例,其有29.99美元的标准档、99.99美元的专业档以及499.99美元的高级档等不同档次的付费选项,高昂的价格使得当下AI视频生成工具的性价比大打折扣,影响其热度进一步提升。
而从外部环境来看,当下AI视频生成在商业化方面也缺乏应用市场的刺激。
当下,在经济增长放缓的背景下,无论是消费端用户还是各行各业企业对AI投入都会更加谨慎。
以短视频创作UGC市场为例,今年7月抖音可快手两大短视频厂商都亲自下场,分别推出《三星堆:未来启示录》、《山海奇镜之劈波斩浪》两部AI生成短剧,尽管在平台的带动下两部AI短剧迅速播放破亿,并吸引了不少创作者开始尝试AI视频生成。然而,时隔三个月,在各大平台上并未看到AI生成短剧扎堆跟进出现的势头。几位尝试过AI的短视频创作者告诉智东西,主要因为当下内容赛道竞争激烈,变现更加艰难,他们更愿意从话题、内容质量等方面去提升而非增大技术成本投入。
以AI被寄予高希望变革的影视行业为例,据央视新闻报道,2024年上半年,北美电影票房35.55亿美元,同比下降19.2%;据灯塔专业版,2024年国庆档(10月1日-10月7日)票房同比去年的27.36亿下滑了23%……在这种背景下,即便已经有不少影视人、短视频创作者选择AI视频生成工具进行创作,但付费意愿却不高。
向内看AI视频生成技术发展仍不成熟,向外看AI视频生成赛道的商业化外部条件不足,这也解释了为什么视频大模型始终发布雷声大,落地雨点小。
结语:冷静看待AI产品热,AI视频赛道仍需等风来
当人们热衷于AI产品的火热落地时,AI视频生成工具已经悄然入秋,Sora的难产和AI视频生成同行的瓶颈不容忽视。只有冷静看待技术产业赛道的周期性特点,企业和产业才能够在日益激烈的竞赛中拔得头筹。
旱季长根系,雨季长叶子。与聊天机器人、虚拟角色、翻译工具等赛道相比,AI视频生成目前的刚需赛道影视制作行业本身面临下行压力,阻碍了AI视频生成产品的商业化落地。寒冬随时可能到来,类Sora产品玩家在技术迭代和产品扩张时,只有保证生存下来才能在来年春天等到风来。