• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
9月24日,星期二
2024-09-24 13:04
AI视频生成大战“白热化”,阿里、字节、快手、美图均押注

近期,国内外多家AI大模型密集“上新”。国内AI视频生成激战正酣,也有玩家悄悄抢占3D大模型赛道,OpenAI则卷向了复杂推理。分析人士认为,这一轮技术迭代,或将使AI行业诞生新的一线梯队。

 

近期AI圈最受瞩目的产品,莫过于OpenAI的“o1”大模型。9月13日,OpenAI正式发布新一代大模型“o1”,即之前所传的“草莓”模型。据介绍,“o1”大模型具备更强大的推理能力,能够解决多步骤问题,在复杂的科学、数学和编程任务方面,“能够像人类一样思考”。

 

回到国内,角逐最激烈的,当属视频生成赛道。今年2月,OpenAI发布视频大模型Sora,开启了AI视频的新时代。此后半年,国内大厂纷纷布局,国产AI视频大模型密集诞生。

 

6月,对标Sora,快手发布视频生成大模型“可灵”,支持通过文生视频、图生视频、视频续写功能,生成最长2分钟、30FPS的1080P高分辨率视频。就在“可灵”上线一周后,Luma AI发布文生视频模型Dream Machine,每120秒能生成120帧画面,还能快速生成5秒钟的电影级别视觉效果视频片段。

 

9月,互联网大厂的AI视频之战再次掀起新高潮。

 

9月19日,阿里宣布通义万相视频生成功能上线。据报道,通义万相视觉模型支持最长5秒、每秒30帧、分辨率为720P的视频生成,并生成与画面匹配的音效,目前已开放文生视频、图生视频两个创作入口。

 

9月23日,美图公司公布旗下美图奇想大模型(MiracleVision)视频生成能力全面升级。据介绍,美图奇想大模型目前单次文生视频与图生视频时长均可达5秒,最长支持1分钟生成时长、帧率24FPS的超长视频,分辨率高达1080P,同时支持任意视频尺寸输出。值得一提的是,基于美图在影像领域的深厚积累,结合对特征的大范围提取,其实现了在艺术风格、细腻画风与细节把控间的高度平衡,不同画风自由切换。

 

 

此前,美图奇想大模型已全面应用于旗下影像与设计产品,其视频能力则率先落地美图旗下AI短片创作工具MOKI,让用户能够通过最低的门槛感受到AI为视频创作带来的改变。

 

字节跳动的豆包大模型,也将于9月24日发布视频生成模型。此前,字节跳动旗下的剪映团队已上线“即梦AI”,其核心功能包括图片生成、智能画布、视频生成以及故事创作等。

 

除了视频模型,AI玩家也开始抢占3D大模型赛道。国内3D大模型头部玩家VAST近日更新旗下大模型Tripo,支持文生3D、单图生3D。腾讯也推出了专门生成开放世界视频游戏的Transformer模型GameGen-O,能模拟游戏引擎功能,生成游戏角色、动态环境、复杂动作等等。

 

在大模型行业分析人士看来,此次各家大模型视频生成能力的集中升级,意味着国内AI行业正在进行新一轮洗牌,并将诞生一批新的头部玩家。而当下AI行业已进入商业化竞争的关键阶段,大模型如何落地到应用中,真正做出符合用户需求的产品,才是检验AI厂商实力的关键。

[展开]
加载更多