AI视频生成大战“白热化”，阿里、字节、快手、美图均押注

9月24日，星期二

2024-09-24 13:04

近期，国内外多家AI大模型密集“上新”。国内AI视频生成激战正酣，也有玩家悄悄抢占3D大模型赛道，OpenAI则卷向了复杂推理。分析人士认为，这一轮技术迭代，或将使AI行业诞生新的一线梯队。

近期AI圈最受瞩目的产品，莫过于OpenAI的“o1”大模型。9月13日，OpenAI正式发布新一代大模型“o1”，即之前所传的“草莓”模型。据介绍，“o1”大模型具备更强大的推理能力，能够解决多步骤问题，在复杂的科学、数学和编程任务方面，“能够像人类一样思考”。

回到国内，角逐最激烈的，当属视频生成赛道。今年2月，OpenAI发布视频大模型Sora，开启了AI视频的新时代。此后半年，国内大厂纷纷布局，国产AI视频大模型密集诞生。

6月，对标Sora，快手发布视频生成大模型“可灵”，支持通过文生视频、图生视频、视频续写功能，生成最长2分钟、30FPS的1080P高分辨率视频。就在“可灵”上线一周后，Luma AI发布文生视频模型Dream Machine，每120秒能生成120帧画面，还能快速生成5秒钟的电影级别视觉效果视频片段。

9月，互联网大厂的AI视频之战再次掀起新高潮。

9月19日，阿里宣布通义万相视频生成功能上线。据报道，通义万相视觉模型支持最长5秒、每秒30帧、分辨率为720P的视频生成，并生成与画面匹配的音效，目前已开放文生视频、图生视频两个创作入口。

9月23日，美图公司公布旗下美图奇想大模型（MiracleVision）视频生成能力全面升级。据介绍，美图奇想大模型目前单次文生视频与图生视频时长均可达5秒，最长支持1分钟生成时长、帧率24FPS的超长视频，分辨率高达1080P，同时支持任意视频尺寸输出。值得一提的是，基于美图在影像领域的深厚积累，结合对特征的大范围提取，其实现了在艺术风格、细腻画风与细节把控间的高度平衡，不同画风自由切换。