火山引擎发布豆包视频生成模型 Seedance 1.0 lite

5月13日，星期二

2025-05-13 15:17

5 月 13 日，在 FORCE LINK AI 创新巡展·上海站，火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包 1.5·视觉深度思考模型，并升级豆包·音乐模型，以更全面的模型矩阵、更丰富的智能体工具，帮助企业打通从业务到智能体的应用链路。

豆包·视频生成模型 Seedance 1.0 lite：效果好、生成快、更便宜

此次全新发布的豆包视频生成模型 Seedance 1.0 lite，支持文生视频、图生视频，视频生成时长支持 5s、10s，分辨率提供 480P、720P。企业用户可在火山方舟平台使用该模型 API，个人用户也可在豆包 App、即梦体验。

作为豆包视频生成模型系列的小参数量版本，Seedance 1.0 lite 模型实现了两大突破：影视级的视频生成质量、视频生成速度大幅提升，兼顾效果、速度、性价比。拥有「更精准的指令遵循」「更丰富的影视级运镜」「更合理的运动交互」

Seedance 1.0 lite 模型可广泛应用于电商广告、娱乐特效、影视创作、动态壁纸等场景。例如在电商领域，可帮助商家快速生成高质量的营销视频素材，精准匹配产品展示、活动推广等场景，降低制作成本与周期。

豆包 1.5·视觉深度思考模型，在 60 项公开评测中取得 38 项第一

新发布的豆包 1.5·视觉深度思考模型（Doubao-1.5-thinking-vision-pro），激活参数仅 20B，但具备强大的多模态理解和推理能力，在 60 个公开评测基准中，有 38 个取得 SOTA 表现，在视频理解、视觉推理、GUI Agent 能力等方面均处于第一梯队。目前，该模型已在火山方舟上线。

在视频理解方面，支持动态帧率采样，视频时序定位能力显著增强，结合向量搜索，可精准定位视频中与文本描述相对应的片段。

同时，新增视频深度思考能力。模型学习了数万亿多模态标记数据，掌握广泛视觉知识，结合强化学习，使视觉推理能力大幅提升。例如，在复杂的图形推理题中，模型提出假设，进行推理检验，当发现和假设不一样时，还能进行不断反思，提出新的猜测，直到得出正确答案。

此外，该模型新增 GUI Agent 能力。基于强大的 GUI 定位性能，可在P C 端、手机端等不同环境中完成复杂交互任务。例如，可对新开发的 App 功能进行自动化检测，目前该功能已经应用于字节跳动多款 App 产品的开发测试中。

去年火山引擎推出了豆包·音乐模型，用户仅通过一张图、一句话就可以创作 10 多种不同风格的高品质音乐。此次大会上，豆包·音乐模型升级，不仅支持英文歌曲创作，还可以通过理解视频，自动适配纯音乐 BGM。目前豆包·音乐模型已全量上线，个人和企业用户可在海绵音乐、火山引擎官网体验。

Data Agent 及新版 Trae 亮相上海巡展

Data Agent是火山引擎推出的企业数据全场景智能体，具备主动思考、洞察、分析、行动能力，可以帮助企业挖掘数据资产价值，功能覆盖数据分析、智能营销等关键领域。

此外，为帮助开发者更便捷地利用 AI 提升开发效率，国内首款 AI 原生 IDE 产品 Trae 也带来多个重点功能升级，例如统一的 AI对话面板（所有交互仅需一个对话框）、支持自定义 @Agent（构建你的专属 AI 团队）、新增联网搜索 #Web 和文档 #Doc 的上下文理解类型（AI 执行需求更准确高效）、通过 MCP 让 AI 主动调用外部工具等。

目前，Trae 已配置豆包 1.5·深度思考模型（Doubao-1.5-thinking-pro），基于模型主动深度思考和 20 毫秒极低延迟，让代码生成的质量更好、效率更高。

豆包大模型产业落地加速，为行业智能化提效

目前，豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地，覆盖 4 亿终端设备、八成主流车企、70% 系统重要性银行和数十家证券基金公司、近七成的 C9 顶级高校和 100 多家科研院所。

[展开]