• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
5月13日,星期二
10 小时前
火山引擎发布豆包视频生成模型 Seedance 1.0 lite

5 月 13 日,在 FORCE LINK AI 创新巡展·上海站,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包 1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。

 

豆包·视频生成模型 Seedance 1.0 lite:效果好、生成快、更便宜

 

此次全新发布的豆包视频生成模型 Seedance 1.0 lite,支持文生视频、图生视频,视频生成时长支持 5s、10s,分辨率提供 480P、720P。企业用户可在火山方舟平台使用该模型 API,个人用户也可在豆包 App、即梦体验。

 

作为豆包视频生成模型系列的小参数量版本,Seedance 1.0 lite 模型实现了两大突破:影视级的视频生成质量、视频生成速度大幅提升,兼顾效果、速度、性价比。拥有「更精准的指令遵循」「更丰富的影视级运镜」「更合理的运动交互」

 

Seedance 1.0 lite 模型可广泛应用于电商广告、娱乐特效、影视创作、动态壁纸等场景。例如在电商领域,可帮助商家快速生成高质量的营销视频素材,精准匹配产品展示、活动推广等场景,降低制作成本与周期。

 

 

豆包 1.5·视觉深度思考模型,在 60 项公开评测中取得 38 项第一

 

新发布的豆包 1.5·视觉深度思考模型(Doubao-1.5-thinking-vision-pro),激活参数仅 20B,但具备强大的多模态理解和推理能力,在 60 个公开评测基准中,有 38 个取得 SOTA 表现,在视频理解、视觉推理、GUI Agent 能力等方面均处于第一梯队。目前,该模型已在火山方舟上线。

 

在视频理解方面,支持动态帧率采样,视频时序定位能力显著增强,结合向量搜索,可精准定位视频中与文本描述相对应的片段。

 

同时,新增视频深度思考能力。模型学习了数万亿多模态标记数据,掌握广泛视觉知识,结合强化学习,使视觉推理能力大幅提升。例如,在复杂的图形推理题中,模型提出假设,进行推理检验,当发现和假设不一样时,还能进行不断反思,提出新的猜测,直到得出正确答案。

 

此外,该模型新增 GUI Agent 能力。基于强大的 GUI 定位性能,可在P C 端、手机端等不同环境中完成复杂交互任务。例如,可对新开发的 App 功能进行自动化检测,目前该功能已经应用于字节跳动多款 App 产品的开发测试中。

 

 

去年火山引擎推出了豆包·音乐模型,用户仅通过一张图、一句话就可以创作 10 多种不同风格的高品质音乐。此次大会上,豆包·音乐模型升级,不仅支持英文歌曲创作,还可以通过理解视频,自动适配纯音乐 BGM。目前豆包·音乐模型已全量上线,个人和企业用户可在海绵音乐、火山引擎官网体验。

 

Data Agent 及新版 Trae 亮相上海巡展

 

Data Agent是火山引擎推出的企业数据全场景智能体,具备主动思考、洞察、分析、行动能力,可以帮助企业挖掘数据资产价值,功能覆盖数据分析、智能营销等关键领域。

 

此外,为帮助开发者更便捷地利用 AI 提升开发效率,国内首款 AI 原生 IDE 产品 Trae 也带来多个重点功能升级,例如统一的 AI对话面板(所有交互仅需一个对话框)、支持自定义 @Agent(构建你的专属 AI 团队)、新增联网搜索 #Web 和文档 #Doc 的上下文理解类型(AI 执行需求更准确高效)、通过 MCP 让 AI 主动调用外部工具等。

 

目前,Trae 已配置豆包 1.5·深度思考模型(Doubao-1.5-thinking-pro),基于模型主动深度思考和 20 毫秒极低延迟,让代码生成的质量更好、效率更高。

 

豆包大模型产业落地加速,为行业智能化提效

 

目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖 4 亿终端设备、八成主流车企、70% 系统重要性银行和数十家证券基金公司、近七成的 C9 顶级高校和 100 多家科研院所。

[展开]
加载更多