1月30日,星期五
12 小时前
蚂蚁灵波开源 LingBot-VA,让机器人「先思后行」

1 月 30 日,蚂蚁灵波宣布开源具身世界模型 LingBot-VA。作为全球首个自回归视频-动作世界模型,它将大规模视频生成与动作控制深度融合,让机器人学会了「先思后行」。

官方表示,在制作早餐、拆快递、叠衣物等 6 项高难度真机测试中,LingBot-VA 仅需极少量数据即可适配,成功率较业界标杆 Pi0.5 提升了 20%;在双臂协同等仿真测试中,成功率更是刷新纪录突破 90%。

据悉,LingBot-VA 采用 MoT 架构与异步推理管线,不仅算得准、更有响应快,解决了大模型落地的延迟难题。蚂蚁灵波表示,承接前几日开源发布的 LingBot-World(模拟环境)、LingBot-VLA(智能基座)与 LingBot-Depth(空间感知),LingBot-VA 探索出一条「世界模型赋能具身操作」的全新路径。

目前,LingBot-VA 的模型权重、推理代码已全面开源。

·图1:真机评测中,LingBot-VA在多项高难操作任务上性能超越业界标杆 Pi0.5
·图2:LingBot-VA 在LIBERO与RoboTwin 2.0仿真基准测试中刷新现有 SOTA

[展开]
加载更多