高德宣布全量开源具身操作基座模型 ABot-M0,可实现一个“通用大脑”适配多种形态具身机器人

久久百科 网络资讯 3

4 月 1 日消息,高德昨日宣布正式全量开源 ABot-M0,官方称这是全球首个基于统一架构的机器人具身操作基座模型,可实现一个“通用大脑”适配多种形态的具身机器人。

据介绍,该模型在 Libero、Libero-Plus、RoboCasa 等多个权威基准测试中实现 SOTA。其中在 Libero-Plus 基准上,该模型的任务成功率达 80.5%,较业界此前的标杆方案 Pi0 提升近 30%。

ABot-M0 模型架构图

官方称,此次 ABot-M0 的开源涵盖数据、算法与模型三大维度,旨在突破数据孤岛与部署难点,为具身智能领域提供前沿的空间理解能力,以及“开箱即用”的通用技术基座。

数据层面,ABot-M0 开源了目前规模最大的通用机器人数据集 UniACT,整合超过 600 万条真实操作轨迹,并提供从原始异构数据到标准化训练数据的全流程处理管线。通过统一动作表示、坐标系与控制频率,该数据集让分散全球的异构机器人数据能够统一使用,大幅提升预训练效率。

算法层面,ABot-M0 同步开源了模型架构与训练框架,其中包含高德创新提出的动作流形学习(AML)算法与双流感知架构。AML 摒弃传统噪声干扰的预测方式,让模型直接预测物理上可行的动作序列,而不是反复试错,显著提升解码效率与策略稳定;双流感知架构,不仅利用 VLM (Qwen3-VL) 提供高级语义理解,还允许通过一个“即插即用”的 3D 模块(如 VGGT)注入几何先验,增强模型的空间理解能力,无需修改骨干网络,即可弥补标准 VLM 在 3D 推理上的短板。

模型层面,ABot-M0 一并开源了端到端的预训练模型与完整工具链,开发者无需从零搭建训练框架即可快速适配工业、家庭等场景。统一架构验证了 " 一个大脑驱动多种形态 " 的可行性,为 " 通用大脑 + 专用躯体 " 的产业标准形成,提供了实证支撑。

ABot-M0 在 Libero-Plus 的评测结果

附项目资源:

  • 论文标题:ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

  • 项目主页:https://amap-cvlab.github.io/ ABot-Manipulation

  • 代码地址:https://github.com/ amap-cvlab / ABot-Manipulation

  • 论文全文:https://arxiv.org/ pdf/2602.11236