北京人形机器人创新中心正式开源具身智能视觉-语言-动作(vla)大模型xr-1。该模型是国内首个、同时也是当前唯一通过国家具身智能标准测试的vla大模型。

本次开源内容涵盖XR-1大模型本体,并同步推出高性能数据底座RoboMIND2.0与高精度数字资产数据集ArtVIP最新版本。
作为具身智能系统的“小脑”,XR-1具备跨硬件平台运行能力,可无缝适配天工2.0、UR系列、Franka Emika等多种主流机器人本体,实现通用操作知识的跨平台迁移。基于自研超百万级多本体交互数据,XR-1在颜色识别、空间定位、背景鲁棒性等七大泛化能力维度中表现优异,稳定完成抓取放置、推拉移动、双臂协同旋转等复杂操作任务。
目前,北京人形机器人创新中心已建成覆盖“大脑—小脑—本体”的全栈式具身智能技术生态:
- 物理本体层:依托“具身天工”平台,已量产并发布天工2.0、天轶2.0等多形态机器人硬件系统;
- 具身大脑层:基于“慧思开物”平台,此前已开源WoW(我悟)世界模型与Pelican-VL(天鹕)多模态大模型,专注于高层语义理解、环境建模与任务规划;
- 具身小脑层:本次开源的XR-1模型承担指令解析与运动控制职能,将高层决策精准映射为底层执行动作,打通从AI推理到物理交互的闭环链路。
源码地址:点击下载










