蚂蚁集团旗下具身智能企业灵波科技正式对外开源其具身大模型 lingbot-vla。

据悉,在上海交通大学发布的具身智能评测基准 GM-100(涵盖 100 个真实世界操作任务)中,LingBot-VLA 在三种不同物理机器人平台上展现出优异的跨本体泛化能力:在未使用深度信息(w/o Depth)的情况下,平均任务成功率从 Pi0.5 的 13.0% 提升至 15.7%;当引入深度感知(w/ Depth)后,空间理解能力显著增强,平均成功率进一步跃升至 17.3%,充分验证了该模型在准确性与泛化性方面的领先实力。

在 RoboTwin 2.0 仿真评测基准(含 50 项高难度任务)中,面对复杂环境扰动(如动态光照变化、场景杂物干扰、平台高度随机偏移等),LingBot-VLA 凭借自主研发的可学习查询对齐机制,深度融合深度模态信息,操作成功率相较 Pi0.5 提升达 9.92%,成功实现从仿真训练到实体部署的全链路性能突破。

低后训练开销、高训练效率、全代码开源——真正面向落地的 VLA 模型
依托覆盖主流机器人构型与多样化操作场景的大规模预训练,LingBot-VLA 具备扎实的通用操控基础,并能以极低成本高效适配各类下游机器人任务。
实测数据显示,LingBot-VLA 在少量标注数据下即可超越 Pi0.5 的性能表现;且随着训练数据规模扩大,其性能优势持续放大。

研发团队同步打造了一套高性能后训练工具链,在仅配备 8 卡 GPU 的硬件环境下,达成单卡每秒处理 261 个样本的训练吞吐量,训练效率较 StarVLA、OpenPI 等主流框架提升 1.5~2.8 倍,显著降低数据与算力投入成本。
本次 LingBot-VLA 开源内容包括完整模型权重,并全面开放涵盖数据预处理、高效微调策略及自动化评估流程的一站式代码库。
- Website: https://www.php.cn/link/b6b3485c6734a0d18d966d2ca4311499
- Model:
https://www.php.cn/link/6d1ca411fcbc6a21484877d59be651db
https://www.php.cn/link/0d58bd579e0e18d6529fcfb6ba9812b8 - Datasets: https://www.php.cn/link/c4a55894b71e51a90b84a28c1b946d2b
- Code: https://www.php.cn/link/10fbe18a1f152d7b4c7ab027cb719c9f
- Tech Report: https://www.php.cn/link/4b49091c850af05caf0012344b4a8a58










