0

0

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

DDD

DDD

发布时间:2024-11-15 21:30:56

|

296人浏览过

|

来源于ZAKER

转载

现在,随便丢给机械手一个陌生物体,它都可以像人类一样轻松拿捏了——

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

除了苹果,罐头、乐高积木、大象玩偶、骰子,都不在话下:

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

这就是来自Meta FAIR团队最新的NeuralFeels技术,通过融合触觉和视觉,机械手可以更精确地操作未知物体,精度最高提升了 94%!

这项研究还登上了Science Robotics的封面,团队同时也公开了包含 70 个实验的新测试基准FeelSight。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

如何让机械手精确操作未知物体?

让机械手拿取常见的魔方、水果等早已是基操,但如何让机器人更好地操作未知物体一直是一个研究难题。

一个重要原因是目前的机械手训练都太过于依靠视觉,并且仅限于操作已知的先验物体,而现实中很多时候物体都会受到视觉遮挡,导致训练往往进步缓慢。

对此,团队研发出一种名为 NeuralFeels 的创新技术,为机器人在复杂环境中的物体感知与操作带来了新的突破。

这究竟是怎么做到的呢?让我们来一起看一下技术细节——

融合了触觉的多模态感知

NeuralFeels 技术的创新之处在于结合了视觉和触觉,通过多模态融合的方式,让机器手能够对未知物体持续进行 3D 建模,更精确地估计手持操作中物体的姿态和形状。

具体的处理流程如下图所示,前端实现了视觉和触觉的鲁棒分割和深度预测,而后端将此信息结合成一个神经场,同时通过体积采样进一步优化姿态。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

而在遮挡视角下,视觉与触觉融合有助于提高跟踪性能,还可以从无遮挡的局部视角进行跟踪。团队在摄像机视角的球面上量化了这些收益。

从下图中可以观察到,当视觉严重遮挡时,触觉的作用更大,而在几乎没有遮挡时,触觉会发挥微调作用。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

前端深度学习策略

首先来看看 NeuralFeels 技术的前端(Front end),它采用了基于深度学习的分割策略和触觉 Transformer,可以精确提取目标对象深度。

用运动学分割一切

神经优化非常依赖分割对象的输入深度,所以团队将前端设计成能够从视觉中鲁棒地提取对象深度的形式。深度在 RGB-D 相机中是现成的,但为了应对严重遮挡的问题,团队还引入了一种基于强大视觉基础模型的动力学感知分割策略。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

触觉 Transformer

最近有研究表明,在自然图像中使用 ViT 进行密集深度预测更有效,于是团队提出了一种触觉 Transformer,用于通过视觉触觉预测接触深度,这个 Transformer 完全在模拟中训练,可在多个真实世界的 DIGIT 传感器上通用。机械手可以用嵌入式摄像头直接感知发光的胶垫,通过监督学习获得接触深度。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

后端姿势优化

NeuralFeels 的后端(Back end)部分通过使用 Theseus 中的自定义测量因子,将前端的中间输出转化为非线性最小二乘问题进行优化。

形状和姿态优化器

后端模块从前端模块得到中间输出,并在线构对象模型。这个过程将交替使用来自视觉 - 触觉深度流的样本进行地图和姿态优化步骤。在本研究的地图优化器中,即时 NGP 模型的权重可以完全描述物体的 3D 几何结构。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

神经 SLAM

在现实世界和模拟中,团队构建了一个不断演进的神经 SDF,它整合了视觉和触觉,并可以同时跟踪物体。下图展示了对应的 RGB-D 和触觉图像的输入流,以及相应的姿态重建。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

Postme
Postme

Postme是一款强大的AI写作工具,可以帮助您快速生成高质量、原创的外贸营销文案,助您征服全球市场。

下载

神经跟踪:给定形状的对象姿态估计

当目标对象存在对应的 CAD 模型时,NeuralFeels 可以实现优秀的多模态姿态跟踪能力。此时目标对象的 SDF 模型是预先计算的,NeuralFeels 会冻结神经场的权重,仅使用前端估计进行视觉 - 触觉跟踪。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

NeuralFeels 大大提升了机械手性能

为了评估 NeuralFeels 技术的性能,研究团队在模拟和真实世界环境中进行了多次实验,涉及 14 种不同物体,相关测试集 FeelSight 也已发布!

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

实验中使用了多种评估指标,包括用于评估姿势跟踪误差的对称平均欧几里得距离(ADD-S),以及用于衡量形状重建精度和完整性的 F 分数等。

结果非常令人惊喜,NeuralFeels 技术在以下 3 个方面都有非常出色的表现:

1. 物体重建精度大幅提升

在物体重建方面,研究发现结合触觉信息后,表面重建精度在模拟环境中平均提高了 15.3%,在真实世界中提高了 14.6%。

最终重建结果在模拟环境中的中位误差为 2.1 毫米,真实世界中为 3.9 毫米。这表明 NeuralFeels 技术能够有效地利用触觉信息补充视觉信息,更准确地重建物体形状。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

2. 物体姿态跟踪更加精准

在物体姿态跟踪方面,NeuralFeels 技术相比仅使用视觉信息的基线方法有显著改进。

在模拟环境中,姿态跟踪精度提高了 21.3%,真实世界中提高了 26.6%。

在已知物体形状的姿态跟踪实验中,即使存在不精确的视觉分割和稀疏的触摸信号,该技术也能实现低误差的姿态跟踪,平均姿态误差可降至 2 毫米左右。

并且,触觉信息在降低平均姿态误差方面发挥了重要作用,在模拟环境中可使误差降低 22.29%,在真实世界中降低 3.9%。

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

3. 应对复杂场景表现出色

在面对严重遮挡和视觉深度噪声等具有挑战性的场景时,NeuralFeels 技术同样表现非常出色。

在模拟的 200 个不同相机视角的遮挡实验中,平均跟踪性能提升 21.2%,在严重遮挡情况下提升幅度可达94.1%!

在视觉深度噪声模拟实验中,随着噪声增加,融合触觉信息能有效降低误差分布,使机器人在视觉信息不理想的情况下仍能准确跟踪物体姿态。

研究意义

NeuralFeels 技术的创新之处在于它融合了多模态数据、并结合了在线神经场,这些技术让机器人能够在操作未知物体时实现更准确的姿态跟踪和形状重建。

而且,与复杂的传感器相比,团队使用空间感知组合所需的硬件更少,也比端到端感知方法更容易解释。

尽管目前在一些方面仍存在改进空间,如在长期跟踪中由于缺乏闭环检测可能导致小误差累积,但对于提升机械手操作精度的效果非常显著,

未来,研究人员计划进一步优化技术,例如通过基于特征的前端获取更粗略的初始化,加入长期闭环检测以减少姿态误差的累积,通过控制神经 SLAM 的输出进行通用灵巧性研究等。

这样一来,家庭、仓库和制造业等复杂环境中作业的机器人的性能都有可能得到极大的提升了!

Meta 最新触觉机械手登 Science 子刊封面,操作未知物体精度最高提升 94%

参考资料:

[ 1 ] https://www.science.org/doi/10.1126/scirobotics.adl0628

[ 2 ] https://suddhu.github.io/neural-feels/

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

3725

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2862

2024.08.16

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

495

2024.06.04

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

68

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

162

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

84

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

113

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

29

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.3万人学习

Django 教程
Django 教程

共28课时 | 4.8万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号