0

0

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

王林

王林

发布时间:2024-05-06 14:52:10

|

998人浏览过

|

来源于51CTO.COM

转载

Article Forge
Article Forge

行业文案AI写作软件,可自动为特定主题或行业生成内容

下载

特斯拉人形机器人又解锁了新技能!

昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。

让我们先一睹 Optimus 的最新技能和训练细节。

现在,Optimus 的端到端神经网络经过训练,能够对特斯拉工厂的电池单元进行准确分装。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

在机器人的FSD计算机上实时运行,仅仅依靠2D摄像头、手部触觉和力传感器。Optimus利用它的腿保持平衡,同时网络驱动整个上半身。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

在插入过程中需要非常精确的动作,且容错率很低,神经网络会自动定位下一个空闲槽位。Optimus 还能从故障中自主恢复。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

Optimus 的训练数据是通过人类远程操作收集,并针对各种任务进行了扩展。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

Optimus 在工厂进行测试,人工干预率持续下降。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

当然,Optimus 现在可以在定期绕着办公室行走,不仅走得更快,走的距离也越来越远了。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

对此,特斯拉 Optimus(Tesla Bot)工程师 Milan Kovac 对 Optimus 的更多训练细节进行了解读。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

在过去的几个月里,特斯拉出色的制造团队制造出了更多的机器人,以便进行研究并收集人工智能数据。

团队训练并部署了一个神经网络,允许 Optimus 开始执行有用的任务,例如从传送带上捡起电池单元并将它们精确地插入托盘中。

这个神经网络完全端到端运行,这意味着 Optimus 只消耗来自机器人 2D 摄像头的视频以及板载本体感受器上的数据,并直接产生关节控制序列。

Optimus 完全在机器人的嵌入式 FSD 计算机上运行,由板载电池供电。这样的设计使得单个神经网络可以通过添加更多样化的数据到训练过程中来执行多个任务。

虽然目前 Optimus 还不完美,速度还有点慢,但我们看到了越来越高的成功率和越来越少的失误。特斯拉还训练 Optimus 从失败案例中恢复,并看到了自发的校正发生。

特斯拉已经在一家工厂部署了几台 Optimus 人形机器人,它们每天都在真实的工作站上进行测试,并持续改进。

团队正在进行进一步的工作,以使 Optimus 移动更快,以及应对更恶劣的地形,同时不牺牲它的人性化特性。团队还将专注于可重复性、训练神经网络处理动态校准和机器人之间的微小差异。很快会有更多的更新。

此外,英伟达高级研究科学家、AI Agents 负责人 Jim Fan 对 Optimus 新视频展示出的技能给予了很高的评价。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

他认为,视频让我们窥见了人类数据收集的真实场景,这是 Optimus 最大的优势。建立这样的流水线需要什么呢?Optimus 做到了以下几点:

Optimus 的手是世界上顶级五指灵巧型机器人手之一,它具有触觉感知,拥有 11 个自由度(DOF),相比之下许多竞品只有 6-7 个 DOF,并且具有强大的稳健性,能够在不需要持续维护的情况下承受大量的物体交互。

远程操作软件:我们可以看到人类操作员戴着 VR 眼镜和手套。设置软件以实现第一人称视频的实时传输和精确控制输出,同时保持极低延迟,这是非常了不起的。人类对于自己动作和机器人动作之间的最微小延迟都非常敏感。Optimus 有一个流畅的全身控制器,可以实时执行人类姿态。

大规模 fleet:你需要不止一个机器人来并行收集数据,需要训练有素的人类每天进行多次轮班(最好全天候),以及一个随叫随到的维护团队,以确保机器人始终处于忙碌状态。这是学术研究实验室甚至都不会考虑的大量操作复杂性。

任务与环境:弄清楚要远程操作什么也同样重要。目前,大多数此类工作都是由演示驱动的:收集你想要放入社交媒体视频中的任务数据。但想要解决通用型机器人的问题,我们需要仔细考虑任务和环境的分布。从视频的 43 秒到 51 秒部分,我们可以看到工厂和家居环境,如移动电池、处理洗衣物、将日常物品分类放入货架。

这是一个开放性的研究问题:如果你只有预算来收集 1000 个任务的训练数据,你会选择什么来最大化技能转移和泛化呢?

结论:远程操作是解决人形机器人问题的必要条件,但不足以充分解决问题。它从根本上来说无法扩展。

在评论区,马斯克预告了 Optimus 人形机器人手部的最新目标,在今年晚些时候将拥有 22 自由度(DoF)。这就更让人期待一波了。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

此前,据马斯克在财报电话会议上透露,特斯拉 Optimus 人形机器人可能会在今年底拥有完成「有用的工厂任务」的能力,并计划今年底前在自家工厂率先使用。同时特斯拉有可能在 2025 年年底前对外销售 Optimus。

特斯拉人形机器人「进化史」

特斯拉人形机器人最早要追溯到 2021 年 8 月的「特斯拉 AI 日」活动上,当时马斯克首次透露了要造人形机器人(Tesla Bot)的设想。

这款人形机器人的身高大概是 1.72 米,重约 112 斤,身材匀称,还带有一张面部屏幕,能够以约 8 公里 / 小时的速度移动。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

2022 年 10 月,这一年的「特斯拉 AI 日」上,Optimus 人形机器人首次亮相。彼时,它还不能做跳舞等花样表演。机器人工作时的功耗是 500W,重量达到 73 公斤,手运动的自由度有 27 个。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

不过,在 Demo 演示中,Optimus 展示了其搬箱子、浇花、在特斯拉超级工厂工作的画面。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

2023 年 5 月,经过半年多的蛰伏,特斯拉 Optimus 终于具备了流畅行走和抓取物体的能力。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

2023 年 9 月,特斯拉 Optimus 再次进化,可以自主对物体进行分类了,亮点在于神经网络完全端到端训练:输入视频、输出控制。闲暇之余,它还能做瑜伽消遣。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

2023 年 12 月,Optimus 二代到来,让人的确看到了电影《机械公敌》里的样子了。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

随着新视频的发布,特斯拉人形机器人的进步速度再次令人惊叹。

特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

498

2024.06.04

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

38

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

83

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

169

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

246

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.5万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号