0

0

特斯拉前AI总监Karpathy解密离职和纯视觉方案

WBOY

WBOY

发布时间:2023-05-16 11:28:06

|

686人浏览过

|

来源于51CTO.COM

转载

Avatar AI
Avatar AI

AI成像模型,可以从你的照片中生成逼真的4K头像

下载

特斯拉前人工智能总监,新晋ai网红老师andrej karpathy近日参加了mit人工智能专家lex fridman的播客节目。对于人工智能爱好者来说,这次访谈可谓是「双厨狂喜」。

将近三个半小时的访谈中,两人谈论了人工智能、宇宙、人类社会等宏大命题,还具体讨论了特斯拉的多项技术,如自动驾驶、Optimus人形机器人、和特斯拉视觉方案。此外,两人还聊到了观众最关心的Andrej的离职,以及特斯拉取消超声波雷达的原因。

不用雷达:贵还难使!

特斯拉去年从传感器套件中删除了毫米波雷达,刚刚又宣布要移除所有超声波雷达,只保留摄像头,采用纯视觉方案。Lex问道:「这使车辆的道路探测变得更难还是更容易?」

Karpathy表示:「人们大都会认为这些传感器是汽车的不可或缺的资产,但如果充分考虑产品的整体性,这些传感器实际上是潜在的负担。」

「这些传感器不是免费的,不可能凭空出现在车上。不仅需要有一个完整的供应链,还需要有人负责采购,」而这些都是要花真金白银的。

同时,传感器可能会故障,需要更换。「作为汽车制造的一部分,传感器的生产还可能拖累整体进度。所以,你不仅需要采购和维护,还必须有编写固件的团队。」

不仅如此,使用雷达传感器还会导致探测系统的冗杂。Karpathy说:「把它们纳入到汽车系统中后,会导致系统整体的过度膨胀。」

安装这么多的传感器对数据引擎也会造成压力。随时间不断发生发展,传感器的功能越来越细化。「现在有太多的雷达,每个的功能都不尽相同。这造成了探测系统的过度膨胀。此外,过多的雷达还会互相干扰,影响效果。」

他高度赞扬前老板马斯克化繁为简的能力,「我认为埃隆很擅长简化,他曾说:『最好的部件是没有部件。』他总会尝试抛弃那些不重要的东西,一直在做减法,因为他了解组织的熵增现象。」

成本高,问题多,需要人员不断修复。还会带来探测系统的冗杂。在这种情况下,安装雷达的成本很高,并且没有很大的发展潜力。

「作为一个计算机视觉工程师,想改善车辆的探测网络,就会考虑增加传感器是否有用,有多大用处。我们进行对比试验,真正确定雷达是否能给车主提供非常有用的路况信息。但结果表明区别并不大,这说明雷达并没有用。」

Karpathy不仅解释特斯拉抛弃这项技术的原因,还断言其他汽车公司也会做出相同的选择。「和激光雷达相似,我认为超声波雷达不能提供很多额外信息。我认为其他还在用激光雷达的公司也会抛弃这项技术的。」

纯视觉方案:更胜一筹

Karpathy对于纯视觉方案抱有很大希望。「如果选择纯视觉方案,我们可以集中所有资源,建立强大的数据引擎。」

「这种传感器的带宽非常高,我们在这方面取得了实质进展。只要大力投资该技术,就可以获得非凡的成就。」

Karpathy表示,纯视觉方案既是必要的,也是充分的。某种意义上讲,世界是为了人类的视觉消费而被设计出来的,人们有视觉上的需求。

同时,该方案能提供所有驾驶者需要的全部驾驶信息。「因此,我们必须集中资源发展这项技术,并不断问自己:『我真的要引入其他的传感器吗?』我认为这种情况下的答案是否定的。」

虽然纯视觉方案获得Karpathy的大力支持,但当Lex问及如何看待激光雷达和纯视觉方案,以及点云和体素之间的区别时,Karpathy坦言:两者不是自动化驾驶的重点。

他说:「我一直看不懂这个争论。因为这不是问题的核心。我觉得大家在讨论自动化时应该关注是否有路测车队作为支撑。这个才是人工智能系统能否更好服务的关键。」

因此,在考虑传感器的探测能力时必须要全面。包括能否提供路测车队来收集大量数据,能否整合传感器与数据,并将传感器整合到数据引擎中,实现数据不同部分的快速搜索,之后不断改进所使用的模型。

厘米级地图:没必要!

当被问及如何看待其他公司制作运营地区的自动驾驶汽车高清地图时,Karpathy表示:「太疯狂了!」

「我们一直在谈论自动驾驶如何改变世界,谈论全球范围内该技术如何运用到交通领域。如果你需要持续提供一个厘米级精准的世界或城市地图,并保持更新频率,这个成本太大了。」

当Lex问这种做法是否会扩展到美国的全部地区时,Karpathy用特斯拉的例子现身说法:「人们不需要如此高精度的地图。一个低精度的地图足以展现路况和前方路段等关键信息。驾驶者可以像看谷歌地图一样,通过这些关键信息理解自己所处环境。」

「特斯拉在驾驶系统中使用和谷歌地图类似分辨率的信息。但不会预先绘制厘米级精度的地图。这种做法画蛇添足,费力不讨好,还稀释了团队能力,让技术人员无法专注于真正必要的东西,那就是计算机视觉问题。」

离职后还会回来?这就是爱

在谈及为何离开特斯拉时,Karpathy表示这是个艰难的决定。虽然特斯拉还未完全实现自动化驾驶,但研发团队已经可以自行发展。这次离职也给他一个机会,去重新审视自己对于人工智能、开源和教育的热爱。

此前,他供职特斯拉已有5年,直接向大老板马斯克汇报,在特斯拉的一众高管中,绝对算得上是老资格了。据报道,此前这位李飞飞的高徒已经休假了几个月时间,之前还曾说过,近期结束休假后就将重返特斯拉,结果直接宣布离职了。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

特斯拉前AI总监Karpathy解密离职和纯视觉方案

Karpathy表示:「很高兴在过去5年里协助特斯拉一起实现了众多目标,离开的决定其实是个艰难的选择。这5年里,自动驾驶完成了『毕业』,从蹒跚寻路开始,开上了城市的街头。我无比期待未来更强大的自动驾驶团队能够继续辉煌下去。」

特斯拉前AI总监Karpathy解密离职和纯视觉方案

关于离职之后的未来打算,他表示:「未来还没什么具体的计划,可能回归自己拥有长期热情的领域,比如AI技术工作、开源和教育等。」

当然,他在访谈中也提到重回特斯拉的可能性:「或许在某个时候我会回来,在特斯拉从事Optimus或AGI(通用人工智能)的工作。特斯拉将是一个了不起的公司,可以创造非凡。在这个大规模的机器人公司,有才华的设计师们正创造前所未有的新事物。」

从特斯拉高管到网红老师,Karpathy可以为了人工智能离开特斯拉,也可以为了人形机器人和AGI有朝一日重返岗位。他追求的不是物质与地位,而是技术的不断进步。这和其导师李飞飞毕业后拒绝转行,坚守计算机图像识别研究的行为异曲同工。或许,这就是「有其师必有其徒」吧!

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

16

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

23

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

75

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

95

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

218

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

420

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

168

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

222

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

33

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 13.2万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号