0

0

LeCun预言AGI:大模型和强化学习都是斜道!我的「世界模型」才是新路

WBOY

WBOY

发布时间:2023-04-08 20:51:01

|

2136人浏览过

|

来源于51CTO.COM

转载

AI界当代最著名巨擘之一、Meta的AI实验室灵魂人物Yann LeCun,长期致力于让机器对世界的运转理念有基础了解,也就是让AI获得常识。LeCun过去的做法,是用视频选段训练神经网络,让AI逐个像素地预测日常活动视频下一帧将会出现啥。不出人意料地,他自己承认这途径撞上了铁板。在数月到一年半之间的思考后,LeCun对下一代AI有了新的想法。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

AI新路径

在《MIT科技评论》的采访中,LeCun勾勒出他的新研究路径,称如此会给机器赋予探索世界的常识基础。对LeCun而言,这就是打造AGI(通用人工智能)的第一步。能像人一样思考的机器,在AI业界诞生时就是指导性愿景,同时也是争议最大的理念之一。

不过LeCun的新路径或许还很不完备,引来的疑问可能比获得的答案还要多。最大的疑问在于,LeCun自己承认了他还不知道如何造出自己所描述的那种AI。此路径的核心是个能以与之前不同方法审视、学习真实世界的神经网络。LeCun终于放弃了让AI逐个像素猜下一帧视频,只让新的神经网络学会完成任务必备的关键知识。

图片

然后LeCun打算将这个神经网络与另一个被称为「配置器」的神经网络配对。「配置器」专管决定哪些细节是主神经网络必须学会的、并照此来自动调节主系统。对LeCun来说,AGI是人类与未来科技互动的不可或缺部分。当然此展望和他押注全副身家搞元宇宙的东家Meta公司不谋而合。

LeCun说,在10-15年间,取代现在智能手机地位的将是AR眼镜。AR眼镜上就必备能辅助人类日常活动的虚拟智能助手。如果这些助手要起最大作用,那必然或多或少要跟得上人脑智能才行。

「世界模型」是AGI核心

LeCun最近热衷的「世界模型」,按他说就是大多数动物大脑的基础运转模式:为真实世界跑个模拟。动物从婴儿期开始就用预估-试错方法来发育智能。幼孩们通过观察真实世界的运动与挫折,在生命的前几个月就发育出了智能的基础。

观察一个小球掉个几百次,普通婴儿就算没上过基础物理课、学过牛顿三定律,也对重力的存在与运作有基础认知。所以这种直觉性/默会性推理,被常人称作「常识」。人类就是通过常识来认知真实世界的大多数可能未来与不可能幻想,来预见自己的行为后果并据此做出决策。如此的人智既不需要像素级精确细节,也不需要完备的物理学参数库。就算有人没有视力、或者是个文盲,一样可以正常发挥智能。

图片

但教机器学会常识就很难。当下的神经网络要被展示数千次示例后,才能开始模糊发现内含规律模式。LeCun表示,智能的基础是预测即刻未来的常识能力。不过在放弃让AI逐像素预测后,LeCun表示要换个思路。LeCun打了个比方:想象下你捏根钢笔悬空放手,常识告诉你这根钢笔必然会坠落,但掉落的精确位置则不在人智预测范围内。按过去的AI开发模式,AI要跑复杂的物理学模型,来预测钢笔是否会坠落、同时求得坠落的精确位置。

现在LeCun努力让AI只预测出钢笔会坠落的常识结论,至于精确位置不在求解范围内。LeCun说这就是「世界模型」的基本模式。

图片

LeCun表示他已经造出了可以完成基础客体识别的「世界模型」早期版本,现在在致力于训练它学会上述常识性预测。

不过「配置器」在此中的功用,LeCun说自己还没搞明白。LeCun想象中的「配置器」AI,是整个AGI系统的控制元件。它将要决定「世界模型」在任何时刻需要做出何等常识性预测、并调适「世界模型」为此该处理的细节数据。LeCun现在坚信「配置器」必不可少,但不知道怎么训练一个神经网络来做到这效果。

「我们需要摸索出可行的技术清单来,而这个清单现在还不存在。」在LeCun的愿景中,「配置器」和「世界模型」是未来AGI基础认知架构的两大核心部分,在此之上才能发展出感知世界的认知模型、驱使AI调整行为的激励模型等等。LeCun称,如此神经网络就能做到每部分都在成功模拟人脑。比如「配置器」和「世界模型」起了前额叶的作用,激励模型是AI的杏仁体,等等。图片

认知架构、不同层面细节的预测模型,这些都是多年来业界中既有的一派观点。不过当深度学习成为AI业界主流后,很多此类老点子就显得过时。现在LeCun重拾传统智慧:「AI研究界把这些东西忘掉好多了。」

大模型和强化学习都是死路

之所以重走旧路,是因为LeCun坚信现在的业界主流路径已经走进死胡同。关于如何做出AGI来,现在AI业界有两种主流观点。

BiLin AI
BiLin AI

免费的多语言AI搜索引擎

下载

一是很多研究者坚信到搞出乌龙的路径:就像OpenAI家的GPT系列和DALL-E系列那样,模型越大越好,大到超过临界点,AI就觉醒人智了。

二是强化学习:不断地试错,并按试错结果奖惩AI。这是DeepMind家做各种棋牌AI、游戏AI的路数。这种路径的信徒认为,只要奖励激励设定对头,强化学习终将造出真正AGI。

Lecun表示在座的两种人都是垃圾:「无限扩张现有大语言模型的量级,最后就能做出人类水平的AI?这种荒唐论调,我一秒钟都没信过。这些模型就只能单纯捯饬各种文本与图像数据,完全没有真实世界的直接体验。」「强化学习要用巨量数据才能训练模型执行最简单任务,我不认为这种办法有机会做出AGI来。」

图片

业内人对LeCun的观点有支持也有反对。如果LeCun的愿景实现,AI将会成为不亚于互联网的下一代基础高性能技术。但他的声张并不包括自家模型的性能、激励机制、控制机制等等。不过这些缺陷都是小事,因为不管褒贬,业内人士一致认为要面临这些短板还是久远以后的事。因为即使LeCun也没法在当下马上做出AGI来。

Lecun自己也表示承认此形势,他称自己只希望为新的理论路径播种、让后来者于此基础上建构出成果。「达到此目标,需要太多人付出太多努力。我现在提出这些,只是因为我认为这条路才是最终的正路。」就算做不到这点,LeCun也希望说服同行不要单单死盯着大模型和强化学习,最好打开思路。「我讨厌看到大家浪费时间。」

业界反应:褒贬皆有

另外一名AI界泰斗、与LeCun交情好的Yoshua Bengio表示乐见老友圆梦。「Yann说这些已经说了有日子了,不过看到他整全性地把各种言说归纳到一处,我还是蛮高兴的。然而这些只是研究方向申请而非结果呈报,大家通常只在私底下分享这些,公开聊的风险挺大。」

图片

DeepMind里牵头开发游戏AI AlphaZero的David Silver不赞成LeCun对自己项目的批评,不过欢迎他实现愿景。

「LeCun描述的世界模型的确是个令人兴奋的新点子。」加州圣菲研究所的Melanie Mitchell则赞成LeCun:「业界真的不常在深度学习社群里看到这种观点。但大语言模型真的既缺记忆,又没有能担纲的内在世界模型骨干。」

谷歌大脑的Natasha Jaques不同意:「大家已经看到大语言模型极具效率,也混杂了相当多人类知识。没语言模型,我怎么升级LeCun提出的这个世界模型?就算人类学习,途径也不止亲身经历,还包括口口相传。」

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

89

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

173

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2.1万人学习

swoole进程树解析
swoole进程树解析

共4课时 | 0.2万人学习

ThinkPHP6.x 微实战--十天技能课堂
ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号