稀疏模型最新进展！马毅+LeCun强强联手：「白盒」非监督式学习

WBOY

发布时间：2023-04-12 08:34:02

1121人浏览过

来源于51CTO.COM

转载

最近马毅教授和图灵奖得主Yann LeCun联手在ICLR 2023上发表了一篇论文，描述了一种极简和可解释的非监督式学习方法，不需要求助于数据增强、超参数调整或其他工程设计，就可以实现接近 SOTA SSL 方法的性能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文链接：https://arxiv.org/abs/2209.15261

该方法利用了稀疏流形变换，将稀疏编码、流形学习和慢特征分析（slow feature analysis）相结合。

采用单层确定性稀疏流形变换，在 MNIST 上可以达到99.3% 的 KNN top-1精度，在 CIFAR-10上可以达到81.1% 的 KNN top-1精度，在 CIFAR-100上可以达到53.2% 的 KNN top-1精度。

通过简单的灰度增强，模型在 CIFAR-10和 CIFAR-100上的精度分别达到83.2% 和57% ，这些结果显著地缩小了简单的「白盒」方法和 SOTA 方法之间的差距。

此外，文中还提供了可视化解释如何形成一个无监督的表征变换。该方法与潜在嵌入自监督方法密切相关，可以看作是最简单的 VICReg 方法。

尽管在我们简单的建设性模型和 SOTA 方法之间仍然存在很小的性能差距，但有证据表明，这是一个有希望的方向，可以实现一个原则性的、白盒式的非监督式学习。

文章第一作者Yubei Chen是纽约大学数据科学中心（CDS）和Meta基础人工智能研究(FAIR)的博士后助理，导师为Yann LeCun教授，博士毕业于加州大学伯克利分校的Redwood Center理论神经科学和伯克利人工智能研究所（BAIR），本科毕业于清华大学。

主要研究方向研究为计算神经科学学习和深度无监督(自监督)学习的交叉，研究结果增强了对大脑和机器无监督表征学习的计算原理的理解，并重塑对自然信号统计的认识。

马毅教授于1995年获得清华大学自动化与应用数学双学士学位，并于1997年获加州大学伯克利分校EECS硕士学位，2000年获数学硕士学位与EECS博士学位。目前是加州大学伯克利分校电子工程与计算机科学系教授，同时也是IEEE Fellow，ACM Fellow，SIAM Fellow。

Yann LeCun最著名的工作是在光学字符识别和计算机视觉上使用卷积神经网络（CNN），也被称为卷积网络之父；2019年他同Bengio以及Hinton共同获得计算机学界最高奖项图灵奖。

从最简单的无监督学习开始

在过去的几年里，无监督表征学习取得了巨大的进展，并且有望在数据驱动的机器学习中提供强大的可扩展性。

不过什么是学习到的表征，以及它究竟是如何以无监督的方式形成的，这些问题仍然不清楚；此外，是否存在一套支撑所有这些无监督表征的共同原则仍不清楚。

许多研究者已经意识到提高模型理解力的重要性，并采取了一些开创性的措施，试图简化SOTA方法，建立与经典方法之间的联系，统一不同的方法，使表征可视化，并从理论角度分析这些方法，并希望能够开发出一种不同的计算理论：使我们能够基于第一原理从数据中建立简单的、完全可以解释的「白盒」模型，该理论也可以为理解人脑中无监督学习的原则提供指导。

在这项工作中，研究人员又朝着这个目标迈出了一小步，试图建立一个最简单的「白盒」无监督学习模型，并且不需要深度网络、projection heads、数据增强或其他各种工程设计。

Imagine By Magic Studio

AI图片生成器，用文字制作图片

下载

文中通过利用两个经典的无监督学习原则，即稀疏性（sparsity）和频谱嵌入（spectral embedding），建立了一个两层模型，在几个标准数据集上取得了非显著的基准结果。

实验结果表明，基于稀疏流形变换（sparse manifold transform）的两层模型，与latent-embedding自监督方法具有相同的objective，并且在没有任何数据增强的情况下，在MNIST上取得了99.3%的KNN最高1级准确率，在CIFAR-10上取得了81.1%的KNN最高1级准确率，在CIFAR-100上取得了53.2%的准确率。

通过简单的灰度增强，进一步在CIFAR-10上实现了83.2%的KNN top-1精度，在CIFAR-100上实现了57%的KNN top-1精度。

这些结果为缩小「白盒」模型和SOTA自监督（SSL）模型之间的差距迈出了重要一步，虽然差距仍然很明显，但研究人员认为进一步缩小差距有可能对无监督表征的学习获得更深入的理解，这也是通往该理论实用化的一条有前景的研究路线。

三个基本问题

什么是无监督（自监督）的re-presentation

从本质上讲，原始信号的任何非同一性转换（non-identity transformation）都可以被称为表征（re-presentation），不过学术界更感兴趣的是那些有用的转换。

无监督re-presentation学习的一个宏观目标是找到一个函数，将原始数据转换到一个新的空间，使「相似」的东西被放在更接近的地方；同时，新的空间不应该是一个collapsed且trivial的，也就是说，必须保留数据的几何或随机结构。

如果这一目标得以实现，那么「不相似」的内容自然会在表示空间中被放置得很远。

相似性（similarity）从何而来？

相似性主要来自三个经典的想法：1）时序共现，2）空间共现；和3）原始信号空间中的局部相邻（local neighborhoods）。

当基础结构为几何结构时，这些想法在相当程度上是重叠的；但当结构为随机结构时，它们在概念上也会有所不同，下图展现了流形结构（manifold structure）和随机共现结构（stochastic co-occurrence structure.）之间的区别。

利用局部性，相关工作提出了两种无监督的学习方法：流形学习和共现统计建模，这些想法很多都达到了谱系分解的表述或密切相关的矩阵分解表述。

流形学习的理念是，只有原始信号空间中的局部邻域才是可信的，通过综合考虑所有的局部邻域，就会出现全局几何，即「全局思考，局部适配」（think globally, fit locally）。

相比之下，共现统计建模遵循一种概率理念，因为有些结构不能用连续流形来建模，所以它也是对流形理念的补充。

一个最明显的例子来自于自然语言，其中的原始数据基本不会来自于平滑的几何，比如在单词嵌入中，「西雅图」和「达拉斯」的嵌入可能很相似，尽管它们并没有频繁共现，其根本原因是它们有类似的上下文模式。

概率和流形的观点对于理解「相似性」是相互补充的，当有了相似性的定义后，就可以构造一个转换，使得相似的概念离得更近。

本文如何建立表征转换？基本原则：稀疏性和低秩（low rank）

大体上来说，可以用稀疏性来处理数据空间中的局部性和分解，以建立support；然后用低频函数构建表征变换，将相似的值分配给support上的相似点。

整个过程也可以称为稀疏流形变换（sparse manifold transform）。

文心一言手机版如何进行长对话_文心一言移动端使用方法【指南】

MiniMax开发者如何接入模型能力_MiniMax开发接入流程指南【指南】

workbuddy运行缓慢怎么优化_workbuddy性能优化详解【详解】

QClaw怎么重新部署项目_QClaw重新部署步骤介绍【介绍】

QClaw在不同系统功能一样吗_QClaw系统差异介绍【介绍】

相关专题

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2910

2024.08.16

SSL检测工具介绍

SSL检测工具有SSL Labs、SSL Check、SSL Server Test、SSLMate、SSL/TLS Analyzer等。详细介绍：1、SSL Labs是一个由Qualys提供的在线SSL检测工具，可以评估服务器证书的部署情况、加密套件、协议支持等方面的安全性，它提供了一个详细的报告，包括证书的颁发者、有效期、安全性配置等；2、SSL Check等等。

355

2023.10.20

PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境（CLI）下的开发与应用，内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理，以及与 Linux 定时任务（Cron）的结合使用。通过实战示例，帮助开发者掌握使用 PHP 构建自动化脚本、批处理工具与后台任务程序的能力。

2025.12.13

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板