0

0

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

PHPz

PHPz

发布时间:2024-05-06 18:04:24

|

1134人浏览过

|

来源于机器之心

转载

在机器学习模型日益应用于开放世界场景中,如何有效识别和处理分布外(out-of-distribution,ood)数据成为一个重要研究领域。分布外数据的存在可能导致模型过度自信和错误预测,这在安全关键应用(如自动驾驶和医疗诊断)中尤为危险。因此,发展一种有效的ood检测机制,对于提高模型在实际应用中的安全性和可靠性至关重要。

传统的OOD检测方法主要集中在单一模式,特别是图像数据上,而忽视了其它潜在有用的信息源,例如文本数据。随着视觉-语言模型(VLMs)的兴起,它们在多模式学习场景中展示了强大的性能,特别是在处理需要同时理解图像和相关文本描述的任务中表现出色。现有的基于VLMs的OOD检测方法[3,4,5]仅仅使用了ID标签的语义信息,忽略了VLMs模型强大的零样本能力,以及VLMs可解释非常广阔的语义空间。基于此,我们认为VLMs在OOD检测中有巨大的未开发潜力,尤其是它们可以综合利用图像和文本信息来改善检测效果。

这篇文章围绕三个问题展开:

1.非ID标签的信息是否对零样本OOD检测有帮助?

2.如何挖掘出对零样本OOD检测有利的信息?

3.如何利用挖掘出的信息进行零样本OOD检测?

在这个项目中,我们提出了一种名为NegLabel的创新方法,该方法利用VLMs进行OOD检测。NegLabel方法特别引入了“负标签”机制,这些负标签与已知ID类别标签具有显著的语义差异,通过分析比较图像和ID标签和负标签的亲和性和性质,NegLabel能够有效地区分属于分布外的样本,从而显著增强模型对OOD样本的识别能力。

在多个零样本OOD检测基准测试中,NegLabel取得了优越的性能表现。在大规模数据集如ImageNet-1k上能够达到94.21%的AUROC和25.40%的FPR95。相比于基于VLMs的OOD检测方法,NegLabel不仅不需要额外的训练过程,而且展示出更优越的性能。此外,NegLabel在不同的VLM架构上都表现出了优异的通用性和鲁棒性。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Ø论文链接:https://arxiv.org/pdf/2403.20078.pdf

Ø代码链接:https://github.com/tmlr-group/NegLabel

接下来将简要地向大家分享我们近期发表在 ICLR 2024 上的分布外检测方向的研究结果。

预备知识

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

方法介绍

NegLabel的核心就是引入了“负标签”机制,这些负标签与已知ID类别标签具有显著的语义差异,通过分析比较图像与ID标签和负标签的亲和性,NegLabel能够有效地区分出属于分布外的样本,从而显著增强模型对OOD样本的识别能力。

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

图1. NegLabel的总览图

1. 如何选取负标签?

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

2. 如何利用负标签来进行OOD检测?

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ToonMe
ToonMe

一款风靡Instagram的软件,一键生成卡通头像

下载

3.如何理解负样本可以促进零样本OOD检测?

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

实验结果

我们的研究工作提供了多维度的实验结果以理解我们提出的方法性能及底层机理。

如下表所示,与诸多性能优良的基准方法和先进方法相比,本文提出的方法可以大规模数据集(如ImageNet)上在其基础上达到更优的分布外检测效果。

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

此外,如下表所示,本文的方法在ID数据发生域迁移时有着更好的鲁棒性。

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

在下列两个表格中,我们对NegLabel的各个模块还有VLMs的结构进行了消融实验。左表可以看出,NegMining算法和Grouping策略都可以有效提升OOD检测的性能。右表展示了我们提出的NegLabel算法在不同结构的VLMs有着良好的适应性。

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

我们还对不同输入图像对于ID标签和负标签的亲和度进行了可视化分析,更多详细的实验和结果请参考原文。

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

参考文献

[1] Hendrycks, D. and Gimpel, K. A baseline for detecting misclassified and out-of-distribution examples in neural networks. In ICLR, 2017.

[2] Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal,Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Learning transferable visual models from natural language supervision. In ICML, 2021.

[3] Sepideh Esmaeilpour, Bing Liu, Eric Robertson, and Lei Shu. Zero-shot out-of-distribution detection based on the pre-trained model clip. In AAAI, 2022.

[4] Yifei Ming, Ziyang Cai, Jiuxiang Gu, Yiyou Sun, Wei Li, and Yixuan Li. Delving into out-ofdistribution detection with vision-language representations. In NeurIPS, 2022a.

[5] Hualiang Wang, Yi Li, Huifeng Yao, and Xiaomeng Li. Clipn for zero-shot ood detection: Teaching clip to say no. ICCV, 2023.

[6] Christiane Fellbaum. WordNet: An Electronic Lexical Database. Bradford Books, 1998. 

相关专题

更多
li是什么元素
li是什么元素

li是HTML标记语言中的一个元素,用于创建列表。li代表列表项,它是ul或ol的子元素,li标签的作用是定义列表中的每个项目。本专题为大家li元素相关的各种文章、以及下载和课程。

416

2023.08.03

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

403

2023.08.14

discuz database error怎么解决
discuz database error怎么解决

discuz database error的解决办法有:1、检查数据库配置;2、确保数据库服务器正在运行;3、检查数据库表状态;4、备份数据;5、清理缓存;6、重新安装Discuz;7、检查服务器资源;8、联系Discuz官方支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

211

2023.11.20

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1994

2024.08.16

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

0

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

13

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

87

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

111

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

155

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.8万人学习

Django 教程
Django 教程

共28课时 | 3.3万人学习

MySQL 教程
MySQL 教程

共48课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号