介绍全球首个基于自监督学习的分子图像生成框架ImageMol

WBOY

发布时间：2023-04-23 12:46:08

1880人浏览过

来源于51CTO.COM

转载

分子是维持物质化学稳定性的最小单位。对分子的研究，是药学、材料学、生物学、化学等众多科学领域的基础性问题。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

分子的表征学习（Molecular Representation Learning）是近年来非常热门的方向，目前可分为诸多门派：

计算药学家说：分子可以表示为一串指纹，或者描述符，如上海药物所提出的 AttentiveFP，是这方面的杰出代表。
NLPer 说：分子可以表示为 SMILES（序列），然后当作自然语言处理，如百度的 X-Mol，是这方面的杰出代表。
图神经网络研究者说：分子可以表示为一个图（Graph），也就是邻接矩阵，然后使用图神经网络处理，如腾讯的 GROVER, MIT 的 DMPNN，CMU 的 MOLCLR 等方法，都是这方面的杰出代表。

但是，目前的表征方法仍存在一些局限性。比如，序列表征缺乏分子的显式结构信息，现有图神经网络的表达能力仍有诸多局限（中科院计算所沈华伟老师对此有论述，见沈老师报告“图神经网络的表达能力”）。

有趣的是，在高中化学学习分子的时候，我们看到的是分子的图像，化学家在设计分子时，也是对照分子图像进行观察和思考。一个自然的想法油然而生：“为什么不直接用分子图像来表征分子呢？”如果可以直接用图像来表征分子，那 CV（计算机视觉）里面的十八般武艺，不都可以用来研究分子吗？

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

说干就干，CV 里面的模型那么多，拿过来学习分子呗？打住，还有一个重要的问题——数据！特别是带标签的数据！在 CV 领域，数据标注这件事似乎并不困难。对于图像识别或者情感分类这些 CV 和 NLP 的经典问题来说，一个人平均能标注 800 条数据。但是在分子领域，只能通过湿实验和临床实验的方式评估分子性质，因此带标签的数据非常稀缺。

基于此，来自湖南大学的研究者们提出了全球首个分子图像的无监督学习框架 ImageMol，利用大规模无标签分子图像数据进行无监督预训练，为分子性质与药物靶点理解提供了新范式，证明了分子图像在智能药物研发领域具有巨大的潜力。该成果以 “Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework” 为题发表于国际顶级期刊《Nature Machine Intelligence》。此次计算机视觉与分子领域交叉取得的成功展示了利用计算机视觉技术理解分子性质与药物靶点机制的巨大潜力，并为分子领域的研究提供了新的机遇。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

论文链接：https://www.nature.com/articles/s42256-022-00557-6.pdf

OmniAudio

OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客，并生成可在常见 Podcast ap

下载

ImageMol 模型结构

ImageMol 的整体架构如下图所示，总共分为三部分：

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

（1）设计一个分子编码器 ResNet18（浅蓝色），能够从约 1000 万张分子图像中提取潜在特征 (a) 。

（2）考虑分子图像中的化学知识和结构信息，利用五个预训练策略（MG3C、MRD、JPP、MCL、MIR）来优化分子编码器的潜在表示 (b) 。具体来说为：

① MG3C（Muti-granularity chemical clusters classification 多粒度化学簇分类）：其中的结构分类器 Structure classifier（深蓝色）用于预测分子图像中的化学结构信息；

② MRD（Molecular rationality discrimination 分子合理性判别器）：其中的合理性分类器 Rationality classifier（绿色），它用于区分合理与不合理的分子；

③ JPP（Jigsaw puzzle predicition 拼图预测）：其中的拼图分类器 Jigsaw classifier（浅灰色）用于预测分子的合理排列；

④ MCL（MASK-based contrastive learning 基于 MASK 的对比学习）：其中的对比分类器 Contrastive classifier（深灰色）用于最大化原始图像和 mask 图像之间的相似性；

⑤ MIR（Molecular image reconstruction 分子图像重建）：其中的生成器 Generator（黄色）用于将潜在特征恢复分子图像，判别器 Discriminator（紫色）用于区分真实图像和生成器生成的假的分子图像。

（3）在下游任务中对预处理的分子编码器进行微调，以进一步提高模型性能 (c) 。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

基准评估

作者首先使用 8 种药物发现的基准数据集来评估 ImageMol 的性能，并且使用两种最流行的拆分策略（scaffold split 与 random scaffold split）来评估 ImageMol 在所有基准数据集上的性能。在分类任务中，利用受试者工作特性（Receiver Operating Characteristic, ROC）曲线以及曲线下的面积（Area Under Curve, AUC）来评估，从实验结果可以看出，ImageMol 均能得到较高的 AUC 值 (图 a) 。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

ImageMol 与预测分子图像的经典卷积神经网络框架 Chemception 在 HIV 和 Tox21 的检测结果对比 (图 b) ，ImageMol 的 AUC 值更高。本文进一步评估了 ImageMol 在预测五种主要代谢酶（CYP1A2, CYP2C9, CYP2C19, CYP2D6 和 CYP3A4）药物代谢方面的性能。图 c 显示，ImageMol 在五种主要药物代谢酶的抑制剂与非抑制剂的预测中，与三种最先进的基于分子图像的表示模型（Chemception46、ADMET-CNN12 和 QSAR-CNN47）相比，获得了更高的 AUC 值（范围从 0.799 到 0.893）。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

本文进一步将 ImageMol 的性能与三种最先进的分子表示模型进行了比较，如图 d、e 所示。ImageMol 与使用随机骨架划分的基于指纹的模型（如 AttentiveFP）、基于序列的模型（如 TF_Robust）和基于图的模型（如 N-GRAM、GROVER 和 MPG）相比具有更好的性能。此外，与传统的基于 MACCS 的方法和基于 FP4 的方法相比，ImageMol 在 CYP1A2，CYP2C9，CYP2C19，CYP2D6 和 CYP3A4 上实现了更高的 AUC 值（图 f）。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

ImageMol 与基于序列的模型（包括 RNN_LR、TRFM_LR、RNN_MLP、TRFM_MLP、RNN_RF、TRFM_RF 和 CHEM-BERT）和基于图的模型（包括 MolCLRGIN、MolCLRGCN 和 GROVER）相比，如图 g 所示，ImageMol 在 CYP1A2、CYP2C9、CYP2C19、CYP2D6、CYP3A4 上实现了更好的 AUC 性能。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

在以上 ImageMol 与其他先进的模型对比中，可以看出 ImageMol 的优越性。

自新冠疫情爆发以来，我们迫切需要为新冠疫情制定有效的治疗策略。因此，作者在该方面对 ImageMol 做了相应的评估。

对 13 个 SARS-CoV-2 靶点进行预测

ImageMol 对现如今关注的SARS-CoV-2 进行了预测实验，在 13 个 SARS-CoV-2 生物测定数据集中，ImageMol 实现了 72.6% 至 83.7% 的高 AUC 值。图 a 揭示了通过 ImageMol 鉴定的潜在特征，它在 13 个靶点（target）或终点（endpoints）活性和无活性的抗 SARS-CoV-2 上很好的聚集，且 AUC 值均比另一种模型 Jure’s GNN 要高 12% 以上，体现出该模型的高精度和很强的泛化性。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

识别抗 SARS-CoV-2 抑制剂

对药物分子研究关乎最直接的实验来了，利用 ImageMol 直接识别抑制剂分子！通过 ImageMol 框架下 3CL 蛋白酶（已被证实是治疗 COVID-19 的有希望的治疗发展靶点）抑制剂与非抑制剂数据集的分子图像表示，该研究发现 3CL 抑制剂和非抑制剂在 t-SNE 图中很好地分离，如下图 b 。

另外，ImageMol 鉴定出 16 种已知 3CL 蛋白酶抑制剂中的 10 种，并将这 10 种药物可视化到图中的包埋空间（成功率 62.5%），表明在抗 SARS-CoV-2 药物发现中具有较高的泛化能力。使用 HEY293 测定来预测抗 SARS-CoV-2 可再利用药物时，ImageMol 成功预测了 70 种药物中的 42 种（成功率为 60%），这表明 ImageMol 在推断 HEY293 测定中的潜在候选药物方面也具有很高的推广性。下图 c 展示了 ImageMol 在 DrugBank 数据集上发现 3CL 潜在抑制剂的药物。图 d 展示了 ImageMol 发现的 3CL 抑制剂的分子结构。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

注意力可视化

ImageMol 可以从分子图像表示中获取化学信息的先验知识，包括 = O 键、-OH 键、-NH3 键和苯环。图 b 和 c 为 ImageMol 的 Grad-CAM 可视化的 12 个示例分子。这表示 ImageMol 同时准确地对全局 (b) 和局部 (c) 结构信息进行注意捕获，这些结果使研究人员能够在视觉上直观地理解分子结构是如何影响性质和靶点。

视觉卷不动了，来看看分子领域？全球首个分子图像自监督学习框架ImageMol来了

Cursor和GitHubCopilot有什么区别_Cursor功能差异详解【详解】

Perplexity切换GPT-4o教程 Perplexity如何自由更换大语言模型【进阶技巧】

PlaygroundAI如何生成角色设计_PlaygroundAI角色创作流程【方法】

WorkBuddy如何写自媒体脚本大纲_WorkBuddy短视频创作灵感激发技巧【全解】

OpenClaw新手必知事项_OpenClaw入门基础指南【指南】

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：GPT-4开发者开发出无限自我修复功能的AI系统下一篇：UiPath助力企业实现高效业务自动化

作者最新文章

微信朋友圈草稿箱怎么用微信朋友圈定时发送隐藏技巧

2026-01-10 08:41

微信朋友圈定时发送是真的吗微信朋友圈预约发布实现方法

2026-01-15 10:19

微信定时发朋友圈怎么弄微信朋友圈自动推送设置流程

2026-01-21 04:27

微信如何定时发朋友圈微信朋友圈自动定时发送设置步骤【汇总】

2026-01-23 10:22

微信怎么设置自动发朋友圈微信朋友圈定时托管操作详解

2026-02-03 04:49

2026微信定时发朋友圈教程微信朋友圈延迟发送设置技巧

2026-02-04 08:23

mysql如何获取系统时间_mysql now与sysdate区别

2026-03-02 11:02

mysql如何进行内连接_mysql inner join匹配逻辑

2026-03-06 07:33

mysql如何清空表数据_mysql truncate table性能优势

2026-03-06 10:03

mysql如何进行右连接_mysql right join应用场景

2026-03-14 09:48

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04