0

0

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

心靈之曲

心靈之曲

发布时间:2024-11-28 18:39:18

|

707人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

准确率84.09%,腾讯ai lab发布interformer,用于蛋白质-配体对接及亲和力预测,登nature子刊

编辑 | 萝卜皮

近年来,深度学习模型在蛋白质-配体对接和亲和力预测中的应用引起了越来越多的关注,而这两者都对基于结构的药物设计至关重要。

然而,许多此类模型忽略了复合物中配体和蛋白质原子之间相互作用的复杂建模,从而限制了它们的泛化和可解释性。

在最新的研究中,腾讯 AI Lab 的研究人员提出了 Interformer,这是一个基于 Graph-Transformer 架构的统一模型。

该模型旨在利用交互感知混合密度网络捕获非共价相互作用。该团队引入了负采样策略,有助于有效校正相互作用分布以进行亲和力预测。

这种方法可以通过准确模拟特定的蛋白质-配体相互作用来提高性能,且具备通用性。

该研究以「Interformer: an interaction-aware model for protein-ligand docking and affinity prediction」为题,于 2024 年 11 月 25 日发布在《Nature Communications》。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

在错综复杂的药物研发过程中,蛋白质-配体对接和亲和力预测任务多年来一直是药物发现过程中的重要组成部分。

蛋白质-配体对接是药物分子结构优化的关键任务,目的是预测配体(小分子)与蛋白质受体或酶结合时的位置和方向。

亲和力预测任务利用准确的结合姿势(蛋白质-配体结合复合物构象),提供配体与其目标蛋白质之间结合强度的计算估计,从而有助于筛选具有潜在亲和力的配体。

近年来,人们对使用深度学习 (DL) 方法进行分子建模的兴趣激增。比如科学家将对接视为生成建模问题,引入了 DiffDock,这是一种基于图神经网络 (GNN) 的模型,已在结合姿势生成方面建立了基准。

然而,现有的深度学习模型往往忽视了蛋白质和配体原子之间非共价相互作用的建模,而这对于可解释性和泛化至关重要。

如图 1 左图所示,DiffDock 产生的对接构象与晶体结构非常相似,但无法捕捉非共价相互作用。此外,虽然传统的亲和力预测方法在晶体结构方面表现出色,但在处理不太精确的结合姿势时,其性能会急剧下降,这对实际应用构成了挑战。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 1:对接姿势中的非共价相互作用与现有和拟议方法的比较。(来源:论文)

新方法:Interformer

在最新的研究中,腾讯 AI Lab 的研究人员提出了 Interformer,这是一种计算 AI 模型,旨在缓解蛋白质-配体对接中的相互作用感知问题,并在实际应用中采用建设性学习进行亲和力预测。

首先,研究人员提出了一种相互作用感知混合密度网络 (MDN) 来模拟非共价相互作用,明确关注蛋白质-配体晶体结构中存在的氢键和疏水相互作用。如图 1 右图所示,Interformer 可以准确地产生结合姿势中的特定相互作用。

其次,团队提出了一个伪 Huber 损失函数,利用对比学习的能力来指导模型区分有利和不利的结合姿势。

第三,该模型基于 Graph-Transformer 框架,该框架在各种图表示学习任务中都表现出比基于 GNN 的模型更优的性能。

Interformer 的另一个优点是通过检查 MDN 的融合系数来解释蛋白质-配体相互作用的内部机制。

具体来说

Interformer 模型的架构灵感来自 Graph-Transformer,最初是为图表示学习任务而提出的。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

Bandy AI
Bandy AI

全球领先的电商设计Agent

下载

图 2:Interformer 架构概述。(来源:论文)

在第一阶段,该模型从晶体结构中获取单个初始配体 3D 构象和蛋白质结合位点作为输入。图形在各种方法中被广泛用于说明配体和蛋白质,如图 2a 所示,其中节点代表原子,边表示两个原子之间的接近度。

研究人员使用药效团原子类型作为节点特征,并使用两个原子之间的欧几里得距离作为边缘特征。这些药效团原子类型提供了必要的化学信息,从而使模型能够更好地理解特定的相互作用,例如氢键或疏水相互作用。

在第二阶段,对接流程如图 2b 所示,通过 Intra-Blocks 处理来自蛋白质和配体的节点特征和边缘特征。

Intra-Blocks 旨在通过捕获同一分子内的内部相互作用来更新每个原子的节点特征。这些更新后的节点特征随后输入到 Inter-Blocks,捕捉蛋白质和配体原子对之间的相互作用,进一步更新节点和边缘特征。

接着,通过交互感知的 MDN 预测每个蛋白质-配体原子对的四个高斯函数参数,并结合形成混合密度函数(MDF),用于估计蛋白质和配体原子之间最可能的距离。MDF 模型能够精确反映特定的相互作用,如氢键和疏水作用,从而生成更加符合自然晶体结构的对接姿势。

最后,所有蛋白质-配体对的 MDF 聚合后,通过蒙特卡洛采样方法生成前 k 个候选配体构象。

在第三阶段,姿势得分和亲和力预测管道如图 2c 所示。生成的对接姿势中蛋白质和配体原子之间的距离和特定相互作用更新了新的边缘特征。

然后通过块内和块间处理节点和边缘特征以创建隐式交互。虚拟节点通过自注意力机制收集有关绑定姿势的所有信息。

最后,虚拟节点的绑定嵌入被输入到亲和力和姿势层,以预测相应对接姿势的绑定亲和力值和置信姿势得分。

通过纳入不良姿势,对比性伪 Huber 损失函数可用于指导模型辨别姿势是好还是坏。训练目标可确保模型为不良姿势预测较低的值,为良好姿势预测较高的值。良好姿势与不良姿势之间的主要区别在于它们的相互作用。

此策略可帮助模型学习关键相互作用,而不是人工特征。研究人员将此特性称为 pose-sensitive,在现实世界的药物开发项目中表现出色。

性能评估

当使用两个广泛使用的基准对蛋白质-配体对接进行评估时,Interformer 在 Posebusters 基准上实现了 84.09% 的准确率,在 PDBbind 时间分割基准上实现了 63.9% 的准确率,且均方根偏差 (RMSD) 小于 2 Å,从而实现了 top-1 预测性能。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 3:对蛋白质-配体对接任务的评估。(来源:论文)

这一改进归功于该模型增强了捕捉配体和蛋白质之间非共价相互作用的能力,这对于产生不太模糊的构象至关重要,对于下游任务的成功执行至关重要。

此外,即使绑定姿势不太准确,该模型也能预测合理的亲和力值。团队内部真实世界基准的评估表明,该模型的性能与其他模型相当,证实了其姿势敏感和强大的泛化能力。

在应用于真实的内部药物管道时,研究人员成功鉴定出两个小分子,在各自的项目中,每个小分子的亲和力 IC50 值分别为 0.7 nM 和 16 nM,从而证明了其在推进治疗发展方面的实用价值。

这种方法使 Interformer 能够通过关注蛋白质和配体原子对之间的特定相互作用来区分不太准确和更有利的对接姿势。这种强大的功能使该模型能够增强在现实场景中预测的通用性。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 4:对蛋白质-配体亲和力预测任务的评估。(来源:论文)

在亲和力预测领域,Interformer 在四个内部真实世界亲和力基准上表现出持续的进步。Interformer 在两个内部药物开发流程中的进一步应用已成功在纳摩尔水平上识别出两种高效分子。

该研究展示了 Interformer 对计算生物学和加速药物设计过程的巨大潜力。

未来,研究人员的目标是将 Interformer 的应用扩展到更广泛的现实世界生物挑战中,并增强其对各种分子相互作用类型的性能,包括蛋白质-蛋白质和蛋白质-核酸相互作用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

178

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

35

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

79

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

4

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

24

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

122

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

72

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 3.1万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

MySQL 教程
MySQL 教程

共48课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号