Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

WBOY

发布时间：2024-08-09 08:22:16

846人浏览过

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

nature子刊，北大团队通用ai框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

编辑 | 萝卜皮

蛋白质复合物结构预测在药物研发、抗体设计等应用中发挥着重要作用，然而由于预测精度有限，预测结果与实验结果经常出现不一致。

北京大学、昌平实验室以及哈佛大学的研究团队提出了 ColabDock，这是一个通用框架，它采用深度学习结构预测模型来整合不同形式和来源的实验约束，而无需进一步进行大规模的再训练或微调。

ColabDock 的表现优于使用 AlphaFold2 作为结构预测模型的 HADDOCK 和 ClusPro，不止在具有模拟残基和表面限制的复杂结构预测中，在借助核磁共振化学位移扰动以及共价标记进行的结构预测中也是如此。

另外，它还可以通过模拟界面扫描限制来帮助抗体-抗原界面预测。

该研究以「Integrated structure prediction of protein–protein docking with experimental restraints using ColabDock」为题，于 2024 年 8 月 5 日发布在《Nature Machine Intelligence》。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

蛋白质对接为理解生物机制提供了重要的结构信息。尽管深度模型在蛋白质结构预测方面发展迅速，但大多数模型都是以自由对接的方式进行预测，这可能会导致实验约束与预测结构不一致。

为了解决这个问题，北京大学、昌平实验室等机构的研究团队提出了用于受限复合物构象预测的通用框架——ColabDock，它是一个由稀疏实验约束引导的蛋白质-蛋白质对接的通用框架。

通过梯度反向传播，该方法有效地整合了实验约束的先验和数据驱动的蛋白质结构预测模型的能量景观，自动搜索满足两者的构象，同时容忍约束中的冲突或模糊性。

ColabDock 可以利用不同形式和来源的实验约束，而无需进一步进行大规模重新训练或微调。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

图示：ColabDock 的工作流程。（来源：论文）

该框架包含两个阶段：生成阶段和预测阶段。

在生成阶段，ColabDock 采用了基于 AlphaFold2 开发的蛋白质设计框架 ColabDesign。在 logit 空间中优化输入序列配置文件，以指导结构预测模型根据给定的实验约束和模板生成复杂结构，同时最大化 pLDDT 和 pAE 测量。

在预测阶段，根据生成的复合物结构和给定的模板预测结构。对于每个目标，ColabDock 会执行多次运行并生成不同的构象。最终构象由排序支持向量机 (SVM) 算法选择。

性能稳健

作为概念验证，研究人员采用 AlphaFold2 作为 ColabDock 中的结构预测模型。当然，这里也可以使用其他数据驱动的深度学习模型，例如 RoseTTAFold2 和 AF-Multimer。

研究人员用合成数据集和几种类型的实验约束上测试 ColabDock，包括 NMR 化学位移扰动 (CSP)、共价标记 (CL) 和模拟深度突变扫描 (DMS)。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

图示：ColabDock 在验证集上的表现。（来源：论文）

Programming Helper

AI代码自动生成器，在AI的帮助下更快地编程

下载

ColabDock 评估了两种类型的约束，即 1v1 和 MvN 约束。前者是残基-残基级别的，实例包括来自 XL-MS 的约束。后者是界面级别的，与 NMR 和 CL 实验有关。

在合成数据集上的测试结果表明 ColabDock 取得了令人满意的性能。此外，正如预期的那样，随着约束数量的增加，ColabDock 的性能也得到了提高。

即使只有很少的限制，ColabDock 在基准数据集和相同的框架设置上的表现也优于 AF-Multimer，并且在提供更多限制的情况下收敛到更少的构象，表明有效应用了附加信息。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

图示：在基准测试集上对 ColabDock、HADDOCK 和 ClusPro 进行比较。（来源：论文）

与 HADDOCK 和 ClusPro 相比，当约束质量较高时，ColabDock 的表现更为突出。在两个实验数据集上，无论提供的约束数量和质量如何，ColabDock 的表现仍然优于 HADDOCK 和 ClusPro。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

图示：ColabDock 在 CSP 集上的性能及约束分析。（来源：论文）

最后，研究人员在抗体-抗原数据集上评估了不同对接方法的性能。ColabDock 预测的中等或更高质量结构的比例远高于 HADDOCK 和 ClusPro。

Nature子刊，北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测，弥合实验与计算的差距

图示：ColabDock、HADDOCK 和 ClusPro 在抗体-抗原基准集上的比较。（来源：论文）

这表明 ColabDock 在抗体设计方面具有潜在的应用价值。并且，在新发布的无偏数据集上，ColabDock 仍然表现出与 AF-Multimer 相当甚至更好的性能。

局限性与结语

ColabDock 也存在一些局限性。目前，ColabDock 只能接受距离小于 22 Å 的限制，这是由 AlphaFold2 中距离图的上限决定的。这一限制使得该模型仅适用于一小部分 XL-MS 试剂。

如果没有基于片段的优化，ColabDock 只能在 NVIDIA A100 图形处理单元 (GPU) 上处理少于 1,200 个残基的复合物，因为内存有限。

此外，该方法可能非常耗时，尤其是对于大型蛋白质复合物。使用 AlphaFold2 的 bfloat16 浮点格式版本有望帮助节省内存并加速计算。

相信未来，研究人员迭代优化之后，作为一个统一的框架，ColabDock 必将能够帮助弥合实验和计算蛋白质科学之间的差距。

论文链接：https://www.nature.com/articles/s42256-024-00873-z

贾跃亭：法拉第未来当前股价被严重低估目标价5美元

内存飙升成本暴涨汽车会涨价还是减配？

10家中国车企入围入围财富世界500强比亚迪进前百

关税压力下创纪录！韩国汽车年出口额达720亿美元

韩国2025年电动车销量首破20万辆中国产汽车大卖

相关专题

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

497

2023.08.14

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2909

2024.08.16

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04