0

0

AI病毒进化预测新突破,北大团队进化启发通用预测框架登Nature子刊

花韻仙語

花韻仙語

发布时间:2025-01-21 20:52:24

|

909人浏览过

|

来源于php中文网

原创

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑 |ScienceAI

蛋白质功能与物种多样性密切相关,因为蛋白质决定生物性状,而这些性状经自然选择后塑造了物种分布。达尔文进化论指出,所有进化都是基因对环境的适应。

基于此,北京大学信息工程学院田永鸿教授、陈杰副教授团队,指导博士生聂志伟、硕士生刘旭东,提出了一种基于进化论的病毒进化预测模型,该模型可跨病毒类型和毒株进行预测,为疫苗和药物的快速研发以及应对新发病毒感染提供了有力工具,并推动了对物种复杂进化机制的研究。

该研究成果发表于2025年1月17日的《Nature Machine Intelligence》期刊,论文标题为“A unified evolution-driven deep learning framework for virus variation driver prediction”。

论文链接:https://www.php.cn/link/4a3b13045573c232c0d6cc56e10f8f45

研究亮点

  1. 定制化蛋白质语言模型: 该研究探讨了如何定制蛋白质语言模型以适应进化预测任务,提出了一种定制化预训练策略和数据集,为蛋白质语言模型预训练与下游任务之间的权衡提供了新视角。
  2. 病毒进化本质问题: 该研究从进化论角度出发,提炼出病毒进化的两个核心问题,并通过“微弱突变放大”和“稀少有益突变挖掘”两个创新设计,实现了跨病毒类型和跨毒株的通用预测,实现了Science和AI的深度融合。
  3. 突变相互作用网络重建: 该研究构建了突变相互作用网络的重建模块(包含动态粒度注意力机制),并提出了多任务焦点损失函数,这些方法具有蛋白质通用性,可扩展应用于各类蛋白质性质预测和蛋白质定向进化。
  4. 多尺度进化预测: 该模型能够进行不同尺度的病毒进化预测,未来可与疫苗和蛋白类药物设计流程结合,有望显著提升设计效率和可控性。

进化驱动的通用预测框架

病毒进化以突变为基础,虽然不同病毒的进化路径各异,但共同点是大多数突变是有害的。即使有益突变与有害突变的比例会因物种和环境而异,但有害突变通常远多于有益突变。

因此,一个病毒变异株通常只包含少量突变。研究团队将病毒进化轨迹概括为“少数位点突变”和“稀少有益突变”两大特点。

这两大特点给建模带来了挑战。“少数位点突变”引起的分子内相互作用网络变化微弱,难以被神经网络直接捕获;“稀少有益突变”导致数据层面严重正负样本不平衡,难以精准预测。

图片

图 1:E2VD 模型架构。(来源:论文)

为此,研究团队提出了进化驱动的病毒变异驱动力预测框架 E2VD(图 1),通过“微弱突变放大”和“稀少有益突变挖掘”实现了跨病毒类型和跨毒株的统一预测。

核心组件包括:面向病毒进化的定制化蛋白质大语言模型(基于国产 AI 超算“鹏城云脑 II”训练)、突变相互作用网络重建模块(包含动态粒度注意力机制)以及多任务焦点损失函数。

进化模式的精准捕获

以 SARS-CoV-2 为例,研究团队比较了定制化蛋白质语言模型与主流模型的预测性能。结果显示,定制化模型以更少的参数量实现了最佳预测效果,超越了参数量远大于其的模型,证明了定制化策略的有效性。

在各种关键病毒进化驱动力预测任务中,E2VD 显著优于其他方法,性能提升幅度达 7%-21%。大量的消融实验验证了 E2VD 对病毒进化模式的精准捕获能力,包括对不同类型突变和稀少有益突变的精准识别。

Detect GPT
Detect GPT

一个Chrome插件,检测您浏览的页面是否包含人工智能生成的内容

下载

多任务焦点损失函数显著提升了预测精度,Accurate 从 57.41% 提升至 91.11%,Recall 从 15.56% 提升至 96.30%。在稀少有益突变预测中,E2VD 将预测精度从 13% 提升至 80%。

图片

图 2:E2VD 对于突变类型的区分和稀少有益突变的精准挖掘。(来源:论文)

跨病毒类型和跨毒株的泛化性能

E2VD 在跨病毒类型和毒株时展现出强大的泛化能力。研究团队使用鲁棒的评估指标评估了模型的泛化性能,结果显示 E2VD 在新冠病毒、寨卡病毒、流感病毒和艾滋病病毒上都表现出色,始终优于其他方法。

图片

图 3:E2VD 跨病毒类型和跨毒株的泛化性能。(来源:论文)

多尺度进化趋势预测

E2VD 可用于多尺度进化趋势预测,包括解释大流行内部进化轨迹、预测潜在高风险突变(准确率达 80%)以及预测大流行尺度的宏观进化轨迹。

图片

图 4:E2VD 解释大流行内部进化轨迹以及预测潜在高风险突变。(来源:论文)

总结与展望

该研究为病毒进化预测提供了一种新的视角和方法,有助于理解物种进化机制,并提高应对新发病毒感染的能力。未来,研究团队计划将 E2VD 与疫苗和药物设计流程结合,以提升设计效率和可控性。

该团队自 2022 年起致力于 AI for Life Science 研究,取得了一系列成果,并获得了多个奖项。

论文链接:https://www.php.cn/link/4a3b13045573c232c0d6cc56e10f8f45

入围戈登贝尔特别奖新闻链接:https://www.php.cn/link/5a2a44703e98c359e5e7bf6db01b3a15

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1998

2024.08.16

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

19

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

61

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

87

2026.01.19

java输出数组相关教程
java输出数组相关教程

本专题整合了java输出数组相关教程,阅读专题下面的文章了解更多详细内容。

39

2026.01.19

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

10

2026.01.19

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

13

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

19

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

160

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号