如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

WBOY

发布时间：2024-03-14 16:49:18

1301人浏览过

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如何把大量物理知识塞给ai？eit和北大团队提出「规则重要性」概念

编辑 | ScienceAI

深度学习模型由于其可以从海量数据中学习潜在关系的能力而在科学研究领域产生了深远影响。然而，纯粹依赖数据的模型逐渐显露出其局限性，包括对数据的过度依赖、泛化能力的限制以及与现实物理世界的一致性问题。这些问题推动着研究者探索更具解释性和可解释性的模型，以弥补数据驱动模型的不足。因此，结合领域知识和数据驱动方法，构建更具可解释性和泛化能力的模型成为当前科学研究的重要方向。这种

例如，美国OpenAI公司开发的文本到视频模型Sora因其出色的图像生成能力而备受赞誉，被认为是人工智能领域的重要进展。尽管能够生成逼真的图像和视频，Sora在处理物理定律方面仍存在一些挑战，比如重力和物体碎裂等。虽然Sora在模拟现实场景方面取得了显著进展，但在理解和准确模拟物理规律方面还有改进的空间。AI技术的发展仍需要不断努力，以提高模型的全面性和准确性，从而更好地适应各种现实世界的情境。

解决这一问题的一个潜在途径是将人类知识融入深度学习模型中。通过结合先验知识和数据，可以增强模型的泛化能力，从而产生能够理解物理规律的「知情机器学习」（Informed machine learning）模型。这种方法有望提高模型的性能和准确性，使其能够更好地应对现实世界中的复杂问题。通过将人类专家的经验和洞察力融入机器学习算法，我们可以建立更加智能和高效的系统，从而推动人工智能技术的发展和应用。

目前，对深度学习中知识的确切价值仍然缺乏深入探讨。在确定哪些先验知识可以有效地整合到模型中以进行“预学习”方面，存在着一个急需解决的难题。同时，盲目地融合多项规则可能导致模型的失效，这一点也是需要引起重视的。这些限制给数据与知识关系的深入探索带来了挑战。

针对这一问题，东方理工（EIT）和北京大学的研究团队提出了「规则重要性」的概念，并开发了一套框架，能精确计算每个规则对模型预测精度的贡献。该框架不仅揭示了数据和知识之间的复杂相互作用关系，为知识嵌入提供了理论性指导，还有助于在训练过程中平衡知识和数据的影响。此外，该方法还可用于识别不恰当的先验规则，为交叉学科领域的研究与应用提供广阔前景。

这项研究题为“Prior Knowledge's Impact on Deep Learning”，已于2024年3月8日在 Cell 出版社旗下的跨学科期刊《Nexus》上发表。该研究受到了 AAAS（美国科学促进会）和 EurekAlert! 的关注报道。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

在教授孩子拼图时，既可以让他们通过反复试验来找出答案，也可以用一些基本的规则和技巧来引导他们。同样地，将规则和技巧——比如物理定律——融入到人工智能训练中能让它们更贴近现实，运作更高效。然而，如何评估这些规则在人工智能中的价值，一直是困扰研究者的难题。

鉴于先验知识的丰富多样性，将先验知识融入深度学习模型是一个复杂的多目标优化任务。研究团队创新性地提出了一个框架，以量化不同先验知识在提高深度学习模型方面的作用。他们将此过程视为充满合作与竞争的博弈，通过评估规则对模型预测的边际贡献来界定其重要性。首先生成所有可能的规则组合（即「联盟」），并对每个组合构建模型，并计算均方误差。

为降低计算成本，他们采用了一种基于扰动的高效算法：先训练一个完全基于数据的神经网络作为基线模型，然后逐一加入各个规则组合进行额外训练，最后在测试数据上评估模型表现。通过比较模型在包含和不包含某个规则的所有联盟中的表现，可以计算出该规则的边际贡献，进而得出其重要性。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：规则重要性的计算流程（来源：论文）

通过流体力学的算例，研究人员探讨了数据与规则间的复杂关系。他们发现，在不同任务中，数据和先验规则的作用完全不同。当测试数据与训练数据分布相近时（即 In-distribution），数据量的增加会削弱规则的作用。

蛙蛙写作——超级AI智能写作助手

蛙蛙写作辅助AI写文，帮助获取创意灵感，提供拆书、小说转剧本、视频生成等功能，是一款功能全面的AI智能写作工具。

下载

然而，当测试数据与训练数据分布相似度较低时（即 Out-of-distribution），全局规则的重要性被凸显出来，而局部规则的影响则被削弱。这两类规则的区别在于：全局规则（如控制方程）影响整个域，而局部规则（如边界条件）仅作用于特定区域。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：规则重要性与数据量之间的关系（来源：论文）

研究团队经数值实验发现，在知识嵌入中，规则间存在三种相互作用效应：依赖效应、协同效应和替代效应。

依赖效应指某些规则需依赖其他规则才能有效；协同效应表明多条规则共同作用的效果超越各自独立作用时的总和；替代效应则显示一条规则的功能可能被数据或其他规则替代。

这三种效应同时存在，并受到数据量的影响。通过计算规则重要性，可清晰展示这些效应，为知识嵌入提供重要指导。

在应用层面，研究团队试图解决知识嵌入过程中的一个核心问题：如何平衡数据与规则的作用，以提升嵌入效率并筛选出不适宜的先验知识。在模型的训练过程中，该团队提出了一种动态调整规则权重的策略。

具体而言，随着训练迭代步的增加，逐渐增大正重要性规则的权重，同时减小负重要性规则的权重。这种策略能够根据优化过程的需求，实时调整模型对不同规则的关注度，从而实现更加高效和准确的知识嵌入。

此外，向 AI 模型传授物理定律可以使它们「更加贴近现实世界，从而在科学和工程领域发挥更大作用」。因此，该框架在工程、物理和化学领域具有广泛的实际应用。研究人员不仅优化了机器学习模型来求解多元方程，还准确识别出对薄层色谱分析预测模型性能有提升效果的规则。

实验结果显示，通过融入这些有效规则，模型的性能得到了显著提升，测试数据集上的均方误差从 0.052 降低至 0.036（减少了 30.8%）。这意味着该框架可以将经验性见解转化为结构化知识，从而显著提升模型性能。

总体而言，准确评估知识的价值有助于构建更契合现实的AI模型，提高安全性和可靠性，对深度学习发展具有重要意义。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：通过规则重要性以识别有效的规则（来源：论文）

接下来，研究团队计划将他们的框架开发成可供人工智能开发人员使用的插件工具。他们的最终目标是开发出能够直接从数据中提取知识和规则，进而自我完善的模型，从而打造一个从知识发现到知识嵌入的闭环系统，使模型成为真正的人工智能科学家。

论文链接：https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

AAAS 报道链接：https://www.eurekalert.org/news-releases/1036117

如何提升代码的跨语言迁移效率利用DeepSeek将Java/C++代码一键转为Python

ai怎么截图_ai智能截图工具操作步骤【方法】

如何写出让领导满意的述职报告利用Kimi梳理年度KPI达成路径

如何提升公众号文章排版审美利用AI绘图工具生成原创配图

如何快速写出吸引人的个人简介利用DeepSeek提炼极简职场标签

相关专题

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

494

2023.08.14

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2902

2024.08.16

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

216

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

413

2026.03.04