0

0

超三万种材料,近百万真实材料合成表征信息,LLM精准构建材料知识图谱MKG,登NeurIPS 2024

霞舞

霞舞

发布时间:2024-12-24 22:12:55

|

473人浏览过

|

来源于php中文网

原创

利用大型语言模型构建材料科学知识图谱,加速材料发现

编辑 | ScienceAI

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

材料科学知识图谱(MKG)整合了海量多源数据,以结构化知识的形式呈现复杂科学领域的数据结构,促进研究进展、创新和应用的知识交流。 新南威尔士大学、同济大学、香港城市大学和GreenDynamics律动造物合作,构建了一个涵盖十五万个节点和近百万个关系的MKG,包含十余种重要的材料科学属性。

该团队利用大型语言模型自主设计本体论,自动提取和清洗了大量材料科学文献中的知识。 他们通过少量数据微调大型语言模型,从数十万篇文献摘要中提取信息,并确保所有信息的可追溯性。 结合自然语言处理技术进行高质量数据清洗,并运用图算法和模型完善和增强图谱,揭示材料学知识间的潜在联系和机制。

MKG可预测未来几年电池、太阳能电池和催化剂等能源领域可能出现的潜在材料,并提供强有力的解释性支持。 这项研究成果已发表在NeurIPS 2024会议上,论文标题为《基于大型语言模型构建和应用多学科材料科学的材料知识图谱》。

论文链接:https://www.php.cn/link/bda085fd5db65533be2d418bd918686d

研究背景:应对材料科学研究的挑战

材料科学研究对现代工业发展至关重要,尤其在能源转换、电子设备、汽车制造和生物医药等领域。传统研究方法耗时长、成本高。 虽然大量文献蕴含丰富数据,但这些知识分散且难以获取。

人工智能技术为解决这一问题提供了新途径。知识图谱能够将非结构化数据转换为结构化知识库,加速知识检索和应用。 然而,构建材料科学知识图谱面临挑战:材料科学领域的复杂性,以及知识的快速更新和扩展需求。

MKG:自动化知识集成

该团队利用大型语言模型自动化构建本体论、提取和分析文献数据,并通过持续学习适应新的研究成果。 MKG的构建和维护过程分为四个步骤:

  1. 自动构建本体论: 利用大型语言模型(如LLaMA或Darwin)自动识别和分类文献中的关键概念和关系。
  2. 知识提取: 通过微调的大型语言模型精确提取结构化数据,并保留信息来源。
  3. 知识清洗: 采用数据清洗技术和人工审核,确保数据准确可靠。
  4. 材料发现: 利用图算法和神经网络分析和预测材料间的新关系,完善和增强知识图谱。

图片

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

下载

图片

图片

表1展示了LLM在知识提取中的效果。(来源:论文)

图片

材料发现与验证

MKG通过图算法和图神经网络进行材料发现,并利用修正后的Jaccard相似度算法进行全局范围的材料预测。 研究人员将MKG按时间分为训练集和验证集,验证了算法的有效性,并统计了高排名预测被验证的概率。

图片

图片

图片

未来研究方向

未来的研究方向包括扩展MKG的覆盖范围、整合其他知识图谱、分析材料再利用的历史模式、分析材料间的簇形成,以及将AI Agent技术集成到本体论的自动构建中。 这些方向将进一步增强MKG的功能和应用范围,推动科学与人工智能技术的融合。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

45

2026.01.06

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

500

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2917

2024.08.16

PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

67

2025.12.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

136

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

47

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号