一种基于混合图神经网络框架的模型,该框架结合了基于Transformer的原子嵌入技术,用于预测金属有机框架(MOFs)中的氢吸附行为
《Materials Today Energy》:A Hybrid Graph Neural Network Framework with Transformer-Based Atomic Embeddings for Predicting Hydrogen Adsorption in Metal-Organic Frameworks
【字体:
大
中
小
】
时间:2026年01月22日
来源:Materials Today Energy 8.6
编辑推荐:
氢能存储MOFs的深度学习预测模型与可解释性分析。提出融合晶体转换器原子嵌入、原子istic线图神经网络和忽略性决策层的混合框架,实现氢吸附量预测R2达0.987。关键发现:过渡金属(V/Cu)、卤素(Cl/Br)及配位键显著影响吸附性能,孔结构参数(空隙率/单位体积比表面积)为关键调控因子。
姜阳 坦|邵海健|邓星|姜迎涛
江苏科技大学计算机学院,中国江苏省镇江市212100
摘要
为应对日益增长的能源需求和环境问题,需要高效的氢储存系统。金属有机框架(MOFs)由于其较大的表面积、可调的孔隙率和热稳定性而具有巨大潜力。然而,利用量子力学或分子模拟来探索庞大的MOF设计空间在计算上非常耗费资源。在本文中,我们开发了一个深度学习框架,通过整合结构、化学和纹理特征来预测MOFs中的H2吸附行为。CrystalTransformer模型用于生成通用的原子嵌入(ct-UAEs),以捕捉原子环境,而ObliviousDecisionLayer则处理纹理描述符。Atomistic Line Graph Neural Network(ALIGNN)作为主要模型,利用线图表示来编码高阶相互作用。该框架在假设的MOFs(hMOFs)和基于拓扑的晶体构建(ToBaCCo)数据集上进行了训练,测试R2值分别为0.974和0.987,表现出良好的性能。可解释性分析(梯度敏感性和GNNExplainer)证实了特征学习的一致性,表明过渡金属(如V、Cu)、卤素(Cl、Br)及其配位键对吸附行为有显著影响。关键的纹理驱动因素包括孔隙率和单位体积表面积。本文表明,图神经网络能够准确预测MOFs的氢储存性能,并为合成MOFs的合理设计和发现提供指导。
引言
氢因其高能量密度和零碳排放而被广泛认为是未来可再生能源系统的关键载体[1]、[2]。然而,实现安全高效的储存仍然是一个阻碍其大规模应用的瓶颈[3]。在候选材料中,金属有机框架(MOFs)因具有较大的表面积、可调的孔隙结构和化学稳定性而受到广泛关注[4]、[5]、[6]、[7]。除了储存之外,MOFs的多功能性还扩展到了氢的生产领域,它们多样的结构拓扑提供了巨大的潜力。例如,最近的进展表明,非贵金属MOFs可以作为尿素辅助氢生产的有效电催化剂[8]。尽管具有这种潜力,但高效探索庞大的MOF化学空间仍然是一个巨大的挑战。虽然传统的计算方法(如密度泛函理论(DFT)和巨正则蒙特卡洛(GCMC)可以提供原子尺度的机制洞察[9]、[10],但其高昂的计算成本使得它们无法用于包含数十万种结构的数据库的高通量筛选。机器学习(ML)已成为一种有效的替代方案[11]。然而,早期依赖于手工制作的全局描述符的模型往往无法捕捉到准确预测性质所需的复杂局部化学环境[12]、[13]、[14]、[15]、[16]。同样,尽管深度学习方法(特别是图神经网络(GNNs),如CGCNN[17]和ALIGNN[18])在结构-性质建模方面取得了进展,但它们的标准原子编码通常难以完全表示复杂的电子效应。为了解决这些限制,我们提出了一个混合深度学习框架,旨在在拓扑准确性和化学可解释性之间架起桥梁。我们整合了预训练的ct-UAE嵌入来捕捉丰富的化学背景,并结合ALIGNN架构进行精确的拓扑编码。同时,引入了Neural Oblivious Decision Ensembles(NODE)[19]来有效处理全局纹理描述符。这项工作的意义在于它有可能推进高通量材料筛选。通过解码特征属性,这种可解释性有助于更清晰地理解特定特征与吸附性能之间的关联,为缩小高效氢储存MOFs的搜索范围提供了宝贵的理论参考点。
方法
模型训练使用了两个大规模的MOF数据集:假设的MOFs(hMOFs)数据集[20]和基于拓扑的晶体构建(ToBaCCo)数据集[21],这两个数据集均来自MOFX-DB[22]。hMOFs数据集包含137,953种结构,涵盖了39种不同的连接类型,从简单的碳-碳连接剂到复杂的芳香族系统,以及14种官能团。ToBaCCo数据集是通过拓扑逆向设计算法自动生成的,包括
结果与讨论
在模型应用之前,两个数据集都经过了预处理以确保数据的一致性。移除了sa_tot_m2g或sa_tot_m2cm3值为零的异常值。经过这一清洗过程后,hMOFs数据集从137,953种结构减少到126,879种,ToBaCCo数据集从13,511种结构减少到13,238种。处理后的数据集被用于模型评估。hMOFs数据集包含11种元素(Zr、Zn、V、Cu、C、Cl、F、O、Br、N和H),而ToBaCCo数据集
结论
在本研究中,我们将ct-UAEs整合到ALIGNN框架中以增强原子嵌入,并加入了ObliviousDecisionLayer来优化特征选择,从而实现了对hMOFs和ToBaCCo数据集中氢吸附行为的高精度预测。所提出的模型表现出一致的强预测性能,同时多种可解释性技术阐明了控制氢储存行为的潜在结构-性质关系。
CRediT作者贡献声明
姜阳 坦:验证、监督、资源管理、方法论、研究、正式分析、数据管理、概念化。邵海健:撰写初稿、可视化、监督、资源管理、项目管理、方法论、资金获取、正式分析、数据管理、概念化。邓星:撰写初稿、可视化、验证、软件开发、项目管理、方法论、资金获取、正式分析、数据管理,
利益冲突声明
? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号