《Journal of Colloid and Interface Science》:Advancing metal organic frameworks screening and remediation condition optimization for removing persistent organic pollutant via integrated machine learning and theoretical calculation insights
编辑推荐:
本研究构建整合机器学习与量子化学计算(DFT)的框架,用于预测和优化MOF复合材料对持久性有机污染物(POPs)的吸附性能。通过分析包含物化特性、操作参数和芳香相关特征的数据库,XGBoost-CMAES模型在预测精度、鲁棒性和可解释性方面表现最佳,揭示π-π相互作用为核心吸附机制,并指出起始浓度、比表面积和颗粒尺寸为关键影响因素。理论计算验证了分子间作用与结构调控对吸附性能的影响,为MOF设计及条件优化提供理论依据,推动水处理技术发展。
魏正文|景思成|吕向飞|王伟|朱塞佩·梅莱|袁康泽|倪万奎|姜振毅|郭亚杰
教育部干旱地区地下水资源与生态效应重点实验室,长安大学,中国陕西省西安市雁塔路126号,710054
摘要
金属有机框架(MOF)在去除持久性有机污染物(POPs)方面变得越来越重要。然而,实现基于MOF的复合材料的精确和合理设计,以及优化实际应用的操作条件仍然具有挑战性。许多研究仍然依赖于经验性的试错方法,这限制了效率和可扩展性。在这项工作中,我们建立了一个综合框架,将机器学习与理论计算相结合,以预测、解释和优化MOF复合材料对POPs的去除效果。构建的数据库包括物理化学描述符、操作参数以及有助于捕捉MOF与污染物相互作用复杂性的其他芳香族相关特征。评估了几种传统和先进的学习算法,通过协方差矩阵适应进化策略优化的XGBoost在预测准确性、鲁棒性和可解释性方面取得了最佳平衡。机器学习模型还确定π–π相互作用是吸附行为的主要贡献因素。SHAP和部分依赖性分析进一步表明,起始浓度、比表面积和颗粒大小对去除行为有显著影响。这些分析还揭示了水化学因素的重要性,为调整处理条件提供了实际指导。理论计算的补充表明,增加芳香环含量和调整偏移平行堆叠可以扩大相互作用接触面积,增强静电互补性,并提高轨道重叠。总体而言,这种结合数据驱动和量子水平的方法将宏观性能预测与微观相互作用机制联系起来。它为指导MOF结构设计和优化处理条件以实现高效和可持续的POPs修复提供了实用策略。
引言
水对人类生活至关重要,并支持社会和工业的发展[1],[2]。在过去的一个世纪里,制造业、工业生产和农业活动的快速增长极大地推动了现代文明的发展。同时,这些活动也严重影响了水资源。污染物排放的增加和水生态系统的变化使得可持续的水资源管理变得更加困难[3],[4]。持久性有机污染物(POPs)被认为是水环境中值得关注的污染物。由于它们的化学稳定性和在自然条件下的缓慢降解,这些POPs化合物难以分解[5],[6],[7]。它们的疏水性使它们能够在生物体内积累并通过食物链传播,从而造成重大的生态和人类健康风险[8],[9]。国际环境组织试图控制POPs污染风险。《斯德哥尔摩公约》将多种POPs列为严格全球控制的污染物。尽管已经做出了相当大的努力来去除这些高毒性和有害的污染物,但POPs仍广泛用于工业、农业和某些制药领域。从废水系统中有效去除它们仍然具有挑战性,提高处理性能仍然是环境修复研究中的进一步课题[10],[11]。
在可用的修复策略中,吸附通常被认为是去除POPs最有效的方法之一,因为它操作简单、效率高且适用于大规模应用[12],[13],[14]。最近,多种无机材料和金属有机框架(MOF)作为有前景的材料受到了广泛关注[15],[16],[17],[18],[19],[20],[21]。特别是,MOF复合材料具有高比表面积、可调节的孔结构和丰富的活性位点,使它们能够捕获多种POPs,包括一些具有复杂分子结构和强环境持久性的POPs[22],[23],[24]。由于MOF的结构可以在金属位点进行调整,研究人员可以调整其孔结构或化学亲和力以匹配特定的POPs,这通常在不同环境条件下带来更好的选择性和吸附性能[25]。尽管有这些优势,基于MOF的吸附剂的合理开发仍然存在一些挑战。POPs与MOF吸附剂表面之间的相互作用复杂且难以分析。这些相互作用取决于分子性质和环境条件,这使得准确预测和控制吸附行为变得困难。另一个挑战是MOF复合材料在结构和化学上的多样性。当与多变的环境因素结合时,可能的组合数量迅速增加,这需要大量的实验工作。另一个限制是传统的实验室实验无法反映实际废水的物理化学异质性。MOF复合材料的性质、反应条件和POPs的特性往往相互影响。当实验单独进行时,很难完全理解潜在的机制关系。因此,为了实际应用优化基于MOF的复合材料,需要更全面地解释MOF结构、环境条件和POPs行为之间的复杂相互作用。更好地理解这些相互作用有助于评估MOF复合材料在去除复杂废水系统中POPs的性能。
将机器学习与量子化学计算相结合,为设计和优化MOF吸附剂提供了有前景的策略[26],[27]。机器学习可以高效处理大型数据集,并检测材料性质、污染物特性和环境条件之间的非线性关系[28],[29],[30]。此外,机器学习可以预测吸附行为,评估潜在的MOF复合材料,并阐明控制吸附行为的重要反应因素。尽管有这些优势,机器学习模型通常提供的关于吸附行为微观机制的见解有限。尽管预测往往准确,但这些模型对控制吸附行为的反应机制的洞察力有限。因此,最近的研究探索了将机器学习与理论分析(包括密度泛函理论(DFT)相结合,以提高预测准确性和机制可解释性[31],[32]。DFT计算提供了分子层面的见解,可以验证机器学习模型的预测并阐明吸附过程中涉及的机制。将机器学习与量子化学计算相结合,为MOF吸附剂的开发和反应过程优化创建了一个更全面的框架。这种组合策略减少了对试错测试的依赖,并有助于指导在现实环境条件下使用的MOF吸附剂的设计[33]。总之,这种综合方法可以加速高性能MOF复合材料的开发,以适应POPs污染物,并优化相关的解决方案反应环境,促进废水修复的进一步研究。
在这里,我们组织了一个用于去除POPs的MOF吸附剂的综合数据库,并开发了一种将先进的机器学习与量子DFT计算相结合的方法。目的是支持MOF复合材料的合理设计,并优化吸附条件以有效去除POPs污染物。基于构建的数据集,我们应用了几种机器学习方法来识别最显著影响吸附性能的物理化学因素。机器学习模型经过训练,以实现可靠的预测能力,而可解释的特征分析有助于阐明MOF吸附剂性质和反应条件与去除行为之间的关系。量子化学计算用于分析分子相互作用,并验证数据驱动模型所指出的微观见解。总的来说,结合机器学习和DFT的方法形成了用于开发未来用于去除POPs的MOF吸附剂的分析框架。这个组合框架支持系统地调整MOF复合材料的特性和反应条件,使基于MOF的吸附系统在去除POPs时更加有效。它还支持利用机器学习与量子水平分析相结合,以阐明驱动POPs在MOF复合材料上去除反应的潜在机制。
数据驱动建模的工作流程
机器学习过程分为四个主要阶段:数据收集、数据处理、模型训练和性能预测,如图1所示。这些阶段相互依赖,形成了一个支持系统设计MOF复合材料以去除POPs和优化操作参数的工作流程。工作流程从数据收集开始,其中包含有关MOF复合材料及其去除性能(视为吸附性能)的实验信息
数据库统计评估
数据库的质量和完整性对机器学习模型的可靠性和性能有很大影响。为了确保模型训练的稳健性,对数据集进行彻底的统计分析并检查关键特征的分布非常重要。在这里,输入特征可以分为以下三个主要类别。
MOF复合材料的性质:总体而言,MOF复合材料的性质表现出相当大的结构多样性。比表面积范围广泛
结论
本研究开发了一个由DFT计算支持的机器学习框架,用于指导MOF复合材料的开发并优化POPs去除的操作条件。传统的回归模型和几种深度学习方法在捕捉材料性质、污染物特性和反应条件之间的复杂关系方面能力有限。相比之下,跨多种统计指标和可视化方法的评估表明,XGBoost-CMAES模型
CRediT作者贡献声明
魏正文:撰写——原始草稿,监督,调查,数据管理,概念化。景思成:软件,调查,正式分析,数据管理。吕向飞:可视化,验证,项目管理,资金获取,概念化。王伟:撰写——原始草稿,监督,方法论,调查,概念化。朱塞佩·梅莱:撰写——审阅与编辑,可视化,软件,正式分析,概念化。袁康泽:撰写
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(42407081)、CPSF博士后奖学金计划(GZC20232222)、中央高校基本科研业务费(300102294105)、中央高校基本科研业务费(CHD)(300203211293)、国家外国专家项目(H20240379)、陕西省重点研发计划(项目编号2025SF-YBXM-534)的支持。