可解释的机器学习方法用于预测MOFs（金属有机框架）膜的分离性能，并抑制渗透性与微污染物排斥能力之间的权衡问题

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月10日 来源：Journal of Membrane Science 9

编辑推荐：

　　本研究构建了可解释机器学习框架，利用XGBoost模型预测MOFs膜对微污染物的渗透性和去除率，通过SHAP分析揭示分离机制（尺寸排阻、Donnan效应、疏水性相互作用），并开发出抑制渗透率-选择性权衡的策略，为高效率MOFs膜设计提供数据驱动方法。

中国江苏省微生物技术国家重点实验室、江苏省新型动力电池重点实验室、江苏省生物医学功能材料协同创新中心，南京师范大学化学与材料科学学院，南京210023

摘要

得益于其高度的可设计性、丰富的孔隙结构和多样的结构，基于金属有机框架（MOFs）的膜在去除不同水介质中的微量污染物方面受到了广泛关注。然而，去除具有不同结构和性质的多种微量污染物仍然具有挑战性。在这里，我们构建了一个可解释的机器学习框架，用于预测MOFs膜的微量污染物排斥能力和渗透性，揭示了分离机制，并指导设计出具有降低渗透选择性权衡的MOFs膜。在七种典型算法中，具有特征交互作用的XGBoost模型在微量污染物排斥能力（R2=0.79，MAE=9.46%，RMSE=12.84%）和渗透性（R2=0.86，MAE=41.53 L m?2 h?1 bar?1，RMSE=57.22 L m?2 h?1 bar?1）方面的表现优于随机森林模型和基于回归的模型（例如支持向量机和多元线性回归）。Shapley加性解释（SHAP）揭示了微量污染物和MOFs膜性质对分离性能的影响。此外，尺寸排阻、Donnan效应、疏水性和操作参数对微量污染物排斥的贡献分别为52.6%、10.5%、14.0%和6.7%，而孔结构、膜的亲水性/疏水性和操作参数对渗透性的贡献分别为49.6%、15.2%和24.1%。然后，通过设计MOFs膜结构和结合水介质的性质，开发了应对渗透选择性权衡的策略。本研究为设计具有高渗透性和从复杂水介质中去除微量污染物的MOFs膜提供了一种数据驱动的方法。

引言

微量污染物（例如抗生素和内分泌干扰化学物质）的分子量（MW）通常在100-1000 Da之间，其特点是浓度极低且具有高生物毒性，这对环境构成了巨大威胁，并且难以通过传统的水处理方法（例如混凝、氧化和生物处理）去除[1]、[2]。

由于膜技术具有高分离精度、占地面积小和操作简便等优点，因此成为先进水处理和资源回收中的有前景的选择[3]、[4]。微量污染物的分子量范围处于纳滤（NF，分子量截留值（MWCO）= 200～1000 Da）和反渗透（RO，MWCO = 100～200 Da）膜的分离范围内[5]。目前，作为脱盐的黄金标准，薄膜复合（TFC）聚酰胺（PA）已成为NF和RO膜的主流结构[6]。然而，传统的NF和RO膜最初是为脱盐设计的，尽管微量污染物的分子量高于盐离子，但它们通常对微量污染物的排斥能力不足[7]。例如，由于存在羧基（-COOH），NF膜带有负电荷，因此通常通过静电吸引对带正电荷的污染物排斥能力较低[8]、[9]。此外，疏水性微量污染物通过疏水性吸引也被疏水性NF和RO膜所不能有效去除[10]、[11]。此外，渗透选择性权衡效应也大大限制了膜的性能[12]。

为了解决上述挑战，将纳米材料（例如碳纳米管[13]、石墨烯[14]、共价有机框架（COFs）[15]和金属有机框架（MOFs）[16]、[17]引入NF/RO膜中，引起了人们的广泛关注，这些材料为膜提供了更多的水通道和可调性质（例如电荷和疏水性）[18]。得益于其丰富的孔隙结构、可控的孔结构和高度的可设计性，MOFs膜在微量污染物去除方面表现出优异的分离性能[9]、[10]，甚至能够打破渗透选择性权衡效应[19]。然而，复杂水介质中存在多种具有不同结构和性质的微量污染物以及共存的污染物，这给设计具有选择性和广谱去除目标微量污染物的MOFs膜带来了巨大挑战。鉴于MOFs还存在大量不同的结构类型，阐明具有高渗透性和选择性的MOFs膜的微量污染物排斥机制具有重要意义。

机器学习（ML）在指导膜对微量污染物的排斥方面非常强大，与传统试错方法相比，它能够构建出针对特定微量污染物进行选择性去除的膜[20]。最近，ML在预测膜的分离性能和揭示污染物排斥机制方面受到了广泛关注[21]。例如，Jeong等人利用极端梯度提升（XGBoost）模型预测微量污染物的排斥能力，并通过Shapley加性解释（SHAP）解释了每个变量（例如微量污染物的分子量、大小和LogK?；膜的分子量截留值、水接触角）对模型预测的贡献[20]。他们进一步使用XGBoost和多模态变换器模型揭示了PA膜对全氟烷基和多氟烷基物质（PFAS）去除的调控因素[22]。通过结合XGBoost模型和可解释的SHAP，还量化了不同机制对微量污染物去除的贡献[21]、[23]，其中尺寸排阻、电荷效应和疏水相互作用分别占NF膜的46.08%、16.21%和11.71%[23]。然而，大多数研究侧重于使用单一变量和简单的复合变量来提高现有模型的预测精度，而没有考虑污染物的化学信息，同时忽略了膜结构-性能关系的深入阐释以及实际场景中的隐含信息。鉴于水介质中存在大量具有不同结构和性质的微量污染物，目前尚不清楚微量污染物的化学特性如何影响其排斥性能，这阻碍了对膜排斥机制的理解。此外，大多数研究试图提高排斥性能，而往往忽略了渗透性的同步增加，从而阻碍了打破渗透选择性权衡的理解。到目前为止，还没有文献预测MOFs膜对污染物的去除效果。因此，建立一个强大且可解释的ML框架，以阐明MOFs膜结构、污染物性质和分离性能之间的黑箱关系至关重要。

为了填补上述知识的空白，本研究旨在解决以下问题：（1）典型的ML模型（例如随机森林（RF）、XGBoost、支持向量机（SVM）、多元线性回归（MLR）、套索回归和岭回归）预测了MOFs膜的微量污染物排斥能力和渗透性。特征交互作用（FI）揭示了数据的隐含信息，提高了ML模型的准确性和可解释性；（2）SHAP分析量化了输入特征（微量污染物性质、微量污染物的分子描述符（MDs）和MOFs有机配体、膜性质以及操作参数对MOFs膜微量污染物排斥能力和渗透性的贡献权重；（3）揭示了微量污染物排斥机制（尺寸排阻、静电效应（Donnan效应）和疏水效应），并提出了抑制MOFs膜渗透选择性权衡的策略。总体而言，开发了一个可解释的ML框架，以指导下一代膜的设计，用于先进的废水处理。

材料与方法

建立了一个可解释的ML框架，用于预测MOFs膜对目标微量污染物的去除能力和渗透性。ML的工作流程如图1所示，包括数据集收集和预处理、特征工程、模型建立、验证、可解释性和应用。

数据集分析

采用皮尔逊相关分析来最小化特征冗余。两个变量之间的皮尔逊相关系数均低于0.65（图2），这表明它们适合作为微量污染物和MOFs膜的关键特征。特征的Violin图显示，用于预测微量污染物排斥（图S4）和渗透性（图S5）的测试数据集的分布与训练数据集的分布没有偏差，表明用于模型训练的数据集是全面的

结论

本研究使用可解释的ML模型预测了MOFs膜的微量污染物排斥能力和渗透性，并阐明了调控因素和分离机制，从而实现了具有高渗透性和选择性的MOFs膜的设计。得益于基于XGBoost-SHAP的可解释框架及其特征交互作用，我们对微量污染物的排斥能力和渗透机制有了深入的了解

CRediT作者贡献声明

Sichen Liu：验证、软件开发。Shiyu Deng：正式分析、数据管理。Kaiyan Gao：撰写——初稿、正式分析、数据管理。Weiben Yang：监督、资源管理、项目管理、方法论、调查、概念化。Yingman Fu：数据管理。Yufan Chen：数据管理。Yanlong Wang：数据管理。Jiaqi Fei：数据管理。Xiaohan Qian：正式分析。Xuemei Luo：数据管理

未引用参考文献

[45]。

利益冲突声明

? 作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

本研究得到了国家自然科学基金（编号：52200058）和江苏省自然科学基金（编号：BK20220380）的财政支持。

联系信箱：

粤ICP备09063491号

摘要

引言

材料与方法

数据集分析

结论

CRediT作者贡献声明

未引用参考文献

利益冲突声明

致谢

热点排行