综述：用于高级氧化催化的机器学习：从描述符到逆向设计

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Molecular Catalysis》：Machine learning for advanced oxidation catalysis: from descriptors to inverse design

【字体：大中小】 时间：2026年03月28日 来源：Molecular Catalysis 4.9

编辑推荐：

　　机器学习通过结合密度泛函理论加速先进氧化过程催化剂设计，提出物理信息神经网络和自主实验循环的解决方案，推动环境治理从试错法向理性设计转型。

李安琪|Oh Rena|任彦荣|赵亮|黄晓阳杰瑞

重庆教育大学生物与化学工程系，中国重庆 400067

摘要

机器学习（ML）的快速发展正在重塑环境修复领域的格局，为高级氧化过程（AOPs）中催化剂的传统试错开发提供了一种强大的替代方案。本文综述了ML辅助催化剂设计的最新进展，展示了数据驱动策略如何超越简单的动力学预测，实现活性位点和反应微环境的精确工程化设计。我们研究了先进算法的能力，特别是当其与密度泛函理论（DFT）结合使用时，能够解码复杂的结构-活性关系，从而以较低的计算成本加速关键电子描述符的识别。这一框架有助于为特定降解机制（从自由基生成到单线态氧产生）定制催化剂的逆向设计。然而，由于数据稀缺和实际废水基质的复杂性，将算法潜力转化为工业应用仍然具有挑战性。为了解决这些问题，我们提出了一条战略路线图，提倡使用基于物理的神经网络和自主实验循环。最终，我们认为ML正从一种统计辅助工具转变为加速下一代绿色催化剂合理发现的关键策略。

引言

全球的水环境正日益受到难以去除的新兴污染物的困扰，包括药品、个人护理产品、内分泌干扰化学物质以及全氟和多氟烷基物质[[1], [2], [3]]。这些污染物通常以微量存在，但由于其持久性、生物累积性和慢性毒性，可能造成长期的生态和健康风险。传统的废水处理方法主要针对大量有机物和营养物质设计，往往难以分解这些稳定的分子[[4], [5], [6], [7]]。因此，高级氧化过程（AOPs）已成为控制这些污染物的关键选择，因为它们可以生成高活性的氧化剂，并促进深度转化或矿化，而不仅仅是简单的相变[[8], [9], [10]]。AOPs的多功能性源于它们对多种氧化系统的适应性，包括芬顿氧化和类似芬顿的氧化[11,12]、臭氧氧化（O₃）[13,14]、过硫酸盐活化氧化（PMS/PDS）[[[15], [16], [17]]、电化学氧化（EAOPs）[[[18], [19], [20]]以及超声波/微波辅助氧化[21,22]，这些过程通常通过紫外线辐射、加热或催化剂来激活。此外，AOPs的效率取决于催化剂配方与废水特性的兼容性。

在异相AOPs中，催化剂处于核心位置：它们控制着氧化剂的活化方式、主导的反应物种、优先发生的反应路径以及过程的效率和经济可行性。然而，AOPs中的催化剂开发传统上依赖于试错实验，随着系统复杂性的增加，这种方法的效率越来越低。AOPs的性能受到多个强耦合变量的影响，包括合成条件、活性位点结构、污染物特性、溶液pH值、共存离子和溶解有机物。这种复杂性使得可转移的设计原则的提取变得复杂，并限制了机制模型在非狭义反应条件下的适用性。

用于形式化结构-性能关系的有用概念框架是定量结构-活性关系（QSAR）分析，它将分子或材料描述符与可观察的结果联系起来[[23], [24], [25]]。在AOPs的背景下，QSAR类型的思维可以扩展到包括催化剂和操作相关的描述符，从而将活性位点属性和反应微环境与降解性能联系起来。然而，传统的QSAR方法往往难以捕捉AOP系统固有的非线性相互作用和高维特征空间。机器学习（ML）提供了一种实用的方法，可以直接从实验和计算数据构建类似QSAR的映射[26]，不仅能够预测性能，还能识别有影响力的描述符[[27], [28], [29]]，并且当与可解释的方法结合使用时，还能提取机制洞察而不仅仅是曲线拟合[30,31]。值得注意的是，最近在异相氧化催化方面的进展表明，在某些情况下，催化“协同效应”可以用机制上明确且可学习的术语来表达，例如模块化基本反应和耦合描述符（包括电导率和活性位点邻近性）[32]，这在概念上与基于ML的多步AOP反应网络的表示是一致的。

数据驱动的多功能、高活性催化剂的发现已在材料科学领域取得了爆炸性增长；然而，将这些计算策略转化为环境修复中的高级氧化过程（AOPs）的具体应用仍然是一个需要系统探索的前沿领域。尽管最近的调查记录了机器学习（ML）在这一领域的崛起，但它们主要集中在通用算法的统计指标上，或者仅限于特定反应类别（例如，类似芬顿的过程），往往未能弥合数据驱动预测与基本化学机制之间的差距。与这些传统总结不同，本文建立了一个全面的框架，超越了简单的相关性，揭示了电子结构与活性氧物种（ROS）生成之间的相互作用。我们明确地将微观密度泛函理论（DFT）描述符与宏观反应器工程联系起来，旨在将该领域从经验性的试错方法转变为基于物理的逆向设计。为了实现这一愿景，讨论沿着AOP催化剂的全创新链展开，从“催化剂是什么”到“ML如何改变其设计”。我们首先总结了激发数据中心方法的AOP催化剂分类和性能瓶颈。随后，我们批判性地分析了遵循QSAR逻辑的ML辅助任务，包括为复杂水基质构建描述符，并展示了ML与量子化学计算结合如何解码结构-活性关系。最后，本文讨论了转化过程中的实际障碍，如数据不一致性，并强调了结合预测与合成的闭环、自主实验平台这一新兴前沿，以支持可扩展的废水处理。

部分摘录

AOPs中催化剂的分类和特性

图1展示了ML辅助AOPs研究的关键词共现网络，将主要主题映射到全球文献计量学景观上。节点大小反映了关键词的频率，“机器学习”位于中心位置，与“高级氧化过程”和“降解”紧密相关。这种中心性突显了ML从边缘的统计辅助工具发展成为环境修复研究中的核心方法论支柱的演变。

经典ML

在基于ML的AOP废水处理催化剂研究中，经典机器学习仍然是最广泛采用的方法论支柱，因为它在数据要求不高且实施流程清晰的情况下提供了强大的性能。其实际目标是关联可测量的输入，如催化剂组成、表面/结构特征、合成条件、氧化剂类型和剂量（PMS/PDS、H₂O₂、O₃）、操作变量（pH值、温度、光照强度）

ML辅助的催化剂性能预测和优化

在AOPs的混乱领域中导航并非易事。它涉及管理一个复杂的网状结构，其中催化剂架构与不断变化的反应动力学以及废水基质的混乱、不可预测性相冲突。多年来，该领域一直严重依赖所谓的“爱迪生式”方法，依靠大量的试错实验来关联结构和性能。但鉴于化学空间的巨大复杂性，仅依靠直觉和运气越来越不可靠。

总结与未来展望

人工智能（AI）与异相催化的结合标志着环境修复领域的一个关键转折点。通过从传统的试错方法转向理性的、数据驱动的策略，机器学习（ML）已经从一个简单的动力学预测统计工具发展成为解码复杂反应网络和加速材料发现的关键引擎。本文的分析强调了整合

CRediT作者贡献声明

李安琪：撰写——原始草稿、研究、形式分析、数据整理、概念化。Oh Rena：形式分析。任彦荣：验证、监督、方法论。赵亮：研究。黄晓阳杰瑞：项目管理、资金获取。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

X. J. H. 感谢国家自然科学基金（NSFC）（编号：22478041）、新重庆YC计划（CSTB2024YCJH-KYXM0116）和中央高校基本科研业务费（资助编号：2024JAIS-ZX003和2025CDJ-IAISZD-001）的财政支持。R. O. 感谢新重庆YC计划（CSTB2024YCJH-KYXM0084）和国际科学家研究基金（W2533039）的财政支持。

联系信箱：

粤ICP备09063491号

摘要

引言