基于深度学习的偏斜分布偏置探索化学与催化反应

《Nature Communications》:Exploring chemistry and catalysis by biasing skewed distributions via deep learning

【字体: 时间:2026年02月22日 来源:Nature Communications 15.7

编辑推荐:

  本研究旨在解决在复杂反应体系中自动发现反应路径的挑战,常规方法难以高效确定搜索方向。研究人员开发了名为“Loxodynamics”的机器学习驱动方法,通过偏置分子动力学,利用局部概率分布的偏度动态识别低能垒方向,引导系统向亚稳态演化。其核心是搭载了基于偏度损失函数的自编码器“Skewencoder”,可从少量采样数据中提取反应坐标。该方法在模型势能、气相反应(SN2和Diels-Alder)及操作条件下酸性菱沸石中催化醇脱水反应中得到验证,为无需高温或先验集体变量知识的反应发现提供了系统性框架。

  
在计算化学的前沿,如何让计算机像一位经验丰富的探险家,在复杂分子反应的“能量山川”中自动找到那些隐秘而关键的通道,一直是一个巨大的挑战。尤其是在多相催化、溶液反应等复杂环境中,分子们的行为如同在举办一场盛大的舞会,传统的计算方法常常像无头苍蝇,难以高效确定搜索方向,要么需要预先知道“舞步”(反应坐标),要么就得耗费巨大的计算资源进行“地毯式”升温搜索。这严重制约了新反应、新催化剂的设计与发现。为了突破这一瓶颈,研究人员将目光投向了机器学习与分子动力学的交叉领域,试图开发一种能够自适应探索化学空间、智能发现反应路径的新方法。
这项研究提出了一种名为Loxodynamics的机器学习驱动框架,用于通过偏置分子动力学来探索反应。其核心创新在于,它不再依赖预先设定的反应坐标或人为升温,而是巧妙地利用反应路径探索中局部自由能分布的“偏斜”特性。研究人员认为,在反应坐标附近,系统的概率分布往往是不对称的,这种“偏度”恰好指明了能垒最低的方向。基于此,他们开发了Loxodynamics方法,在分子动力学模拟中动态计算局部概率分布的偏度,并据此实时调整模拟的偏置力,从而智能地将系统引导向可能的亚稳态(如反应物、产物或中间体)和过渡态区域。
为了从有限的采样数据中高效提取出隐含的反应坐标,研究团队设计了名为Skewencoder的神经网络模型。它是一个特殊的自编码器,但其训练损失不仅包含常规的重建误差,还引入了一个基于偏度的正则化项。这个“偏度损失”迫使自编码器的潜空间(latent space)编码能够捕获导致概率分布不对称的关键自由度,这些自由度往往就是潜在的反应坐标。通过“采样-搜索”的迭代循环,系统可以逐步描绘出体系的自由能面,并且这一过程自然地包含了对于复杂反应环境至关重要的有限温度效应。
本研究发表在《Nature Communications》上,为了验证Loxodynamics框架的普适性和有效性,作者将其应用于三个不同层次的体系。他们首先在几个经典的模型势能面上进行了测试,证明了该方法能够准确、高效地定位过渡态并描绘自由能剖面。接着,他们将方法应用于两个典型的气相基元反应:SN2亲核取代反应和Diels-Alder环加成反应,成功复现了已知的反应路径并计算了能垒。最具挑战性的应用是在真实的催化体系中:在模拟工业操作条件(operando conditions)下,研究了酸性菱沸石(chabazite)催化剂上醇的脱水反应。Loxodynamics成功探索了该复杂多相催化体系中的多条可能反应路径,并识别出优势反应通道,展示了其在接近真实复杂环境下发现反应机制的能力。
本研究用到几个主要关键技术方法包括:1. Loxodynamics算法框架,该框架整合了偏置分子动力学与基于偏度的反应坐标识别逻辑,实现了自适应的反应路径搜索循环。2. Skewencoder神经网络架构,这是一种集成了基于偏度损失函数的自编码器,用于从高维分子构型数据中提取低维反应坐标。3. 增强采样分子动力学模拟,作为探索高维构型空间的基础。验证所用体系包括理论模型势能面、气相小分子反应体系,以及基于第一性原理计算的周期性模型(用于模拟菱沸石催化剂的样本队列)。
研究结果
模型势能面上的验证
通过在双势阱、Muller-Brown等经典模型势能面上的测试,研究表明Loxodynamics能够仅从围绕初始最小值的有限采样开始,自主探索势能面,准确找到过渡态和另一个能量最小值。与基于温度的加速方法相比,该方法在不人为升高系统温度的情况下,实现了对反应路径的加速发现,避免了因高温引入的非物理路径。
气相反应中的应用
对于SN2(CH3Cl + Cl-)和Diels-Alder(乙烯+丁二烯)反应,Loxodynamics成功地从反应物盆地出发,自动发现了生成产物盆地的路径。提取的反应坐标与理论化学中常用的内禀反应坐标(IRC)高度一致,计算得到的反应能垒与高精度量子化学计算结果吻合,证明了该方法在真实分子体系中识别关键反应自由度的能力。
多相催化反应中的探索
在模拟真实催化环境的操作条件下,对酸性菱沸石中乙醇脱水生成乙烯的反应进行研究。Loxodynamics成功探索了多条可能的反应机制,包括逐步机理和协同机理。它不仅确认了文献中提出的主要路径,还揭示了一些在常规静态计算中可能被忽略的、涉及催化剂表面柔性或溶剂化效应影响的替代路径。这展示了该方法在复杂、高维反应环境中系统探索未知化学空间的价值。
结论与讨论
该研究发展了一种名为Loxodynamics的新型机器学习驱动计算框架,它通过偏置分子动力学并利用局部概率分布的偏度来指导反应探索。其核心组件Skewencoder能够从最小化的初始采样数据中学习并提取有效的反应坐标。该方法在从模型体系到真实气相反应乃至复杂多相催化反应的一系列验证中均表现出色。
这项工作的主要意义在于,它为解决计算化学中“反应发现”的长期挑战提供了一个系统性的解决方案。Loxodynamics框架的关键优势在于其“自主性”和“高效性”:它不需要研究人员预先知道或猜测反应坐标(集体变量),也无需通过不现实的升高模拟温度来加速过程,从而能更物理、更系统地探索复杂体系的自由能景观。这为在纳米材料、生物酶催化、电池界面反应等极其复杂的体系中,发现全新的反应路径和机理提供了强大的工具。未来,将该方法与更高精度的势能面结合,有望极大地加速新催化剂、新反应的设计周期,推动计算指导的实验发现。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号