《Digital Chemical Engineering》:DFT in catalysis: Complex equations for practical computing applications in chemistry
密度泛函理论(DFT)已成为现代计算催化领域的基石,因其在描述分子结构、成键和反应活性时,在精度与效率之间达到了实用的平衡。本文对DFT方法学进行了全面概述,从其量子力学基础和基组构建,到由雅各布阶梯定义的交换-关联泛函层次结构。
1. 引言
化学始于何处?答案在于识别可以在化学学科框架内研究的最简单实体或现象。虽然原子是一个起点,但更精确的定义是,化学是不同原子在相互作用时所表现出的行为。静态、不发生相互作用的原子集合中没有化学。化学的本质在于原子间的相互作用,这导致了分子的形成与解离,而化学键正是这一过程的集中体现。
化学键的存在本质上依赖于电子。我们对电子性质的理解源于20世纪上半叶诸多突破性贡献。由于经典模型与实验观察之间的差异日益增大,量子力学应运而生。薛定谔方程的提出使得评估粒子这种新颖的波状行为成为可能,并需要一个统计框架来准确描述它。
2. 薛定谔方程
物质的量子力学描述始于薛定谔方程,它通过哈密顿算符将系统的总能量与其电子波函数联系起来。原则上,该方程包含了描述原子和分子所需的所有信息。然而,仅对最简单的氢原子存在解析解,因为多电子系统中电子-电子排斥的显式处理在数学上是难以处理的,因此需要近似方法。
一个常见的简化是在玻恩-奥本海默近似下,将每个电子视为在其他电子产生的平均场中运动,而原子核保持固定。这一平均场概念引出了Hartree和Hartree-Fock方法,其中总波函数由单电子轨道构建,提供了化学上直观的成键图像。尽管对真实分子系统精确求解薛定谔方程无法实现,但其概念框架支撑着每一种现代量子化学方法。在催化领域,这些近似使得在电子水平上描述活性位点、中间体和过渡态成为可能,从而在基础量子理论与观察到的化学反应性之间建立了直接联系。
2.1. 波函数
大多数电子结构方法通过将电子视为独立粒子然后校正缺失的相互作用来近似真实系统。这一简化将多体问题简化为一个可管理的准单粒子模型。在此框架下,引入了单电子函数或轨道,并用于构建排列在Slater行列式中的近似分子轨道。由于类氢原子提供了薛定谔方程的精确解,其轨道可作为近似原子和分子系统的便利单电子函数。在分子计算中,电子波函数通常表达为这些原子轨道的线性组合,这种方法被称为原子轨道线性组合(LCAO)方案。尽管是近似的,但这种方法为理解和计算原子与分子的电子结构提供了实用且数学上易处理的基础,构成了现代量子化学计算的概念基础。
2.2. 基组的性质
Slater型轨道(STO)最初被引入来模拟单电子原子函数,通过指数径向衰减和类氢角依赖关系,紧密地模拟了类氢原子轨道。尽管STO具有物理准确性,但存在一个主要的计算挑战:分子计算所需的四指标积分缺乏解析解,需要耗时且易出错的数据方法。为了克服这一限制,开发了高斯型轨道(GTO)作为替代方案。GTO以高斯函数形式衰减,允许解析计算所有必要的积分,从而极大地提高了计算效率。然而,其更快的衰减和在原子核处缺少尖峰使其对真实原子轨道的表示不那么真实。为了解决这个问题,现代量子化学方法通过组合多个GTO来近似STO,形成收缩的高斯函数,在保留GTO计算优势的同时模仿STO的物理准确性。这种复合方法在精度和效率之间提供了最佳平衡,构成了几乎所有现代分子电子结构计算所用基组的基础。
2.3. 基组的大小
从数学角度看,增加基组的大小可以通过提高其灵活性来改善所表达的函数。这被称为多重zeta基组,允许更好地描述具有不同对称性的成键相互作用。在有机金属DFT优化中,几何优化至少需要双zeta基组。为了提高效率,额外的基函数通常只应用于价层轨道,因为它们主要描述化学行为,这产生了分裂价基组,将计算资源集中在参与反应活性的电子上。
此外,在发生原子轨道杂化的情况下,需要额外的考虑。例如,氮的真实原子轨道无法表示分子中的杂化,为了修正这一点,氮的基组中会添加d轨道,这些被称为极化函数。在电子关联方法中,需要更详细的极化表示,这可能涉及更高阶的极化函数。
另一种纳入极化的方法涉及允许基函数位于远离原子中心的位置,但这会显著减慢几何优化速度,因此很少用于当代计算。为避免能量计算和其他分子性质的显著误差,标准基组通常还会补充弥散基函数。这对于模拟阴离子、高度激发的电子态和松散结合的复合物尤其重要。
当考虑到电子波函数的反对称性时,轨道被引入作为多电子波函数分解为单电子波函数的因子。在类氢原子中,这些轨道自然出现,因为每个能级只能被一个电子占据。根据泡利不相容原理,每个轨道最多可以被两个自旋相反的电子占据。对于较重的原子,赝势被用于描述内层电子。当特别应用于较重元素的内层时,术语有效核势(ECP)被使用。ECP通过修改哈密顿算符来简化计算,从而提高计算效率。这些修正也可以纳入相对论效应,这对于精确模拟过渡金属和重原子至关重要。
3. Hartree Fock
Hartree-Fock(HF)方法为解决多电子薛定谔方程提供了第一个实用方法。在HF理论中,每个电子被描述为在所有其他电子产生的平均静电场中运动。总波函数被表示为一个单一的Slater行列式,自动满足泡利不相容原理。HF过程迭代求解,直到轨道和势之间达到自洽,从而产生所谓的自洽场(SCF)。这种方法给出了系统的平均场描述,足以重现成键和分子几何结构的定性特征,但它忽略了电子之间的瞬时关联。由于未包含电子关联,HF能量系统地高于实验值。在实践中,需要校正关联的方法,如后HF方法或密度泛函理论(DFT),以达到定量精度。
4. DFT
DFT方法被广泛使用且日益流行的原因有几个。或许最令人信服的是电子密度的物理性质,它提供了与现实世界中可测量量的直接联系,这与更抽象的波函数概念形成对比。Hartree-Fock方法变分地最小化Slater行列式的能量,该行列式依赖于所有电子的坐标,导致变量数量庞大。相比之下,早期的DFT方法通过用电子密度来表达多体问题而简化了它,电子密度仅依赖于三个空间坐标,而与电子数量无关。Kohn-Sham轨道的引入重新引入了对电子数的一些依赖性。
4.1. DFT方法论与Hohenberg-Kohn定理
DFT基于Hohenberg和Kohn提出的两个基本定理。第一定理指出,电子密度唯一地决定系统的所有性质,包括其外势、哈密顿量和总能量。第二定理引入了密度的变分原理,指出任何对应于正确电子数的尝试密度所提供的能量值等于或大于真实基态能量。然而在实践中,该方法面临两大挑战:没有明确的方法来选择准确的尝试密度,以及将能量作为期望值计算重新引入了DFT旨在避免的复杂性——即直接求解多体薛定谔方程。
4.2. Kohn-Sham理论
一旦确定电子密度可以作为变分参数,下一步就是将总能量定义为该密度的泛函。对于非氢系统,主要挑战在于准确描述电子-电子排斥和量子关联。Kohn和Sham通过引入一个虚构的非相互作用电子系统来解决这个问题,该系统再现了真实的相互作用系统的相同密度。这使他们能够将总能量泛函分解为四个组成部分:非相互作用电子的动能、外势、经典库仑(Hartree)项以及交换-关联泛函,后者校正了所有剩余的量子效应。交换-关联项既包含了真实与近似动能之间的差异,也包含了电子-电子相互作用的非经典部分。Kohn-Sham形式主义因此将多体问题简化为一个有效的单电子框架,可以使用由Slater行列式构建的轨道自洽求解。尽管高效且成功,该方法面临两个主要限制:必须手动校正自相互作用误差,并且交换-关联泛函的精确解析形式是未知的。
4.3. DFT泛函与雅各布阶梯
Perdew及其合作者定义的DFT雅各布阶梯提供了一个分层框架,其中最准确和复杂的密度泛函近似(DFA)位于较高阶。近似根据交换-关联泛函Exc[ρ]的计算方式分类。阶梯的最顶层代表完全相互作用系统的薛定谔方程。阶梯的前四个阶使用由占据轨道构建的DFA:局域密度近似(LDA)、广义梯度近似(GGA)、元GGA泛函和超GGA(杂化泛函)。在雅各布阶梯中,双杂化泛函代表第五阶。最近,这些泛函已与Grimme及其同事的D3模型分散校正相结合,后来又加入了Becke-Johnson(BJ)阻尼,随后是Grimme的D4分散校正。文献中还报道了其他改善分散相互作用描述的方法,例如非局域关联泛函VV10。
4.4. DFT建模的现状
现代杂化和元杂化泛函,如B3LYP、PBE0、M06和ωB97X-D,在广泛的系统中平衡了计算成本和精度。这些泛函对于电子关联、自旋态和相对论效应至关重要的有机金属化学和催化领域已被证明特别有效。
DFT在催化建模中的发展得益于处理复杂反应网络和大催化体系能力的增长。早期DFT研究侧重于配体截断和理想化条件的简化模型。如今,先进的泛函结合了分散校正和隐式溶剂模型,允许精确处理涉及大配体、显式溶剂和动态路径的真实催化系统。相对论DFT的最新进展,特别是使用有效核势和标量相对论校正,提高了对Pd、Pt、Au和Ir等重过渡金属的预测准确性。
在DFT的最新见解中,我们重点介绍了一些开创性研究,这些研究展示了DFT在揭示有机金属、酶催化和多相系统的催化机制中的核心作用。数据驱动框架,例如Mok等人的工作,例证了DFT与机器学习在CO2还原电催化中的整合。Butera则提供了连接理论与实际催化的全面综述。Shambhawi等人探索了多相催化剂的计算设计策略,Zhang等人分析了用于逆水煤气变换反应的Fe基和Cu基单原子催化剂。Chen总结了MOFs上CO2转化的DFT方法,而Zhang L.等人将实验与DFT结合以合理化Ni掺杂的Mo2C电催化剂。在分子方面,Mavroskoufis等人将(TD-)DFT应用于光-NHC催化,Nandy等人使用DFT解码C–H活化的酶蓝图。补充研究将DFT应用扩展到能量存储和双原子催化剂设计。这些工作共同凸显了现代DFT的多样性,从机理阐明到逆向催化剂设计,展示了其在催化研究全谱系中的预测和统一作用。
定位和验证过渡态(TS)是DFT研究机理阐明的核心。现代算法已将此过程自动化,其中最广泛使用的是微动弹性带(NEB)方法、弦方法和生长弦方法(GSM),它们结合DFT梯度,即使对于复杂的多步反应也能高效定位鞍点。
振动频率分析仍然是确认过渡态的标准判据,具有一个虚频对应于反应坐标上的运动。内禀反应坐标(IRC)计算进一步将TS结构与相邻的极小值点连接起来,确保机理的连续性。最近的发展集中在自动TS搜索算法上,这些算法集成人工智能和全局优化,以最少的用户输入探索反应图景。
机器学习加速的TS预测代表了一个新兴前沿。在DFT数据上训练的神经网络可以预测近似的TS几何结构和能垒,极大地减少了对昂贵的量子化学优化的需求。一旦势能面(PES)被绘制出来,微动力学建模将热力学和动力学数据整合到速率方程中,预测整体周转频率和选择性趋势。
这种方法在多相催化中发挥了重要作用,其中基于DFT的微动力学模型解释了金属表面和配体环境的趋势。例如,从DFT数据推导出的Sabatier分析和标度关系能够生成火山图,将催化活性与吸附能关联起来。这些描述符指导了析氢、CO2还原和氨合成催化剂的理性设计。
DFT数据与动力学蒙特卡洛(kMC)模拟和从头算分子动力学(AIMD)的整合进一步增强了反应网络建模的真实性。静态DFT与动态模拟之间的协同作用提供了真实条件下催化性能的全面视图。
DFT在催化剂设计中扮演着双重角色:它合理化实验结果并预测具有改进性能的新候选物。在均相催化中,DFT阐明了配体结构、电子效应和配位几何如何影响催化循环的每一步。通过将总能垒分解为电子和空间贡献,DFT对氧化加成、转金属化和还原消除的分析表明,富电子配体促进氧化加成,而空间位阻大的配体通过稳定低配位中间体促进还原消除。描述符方法,如Tolman锥角、埋藏体积百分比(%VBur)及其衍生的空间位阻图,现在整合了DFT计算的参数,如前线轨道能和金属-配体电荷转移,以预测催化性能。
在多相催化中,DFT改变了对表面化学的理解。使用平面波基组的周期性DFT方法的发展允许对金属和氧化物表面进行精确建模。现在可以高精度预测催化表面的吸附能、扩散势垒和反应机理。此外,机器学习势的出现将DFT精度扩展到涉及数千个原子的分子动力学模拟。
催化剂设计中的一个主要挑战是化学空间的广阔性。DFT衍生的描述符为高效筛选提供了途径。最近的发展将DFT与机器学习相结合,以加速催化剂发现。在DFT计算描述符上训练的机器学习模型以极低的计算成本预测吸附能、反应势垒或周转频率。混合量子-机器学习方法正在成为下一个前沿,机器学习量子势在DFT和动力学之间架起桥梁。Δ学习等技术使用数据驱动的校正来纠正系统性的DFT误差,而替代机器学习势允许实时探索势能面。这些方法降低了DFT级精度与大规模动力学模拟之间的计算障碍,使得能够以接近实验精度进行催化循环的计算机设计。
尽管取得了显著进展,DFT在描述某些催化现象时仍面临固有的局限性。标准的交换-关联泛函通常在处理自相互作用误差、多参考特征和色散力方面存在困难。涉及开壳层构型或自旋交叉反应的过渡金属络合物尤其具有挑战性。为了解决这些缺陷,人们开发了多参考DFT、范围分离杂化和双杂化泛函。将DFT与实验光谱学(如XAS、IR、NMR)通过计算光谱学和逆向设计相结合,将进一步增强其预测能力。催化剂设计的未来很可能在于自动化的DFT工作流程与机器学习的结合,从而实现理论预测直接指导实验合成和测试的闭环发现平台。
然而,DFT也存在一些问题,自旋污染是标准DFT在处理开壳层或破缺对称金属络合物时的主要限制之一。一个广泛采用的校正方案是Yamaguchi自旋投影方法。在涉及双自由基、自旋交叉反应或多构型过渡态的情况下,单行列式DFT变得不可靠。为了克服这些不足,建议采用多参考方法,如CASSCF或CASPT2。最近,多参考DFT和DFT-in-DFT嵌入方案被开发出来,以结合DFT效率和多参考精度,为复杂催化系统中的静态和动态电子关联提供平衡处理。另一方面,Grimme及其同事提出了一种基于分数占据密度的工具,用于可视化和量化静态电子关联,从而能够识别强关联电子并提供静态电子关联的单一全局度量。
4.5. 催化应用中DFT泛函的对比性能
在计算催化领域,DFT中交换-关联泛函的选择是最关键的方法学决策之一,因为它直接影响几何结构、吸附能、过渡态势垒、氧化还原/氢负离子能量学和机理排序。大量基准研究表明,性能高度依赖于具体情境:没有一个泛函在所有催化体系中表现卓越。例如,一项对许多金属的过渡金属-氧键解离的研究发现,像PBE或RPBE这样的GGA泛函产生较大误差,而像B2PLYP、TPSSh和B3P86这样的杂化/元-杂化形式主义产生的误差较小。另一个关于金属表面吸附的基准建立了一个实验吸附能数据库,并比较了包括RPBE、BEEF-vdW等在内的几种泛函。总之,对于均相有机金属体系,势垒高度和热化学的精度强烈依赖于Hartree-Fock(HF)交换的比例、色散校正的包含以及自旋态和多参考特征的处理。在一项关于后期过渡金属反应剖面的开创性基准研究中,作者发现所谓的“动力学”泛函(如mPW1K,BMK)对于TM体系的性能比通用杂化泛函差;相反,像PBE0、B1B95和PW6B95这样的泛函提供了相对更好的性能。对于氧化还原/氢负离子化学,一项研究报告称,当在GGA-D3水平上进行几何优化,并用PBE0-D3进行单点计算时,平均绝对误差约为1.4 kcal mol-1,这暗示PBE0-D3是氢负离子/配体设计化学的强有力候选者。因此,对于均相催化可以推断:具有适中HF交换比例(≈20–30%)的杂化或元-杂化泛函,加上色散校正,在典型的有机金属催化循环中提供了负担能力和化学精度之间的最佳折衷。需要注意的是:开壳层或多参考情况可能仍然挑战这些方法,并且基组/溶剂化/热校正可能主导剩余的误差预算。
在多相催化中,建模通常涉及金属/氧化物表面的周期性板、吸附物结合能以及表面上的反应势垒。关键挑战包括:金属-吸附物成键、范德华(vdW)/色散相互作用、横向吸附物耦合、覆盖效应和离域的d态的正确描述。在多相催化的实用指南是:使用色散校正的GGA(或vdW感知的)泛函进行大规模的周期性筛选研究(成本与精度的权衡);如果计算资源允许,对关键步骤(例如速率决定步骤)测试杂化泛函,以验证GGA结果集;并且如果结合/吸附能量位于机理临界值的±0.2–0.4 eV范围内,则应始终谨慎对待。
催化机理建模通常依赖于计算的势垒高度和中间体及过渡态的相对能量学。一项关于Ni/Pd基催化剂活化能的基准研究发现,PBE0-D3提供了最佳性能,其次是PW6B95-D3和B3LYP-D3,杂化/元-杂化泛函优于普通的GGA和元-GGA。因此,对于反应网络建模,应该:对所有步骤应用相同的泛函(以保持误差抵消);用更高级别的泛函或方法对一两个关键势垒进行基准测试;检查机理排序如何随替代泛函而变化。
现代催化剂设计工作流程越来越多地利用高通量DFT + 描述符筛选 + 机器学习。在这种情况下,计算成本至关重要,像r2SCAN-D4、B97-3c或低成本GGA-D4变体这样的泛函越来越受到关注。用户应注意,描述符误差会传播,用于构建数据集的泛函最终会影响下游人工智能模型的预测可靠性。有几个注意事项必须缓和上述指导。首先,许多基准集显示出相当大的分散性。其次,最佳泛函可能取决于化学问题的类型(吸附 vs. 键断裂 vs. 氧化还原),而不仅仅是简单的杂化 vs. GGA分类。第三,环境效应(溶剂化、温度/熵、覆盖度、载体效应)可能主导误差预算并掩盖泛函选择的影响。展望未来,非经验性元-GGA和双杂化方法的发展,结合机器学习校正方案(Δ学习)和严格的不确定性量化,为更具预测性的催化建模提供了一条有希望的途径。然而,在通用的催化泛函出现之前,从业者必须保持警惕:进行敏感性检查,记录泛函选择策略,并清晰传达方法学的不确定性。
总而言之,在均相有机金属催化中,准确的反应势垒和自旋态能量学至关重要,通常推荐使用B3LYP、PBE0和TPSSh等杂化泛函。在所有配体或吸附物涉及显著非共价相互作用的情况下,应应用显式色散校正(D3或D4)以确保可靠的能量学。对于大型周期性多相系统,具有色散校正的GGA泛函(如PBE-D3或RPBE-D3)仍然是实用且广泛采用的标准,在精度和计算可行性之间取得平衡。新兴的元-GGA类,特别是r2SCAN-D4,以GGA级成本提供了接近杂化泛函的精度,使得这些泛函对于机器学习辅助的催化材料高通量筛选特别有吸引力。相比之下,像B2PLYP-D3这样的双杂化泛函最好保留用于小型基准模型或能量精修,因为它们的计算需求显著更高。最后,BEEF-vdW泛函通过提供吸附能和火山图预测的统计误差估计,在量化催化筛选中的不确定性方面提供了独特的优势,从而提高了计算催化剂设计的鲁棒性。
5. 机理描述
量子力学建模已成为探索有机金属反应机理的日益流行的方法。DFT计算通常用于识别反应路径上的中间体和过渡态。所有可能的反应路径都在称为势能面(PES)的多维空间中被映射。PES内的化学显著结构,如反应物、中间体、过渡态和产物,被识别为梯度为零的驻点。这些点在一定温度和压力条件下的相对吉布斯自由能定义了反应的能量格局。这些能量值的序列有助于推断反应机理。值得注意的是,PES的理论存在是玻恩-奥朋海默近似的直接结果,该近似将电子和原子核的运动解耦。
5.1. 理论模型
为了确定平衡常数和速率常数,有必要计算吉布斯自由能,因为这依赖于吉布斯能量差而非内能差。这些计算的精度强烈依赖于泛函和基组的选择。几何优化是关键的先决步骤,旨在定位中间体的局部极小值或过渡态的局部极大值。对于具有许多原子或过渡金属中心的系统,此过程可能计算成本高昂。
为了提高精度,通常在几何优化后通过单点计算来精修电子能量。这种方法分离了电子能量计算,提供了一种更高效的途径。当使用不同泛函和基组时,焓和自由能差异保持一致的假设进一步增强了结果的可靠性。
溶剂效应显著影响化学物种的稳定性,也必须纳入能量计算。虽然优化时显式包含溶剂是理想的,但隐式溶剂模型通常用于单点计算以提高效率。熵通常被高估,因为计算忽略了分子在电子术语中并非处于真正的液态这一事实。这种差异通常使用隐式溶剂模型(如SMD或PCM)进行校正,这些模型包含了溶剂的半径和介电常数。此外,真正的催化环境,如电化学界面或操作条件,要求包含外加电势和电场,这是计算电化学中一个快速发展的领域。
此外,标准DFT热化学的一个众所周知的限制是谐振子-刚性转子近似,它倾向于高估熵贡献,特别是对于表面吸附物或柔性分子中间体的低频模式。为了解决这个问题,Martin及其同事提出了一种准谐校正方案,用有效的截止值替换非常低的振动频率,从而产生更现实的熵和自由能估计。实际上,他们提出了一种基于压力的校正,对水应用最大值1354 atm。该值根据溶剂的密度使用理想气体方程进行缩放,并结合溶剂的分子量和温度。并且,为了考虑1 M的标准实验浓度,引入了一个额外的校正项,该项与温度相关。其他方法也已显示出,这样的校正可以显著改变反应自由能剖面的形状,甚至改变预测的速率决定步骤。类似地,最近的计算研究表明,对熵应用准谐或受阻转子校正可以重塑有机金属反应机理中的吉布斯自由能图景,从而改进选择性和动力学的预测。因此,在比较具有不同构象灵活性或吸附特征的中间体和过渡态时,纳入这种物理驱动的熵校对于精确的热力学和动力学建模至关重要。
5.2. 催化系统与能量剖面解释
解释反应的能量剖面传统上通过Eyring的过渡态理论(TST)实现,侧重于速率决定步骤(rds)。然而,化学计量反应的背景与催化过程显著不同。Kozuch和Shaik主张将催化过程的循环性质纳入热力学评估。
在他们的2011年报告中,他们强调了速率决定步骤描述符的局限性,该描述符常常具有误导性。在稳态条件下,催化循环中的所有步骤定义上以相等的速率进行。Kozuch提倡使用能量跨度模型(ESM),该模型提供了对催化循环更全面的评估。单步反应的速率可以通过阿伦尼乌斯方程表示,而能量跨度(δE)概念将其扩展到多步催化循环。与连续的中间体-过渡态对不同,δE考虑循环中最大的能量差。
催化效率的关键度量——周转频率(TOF),也可以使用ESM从理论上推导出来。所提出的反应机理应被视为一个工作理论,其预测必须与实验结果进行验证。机理必须与可观测数据相一致,包括总反应化学计量、选择性、速率定律、活化参数、中间体及其光谱特征。尽管技术进步可能最终“证明”机理,但重新解释仍然是一种持续的可能性。为了推进催化领域,研究人员应专注于反驳而非验证他们偏爱的机理理论。机理研究应旨在消除替代解释,从而加强未被反驳的假设的可信度。同样重要的是要认识到,计算方法本身并不揭示反应路径。相反,它们基于当前的化学理解来评估反应。计算研究通常强调生产性反应路径,而忽略了诸如催化剂失活或循环外反应等因素。这种狭隘的关注意味着只探索了PES的一小部分。此外,多条反应路径可以连接特定的反应物和产物,这进一步使分析复杂化。