《The Journal of Physical Chemistry A》:Assessing the Limits of the “Lego-Brick” Approach: Equilibrium Structures of Strained and Flexible Cyclic Molecules
编辑推荐:
本文针对“Lego-brick”(TM+LR)方法在计算化学中准确预测分子结构的适用性进行了系统性评估。研究团队通过构建一个包含三、四、五元环(含杂环和多种构象体)的多样化基准集,比较了模板分子(TM)和完整“Lego-brick”(TM+LR)方法的旋转常数与实验值的差异。结果表明,虽然小环体系对方法构成挑战,但“Lego-brick”方法仍能保持良好精度,线性回归(LR)校正对实现目标精度至关重要。该工作不仅明确了TM+LR方法在柔性体系中的应用界限,还展示了其能显著改进初始密度泛函理论(DFT)结果,为缺乏同位素数据时通过半实验(SE)方法获取实验质量平衡结构提供了可行方案,拓展了该方法的化学空间适用范围。
在化学领域,尤其是高分辨分子光谱学中,精确的分子结构是预测光谱参数(特别是旋转常数)的基础。传统的从头算(ab initio)方法,如基于耦合簇(CC)理论及其显式相关变体的复合方案,虽然能达到近乎光谱级的精度,但计算成本高昂,且随着分子复杂性和尺寸的增加而迅速变得难以承受。近年来,一种被称为“Lego-brick”(也记为TM+LR)的片段化方法被提出,作为上述高成本复合方案的一种替代。其优势在于利用了密度泛函理论(DFT),使得模型能够扩展到较大体系而计算成本不会显著增加。该方法通过使用已知精确平衡结构的小片段来构建目标分子结构,并利用线性回归(LR)数据校正片段间的连接参数。此前,该方法已在中等至大型刚性分子体系(如多环芳烃)中证明了其有效性,并成功扩展到自由基和质子化物种。然而,其应用性主要是在刚性体系上进行了评估,对于含有应变环和/或构象柔性增加的分子,其性能尚不明确。为了填补这一空白,并探索该方法在更广阔化学空间中的应用界限,研究人员在《The Journal of Physical Chemistry A》上发表了这项研究。
研究人员开展此项研究,主要运用了计算化学中的多种技术方法。核心是“Lego-brick”(TM+LR)方法本身,该方法结合了模板分子(TM)校正和线性回归(LR)校正。计算主要在Gaussian16程序套件中完成,使用了rev-DSDPBEP86(revDSD)双杂化泛函结合jun-cc-pV(T+d)Z基组(简写为revDSD/junTZ)进行几何优化。为了评估平衡结构的准确性,将计算得到的平衡旋转常数与实验值进行比较。由于实验旋转常数对应于振动基态,因此有意义的比较需要将振动效应纳入计算值。研究人员采用二级振动微扰理论(VPT2),在B3LYP/jun-cc-pVDZ(B3/junDZ)水平计算了振动修正。研究还利用了半实验(SE)方法来确定部分分子的平衡结构,该方法结合了不同同位素体的实验(振动基态)旋转常数和计算的振动修正。此外,研究建立了一个化学多样性的基准数据集,包含50个物种(含构象体),涵盖三、四、五元环、六元环及双环化合物,并使用了大量已知SE平衡结构的片段进行模板构建。
研究结果
1. 三、四、五元环分子的性能评估
- •
三成员环分子:对于三成员环分子(如环氧乙烷衍生物),初始的revDSD/junTZ水平预测旋转常数的平均误差为0.69%。应用TM方法后,平均误差降至0.37%,但标准偏差略有增加。结合LR校正的TM+LR方法进一步将平均绝对误差降低至0.30%,最大误差为0.76%,标准偏差恢复到与初始DFT相近的水平(0.32%)。研究以内环氧丙醇(glycidol)为例进行了深入分析,发现其旋转常数对连接片段的二面角(如C7C3C2O1)极为敏感,这表明需要针对连接片段的二面角开发LR校正参数。
- •
四成员环分子:对于四成员环分子,TM+LR方法将初始revDSD/junTZ的平均误差(0.50%)显著降低至0.13%,约为初始误差的1/4。研究展示了如何使用开链片段(如二甲醚和甲烷)来模板化环状分子(如氧杂环丁烷和硫杂环丁烷),并取得了可靠结果,表明环化对结构参数的影响能够被初始DFT几何结构正确保留。
- •
五成员环分子:五成员环分子的结果与四成员环相似,TM+LR将平均绝对误差从初始的0.57%降至0.14%。研究利用TM+LR方法的准确性,帮助确认了四氢呋喃最稳定的构象是扭曲(C2)结构,而非弯曲(Cs)结构。对于乙内酰脲(hydantoin)及其开链前体乙内酰脲酸(hydantoic acid),使用相同片段(H2CO, NH3>, 甘氨酸)进行模板化也取得了令人鼓舞的结果,平均误差在0.15%至0.35%之间。
2. 更大环分子与复杂体系的应用
- •
六成员环与双环化合物:对于甲苯、咖啡酸等更大或更柔性的分子,TM+LR方法表现出色。例如,对于具有八个几何异构体的咖啡酸,TM+LR将旋转常数的平均偏差从~0.5%大幅降低至0.10–0.12%。即使只使用了部分SE结构(如丙烯酸)进行模板,也取得了显著改进。
- •
高柔性分子:对于阿司匹林和血清素这类具有多个构象体的高柔性分子,研究人员通过巧妙的片段组合(如阿司匹林使用苯、甲酸和甲酸甲酯;血清素使用苯、丙烯醛和乙胺)成功应用了TM方法。TM+LR预测的旋转常数与实验值偏差很小(阿司匹林<0.2%,血清素大多<0.1%),证明了该方法处理复杂柔性体系的潜力。
3. TM+LR在半实验(SE)结构确定中的应用
研究展示了TM+LR结构可以作为SE方法中不可确定参数的可靠估计。例如,对于亚甲基环丁烷和2-氮杂环丁酮,研究人员利用TM+LR结构固定了SE拟合中的部分参数,从而首次推导了它们的部分SE平衡结构(reSE)。结果表明,TM+LR结构与得到的SE结构在不确定性范围内非常吻合(键长差异在1-4 m?,角度差异约0.05°),而与传统取代法(rs)得到的结构差异则大得多(键长约10-12 m?,角度0.2-0.7°)。这凸显了TM+LR方法能以极低的计算成本提供可用于SE结构确定的可靠几何参数。
结论与意义
本研究系统评估了“Lego-brick”(TM+LR)方法在应变环和柔性环状分子中的应用性能。结果表明,尽管小环体系对该方法构成了挑战,但TM+LR方法总体上能显著改进初始DFT结果,将旋转常数的平均误差降低至初始值的1/4甚至更低,通常能达到优于0.1%的实验精度。当未能达到此典型精度时,原因通常可追溯到旋转常数对特定结构参数(尤其是连接片段的二面角)的高敏感性,这为未来方法的改进指明了方向。
本工作的意义在于:
- 1.
明确了应用界限:首次系统地将TM+LR方法的应用扩展到包含应变环和显著构象柔性的化学空间,明确了其在该类体系中的性能表现和当前局限。
- 2.
验证了方法的稳健性:证明了即使使用开链片段模板化环状分子,或仅使用部分SE平衡结构进行模板校正,TM+LR方法仍能带来实质性改进,展示了方法的灵活性和稳健性。
- 3.
促进了半实验方法的发展:证实了TM+LR几何结构足够精确,可作为SE方法中不可测定参数的可靠替代,从而能够在缺乏足够同位素数据的情况下,获得实验质量的平衡结构,推动了SE方法在更广泛体系中的应用。
- 4.
为处理复杂柔性体系提供了策略:通过针对阿司匹林、血清素等复杂分子的成功案例,为处理缺乏合适片段的较大柔性体系提供了可行的片段化策略。
- 5.
推动了计算化学实用化:该研究强化了TM+LR方法作为一种能够在保持高精度的同时,大幅降低计算成本、适用于中等至大型分子结构预测的实用工具的潜力,为计算光谱学和相关化学领域的研究提供了有力支持。