熔融盐中大型原子模型的机理分析：从机器学势预测到电子结构关联中文标题

《Advanced Science》：Mechanistic Analysis of Large Atomic Models of Molten Salt

【字体：大中小】 时间：2026年03月13日 来源：Advanced Science 14.1

编辑推荐：

　　这篇研究通过精细调控预训练的深度势能模型（DPA2），揭示了机器学习原子间势能（MLIP）预测与电子结构的内在关联。研究发现，模型输出的原子能量与特定能量区间的投影态密度（PDOS）高度相关，表明神经网络能够捕捉量子力学信息，其预测代表了有意义的物理化学相互作用。这项工作为构建可解释、可迁移的MLIPs提供了基于电子结构的通用策略。

熔融盐因其高能量密度、优异的热稳定性和强化学耐受性，已成为极端条件下金属分离的有效介质，并在聚变反应堆等先进应用中至关重要。其中，处理钨等难熔金属尤其困难，而电化学方法利用熔融Na₂WO₄作为电解质是目前制备高性能钨涂层的主流技术。分子动力学（MD）模拟是揭示熔融盐微观机制的有力工具，但钨熔融盐体系缺乏精确高效的原子间势能模型，阻碍了基础理解和实际应用。机器学习原子间势能（MLIPs）结合了第一性原理计算的精度与经典分子动力学的效率，已成为材料建模的重要推动力。其中，大规模原子模型如DPA2通过多任务学习策略展现了优异的泛化能力和预测精度，其核心优势在于预训练与微调范式：先在广泛多样的数据集上训练通用模型以学习可迁移的表征，再通过特定任务进行微调。

尽管深度势能模型在多个领域广泛应用，但其在复杂离子体系中的具体应用以及其原子能量预测的物理化学含义目前仍缺乏充分的探索和清晰的理解。本研究以熔融Na₂WO₄为代表体系，利用其从头算分子动力学（AIMD）数据对一个预训练的DPA2模型进行微调，并与使用相同架构从头训练的模型进行系统比较。如图1所示，该工作不仅评估了这种迁移学习方法的有效性，更揭示了模型预测的原子能量与电子结构，特别是在表现出高电子密度和独特原子局部环境的能量区域的投影态密度（PDOS）之间存在强相关性。这表明模型学习了结构与能量之间有意义的物理关系，而非表面的统计关联，并为开发可解释的机器学习势能和对密度泛函理论（DFT）总能的更深入理解提供了新视角。

在方法上，本研究首先使用CP2K生成训练数据，然后在DeepMD-kit框架中进行模型训练，并利用LAMMPS进行后续的分子动力学模拟。投影态密度（PDOS）分析则通过Multiwfn完成。初始AIMD构型由Packmol生成，包含五个Na₂WO₄单元，密度为3 g/cm³。原子间势能采用经范德华修正的PBE泛函在DFT层面进行评估。所有元素（Na、W、O）均使用具有双ζ价极化（DZVP）质量的MOLOPT基组。AIMD模拟在1173 K的NVT系综中进行。为了验证结论的普适性，还在相同计算条件下模拟了额外的Na₂WO₄-WO₃（3:1比例）以及含40个原子的NaCl-KCl熔融盐体系。对于深度势能建模，采用了来自DPA2框架的预训练模型DPA-2.3.0-v3.0.0b4-medium，该模型在28个不同的数据集上进行了预训练。为了评估预训练模型的有效性，本文还采用了相同架构但不引入任何先验知识的、从头训练的模型进行比较。

实验部分首先评估了预训练模型与从头训练模型的预测性能。通过对验证集上平均绝对误差（MAE）和标准差（STD）的分析，发现预训练模型在两个体系（Na₂WO₄和Na₂WO₄-WO₃）的MAE和STD指标上均优于从头训练的模型。具体而言，对于Na₂WO₄，能量MAE从0.1378降至0.0710 eV，力MAE从0.0737降至0.0556 eV/?，预测精度显著提升。在标准差分析上，模型预测的标准差与DFT参考值更为接近，这表明模型探索了更广阔的特征空间，揭示了过拟合程度。能量标准差的误差（相对于DFT参考）在预训练后从0.011提升至-0.0016 eV，有量级上的改善。标准差的显著降低强烈表明过拟合得到缓解，意味着微调模型捕捉到了更多真实的物理特征，而非仅仅记忆训练数据。这些结果共同证实，与从头训练相比，预训练能产生精度和泛化能力显著增强的模型。

在分子动力学模拟性能方面，对Na₂WO₄-WO₃混合物在1173 K下使用预训练模型进行了模拟。如图2a所示，预训练模型产生了更稳定的能量轨迹，系统快速达到平衡。相比之下，从头训练的模型表现出缓慢的向下漂移，表明弛豫不完全。两种模型的总能之间存在约100 eV的系统性偏移，这可能是原子能量预测的累积误差所致。图2b比较了两种模型的W-O键径向分布函数（RDF）。在短程（r<2 ?）范围内，RDF几乎相同，表明对主要W-O成键环境描述一致。但在更远距离上，差异开始显现：从头训练的模型产生更宽的峰，反映了其捕捉中程结构有序性的精度较低。这些结果共同证明了预训练模型在预测精度和动态稳定性上的优越性。因此，本文后续的所有模拟均基于预训练模型。

在讨论部分，研究利用上述训练的模型深入探讨了其能量预测的底层机制。通过分析DPA2模型的输出，发现其原子能量预测与每个原子在选定能带内的积分投影态密度（PDOS）存在强相关性。为说明这一点，研究分别从模型的训练集和验证集中随机选取一帧进行详细分析。同时，还在NaCl-KCl熔盐体系上训练模型并进行相同分析，以进一步验证所观察到的关系。

DPA2模型通过多阶段过程计算总能：首先通过神经网络将原子坐标和元素类型嵌入到描述符中，然后通过拟合网络映射单个原子的能量贡献。图3a展示了用于后续分析的Na₂WO₄分子结构。系统的总能量最终通过求和所有原子的能量贡献得到。每个原子的能量又由两项相加而成：一项是训练前的平均能量（源于通过最小二乘法对所有训练结构能量进行统计拟合得到的元素参考能量），另一项是相互作用能（由训练后的模型通过考虑每个原子在环境中的影响而产生）。值得注意的是，本文分析的原子能量排除了各自元素的平均能量值，因为只有相互作用能是代表邻近原子影响并反映系统物理性质的有趣项。

态密度（DOS）从分子轨道角度提供了对局域电子环境的基本描述，本质上表征了特定原子周围电子的可用量子态分布。为了探究元素特异性特征并与机器学习模型输出的原子贡献建立直接联系，研究将DFT计算得到的总DOS分解为单个原子的贡献（投影DOS，即PDOS）。这种原子分辨分析使我们能够直接比较模型的输出与底层电子结构，从而检验预测的原子贡献是否在局部化学环境中具有可验证的物理基础。

主要结果总结于图3。图3a展示了DPA2模型训练数据集中随机选取构型对应的Na₂WO₄体系总态密度（TDOS）。通过将Kohn-Sham轨道投影到目标组分对应的原子基函数上，然后对贡献进行求和，获得了该分子和特定原子的投影态密度。图3b,c展示了一个Na₂WO₄分子的态密度、两个体系中Na原子的态密度以及真空环境中Na、W、O的态密度，并对每个峰的轨道特征进行了归属。如图中蓝色虚线箭头所示，对同种元素的每个原子在特定能带上的DOS曲线进行积分，得到的积分值与模型对该原子的输出值显示出强相关性，如紫色虚线箭头所强调。图3e,f说明了该体系中Na1和Na2积分所使用的能量范围。

图4a-c突出了该帧中每个元素对应的积分区域，而图4d-f展示了这些区域的放大视图。定义这些积分区域的能量范围是通过迭代过程手动选择的，目的是使中心化后的积分PDOS值与中心化后的负模型输出值对齐，从而最小化这两个量之间的差异，并反映模型预测的预期含义。图4g-i显示了积分值以及模型输出的负值。这两个量的中心化结果展示在图4j-l中。研究将此分析扩展到验证集和NaCl-KCl熔盐体系，如图4m-r所示，所有体系都表现出良好的一致性。具体来说，图4a展示了训练集中Na原子的原始PDOS数据，图4d展示了积分范围的放大视图，图4g呈现了原始积分值与模型输出负值，最后，图4j说明了这两个数据集归一化后的结果。经过广泛研究，发现在DOS相对较高的轨道附近的积分值与模型输出的负值在中心化后表现出显著的一致性。对于验证集和NaCl-KCl体系，关于积分范围和相应模型输出的详细信息在补充材料中提供。

观察到的模型预测原子能量与特定能量范围内的PDOS积分之间的相关性，可以通过比较体系真实的物理DFT能量与DPA2模型产生的能量来合理化。如前所述，DPA2被训练来预测相互作用分量，即随原子构型和成键而变化的那部分能量。根据分子轨道理论，DFT能量由整个电子结构系统的电子密度决定，电子密度是所有分子轨道的组合，其中前线轨道，如最高占据分子轨道（HOMO）和最低未占分子轨道（LUMO），能够影响系统的相互作用和性质。在此背景下，PDOS提供了分子轨道结构的局域投影。至关重要的是，在费米能级附近的能量窗口内对PDOS进行积分，有效地量化了原子在这些前线轨道中的电子密度，而这些前线轨道是化学键和反应性的主要决定因素。如图4d-f中的蓝色区域所示，模型成功的根源在于其隐含地关注了这些轨道中PDOS在同种原子间变化最显著的子区域，而不是关注基本不变的全轨道特征。这使得模型能够将前线电子密度的细微变化与相互作用能的变化联系起来。观察到的强相关性揭示了一个基于物理的机制：在键合敏感的前线态中具有更高电子占据的原子，对相互作用能贡献更负（即更具稳定化作用）。这些发现表明，仅基于原子坐标进行训练的模型，已经内化了前线轨道理论的一个关键原理：前线轨道的局域占据决定了原子间相互作用能。前线轨道理论是理解化学相互作用机制的最重要理论之一，我们的工作证明了模型的描述符确实捕捉到了关键轨道的基本性质，并与反应总能建立了直接关系。因此，我们的解释框架本质上是通用的，可以成功地扩展到任何原子间相互作用由局域电子结构决定的分子或凝聚相体系。这为跨不同化学空间构建物理可解释的机器学习势能提供了稳健的策略。

总之，本分析提供了详细的数值证据，表明模型在将原子坐标和元素类型映射到DFT相互作用能时，学习到的是具有物理意义的表征，而非依赖统计相关性或产生任意输出。模型预测与环境敏感能量窗口内的PDOS积分之间的强烈对应关系表明，模型隐式编码了支配原子间相互作用的电子结构的关键特征，尽管其训练仅基于结构和能量数据。所建立的相关性为模型精炼开辟了新途径，例如通过引入对局域化学环境敏感的电子结构特征作为监督信号，这可能比单独使用总能量提供更基于物理的学习目标。最终，通过将模型预测的原子相互作用与PDOS衍生量联系起来，这项工作加深了我们对神经网络如何从原子几何重构DFT级能量的理解。这种理解为未来开发更精确的模型铺平了道路，这些模型最终可为实验设计和分析提供可靠的理论原理和预测指导。

热点排行

新闻专题