短键评估方法：快速评估深度神经网络势函数模型泛化能力的新策略及其有效性验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Computational Materials》：Short bond evaluation method for rapidly assessing the generalization ability of deep neural network potential function models and its effectiveness verification

【字体：大中小】 时间：2026年01月18日 来源：npj Computational Materials 11.9

编辑推荐：

　　本文针对深度神经网络势函数(DNNP)模型泛化能力评估成本高、效率低的问题，提出了一种基于短键分析(SBEM)的快速评估方法。研究人员通过对比自洽场标记评估法(SCFEM)在多个复杂反应体系中的验证实验，证实SBEM能以极低计算成本有效筛选性能不佳的模型，显著加速模型训练迭代过程，为分子动力学模拟领域提供了可靠的评估工具。

在材料科学、物理化学和生物分子模拟等领域，基于第一性原理计算的分子动力学(MD)模拟已成为研究物质微观行为的重要工具。然而，传统的第一性原理分子动力学(FPMD)由于计算复杂度高（与原子数N呈O(N³)至O(N⁶)关系），难以模拟大体系或长时间尺度的过程。深度神经网络势函数(DNNP)模型通过结合第一性原理数据的精度和经典力场的计算效率，为这一困境提供了突破口。但DNNP模型的训练和优化面临严峻挑战：如何快速、可靠地评估模型在远超训练样本空间的泛化能力？当前主流的自洽场标记评估法(SCFEM)虽精度高，但计算成本巨大，尤其当模型产生不合理结构时，SCF计算可能无法收敛或耗时极长，严重制约了模型迭代效率。

针对这一瓶颈问题，昆明理工大学真空冶金国家工程研究中心的陈秀敏研究员团队在《npj Computational Materials》上发表了题为"Short bond evaluation method for rapidly assessing the generalization ability of deep neural network potential function models and its effectiveness verification"的研究论文。该研究创新性地提出了短键评估方法(SBEM)，基于Lennard-Jones(LJ)势原理，通过统计分子动力学模拟结构中原子间距过近（短键）的数量来快速评估模型性能。该方法的核心思想是：合理的分子结构应遵循基本的物理规律，原子间距不应显著低于平衡距离；若模拟结果中出现大量短键，则表明模型预测偏离物理实际，泛化能力不足。

研究方法上，团队选取了两个典型复杂反应体系（sys-A气相链反应和sys-B气液固多相反应）作为研究对象。通过DeepMD-kit软件训练DNNP模型，在不同训练步长下保存中间模型构成待评估模型集。利用LAMMPS软件进行分子动力学模拟生成泛化空间验证集(GSS)，分别采用SBEM和SCFEM对模型性能进行评估对比。SBEM通过设定短键距离阈值（本文统一设为1.0 ?，低于系统中任意两元素平衡距离r_e），统计模拟结构中短键数量；SCFEM则通过VASP软件进行自洽场计算，获取能量的根均方误差(RMSE)作为评估基准。

模型训练与筛选

研究团队在模型训练过程中定期保存中间模型，形成sys-A的16个模型（A1-A16）和sys-B的15个模型（B1-B15）。通过损失函数阈值（0-9 meV）和TSS验证集RMSE阈值（0-5 meV）筛选后，最终保留sys-A的8个模型（A9-A16）和sys-B的8个模型（B8-B15）进入泛化能力评估阶段。

GSS验证集生成

针对每个保留模型，研究团队设置了NVT、NVE和NPT三种系综的分子动力学模拟任务，采样间隔为0.1 ps，总模拟时间为1 ns，生成包含101帧结构的GSS验证集。部分模型在模拟过程中出现错误导致采样不足，这些结果仍被保留用于方法验证。

SBEM与SCFEM指标计算

SBEM计算了每个GSS验证集的短键相关指标：短键帧数(SBFrameNum)、短键总数(TotalSBNum)和帧平均短键数(MeanSBNum)。SCFEM则计算了模型预测能量与SCF标记值之间的RMSE(SCF_e_rmse)。实验结果显示，当TotalSBNum非零时，SCF_e_rmse通常较大（10^-1-10²eV量级），显著高于TSS验证集的RMSE（10^-3eV量级），表明SBEM能有效识别性能不佳的模型。

模型能力指标对比分析

通过绘制不同步长模型的MeanSBNum和SCF_e_rmse变化曲线（图6系列），研究发现两个指标在多数任务中呈现一致趋势，特别是在高样本量的NVT任务中，峰值点对应相同模型。帧级详细指标分析显示，短键数量(SBNum)与SCF能量绝对偏差(SCFErr AD)在时间演化上具有高度一致性，Pearson相关系数|R|>0.8的任务占52%，0.5<|R|≤0.8的占30%，证实了SBEM与SCFEM在评估模型性能上的等效性。

成本效益分析

SBEM在计算成本上展现巨大优势：短键提取平均每帧耗时0.2-0.5秒，而SCF标记耗时167-5129秒，两者时间成本相差3-4个数量级。硬件配置上，SBEM仅需2核CPU/4GB内存，SCFEM则需要64核CPU/256GB内存，资源成本相差约48倍。特别值得注意的是，性能差的模型产生的结构更不合理，导致SCF计算时间更长，因此用SBEM预筛选差性能模型可实现超线性成本节约。

研究结论表明，短键评估方法(SBEM)具有必要但不充分的特点：短键存在能可靠指示模型性能差，但短键缺失不保证模型性能优。尽管如此，SBEM在快速筛选差性能模型方面表现卓越，能显著降低DNNP模型训练过程中的评估成本。该方法基于LJ势原理，具有良好的普适性和可转移性，适用于不同化学体系的模型评估。未来研究可探索SBEM在模型结构设计和反馈学习策略等训练环节的更深层次应用。

本研究通过严谨的实验设计和系统的对比分析，证实了SBEM作为一种高效、低成本的DNNP模型评估工具的实际价值，为分子动力学模拟领域的模型优化提供了新的技术路径，对推动材料设计、药物开发等领域的模拟研究具有重要意义。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号