基于潜在扩散Transformer的镍基单晶高温合金连续成分空间微观组织生成

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Materials Research and Technology》：Microstructure generation of Ni-based single-crystal superalloys across continuous composition spaces via a latent diffusion transformer

【字体：大中小】 时间：2026年06月06日 来源：Journal of Materials Research and Technology 6.2

编辑推荐：

　　在镍基单晶高温合金中，γ′析出相微观组织对成分的显著敏感性，加之多元成分空间的高维连续性，使得通过实验建立成分-微观组织映射关系变得不可行。本研究中，研究人员基于Ni-Al-Mo体系的相场模拟数据，开发了一种成分条件化潜在扩散Transformer（Compo

在镍基单晶高温合金中，γ′析出相微观组织对成分的显著敏感性，加之多元成分空间的高维连续性，使得通过实验建立成分-微观组织映射关系变得不可行。本研究中，研究人员基于Ni-Al-Mo体系的相场模拟数据，开发了一种成分条件化潜在扩散Transformer（Composition-Conditioned Latent Diffusion Transformer, CCLDT），用于在连续成分空间内实现微观组织图像的广义生成。CCLDT建立在潜在扩散模型（Latent Diffusion Model, LDM）框架之上，以扩散Transformer（Diffusion Transformer, DiT）作为去噪骨干网络。通过优化其成分条件化机制，CCLDT在已知成分和未知成分下的平均Intra-FID分数分别达到11.31和18.70，展现出学习生成映射中的优越视觉保真度。此外，对于每个物理统计描述符，超过75%的数据点显示出低偏差：具体而言，γ′体积分数的绝对误差低于0.02，自相关函数（Autocorrelation Function, ACF）的相对误差低于6%，从而验证了模型在连续成分空间内的强物理一致性。重要的是，CCLDT凸显了Mo的主导作用及其与Al的协同交互效应，这与基于晶格错配和能量平衡考虑的物理分析一致。此外，Intra-FID与物理指标的一致性证明了其在微观组织评估中的有效性。据研究人员所知，本工作首次将基于DiT的潜在扩散模型应用于镍基单晶高温合金，实现了从连续成分空间到微观组织的生成映射。

镍基单晶高温合金具有典型的两相微观组织，由有序γ′析出相（L1?结构）分布于无序γ基体（面心立方结构，FCC）中，这赋予了其优异的高温蠕变抗力，因此被广泛应用于高压涡轮叶片和导向叶片等关键热端部件的制造。γ′相对成分变化高度敏感，其体积分数、形貌和平均尺寸等微观组织特征的变化直接决定了材料的高温力学性能，包括蠕变和疲劳抗力。将微观组织特征融入机器学习模型——如γ′相的统计特征（体积分数等）、两点相关函数以及通过深度学习提取的高阶形态学表征——已被证明能显著提升材料力学性能预测的准确性和鲁棒性。然而，镍基高温合金领域缺乏具有充分成分覆盖的高质量微观组织数据集，这成为制约高保真性能预测模型发展的主要瓶颈。因此，建立成分-微观组织映射关系至关重要，尤其考虑到成分空间的高维连续性。无论是实验还是模拟，穷举探索这一空间均因成本高昂和复杂度大而不可行。生成模型通过构建可扩展的映射关系，为快速预测和多样化生成未知成分下的微观组织提供了有前景的解决方案，但其有效性高度依赖于高质量且具有统计代表性的训练数据。相场模拟广泛用于模拟析出和粗化行为，能提供具有高度参数保真度的物理一致微观组织，基于这些数据集训练的生成模型可内嵌显式物理先验，构成物理信息深度学习（Physics-Informed Deep Learning, PIDL）的稳健形式。

去噪扩散概率模型（Denoising Diffusion Probabilistic Models, DDPMs）因在微观组织生成中训练稳定、生成质量高而成为当前研究前沿。Lee等首次将DDPM应用于微观组织重建，验证了其在六种不同形态合成材料上的泛化性。后续研究成功将无条件DDPM应用于实验微观组织图像生成。Düreth等展示了基于多类显微镜图像的条件DDPM生成。为探索DDPM在未知条件下的预测能力，代表性工作将处理和成像条件编码为离散分类变量，虽对预定义类别的离散组合有效，但无法捕捉参数空间的内在连续性，限制了固定层级间的插值。Ikeda和Ma等证明了使用多个物理参数作为连续条件输入进行微观组织生成的可行性，但其条件编码方法依赖简单重复或前馈网络映射，未能充分提取条件信息或捕捉 QR码参数间交互作用，限制了模型的整体表征能力。

在镍基单晶高温合金这一特定领域，仍存在两个关键空白：其一，DDPM尚未应用于基于连续成分变量的微观组织预测；其二，现有基于DDPM的微观组织生成框架在计算效率、去噪骨干设计和多元连续成分向量的条件编码方面存在结构性局限。针对这些问题，研究人员采用Ni-Al-Mo三元体系作为简化但具有物理代表性的多元系统，以平衡相场模拟中的计算复杂度和物理精度。该体系中，Al控制γ′析出，Mo作为关键γ强化元素调节晶格错配和弹性相互作用，且两者存在关键协同效应，便于系统研究成分-形貌关系。基于该体系，研究人员开发了CCLDT模型。

CCLDT的核心技术方法包括以下关键要素：首先，采用基于相场模拟的高保真微观组织数据集作为基础，通过热力学计算确定Ni-Al-Mo成分空间内的目标成分，利用Li等开发的大势能框架结合Thermo-Calc热力学数据库（TCNI10）和动力学数据库（MOBNI5）进行相场模拟，获得223个成分点对应的512×512灰度微观组织图像，经裁剪增强后得到11,150张256×256图像；其次，构建自相关约束自编码器（Autocorrelation-Constrained Autoencoder, ACC-AE），引入自相关损失函数以保持原始微观组织的空间相关性，实现像素空间到潜空间的压缩与重建；再次，设计自注意力成分编码器（Self-Attention Composition Encoder, SA-CE），为Ni、Al、Mo三种元素分配可学习的256维嵌入向量，经原子分数加权并通过可学习温度参数缩放后，与全局[CLS]标记拼接，经自注意力机制处理获取全局成分信息；然后，采用DiT-S/1架构（12个DiT块，潜空间patch大小为1）替代传统U-Net作为去噪骨干，以块独立前馈网络（Block-Independent Feed-Forward Network, BI-FFN）替换原始共享前馈网络，将成分条件注入每个DiT块；最后，训练阶段采用Min-SNR-γ权重策略平衡不同时间步的预测难度，推理阶段采用去噪扩散隐式模型（Denoising Diffusion Implicit Models, DDIM）采样算法加速采样，并通过分类器无关引导（Classifier-Free Guidance, CFG）优化生成质量，以Intra-FID、LPIPS、sFID、Precision、Recall等感知指标以及γ′体积分数、ACF曲线、粒子面积和纵横比分布等物理统计描述符进行综合评估。

研究结果显示，ACC-AE的训练和验证损失曲线在训练后期保持稳定且高度重叠，表明模型已收敛且无显著过拟合。在无噪声条件下，Pixel MAE、Autocorr和LPIPS均接近0，SSIM接近1；当潜变量施加噪声时，各项指标仍保持满意水平，表明ACC-AE学习的潜空间具有鲁棒性。消融研究表明，SA-CE模块带来的性能提升最大，将平均Intra-FID降低5.57（相对降低28%）；BI-FFN替换共享FFN可降低4.37（23%）。最优CFG尺度确定为2.5，在此设置下Intra-FID较基线显著改善。在已知成分下，平均Intra-FID为11.31，all-pairs LPIPS为0.37，sFID较高（与文献报道现象一致），平均Precision和Recall分别为0.62和0.75；在未知成分下，平均Intra-FID为18.70，all-pairs LPIPS为0.34，平均Precision和Recall分别为0.57和0.70。视觉比较显示，模型准确合成了从球形到立方体、从稀疏到致密分布、从周期到随机空间模式等多种全局形态和空间分布，并能捕捉和再现代表性及稀少的局部形态细节。

通过DensMAP非线性降维可视化分析，真实和生成样本在潜空间中均形成三个明显聚类，且生成样本紧密围绕真实数据分布，显示出高度的分布一致性。三个聚类分别为：低中Al-中高Mo聚类（LM-Al/MH-Mo）、中高Al-高Mo聚类（MH-Al/H-Mo）和中高Al-低Mo聚类（MH-Al/L-Mo）。即使在固定某元素含量情况下，另一元素的微小变化（如0.005原子分数）即可导致聚类归属的改变，表明成分与微观组织间存在高度非线性和敏感的关系。模型在不同成分区域准确捕捉了微观组织规则性的系统差异：LM-Al/MH-Mo微观组织表现为各向同性和各向异性特征的混合，Mo含量较高时γ′相沿?100?方向择优排列形成迷宫状分布；MH-Al/H-Mo微观组织空间规则性最高，呈现精细γ′析出相的棋盘格状排列；MH-Al/L-Mo微观组织则显示 emerging anisotropic 特征，非球形析出相呈稀疏无序分布，且随Al含量增加γ′析出相尺寸显著增大。

在未知成分下的生成质量评估表明，对于绝大多数成分，Intra-FID、all-pairs LPIPS、Precision和Recall在成分空间内的分布保持可比性，证明了模型优异的插值泛化能力。然而，部分边界成分（如Ni-19.1Al-3Mo、Ni-19.6Al-2Mo、Ni-20.1Al-1.5Mo）因γ′体积分数极高、析出相粗化且空间排列无序，Intra-FID超过20，LPIPS接近0.48；外推成分Ni-20.6Al-1Mo的Intra-FID急剧增至45以上，伴随析出相合并和几何畸变，这与形态依赖的生成难度增加及样本覆盖有限有关。

物理统计一致性评估表明，对于已知和未知成分，超过75%的成分在各描述符上表现出低偏差：γ′相体积分数绝对误差低于0.02（即2个百分点），ACF曲线的NAAD低于6%，粒子面积的QRD（分位数相对偏差）低于4%，纵横比的QRD低于15%。在未知成分Ni-17.6Al-7Mo、Ni-16Al-8Mo和Ni-17.6Al-2Mo上，生成微观组织在ACF曲线和二维快速傅里叶变换（2D-FFT）功率谱方面与真实结构高度一致，准确捕捉了等间距峰、第二峰位置、网格状离散亮点、弧状晕环以及十字形条纹等关键频谱特征。粒子面积和纵横比分布的比较显示，各代表性成分的Q₁、Q₂、Q₃分位数相对偏差均低于20%，低阶分位数偏差甚至低于6%。对于外推成分Ni-20.6Al-1Mo，虽然ACF曲线保持良好一致性，但粒子面积分布出现显著偏差，生成结构中粗化γ′析出相过度代表，导致纵横比偏差增大。

在讨论部分，研究人员从数据驱动和物理机制两个角度分析了元素对微观组织的调控机制。SA-CE提取的[CLS]嵌入在二维DensMap空间中呈规律性变化，形成三个与潜空间聚类结果一致的聚类，Mo含量沿特定方向逐渐增加。Mo到无条件表示的距离与Mo含量呈显著正相关，表明Mo在塑造微观组织形态中的关键作用。自注意力权重矩阵可视化显示，Mo从全局[CLS]和单个元素表示中获得最高的平均注意力权重，即使在低Mo区域亦然，说明其重要性不限于高Mo成分。物理机制上，Mo添加增大了γ/γ′两相间的晶格错配度（δ），驱动γ′析出相从球状向立方体转变，同时增强析出相间的弹性相互作用，促使分布从各向同性随机向?100?方向择优排列转变。Al对Ni的注意力分配呈现不对称模式，与已知的元素分配行为一致：Al优先分配至γ′相，Ni则为γ基体的主要组成元素。

通过有效界面能（effective interfacial energy, S_eff）量化界面能与弹性应变能的竞争关系，研究人员发现Mo含量增加时，δ的变化主导了S_eff的演变。当S_eff不可忽略时，其变化主要受δ调控，从而决定微观组织形态。对于Al的单独影响，在Al富集、Mo贫乏区域，γ′体积分数的增加和δ的轻微降低共同作用，导致S_eff的非单调变化，进而引起析出相排列周期性的显著非单调趋势。Al含量对微观组织的影响通过γ′体积分数和晶格错配度两个耦合途径调节S_eff实现，但这一影响与Mo含量密切相关，体现了Al与Mo在调控微观组织形态中的关键协同机制。

在生成评估指标与物理统计误差的一致性方面，Intra-FID与各物理统计误差的Spearman秩相关系数ρ_s在0.35至0.50之间，表现出一致的中等正相关，表明其捕捉多维形态信息而非受单一物理描述符主导。sFID与物理统计误差的相关性始终低于Intra-FID。All-pairs LPIPS与体积分数、面积和ACF曲线误差相关性较强，但与纵横比误差的相关性弱（ρ_s=0.2）且缺乏统计显著性（p=0.1），对粒子形状敏感度低。Precision和Recall与物理统计误差的一致性也较低。通过构建Intra-FID等级与综合物理统计指标等级的混淆矩阵分析，对角线元素之和为85，表明两者在质量评估中具有良好的一致性和鲁棒性。

研究结论总结如下：CCLDT为镍基单晶高温合金的成分-微观组织生成提供了定制化的条件化策略，在LDM框架内以DiT为骨干，实现了生成性能提升和计算效率优化，SA-CE和BI-FFN模块分别以仅2.5%和6%的边际计算开销将平均Intra-FID降低28%和23%；对于已知成分，CCLDT在感知和物理统计评估中均实现高保真度，生成微观组织与真实微观组织强一致且保持充分多样性；更重要的是，CCLDT对训练期间未见成分具有良好的泛化能力，平均Intra-FID和LPIPS分别为18.7和0.34，生成微观结构在不同有序化程度下保持空间统计特性，超过75%成分的ACF曲线NAAD低于6%；SA-CE在改进成分表示的同时提供了成分-微观组织关系的可解释性，自注意力分析揭示了Mo的主导作用及其与Al的强烈协同效应，独立物理分析表明界面能和弹性应变能的竞争（主要由晶格错配度控制并受γ′体积分数影响）决定了γ′析出相的尺寸、形状和空间分布，Mo对晶格错配的较强影响与其在注意力分析中的突出地位一致；Intra-FID与多种物理统计指标呈中等一致性，证实了其在微观组织评估中的有效性，All-pairs LPIPS对空间分布特征更为敏感但和与粒子形状相关性较低，可作为互补指标。虽然模型在成分空间内表现出稳健的插值能力，但部分边界和外推成分附近的生成质量仍有提升空间，这主要受样本覆盖有限和形态依赖的生成难度增加影响。未来工作可引入物理信息描述符和物理引导建模策略，以改善稀疏采样区域的性能，并支持更广泛和稀疏采样成分空间的应用。

联系信箱：

粤ICP备09063491号

热点排行