专家混合神经网络用于计算伽马射线积累因子

【字体: 时间:2026年03月08日 来源:Annals of Nuclear Energy 2.3

编辑推荐:

  辐射屏蔽设计中,传统 buildup因子计算方法在原子序数高元素吸收边附近存在精度与效率平衡难题。本研究提出基于MLP的混合专家(MoE)神经网络回归框架,通过残差连接增强模型表征能力,利用ANSI标准数据构建训练集,涵盖0.015-15 MeV能量及40倍平均自由程渗透深度。模型在VisualDose集成后,较VISIPLAN和SuperMC展现更优泛化性能,实现高精度连续预测。

  
杨子慧|孙一航|张恒|陈冲|莫子文|顾志星|李涛生|余杰
中国科学院合肥物质科学研究院,中国安徽省合肥市,230031

摘要

在辐射屏蔽设计和计算中,点核积分方法是常用的剂量估算技术,该方法依赖于积累因子来考虑散射效应。传统的积累因子计算方法在平衡准确性和效率方面存在困难,尤其是在处理吸收边缘附近的急剧变化时。本文提出了一种基于多层感知器(MLP)并加入残差连接的专家混合(MoE)神经网络回归框架。该框架利用MLP作为专家,建立从输入参数(原子序数、入射光子能量、质量衰减系数、穿透深度、吸收边缘能量等)到输出积累因子的非线性映射关系。残差连接的引入增强了模型的表示能力和训练稳定性。通过利用专家协调机制,MoE框架能够精确捕捉不同能量和元素下积累因子的复杂非线性变化,实现对不连续性的准确描述。训练数据集是根据ANSI/ANS-6.4.3-1991标准构建的。比较结果表明,该模型的预测结果与ANSI标准数据吻合良好。该框架已集成到辐射剂量评估软件VisualDose中,并与点核代码VISIPLAN和蒙特卡洛代码SuperMC进行了对比,显示出良好的泛化能力。该框架能够连续预测不同元素和能量下的积累因子,提高了剂量估算的准确性,同时保持了计算效率,展现了其潜在的应用价值。

引言

在辐射屏蔽计算中,评估γ射线的剂量至关重要;然而,这一过程通常很复杂,且依赖于大量的物理参数数据。引入积累因子可以简化这一计算过程。积累因子作为一种校正因子,其基本定义是:对于能量为E的入射光子穿过具有线性衰减系数μ的介质并达到穿透深度x时,由散射和二次辐射产生的总剂量(或曝光量、能量通量)与仅由未碰撞光子产生的剂量之比。
White在1950年首次提出了积累因子的概念(White, 1950),用于描述Co-60 γ射线在水中的穿透情况。此后,积累因子的计算逐渐成为研究的重点。1954年,Goldstein使用矩方法计算了γ射线的积累因子(Taylor, 1954);Taylor则是第一个提出使用基于实验数据的经验公式来预测简单屏蔽材料中积累因子的人。1986年,Kucuk(Harima等人,1986)开发了一种基于G-P拟合公式和等效原子序数(Zeq)的抛物线插值方法,能够预测任意元素和轻质混合物中点γ射线的积累因子。1991年,美国核学会(ANS)采用了G-P拟合公式,为23种元素和3种混合物在0.015–15 MeV范围内的积累因子提供了数据。然而,这一标准已经几十年没有更新,需要修订以反映最新的研究进展和实际应用需求。随后,Kucuk在2008年和2010年提出了使用广义前馈神经网络(GFFNN)来预测0.03–15 MeV能量范围内的积累因子,深度可达10个平均自由路径。最近,Chen等人(2021)应用反向传播神经网络(BPNN)预测了0.015–15 MeV范围内的积累因子和最大40个平均自由路径的穿透深度。不过,该论文并未详细说明训练数据集是否包含了特定能量区域的高Z元素的积累因子数据。此外,Chen等人(2023)提出了使用Extra Trees(ET)模型从ANSI标准数据库中学习积累因子数据并构建回归模型。然而,文献中指出,这种方法在低能量(<0.1 MeV)深度穿透场景中的适用性可能受到壳层边界附近截面不连续性的限制。Wang等人(2026)提出了一种基于集成机器学习的高精度γ射线积累因子预测模型,通过整合多种模型的优势显著提高了预测准确性和泛化性能。Chen等人(2026)引入了一种基于条件生成对抗网络(cGAN)和U-Net的生成重建替代模型,用于预测多组光子屏蔽参数场,解决了传统点核方法和ANSI数据库的局限性。该模型利用多组光子通量数据预测复杂的光子屏蔽参数场,验证结果表明该方法具有高准确性和可行性。
积累因子数据库大致可以分为三类:低原子序数元素、高原子序数元素和混合物。对于低原子序数元素,积累因子随能量和穿透深度平滑变化,呈现规律性的增减趋势;而高原子序数元素则表现出完全不同的特性:当光子能量接近K吸收边缘时,衰减系数和积累因子急剧上升,穿过K吸收边缘后突然下降,导致明显的不连续性。这种剧烈变化给基于神经网络的高Z元素数据预测带来了挑战。
为了解决这个问题,本文提出了一种基于多层感知器专家混合神经网络的回归模型。利用MoE的结构优势,该模型提供了一个统一的框架,能够同时拟合低Z元素、高Z元素和混合物。此外,还引入了吸收边缘参数作为输入特征,以增强对不同能量和穿透深度下已知和未知曝光积累因子的预测能力。该模型覆盖了0.015 MeV到15 MeV的能量范围和最大40个平均自由路径的穿透深度,数据集特别包括了靠近吸收边缘的高Z元素的积累因子数据。实验结果验证了所提出方法的可行性和有效性。
本文的其余部分安排如下:第2节描述了神经网络方法的理论背景;第3节介绍了数据来源和预处理过程;第4节展示并分析了实验结果;第5节对本文进行了总结。

模型和方法

随着深度学习的快速发展,专家混合模型逐渐成为解决回归问题的重要方法之一。MoE模型最初由Jacobs等人(1991)提出,其核心思想是引入多个子模型(专家网络),并通过门控网络根据输入特征动态选择最合适的专家。这种机制使模型能够有效处理复杂任务和异构输入。

训练数据集和预处理

本研究使用ANSI/ANS-6.4.3-1991中的积累因子数据作为数据集,数据集包含五个特征变量和一个目标变量。数据集包括23种元素:Be、B、C、N、O、Na、Mg、Al、Si、P、S、Ar、K、Ca、Fe、Cu、Mo、Sn、La、Gd、W、Pb和U,以及三种混合物:水、混凝土和空气。穿透深度范围从0.5个平均自由路径(mfp)到40个mfp,共有16个离散点;能量范围从15 keV到15 MeV,共有25个离散点。

神经网络训练和结果分析

本研究采用了第2节中提出的MoE神经网络架构,该架构由八个专家组成,每个专家实现为一个两层残差多层感知器(Residual MLP)。门控网络采用Top-2策略选择最相关的专家,并通过softmax归一化结合它们的输出。训练过程中,损失函数定义为log-cosh,同时使用Adam优化器和余弦退火算法以及重启调度器来动态调整参数。

结论

本研究开发了一种MoE神经网络,用于提高γ射线积累因子的预测准确性和可解释性。该模型整合了多个专家子网络,以捕捉材料和能量依赖的特性,并采用门控网络进行自适应输出组合。在涵盖不同原子序数材料的扩展数据集上进行训练后,该框架的性能优于传统的回归模型和单一网络模型。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。

致谢

本研究得到了安徽省小型反应堆和微型反应堆技术重点实验室开放项目计划(编号:SMRT-25-07)、四川省应用核技术重点实验室(成都理工大学)的开办基金、HFIPS主任基金(编号:YZJJ202403-CX)以及中国科学院的战略优先研究计划(编号:XDA0410000)的支持。我们感谢机构共享中心的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号