一种基于机器学习的在线电子重建方法，在CLAS12上进行应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computer Physics Communications》：A machine learning based approach to online electron reconstruction at CLAS12

【字体：大中小】 时间：2026年01月30日 来源：Computer Physics Communications 3.4

编辑推荐：

　　在线电子重建方法研究基于机器学习与多探测器信号融合的电子识别技术，在CLAS12实验中实现超过75%纯度及近100%效率的实时分析，为高能物理实验的数据流读取模式转型奠定基础

R. Tyson|G. Gavalian

托马斯·杰斐逊国家加速器设施，美国弗吉尼亚州纽波特纽斯，23606

摘要

在线重建是高能物理和核物理实验中用于监测和实时分析的关键技术。重建算法的一个重要组成部分是粒子识别，该过程结合了粒子通过多个探测器组件时留下的信息来确定粒子的类型。对于像CLAS12这样的电产生核物理实验来说，电子识别尤为重要，因为它用于触发数据记录。本文为CLAS12开发了一种机器学习方法，通过结合来自多个探测器组件的原始信号来重建和识别电子。这种方法实现了超过75%的电子识别精度，同时保持了接近100%的效率。这些机器学习工具能够以高于数据采集速率的速度运行，从而实现实时电子重建。这项工作增强了在线分析和监测能力，并有助于改进CLAS12的触发机制。这种基于机器学习的方法对于那些旨在转向流式读出操作的实验也至关重要，在这些实验中，在线重建将成为数据采集范式的一个关键组成部分。

引言

高能物理和核物理实验产生的数据量不断增加，需要高效地进行实时处理以确保数据保存。通常，这依赖于基于硬件和物理要求的增量触发机制来过滤数据。在线监测和实时分析也是高能物理和核物理实验操作中的关键要素，因为它们确保实验提供高质量的数据。在线重建和粒子识别方案对于触发、在线数据选择和实时分析至关重要。这些方案旨在处理来自多个探测器组件的原始信号，以确定哪些原始粒子通过了粒子探测器及其特性。

使用机器学习（ML）进行在线重建具有吸引力，因为其处理速度能够跟上数据采集速度。最近的研究探索了在CEBAF大型接受谱仪（CLAS12）中使用卷积神经网络（CNNs）[1]、[2]进行电子触发，以提高电子触发精度[1]。参考文献[3]、[4]展示了如何在ATLAS触发器中使用神经网络来提高电子识别能力，从而将背景水平降低一半。在LHCb的高级触发器中也采用了诸如提升决策树这样的机器学习算法[5]。参考文献[6]中，使用神经网络从微图案气体探测器数据中准确重建了轨迹的顶点。参考文献[7]展示了如何通过使用神经网络从漂移管中去除噪声，并用第二个网络识别击中相对于漂移管线的路径侧来改进紧凑型μ子螺线管（CMS）的μ子识别。在本文中，我们将描述如何实现CLAS12的在线电子重建。与之前的方法相比，这里提出的程序不仅能够识别电子的存在，还能完全重建所有必要的信息，以便进行实时分析和物理反应识别。

连续电子束设施（CEBAF）位于托马斯·杰斐逊国家加速器设施（JLab）[8]、[9]。CEBAF向JLab的四个实验大厅提供能量高达11 GeV的电子束，并计划在未来几年内将束流能量提高到12 GeV。CLAS12探测器位于B厅，旨在进一步加深对强子结构和量子色动力学的理解[10]。图1显示了CLAS12的示意图。CLAS12探测器几乎覆盖了完整的方位角范围，通过前置标记器实现了低极角覆盖（2.5-5°），通过前置探测器实现了前角覆盖（5-35°），并通过中央探测器实现了大极角覆盖（35-125°）[10]、[11]。前置探测器进一步划分为六个方位角扇区。通过使用前置标记器跟踪器中的轨迹与前标记器径迹仪中的击中事件的重合，可以检测到散射角非常小的电子，从而区分电子和光子[11]。由于背景低且探测器装置简单，前置标记器中的电子检测和识别相对直接。中央探测器不进行电子识别。在前置探测器（FD）中，电子重建是一个更为复杂的过程，将是本文讨论的重点。

CLAS12的在线重建将有利于改进在线监测、实时分析和触发机制。2023年，CLAS12实验首次迈出了实现完全在线重建的步伐，在在线操作中重建了来自FD漂移室的轨迹[12]。这一点特别有益，因为CLAS12当时正在进行双目标实验，轨迹重建使得可以监测来自两个目标的电子产生情况。这种在线轨迹重建基于CLAS12已经融入离线重建的机器学习跟踪技术，某些通道的跟踪效率提高了多达50%，计算时间减少了约30%[13]、[14]、[15]。在这些AI预测的轨迹基础上，后续的神经网络能够以高分辨率预测轨迹的动量和角度[16]。这避免了昂贵的轨迹拟合过程，允许在在线数据采集操作期间生成重建轨迹。然而，这些轨迹并未被识别为属于特定类型的粒子，因此无法用于更高级的分析或触发。如前所述，将CNN应用于电子触发被证明是一种有前景的改进触发方法[1]。然而，参考文献[1]中推荐的实现方式只能识别电子的存在，而无法将其分配到特定轨迹并完全重建它。此外，与更简单的神经网络相比，CNN的速度相对较慢。

本文将介绍一种用于CLAS12的完全在线电子重建的概念验证算法。简单快速的多层感知器（MLP）[17]类型算法将结合到在线轨迹重建算法中，以便根据CLAS12子系统的信息来识别电子。第2节将简要描述本文中使用的机器学习算法。第3节将更深入地介绍CLAS12的离线电子重建。第4节将描述如何将轨迹与后续探测器子系统中的击中事件关联起来，以及如何利用这些信息来识别电子。第5节将描述进一步测试，展示这些算法在在线电子重建方面的良好性能。第6节将介绍对训练样本的改进，使得在线电子识别效率接近100%。第7节将给出简要的结论和展望。

章节摘录

深度学习概述

深度学习算法（如神经网络）因其多功能性、良好的性能和高预测率而在机器学习应用中非常受欢迎。有许多流行的软件包和库可用于实现深度学习算法。由于CLAS12重建框架基于Java [18]，因此本文使用了基于Java的DEEP NETTS [19]库。

多层感知器是由相互连接的节点组成的前馈神经网络

CLAS12前置探测器中的离线电子重建

CLAS12前置探测器（FD）中的电子重建涉及多个不同的探测器，如图1所示。FD漂移室（DC）可以重建带电粒子（特别是电子）的动量和角度[21]。然后可以将这些轨迹及其相关的动量与其他CLAS12探测器中的击中事件关联起来[18]。CLAS12高阈值切伦科夫计数器（HTCC）通过要求至少产生两个光电子来作为电子识别的 veto

CLAS12前置探测器中的在线电子重建

CLAS12 FD中用于离线电子重建的几种传统算法速度太慢，无法在线使用。参考文献[12]详细介绍了如何实现机器学习轨迹查找和轨迹修复算法以生成在线重建中的轨迹。去噪算法速度太慢，无法在线使用，但可以通过消除避免轨迹重叠的要求来达到相同的轨迹效率。使用卡尔曼滤波器拟合轨迹是一种

验证

如第4节末尾所述，应基于CLAS12数据中的所有负粒子来测量在线电子识别算法的精度和效率。为了尽可能公平地估计精度，离线电子识别的唯一限制是电子的顶点必须限制在目标位置周围的合理范围内。为了避免效率低下的来源之间的混淆，需要比较在线和

提高电子识别效率

另一种识别电子的方法是观察那些与中性粒子具有较小极角距离的负粒子。这些电子是在电子产生地和电子与光子被检测到的量热器之间的某些材料中辐射出光子时产生的（

e^{?} \to e^{?} γ

）。图16显示了负粒子和中性粒子之间的方位角差异（Δ?）作为极角差异（Δθ）的函数。

结论与展望

在本文中，我们展示了如何基于CLAS12数据采集操作中最近整合的在线轨迹重建技术，实现CLAS12前置探测器的完全在线电子重建[12]。第一个神经网络允许将轨迹与CLAS12量热器中的击中事件关联起来。然后将来自量热器和与轨迹相关的高阈值切伦科夫计数器的信息传递给后续的神经网络

CRediT作者贡献声明

R. Tyson：撰写——原始草稿、可视化、验证、软件、方法论、资金获取、正式分析、数据管理、概念化。G. Gavalian：撰写——审稿与编辑、监督、软件、资源管理、项目协调、方法论、资金获取。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

联系信箱：

粤ICP备09063491号

摘要

引言