利用监督机器学习方法,在Fermi-LAT 4FGL-DR4中的非关联源中识别伽马射线脉冲星候选体

《Astroparticle Physics》:Identification of gamma ray pulsar candidates in the Fermi-LAT 4FGL-DR4 unassociated sources using supervised machine learning

【字体: 时间:2026年01月28日 来源:Astroparticle Physics 2.9

编辑推荐:

  本研究利用随机森林和极端梯度提升树算法,对费米-LAT 4FGL-DR4目录中的2,257个未关联源进行分类,旨在识别伽马射线脉冲星候选者并探讨数据平衡方法的影响,为高能天体物理研究提供新见解。

  
A. Pathania|K.K. Singh|S.K. Singh|A. Tolamatti|B.B. Singh|K.K. Yadav
印度孟买Bhabha原子研究中心天体物理科学部,邮编400 085

摘要

自2008年8月以来,Fermi伽马射线太空望远镜上的大面积望远镜(LAT)一直在持续提供高质量的全天高能范围(从30 MeV到500 GeV及以上)的调查数据。通过对Fermi-LAT数据的全面分析,陆续发布了多个伽马射线源目录。最新的第四版Fermi-LAT伽马射线源目录(4FGL-DR4)基于前14年的观测数据(能量范围为50 MeV-1 TeV),包含了7195个源。其中大约33%的源在较低能量波段没有已知的对应体。这类高能伽马射线源被称为未关联或未识别的源。将这些对象正确分类为已知的伽马射线源类型(如活动星系核或脉冲星)对于群体研究和多波段观测以探测辐射过程至关重要。在这项工作中,我们使用两种监督机器学习技术——随机森林(Random Forest)和极端梯度提升(Extreme Gradient Boosting)对4FGL-DR4目录中报告的未关联源进行了详细分类。我们主要关注利用Fermi-LAT的长期观测数据得出的不同特征来识别新的伽马射线脉冲星候选体,并探讨了数据平衡方法对Fermi-LAT未关联源分类的影响。

引言

Fermi伽马射线太空望远镜于2008年8月的发射在不到二十年的时间里彻底改变了高能天体物理学领域[1],[2]。随着时间的推移,高能伽马射线源的数量及其类型大幅增加,基于Fermi数据已经发布了多个连续的目录[3],[4],[5],[6],[7],[8],[9]。迄今为止发布的所有Fermi伽马射线源目录(FGL),依次命名为0至4FGL,主要由两类源组成:活动星系核和脉冲星。未关联源(在其他波段没有对应体的源)的数量也持续增加。最新的Fermi合作组织数据发布(4FGL-DR4)使用了2008年8月4日至2022年8月2日期间大面积望远镜(LAT)在50 MeV-1 TeV能量范围内的14年全天观测数据,报告了7195个源[10]。在4FGL-DR4目录中的7195个源中,有2428个被认为是未关联的,即它们的性质在任何其他能量或频率范围内都未知。在连续的Fermi-LAT目录中,最主要的源群体是外星系源,特别是活动星系核或类星体。第二大类源是脉冲星,主要分布在银河系内。
脉冲星是快速旋转的强磁化中子星(表面磁场强度在108到1014 G之间),它们在整个电磁波谱范围内发射脉冲状的非热辐射[11]。脉冲周期从几毫秒到几秒不等[12],[13]。根据脉冲或旋转周期,脉冲星被分为毫秒脉冲星和普通/典型脉冲星[14]。旋转周期小于30毫秒的毫秒脉冲星也被称为再生脉冲星,被认为是较老的源,具有较弱的磁场。普通或非再生脉冲星具有至少30毫秒的脉冲周期,相对较年轻。脉冲星主要通过无线电观测来探测,方法是寻找无线电闪烁[15],第一颗脉冲星是在1967年的一项射电天文学项目中发现的[16]。自这一发现以来,根据澳大利亚望远镜国家设施(ATNF)定期发布的目录,迄今已探测到3500多颗脉冲星[1]。最新的第三版脉冲星目录(3PC)基于Fermi-LAT的12年高能伽马射线观测数据,报告了大约340颗伽马射线脉冲星和候选体[17]。这仅占已知脉冲星总数的不到10%。图1显示了通过无线电观测探测到的脉冲星群体与Fermi-LAT脉冲星目录中报告的伽马射线脉冲星之间的比较。由于脉冲星磁层是弱的光学发射体,只有少数脉冲星在光学波段被观测到,而在X射线波段也有几十颗被观测到[18]。已知的伽马射线脉冲星群体几乎由毫秒脉冲星和年轻脉冲星平分[17],[19],[20]。这标志着Fermi-LAT在脉冲星天文学领域的重大贡献,因为在2008年发射之前,只有五颗伽马射线脉冲星(由EGRET [21]发现)。伽马射线脉冲星的光曲线是稳定的,其能谱(由Fermi-LAT测量)显示出曲率。在几GeV能量处需要添加一个指数截止[10],[13]。在这个能量以上,谱线下降非常快,使得用地基伽马射线望远镜难以探测到GeV-TeV能量的脉冲星。因此,在极高能量范围内仅探测到少数脉冲星[13],[22]。脉冲星的高度规律性脉冲或光曲线允许将不同时期的信号叠加,从而提高了在无线电和伽马射线波段的探测概率[17]。
由于脉冲星大多位于银河平面上,它们是探测强电磁场下的物理和天体物理学不同方面的绝佳对象和强大工具,包括辐射过程[23]、恒星演化[24]、暗物质[25]和基础物理[26]。脉冲星观测也被用作不同天体物理实验中的潜在工具,例如用于低频引力波探测的脉冲星定时阵列[27]、核天体物理学中的中子星状态方程[28]、广义相对论的检验[29]等。因此,搜索脉冲星对于脉冲星群体的统计研究、它们的物理性质、分类以及探测基础物理非常重要。然而,由于需要以非常高的时间分辨率解析窄脉冲,脉冲星搜索在计算上非常昂贵。基于机器学习和人工智能的算法被广泛用于根据伽马射线或其他波段的观测特征来识别Fermi-LAT未关联源[30],[31],[32],[33],[34],[35],[36],[37],[38]。Fermi-LAT探测到的源根据光谱特征和位置精度进行了表征。Mirabal等人(2016年)利用第三版Fermi-LAT目录(3FGL)[6]中报告的光谱测量结果,通过使用监督机器学习分类器在3FGL未关联源中识别出脉冲星候选体,并发现现有脉冲星群体合成模型可以容纳34个额外的候选体[39]。Finke等人(2021年)使用全连接深度神经网络和循环神经网络,根据Fermi-LAT的光子能谱和时间序列测量结果,将4FGL-DR2目录中报告的未关联源分类为活动星系核和脉冲星[40]。Germani等人(2021年)使用一组人工神经网络,根据脉冲星或类星体子类的可能性来表征4FGL-DR2未关联源[41]。Balakrishnan等人(2021年)提出了一个半监督生成对抗网络,用于在4FGL-DR2未关联源中更有效地识别脉冲星候选体[42]。在本研究中,我们使用监督机器学习(随机森林和极端梯度提升)将4FGL-DR4未关联源分类为脉冲星和类星体,重点识别伽马射线脉冲星候选体。本文的结构如下:第2节简要描述了监督机器学习技术。第3节描述了使用的数据集。第4节详细讨论了结果。最后,第5节总结了这项研究。

部分摘录

监督机器学习

基于人工智能的方法,包括机器学习,正成为科学研究中增值高级数据产品的常见手段,应用于检测、分类和回归等不同领域[43]。它通过训练或利用可用信息来解决问题。机器学习是指使用计算机算法和模型从输入数据中学习并进行预测的方法。

数据集和处理

随着全天调查的持续进行,LAT源的数量稳步增加,未关联源大约占总数的三分之一(图2)。在最新的4FGL-DR4目录(版本gll_psc_v34.fit)中,报告了7195个伽马射线源[10]。所有这些源进一步被划分为24个子类,并根据不同波长的相关时间特征或位置重合性被标记为已识别或关联的[38]。在本研究中,我们...

结果与讨论

我们使用上述基于RF和XGB的二分类模型将最新4FGL-DR4目录中的2200多个未关联源分类为脉冲星和活动星系核。下面描述了分类器的性能、不同输入特征在分类中的重要性以及未关联源分类的结果。

结论

在这项工作中,我们为Fermi-LAT合作组织发布的最新4FGL-DR4目录中的2257个高能伽马射线源建立了两个基于RF和XGB的二分类器。本研究的结果表明,大部分伽马射线脉冲星候选体包含在现有的未关联源群体中。本研究的重要发现总结如下:
  • 在可用的150多个特征中...

CRediT作者贡献声明

A. Pathania:撰写——原始草稿、正式分析、数据管理、概念化。K.K. Singh:撰写——审阅与编辑、方法论、概念化。S.K. Singh:正式分析、数据管理。A. Tolamatti:正式分析、数据管理。B.B. Singh:资源支持。K.K. Yadav:监督。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

我们感谢两位匿名审稿人提出的非常有见地的建设性评论,这些评论极大地帮助科学上改进了手稿的内容。本研究广泛使用了ATNF脉冲星目录(Manchester等人,2005年)。我们还要感谢Fermi科学支持中心(FSSC)公开提供的数据。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号