一种新颖的图学习框架,用于实现可解释且能处理数据不平衡问题的金融欺诈检测

《Engineering Applications of Artificial Intelligence》:A novel graph learning framework for interpretable and imbalance financial fraud detection

【字体: 时间:2026年01月08日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  提出了一种面向金融欺诈检测的谱图学习框架,通过可学习的多阶谱滤波器动态调节局部结构敏感性,结合基于标签分布和结构重要性的动态邻域采样策略缓解不平衡问题,并引入自监督对比学习增强行为模式区分度。摘要:针对金融欺诈检测中存在的极端不平衡数据、复杂结构伪装和可解释性不足三大挑战,提出不平衡感知的IFDetector框架,融合多阶谱图学习、结构自适应采样和聚类自监督对比学习,实现高精度欺诈检测与谱响应可解释性分析。

  
卢俊豪|徐秋鹏|胡建明
海南大学数学与统计学院,海口,570228,中国

摘要

金融欺诈对现代金融系统构成了严重威胁,因此准确检测欺诈行为至关重要。在现实世界系统中,由于欺诈活动极为罕见,以及存在诸如交易拆分和结构伪装等对抗性行为,检测金融欺诈仍然极具挑战性。这些因素导致了类别不平衡和图噪声,为在高风险金融应用中部署基于人工智能的可靠解决方案带来了重大障碍。特别是,许多现有方法缺乏可解释性,进一步限制了它们的实际应用范围。为了解决这些问题,我们提出了一个考虑不平衡因素的可解释金融欺诈检测器,这是一种专为不平衡和对抗性金融场景定制的新型谱图学习框架。该框架集成了一种可学习的多阶、节点自适应谱滤波器,能够动态调节频率响应,使模型在保持全局可解释性的同时检测到细微的局部扰动。为了更好地表示少数类节点,我们引入了一种动态邻域采样策略,根据标签分布、结构中心性和特征相关性自适应地重新加权邻近信息。此外,我们还引入了一个考虑聚类的自监督对比学习模块,通过将用户与相似的行为模式对齐来增强节点嵌入的鲁棒性和区分能力。在三个公开的金融欺诈数据集上的实验表明,该模型的性能优于12种先进模型,并提供了多种内置的可解释性形式,包括谱响应分析、节点特征重要性和空间-谱理论一致性。

引言

随着全球经济的快速数字化,金融交易变得越来越复杂,金融欺诈对系统稳定性和公众信任构成了日益严重的威胁(Sun等人,2023年)。根据《2024年关于职业欺诈和滥用的国家报告》1,全球因欺诈造成的损失超过31亿美元,其中22%的案例损失超过100万美元。
金融欺诈的日益增长的威胁使得高效准确的检测对于维护金融系统的稳定性至关重要(Cheng等人,2025年)。传统的机器学习方法(Papastefanopoulos等人,2025年;Zhang等人,2025a年)已被用于检测欺诈行为,但它们往往难以捕捉实体之间的复杂关系。金融交易自然形成了图结构数据,其中包含多个实体和相互依赖的链接,这些链接揭示了直接联系和隐藏的关联,例如欺诈团伙。图神经网络(GNNs)能够建模高阶和非线性关系,为准确和可扩展的欺诈检测提供了有前景的方法(Motie和Raahemi,2024年;Tong等人,2025年)。
挑战1.尽管标准GNNs具有强大的表达能力,但它们难以准确识别那些在正常用户中隐藏自己的欺诈用户。这种行为伪装可能导致模型错误分类欺诈节点,从而降低检测的可靠性(Song等人,2025年)。图1突出了现实世界交易网络中的三个关键问题。首先,检测机制的可解释性仍然有限。其次,当欺诈者通过合法用户建立间接链接时,会发生长距离的结构伪装。例如,u1u6通过u2u5相连,基于邻接关系的检测器难以捕捉到这种关联。第三,欺诈用户通过模仿正常交易模式来进行行为伪装。例如,u6在合法用户中混迹,使得难以区分伪装后的欺诈行为和真实活动。这些因素,加上极端的类别不平衡,限制了传统GNN方法的有效性,阻碍了准确的异常检测(Xie等人,2025年)。
挑战2.在高风险金融系统中,仅靠准确的检测是不够的;提高GNNs的透明度和可解释性是必不可少的(Zhen等人,2025年)。虽然GNNs在建模高阶关系方面表现出色,但它们的黑箱性质限制了信任度和实际应用(Phan等人,2023年)。当前的研究主要沿着空间和谱域展开。如图2所示,空间方法沿图邻接关系传播特征,有效地捕捉了局部结构,但难以建模长距离依赖性。相比之下,谱方法利用图拉普拉斯频率分解来捕捉多尺度结构特征,并提供了更强的理论可解释性。然而,仍然缺乏一个统一的框架,使得传播机制部分不透明。Chen等人(2023年)表明,空间和谱方法可以通过线性、多项式和有理聚合函数统一起来,为揭示传播行为和谱响应提供了基础。在此基础上,一个统一的、具有谱透明性的图学习框架可以提高检测准确性和可解释性,满足高风险金融应用的需求。
贡献。为了解决金融图中欺诈检测的多方面挑战,我们提出了IFDetector,这是一种考虑不平衡因素且具有可解释性的金融欺诈检测器。IFDetector引入了一种基于图拉普拉斯的多阶可学习谱滤波器,能够对局部结构扰动进行自适应敏感。过滤后的表示通过节点级门控机制进一步细化,有效抑制噪声并增强特征区分能力。为了缓解类别不平衡,邻域采样策略根据标签分布、结构中心性和特征相似性调整采样权重。表示学习与分类分离,聚类感知的自监督对比学习方法增强了行为相似用户之间的内部一致性,捕捉了异质性和伪装。IFDetector构建在一个统一的空间-谱GNN框架内,通过频率响应分析和特征重要性评估提供了理论可解释性,支持透明和可靠的欺诈检测。
我们的贡献总结如下:
  • 我们提出了一种基于Bernstein多项式的节点自适应谱图过滤框架,具有可学习的谱权重,能够实现多频率响应建模和内在的谱可解释性。
  • 为了解决金融图中的类别不平衡问题,我们设计了一种考虑结构的自适应采样策略,结合了标签分布、节点特征和邻居拓扑,改善了少数类节点的表示。
  • 我们引入了一个考虑聚类的自监督学习框架,以处理高异质性和伪装问题,结合了结构对比学习和群内一致性,并将表示与分类分离。
  • 我们在真实的金融欺诈数据集上验证了IFDetector,证明了其优越的检测性能,并提供了关于模型可解释性和节点表示的详细见解。
本文的其余部分组织如下。第2节回顾了相关工作。第3节介绍了初步概念和符号。第4节介绍了提出的方法论。第5节报告了实验和性能比较。第6节讨论了结果和意义。最后,第7节总结了本文并概述了未来研究的潜在方向。

章节片段

用于异常检测的图神经网络

欺诈检测长期以来一直是一个活跃的研究领域,早期的方法依赖于统计方法和经典机器学习技术,如Fisher判别分析(Mahmoudi和Duman,2015年)、决策树(Papastefanopoulos等人,2025年)和支持向量机(Singh等人,2022年)。当特征被精心设计且分布假设成立时,这些方法表现良好。深度学习(Ranganatha和Syed Mustafa,2025年;Xie等人,2024年)进一步

初步

本节介绍了多关系不平衡图的关键概念。我们还简要描述了本工作解决的主要问题。

方法论

本节介绍了IFDetector框架,该框架由四个核心模块组成:样本重建、特征编码、自监督建模和欺诈检测。如图3所示,该框架从双层采样策略开始,结合了标签感知的样本平衡器和K-means邻居采样器来构建具有代表性的子图,以减轻类别不平衡和节点伪装。节点自适应谱编码器利用多阶Bernstein多项式

实验

为了评估IFDetector的有效性,我们从四个关键角度对多个金融图数据集进行了全面实验:性能比较、消融分析、鲁棒性和计算效率。这些实验旨在解决以下研究问题,全面评估IFDetector在金融欺诈检测中的能力:
  • RQ1:IFDetector与最先进的基线相比表现如何?
  • RQ2:这些是什么

关于IFDetector在T-Finance上的可解释性讨论

可解释性在金融异常检测中起着至关重要的作用。在这项工作中,我们从三个角度强调了我们方法的透明度:首先,通过识别哪些节点特征对检测结果贡献最大;其次,通过分析模型在训练过程中的谱响应演变来揭示其频率选择行为;第三,通过提供基于图神经网络理论的空间域解释,将谱视图和空间视图联系起来

结论

本文提出了一种用于金融欺诈检测的可解释不平衡样本检测器,解决了数据不平衡问题。我们引入了一种考虑结构的子图采样策略来提高少数类样本的识别能力,并采用了一种节点自适应的多阶Bernstein编码器来增强模型的表示能力和透明度。我们使用了一种聚类感知的自监督对比学习机制来区分伪装用户和正常用户的行为。

CRediT作者贡献声明

卢俊豪:撰写 – 审稿与编辑、撰写 – 原稿、验证、软件、方法论、概念化。徐秋鹏:撰写 – 原稿、可视化、软件。胡建明:撰写 – 审稿与编辑、验证、监督、项目管理、资金获取、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号