基于复杂网络特征的链上庞氏骗局可解释风险预测模型

【字体: 时间:2026年03月14日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  区块链庞氏骗局检测中,本文提出基于复杂网络特征的ERPMS可解释性模型,通过构建时序图提取多尺度网络特征,结合集成学习与SHAP解释,实现99.77%的准确率,揭示高价值密度、自动拆分洗钱及中心收割边网络结构特征。

  
廖斌|周涛|张涛|李敏
贵州财经大学大数据与统计学院,中国贵阳550025

摘要

随着区块链技术和加密货币的普及,链上的庞氏骗局变得越来越猖獗,对数字金融生态系统的安全构成了严重威胁。尽管现有的检测模型在性能上有所提升,但它们往往缺乏可解释性,无法满足监管机构和实际应用对透明度的要求。为了解决这一差距,本研究提出了一种可解释的链上庞氏骗局风险预测模型,该模型整合了复杂的网络特征。首先,基于原始的链上交易数据构建了一个有向加权时间图,以提取多尺度的网络结构和行为特征。其次,采用随机过采样技术来解决极端类别不平衡的问题,并构建了一个基于堆叠的集成学习模型。实验结果表明,在严格的非泄露评估设置下,所提出的模型实现了99.77%的准确率、97.34%的精确度、92.96的F1分数和97.01的曲线下面积(AUC),显著优于主流的基线方法。最后,通过引入Shapley Additive解释(SHAP)进行可解释性分析,研究发现庞氏骗局节点表现出低成本的操作模式,其特征是“高价值密度”和“自动化分割洗钱”在交易行为中,同时在拓扑结构上显示出“非同配混合”特征,表现为极端单向的资金流动和“中心收割边缘”的掠夺性机制。

引言

近年来,金融技术的快速发展推动了区块链技术在金融交易和资产管理中的广泛应用。作为一种去中心化、防篡改且高度透明的分布式账本,区块链不仅实现了虚拟资产的安全点对点转移,还为“价值互联网”(Tapscott和Euchner,2019;Wood和Buchanan,2015)奠定了基础。然而,这种变革性技术也带来了新的安全风险。特别是在监管体系不完善的背景下,链上的欺诈活动变得越来越多样化且隐蔽,成为威胁数字金融生态系统安全的重要来源。
在各种类型的链上金融欺诈中,庞氏骗局(Artzrouni,2009)是最典型和最具破坏性的例子(Moore等人,2012;Neisius和Clayton,2014),通过承诺“无风险的高回报”成功欺骗了大量投资者(Jacobs和Schein,2011;Cunha等人,2013)。如图1所示,庞氏骗局的本质是一种金字塔式的非法筹款活动,它依赖于新投资者的持续资金流入来支付给前期投资者的回报,且没有任何真正的盈利模式。一旦新投资者的流入放缓或资金链断裂,系统就会立即崩溃,导致大量投资者遭受重大损失。
与传统模型相比,基于区块链的庞氏骗局通过加密货币和智能合约迅速积累资金,隐藏真实身份,并具有更高的隐蔽性和可扩展性。实际上,这些骗局已经造成了巨大的损失(Vasek和Moore,2018)。2020年,中国政府捣毁了著名的Plus Token项目,该项目涉及超过2亿注册用户,控制的加密资产价值超过600亿美元(Zhang等人,2023)。类似的欺诈案件频繁发生,例如美国的Madoff丑闻、阿尔巴尼亚的非法筹款浪潮、哥伦比亚的DMG和DRFE项目以及芬兰的Wincapita骗局(Hofstetter等人,2018;Rantala,2019;Carvajal等人,2009;Deason等人,2015)。这些骗局在全球范围内造成了数亿美元的财务损失,影响深远(Kim,2022)。目前,学术界和业界都对链上庞氏骗局的检测进行了广泛研究。在这些研究中,机器学习方法展现了强大的异常检测能力,并逐渐成为金融反欺诈的主要技术手段(Viji等人,2024;Dhanka等人,2023),涵盖了结构图挖掘(Fu等人,2018)、机器学习(Onu等人,2023)、异常检测(Jin等人,2022)和图神经网络(Jiang和Tsai,2025)等技术方法。通过结合账户行为分析、字节码和操作码提取,这些方法实现了庞氏风险地址的自动化识别(Chen等人,2021;Feng等人,2024;Fan等人,2021)。尽管检测性能不断提高,现有方法通常存在两个关键瓶颈:首先,过度依赖个别账户的静态特征,缺乏对交易网络全局结构的系统建模;其次,算法的“黑箱”问题,即模型决策过程的缺乏透明度,这使得难以满足金融监管机构对可解释性和审计性的实际要求。
鉴于此,本研究提出了ERMPS(基于复杂网络特征的链上庞氏骗局可解释风险预测模型),旨在准确识别欺诈性的链上庞氏交易。具体而言,我们利用公共区块链数据构建了一个复杂的有向图。通过结构分析,提取了一整套局部和全局网络特征。随后,采用多种主流机器学习模型对地址的庞氏风险进行分类。在确保高预测性能的同时,本研究引入了SHAP框架来提供分类器决策过程的可解释性分析。我们的分析表明,庞氏骗局节点倾向于使用简化脚本进行资金转移,交易量极少;它们的高频率、小金额分布特征证实了自动化分割洗钱策略。此外,网络拓扑表现出极端单向流动模式和强烈的非同配性——核心节点倾向于与众多低度外围节点连接——直观地描绘了一种金字塔式的“中心收割边缘”掠夺性结构。

相关工作

近年来,随着区块链技术的快速发展,链上的庞氏骗局变得越来越猖獗,对投资者资产的安全构成了严重威胁,并给监管系统带来了重大挑战(Cortés等人,2016)。为了解决链上庞氏骗局的自动化识别问题,学术界逐渐开发了多种技术方法,主要包括交易行为分析、智能合约的静态分析以及网络分析

ERMPS模型框架设计

ERMPS模型的整体构建过程如图2所示。核心组成部分包括图结构建模和多尺度特征提取、ERMPS模型训练与集成以及链上行为特征解释。每个组成部分的详细信息如下。

数据收集和标签获取

为了识别和建模链上庞氏骗局,本文以比特币平台作为研究对象,系统地整合了2020年1月1日至2025年6月1日的链上交易数据。该数据集涵盖了多个公共数据平台和相关文献中的注释数据(Xiang等人,2023;Nerurkar等人,2021;Liu等人,2021a;Monaco,2015;Chang和Svetinovic,2018;Zola等人,2019;Liu等人,2021b;Greaves和Au,2015),具体细节详见

实验环境和评估指标

为了确保实验的可重复性和准确性,建立了严格的实验环境配置。表3详细列出了本研究中使用的具体硬件和软件规格。值得注意的是,为了减轻图数据分析中普遍存在的结构数据泄露问题,采用了基于社区的划分策略。具体来说,使用了Louvain算法进行社区检测(分辨率参数为γ=1.0以及一个固定的随机种子

行为特征分析

为了深入理解模型的不透明决策机制并验证提取特征的实际意义,本节引入了SHAP框架,从三个维度全面解构ERMPS模型:全局特征贡献、特征交互和微观个体决策路径。

结论

准确预测链上庞氏骗局对于维护数字金融生态系统的安全和保护投资者权益至关重要。针对现有研究在结构特征挖掘、严格评估机制和模型可解释性方面的局限性,本研究提出了一种基于复杂网络特征的链上庞氏骗局可解释风险预测模型(ERMPS)。
基于2020年1月1日至

CRediT作者贡献声明

廖斌:撰写——审稿与编辑、方法论、资金获取、概念化。周涛:撰写——初稿、可视化、方法论、调查、形式分析、数据整理。张涛:验证。李敏:监督。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了贵州省基础研究计划(自然科学)(项目编号:MS[2025]226)和2024年贵州省研究生研究基金(项目编号:2024YJSKYJJ262)以及贵州财经大学人才引进研究启动项目(项目编号:2023YJ26)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号