基于长短期记忆网络和多层感知器混合模型的多标签财务报表欺诈检测
《Engineering Applications of Artificial Intelligence》:Multi-label financial statement fraud detection based on long short-term memory and multilayer perceptron hybrid model
【字体:
大
中
小
】
时间:2026年02月15日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
检测财务报表欺诈的传统二分类方法无法全面识别多类型关联欺诈行为。本文提出LSTM-MLP多标签检测框架,整合时序特征与跨欺诈类型关联分析,并设计Top-K阈值策略优化标签输出。实证研究表明该方法在真实中国数据集上优于传统模型,可解释性分析揭示了资产虚增与利润操纵的关联特征,同时验证了欺诈类型多样性对公司退市风险的影响。
陈振松|陈浩|刘彦欣|史勇
中国北京首都经济贸易大学管理与工程学院
摘要
检测财务报表欺诈行为至关重要,因为它关系到经济秩序、公众信任和法律责任。然而,现有研究通常将其视为一个二元分类问题,而忽视了不同类型欺诈行为之间的关联信息。为了解决这个问题,我们提出了一个多标签财务报表检测框架,以识别所有不同类型的欺诈行为,包括利润虚增、资产虚增、虚假陈述、披露延迟和重要信息遗漏。在所提出的框架中,我们将长短期记忆网络(LSTM)与多层感知器(MLP)相结合,有效地捕捉了不同类型欺诈行为之间的时间依赖性和关联性。此外,我们采用了可解释性技术来分析各种欺诈行为与不同财务特征之间的差异和联系。在中国真实数据集上的实证结果表明,所提出的多标签分类框架是有效的,其性能优于传统的二元分类模型,并且在类别不平衡的情况下仍保持稳健性。此外,我们提出了一种新颖的Top-K阈值策略,其核心思想是根据对欺诈行为严重性的初步评估来确定涉及的特定欺诈类型。总体而言,这项研究通过引入多标签分类框架并进行彻底的可解释性分析,为财务报表欺诈检测领域做出了贡献。这一进展不仅为审计人员和监管机构提供了更具针对性的调查工具,也有助于更全面地理解财务欺诈的机制。
引言
财务报表欺诈被视为一种特殊的欺诈行为。它涉及故意歪曲财务信息和故意虚假陈述财务报表,以欺骗报表的使用者(Van Wyk 2014)。鉴于当前全球经济环境,利益相关者正在加大力度预防和检测欺诈行为。这是对近年来观察到的欺诈行为增加趋势的自然反应(Sabau 2012;Achakzai和Peng 2023)。例如雷曼兄弟、安然和泰科国际等公司的财务欺诈事件,对全球经济、金融市场和投资者造成了深远的不利影响。根据注册会计师协会(ACFE)2020年的报告,财务报表欺诈是职业欺诈领域中成本最高的类别,平均损失金额为954,000美元。在以往的财务报表欺诈检测研究中,它通常被视为一个二元分类问题(Kirkos等人2007;Zhou和Kapoor 2011;Huang等人2017;Tang等人2018;Craja等人2020;Bao等人2020;Bertomeu等人2021;Gepp等人2021;Kydros等人2022;Achakzai和Juan 2022;Xu等人2022;Aftabi等人2023;Rahman和Zhu 2023;Zhou等人2023;Sun等人2024;Innan等人2024;Cai和Xie 2024),仅关注判断一家公司是否表现出欺诈行为。然而,在实际情况下,仅仅检测到欺诈行为的存在可能是不够的。事实上,我们发现许多欺诈行为同时涉及多种类型,通过对2012年至2021年间中国上市公司的220起财务报表欺诈案例进行调查,发现了大量相互关联的欺诈信息。图1(a)展示了每个案例中涉及的欺诈类型数量。从图中可以看出,这些行为往往是相互交织的,形成了一个掩盖其真实情况的共生关系。
需要注意的是,在审计实践中,即使使用完全合理的审计程序,审计人员也难以发现所有欺诈行为。虽然审计人员在发现重大错误和欺诈行为方面负有重要责任,但这一职责并非绝对的。特别是当欺诈行为以看似无意的方式实施时(Hamilton 2016)。此外,审计人员更关注欺诈行为的规模而非性质(Powell等人2005)。这表明一些欺诈行为可能被忽略了。但根据公众公司会计监督委员会(PCAOB)的说法,任何故意的虚假陈述都是令人担忧的,因为它可能表明管理层诚信方面的更普遍问题,即使虚假陈述的规模较小。尽管国际审计准则不能保证检测出所有财务报表欺诈行为,但利益相关者当然希望审计人员能够发现所有违规行为。这一期望对于保护企业和个人的合法权益、维护市场秩序和促进健康发展具有重要意义。此外,鉴于大多数欺诈公司同时犯有多种违法行为,审计人员不应将披露的欺诈行为视为孤立事件,而应平等对待每种欺诈行为。相反,这些行为应被视为使用其他欺诈手段的信号(Wang等人2023b)。Achakzai和Peng(2023)的研究揭示了财务报表欺诈案件中的惯犯行为。区分首次犯罪者和重复犯罪者在使用欺诈手段方面的差异至关重要。例如,首次犯罪者通常会伪造信息并隐藏关键细节,而重复犯罪者则倾向于使用更复杂和隐蔽的策略,如操纵收入、成本和资产项目(Wang等人2023b)。同时,必须认识到欺诈行为的发生反映了企业高管的多种动机,反映了每个实体的独特情况。在这方面,我们希望通过分析对违规公司施加的处罚程度来衡量不同类型欺诈的影响或欺诈行为的总体严重性,因为(Karpoff等人,2007)发现法律处罚与不当行为造成的损害之间存在相关性。然而,监管报告并未详细说明针对特定类型欺诈行为所处以的罚款。在我们的研究中,我们通过检查从事各种类型欺诈的公司是否在欺诈发生三年或五年后被摘牌来评估欺诈行为的严重性和公司的当前运营状况。图1(b)的结果清楚地表明,随着公司从事的欺诈行为种类增加,在三年或五年内被摘牌的公司比例显著增加。这一趋势可能是由于公司在濒临破产或摘牌时面临越来越大的压力,迫使他们采取多种欺诈手段来掩盖困境。一旦真相暴露,损害往往变得无法弥补,最终导致公司被摘牌。总体而言,公司实施的欺诈行为的数量和类型对于评估其真实情况和理解这些行为之间的关联至关重要,这对于检测和预防欺诈至关重要。因此,探索同时考虑欺诈行为的数量和类型的欺诈检测方法至关重要。最近,Tragouda等人(2024)尝试了一种多标签分类方法来识别财务欺诈。尽管他们的方法很有趣,但它只能识别审计人员做出的三个主要评论群组,因此无法确认与每种欺诈行为相关的具体属性,并忽略了这些行为的时间进展。
总体而言,在审计实践中,全面调查企业的所有财务欺诈活动通常被认为是可取的。然而,现有研究主要集中在二元分类方法上,这些方法无法支持深入的欺诈分析。为了解决这一局限性,我们将多标签分类框架纳入财务报表欺诈检测领域,以更准确和全面地识别欺诈行为的多样性。利用这一框架,我们可以同时对每个案例中的多个相关标签进行分类,从而更全面地了解欺诈行为的复杂性。具体来说,我们首先将企业财务报表欺诈分为五种不同类型,包括利润虚增、资产虚增、虚假陈述、披露延迟和重要信息遗漏。然后,在所提出的多标签框架中,我们结合使用了LSTM和MLP。这种组合可以通过从不同时间点的财务报表中获取信息来有效检测财务报表欺诈。最后,我们对实证结果进行评估分析,并对不同类型的欺诈行为进行可解释性分析。我们的主要贡献总结如下:
(1) 我们将多标签分类引入财务报表欺诈检测领域,旨在同时检测所有可能的欺诈行为,而不仅仅是判断是否存在欺诈。这为利益相关者提供了全面了解欺诈行为的工具。
(2) 提出了LSTM-MLP模型,以捕捉时间和欺诈类型的相关信息。此外,为了揭示不同类型欺诈的关键财务特征,我们分别对不同类型的欺诈行为进行了全面的可解释性分析。
(3) 我们提出了Top-K阈值策略,根据欺诈行为的严重性动态确定标签阈值。通过这种策略,可以充分利用所有标签信息,并进一步优化多标签分类的输出。
本文的其余部分结构如下。第2节对相关文献进行了全面回顾。第3节深入探讨了本研究中开发的多标签财务报表欺诈检测框架。随后,第4节通过真实世界数据集的实证分析、鲁棒性测试、参数敏感性分析以及基于SHapley Additive exPlanations(SHAP)和特征重要性的可解释性分析,验证了所提出框架的有效性。最后,第5节总结了研究并提出了未来的研究方向。
章节片段
文献综述
近几十年来,发表了大量关于财务报表欺诈检测和多标签分类应用的研究。在本节中,我们从三个角度简要概述了最相关的文献,包括与财务报表欺诈相关的理论、检测方法和多标签分类任务。
方法论
在本节中,我们首先介绍了用于检测财务报表欺诈的所提出的多标签框架(如图2所示),然后概述了所使用的人工智能方法的可解释性。
实验
在本节中,我们首先描述了数据来源,主要包括特征选择和标签集的建立。然后,介绍了用于各种分类任务的评估指标以及相应的实验设置。接下来,我们全面分析了实证结果。之后,进行了参数敏感性分析和鲁棒性测试,以验证参数选择的合理性和
结论与未来工作
本研究提出了一个多标签财务报表欺诈检测框架,不同于传统的二元分类方法。具体来说,该框架使用了三种不同类型的公司输入特征,包括财务特征、宏观经济特征和行业相关特征,并区分了五种不同类型的欺诈,分别是利润虚增、资产虚增、虚假陈述、披露延迟和重要信息遗漏。所提出的多标签
CRediT作者贡献声明
陈振松:撰写——审阅与编辑、撰写——初稿、方法论、概念化。陈浩:撰写——初稿、软件开发、形式分析、数据整理。刘彦欣:撰写——审阅与编辑、验证、概念化。史勇:监督。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
作者感谢编辑和匿名审稿人的宝贵意见和建议,这些意见极大地改进了手稿。本工作得到了国家自然科学基金(编号72571184和72503157)和教育部人文社会科学青年基金项目(编号24YJCZH032和23YJCZH146)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号