基于置信度调整的边际适应提升算法，用于实现可解释的财务困境预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月13日 来源：INTERNATIONAL JOURNAL OF FORECASTING 7.1

编辑推荐：

　　针对财务困境预测中类不平衡与模型可解释性不足的问题，提出XGBoost-CSMA框架，通过动态调整边际和集成TreeSHAP解释提升预测性能与决策透明度，实验验证其优于传统方法。

刘婉婉|兰星宇|夏梦|邹瑶|庞从远|宋光晓

杭州电子科技大学管理学院，中国杭州，310018

摘要

在日益波动的全球环境中，财务困境预测（FDP）对经济稳定至关重要。现有的统计和机器学习模型面临两个持续存在的挑战：一是财务数据集中固有的类别不平衡问题，即财务困境案例较为罕见；二是复杂黑盒模型的可解释性较差，这在高风险情境下会削弱人们的信任。为了解决这些限制，我们提出了XGBoost-CSMA，这是一种基于重新加权方法的提升集成框架，用于可解释的不平衡财务困境预测。与依赖静态、专家定义的成本矩阵的成本敏感方法不同，我们的置信度缩放边际适应（CSMA）目标根据置信水平动态调整预测边际。这使得模型能够自动适应不同的财务困境信号，而无需预先定义成本，从而在保持对关键边缘案例的区分能力的同时减轻不平衡问题。此外，XGBoost-CSMA将TreeSHAP解释嵌入到模型验证中，形成一个反馈循环，提升了预测性能和决策透明度。我们还提供了将成本敏感学习有效整合到梯度提升中的理论基础。利用真实世界企业财务数据集进行的实证评估证实了XGBoost-CSMA相对于现有基线的优越性，其几何平均值和真正例率的显著提升进一步证明了其对困境信号的更高敏感性。

引言

财务困境预测（FDP）系统在减轻经济损失和确保金融稳定方面发挥着重要作用。随着市场波动性的增加和监管审查的加强，准确识别面临财务困境的公司已成为投资者、债权人和政策制定者等利益相关者的关键挑战（Alaka等人，2016年；Altman等人，2017年）。当前的FDP方法主要依赖于统计模型和机器学习技术，如逻辑回归（LR）（Altman & Sabato，2007年）、支持向量机（SVMs）（Ding等人，2008年）和集成方法（Alaka等人，2018年；Son等人，2019年）。尽管这些方法被广泛采用，但它们面临三个根本性挑战：（1）由于未能充分处理复杂的财务模式，预测精度较低（Begley等人，1996年）；（2）类别不平衡严重，高风险公司的稀缺导致预测器偏向于低风险案例（Abedin等人，2023年）；（3）性能与可解释性之间的权衡，高精度模型（例如深度学习）往往缺乏透明度，而可解释模型（例如决策树）的区分能力不足。这些限制阻碍了在现实金融场景中部署可靠且可操作的风险评估系统。

为了解决这些问题，研究人员探索了各种策略。针对类别不平衡问题，传统方法如重采样技术——包括合成少数类过采样技术（SMOTE）（Chawla等人，2002年）及其变体（Batista等人，2004年）以及欠采样技术（García等人，2012年）——试图通过操纵数据分布来重新平衡训练数据。然而，这些方法生成的合成样本往往具有不现实的财务比率，这可能会影响风险模型的泛化能力，尤其是在类别极度不平衡的情况下。成本敏感学习通过将不对称的误分类成本纳入学习目标来处理类别不平衡问题，对少数类实例的错误施加更高的惩罚，从而引导模型关注关键的财务困境案例（Sun等人，2007年）。这种方法在系统地调整决策边界以偏好高风险样本的同时保留了原始数据分布，特别适用于需要保持财务指标之间真实关系的财务风险预测。尽管如此，成本敏感方法依赖于静态的惩罚权重，无法适应财务困境的动态特性，其中误分类成本会随宏观经济条件非线性变化。结合重采样和算法调整的混合方法试图缓解这些限制，但会导致真实财务风险的误分类率上升（Galar等人，2011年）。

机器学习中的可解释性方法大致分为两类：事后解释方法（例如SHAP Lundberg & Lee，2017年和LIME Ribeiro等人，2016年）和本质上可解释的模型。本质上可解释的模型通过设计确保透明度，提供确定性和全局一致的解释。然而，它们捕捉财务数据中高维、非线性关系的能力有限，常常导致欠拟合，或者当模型复杂性增加时，决策结构过于复杂，从而削弱了可解释性。相比之下，事后技术通过扰动输入并近似局部特征重要性来提供模型不可知的解释。这些方法具有多个优势：它们可以应用于任何黑盒模型而不牺牲预测性能，能够灵活分析复杂模式，并提供直观的特征归因分数，便于利益相关者理解。虽然这些方法解决了可解释性的某些方面，但由于类别不平衡的复合挑战，它们在FDP中的应用仍然存在问题。在不平衡的数据集上进行训练时，事后解释会变得不可靠，因为重采样技术会扭曲特征空间并产生误导性的归因（Chen等人，2024年）。同样，通过成本敏感学习处理不平衡的本质上可解释的模型往往在其不透明的优化过程中掩盖了决策逻辑。这种权衡削弱了风险评估的可靠性，使得金融机构和监管机构无法在准确性と可操作的决策支持之间取得平衡。

基于上述研究背景和方法论考虑，我们提出了一个基于置信度缩放边际适应的提升集成框架（XGBoost-CSMA），用于可解释的FDP。XGBoost-CSMA以梯度提升决策树（GBDTs）为基础，并引入了置信度缩放边际适应（CSMA）机制，将FDP的类别不平衡问题重新定义为预测置信边际的动态优化。这种设计使模型能够自动关注那些信息丰富但早期FDP难以识别的财务困境样本。与传统方法不同，XGBoost-CSMA不仅提高了预测性能，还通过将TreeSHAP（Lundberg等人，2020年）作为建模框架的组成部分，确保了在不平衡条件下的模型行为具有稳定性和可信性。值得注意的是，我们将解释分析从一个简单的解释工具提升为一个关键的模型验证机制，结合了三个互补的视角——特征贡献分析、决策路径解释和财务特征交互分析，同时回答两个基本问题：哪些财务指标在FDP中起主导作用，以及这些指标的系统变化如何影响风险概率？

我们提出的XGBoost-CSMA框架在三个基本方面区别于现有的FDP方法。首先，虽然传统的成本敏感方法依赖于从专家知识中得出的预定义成本矩阵，但我们的CSMA优化目标根据置信水平动态调整预测边际，从而无需预先指定成本即可自动适应不同的财务困境信号。其次，我们提出了一个全面的解决方案，同时解决了FDP中的类别不平衡和模型可解释性挑战，而以往的研究通常分别处理这些问题。第三，与主要使用解释技术进行事后合理化的现有可解释机器学习应用不同，我们将TreeSHAP解释作为模型解释和验证的固有组成部分，从而形成一个反馈循环，共同提升预测性能和决策透明度。

本研究的贡献有四个方面。（1）我们开发了一种CSMA机制，将误分类成本敏感性与预测置信度系统地整合到提升集成框架中，将传统的梯度提升转变为一个关注不平衡的FDP预测器。这不仅解决了类别不平衡问题，还保留了对FDP特别有价值的边缘案例的区分能力。（2）我们为将CSMA目标嵌入梯度提升提供了严格的理论推导，包括一阶和二阶近似的详细数学公式以及相应的增益计算，为关注不平衡的财务风险建模奠定了坚实的基础。（3）尽管提升集成算法因其预测性能而在金融应用中得到广泛应用，成本敏感学习主要应用于非结构化数据领域，但XGBoost-CSMA通过开发一个统一的框架，结合了这两种方法的优点。（4）我们超越了传统的模型解释实践，将基于TreeSHAP的可解释性不仅作为事后分析工具，还作为模型验证和决策审计的固有组成部分。这种双用途的可解释性框架使财务分析师能够理解驱动模型预测的因素，并验证这些决策模式是否符合领域专业知识和监管要求，从而解决了财务风险建模中的关键可信性挑战。

部分摘录

FDP方法

作为企业风险管理中的一个关键话题，FDP研究强调模型构建的科学严谨性和预测有效性从根本上决定了运营监控系统的有效性和投资者的风险缓解策略。随着时间的推移，主流方法演变为两种主导范式——传统的统计模型和人工智能算法（特别是机器学习方法），每种方法都有其独特的理论基础

极端梯度提升

XGBoost是对GBDTs的一种高级改进，它采用加性训练策略通过迭代添加弱学习器（决策树）来优化目标函数。虽然传统的GBDTs通过顺序添加弱学习器来最小化损失函数，但它们存在两个关键限制：（1）GBDTs缺乏对模型复杂性的显式控制，容易导致过拟合风险；（2）GBDTs仅利用一阶梯度信息，

FDP数据集

本研究考察了2000年至2024年间上海和深圳证券交易所的A股上市公司。排除数据缺失过多的公司后，最终样本量如表1所示。根据中国上市公司的年度报告披露系统，上市公司的财务数据（T-1）与其股票在T年是否受到特殊处理（ST）之间存在强相关性。因此，本研究的时间段是

XGBoost-CSMA与平衡FDP模型

本研究通过将XGBoost-CSMA的性能与传统的财务风险预测方法进行基准测试，对其识别上市公司财务风险的能力进行了初步评估。为了确保全面分析，我们使用了一组包括AUC、TPR、TNR和Gmean在内的综合评估指标。XGBoost-CSMA与其他FDP模型之间的比较分析结果如表4所示。所有结果均为五次独立运行的平均值

结论

本研究介绍了XGBoost-CSMA，这是一个成本敏感的集成框架，它将CSMA与可解释的提升相结合，以解决FDP中的类别不平衡和可解释性双重挑战。所提出的动态CSMA机制有效地区分了边缘案例，同时通过使用自适应目标函数改变静态成本矩阵，减轻了对非困境公司的预测偏差。将TreeSHAP解释整合到验证过程中增强了模型

CRediT作者贡献声明

刘婉婉：撰写——原始草稿、可视化、软件、方法论、资金获取、数据整理、概念化。兰星宇：撰写——原始草稿、方法论、调查、数据整理、概念化。夏梦：撰写——审阅与编辑、可视化、验证、方法论、形式分析。邹瑶：撰写——审阅与编辑、验证、资源准备。庞从远：撰写——审阅与编辑、验证。宋光晓：撰写——审阅与编辑、验证。

利益冲突声明

作者声明以下可能被视为潜在利益冲突的财务利益/个人关系：刘婉婉报告称获得了国家自然科学基金的支持。其他作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

这项工作是由国家自然科学基金（72401079）资助的研究项目的成果。

数据和代码可用性

本手稿中呈现的工作的可复现性包可在https://github.com/Ducktor-Lan/XGBoostCSMA获取。相关数据的访问可能受到限制。

联系信箱：

粤ICP备09063491号

摘要

引言