《Financial Innovation》:Multi-source information fusion for credit risk assessment of local government financing platforms using PSO-XGBoost and SHAP
编辑推荐:
截至2023年底,中国地方政府融资平台(Local Government Financing Platforms, LGFPs)债务规模已达60万亿元人民币,信用风险不确定性加剧,威胁经济社会稳定。为此,研究人员提出一种基于PSO-XGBoost-SHAP框架
截至2023年底,中国地方政府融资平台(Local Government Financing Platforms, LGFPs)债务规模已达60万亿元人民币,信用风险不确定性加剧,威胁经济社会稳定。为此,研究人员提出一种基于PSO-XGBoost-SHAP框架的信用风险评估方法:采用粒子群优化(Particle Swarm Optimization, PSO)进行超参数调优,极限梯度提升(Extreme Gradient Boosting, XGBoost)用于风险分类,SHAP(SHapley Additive exPlanations)解释模型输出。在该框架下,从地方财政风险、平台自身信用风险及政府支持三个维度构建了31项风险指标,扩展了现有评估体系。依据官方指引识别全国范围内3876家LGFPs,并融合多源信息进行建模。结果表明:(1)所提模型稳定性与泛化能力优异,AUC指标优于支持向量机(SVM)、逻辑回归(LR)及随机森林(RF)等基准模型;(2)对LGFP信用风险的贡献度由高到低依次为区域财政风险、平台自身信用风险及政府支持;(3)高风险LGFPs集中在两类地区:经济基础薄弱且债务负担重的省份(贵州、云南)与经济总量大但隐性债务突出的省份(河南、江苏),呈现显著的区域异质性。研究据此提出差异化政策建议,以缓释LGFP信用风险。
研究背景与意义
2024年,穆迪与惠誉相继下调中国主权信用评级展望,主要原因之一是中国地方政府融资平台(LGFPs)的债务信用风险可能冲击地方财政稳定。中共二十届三中全会将LGFPs隐性债务列为中国经济三大系统性风险之一,强调需加快建立防范化解长效机制并推进平台改革转型。截至2023年末,LGFPs债务规模达60万亿元,偿债资金来源高度依赖土地出让收入与一般公共预算,而两者近年均呈下滑趋势,叠加信用违约事件创新高,风险传导至金融体系的隐患加剧。传统评估方法存在样本代表性不足、指标体系偏重财务指标而忽视政府关联属性、难以捕捉非线性关系且可解释性差等局限。为此,本研究构建全国性样本与多维指标体系,引入可解释的集成学习方法,以提升风险评估的科学性与决策支持能力。该研究成果发表于金融科技领域权威期刊《Financial Innovation》。
关键技术与方法
研究采用PSO-XGBoost-SHAP集成框架。样本覆盖全国3876家LGFPs(2018–2023年),包含275例实际违约样本,依据非经营性收入占比>30%、政府补贴占净利润>50%等标准结合多源数据交叉验证识别。指标体系涵盖地方财政风险(11项)、平台财务风险(9项)与政府支持力度(6项)三个维度共31项指标,经相关性分析与方差膨胀因子(Variance Inflation Factor, VIF)检验剔除冗余指标后保留26项。采用粒子群优化(PSO)算法搜索XGBoost最优超参数,以五折交叉验证确保稳定性,并利用SHAP值量化特征贡献,实现模型全局与局部双重解释。
研究结果
模型性能评估
PSO-XGBoost在测试集上AUC达0.8609,显著优于SVM、LR及RF等基准模型,且在不平衡数据处理中无需重采样即可有效控制误报率(<5%)并实现53.01%的召回率。跨期验证(训练集2018–2023年,测试集2024年)AUC为0.862,证实模型具备时间泛化能力。
SHAP全局解释性分析
区域财政风险贡献度最高(57.4%),其次为平台财务风险(38.9%),政府支持影响最低(3.7%)。前十大关键指标累计贡献83.2%,以现金比率(Q231)、城镇居民人均可支配收入(Q125)、人均GDP(Q124)、对外担保比率(Q223)与地方债务率(Q111)为核心。其中,Q223、Q111与财政收入增速(Q134)为传统线性模型未识别的新风险驱动因子。
SHAP局部解释与交互效应
单样本层面,SHAP热力图可解析各指标对个体预测的正负向贡献。交互分析表明,人均GDP与现金比率的交互效应最强(0.078),财政自给率与城镇居民人均可支配收入次之(0.069)。二者在不同区间呈现非线性协同作用:低人均GDP区现金比率与风险负相关,高人均GDP区则转为正相关;低财政自给率区居民收入与风险正相关,高自给率区转为负相关。
高风险区域分布
高风险LGFPs集中于两类省份:一是经济弱、债务高的贵州、云南、甘肃,需加大转移支付与专项债支持并严控新增债务;二是经济强但隐性债务突出的江苏、湖南、山东,应重点管控平台债务规模并加速市场化转型。
稳健性检验
敏感性测试显示,调整LGFP识别阈值(非经营性收入比30%–50%)、缺失值处理方法(内部机制vs显式填补)、违约定义(是否含商票逾期)均不改变模型性能与关键指标排序,SHAP值排名Spearman相关系数达0.8525,证实结论稳健。
结论与讨论
研究表明,区域财政风险是LGFP信用风险的首要来源,占比近六成。PSO-XGBoost-SHAP框架兼顾高精度与可解释性,可作为监管传统线性模型的有效补充。据此建议:金融监管部门构建以现金比率、对外担保比率为核心的动态预警系统;地方政府强化财政纪律与透明度,从源头遏制隐性债务;平台企业聚焦优化债务结构,严控短期负债与或有负债;实施区域差异化治理,高风险省份侧重存量化解与流动性纾困,经济强省侧重增量管控与市场化转型。未来研究可纳入宏观政策与公司治理变量,构建动态面板模型,并深入量化债务重组等政策工具的异质性效应。