《Scientific Reports》:Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data
编辑推荐:
针对撒哈拉以南非洲(SSA)地区女性外阴残割(FGM)分类研究缺乏高效预测工具的问题,研究人员基于2015-2023年11国的人口与健康调查(DHS)数据,利用七种机器学习(ML)算法对FGM进行了分类预测。结果表明,随机森林(RF)模型性能最优(准确率0.85, AUC 0.93),且可解释性分析(SHAP)显示,母亲对FGM的看法、居住国、宗教理由及自身是否受过残割是关键影响因素。本研究为SSA地区针对性地制定基于证据的干预策略提供了重要依据。
在全球公共卫生领域,女性外阴残割(Female Genital Mutilation/Cutting, FGM) 是一个根深蒂固且对女性身心健康造成深远伤害的传统习俗。尽管国际社会已广泛认识到其危害,但这一做法在撒哈拉以南非洲(Sub-Saharan Africa, SSA) 的许多国家和地区依然普遍存在,与性功能障碍、慢性疼痛、感染、不孕以及孕产妇死亡风险增加等一系列负面健康后果紧密相连。然而,要想有效遏制并最终根除这一习俗,公共卫生工作者和政策制定者面临着一个关键挑战:如何在庞大复杂的社会人口学数据海洋中,精准识别出哪些因素最能预测FGM的发生,从而将有限的干预资源投入到最需要、最有效的方向上?传统统计分析在处理多变量、非线性关系的大型数据集时往往力有不逮。就在这样的背景下,一项创新的研究应运而生,它巧妙地将现代机器学习(Machine Learning, ML) 的力量与权威的人口与健康调查(Demographic and Health Survey, DHS) 数据相结合,试图为这一难题提供更清晰、更准确的解答。这项研究成果最终发表在了《Scientific Reports》期刊上。
为了回答上述问题,研究团队开展了一项基于二手数据的预测建模研究。他们采用了横断面研究设计,数据来源于2015年至2023年间在11个SSA国家进行的DHS调查。研究的分析对象是62,249名至少育有一女的妇女,核心目标是通过机器学习模型,预测母亲报告其至少一个女儿经历过FGM的可能性。研究团队运用了七种主流的分类算法进行建模与比较,包括逻辑回归(Logistic Regression)、决策树(Decision Tree)、随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)、K-最近邻(K-Nearest Neighbors, KNN)、极限梯度提升(XGBoost, XGB) 以及朴素贝叶斯(Naive Bayes, NB)。模型的性能通过准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1 Score)和受试者工作特征曲线下面积(Area Under the Curve, AUC) 等指标进行综合评估。此外,研究还通过校准曲线、Brier分数评估模型预测概率的可靠性,并利用SHAP (SHapley Additive exPlanations) 可解释性人工智能框架,深入解读了各特征对模型决策的贡献。
模型性能比较
在所有测试的七种机器学习分类器中,随机森林(RF)模型展现了最佳的综合性能。其准确率达到0.85,精确率为0.83,召回率为0.88,F1分数为0.85,AUC值高达0.93。这表明RF模型在整体分类正确率、对阳性样本(女儿经历FGM)的识别能力以及模型区分度方面均表现优异。XGBoost模型以0.84的准确率和0.92的AUC值紧随其后。相比之下,逻辑回归和朴素贝叶斯模型的性能相对较弱。
模型校准评估
除了判别能力,模型预测概率的准确性(校准度)对实际应用也至关重要。评估显示,随机森林(Brier分数 = 0.1319) 和决策树(0.1328) 模型拥有最好的校准性能,即其预测的概率值与实际观察到的结果频率最为接近,这使得其预测结果更具可信度和实用性。
特征重要性及可解释性分析
通过SHAP框架的可视化分析,研究清晰地揭示了影响模型对“母亲报告女儿经历FGM”这一结果进行分类的关键因素。SHAP摘要条形图显示了各特征对模型输出的平均绝对贡献(全局重要性)。贡献度最高的四个特征依次是:母亲对FGM持支持态度(平均SHAP值 +0.14)、居住国(+0.13)、应答者(母亲)自身接受过割礼(+0.11),以及认为FGM具有宗教合理性(+0.07)。SHAP力图则进一步展示了每个特征值如何具体影响单个样本的预测。例如,母亲支持FGM、居住在FGM高流行率国家、母亲自身经历过割礼以及持有宗教合理信念,都会显著增加模型预测其女儿经历FGM的概率(正向贡献);反之,母亲反对FGM、居住在低流行率国家等因素则会降低预测概率(负向贡献)。
本研究系统地应用并比较了多种机器学习技术,利用具有全国代表性的大规模DHS数据,成功构建了用于分类撒哈拉以南非洲地区女性外阴残割的有效预测模型。其中,随机森林分类器被证明是性能最优的模型。这项研究最重要的贡献之一在于,它不仅提供了高精度的预测工具,还通过先进的可解释性人工智能方法,深入剖析了驱动预测结果的核心社会文化因素。可解释性分析结果一致表明,母亲对FGM的个人看法、家庭所在的国家背景、为FGM提供的宗教理由以及母亲自身的割礼经历,是预测其女儿是否经历FGM的最关键变量。这些发现具有明确的公共卫生干预意义。研究结论强调,旨在改变FGM做法的教育和倡导工作,应优先针对母亲群体,特别是那些自身经历过FGM或坚信该习俗具有宗教合理性的母亲。实施社区参与项目,挑战围绕FGM的既定惯例和观念,可能尤其有效,特别是当这些做法植根于宗教或文化理由时。因此,这项研究为设计更具针对性、基于证据的干预策略提供了至关重要的科学依据,有望助力加速在SSA地区消除FGM的进程。