《Prevention Science》:Using Machine Learning Methodology to Identify Predictors of Non-Response to MTSS-B: a Focus on Discipline Problems and Juvenile Justice Involvement
编辑推荐:
行为多层级支持系统(Multi-tiered Systems of Support for Behavior, MTSS-B)是美国广泛应用的阶梯式预防干预模式,目前覆盖全美超25000所学校。研究人员利用一项既往MTSS-B随机对照试验(Randomized
行为多层级支持系统(Multi-tiered Systems of Support for Behavior, MTSS-B)是美国广泛应用的阶梯式预防干预模式,目前覆盖全美超25000所学校。研究人员利用一项既往MTSS-B随机对照试验(Randomized Controlled Trial, RCT)的16907名小学生数据,该试验纳入42所学校,随机分配至实施Tier 1+Tier 2干预组或仅实施Tier 1对照组,原始数据收集于2008–2012年,并与2008–2024年6–12年级行政行为记录关联。研究人员采用机器学习方法识别小学阶段可预测三类长期结局(即校内停课(In-School Suspension, ISS)、校外停课(Out-of-School Suspension, OSS)、逮捕)的因子,上述结局均代表Tier 1无应答。针对ISS,最强预测因子为家庭参与度、女性性别及内化问题,三者均为保护因素;针对OSS,最强预测因子为家庭参与度、内化问题及学业表现,均为保护因素;针对逮捕,关键预测因子包括家庭问题(问题越少逮捕风险越低)、亲社会行为及家庭参与度,后两者为保护因素。Tier 1+Tier 2组与仅Tier 1组的顶级预测因子高度相似。上述发现可为MTSS-B潜在无应答的早期筛查提供依据,并凸显家庭参与实践的必要性。
研究背景与意义
行为多层级支持系统(Multi-tiered Systems of Support for Behavior, MTSS-B)是基于公共卫生模型的阶梯式行为预防框架,旨在通过 universal(Tier 1)、targeted(Tier 2)、intensive(Tier 3)三级支持应对学生差异化行为需求,减少排斥性惩戒、阻断校园到监狱的管道效应。现有证据表明Tier 1干预可有效改善多数学生的行为与学业结果,但约10%–15%的学生对其无应答,需更高层级支持;然而学界对无应答的早期预测因子认知有限,且尚未明确Tier 2支持的介入是否会改变风险关联模式。此外,早期行为问题若未及时干预,会通过发展级联效应引发后续特殊教育安置、学业失败甚至少年司法卷入,因此识别可操作的预测因子对精准分流干预具有重要实践价值。该研究基于马里兰州42所小学的随机对照试验(Randomized Controlled Trial, RCT)纵向队列,结合机器学习与传统多层线性模型,系统解析小学特征对中学阶段排斥性惩戒与逮捕风险的预测作用,成果发表于《Prevention Science》。
关键技术方法
研究依托PBISplus RCT队列,纳入42所已高质量实施Tier 1 MTSS-B的小学,按学区分层匹配基线特征后随机分为Tier 1+Tier 2组(n=20)与仅Tier 1组(n=22),基线数据采集于2007–2008年,覆盖K–5年级16907名学生。预测变量包含人口学特征、教师评定的学业表现、行为与家庭变量(采用教师课堂适应观察量表(Teacher Observation of Classroom Adaptation, TOCA-C)测量,含注意力问题、内化问题、攻击/破坏行为、亲社会行为、情绪调节问题、家庭问题、家庭参与度7个分量表),结局变量来自马里兰州 longitudinal 数据系统(Maryland Longitudinal Data System, MLDS)的2008–2024年记录,包括6–12年级是否曾发生校内停课(In-School Suspension, ISS)、校外停课(Out-of-School Suspension, OSS)、少年逮捕,均二分类处理。数据分析采用机器学习流程:通过多重链式方程插补(Multiple Imputation by Chained Equations, MICE)处理缺失值,经RobustScaler标准化、十折交叉验证与SMOTE-Tomek平衡类别分布,筛选12种监督学习算法后选择随机森林作为最终模型,采用SHapley Additive exPlanations(SHAP)解析特征贡献;同时配套拟合多层广义线性混合模型(Generalized Linear Mixed Model, GLMM),将学生嵌套于基线学校以估计预测因子的相对效应量。
研究结果
预测模型性能
随机森林在所有结局中表现最优:逮捕模型的准确率、精确率、召回率、F1值与受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, ROC-AUC)均为0.87,Cohen’s Kappa与马修斯相关系数(Matthews Correlation Coefficient, MCC)为0.75;ISS模型上述指标达0.92,Kappa与MCC为0.84;OSS模型指标为0.83,Kappa与MCC为0.65。SMOTE处理使三类模型的准确率提升8%–10%,显著改善少数类的识别能力。
顶级预测因子特征
校内停课(ISS)顶级预测因子:家庭参与度为最强保护因素,更高水平显著降低ISS风险;女性性别与内化问题同样为保护因素,高内化症状与更低ISS概率相关;破坏行为与情绪调节问题则为风险因素,高得分对应更高ISS风险;队列与研究起始年级的预测贡献极低。
校外停课(OSS)顶级预测因子:家庭参与度、内化问题、学业表现为前三位保护因素,更高水平降低OSS概率;亲社会行为为保护因素,破坏行为为风险因素;性别与队列的贡献可忽略。
逮捕顶级预测因子:家庭问题为最强预测因子,更低家庭问题对应更低逮捕风险;亲社会行为与家庭参与度为保护因素,更高得分降低逮捕概率;学业表现差与高破坏行为为风险因素;内化问题与注意力问题呈负向关联,高症状对应更低逮捕风险;性别、队列与干预组别的贡献有限。
干预条件下的预测因子一致性
Tier 1+Tier 2组与仅Tier 1组的顶级预测因子排序与贡献强度几乎完全一致,表明干预情境未改变基线特征对长期结局的预测模式,即两类学校中发生无应答的学生基线风险特征无显著差异。
多层线性模型结果
无条件模型显示,小学层面可解释ISS方差的14.5%、OSS的7.6%、逮捕的6.5%。控制嵌套结构后,所有SHAP识别的顶级预测因子均与对应结局显著相关:破坏行为是ISS(OR=1.72)与OSS(OR=1.91)的最强预测因子;队列是逮捕的最强预测因子(OR=0.46),其次为破坏行为(OR=1.37),两组的效应模式无显著差异。
讨论与结论
研究证实家庭相关因素是跨结局的核心预测因子:家庭参与度是ISS、OSS、逮捕的共同保护因素,家庭问题是逮捕的特异性风险因子;内化问题是两类停课的共有保护因素,性别与学业表现分别对ISS、OSS具有独特预测价值。预测因子在不同结局中存在异质性,提示筛查工具需针对具体目标结局定制。干预条件未改变预测因子的权重,说明Tier 2支持可能通过系统性优化学校行为响应机制降低整体风险,而非针对性缓解特定基线风险的作用。研究局限性在于机器学习无法推断因果,且未追踪学生后续就读学校的动态影响,结局采用“是否发生”的二分类定义未区分事件类型与时序特征。总体而言,该研究首次将机器学习应用于MTSS-B无应答预测,明确了家庭参与的跨阶段保护作用,为学校早期识别高风险学生、优化阶梯式支持的资源配置提供了实证依据,也为发展精准化行为筛查工具奠定了理论基础。