基于可解释性集成机器学习预测老年类风湿关节炎患者靶向疾病修饰抗风湿药物的不依从性与不持续性风险

《Clinical Therapeutics》：Interpretable Ensemble Machine Learning Prediction of Nonadherence and the Risk of Nonpersistence of Targeted Disease-Modifying Antirheumatic Agents in Older Adults With Rheumatoid Arthritis

【字体：大中小】 时间：2026年02月22日 来源：Clinical Therapeutics 3.6

编辑推荐：

　　本研究针对老年类风湿关节炎（RA）患者对生物/靶向合成疾病修饰抗风湿药物（b/tsDMARDs）的不依从和非持续性问题，开发并验证了多种集成机器学习模型。研究利用美国联邦医疗保险数据，揭示了年龄、疾病严重程度指数、衰弱评分等是预测上述风险的关键因素，为个性化干预和精准医疗在RA管理中的应用提供了重要工具和洞见。

类风湿关节炎（RA）是一种让人备受煎熬的自身免疫性炎症性疾病，它无情地攻击关节滑膜，导致持续的关节疼痛、僵硬甚至畸形，严重影响着全球数百万人的生活质量，尤其在老年人群中更为常见。随着人口老龄化，这一问题愈发突出。治疗RA的核心武器是一类被称为疾病修饰抗风湿药物（DMARDs）的药物。近年来，生物制剂和靶向合成DMARDs的出现极大地改变了RA的治疗格局，成为常规合成DMARDs（如甲氨蝶呤）疗效不佳时的关键二线选择。

然而，一个严峻的现实是，许多患者难以坚持这些先进的治疗方案。服药不按时、不按量（不依从）以及过早停止治疗（不持续）是RA管理中普遍存在的“拦路虎”。研究表明，患者对某些生物DMARDs的依从率低至16%，而治疗一年后的持续率也差异巨大，介于32%到90.9%之间。这不仅会导致疾病进展加速、残疾风险增加，还会推高医疗成本。理解哪些因素导致患者不依从或不持续，对于制定有效干预措施至关重要。尽管已有大量观察性研究探讨了影响依从性的多方面因素，但鲜有研究利用机器学习（ML）这一强大工具，来全面评估所有类型的b/tsDMARDs，并为老年RA患者构建预测模型。机器学习擅长从海量数据中发现复杂模式，但模型的“黑箱”特性又让临床医生望而却步。

为此，来自美国密西西比大学的研究人员Yinan Huang和Sandeep K. Agarwal开展了一项开创性研究。他们利用大规模的美国联邦医疗保险（Medicare）报销数据，为老年RA患者开发并验证了一系列可解释的集成机器学习模型，旨在预测其对b/tsDMARDs的不依从和不持续风险。这项研究不仅填补了方法学上的空白，其成果更有可能帮助临床医生提前识别高风险患者，从而进行精准干预，优化RA的长期管理。该研究已发表在药物治疗学领域的权威期刊《Clinical Therapeutics》上。

关键研究方法概要：

本研究是一项回顾性队列研究，数据来源于美国联邦医疗保险（Medicare）5%的报销数据库（2012-2020年）。研究纳入了年龄≥65岁、在2013-2019年间新开始使用b/tsDMARDs、并被诊断为RA的老年患者。研究团队从医保数据中提取了患者人口统计学、临床特征、共病、合并用药、医疗资源使用等27个预测变量。研究主要评估两个结局：在12个月的随访期内，不依从（定义为药物持有率MPR <80%）作为二分类结局；不持续（定义为从起始用药到出现≥60天治疗中断的持续天数）作为生存分析结局。为了预测这两个结局，研究者构建了多种集成机器学习模型：对于不依从的预测，使用了随机森林（RF）、极限梯度提升（XGBoost）和预测规则集成（PRE）这三种分类模型；对于不持续的预测，则使用了它们的生存分析对应模型：随机生存森林（RSF）、XGBoost生存模型和PRE生存模型。数据按75%/25%的比例划分为训练集和测试集，模型性能通过受试者工作特征曲线下面积（AUC）和一致性指数（C-index）等指标进行评估，并使用SHAP（Shapley Additive Explanations）值等方法增强模型的可解释性。

研究结果

研究队列特征：

经过严格的纳入和排除标准筛选，最终确定了3927名符合条件的老年RA患者。研究队列的平均年龄为73.4岁，女性占75.2%，大多数为白人（84.9%）。在起始的b/tsDMARDs类型中，肿瘤坏死因子抑制剂（TNFi）生物制剂使用者最多（57.6%），其次是非TNFi生物制剂（38.3%）和靶向合成DMARDs/Janus激酶抑制剂（JAKi）（4.1%）。

治疗依从性与不依从的机器学习模型：

在12个月的随访期内，约有53.7%的患者对b/tsDMARDs治疗依从（MPR ≥80%）。三种机器学习分类模型（RF、XGBoost、PRE）在预测不依从方面的表现相当。与作为基线模型的PRE相比，随机森林和XGBoost模型在AUC上均未显示出统计学上的显著差异。这些模型一致地将年龄、基于医保数据的RA严重程度指数（CIRAS）、b/tsDMARDs类型、衰弱评分、癌症史以及Elixhauser共病指数列为预测不依从的最重要特征。

治疗持续性与不持续的机器学习模型：

在观察期内，81.5%的患者在整个观察期内持续治疗，平均治疗时间为985天。其余18.5%的患者在起始b/tsDMARDs后经历了不持续事件（出现≥60天的治疗中断）。在预测不持续风险方面，两种树集成生存模型——随机生存森林和XGBoost生存模型的表现，均显著优于PRE生存模型。预测不持续风险的关键特征包括年龄、Elixhauser评分、衰弱评分和基于医保数据的RA严重程度指数（CIRAS）。

模型可解释性：

研究者采用了SHAP值分析和规则提取来增强模型的可理解性。对于树模型（RF和XGBoost），SHAP图直观展示了各特征对预测结果的贡献方向和程度。例如，在XGBoost模型中，b/tsDMARDs起始年份、衰弱评分和CIRAS对不依从预测的贡献最大。对于规则模型（PRE），研究提取了最重要的“如果-那么”规则。例如，一条重要规则显示：如果患者同时满足（1）未使用甲氨蝶呤（MTX）、（2）未使用其他常规合成DMARDs（csDMARDs）、（3）无癌症共病，则其发生不依从的可能性较低。

结论与讨论

本研究成功地将多种可解释的集成机器学习方法应用于老年RA患者群体，有效预测了他们在起始b/tsDMARDs治疗后12个月内发生不依从和不持续的风险。这是首个将此类机器学习模型引入RA患者药物利用模式评估的探索性研究，具有重要的方法论意义和临床价值。

研究发现，随机森林和XGBoost及其生存模型在预测任务中展现了可靠的性能，而预测规则集成模型也提供了良好的可解释性。模型识别出的关键风险因素，如更高的年龄、更严重的RA疾病活动度（通过CIRAS衡量）、更高的共病负担（Elixhauser评分）、更差的生理状态（衰弱评分）以及特定的药物类型，与既往文献报道一致。这些发现证实了利用常规医保数据构建预测模型的可行性。

这项研究的重要意义在于，它为解决RA长期管理中的核心挑战——治疗依从性和持续性——提供了一种基于数据的、前瞻性的工具。通过机器学习模型，临床医生和医疗系统可以在治疗早期识别出有高风险不依从或不持续的患者。这使得资源能够被更精准地投放，例如，对高风险患者加强用药教育、提供更频繁的随访支持或进行多学科团队管理，从而实现个性化医疗和精准干预的目标。对于RA这种需要长期规范治疗的慢性病而言，提高治疗依从性和持续性直接关联着能否实现疾病缓解、防止关节破坏和改善患者远期生活质量。

当然，研究也存在一些局限性，例如依赖医保报销数据可能缺乏某些临床细节（如具体的疾病活动度评分），模型仅在内部验证而未进行外部验证，以及数据中近年获批的JAKi药物样本量较小等。未来的研究可以整合更丰富的临床和实验室数据，探索更复杂的机器学习算法（如深度学习），并在独立队列中进行外部验证，以进一步提升模型的预测能力和普适性。此外，探索这些风险因素与不依从/不持续之间的因果关系，以及评估不依从/不持续对临床结局和医疗成本的最终影响，也是重要的研究方向。

总之，这项研究为利用机器学习优化RA患者管理迈出了坚实的一步。它展示了如何将大数据转化为临床可操作的洞见，最终服务于改善患者预后和提升医疗效率的终极目标。

热点排行

新闻专题