融合磁共振影像与诱发电位时间序列特征的多模态机器学习模型显著提升多发性硬化症残疾进展预测效能

【字体: 时间:2026年03月11日 来源:Frontiers in Immunology 5.9

编辑推荐:

  本推荐总结了《结合磁共振成像和诱发电位增强多发性硬化症残疾进展的机器学习预测》一文的核心发现。该研究通过创新的多模态机器学习(ML)流程,将临床数据、高维磁共振成像(MRI)影像组学特征与运动诱发电位时间序列(EPTS)特征相结合,旨在预测多发性硬化症(MS)的长期残疾进展。研究证明,整合结构(MRI)和功能(EP)的亚临床标志物,相比单一模态模型,能够显著提升预测性能(例如最优模型Brier Score = 0.062),为MS的个体化预后监测和精准医疗决策提供了有力的新工具。

  
引言
多发性硬化症(Multiple Sclerosis, MS)是一种中枢神经系统(Central Nervous System, CNS)的慢性免疫介导性疾病,通过炎症、脱髓鞘和神经变性导致进行性神经功能残疾。全球范围内,MS患者数量持续上升,然而,准确预测MS的疾病进程在临床实践中仍具挑战性。这种不确定性加剧了患者的心理困扰,并影响其生活质量。MS的异质性也给临床医生制定个体化治疗方案带来困难。因此,亟需建立稳健的预后预测模型,以识别疾病快速进展高风险患者,从而指导基于预后的治疗决策。
传统的预后模型多依赖于单一模态数据(如临床或磁共振成像(Magnetic Resonance Imaging, MRI)生物标志物)或常规测量指标(如MRI病灶计数、诱发电位(Evoked Potentials, EPs)的潜伏期值),可能忽略了与复发无关的亚临床病理活动(即“闷燃”smolderingMS)所驱动的功能衰退。为弥补这一不足,本研究开发了一个多模态机器学习(Machine Learning, ML)流程,整合临床数据、MRI影像组学特征和运动EP时间序列(EPTS)特征,以预测基于扩展残疾状态量表(Expanded Disability Status Scale, EDSS)的MS残疾进展。
材料与方法
本研究为单中心观察性研究,回顾性纳入了比利时一家三级MS中心的127名多发性硬化症患者(People with MS, PwMS),共计424个随访“事件”。入组标准要求患者同时具备基线MRI、基线前后6个月内的EDSS和运动EP评估,以及在基线后2-3年的随访EDSS评估。
数据模态与特征提取
  1. 1.
    临床数据:包括年龄、性别、基线EDSS和MS病程。
  2. 2.
    MRI数据:采用T2加权液体衰减反转恢复(Fluid-Attenuated Inversion Recovery, FLAIR)序列。通过标准化预处理流程(包括去噪、偏置场校正、超分辨率重建)后,使用序列自适应多模态分割(Sequence Adaptive Multimodal SEGmentation, SAMSEG)工具分割出41个脑解剖结构(如正常表现白质(Normal-Appearing White Matter, NAWM)、灰质、丘脑等)和脑白质病灶(White Matter Lesions, WML)。在此基础上,提取了42个解剖和病灶体积特征,以及来自病灶和NAWM等区域的100个影像组学(Radiomics)描述符。影像组学特征涵盖六类:基于形状的特征、一阶统计量、灰度共生矩阵(Grey Level Co-occurrence Matrix, GLCM)、灰度游程长度矩阵(Grey Level Run Length Matrix, GLRLM)、灰度区域大小矩阵(Grey Level Size Zone Matrix, GLSZM)和灰度依赖矩阵(Grey Level Dependence Matrix, GLDM)。
  3. 3.
    运动EP数据:记录拇短展肌(Abductor Pollicis Brevis, APB)和踇展肌(Abductor Hallucis, AH)在经颅磁刺激(Transcranial Magnetic Stimulation, TMS)后的运动诱发电位。分析时选用峰-峰幅度(Peak-to-Peak Amplitude, PPA)最大的时间序列。除常规特征(潜伏期、PPA)外,采用高度比较时间序列分析(Highly Comparative Time-Series Analysis, HCTSA)框架提取高维EPTS特征,并利用Boruta算法进行特征选择。关键特征包括用于APB肌肉的“滑动窗口”特征和用于AH肌肉的“预测误差的平均绝对滞后-1自相关”特征。
结局定义与机器学习流程
残疾进展定义为基线(t0)与2-3年后随访(t2y)之间EDSS的变化达到特定阈值(例如,基线EDSS为0时需增加≥1.5分,基线EDSS在0-5.5之间时需增加≥1分,基线EDSS>5.5时需增加≥0.5分),结果为二分类变量(进展/稳定)。
研究构建了包含96种配置的机器学习分析流程,系统比较了不同数据模态(仅EPTS、仅MRI、EPTS+MRI,各组合包含或不包含临床数据)、不同算法(逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)、平衡随机森林(Balanced RF, BRF)、轻量级梯度提升机(Light Gradient Boosting Machine, LGBM))等的性能。流程包括特征相关性过滤、Boruta特征选择、自适应合成过采样(Adaptive Synthetic Sampling, ADASYN)以处理类别不平衡、模型训练、Platt缩放概率校准以及基于平衡准确率的最佳阈值选择。模型评估采用20次重复的分层患者3折交叉验证,以消除患者内数据泄露。主要评估指标包括受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUROC)、平均精度(Average Precision, AP)和布里尔分数(Brier Score)。使用SHapley可加性解释(SHapley Additive exPlanations, SHAP)进行模型可解释性分析。
结果
统计特征分析
在单变量分析中,经过严格的Bonferroni校正后,仅有“NAWM的GLSZM灰度水平非均匀性”这一特征在进展组与稳定组间存在显著差异(p = 0.035)。若采用较宽松的Benjamini-Hochberg校正,则有23个特征显著,包括8个纹理影像组学特征、10个形状或解剖特征、2个一阶统计量特征和3个EPTS衍生特征,这些特征在进展组中通常中位数更高。
多模态模型的优越性
关键差异图显示,整合EPTS和MRI特征的模型,其平均排名显著优于任何单一模态模型。无论是否加入临床变量,这种优势都具有统计学意义。模型性能比较进一步证实,整合EPTS和MRI数据的模型在AP、特异性和Brier Score等多个指标的中位数表现上显著优于单一模态模型,并且在AUROC上显著优于仅使用MRI的模型。尽管EPTS-only模型在AUROC和灵敏度上表现最佳,但EPTS+MRI组合模型在所有性能指标上取得了最佳的总体平衡。
性能权衡与最佳模型
性能权衡分析显示:
  • 在AUROC与AP的权衡中,帕累托前沿仅由EPTS模型和EPTS+MRI组合模型构成。EPTS-only模型在AUROC上领先,而组合模型在AP上最高。
  • 在灵敏度与特异性的权衡中,EPTS+MRI模型实现了更好的平衡,而EPTS-only模型显示出最高的灵敏度。
在布里尔分数(衡量概率预测准确性的指标,分数越低越好)上表现最佳的模型是一个使用EPTS和MRI组合数据的LGBM模型,其布里尔分数为0.062。
特征重要性解读
对最佳模型的SHAP分析显示:
  1. 1.
    MRI影像组学特征占主导:最重要的特征多为MRI纹理和形状特征。例如,“NAWM的GLSZM灰度水平非均匀性”“病灶的GLDM依赖非均匀性” 等纹理特征值越高,与残疾进展风险增加相关,反映了NAWM和病灶区域的异质性。“NAWM的最小轴长”“主轴长” 等形状特征值越低,预示进展风险越高,可能与白质萎缩有关。
  2. 2.
    EPTS特征的补充价值“滑动窗口” 类特征和“APB肌肉的PPA” 也位居重要特征之列。较低的PPA值与较高的进展风险相关。
  3. 3.
    临床特征:性别是唯一被保留的重要临床特征,SHAP分析显示男性与较低的预测进展风险相关,研究者认为这可能反映了队列中性别比例和疾病进展事件的特定分布偏差,而非普遍的生物学规律。
讨论与结论
本研究首次成功将临床数据、MRI影像组学和运动EPTS特征整合到一个多模态ML流程中,用于预测MS的长期残疾进展。核心结论是:结合结构和功能的亚临床标志物,能够持续改善对MS残疾进展的预测能力,支持将多模态监测用于个体化医疗。
讨论要点
  • 多模态的互补性:结构(MRI)和功能(EP)生物标志物提供了关于疾病过程的互补信息。高维特征能够揭示看似正常组织中的细微结构变化和常规评估无法检测的功能障碍。
  • MRI特征的洞察:纹理特征(如GLSZM非均匀性)反映了NAWM和病灶的微观结构异质性,与脱髓鞘、炎症和轴突丢失相关。形状特征与脑萎缩相关,具有预后意义。
  • EPTS特征的洞察:尽管高维EPTS特征(如“滑动窗口”)的精确生理机制尚不完全清楚,但它们携带了重要的预后信息,且与MRI信息互补。EPTS-only模型的高灵敏度使其在识别高风险个体方面具有潜在价值。
  • 临床意义:该研究为多模态预后模型提供了概念验证。在常规随访中纳入EP评估(成本较低、负担小)可能有助于识别那些临床和MRI表现稳定但存在亚临床功能损伤、有进展风险的患者,从而指导更密切的监测或治疗调整决策。
  • 局限性与展望:研究的主要局限包括样本量较小、类别不平衡、单中心回顾性设计、缺乏外部验证、未纳入疾病修正治疗(Disease-Modifying Therapies, DMTs)数据以及复杂的预处理流程。残疾进展基于单次EDSS评估定义。未来需要在更大规模、多中心的前瞻性队列中进行外部验证,并探索纳入更多模态(如光学相干断层扫描、血清生物标志物)和纵向数据分析,以进一步提升模型性能及临床转化潜力。
总结而言,这项研究证明了整合MRI影像组学与运动EPTS特征的多模态机器学习方法,在预测多发性硬化症残疾进展方面优于单一模态模型。这为开发更精准的MS预后工具和实现个体化疾病管理奠定了重要基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号