《Frontiers in Aging Neuroscience》:Predicting progression from amnestic mild cognitive impairment to Alzheimer's disease using longitudinal EEG data: a 12-month cohort study
编辑推荐:
本研究创新性地利用一年内四次重复测量的脑电图数据,构建了反映动态演变趋势的纵向特征(如频谱功率比、排列熵、相位滞后指数等),结合支持向量机等机器学习算法,实现了对遗忘型轻度认知障碍患者是否转化为阿尔茨海默病的高精度预测(准确率达94.92%),为阿尔茨海默病连续体的早期干预提供了重要的电生理生物标志物。
引言
阿尔茨海默病(AD)是一种以不可逆性记忆损害、失语、失用、失认及人格行为改变为特征的神经退行性疾病,其发病隐匿、病程漫长。目前全球约有5000万AD患者,且缺乏有效治疗药物,预计到2050年患者数量将攀升至1.31亿,给社会与家庭带来沉重负担。遗忘型轻度认知障碍(aMCI)是介于正常老化与痴呆(尤其是AD)之间的过渡阶段,作为向痴呆或AD进展的最早临床可检测阶段,其年转化率为10%–15%,终身转化率高达75%–80%。因此,在aMCI阶段早期准确预测其转化成为管理AD连续体和减轻疾病负担的关键问题。
传统MCI诊断依赖生物标志物、神经影像、认知测验和神经心理评估的组合,过程耗时费力且成本高昂。而静息态脑电图(EEG)作为无创检查,具有便捷、经济、实时诊断和普适性等优势,已广泛应用于MCI的诊断与疾病进展监测。与任务态EEG相比,静息态EEG不需受试者执行复杂指令,尤其适合存在认知下降的老年人。现有研究发现MCI人群的EEG信号存在“高向低”频率转移、复杂度降低及功能连接减弱等趋势,但MCI疾病进展的异质性亦体现在EEG信号中,给分析带来挑战。
近年来,机器学习(ML)在利用EEG信号鉴别MCI患者中的应用日益广泛。例如,Lee等(2022)通过提取AD与MCI患者的频谱、非线性和功能连接特征,分类准确率达到86.85%;Perez-Valero等(2022)则在对AD、MCI和健康对照(HC)三组的分类中达到95%的准确率。尽管研究者通过特征优化和模型调参取得了满意结果,但MCI患者与AD或HC之间EEG特征的重叠仍提示分类性能有较大提升空间。
纵向数据(又称面板数据)包含对个体的重复测量。在医学领域,纵向研究能捕获横断面研究无法涵盖的个体动态轨迹趋势,对早期诊断、风险预测、治疗规划和预后评估具有显著优势。虽然已有研究对MCI患者进行EEG纵向采集(如Miraglia等2020;Vecchio等2018),但缺乏从多次EEG测量中提取特征并构建纵向特征的研究。在“HC-MCI-AD”疾病连续体中,病情进展是动态演化过程,提取纵向特征可为早期诊断和预后改善提供多维纵向信息。
研究方法
本研究采用前瞻性队列设计,招募92例aMCI患者,进行为期一年随访。最终纳入65例(27例转化为AD的进展型MCI[PMCI]和38例未转化的稳定型MCI[SMCI])完成四次EEG记录(每4个月一次)。EEG信号经预处理后,从每次记录中提取三类特征:
- 1.
频谱特征:包括delta/alpha、theta/alpha等5个功率谱密度比值(PSD ratio),以及各子频带(delta、theta、alpha、beta、gamma)的功率谱密度熵(PSDE)。
- 2.
非线性特征:包括排列熵(PE)、样本熵(SE)以及新提出的中位质心相空间重构距离(M-DCPSR)。
- 3.
功能连接特征:基于相位滞后指数(PLI)评估alpha频带脑区连接强度。
进一步,利用前三次测量数据构建六类纵向特征:集中趋势(如均值MF)、离散趋势(如标准差SDF、极差RF)以及动态趋势(如曲线下面积AF、速度均值MVF、速度标准差SDVF)。通过F统计量筛选前100个特征,输入支持向量机(SVM)、随机森林(RF)等8种机器学习分类器,采用重复10×5折交叉验证评估性能。
结果分析
EEG特征动态演变
- •
频谱特征:在随访前期(0、4个月),SMCI与PMCI组的PSD比值与PSDE无显著差异;而后期(8、12个月),PMCI组在delta、theta频带PSDE升高,alpha、beta频带PSDE降低,呈现低频活动增强、高频活动减弱趋势。
- •
非线性特征:两组M-DCPSR、SE、PE值随随访时间均呈现下降,但PMCI组下降更显著,表明EEG信号复杂度进一步降低。
- •
功能连接:后期PMCI组alpha频带PLI显著低于SMCI组,提示脑功能网络连接减弱。
纵向特征贡献
特征重要性分析显示,动态趋势特征(如SDVF、MVF)和离散趋势特征(SDF、RF)被优先筛选(合计占比80.74%),而集中趋势特征(MF)未被选中,说明EEG信号的变异性和演变速率比平均值更具预测价值。
机器学习预测性能
SVM模型表现最优,准确率(ACC)达94.92%,曲线下面积(AUC)为93.25%,灵敏度(SEN)90.20%,特异度(SPE)98.80%,F1分数93.65%。其他非线性分类器(如RF、AdaBoost)性能均超过80%,而线性分类器(LDA、LogReg)性能较低(60%–70%),印证EEG纵向特征中隐含非线性模式。
讨论与展望
本研究通过捕捉EEG纵向特征动态变化,显著提升aMCI向AD转化的预测效能。PMCI组后期显著的“低频化”、复杂度下降及连接减弱可能与神经元丢失、白质通路损害及神经递质紊乱相关。纵向特征优于横断面特征,凸显重复测量在刻画AD连续体动态演变中的必要性。
研究局限性包括单中心样本量有限、未使用临床痴呆评定量表(CDR)、随访期较短等。未来将通过多中心合作扩大样本,延长随访,并融合多模态生物标志物(如MRI、Aβ-PET)提升预测稳健性。
结论
本研究构建的EEG纵向特征机器学习框架可有效预测aMCI向AD的转化,为AD早期干预提供客观、动态的电生理评估手段。