《npj Digital Medicine》:A machine learning–enabled blood transcriptomic signature for digital diagnosis and subtyping of Alzheimer’s disease
编辑推荐:
本研究针对阿尔茨海默病(AD)早期诊断困难、缺乏可捕获代谢-免疫紊乱的非侵入性生物标志物等临床挑战,开发了一种基于乳酸化相关基因的机器学习血液转录组模型——乳酸化衍生评分(LDS)。该研究通过整合多队列脑转录组数据构建LDS模型,并在独立血浆队列(n=540)中验证其诊断效能。结果显示LDS可有效区分AD与正常对照(NC)(AUC=0.772),与血浆p-tau181/p-tau217联合后诊断性能进一步提升(AUC=0.859),并能识别AT+个体和遗忘型轻度认知障碍(aMCI)。LDS高分个体呈现神经炎症激活和代谢应激特征,表明该模型可为AD的精准数字医疗提供新工具。
阿尔茨海默病(Alzheimer's Disease, AD)是困扰全球老年人群的主要神经退行性疾病,随着人口老龄化加剧,其发病率持续攀升,给家庭和社会带来沉重负担。尽管科学家们已揭示了AD的核心病理特征——包括β淀粉样蛋白(Aβ)沉积、tau蛋白过度磷酸化、突触功能障碍和神经炎症,但如何在疾病早期,甚至在症状出现前准确识别高风险个体,仍是临床实践中的巨大挑战。传统的认知评估、脑脊液(CSF)检测和正电子发射断层扫描(PET)成像要么灵敏度不足,要么具有侵入性且成本高昂,限制了其大规模应用。近年来,血液生物标志物如血浆磷酸化tau181(p-tau181)、磷酸化tau217(p-tau217)等显示出巨大潜力,但它们主要聚焦于Aβ-tau轴,可能忽略了疾病过程中复杂的代谢和表观遗传失调。乳酸化(lactylation)作为一种新发现的将糖酵解与表观遗传调控联系起来的关键修饰,其在AD中的作用尚不明确。能否利用这一新兴机制开发出更全面、更早期的诊断工具呢?这正是东南大学等机构的研究团队在发表于《npj Digital Medicine》的论文中试图回答的问题。
研究人员主要运用了多组学数据整合与机器学习建模、共识聚类分析、功能富集与免疫微环境分析、独立临床队列验证以及SHAP模型可解释性分析等关键技术方法。数据来源包括9个公共AD转录组数据集(如GSE5281、GSE84422等)和一个前瞻性收集的独立临床血浆队列(n=540,来自东南大学附属中大医院)。
转录组分析揭示AD中乳酸化相关染色质和线粒体改变
研究人员整合了GSE5281和GSE84422数据集作为训练队列,鉴定出32个在AD中差异表达的乳酸化相关基因(DE-LRGs)。功能分析显示,上调基因富集于染色质重塑和转录调控,而下调基因则与线粒体功能密切相关,提示乳酸化紊乱可能同时影响AD的表观遗传和代谢层面。
基于乳酸化的亚型分析揭示AD患者的代谢-免疫异质性
通过共识聚类,AD患者被分为两个亚型:Cluster 1表现为高乳酸化评分,代谢和神经元功能通路活跃;Cluster 2则显示出更强的免疫细胞浸润和免疫检查点分子(如CTLA4, PDCD1)上调,尽管乳酸化水平较低。这表明AD存在与乳酸化状态相关的异质性,可能与不同的病理生理机制有关。
LDS诊断模型的开发与验证
研究团队通过随机森林(RF)特征筛选和偏最小二乘广义线性模型(plsRglm)构建了包含7个基因(GFAP, GTF2I, RB1, PFKM, BCLAF1, SPR, SMARCC1)的LDS模型。在训练队列中,LDS区分AD与NC的曲线下面积(AUC)达到0.897。在7个独立的外部验证数据集和独立的临床血浆队列中,LDS均表现出稳健的诊断性能(血浆队列AUC=0.772),且决策曲线分析(DCA)显示其具有临床实用性。
基于SHAP的模型解释与跨队列稳定性
SHAP分析表明,GFAP是对模型贡献最大的基因,其次是RB1和PFKM等。这种特征重要性在不同数据集间保持高度一致,证明了LDS模型的稳健性和生物学合理性。
独立血浆验证证实LDS的临床稳健性和优越性
在包含270名AD患者和180名NC的独立血浆队列中,通过RT-qPCR检测LDS基因表达。LDS模型的表现优于其他8个已发表的AD相关多基因标志物。与血浆p-tau181 (AUC=0.828)和p-tau217 (AUC=0.843)相比,LDS单独使用性能良好,而三者结合的模型诊断效能最高(AUC=0.859)。特别值得注意的是,LDS单独识别AT+(淀粉样蛋白和tau病理阳性)个体的能力也很强(AUC=0.861)。
LDS评分反映人群异质性并与神经病理和功能严重程度相关
亚组分析显示,LDS的诊断性能在不同年龄和性别亚组中存在差异。相关性分析发现,LDS评分与Braak分期、神经纤维缠结密度呈正相关,与MMSE评分呈负相关。在血浆队列中,LDS还与年龄、FRAIL衰弱评分、日常生活能力量表(ADL)评分等相关,表明LDS能够反映疾病的临床和病理严重程度。
LDS高危组呈现神经炎症和代谢功能障碍特征
根据LDS评分将样本分为高危和低危组后,差异表达和富集分析显示,高危组基因显著富集于TNFα信号通路、IL6-JAK-STAT3信号通路、补体激活等炎症相关通路,而氧化磷酸化等代谢保护性通路活性降低。免疫细胞浸润分析也证实高危组具有更强的免疫抑制和促炎特征。
利用乳酸化相关标志物和血浆tau生物标志物对aMCI个体进行风险分层
研究还评估了LDS在遗忘型轻度认知障碍(aMCI)中的应用价值。LDS评分及p-tau181/p-tau217水平在aMCI组中均显著高于NC组。利用五个LDS基因(GFAP, GTF2I, BCLAF1, SPR, SMARCC1)构建的随机森林(RF)分类器区分aMCI与NC的AUC为0.809。当该基因评分与p-tau181/p-tau217结合时,识别aMCI的AUC进一步提升至0.912,识别AT+个体的能力近乎完美(AUC=0.999),显示出极佳的早期风险分层潜力。
药物富集分析揭示AD乳酸化相关基因的潜在治疗靶点
通过药物富集分析,研究人员发现了一些可能靶向LDS关键基因通路的小分子化合物,如组蛋白去乙酰化酶(HDAC)抑制剂(Scriptaid、曲古抑菌素A、丙戊酸)等,为针对乳酸化紊乱的治疗策略提供了线索。
本研究成功开发并验证了LDS这一基于乳酸化相关基因的血液转录组标志物。LDS不仅对AD具有诊断价值,还能识别疾病亚型、反映病理严重程度,并对aMCI和AT+个体进行早期风险分层。其价值在于补充了现有血浆tau生物标志物的不足,揭示了乳酸化在连接代谢应激与神经免疫失调中的潜在桥梁作用。作为一种可扩展、可解释的数字医学工具,LDS有望整合到电子健康记录或数字健康平台中,实现AD的规模化筛查、精准诊断和长期监测,并为开发针对乳酸化通路的新疗法提供了方向。未来需要在更多样化的人群和前瞻性队列中进行验证,并深入探索乳酸化在AD中的具体分子机制。