《Annals of Neurology》:Genetic-Proteomic Integration Identifies Predictive Plasma Proteins for Multiple Sclerosis
编辑推荐:
摘要
多发性硬化症(Multiple Sclerosis, MS)在首发临床症状出现前存在长期临床前阶段。识别能够反映这一早期生物学过程的循环生物标志物,有助于优化风险分层并指导干预策略。研究人员旨在通过大规模蛋白质基因组学整合,鉴定影响MS易感性的血浆蛋白,
摘要
多发性硬化症(Multiple Sclerosis, MS)在首发临床症状出现前存在长期临床前阶段。识别能够反映这一早期生物学过程的循环生物标志物,有助于优化风险分层并指导干预策略。研究人员旨在通过大规模蛋白质基因组学整合,鉴定影响MS易感性的血浆蛋白,并评估其诊断前预测价值及对疾病严重程度的影响。研究采用顺式作用蛋白数量性状位点(cis-acting protein quantitative trait loci, cis-pQTL)数据,覆盖2,545种血浆蛋白(n=80,824)。通过孟德尔随机化(Mendelian randomization, MR)与共定位分析(colocalization),在14,802例病例与26,703例对照中检验预测蛋白水平与MS风险的关联,并结合剪接注释解析不同检测平台间的差异。研究人员在英国生物样本库(UK Biobank)诊断前样本(124例病例,52,515例对照;中位诊断前时间为5.9年)中验证了候选蛋白对MS发病的预测能力,并在12,584例患者中评估其与疾病严重程度的关联。结果显示,共鉴定出39种与MS风险相关的蛋白,其中大多数形成密集互作网络,富集于免疫调节通路、B/T细胞共刺激、细胞因子信号及爱泼斯坦-巴尔病毒(Epstein–Barr virus, EBV)相关通路。转录组富集分析显示其在B细胞亚群中表达最强。剪接数据表明,蛋白质组学平台间的不一致反映了不同蛋白亚型(proteoforms)的检测差异。在诊断前样本中测定的28种遗传相关蛋白中,8种与MS确诊时间显著相关,富集程度超过随机预期(pbinom=4.92×10?5)。DKKL1在风险、发病率及严重程度分析中均表现出一致的保护性关联。整合pQTL数据使共定位位点的精细定位分辨率提高10倍以上,并提名13个潜在新型风险位点。该研究建立的整合框架可识别因果蛋白、细化风险位点,并为开发具有转化潜力的早期预测生物标志物提供支持,推动基于遗传锚定标志物的临床前疾病检测与干预策略。《Annals of Neurology》2026年刊载。
多发性硬化症是一种目前尚无法治愈的慢性自身免疫性疾病,现有疗法虽可改善患者预后,却难以阻止长期残疾进展。越来越多的证据表明,MS病理过程在首次临床症状出现前已持续多年,这为早期干预提供了关键窗口期。然而,由于MS发病率较低且干预效果评估需要长期随访,目前缺乏可用于临床试验富集与风险分层的实用早期生物标志物。血液蛋白因易于获取且具有潜在机制指示意义而成为理想候选,但既往蛋白质组学研究受限于样本量与成本,且难以区分因果性改变与疾病继发效应。遗传学研究虽已发现超过200个MS风险相关变异,但多数位于非编码区,难以精准定位因果基因。在此背景下,研究人员通过整合遗传学与蛋白质组学数据,旨在克服传统研究的局限,系统识别MS致病蛋白并验证其预测价值。
为实现上述目标,研究人员采用了多队列整合分析策略。研究基于三个大型蛋白质组学队列(英国生物样本库UKB、冰岛deCODE遗传学DCG、英国Fenland研究FEN)的顺式蛋白数量性状位点数据,涵盖2,545种血浆蛋白。通过两样本孟德尔随机化分析与贝叶斯共定位方法,在独立病例对照数据中检验蛋白与MS风险的因果关系。为解析平台间差异,研究人员整合了GTEx v10的剪接数量性状位点数据进行注释。诊断前预测价值在英国生物样本库前瞻性队列中通过Cox比例风险模型验证,疾病严重程度关联则基于12,584例患者的年龄相关MS残疾评分进行孟德尔随机化分析。此外,研究人员通过整合pQTL数据改进风险位点的精细定位,并提名独立于已知风险位点的新型候选区域。
在结果部分,研究人员首先通过全蛋白质组孟德尔随机化分析,结合单/多因果变异假设下的共定位验证,最终确定39种与MS风险存在因果关联的蛋白。这些蛋白形成了高度互联的网络结构,其中53%的蛋白聚集于以CD40、CD5、TNFRSF1A、MAPK3、STAT3、IL7R、SLAMF1和CD58为核心的最大互作簇。网络中心性与蛋白效应量呈强正相关,表明关键免疫调节分子在MS易感性中起核心作用。通路富集分析显示这些蛋白显著参与B细胞受体信号、EBV感染及膜攻击复合物调控等过程。转录组细胞类型特异性分析进一步揭示,编码这些蛋白的基因在外周血B细胞亚群(尤其是初始B细胞、耗竭记忆B细胞和非转换记忆B细胞)中表达富集最为显著。
针对跨平台一致性问题,研究发现基于适配体(aptamer)的检测平台间因果效应相关性极高(r=0.94),但与基于抗体(antibody)的Olink平台相关性较弱(r=0.55-0.57)。通过整合剪接数量性状位点注释,排除具有不一致剪接证据的位点后,跨平台相关性显著提升至0.95-0.99,证明可变剪接导致的蛋白亚型差异是平台间不一致的主要来源。
在诊断前样本验证中,28种可用Olink平台检测的关联蛋白里有8种与MS发病风险显著相关,富集程度远超随机预期(pbinom=4.92×10?5)。值得注意的是,除DKKL1外,其余蛋白的效应方向与孟德尔随机化估计值并不一致,可能反映了终生遗传效应与短期诊断前蛋白动态变化的差异。DKKL1是唯一在风险、发病率及严重程度分析中均显示保护性效应的蛋白,且在男女群体中效应一致,提示其可能通过B细胞而非生殖系统发挥保护作用。
在精细定位方面,单独使用MS全基因组关联研究数据仅能在33.3%的共定位位点构建95%可信集,而整合pQTL数据后所有位点均可成功构建,且条件精细定位的可信集大小较单纯GWAS分析缩小12.3倍,在多信号假设下缩小幅度可达23倍。研究人员还据此提名了15个潜在新型MS风险位点,其中13个在独立队列(FinnGen与UKB合并)中显示出与发现阶段一致的风险效应方向。
在讨论部分,研究人员指出该研究的网络分析结果强调了B/T细胞共刺激通路的核心地位,特别是CD40-CD58信号轴与EBV生物学过程的深度交织,这与现有B细胞清除疗法的临床获益机制相吻合。研究创新性地揭示了可变剪接导致的蛋白亚型差异是蛋白质组学平台间不一致的关键原因,并通过遗传整合将跨平台相关性提升至接近完全一致的水平。诊断前验证证实了遗传优先排序策略在早期发现生物标志物中的有效性,而DKKL1的多效性关联为同时靶向疾病易感性与进展提供了新线索。精细定位分辨率的提升与新型位点的提名为后续功能研究与更大规模遗传验证指明了方向。总体而言,该研究建立了一个可推广的遗传-蛋白质组学整合框架,不仅深化了对MS发病机制的理解,也为开发经遗传证据支持的转化医学应用提供了可靠路径。论文发表于《Annals of Neurology》。