血浆蛋白质组学模型:超越临床与遗传模型,精准预测非糖尿病人群新发慢性肾病风险

《CHINESE MEDICAL JOURNAL》:Plasma proteomics outperforms clinical and genetic models for chronic kidney disease prediction in non-diabetic adults

【字体: 时间:2026年03月21日 来源:CHINESE MEDICAL JOURNAL 7.3

编辑推荐:

  本研究通过分析超过4万名非糖尿病成年人的近3000种血浆蛋白,开发并验证了一个用于预测新发慢性肾病(CKD)的蛋白风险评分。该评分模型在判别能力和重新分类指标上均显著优于现有临床模型(CKD-PC模型)和多基因风险评分(PRS)。一个简化的五蛋白模型(CD59、COL6A3、HRC、ITGB2、HAVCR1)表现同样出色。该研究为在非糖尿病人群中实现早期、精准的CKD风险分层提供了有力工具。

  
研究背景与方法
慢性肾病(Chronic Kidney Disease, CKD)是一种影响全球约10%成年人的重大健康问题,但其早期通常没有明显症状,使得早期发现和干预充满挑战。尽管已有基于临床指标的风险分层模型,如CKD预后联盟(CKD-PC)临床模型,以及基于遗传信息的聚合基因风险评分(Polygenic Risk Score, PRS),但其预测能力均有局限。高通量蛋白质组学技术为发现新的生物标志物提供了强大工具,因为它能捕捉动态的生物过程,整合了遗传和环境因素的综合影响。然而,以往的蛋白质组学研究多集中于高风险人群(如糖尿病患者)或疾病进展,而非普通人群中的新发CKD事件。
为了填补这一空白,本研究在超过4万名无糖尿病的英国生物银行(UK Biobank)参与者中,分析了近3000种血浆蛋白质。研究旨在开发并验证一个基于蛋白质的评分,用于预测新发CKD,并评估其性能是否优于既有的CKD-PC临床模型和CKD PRS。
研究数据来源于英国生物银行,这是一项大规模前瞻性队列。血浆蛋白质组检测使用了Olink Explore 3072平台。研究人员在训练集中,通过结合LASSO回归进行变量选择的Cox比例风险模型,开发了蛋白质风险评分。该评分的性能与CKD-PC临床模型(包含年龄、性别、种族、体重指数、吸烟状态、心血管病史、高血压、估算的肾小球滤过率(eGFR)和尿白蛋白肌酐比等变量)以及CKD PRS进行了比较。主要研究结局为新发CKD事件。模型的性能通过C指数(Harrell’s C-index)、综合判别改善指数(Integrated Discrimination Improvement, IDI)、净重分类改善指数(Net Reclassification Improvement, NRI)和决策曲线分析(Decision Curve Analysis)进行评估。
研究人群与模型构建
研究共纳入41,120名无基线CKD或糖尿病的参与者,并将他们分为一个开发队列(进一步按7:3比例分为训练集和测试集)和一个验证队列。训练集和测试集之间基线特征平衡。相比于开发队列,验证队列中白种人比例更高、吸烟率更高、体重指数更高、基线eGFR更高,同时心血管疾病和高血压患病率也更高,但CKD发病率较低。
通过对2911种血浆蛋白进行LASSO回归分析,最终构建了一个包含86种蛋白质的CKD蛋白风险评分。在这86种蛋白质中,影响最大的五种分别是:CD59糖蛋白(CD59)、胶原α-3(VI)链(COL6A3)、肌浆网富组氨酸钙结合蛋白(HRC)、整合素β-2(ITGB2)和甲型肝炎病毒细胞受体1(HAVCR1)。在中位随访12.4年的测试集中(观察到264例新发CKD),蛋白风险评分与CKD风险显著正相关(每增加一个标准差,调整后的风险比HR为1.88)。
生物学通路与网络分析
这86个候选蛋白显著富集于多个关键的生物学过程,包括血管生成、细胞外区域定位和受体结合活性。通路分析进一步发现,磷酸肌醇3-激酶/蛋白激酶B(PI3K/Akt)信号通路是最显著的富集通路。蛋白质-蛋白质相互作用网络分析揭示了高度互连的蛋白质簇,其中表皮生长因子受体(EGFR)、基底膜特异性硫酸乙酰肝素蛋白聚糖核心蛋白(HSPG2)和生长分化因子15(GDF15)成为网络的中心枢纽。这些排名靠前的蛋白质在相互作用网络中具有最高的中介中心性、接近中心性和度中心性值,表明它们在网络中发挥着关键作用。
模型性能比较与临床价值
在测试集中,完整的86蛋白风险评分展现出了卓越的判别能力(C指数:0.838),其性能超越了CKD-PC临床模型(0.825)和CKD PRS(0.749)。令人瞩目的是,一个仅包含上述五种关键蛋白质的简化模型也表现强劲(C指数:0.810),其表现可与CKD-PC临床模型相匹敌。这些结果在独立的验证队列中保持一致(完整蛋白评分:0.866;五蛋白模型:0.860),所有模型在测试集中均显示出良好的校准度。
无论将完整的蛋白风险评分还是五蛋白组合添加到CKD-PC临床模型中,都能显著提升模型的预测准确性和重分类指标,而CKD PRS则未能提供任何增量价值。具体而言,在CKD-PC模型基础上增加完整蛋白评分,可显著提升模型的区分度(ΔC指数:0.029)、综合判别能力(10年IDI:0.009)和净重分类能力(NRI:0.162)。五蛋白组合也显示出相似的益处(ΔC指数:0.017;IDI:0.007;NRI:0.162)。相比之下,CKD-PRS并未增强模型性能(所有指标改善值接近0)。决策曲线分析证实,整合蛋白质信息的模型在临床决策中具有更大的净获益。
研究者还根据约登指数确定的风险评分临界值(-0.53,特异度73.4%,灵敏度74.6%)将参与者分为低风险和高风险组。高风险组在测试集和验证集中均显示出显著升高的CKD发病率。此外,在训练集内的比较分析显示,基于LASSO的模型相对于XGBoost方法取得了更优的预测性能。
讨论与意义
尽管在糖尿病患者的CKD蛋白质组学预测因子方面已取得重大进展,但这些标志物是否能推广到非糖尿病人群尚不清楚。本研究的一个关键优势在于其专门针对非糖尿病人群,这一设计选择旨在隔离和识别在没有糖尿病情况下,与新发CKD特异相关的蛋白质组信号,因为糖尿病会深刻改变蛋白质组景观和CKD的病理生理。
CKD PRS表现不佳,这与CKD的复杂病因学相一致,其中可改变的环境因素和获得性疾病通常比遗传倾向更重要。CKD相关性状的中等遗传力意味着,当前PRS构建未能捕获很大一部分疾病风险。
本研究的通路和网络分析为预测模型提供了生物学机制支持。所识别的蛋白质在血管生成、细胞外基质调控和PI3K/Akt信号通路等过程中的富集,与已确立的肾损伤和纤维化机制高度一致。EGFR、HSPG2和GDF15等关键枢纽蛋白的发现,进一步强化了该模型与核心肾脏病理生物学的联系。
值得注意的是,模型中最具影响力的五种蛋白质与肾脏生理有着合理的联系。HAVCR1是急性肾损伤的既定生物标志物,并越来越多地与CKD进展相关联。COL6A3与细胞外基质积聚和肾纤维化有关。ITGB2在炎症中发挥作用,而炎症是肾损伤的关键驱动因素。HRC可能反映了影响肾血流动力学的血管或心脏功能紊乱。CD59是一种补体调节蛋白,保护组织免受补体介导的损伤。
从临床实施的角度来看,五蛋白组合的性能尤为重要。这个精炼的蛋白组合代表了性能与实用价值之间的最佳平衡。应用五蛋白检测在技术上是可行的,可能具有成本效益,并且适合用于大规模人群筛查。
本研究也存在一些局限性。首先,英国生物银行的人群普遍更健康,这可能低估了CKD的绝对风险。其次,参与者主要为欧洲白人后裔,需要在多民族人群中进行进一步研究。第三,所使用的PRS可能并非针对此特定人群的最优评分。最后,所识别的蛋白质在CKD发病机制中的功能作用需要进一步的功能验证。
总之,这项大规模蛋白质组学分析建立了一个稳健的蛋白质风险评分,可显著改善对非糖尿病人群中新发CKD的预测。该蛋白质组特征,特别是精简为实用的五蛋白组合时,其性能超越了临床和遗传模型,为症状前风险分层提供了有力工具。所确定的生物学通路和特定蛋白质为理解CKD病理生理学和指导未来机制研究提供了宝贵资源。将这种简化的蛋白质组学组合转化为临床可部署的检测方法,在实现早期、靶向的预防策略以减轻日益增长的全球CKD负担方面具有广阔前景。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号