《Scientific Reports》:Unsupervised cluster analysis identifies risk profiles driving heterogeneity and survival patterns in aortic aneurysm patients
编辑推荐:
本研究针对主动脉瘤(AA)患者群体异质性高、风险分层困难,提出利用“表型图谱(Phenomapping)”无监督聚类算法,对英国生物样本库(UK Biobank)中主动脉病理患者进行风险分型。研究发现,心血管合并症是驱动患者分群和影响全因死亡率的主要因素,而非动脉瘤形态学差异,相关合并症指数有助于优化风险预测。
主动脉瘤(Aortic Aneurysm, AA)是一种潜在致命的血管疾病,犹如体内一颗随时可能破裂的“定时炸弹”。这类疾病的诊治面临一个核心难题:患者群体高度异质。同样是主动脉瘤患者,有些人可能多年相安无事,而另一些人则病情迅速进展,甚至发生致命的破裂或夹层。传统的临床分类主要依据动脉瘤的形态(如大小、位置)和临床表现,但这套标准似乎不足以精准捕捉和预测这种内在的差异性。究竟是什么因素在驱动不同患者截然不同的病程与命运?是动脉瘤本身的特点,还是患者身上携带的一系列“共病”(合并症)在幕后起着更关键的作用?这种不确定性给临床医生的风险分层和个性化治疗决策带来了巨大挑战。
为了拨开这团迷雾,一项发表在《Scientific Reports》上的研究另辟蹊径,将目光投向了“数据驱动”的解决方案。研究人员猜想,在患者海量的临床数据中,可能隐藏着超越传统分类的、更具生物学意义的风险特征。于是,他们利用“表型图谱(Phenomapping)”这一方法,对英国生物样本库(UK Biobank)中记录有主动脉病理(国际疾病分类ICD-10代码I71组)的数千名患者展开了深入分析。研究核心是应用无监督聚类算法(k-means),仅根据患者的 demographics 和临床表型数据(特别强调相关合并症),让机器“自主”地将相似的患者归为同一群组,从而发现数据中天然存在的、同质性更高的亚型。主要分析聚焦于最常见的腹主动脉瘤(Abdominal AA)患者群体,并在其他类型的主动脉病理(如胸主动脉瘤、主动脉夹层)中进行验证,以期探寻普适性的规律。研究的终点指标是硬核的——全因死亡率。
通过这项探索,研究团队得出了颠覆传统认知的结论。他们发现,在驱动患者分群、进而影响其长期生存的关键因素中,动脉瘤的形态学差异竟然退居次席,而心血管系统的合并症(如冠心病、心力衰竭等)脱颖而出,成为最强的“分离器”。这意味着,一个合并严重心血管疾病的患者,无论其动脉瘤的具体形态如何,都可能与另一个心血管状况相似但动脉瘤形态不同的患者归于同“类”,并且他们面临着显著更高的死亡风险。研究进一步揭示,心血管与肾脏的合并症(心肾多病共存,Cardiorenal multimorbidity)是区分患者风险层级最相关的表型特征,基于此构建的合并症指数具有重要的信息价值。然而,研究也谨慎指出,动脉瘤病理本身所带来的疾病负担,会与这些合并症产生叠加效应,非线性地推高死亡风险,因此在基于合并症进行风险评估时,必须将主动脉疾病本身的影响纳入考量。
为开展此项研究,研究人员主要应用了以下几项关键技术方法:首先,研究基于大规模人群队列“英国生物样本库(UK Biobank)”的数据,纳入了所有记录有主动脉病理(ICD-10 I71)的参与者作为研究对象。其次,核心分析方法为“无监督聚类”,具体采用了k-means算法,依据选定的人口统计学和临床表型变量对患者进行分组。最后,利用生存分析(具体方法未在摘要中详述,但提及了“Survival analysis”)来比较不同聚类组之间的全因死亡率差异,从而评估各风险表型的预后意义。
研究结果
- •
研究人群与聚类分析:研究共纳入4623名参与者,包括腹主动脉瘤(66.9%)、胸主动脉瘤(25.4%)、胸腹主动脉瘤(0.5%)和主动脉夹层(7.2%)患者。通过对腹主动脉瘤亚组进行无监督聚类,成功识别出由不同表型特征定义的患者亚群。验证分析在其他主动脉病理类型中也重复了类似的聚类模式。
- •
心血管合并症是主要驱动因素:分析表明,心血管合并症是区分不同患者集群的最主要驱动因素,其影响力超过了动脉瘤的形态学差异。这一发现在主要分析(腹主动脉瘤)和验证分析(其他主动脉病理)中均保持一致。
- •
合并症与生存结局关联:生存分析结果清晰地显示,那些在聚类中被归为具有多重合并症(特别是心血管相关疾病)的集群,其全因死亡率显著高于其他集群。这表明基于表型聚类识别出的风险特征与患者的实际预后密切相关。
- •
心肾多病共存的核心作用:深入分析提示,心血管和肾脏的合并症(心肾多病共存)是区分主动脉瘤患者、并关联其死亡风险的最关键表型分隔器。这些合并症信息可用于构建具有预测价值的合并症指数。
- •
疾病负担的非线性叠加效应:研究指出,死亡风险的增加并非线性,这可能提示主动脉病理本身的疾病负担与患者已有的合并症(如心肾疾病)产生了叠加效应,共同推高了死亡风险。因此,在利用这些合并症进行风险评估时,必须考虑到主动脉疾病自身的影响。
结论与讨论
本研究通过应用无监督表型图谱技术,在大规模主动脉瘤患者队列中揭示了超越传统形态学分类的、以合并症(尤其是心血管和肾脏疾病)为核心驱动的风险分型体系。研究的主要结论是:在主动脉瘤患者巨大的异质性背后,心血管合并症,特别是心肾多病共存的状态,是区分患者风险层级和预测其长期生存结局的最强有力因素,其重要性甚至超过了动脉瘤本身的形态特征。这一发现挑战了主要依据动脉瘤尺寸和位置进行风险评估的常规临床思维,将关注点引向了患者的全身性共病状态。
其重要意义在于:首先,它为主动脉瘤的精准医疗提供了新视角。通过数据驱动的聚类方法,临床医生可以识别出那些“高风险表型”的患者,即使他们的动脉瘤形态学指标看起来并不十分危急,从而提前加强监测和综合治疗干预。其次,研究提示未来的风险预测模型应整合强有力的合并症指标,而本研究识别出的关键合并症(心血管、肾脏疾病)为构建此类模型提供了重要的变量依据。最后,研究发现的“非线性风险叠加”现象警示,在管理主动脉瘤患者时,需要采取一种全局性的策略,即在处理局部血管病变的同时,必须积极管理和优化患者的全身健康状况,特别是心血管和肾脏功能,这可能对改善患者总体预后具有至关重要的作用。这项研究将机器学习与临床医学深度融合,为理解复杂疾病异质性和实现个体化风险管理迈出了坚实的一步。