C反应蛋白在急性肺栓塞中具有超越经典统计关联的预后信息价值:一种新颖的疾病进展结构化路径分析

《PLOS One》:Does C-reactive protein exhibit high prognostic information value in acute pulmonary embolism? A novel structural pathway for disease progression beyond classical statistical associations

【字体: 时间:2026年02月19日 来源:PLOS One 2.6

编辑推荐:

  本研究通过结合经典统计模型与新颖的分类学结构分析,重新评估了急性肺栓塞(APE)的预后因子。结果发现,尽管传统回归模型将年龄识别为最强死亡预测因子,但无结果导向的分类学方法揭示了C反应蛋白(CRP)是患者间结构变异的最显著信号,表明其预后信息价值可能超越传统的基于结果的关联,为风险分层提供了新视角。该框架有助于减少冗余、增强可解释性,并识别出真正相关的预后因素。

  
引言
急性肺栓塞(APE)是一种严重且可能危及生命的疾病,其临床意义源于高死亡率、需要准确的风险分层、多样的临床表现、诊断的复杂性、治疗挑战以及对长期管理的影响。识别关键的预后变量至关重要,这些变量包括血流动力学不稳定、右心室功能障碍、心脏生物标志物(如肌钙蛋白、利钠肽)、人口统计学因素(如年龄、合并症)、炎症标志物、影像学发现、实验室值(如白细胞计数、纤维蛋白原/白蛋白比率)以及综合临床评分,如肺栓塞严重程度指数(PESI)。临床数据集的高维度要求稳健的变量选择技术以减少冗余并提高预测性能。冗余的预测因子——特别是在心血管数据集中——可能反映内部聚类并损害模型的可解释性。
材料与方法
本研究纳入了2009年12月至2018年12月期间在波兰奥波莱大学临床医院心脏病科接受治疗的所有确诊为急性肺栓塞(APE)的患者。数据集包括366名连续确诊患者的医疗记录。通过胸部计算机断层扫描肺血管造影(CTPA)、临床表现和实验室特征等多种方式确诊。共评估了20个潜在的预后变量,包括年龄、体重指数(BMI)、血红蛋白(Hb)、白细胞计数(WBC)、红细胞计数(RBC)、血小板计数(PLT)、尿素(UREA)、肌酐(CREA)、肾小球滤过率(GFR)、葡萄糖(GLU)、钠(Na+)、钾(K+)、氯(Cl-)、CK-MB mass、高敏肌钙蛋白T(hsTnT)、D-二聚体(D-dimer)、校正D-二聚体(aD-dimer)、国际标准化比值(INR)、活化部分凝血活酶时间(aPTT)和C反应蛋白(CRP)。除了已建立的预后标志物外,还特意包括了假定对APE相关死亡率没有直接影响的变量(如钠、氯)以增强数据集的整体变异性。研究采用Kaplan-Meier方法估计1年随访期的总生存概率。模型的判别能力和简洁性使用一致性指数(C-index)、赤池信息准则(AIC)和p值进行评估。此外,研究提出了基于Newton二项式定理的预测因子结构分析,考虑了所有1140个由20个临床变量构成的唯一三元组。对于每个三元组,使用Marczewski–Steinhaus(M–S)度量计算患者之间成对的分类学距离的方阵。该方法侧重于相对差异,使其具有尺度不变性,更适用于关注结构差异模式而非绝对大小的场景。然后,生成按平均距离排序的三元组碎石图,并应用分段回归来检测区分低变异性段和高变异性段的转折点。在每个定义的段中,计算每个临床变量在所有可能的三元组中出现的频率,并使用卡方检验识别显著的过度代表。
结果
经典回归分析与分类学方法得出了不同但互补的结果。经典回归分析方面,Cox回归确定了15个变量具有统计学显著性(p < 0.05),逻辑回归确定了14个。其中,年龄成为最强的预测因素(C-index = 66.6%, AIC = 350.71),而血小板计数显示出最弱的判别性能(C-index = 49.5%, AIC = 377.70)。在多变量Cox回归中,年龄、血红蛋白和INR保持显著;在多变量逻辑回归中,只有年龄保持统计学显著性。
分类学分析方面,研究识别出平均结构距离最低的三元组为Na+/Cl-/INR(平均距离0.259),而平均距离最高的三元组为hsTnT/校正D-二聚体/CRP(平均距离0.709)。通过碎石图和分段回归,在全部1140个三元组中识别出一个明显的结构变化点,位于第963和964个三元组之间,对应的平均分类学距离为0.478。变化点前后的斜率比为5.82,表明高变异性段(第964-1140个三元组)的结构发散增长几乎是低变异性段(第1-963个三元组)的六倍。变量分布分析显示,在分析的20个变量中,有16个在段间的出现频率存在统计学显著差异(p < 0.05)。其中,C反应蛋白(CRP)在高变异性段中的过度代表最为突出,出现在该段177个三元组中的61个里(χ2 = 62.25,p < 0.0001)。其他与高变异性段强相关的因素包括D-二聚体、校正D-二聚体、hsTnT、年龄、血红蛋白和电解质(Na+、K+、Cl-)。相比之下,白细胞计数(WBC)以及三个肾功能标志物——尿素(UREA)、肌酐(CREA)和肾小球滤过率(GFR)——在段间的分布没有统计学显著差异(p > 0.05)。总体而言,所检查的变量表现出三种不同的统计模式:第一类,缺乏显著分化,即频率差异在统计学上与所研究人群的随机变异无法区分(WBC、UREA、CREA、GFR)。第二类,在低变异性段(段1)显著占主导地位,如年龄、BMI、Hb、RBC、PLT和电解质组(Na+、K+、Cl-),其过度代表可能反映了大多数患者三元组中观察到的基线结构配置。第三类,在高变异性段(段2)显著过度代表,包括GLU、CK-MB mass、hsTnT、D-dimer、aD-dimer、INR、aPTT和CRP,它们在该段的聚类反映了统计上显著偏离基线结构,与三元组间结构差异增加的状态一致。
讨论
经典回归分析证实年龄是APE患者死亡的最强统计预测因子,但这引发了一个解释性问题:年龄是一个不可改变的背景特征,反映了累积的脆弱性而非急性病理生理活动,且大量具有统计学显著性的预测因子提示模型变量间存在大量冗余。回归本身在区分哪些生物标志物真正参与疾病过程方面提供的见解有限。
为弥补此局限,研究引入了基于Marczewski–Steinhaus距离的无结果导向分类学框架,旨在独立于临床终点检查各个变量如何影响患者间多维变异性结构。在此框架内,C反应蛋白(CRP)成为塑造多维患者离散度的最活跃生物标志物,而年龄主要促进结构同质性而非疾病驱动的差异性。因此,分类学方法作为一个假设生成过滤器,突出了那些可能携带超越传统回归模型所捕获的病理生理学相关性的生物标志物。
根据结构分析,可以将风险因素的行为划分为三个不同的特征:第一,对疾病临床评估没有实际意义的因素,其对健康或疾病的信号是中性和随机的,如白细胞计数和肾功能标志物。第二,对病理过程不敏感的因素,反映了稳定和持久的患者特征,更类似于健康状态而非对疾病的动态反应,如年龄、BMI、血红蛋白、红细胞、血小板和电解质。第三,显示出可能易受疾病不良影响并对病理过程敏感的因素,表现为在高变异结构段中的显著过度代表和分类学离散度增加,按强度降序排列包括:CRP、D-二聚体、hsTnT、aPTT、CK-MB mass、GLU、校正D-二聚体和INR。
结合回归关系来看,年龄成为APE患者死亡最强预测因子,并不仅仅是统计计算的结果,更因为它是一个不可改变的背景风险决定因素,而非急性病理过程的标志。这一结论源于该变量在与其他患者特征的统计空间中的几何结构,使得患者临床特征彼此更相似。虽然年龄是回归推导出的最佳死亡预测因子,但它不是由APE直接发出的危及生命的风险信号,而是一个间接信号。
考虑到上述统计和临床考量,对单个风险因素的一维分析,如通过变异系数,可能具有误导性。只有结合回归和非回归的方法,才能识别出APE中最可靠的死亡风险因子,根据所提出的方法学,这就是C反应蛋白。随后依次是D-二聚体、hsTnT、aPTT、CK-MB mass、GLU、校正D-二聚体和INR。因此,在单变量Cox和逻辑回归中被确定为具有统计学显著性的众多生物标志物中,只有GLU、CK-MB mass、hsTnT、D-二聚体、INR以及最重要的CRP同时满足两种分析方法作为风险因子的标准。
值得注意的是,先前研究已将升高的CRP水平与APE更高的死亡率和不良结局相关联。本研究的发现扩展了这一证据体系,表明CRP在多维临床空间中具有最强的对患者间变异性的结构贡献,独立于经典的基于回归的关联。在更广泛的心血管和血栓炎症疾病背景下,本研究中观察到的CRP突出的结构行为与大量证据一致,这些证据将全身性炎症与不良结局联系起来。综合来看,这些研究将CRP置于一个连贯的生物学框架中,即炎症在不同临床背景下与血栓形成、内皮功能障碍和组织损伤相互作用。从这个角度来看,本研究关于CRP的分类学发现不仅复制了已知的基于结果的关联,还提供了一个额外的结构层面:表明与CRP相关的炎症活动以经典回归模型无法完全捕捉的方式组织了多维临床变异性。这支持了CRP不仅是临床严重程度的关联物,而且是APE疾病异质性的关键信息驱动因素的解读。
结论
本研究证明,传统的回归分析可能会忽视急性肺栓塞(APE)中预后变量的多维结构。通过使用基于变量三元组的、无结果导向的分类学方法,研究发现C反应蛋白(CRP)在所有分析因素中作为最强的结构信号出现,显示出标准统计技术未能捕捉到的变异性模式。研究结果表明,CRP可能携带具有临床意义的信息,可能反映了参与APE进展的潜在炎症机制。它在高变异性组合中的持续过度代表支持了重新考虑其作用的必要性——不仅仅是作为一种被动的炎症标志物,而是可能作为不良结局的促成因素。本研究引入的分类学框架为识别高价值预后指标提供了一种新颖且互补的工具。通过专注于结构性的变量间关系而非直接的结局关联,该方法有可能丰富临床见解、减少冗余、提高模型可解释性,并揭示在传统分析中可能被隐藏的潜在预后信号。本研究呈现的结果值得在未来研究中进一步探索,包括在独立数据集和前瞻性研究设计中进行验证,以扩展其临床适用性。
研究局限性
本研究存在一些局限性。首先,其回顾性设计依赖于常规临床护理期间收集的数据,这些数据虽然完整,但最初并非为本研究的具体分析目的而设计。其次,所有参与者均来自单一的三级医疗中心,这可能限制了研究结果在其他人群或临床环境中的普适性。第三,所采用的分类学方法是无监督且无结果导向的;因此,分段分析不支持直接的因果推断。最后,尽管几何方法为变量相互作用提供了新的视角,但它需要在独立数据集和前瞻性队列中进行外部验证,以确认其可重复性和临床相关性。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号