预测支气管肺发育不良早产儿肺动脉高压的机器学习模型:一项多中心队列研究

《Journal of Perinatology》:Predicting pulmonary hypertension in infants with bronchopulmonary dysplasia

【字体: 时间:2026年02月21日 来源:Journal of Perinatology 2.4

编辑推荐:

  本文针对支气管肺发育不良(BPD)早产儿并发肺动脉高压(PH)风险预测的临床难题,研究者利用包含每日临床数据的大型多中心队列,分别于校正胎龄(PMA)33周和36周两个时间点,开发并验证了逻辑回归(LR)与长短期记忆(LSTM)网络模型。研究结果显示,LR模型在保持简约性和可解释性的同时,实现了与LSTM模型相当的良好预测性能。该模型的成功构建,为临床早期识别高危患儿、优化监测与干预策略提供了实用工具,有望提升精准医疗水平。

  
对于在新生儿重症监护病房(NICU)中渡过最初艰难时光的极早产儿来说,支气管肺发育不良(Bronchopulmonary Dysplasia, BPD)是他们面临的最常见的长期并发症。然而,一个更为严峻的挑战隐藏在BPD的背后:超过四分之一的中重度BPD患儿会并发肺动脉高压(Pulmonary Hypertension, PH)。一旦发生PH,这些脆弱的小生命将面临更高的死亡率、更严重的发育障碍和更多的并发症,确诊后两年内死亡率超过四分之一。尽管BPD本身已有一些风险预测模型,但专门用于预测BPD患儿是否会进展为PH的工具却一直缺失。临床上,医生们急需一种能够早期、准确识别出PH最高风险患儿的方法,以便进行更密切的监测,并为未来可能的预防性或治疗性干预措施筛选合适的候选者。这不仅是改善患儿预后的关键,也是设计更高效临床试验、加速新疗法研发的重要前提。
为了填补这一空白,一项发表在《Journal of Perinatology》上的研究迈出了重要一步。研究者利用来自北美462家NICU、时间跨度长达十余年(2008-2022年)的大型多中心队列数据,旨在开发并验证能够预测BPD早产儿发生PH风险的机器学习模型。他们聚焦于两个关键的临床时间点:一是针对在校正胎龄(Post-Menstrual Age, PMA)33周时仍需接受机械通气的最高危婴儿;二是针对所有在PMA 36周时仍需任何呼吸支持(符合新生儿研究网络2019年BPD诊断标准)的婴儿。通过分析这两个群体从出生到对应时间点的详细临床数据,研究团队希望能够构建出实用、可靠的预测工具。
为达成此目标,研究人员主要运用了以下几种关键技术方法:首先,他们构建了两个大规模、具有时间代表性的多中心观察性队列,分别对应33周和36周PMA两个预测时间点,数据来源为前瞻性收集的电子健康记录。其次,研究采用了多种机器学习建模策略进行对比,包括可解释性强的逻辑回归(Logistic Regression, LR)模型,以及能够处理时间序列数据的深度学习方法——长短期记忆(Long Short-Term Memory, LSTM)网络模型,同时还包括了多层感知机(Multilayer Perceptron, MLP)模型作为对比。在数据处理上,他们将变量分为静态(如人口统计学、合并症)和动态(如每日实验室检查、用药、呼吸支持)两类,并分别采用特征汇总(用于横断面模型)和序列建模(用于LSTM)的方式进行处理。最后,研究采用严格的内部训练-测试集划分以及独立的时间验证队列(2021-2022年出院的婴儿)来评估模型的泛化性能和稳健性。
研究结果
研究人群特征
在PMA 33周时间点,研究共纳入2849名接受机械通气的婴儿,其中360名(13%)后续发展为PH。在PMA 36周时间点,研究纳入了20,173名接受任何呼吸支持的婴儿,其中770名(4%)后续发展为PH。与未发生PH的婴儿相比,发生PH的婴儿胎龄更小、出生体重更低、黑人比例更高,且死亡率显著升高(33周队列:23% vs 7%;36周队列:12% vs 1%)。
模型性能与关键预测因子
在PMA 33周时间点,逻辑回归模型筛选出的前六个关键预测因子包括:出生体重、咖啡因总使用天数、全身性类固醇总使用天数、是否存在早期PH、以及33周PMA前的最后吸入氧浓度(FiO2)和毛细血管血气(CBG)二氧化碳分压(pCO2)。该模型的区分能力良好,受试者工作特征曲线下面积(AUROC)为0.726。
在PMA 36周时间点,逻辑回归模型筛选出的前六个关键预测因子包括:出生体重、是否存在房间隔缺损(Atrial Septal Defect, ASD)、全身性类固醇总使用天数、以及36周PMA前的最后血清氯离子水平、CBG pCO2和呼吸支持级别。该模型的区分能力更强,AUROC达到0.826。
在验证队列中,两个时间点的逻辑回归模型均保持了稳健的性能(33周AUROC 0.726, 36周AUROC 0.778)。值得注意的是,在两个时间点,逻辑回归模型的表现都与更为复杂的LSTM模型相当,甚至略优,而MLP模型的表现相对较弱。
讨论与结论
这项研究成功开发并验证了用于预测BPD早产儿发生PH风险的模型,模型在两个时间点(PMA 33周和36周)均表现出良好的区分能力,并在独立的时间验证队列中得到了确认。研究表明,低出生体重、呼吸支持需求(反映肺部疾病严重程度)以及血气中的pCO2水平是预测PH的核心临床指标。此外,全身性类固醇的暴露时长、房间隔缺损的存在以及血清氯离子水平等因素也提供了额外的预测价值。
研究结果具有多重重要意义。首先,这些模型使用了易于获取的临床变量,为床边识别PH最高风险婴儿提供了实用工具,有助于实现早期预警和针对性加强监测。其次,模型可用于未来PH预防或治疗性临床试验的“预后富集”,即筛选更有可能发生结局的患儿入组,从而提高试验效率和研究效能。最后,研究发现逻辑回归模型在性能上与复杂的LSTM网络相当,这意味着一个更简约、更易解释的模型足以满足当前的预测需求,更有利于临床转化和应用。
当然,研究也存在一定局限性,例如PH的定义基于临床诊断或药物使用,而非金标准的心导管检查;模型仅涵盖了住院期间的数据,而部分患儿可能在出院后仍会发病;并且需要进一步的前瞻性外部验证以确保其普适性。尽管如此,这项工作为改善BPD相关PH这一严峻临床问题的管理迈出了关键一步,标志着向基于风险的精准化管理模式转型的重要开端。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号