《Frontiers in Immunology》:Etiological study of pulmonary infections following solid organ transplantation using metagenomic next-generation sequencing and development of a risk prediction model: a retrospective cohort study
编辑推荐:
目的:分析实体器官移植(Solid Organ Transplantation, SOT)后肺部感染的病原学病因,并基于宏基因组二代测序(Metagenomic Next-Generation Sequencing, mNGS)技术构建预后预测模型,系统识别关
目的:分析实体器官移植(Solid Organ Transplantation, SOT)后肺部感染的病原学病因,并基于宏基因组二代测序(Metagenomic Next-Generation Sequencing, mNGS)技术构建预后预测模型,系统识别关键预测因子,为临床风险分层和个体化干预提供证据。方法:回顾性收集2020年1月至2023年12月在一家医院接受肝或肾移植后发生肺部感染患者的临床数据。所有患者均接受支气管肺泡灌洗液或痰液的mNGS检测以鉴定病原体。收集的数据包括人口统计学特征、移植相关参数、基础疾病、实验室检测结果、mNGS病原体检测结果和预后指标。数据集被随机分为训练集(n=262)和测试集(n=66)。在自动机器学习(Automated Machine Learning, AutoML)框架内,使用改进的达摩优化算法(Improved Dharma Optimization Algorithm, IDRA)对模型超参数进行优化。通过LASSO回归和SHAP可解释模型双向验证特征重要性,并开发了基于MATLAB的交互式决策支持系统。结果:mNGS对病原体的总体阳性检出率显著高于常规方法(84.76% vs. 61.89%,P<0.001)。训练集和测试集之间的基线特征或实验室指标均无统计学显著差异(均P>0.05),证实了随机分层抽样的有效性。两个队列的不良预后事件比例高度一致(训练集:27.48% vs. 测试集:28.79%,χ2=0.045,P=0.832)。预测模型在训练集上的受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, ROC-AUC)为0.9694,精确率-召回率曲线下面积(Area Under the Precision-Recall Curve, PR-AUC)为0.9690;在测试集上的ROC-AUC为0.9206(95% CI: 0.854-0.987),PR-AUC为0.9273(95% CI: 0.867-0.988),优于对比模型。最终筛选出14个关键变量:mNGS细菌检出、mNGS真菌检出、降钙素原(Procalcitonin, PCT)、C反应蛋白(C-Reactive Protein, CRP)、mNGS病毒检出、白细胞计数、肌酐、移植后时间、中性粒细胞百分比、糖尿病、年龄、总胆红素、丙氨酸氨基转移酶(Alanine Aminotransferase, ALT)和淋巴细胞百分比。与AutoML筛选变量的特征重叠率为78.6%(11/14)。SHAP分析显示了降序的重要性排名:mNGS细菌检出、mNGS真菌检出、PCT等。结论:本研究整合多维临床数据与可解释机器学习技术,证实了病原学病因特征在移植术后肺部感染预后预测中的核心作用,并展示了实时风险评估以指导临床决策的潜力。然而,其作为干预指南的疗效需要在不同医疗环境中进行前瞻性验证。这项工作提供了创新工具和方法学框架,以推进精准诊断和管理,并通过多中心合作进行持续优化。
实体器官移植(Solid Organ Transplantation, SOT)是终末期器官衰竭患者唯一有效的长期治疗手段。随着外科技术的进步、免疫抑制方案的优化以及围手术期管理的加强,其1年生存率已显著提高至90%以上。然而,移植后的免疫抑制状态持续增加了感染风险,其中以症状隐匿、进展迅速、病原体多样为特征的肺部感染,已成为移植受者非肿瘤性死亡的首要原因。临床数据表明,该并发症影响20%–40%的受者,重症病例死亡率超过50%,损害移植物功能和长期生存结果,构成了移植领域的关键挑战。传统病原体检测方法(如微生物培养、显微镜检查、免疫学检测)虽然简便且经济,但存在显著局限性:细菌培养需要3–5天才能出结果,无法满足快速早期诊断的需求;对真菌、病毒和非典型病原体(如耶氏肺孢子菌、巨细胞病毒)的灵敏度受样本质量和培养条件影响,导致30%–60%的漏诊;此外,这些方法很少能检测到罕见病原体或新出现的变异株。由于移植受者常表现为混合感染,单一传统检测无法全面捕捉感染谱,迫使临床医生采取经验性抗微生物治疗。这种广谱、盲目的用药实践可能延误最佳治疗、加剧抗菌药物耐药性、诱导药物毒性并浪费医疗资源,最终损害患者康复。宏基因组二代测序(Metagenomic Next-Generation Sequencing, mNGS)提供了一种创新的诊断解决方案。这种无假设的技术通过高通量测序和生物信息学分析,在24-48小时内全面识别样本中的细菌、真菌、病毒和寄生虫,同时检测抗生素耐药基因和毒力因子,实现无偏倚的病原体筛查。现有证据强调了mNGS在免疫功能低下群体(如血液系统恶性肿瘤、HIV感染者)中的高诊断准确性。然而,其在SOT相关肺部感染中的临床应用价值仍需进一步验证。关键在于,SOT肺部感染患者的预后差异很大,但目前尚无可靠的预后评估工具。现有研究主要关注病因学诊断,对预后因素的探索较为零散,未能建立整合临床特征、实验室指标和病原体谱的综合预测模型。因此,本研究旨在:系统评估mNGS的诊断价值,量化其与常规方法相比的表现及对临床决策的影响;识别独立的预后风险因素,并构建和验证预测模型。这些目标旨在为SOT术后肺部感染的精准诊断和个体化管理提供理论基础。本研究采用回顾性队列研究设计,数据来源于树兰(杭州)医院电子病历系统。纳入标准为:术后出现明确的肺部感染症状(如发热、咳嗽、呼吸困难)并有影像学证据(CT或X线)支持;有完整且可追溯的BALF/痰液mNGS结果;临床记录完整性≥95%。排除标准包括:非BALF/非痰液样本或技术无效的mNGS结果;继发于肺外播散或原发灶不明的肺部感染;合并严重免疫缺陷疾病或移植后48小时内死亡导致无法观察结局。本研究得到了医院伦理委员会的批准。主要关键的技术方法包括:使用mNGS技术对支气管肺泡灌洗液或痰液样本进行病原体检测;应用基于改进的达摩优化算法(IDRA)的自动机器学习(AutoML)框架进行特征筛选和模型超参数优化;采用LASSO回归和SHAP(SHapley Additive exPlanations)可解释模型进行特征重要性验证与分析;构建了基于MATLAB的交互式决策支持系统。
研究结果方面,首先,在病原体检出率比较方面,研究人员发现mNGS对肺部感染病原体的总体阳性检出率(84.76%)显著高于常规微生物学方法(61.89%),差异具有统计学意义(P<0.001)。mNGS在病毒(29.88% vs. 12.80%)和真菌(26.52% vs. 15.55%)检测方面优势尤为突出,细菌检出率(59.45% vs. 51.22%)也显著高于传统培养。此外,mNGS检测到的混合感染比例(22.26%)远高于常规方法(8.54%)。其次,在改进的群体智能算法性能评估方面,通过对改进的IDRA算法与原始DRA、WOA、GWO、PSO、GA等算法在CEC2022基准函数集上的测试表明,IDRA在大多数测试函数上表现出显著优于其他算法的稳定性和更快的收敛速度,陷入局部最优的风险最低,证实了其在全局优化性能和收敛效率上的优势。第三,在模型训练评估方面,通过AutoML框架自动搜索和优化后,最终确定的最优基础预测模型架构为梯度提升树的变体。在训练集交叉验证中,该“AutoML模型”的综合性能最优,ROC-AUC达0.9694,PR-AUC达0.9690,F1分数为0.8964,优于逻辑回归、支持向量机、AdaBoost、XGBoost和LightGBM等对比模型。第四,在测试集预测性能比较方面,AutoML模型在独立测试集上表现出最强的鲁棒性,ROC-AUC为0.9206,PR-AUC为0.9273。决策曲线分析(Decision Curve Analysis, DCA)证实,在15%–60%的预测风险阈值范围内,使用该模型指导临床干预(如ICU预备或加强监测)可带来显著的净获益,优于“全部治疗”和“全部不治疗”策略。校准曲线分析显示,AutoML模型的校准性能显著优于其他模型,Brier评分最低(0.130)。第五,在可解释性分析方面,通过LASSO回归筛选出14个与预后显著相关的变量,与AutoML筛选特征的重叠率为78.6%。SHAP分析量化了特征贡献,按重要性降序排列为:mNGS细菌检出 > mNGS真菌检出 > PCT > CRP > mNGS病毒检出 > 白细胞计数 > 肌酐 > 移植后时间 > 中性粒细胞百分比 > 糖尿病 > 年龄。交互分析进一步揭示了关键指标间的协同效应,例如,mNGS确认细菌检出时会显著增强PCT的预测价值。
讨论部分指出,实体器官移植是治疗终末期器官衰竭的有效方法,但术后肺部感染是严重影响患者和移植物存活率的主要并发症。尽管常规临床评估可诊断感染,但在病原体检出率上存在局限性。mNGS作为一种新兴病原体检测技术,无需预设病原体靶点,不受抗生素影响,直接对临床样本进行核酸提取和测序,通过生物信息学比对鉴定病原微生物,在危重或病原体未明感染中具有高灵敏度和短检测周期的优势。本研究结果证实了mNGS在移植术后肺部感染病原体检出中的优势。研究提出的AutoML算法旨在解决传统随机森林算法在处理高维mNGS数据时的局限性,通过Tent混沌映射和动态高斯变异机制提升了模型性能。研究创新性地将mNGS病原体分型数据与患者临床特征整合,揭示了11个核心特征与预后之间的非线性关联。SHAP分析证实了病原体载量在风险预测中的主导作用。尽管mNGS技术有效克服了传统检测的局限性,但其周转时间仍受限于测序基础设施要求,通常需要24-48小时。因此,研究倡导分层诊断策略:常规筛查优先使用传统方法(培养/PCR),将mNGS保留用于培养阴性、疑似罕见/难培养病原体或病情恶化的免疫功能低下患者。研究的局限性包括:单中心数据偏倚、缺乏外部验证队列、mNGS解读复杂性、成本约束、分析流程不统一以及模型泛化能力受限等。未来方向包括建立多中心平台、整合动态病原体数据库、实施分层检测策略、建立实验室间质量控制以及利用连续监测数据进行动态风险预测。
研究结论部分指出:本研究开发的预后预测模型整合了临床数据、机器学习和决策支持。其核心价值不仅在于超越了传统模型的预测能力,还开创了一种可解释、用户友好且高效的评估范式,为改善实体器官移植术后肺部感染的预后开辟了新途径。然而,其作为干预指南的临床转化需要在不同医疗环境中进行前瞻性验证。