《Frontiers in Cellular and Infection Microbiology》:Urine volatile organic compounds profiling via GC-IMS combined with machine learning: a powerful diagnostic and pathogen differentiation tool for urinary tract infections
编辑推荐:
本综述创新性地将气相色谱-离子迁移谱(GC-IMS)技术与机器学习算法相结合,系统阐述了尿液挥发性有机化合物(VOCs)在泌尿系感染(UTI)诊断与病原分型中的转化价值。研究通过前瞻性队列(n=258)验证了乙酸(OR=3.27)、苯甲醛(OR=4.95)等11种差异VOCs的生物标志物潜力,构建的随机森林模型曲线下面积(AUC)达0.914,显著优于单一临床指标模型(AUC 0.831)。该策略突破了传统尿培养24-48小时的时间瓶颈,为抗生素精准治疗提供了代谢组学支持。
研究背景
泌尿系感染(UTI)作为全球最常见细菌感染之一,其临床管理长期受限于传统尿培养24-48小时的诊断延迟。当前快速筛查指标(如白细胞酯酶、亚硝酸盐)的敏感性与特异性存在较大变异,亟需开发兼具快速性、准确性并能提供病原学信息的新型诊断工具。微生物在生长代谢过程中释放的挥发性有机化合物(VOCs)作为"代谢指纹",为感染诊断提供了新视角。气相色谱-离子迁移谱(GC-IMS)技术凭借高灵敏度、快速分析等优势,特别适合临床样本的高通量VOCs分析。
研究方法
本研究采用单中心前瞻性诊断准确性研究设计,纳入258例疑似UTI成人患者。所有参与者提供清洁中段尿样本,同步进行临床尿常规、尿培养(金标准)和GC-IMS分析。基于尿培养结果将患者分为感染组(152例,58.9%)和非感染对照组(106例)。通过GC-IMS技术检测尿液顶空中的VOCs成分,并结合年龄、体温、降钙素原(PCT)、C反应蛋白(CRP)等临床参数,采用逻辑回归(LR)、随机森林(RF)和支持向量机(SVM)三种机器学习算法构建诊断模型。
关键发现
研究共鉴定出33种尿液VOCs,其中11种在感染组与非感染组间存在差异表达。经Bonferroni校正后,乙酸(p=1.22×10-12)、苯甲醛(p=7.62×10-7)和呋喃(p=9.29×10-4)呈现最显著差异。随机森林算法整合临床与VOCs特征的表现最优,测试集曲线下面积(AUC)达0.914,准确率82.1%,敏感性87.0%,特异性75.0%。该模型显著优于单纯临床特征模型(AUC 0.831)或单纯VOCs模型(AUC 0.850)。
多变量分析确认乙酸(OR=3.27)和苯甲醛(OR=4.95)为UTI的强独立预测因子。值得注意的是,丙酮(OR=0.69)和2-甲基-1-丙醇(OR=0.52)表现出保护效应,可能反映了宿主共生微生物代谢活性或保护性代谢通路的状态。
病原分型探索
在152例感染患者中,革兰阴性菌感染占71.1%(主要为大肠埃希菌和肺炎克雷伯菌),革兰阳性菌占28.9%。VOCs谱在革兰阴阳性菌感染间显示出中度区分能力(AUC 0.800)。主成分分析(PCA)和t分布随机邻域嵌入(t-SNE)可视化显示病原体类型间存在部分聚类趋势,尽管组间仍有较大重叠。
代谢通路解析
通过构建重要VOCs的生化网络,发现这些分子主要富集于短链脂肪酸代谢(乙酸、丙酸等)、芳香氨基酸代谢(苯甲醛、甲苯等)和酮体/酒精代谢等核心通路。这种网络化分析将离散的VOCs变化与已知微生物生化途径直接关联,提升了研究结果的生物学可解释性。
临床意义与局限
本研究建立的临床-VOCs融合模型在决策曲线分析中显示出广泛的临床净获益(阈值概率0.1-0.8),有望在等待传统药敏结果期间为经验性抗生素选择提供关键参考。研究同时承认了单中心设计的局限性、GC-IMS对异构体分辨的挑战以及饮食/药物等混杂因素控制的需要。尽管对产超广谱β-内酰胺酶(ESBL)菌株的区分能力有限(AUC<0.6),但为后续靶向代谢组学研究指明了方向。
结论
尿液VOCs分析通过GC-IMS与机器学习融合,展现了作为UTI快速诊断与病原分型工具的显著潜力。这种基于代谢指纹的策略有望突破现有诊断瓶颈,推动抗感染治疗向更精准、及时的方向发展。