《Talanta》:SERS on analyte-enriched blood for rapid, culture-free sepsis recognition and causative pathogen identification with super operational neural networks
编辑推荐:
本研究针对脓毒症诊断依赖血培养、耗时长、敏感性/特异性不足的临床痛点,开发了一种结合表面增强拉曼光谱(SERS)与深度学习(DL)的工作流程(SERS-DL)。该研究利用靶向分析物富集血液样本,训练了基于超操作神经网络(Super-ONNs)的轻量级一维分类器SuperRamanNet。在五折样本内交叉验证中,系统对脓毒症二元识别的准确率达99.67%,对六类病原体鉴别的准确率达98.84%;在外部盲法队列中,病原体分型准确率仍高达98.28%,显示出强大的泛化能力。这项快速、无培养、便携的SERS-DL技术为脓毒症的即时检测和病原体鉴定提供了接近临床级别的准确度,有望加速分诊、指导早期治疗。
脓毒症(Sepsis)是一种由感染引发宿主免疫反应失调导致的危及生命的医学状况,常导致全身性炎症、多器官功能障碍甚至死亡。它每年影响全球数百万人,并造成约1100万例死亡,占全球总死亡人数的20%。早期准确诊断对于改善患者预后至关重要,因为干预延迟直接与发病率、死亡率增加、住院时间延长和医疗费用上升相关。然而,当前的脓毒症诊断方法主要依赖于微生物血培养、生物标志物(如降钙素原PCT和C反应蛋白CRP)以及临床评分系统(如序贯器官衰竭评估SOFA评分)。这些常规方法存在显著局限性:血培养虽被视为金标准,但需要24至72小时才能鉴定出病原体,无法满足及时临床决策的需求;而生物标志物如CRP、PCT、白细胞计数等,缺乏足够的特异性来区分脓毒症与其他炎症性疾病,且其在感染后的延迟升高也影响了早期检测。
分子诊断技术,如多重PCR(聚合酶链式反应)和MALDI-TOF MS(基质辅助激光解吸/电离飞行时间质谱),虽然能更快地检测病原体,但它们通常价格昂贵,需要熟练的操作人员,并且可能因假阳性风险而需要确认性检测。特别是MALDI-TOF MS,其有效性往往依赖于培养出的分离菌株,限制了其在直接处理患者样本中的应用。因此,临床迫切需要一种快速、灵敏、特异且经济高效的床旁诊断(Point-of-Care, POC)平台用于脓毒症诊断。
近年来,将表面增强拉曼光谱(Surface-Enhanced Raman Spectroscopy, SERS)与人工智能(Artificial Intelligence, AI)相结合的新方法展现出解决这些挑战的潜力。SERS相较于传统方法具有多项优势:检测快速且样本制备简单;识别细菌生物标志物的灵敏度和特异性高;无需培养即可进行分析;兼容床旁POC部署。先前的研究已成功将银纳米棒(AgNRs)作为SERS活性基底,用于检测和分类与脓毒症相关的革兰氏阴性菌内毒素。AI增强的SERS平台进一步实现了病原体的快速鉴定、密切相关的细菌物种的区分以及抗菌药物耐药性表型的检测。
尽管已有一些研究探索了利用血液或血清的拉曼光谱进行病原体识别,并采用经典机器学习或传统分析方法,但其中明确聚焦于脓毒症快速诊断的研究并不多见。许多深度学习方法虽然展示了强大的分类能力,但并未特别强调其与脓毒症临床诊断的相关性。此外,现有的SERS结合机器学习的研究往往由于机器学习创新有限,难以在外部验证数据集上达到临床级别的性能。
为了弥补这些研究空白,一个研究团队在《Talanta》上发表了一项创新性研究,他们开发了一种AI增强的、基于SERS的POC诊断方案,用于直接从血液中快速、无培养地检测脓毒症。该平台结合了工程化的SERS活性纳米结构以增强信号捕获,以及基于超生成神经元(Super Generative Neurons)的先进深度学习分类器,能够从靶向分析物富集的血液中准确识别导致脓毒症的病原体。
为开展此项研究,研究人员主要运用了以下几项关键技术方法:首先,他们从卡塔尔的一家三级医院收集了653份分析物富集的血液样本(271份菌血症/脓毒症阳性,382份对照/阴性)构成主要数据集,并额外使用了一个包含70个独立样本的外部盲法队列进行验证。其次,他们建立了一套完整的SERS光谱预处理流程,包括基线校正(采用ZhangFit方法)、滤波、标准化(如标准正态变量SNV归一化)以及针对类别不平衡的加权数据增强技术。核心创新在于提出了名为SuperRamanNet的轻量级一维分类器,其基础是超操作神经网络(Super-ONNs),该网络通过非局部化内核和随机空间偏置来增强特征提取能力,并引入了多残差(MultiRes)块结构。最后,研究采用五折样本内交叉验证和外部盲法验证来评估模型性能,重点关注了准确度、精确度、召回率、F1分数和特异性等指标。
2. 方法学
2.1. 框架概述
研究的工作流程始于从临床确诊的脓毒症(阳性)和对照(阴性)病例中收集血液样本,目标类别包括五种主要的脓毒症致病菌(大肠杆菌、金黄色葡萄球菌、肺炎克雷伯菌、铜绿假单胞菌、表皮葡萄球菌)和一个对照组。SERS光谱从沉积在银纳米棒(AgNR)基底上的制备分析物中获取,并经过严格的预处理。深度学习分类器负责区分这六种类别。对于脓毒症检测,则将五种病原体类别合并为一个脓毒症阳性超类,进行二元分类。
2.2. 血液样本收集和靶向分析物富集用于SERS采集
血液样本在卡塔尔哈马德总医院微生物实验室收集,并遵循了相应的伦理和生物安全规范。样本经过离心处理以浓缩目标生物标志物(上清液),然后将3μL上清液点样在预制的AgNR基底上,干燥后使用785nm激光器激发,并通过光谱仪记录拉曼光谱。光谱范围选定在400-1800 cm-1,以捕获关键的细菌生物标志物并最小化荧光干扰。
2.3. SERS光谱预处理
原始SERS数据包含有价值的拉曼信号和各种伪影。研究采用了包括基线校正(去除荧光背景)、滤波和归一化在内的综合预处理流程,以增强光谱质量。为了解决类别不平衡问题,采用了类别加权的数据增强技术(如抖动、缩放、时间扭曲),从而提高了模型的泛化能力和鲁棒性。t-SNE可视化分析表明,数据增强后,不同病原体类别的光谱簇变得更加紧凑和可分。
2.4. 用于增强脓毒症识别和病原体分类的SuperRamanNet
SuperRamanNet模型是基于超生成神经元构建的。超操作神经网络(Super-ONNs)是操作神经网络(ONNs)的扩展,它通过引入随机内核移位(空间偏置范围Γ=±2)来获得空间多样性,从而克服了传统卷积神经网络(CNNs)线性卷积的局限性和ONNs需要手动设计算子集的不足。SuperRamanNet架构中包含了顺序排列的多残差(MultiRes)块,每个块内包含使用不同内核大小的SuperConv层(基于Super-ONN),这些层的输出被拼接并通过批量归一化(Batch Normalization, BN)和TanH激活函数,最后与一个残差连接合并。这种设计使其能够有效捕捉光谱中的细微差异。
2.5. 深度学习的实验设置和评估指标
研究采用五折交叉验证(5-fold-CV)策略,确保同一血液样本的光谱不会同时出现在训练集和测试集中。模型使用Adam优化器和平均绝对误差(MAE)损失函数进行训练。性能通过准确度、精确度、召回率(灵敏度)、特异性和F1-score等指标进行评估。
3. 结果与讨论
3.1. 获取的SERS光谱的定性评估
对六个目标类别的平均SERS光谱及其标准差的分析显示,对照组和肺炎克雷伯菌的光谱轮廓相对随机且均匀,而其他四种病原体则表现出更 distinct 的光谱特征,尤其是在750 cm-1附近有一个显著的共有峰,但在其他区域存在差异。对照组和肺炎克雷伯菌的类内变异性最大,这为深度学习分类带来挑战,但也提供了可区分的特征。
3.2. 基于深度学习的SERS光谱分类结果
3.2.1. 主要验证结果
在主要数据集的五折交叉验证中,提出的SuperRamanNet模型在脓毒症二元识别和六类病原体鉴定任务上均取得了最佳性能,准确率分别达到99.67%和98.84%。其性能优于其他基准模型(如SelfResNet, SelfMultiResNet等)。混淆矩阵分析显示,常见的错误分类发生在大肠杆菌与铜绿假单胞菌之间,以及大肠杆菌与对照组之间。SuperRamanNet有效地减少了这些误分类。
3.2.2. 外部验证结果:盲法测试
在独立的外部验证集上,SuperRamanNet对病原体鉴别的准确率仍高达98.28%,证明了模型良好的泛化能力。尽管外部数据的异质性导致错误分类略有增加,但整体模式与内部验证一致。
3.2.3. 模型解释
通过t-SNE和UMAP对SuperRamanNet倒数第二层嵌入进行可视化,结果显示六个目标类别形成了清晰可分簇,表明模型学到了有效的特征表示。此外,利用平滑Grad-CAM方法生成的显著性图谱(Saliency Maps)揭示了驱动分类决策的关键光谱区域。对于大多数病原体类别,740-760 cm-1区域是一个重要的判别区。例如,金黄色葡萄球菌在525-535 cm-1有一个独特波段,而肺炎克雷伯菌则有多个重要波段。这些发现与已知的细菌生物标志物信息相符,增强了模型决策的可解释性。
3.3. 消融研究
3.3.1. 数据增强前后的分类性能
消融研究表明,在没有进行数据增强的情况下,模型在外部验证集上的准确率仅为66.67%。而应用类别加权数据增强后,性能显著提升至98.28%,凸显了数据增强对于处理类别不平衡和提升模型泛化能力的关键作用。
3.3.2. Super-ONN新颖性对性能提升的影响
另一项消融研究将SuperRamanNet中的Super-ONN块替换为标准的CNN块或Self-ONN块。结果证实,基于Super-ONN的模型性能优于CNN,而Super-ONN与Self-ONN之间的性能差异在统计上不显著,表明非线性神经操作是性能提升的主要因素,而内核移位在此特定任务中贡献有限。
3.4. 与现有文献的比较
与以往侧重于病原体鉴定但并非专门针对脓毒症、或使用较简单机器学习方法的研究相比,本研究提出的SERS-DL工作流程直接针对脓毒症的快速诊断和病原体精确识别,并在采集速度(3秒/光谱)和分类准确度方面表现出色。
3.5. 关于应用、局限性和前景的讨论
研究也指出了当前方法的局限性,包括原始血液样本收集阶段存在的类别不平衡问题(如大肠杆菌样本过多),这可能会影响模型性能;需要进一步优化模型以便在便携式拉曼光谱仪上实现实时推断;未来需要整合临床元数据(如年龄、SOFA评分等)以增强模型的稳健性,并进行更广泛的临床验证以推动其向床旁诊断的转化。
4. 结论
该研究成功开发了一个集成了SERS与先进深度学习技术(特别是SuperRamanNet模型)的临床诊断框架,用于直接从分析物富集的血液中实现脓毒症的快速、无培养识别和病原体鉴定。该方法在内部和外部验证中均表现出接近临床级别的高准确度和强大的泛化能力。通过消融研究证实了数据增强和Super-ONN架构的贡献。尽管存在样本平衡和边缘部署优化等挑战,但该研究成果为脓毒症的即时、精准诊断提供了强有力的技术支撑,具有改善患者预后和减轻全球脓毒症负担的巨大潜力。