《Sleep and Breathing》:Spectral analysis of ECG and SpO? for machine learning classification of Sleep-Disordered breathing
编辑推荐:
本研究旨在解决住院患者睡眠呼吸障碍(SDB)筛查工具不足、漏诊率高的问题。研究人员利用多导睡眠图(PSG)验证数据,开发并验证了一种基于常规采集的心电图(ECG)和脉搏血氧饱和度(SpO?)波形的机器学习分类器,用于无创、可扩展的SDB检测。该模型在验证集中展现出72.3%的敏感性和73.3%的特异性,显示了利用常规监护数据进行SDB筛查的潜力,为重症监护室(ICU)等场景的临床决策支持提供了新思路。
睡眠,本应是恢复精力的港湾,但对全球数以亿计深受睡眠呼吸障碍(Sleep-disordered breathing, SDB)困扰的人来说,夜晚却可能充满风险。其中,阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea, OSA)是最常见的形式,它与心血管疾病、中风甚至全因死亡率升高密切相关。尽管问题严重,但在医院,尤其是重症监护室(ICU)这类SDB高发的场所,由于缺乏简便、可扩展的筛查工具,大量患者未被诊断,错过了干预良机。传统的诊断“金标准”——多导睡眠图(Polysomnography, PSG)——设备笨重、操作复杂,难以在住院环境中大规模应用。因此,探索一种利用患者日常监护中已常规采集的生理信号(如心电和血氧)来识别SDB的方法,成为了一项迫切且具有重要临床意义的研究课题。发表在《Sleep and Breathing》上的这项研究,正是对此难题的一次有力探索。
为了回答“能否仅利用心电(ECG)和脉搏血氧饱和度(SpO?)这两种ICU常规监护信号,可靠地筛查睡眠呼吸障碍?”这一问题,研究人员开展了一项探索性研究。他们利用了来自动脉粥样硬化多种族研究(Multi-Ethnic Study of Atherosclerosis, MESA)睡眠队列的数据,该队列包含了完整的过夜PSG记录作为评估标准。研究者从该数据集中随机选取了122名参与者(样本略偏向于重度OSA病例),开发了一套两阶段的支持向量机(Support Vector Machine, SVM)分类模型。研究团队首先对心电信号的R-R间期和血氧饱和度变异性进行了谱分析,提取特征,然后用30名受试者的数据训练分类器,并在其余92人的独立验证集中评估其性能。
本研究主要运用了以下关键技术方法:1. 数据来源与预处理:研究数据来自MESA睡眠研究队列,通过国家睡眠研究资源库获取包含心电、血氧等多通道生理信号的EDF格式数据。2. 信号处理与特征提取:采用基于复小波变换的稳健R波峰值检测算法处理原始心电信号,即使在存在运动伪影的情况下也能准确识别。随后,对非均匀采样的R-R间期时间序列,结合窗口技术和Lomb-Periodogram方法进行谱分析,生成能够反映心率变异性频率成分随时间演变的谱图。同时,从SpO2波形中提取了包括最大值与最小值之差、均值和标准差在内的特征。3. 机器学习模型构建:研究采用了支持向量机这一传统机器学习方法,使用高斯核函数,并采用了标准化和核自动缩放选项。构建了一个两阶段的SVM分类管道:第一阶段(SVM-1)在180秒的时间窗口水平上识别是否存在呼吸事件;第二阶段(SVM-2)则基于SVM-1识别的呼吸事件窗口比例,对受试者个体进行是否存在OSA的整体分类。
研究结果
样本人群特征
分析的122名参与者中位年龄为69岁,52%为男性,人种/族裔构成包括白人(35%)、黑人/非裔美国人(9%)、华裔美国人(24%)和西班牙裔(32%)。中位体重指数(Body Mass Index, BMI)为28.2。根据美国睡眠医学会(American Academy of Sleep Medicine, AASM)和医疗保险与医疗补助服务中心(Centers for Medicare & Medicaid Services, CMS)标准计算的平均呼吸暂停低通气指数(Apnea-Hypopnea Index, AHI)分别为26.5和17.3。训练集与验证集之间在人口统计学和睡眠数据上均无显著差异。
分类器性能
- •
训练阶段表现:
- •
SVM-1(窗口级分类):在区分包含与不包含呼吸事件的180秒时间窗口时,表现出了极高的性能,敏感性达98.7%,特异性达99.0%。
- •
SVM-2(受试者级分类):在训练集(30名受试者)中,能够以100%的准确率正确分类受试者是否存在OSA。
- •
验证阶段表现:
- •
当将训练好的两阶段组合模型应用于独立的验证集(92名受试者)时,其在受试者水平的分类性能为:敏感性72.3%,特异性73.3%,阳性预测值73.9%,阴性预测值71.7%,总体准确率72.8%,F1分数为73.1%。
结论与讨论
本研究成功开发并初步验证了一个仅使用心电图和脉搏血氧饱和度波形数据的机器学习分类器,能够在精心策划的数据集中区分有无显著睡眠呼吸障碍的受试者。其核心目的是测试一种仅依赖于重症监护病房(Medical Intensive Care Unit, MICU)常规监测生理信号的分类工具,以辅助患者管理。
研究结果表明,该方法在利用常规生理信号进行SDB检测方面展现出显著潜力。在训练集中观察到的高敏感性和特异性,凸显了该方法在捕捉SDB相关生理特征签名方面的能力。尽管在验证集中的表现有所下降,但这强调了该技术在实际临床转化中面临的挑战和需要改进的方向。
研究的优势在于使用了经过PSG验证的精选数据集,确保了评估的稳健性。同时,分类器训练采用了反映真实世界人口统计学和OSA严重程度变化的随机样本,增强了其普适性。通过分析心率变异性(Heart Rate Variability, HRV)和SpO2波动的频谱特征,该研究利用了已确立的SDB生理标志物。其先分类时间窗口事件、再汇总进行患者级标签判定的分步机器学习框架,也与OSA的病理生理学理解和识别逻辑相符,具有可适应性。
然而,研究也存在若干局限性。首先,基于心电的SDB检测在存在心脏心律失常(尤其是频发房性或室性早搏)的情况下固有地受到限制,因为这些情况会扭曲基于心率变异性的谱分析。尽管房颤影响较小,但异位搏动常导致谱图无法解读,降低了模型在有潜在心律不齐患者中的可靠性。其次,虽然SpO2提供了有价值的辅助数据,但缺乏直接的呼吸努力测量(如胸廓阻抗、鼻气流)可能导致对轻度SDB病例的误分类。此外,本研究是在信号质量较高的非值守PSG数据中开发和测试的,而ICU数据可能包含更多伪影以及危重病固有的不稳定性/变异性,这可能影响其直接转化。最后,相对较小的验证队列及其对重度OSA的富集可能使性能指标存在偏差,凸显了在更大数据集中进行外部验证的必要性。
展望未来,虽然该方法利用了住院和ICU患者常规可得的信号,但当前研究应被视为在高质量PSG数据集中进行的一项可行性试验。未来的工作应侧重于收集ICU环境下的心电/SpO2数据,以量化其在真实世界伪影下的性能,并优化预处理流程,在部署到临床决策支持系统前进行外部验证。后续迭代可探索多模态特征提取、整合额外的生物信号,并可能扩展机器学习方法学以提升分类准确性和临床适用性。同时,应深入研究ICU转化及整合到临床决策支持系统中的最佳实践,以最大化这一新工具的应用率和影响力,从而为患者护理带来有意义的改变。