《npj Cardiovascular Health》:Development and validation of AI-Enhanced auscultation for valvular heart disease screening through a multi-centre study
编辑推荐:
本文聚焦于解决因传统听诊灵敏度低导致的瓣膜性心脏病(VHD)漏诊率高这一临床痛点。研究人员开展了一项多中心研究,开发了一种基于循环神经网络、直接通过听诊器录音预测具有临床意义VHD的AI算法。该算法在独立测试集上实现了0.83的AUROC,对严重主动脉瓣狭窄(AS)和二尖瓣反流(MR)的灵敏度分别高达98%和94%,其性能超越了全科医生。该研究为解决VHD大规模筛查难题提供了有前景的、可扩展的低成本工具,有助于实现早期诊断和及时干预。
瓣膜性心脏病(VHD)正迅速成为“下一个心脏流行病”,尤其在老龄化社会中,其患病率不断攀升。然而,超过一半的VHD病例未被诊断,原因在于其症状(如呼吸困难、疲劳)常被误认为呼吸系统问题或自然衰老,导致许多患者直到出现晚期症状和并发症时才就医,错过了最佳干预时机。目前的诊断工具难以胜任大规模筛查:初级保健依赖全科医生(GPs)用听诊器识别心脏杂音,但灵敏度可低至45%,且临床技能信心下降;而作为诊断金标准的超声心动图,则受限于设备昂贵、需专业操作人员且检查耗时,难以普及。与此同时,现有的人工智能(AI)工具大多专注于杂音检测,将其作为VHD的间接代理,但这种方法对常见亚型(如二尖瓣反流,MR)的灵敏度不足,且受限于小规模数据集。为了解决这些挑战,一项发表于《npj Cardiovascular Health》的多中心研究,旨在开发一种新型AI算法,能够直接从听诊器录音中预测具有临床意义的VHD,为早期筛查提供一种准确、快速且可及的解决方案。
为了验证这一目标,研究团队采用了几个关键技术方法。首先,他们构建了一个大规模、高质量的数据集,该数据集来源于三项在英国国家医疗服务体系(NHS)下进行的研究(CAIS、DUO-EF和OxVALVE),共纳入了1767名患者,将电子听诊器在四个标准听诊位置(主动脉、肺动脉、三尖瓣、二尖瓣)采集的心音录音与作为金标准的超声心动图诊断标签配对。其次,算法开发基于一个循环神经网络(RNN),该网络最初在公开的心音数据集上进行杂音检测的预训练,随后使用本研究收集的、以超声心动图为标签的数据进行微调,使其能够直接预测“具有临床意义的VHD”(定义为存在≥轻度瓣膜狭窄或≥中度瓣膜反流)。最后,研究通过一个独立的测试集(包含263名患者)评估了算法性能,并与14位拥有不同临床经验的全科医生进行了直接比较,后者通过在线调查听取相同的听诊录音并进行判断。
研究结果如下:
数据特征:研究队列中位年龄为74岁,40%患者超重,26%肥胖。793名(45%)患者被超声心动图诊断为具有临床意义的VHD,最常见的是主动脉瓣狭窄(AS,n=325)和二尖瓣反流(MR,n=287)。
算法性能:所开发的“VHD检测器”算法在识别具有临床意义的VHD时,接收者操作特征曲线下面积(AUROC)达到0.83。在设定的操作点(概率阈值≥0.675)时,灵敏度为72%,特异性为82%。算法预测概率与金标准校准良好,预期校准误差为0.08。
不同类型和严重程度VHD的性能:算法对特定严重病变表现出极高的灵敏度:在测试集中,对严重AS的灵敏度为98%,对严重MR的灵敏度为94%。不过,对于中度MR等病变,灵敏度相对较低。
听诊部位分析:分析显示,三尖瓣部位是检测VHD最重要的单一位置,但对严重AS和MR的检测灵敏度分别为75%和64%。结合主动脉和二尖瓣部位的录音可显著提高对各种VHD的检测灵敏度,而加入肺动脉部位则对整体灵敏度影响甚微。
与全科医生比较:在全科医生方面,其综合表现(基于多数决原则)的灵敏度为62%,特异性为64%。VHD检测器在灵敏度(p=0.01)和特异性(p=0.002)上均显著优于全科医生的表现。个体全科医生的操作点差异很大,而算法的性能则更为一致,集中在高特异性区域。值得注意的是,在14位全科医生中,算法在13例中取得了更高的约登指数,在剩下1例中与之持平。
讨论与结论部分强调了本研究的意义。这项多中心研究表明,机器学习算法可以有效利用标准胸部听诊位置的心音录音来检测具有临床意义的VHD。与电子听诊器结合后,该算法有潜力成为一种快速、无创的VHD筛查工具,其灵敏度和一致性均优于当前初级保健的临床评估,有助于更高效地分流患者,使其获得目前资源有限且昂贵的超声心动图服务。
研究的核心优势在于其构建了世界上规模最大、标注最全面的心音图资源库之一,并且每个病例都有配对的超声心动图金标准。VHD检测器算法的一个关键优势在于其对严重AS和严重MR这两种具有独特声学特征且临床意义重大的疾病具有极高的灵敏度。这种高灵敏度在筛查环境中转化为高阴性预测值,能让全科医生更有信心地排除严重的左侧VHD。与以往基于杂音检测的AI研究不同,本研究的算法直接以超声心动图标签为训练目标,避免了杂音标注本身的复杂性和观察者间的高变异性,从而可能学习到人耳无法察觉或不符合既定模式的声学特征,这使得模型具有更强的校准和鉴别能力。
当然,研究也存在一些局限性。例如,数据集虽然包含了多样化的VHD表现,但并非典型的英国筛查人群代表(为了获得足够的VHD病例,招募偏重于医院患者),这可能导致在真实世界筛查中灵敏度降低。与全科医生的比较也存在局限,因为医生仅通过耳机听录音,并未进行现场听诊。未来需要在初级保健环境中进行前瞻性研究,以验证其在真实环境中的性能,并评估其在更低疾病流行率人群中的筛查效益。
总之,VHD检测器显示出作为获得性VHD筛查工具的巨大潜力。它能够在需要进一步检查的中重度VHD患者与仅需观察的轻度反流或微量VHD患者之间进行有效区分。与手持超声心动图等更复杂的筛查方法不同,该工具仅需一分钟简单的听诊器录音,操作快速、易于获取,且可由经过最少培训的非专业操作人员部署,有望实现VHD的早期检测。