《Nature Medicine》:Remote monitoring of heart failure exacerbations using a smartwatch
编辑推荐:
本研究针对心力衰竭(HF)患者病情间歇性加重的监测难题,探索了利用消费级可穿戴设备(Apple Watch)数据进行持续日常监测的新方法。研究人员通过开展TRUE-HF前瞻性观察性队列研究,开发了一个名为TRUE-HF的深度学习模型,该模型能够基于30天的智能手表数据准确预测患者的峰值摄氧量(pVO2)。研究发现,模型中每日预测pVO2下降10%与计划外医疗事件风险显著增加相关,且可提前中位数7.4天预警。该模型在一项独立的、使用Fitbit数据的All of Us研究计划队列中得到了外部验证。这项研究表明,基于可穿戴设备的日常心肺功能监测为心力衰竭的纵向研究和风险管理提供了一种可扩展且可推广的新途径。
心力衰竭(Heart Failure, HF)是一场全球性的健康危机,影响着全球约6430万人,并伴随着沉重的经济负担和高死亡率。这种疾病的特点是其周期性的缓解与急性加重,而传统的临床评估工具,如心肺运动试验(Cardiopulmonary Exercise Testing, CPET)和纽约心脏病协会(New York Heart Association, NYHA)功能分级,往往是静态的、间歇性的。它们不仅成本高、可及性有限,也难以捕捉患者日常波动的临床状态。因此,临床上迫切需要一种能够进行动态、无创、实时监测的工具,以实现更准确的风险分层和更及时的干预。随着可穿戴技术(如智能手表)和人工智能的进步,通过消费级设备持续采集生理数据,为心力衰竭的远程监测带来了新的希望。然而,一个关键的知识空白是:那些在健康人群中验证有效的算法,能否可靠地应用于具有独特病理生理特征的心力衰竭患者?
为了解答这一问题,研究人员启动了“Ted Rogers Understanding Exacerbations of Heart Failure”(TRUE-HF)研究,一项为期3个月的前瞻性观察性队列研究。该研究假设:1)消费级可穿戴数据可用于评估自由生活状态下的心衰患者心肺功能;2)每日心肺功能监测指标能够预测计划外的医疗事件。研究结果近期发表在国际顶级医学期刊《自然·医学》(Nature Medicine)上,为我们揭开了智能手表在心力衰竭管理中的巨大潜力。
研究人员主要运用了几项关键技术方法:首先,他们建立了TRUE-HF前瞻性观察队列(NCT05008692),纳入217名心衰患者,使用Apple Watch Series 6采集自由生活状态下的生理数据,并通过临床访视进行金标准CPET测量。其次,开发了一个名为TRUE-HF的自回归Transformer深度学习模型框架,该模型能够处理长达30天的、以90分钟为间隔汇总的可穿戴数据,并结合患者基线临床信息,预测每日的峰值摄氧量(pVO2)。最后,研究在来自美国国立卫生研究院“All of Us”研究计划的独立外部队列中进行了验证,该队列使用Fitbit设备数据,为此训练了一个仅依赖心率和步数的简化传感器模型(TRUE-HF-RS)以评估其普适性。
研究结果
Wearable TRUE-HF cohort
研究在2019年12月至2024年4月期间,招募了217名心力衰竭患者。患者中位观察期为94.5天。最终,191名患者完成了研究,其中187人完成了研究结束时的CPET。共有32人经历了计划外医疗事件。研究预先将最后50名成功完成研究终点评估的患者分配为预留测试集,用于最终的模型评估,前154名患者用于模型开发和训练。
TRUE-HF wearable-based prediction model
研究人员开发了TRUE-HF模型,这是一个结合了可穿戴数据和患者特定临床信息的自回归Transformer框架。模型处理30天的可穿戴数据,并预测每日的pVO2。研究中预设临床有意义的CPET pVO2下降为≥10%。
External validation in the All of Us cohort
研究在来自“All of Us”研究计划的独立患者队列中进行了外部验证。该队列包含193名符合条件的心衰患者,使用Fitbit设备,数据仅限于心率和步数。为此,研究训练了一个简化传感器变体模型(TRUE-HF-RS)。
Analysis of model prediction of absolute CPET pVO2in the TRUE-HF cohort
在预留测试集上,TRUE-HF模型预测的研究结束前一天的pVO2与金标准CPET测量的pVO2显示出强相关性(Pearson’s r = 0.85)。模型准确检测到从研究开始到结束时CPET pVO2下降(≥10%)的能力也显著优于Apple Watch自带的VO2max算法。
TRUE-HF daily pVO2monitoring in unplanned healthcare utilization in TRUE-HF
探索性分析发现,每日预测pVO2的下降与近期计划外医疗事件风险显著相关。在测试队列中,TRUE-HF模型预测计划外医疗事件的AUROC为0.77。以预测pVO2下降≥10%作为阈值,敏感性为88%,特异性为62%。预测到的pVO2下降中位提前7.4天预警了医疗事件。扩展Cox比例风险模型显示,每日预测pVO2每下降10%,计划外医疗事件的风险比(Hazard Ratio, HR)增加3.62倍。而研究开始时的静态临床指标(如CPET pVO2、NT-proBNP、6分钟步行距离、NYHA分级)及传统心衰风险模型(SHFM, MAGGIC, PREDICT-HF)均未显示出显著的风险比。
All of Us external validation of unplanned healthcare utilization
在“All of Us”外部验证队列中,使用TRUE-HF-RS模型也得到了阳性结果。每日预测pVO2每下降10%,计划外医疗使用的风险比为1.32,模型预测中位提前21天预警事件。
Extension of method to 6MWT distance in the TRUE-HF cohort
研究还将模型框架扩展到预测6分钟步行距离(6MWTD),并发现可穿戴数据也能较好地预测6MWTD,但其与计划外医疗事件的关联未达到统计学显著性。
Feature analysis of the TRUE-HF model
特征分析表明,可穿戴传感器数据(特别是运动时间、步数和血氧饱和度)对模型预测贡献显著。去除每月结构化运动测试的数据对模型性能影响甚微。缩短输入数据窗口(20天或10天)会降低模型性能。消融分析显示,结合可穿戴和临床数据的完整模型性能最优。
结论与讨论
本研究的结果为利用消费级可穿戴数据评估心衰患者心肺功能及建立远程监测方法提供了有力证据。TRUE-HF深度学习模型能够高精度地预测金标准CPET测量的pVO2,实现了从静态、低频的临床评估向动态、高频的日常监测的潜在转变。更重要的是,该模型发现了每日预测pVO2出现临床有意义下降(≥10%)是计划外医疗事件的早期预警信号,其预测能力超越了传统的静态临床标志物和风险评分。这一发现在使用不同品牌设备(Fitbit)的独立外部队列中得到了验证,尽管传感器功能减少导致性能略有下降,但风险关联的方向性和显著性得以保持,证明了该方法的可推广性。
这项研究的核心意义在于,它首次通过深度学习模型,将消费级智能手表转化为一个强大的、可持续监测心衰患者心肺功能状态和急性加重风险的“预警系统”。通过捕捉接近实时的生理数据趋势,该方法能够比传统手段更早地识别出病情恶化的高风险患者,为实施预防性干预、避免不必要的住院和降低医疗成本创造了窗口期。尽管研究在样本量和亚组分析上存在局限,但TRUE-HF模型为心力衰竭的纵向研究、风险分层和远程患者监测指明了一条可扩展的新道路,有望在未来深刻改变心衰的疾病管理范式。