《npj Cardiovascular Health》:Assessing the feasibility of using smartphone data to identify risk of idiopathic pulmonary arterial hypertension
编辑推荐:
本文针对特发性肺动脉高压(IPAH)诊断延迟的临床难题,探讨了利用智能手机App“My Heart Counts”采集的真实世界活动与心率数据,构建机器学习模型以实现早期风险识别的可行性。研究表明,基于诊断前数据的分类器能够有效区分IPAH患者与健康及疾病对照组,并与临床指标显著相关,为利用数字健康工具辅助IPAH的早期检测与远程监测提供了初步证据。
在心血管医学领域,特发性肺动脉高压(IPAH)是一种罕见、进展性且危及生命的疾病。其诊断过程充满挑战,一方面,患者的早期症状如气短、疲劳等非常不特异,容易与其他常见病症混淆;另一方面,确诊的金标准是侵入性的右心导管检查,通常只能在专科医疗中心进行。这一系列障碍导致从首次出现症状到最终确诊,患者平均要经历长达约3年的延误。诊断的延迟往往意味着患者确诊时病情已进入更晚期,可能伴随更多并发症,不仅增加了治疗难度,也显著影响了生存率和生活质量。因此,开发能够助力早期识别和持续监测IPAH风险的新方法,成为了临床和科研人员亟待解决的关键问题。
与此同时,数字健康技术正以前所未有的速度融入日常生活。智能手机和智能手表等可穿戴设备,能够持续、被动地记录用户的活动量、心率、睡眠等多种生理与行为数据,为在真实世界环境中长期、无感地监测个体健康状态提供了可能。那么,一个令人兴奋的设想便浮出水面:我们能否利用这些日常设备产生的“数字足迹”,构建一个预警系统,在IPAH典型临床症状充分显现之前,就识别出患病风险升高的人群?这正是发表在《npj Cardiovascular Health》上的这项研究所要探索的核心。
为了回答这一问题,研究团队开展了一项探索性研究。他们利用一款名为“My Heart Counts”(MHC)的智能手机应用程序,在英国招募了109名参与者,包括IPAH患者、其他疾病对照组(如重症新冠肺炎康复者)和健康志愿者,收集了他们长达八年(中位时间5.4年)的回顾性与前瞻性数据。这些数据主要来自iPhone内置传感器和Apple Watch,涵盖了步数、爬楼层数、行走速度、静息与行走心率、心率变异性、估测的最大摄氧量(VO2max)以及睡眠时间等多个维度。此外,参与者还通过App完成了一系列关于生活方式、风险感知和健康心态的问卷调查。研究旨在分析IPAH患者在诊断前后其数字生物标志物与健康人群的差异,并评估基于这些数据构建机器学习模型来识别IPAH的可行性。
本研究主要采用了以下关键技术方法:1. 基于智能手机App的纵向数据采集:利用“My Heart Counts”应用,被动收集来自iPhone和Apple Watch的传感器数据,并进行清洗、聚合与特征工程。2. 临床队列与数字数据的关联分析:将数字健康数据与来自英国四个IPAH专科中心的临床队列(包括人口统计学、右心导管结果、6分钟步行距离等)进行关联。3. 机器学习建模与验证:使用XGBoost和线性支持向量机算法,基于数字活动特征和问卷回答,构建分类模型以区分IPAH患者与对照组,并在独立的美国MHC队列中进行外部验证。4. 统计与相关性分析:应用多种统计方法比较组间差异,并分析数字指标与临床风险评分(如ERS/ESC 4- strata风险评分)之间的相关性。
研究结果
UK My Heart Counts队列招募
研究最终纳入了109名提供有效数据的英国参与者,包括IPAH患者、疾病对照和健康对照。其中21名IPAH患者拥有诊断前的活动数据。
Phone-derived HealthKit活动指标可识别参与者组间差异
分析发现,与健康对照相比,IPAH患者在诊断前的步数、平均及最大步速、爬楼层数及爬楼速度均显著降低。与疾病对照相比,IPAH患者的步数、爬楼层数和最大爬楼速度也显著更低。诊断后,IPAH患者的步数、爬楼层数及相关速度均较诊断前有显著改善,静息和行走心率也显著下降。
Watch-derived HealthKit活动、心率和睡眠指标揭示参与者组间差异
来自智能手表的数据(如光电容积脉搏波PPG)进一步证实了上述活动指标的差异。此外,IPAH患者表现出更高的平均心率、行走心率,以及更低的心率变异性、心率储备和估测的VO2max。睡眠数据显示,IPAH患者夜间清醒时间显著更长。
体力活动和心率的日、周、季节性模式差异
在日、周和季节性模式分析中,IPAH患者在所有时间尺度上都表现出持续性的活动能力下降和心率模式异常。例如,健康人群在周末活动会减少,而IPAH患者的这种周末效应较弱,表明其日常活动功能持续受损。
生活方式、活动和心态问卷反应的对比
问卷分析显示,三组参与者在运动心态、疾病认知和风险感知上存在显著差异。IPAH患者更倾向于认为运动不那么轻松、有趣,且对生活方式改变预防疾病的信心较低。因子分析显示,问卷回答的模式能够将IPAH患者与其他组区分开来。
远程体力活动、心率和问卷指标与临床风险变量相关
研究发现,多个数字指标与临床指标显著相关。例如,临床6分钟步行距离与爬楼层数、平均步速、心率储备、心率变异性等显著正相关。基于风险阈值分类的步行测试结果也与步数、心率储备、VO2max等数字指标显著相关。
利用智能手机采集的数据对IPAH患者进行分类
基于诊断前的数据,使用手表指标训练的分类器在内部验证中表现出色,接收者操作特征曲线下面积(ROC AUC)达0.87。当加入“生活满意度”问卷调查数据后,模型性能进一步提升至ROC AUC 0.94。仅使用手机活动数据结合“生活方式因素”问卷,也能达到ROC AUC 0.91。然而,基于诊断后数据训练的模型性能较差,突显了诊断前数据对于早期识别的重要性。
利用外部美国My Heart Counts队列测试和改进IPAH分类器
直接将英国模型应用于美国队列时,由于人群间活动水平等差异(数据漂移),模型性能不佳。研究通过将20%的美国数据加入训练集重新训练模型,成功构建了一个更具普适性的模型,在美国测试集上取得了ROC AUC 0.74的性能。
结论与讨论
这项研究作为概念验证,首次系统地表明,利用智能手机和可穿戴设备采集的真实世界长期活动、心率及问卷数据,能够有效区分IPAH患者与对照人群。诊断前而非诊断后的数字生物标志物在分类中表现优异,这强烈支持了此类数字工具有潜力用于IPAH的早期风险识别。研究还发现,简单的手机衍生指标(如步速、爬楼速度)与临床功能测试结果显著相关,提示其可作为传统临床评估的补充或远程监测工具。
该研究的意义在于,它为解决IPAH诊断延迟这一难题提供了一个创新且可扩展的潜在方向。智能手机的高普及率使得基于手机数据的筛查具备广泛覆盖的潜力。尽管智能手表能提供更丰富的心血管数据(如心率变异性),提升了模型性能,但手机因其更低的门槛和更长的历史数据回溯能力,在人群级数字表型分析中可能更具实用价值。此外,结合患者报告的心态与生活方式问卷,能进一步改善模型,强调了整合主观感受以全面理解健康状况的重要性。
当然,研究也存在局限性。例如,不同人群(如英美)之间存在数据漂移,需通过混合数据训练来提高模型普适性;睡眠等部分数据稀疏;数字活动下降的模式可能并非IPAH特异,也见于其他心血管疾病。未来需要在更大规模、更多样化的队列中验证,并整合电子健康记录、心电图等更多元数据,以开发特异性更高、能够区分不同疾病的多疾病分类器。
总之,这项开创性的工作为将日常消费电子产品转化为严肃的医疗健康监测工具迈出了坚实的一步。它展示了数字健康技术在革新罕见病筛查、监测模式方面的巨大潜力,为未来实现更早发现、更持续管理IPAH等严重疾病带来了新的希望。