《Journal of Biomedical Informatics》:Heat and hearts: An exposure-anchored computational phenotyping framework for assessing cardiovascular vulnerability during extreme heat
编辑推荐:
本研究基于芝加哥大型医疗机构的电子健康记录数据,结合高分辨率气温数据,开发了极端高温相关心血管脆弱性(HECV)的计算表型。通过纵向分析和表型关联研究,确定了低游离甲状腺素、肾功能减退、心血管药物使用及既往超声心动图检查为关键预测因子。模型验证显示,2年、3年和5年时间的风险分层AUC分别为0.85、0.82和0.81,有效区分了高危与低危患者。该成果为临床和公共卫生机构提前识别高温易感人群提供了可靠工具。
彼得·M·格拉菲(Peter M. Graffy)|本杰明·W·巴雷特(Benjamin W. Barrett)|丹尼尔·E·霍顿(Daniel E. Horton)|诺里娜·B·艾伦(Norrina B. Allen)|阿贝尔·N·科(Abel N. Kho)
美国伊利诺伊州芝加哥市西北大学预防医学系
摘要
目的
极端高温会增加心血管系统的脆弱性。我们利用与高分辨率温度数据关联的纵向电子健康记录(EHR),开发并验证了一种基于热暴露的心血管脆弱性(HECV)计算表型,用于门诊就诊情况的研究。
材料与方法
我们从一个大型芝加哥医疗系统收集了成年患者的忠诚度队列(2017–2024年),并将所有就诊记录与Daymet每日温度数据进行了关联,分辨率达到1平方公里。我们识别出HECV病例,并将其与非HECV对照组进行匹配。使用诊断前12个月的结构化EHR数据进行了全表型关联研究(PheWAS)和条件逻辑回归分析。该模型在2018年1月1日的测试数据集上进行了评估,计算了事件发生时间和时间依赖性的曲线下面积。
结果
在104,439名忠诚度队列患者中(62.7%为女性;平均年龄43.6岁),关键预测因素包括游离甲状腺素水平低、肾功能下降、使用心血管药物以及既往的心脏超声检查结果。PheWAS显示,这些因素与慢性肾病、二尖瓣疾病和静脉血栓栓塞症存在关联(所有p<0.001)。我们的HECV风险区分模型在2年、3年和5年时的AUC分别为0.85、0.82和0.81。风险分层显示:2年的HECV发病率从最低三分位数20.4%到最高三分位数50.0%不等;5年的风险从87.0%到98.1%不等。
结论
常规收集的EHR特征结合外部热指标,可以识别出HECV风险较高的患者,从而支持积极的临床或公共卫生应对措施。HECV的计算表型生成了一种具有强时间依赖性AUC的区分工具,能够在事件发生前识别出热敏感患者。
引言
由于人为气候变化,美国极端高温事件的严重程度和持续时间正在增加,这将对公共卫生和医疗系统造成重大负担。心血管疾病(CVD)受到极端高温的严重影响,研究发现两者之间存在密切关联,预计到2050年CVD的患病率将增加90%,而与热相关的CVD死亡率到2065年将增加260%[1][2]。虽然热对心血管死亡率的影响已得到较为充分的研究,但其对非死亡性心血管结果的影响尚不完全清楚[3][4][5]。极端高温通过多种机制对心血管系统造成生理压力,包括血管内液体流失、自主神经调节紊乱、电解质失衡、内皮功能障碍、炎症和心脏负荷增加。这些过程可能导致多种心血管疾病的表现,而不仅仅是单一的热相关诊断,这使得使用传统结局定义来识别基于热暴露的心血管脆弱性(HECV)变得复杂。尽管生活方式、结构和生物学因素都可能在不同程度上影响极端高温期间的心血管事件,但个体医疗史中的某些特征可能有助于在事件发生前预测或解释该事件[6][7][8]。随着电子健康记录(EHR)的广泛应用以及先进机器学习方法的发展,研究人员能够识别出与HECV风险相关的重要临床特征。
先前的研究利用EHR数据进行CVD结局的纵向研究,大多数研究采用了无监督机器学习方法[8][9][10][11][12]。基于EHR数据库的忠诚度队列(即那些持续与医疗系统互动的患者)被证明对纵向流行病学研究特别有用[13][14][15]。这类研究有助于识别一般的CVD病例及其风险因素;然而,此前尚未有研究将外部气候因素与地理编码的EHR数据关联起来以评估HECV风险。根据《美国健康保险可移植性和责任法案》(HIPAA)的规定,将地理编码的EHR数据与外部数据源关联存在保护健康信息隐私的重大障碍[16]。通过使用DeGAUSS算法将忠诚度队列的EHR数据与每日温度数据同步,研究人员可以评估患者随时间变化的HECV风险。
在像伊利诺伊州芝加哥这样的城市中,定期收集的EHR特征与外部热指标相结合,可以帮助识别HECV风险较高的患者,从而为临床或公共卫生措施提供支持。HECV的计算表型开发出了一种具有强时间依赖性AUC的区分工具,能够在事件发生前识别出热敏感患者。
方法与材料
这是一项经过机构审查委员会批准、符合HIPAA标准的回顾性研究,使用了2017年至2023年期间芝加哥地区患者中心结果研究网络(CAPriCORN)内6个学术医疗中心的去标识化EHR数据。所有相关代码可访问[
https://github.com/petergraffy/HRCVD-risk ]。CAPriCORN是一个区域性的临床数据研究网络,拥有1200万患者样本,整合了多个大型学术机构的EHR数据。
结果
患者选择的完整流程图见图1。在2017–2023年研究期间,共有104,439名符合忠诚度队列纳入标准的独特患者(62.7%为女性,37.3%为男性;研究开始时的平均[标准差]年龄为43.6岁[17.5岁])。平均随访时间为2.8±2.4年。各交叉验证子集的人口统计特征见表1。
讨论
本研究提出了一种人群健康信息学方法框架,用于识别极端高温期间的暴露相关心血管脆弱性。通过整合常规收集的结构化EHR特征,我们识别出在极端高温期间心血管脆弱性较高的患者群体。该模型具有良好的区分能力,2年、3年和5年的时间依赖性AUC分别为0.85、0.82和0.81。
数据可用性声明
鉴于电子健康记录和死亡证明数据的保护性质,公开发布所有数据在伦理和法律上均不可行,但部分分析结果可根据请求提供。
作者贡献声明
所有作者都对研究的构思或设计做出了实质性贡献,参与了初稿的撰写和审阅,并同意对研究的各个方面及其完整性负责。
资助声明
本研究得到了美国心脏协会(AHA)提供的Predoctoral Fellowship 24PRE1193628项目的资助(授予P.M.G.),以及健康科学整合计划(HSIP)和巴菲特全球事务研究所的Defusing Disasters工作组的支持。
未引用参考文献
[55]
CRediT作者贡献声明
彼得·M·格拉菲(Peter M. Graffy): 撰写 – 审阅与编辑、初稿撰写、可视化、验证、监督、软件开发、资源协调、项目管理、方法学设计、资金获取、正式分析、数据整理、概念构建。
本杰明·W·巴雷特(Benjamin W. Barrett): 撰写 – 审阅与编辑、初稿撰写、软件开发、数据整理、概念构建。
丹尼尔·E·霍顿(Daniel E. Horton): 撰写 – 审阅与编辑、初稿撰写、监督、方法学设计、资金获取。
利益冲突声明
作者声明以下可能构成潜在利益冲突的财务利益和个人关系:彼得·格拉菲报告获得了美国心脏协会公司的财务支持。如果还有其他作者,他们声明自己没有可能影响研究的已知财务利益或个人关系。
致谢
我们感谢Defusing Disasters工作组成员的工作及美国心脏协会提供的资助。