《Journal of the American Heart Association》:Translating Mechanistic Insights Into Action and Revealing New Pathways: Machine Learning Approaches in Heart Failure With Preserved Ejection Fraction
编辑推荐:
这篇综述深入探讨了机器学习(ML)如何整合先进心脏成像技术,以揭示射血分数保留型心力衰竭(HFpEF)复杂的病理生理机制。文章系统性地介绍了ML方法,包括有监督学习、无监督学习和物理信息神经网络(PINN),在评估心肌纤维化、脂肪变性、能量代谢和舒张功能障碍等关键组织及腔室层面的应用。通过结合多模态数据(如心脏磁共振(CMR)、31P-磁共振波谱(31P-MRS)和多组学数据),ML有望实现更精准的患者分型,并推动针对个体的靶向治疗,最终导向HFpEF的精准医疗。
MACHINE LEARNING APPROACHES IN MECHANISTIC EVALUATION OF HFpEF
射血分数保留型心力衰竭(HFpEF)是一种高发病率和高死亡率的普遍疾病,治疗选择有限。掌握并整合关键的机制性见解对于开发最佳治疗策略至关重要。机器学习(ML)在推进临床研究中正扮演变革性角色,可用于理解HFpEF中的心肌功能障碍。ML技术,包括有监督学习、无监督学习和强化学习,可应用于心脏成像以识别表型和提取生物标志物。结合先进成像和ML的HFpEF机制性评估,可以提供关于心肌僵硬度、脂肪变性和能量代谢的信息。
有监督学习和无监督学习是ML的两大主要类型。深度学习作为ML的一个子领域,利用多层神经网络从原始输入(如图像)中提取复杂特征,使其特别适合与超声心动图和心脏磁共振(CMR)等先进成像应用结合使用。与传统统计技术相比,ML方法在分析复杂生物系统固有的非线性关系、处理大规模数据集、选择相关特征以及进行迁移学习等方面具有优势。
MECHANISTIC INSIGHTS AT THE CHAMBER LEVEL: ASSESSMENT OF DIASTOLIC DYSFUNCTION
左心室的功能效率依赖于其在舒张期(充盈)和收缩期(射血)之间的交替能力。舒张功能与心肌松弛和左心室的被动特性相关,后者受心肌张力影响。舒张功能障碍主要表现为充盈压升高,可通过超声心动图评估。例如,E/e’比率被发现在预测未来心衰事件方面有价值。
在HFpEF中,舒张功能障碍普遍存在,但当代评估有时具有挑战性,需要整合多个超声心动图参数。多项研究已应用ML技术来增强舒张功能障碍的评估,从而有助于临床风险分层。例如,使用无监督聚类方法结合有监督分类器的深度学习模型,可以确定舒张功能障碍的严重程度,并识别对螺内酯治疗有不同反应风险的患者。
MECHANISTIC INSIGHTS AT THE TISSUE LEVEL
Evaluating Myocardial Stiffness
心肌僵硬度是影响心脏收缩和舒张功能的重要内在特性。它由心肌细胞内的细胞骨架和细胞外成分(如胶原纤维)共同影响。评估活体心肌僵硬度是一项复杂的任务。三维有限元建模通过整合左心室几何结构和心肌力学,能够实现患者特异性的心肌僵硬度(剪切刚度模量,μ)评估。然而,这种方法计算量大。
ML提供了一种耗时较少的替代方案。例如,Babaei等人开发了一个ML模型,通过分析心脏成像和患者人口统计学的几何、结构和功能特征来预测被动心肌僵硬度。该模型在预测被动心肌僵硬度方面达到了高精度(R2为96%),并将器官水平的舒张末期压力-容积关系指标与内在心肌组织特性联系起来。
Myocardial Fiber Orientation
心肌纤维取向对调节心脏收缩和舒张功能非常重要,在临床前研究中发现其在心衰中会发生改变。扩散张量成像(DTI)-CMR等新型CMR序列允许表征心肌纤维取向。然而,过去在活体人类中评估DTI非常困难。最近的技术进步补偿了整体运动并降低了对速度和加速度的敏感性,已证明了在3T临床MRI扫描仪上对人类志愿者和HFpEF患者进行DTI-CMR的可行性。
ML方法如Fibernet,利用物理信息神经网络(PINN)从多个电解剖图中确定人心房的心肌纤维取向和心脏传导速度张量。PINN是一类可以将物理定律整合到神经网络训练中以解决复杂科学和工程问题的ML模型。虽然DTI-CMR提供高分辨率的肌纤维取向数据,但其在临床环境中的可及性可能有限。Fibernet使用可能更易获取的电解剖图,然后利用PINN来估计肌纤维取向。
Myocardial Fibrosis
纤维化,即细胞外基质(包括胶原蛋白积累和交联)的过度沉积,不同程度地存在于HFpEF患者中,并与较差的预后相关。纤维化的生物标志物被发现与HFpEF患者对螺内酯治疗缺乏反应直接相关,这意味着纤维化的存在可能会调节某些治疗的疗效。
心肌纤维化是心肌僵硬度的关键组成部分,可以使用CMR无创评估。通过CMR上的参数映射技术(注射钆前后进行T1 mapping以计算细胞外体积(ECV))可以对其进行量化。典型的正常ECV值范围为25%至30%,大于30%被认为是异常的细胞外扩张。
尽管传统的CMR需要专家解读,但卷积神经网络和深度学习模型可以增强定量纤维化分析和节段特异性纤维化评估。例如,Haidiri等人开发了一种深度学习半自动化工具,使用卷积神经网络在17节段模型中识别和定位CMR中的心肌纤维化。该框架在心肌节段的纤维化二元分类中准确度高达0.86,与放射科医师的评估结果非常接近。另一个例子是FibrosisNet,一个深度学习网络,可以自动化地从CMR中检测和分类心肌纤维化,实现了96%的准确率和F1分数。
Myocardial Steatosis
氢原子磁共振波谱(MRS)是一种无创技术,可以在活体内量化心脏中的甘油三酯含量。临床研究表明,心脏中的脂质积累与形态学改变和舒张功能障碍有关。HFpEF患者的心肌甘油三酯含量被发现增加了两倍,并且与舒张应变率受损相关。甘油三酯的积累也被发现会导致患有冠状动脉微血管疾病的女性出现舒张功能障碍。据我们所知,ML尚未被用于利用临床、成像和血液生物标志物来推断和评估心脏中的心肌脂肪变性,这仍是一个有前景的开发领域。
Myocardial Energetics
在心脏中,三磷酸腺苷(ATP)的生成主要通过肌酸激酶(CK)系统完成。磷酸肌酸与ATP的相对浓度是心肌将底物转化为ATP用于主动过程能力的标志,代表了心肌的能量状态。已知线粒体功能受损和能量代谢改变会导致能量不足,并加剧心衰的严重程度。
磷-31磁共振波谱(31P-MRS)是一种强大的无创、无电离辐射的模态,能够独特地在活体内评估心肌能量状态。研究表明,与对照组相比,HFpEF患者的磷酸肌酸/ATP比值降低,这与舒张应变率和最大耗氧量显著降低相关。
ML技术已被应用于研究心肌能量代谢。例如,在一项检查小鼠心脏组织基因表达谱的研究中,使用特征选择来识别与HFpEF潜在诊断生物标志物相关的关键代谢基因,并采用有监督学习算法随机森林对这些基因的重要性进行排序。另一项研究使用代谢组学、RNA测序和ML技术来检查心衰中心肌代谢的差异。基于ML的代谢物聚类揭示了不同组间独特的代谢特征,HFpEF心肌的特征是脂肪酸氧化减少、氨基酸代谢改变和替代燃料来源利用受损。
INTEGRATION OF MULTIMODAL DATA USING MACHINE LEARNING
随着我们从患者就诊、成像和实验室评估中获得越来越多的多模态数据,这为使用ML提供了独特的机会,而传统统计方法可能在此处存在不足。
拥有足够样本来训练神经网络架构仍然是一个重大挑战。科学ML新兴领域的一项创新是物理信息神经网络(PINN)。这种方法将物理学或守恒定律的先验知识与数据相结合来规范网络。它代表了一种结合物理学和机器学习的混合方法。多保真度PINN(MPINN)是一种物理信息神经网络,它结合数学模型来解决复杂的多尺度问题。它们特别适用于传统模型因数据稀疏或有噪声而受限的情况,因为它们可以整合多种数据级别。
在HFpEF的背景下,MPINN可以构建为一个相互连接的子网络系统,每个网络专门处理不同类型的数据。例如,一个网络可以训练处理低保真度数据(如人口统计学、合并症、实验室生物标志物和生命体征)。第二个网络连接低保真度和高保真度领域(这些数据与成像数据),将整合从两种数据类型中学到的中间表示。第三个子网络则专注于高保真度数据,整合来自超声心动图和心脏磁共振成像的详细定量信息。这些使用MPINN的子网络结合了机制性理解和高保真度数据,从而能够对疾病机制进行更稳健的建模。这个过程产生了一个多保真度近似,提高了模型的准确性和效率。
POTENTIAL CHALLENGES
尽管ML在HFpEF中的应用前景广阔,但仍存在一些挑战。这些挑战包括偏差、混杂因素、过拟合和缺乏外部验证。为防止过拟合,应在模型构建过程中使用验证数据集或开发数据集。此外,模型应在外部数据集中进行验证,并在应用于医疗保健环境之前进行严格的开发和测试。
维度约简可以进一步降低模型复杂性和过拟合的可能性,同时增强可解释性。这可以通过特征选择或特征提取来实现。正则化技术,如最小绝对收缩和选择算子(LASSO)或岭回归,也有助于防止模型与训练数据拟合过度。此外,处理数据或类别不平衡至关重要,需要采用重采样技术、代价敏感学习和集成方法等再平衡策略。
可解释的人工智能通过阐明模型做出特定决策的原因来增强透明度。例如,研究人员开发了一个结合临床数据和CMR衍生的心外膜脂肪组织体积的模型,用于诊断HFpEF和预测结局。使用可解释的人工智能,他们能够确定哪些特征在驱动分类中最为重要。
自适应ML方法,如迁移学习和持续学习,通过使用预训练模型和持续模型更新,为克服其中一些挑战提供了创新的解决方案。迁移学习在深度学习中使用在大型数据集上预训练的模型作为新模型的起点。持续学习使模型能够学习并适应新数据,同时保留先前获得的知识。
迄今为止,大多数ML在HFpEF中的应用都集中在优化筛查或识别已知的病理生理特征上,但临床前文献越来越多地使用多组学方法来揭示与疾病发展和预后相关的关键信号机制和基因状态。将多模态临床前数据集(如深度表型组学、组织病理学、单细胞或核RNA测序、代谢组学、蛋白质组学和磷酸化蛋白质组学)与临床数据(这些数据更具异质性,并受到组织可及性的限制)整合,可以实现由可解释性分析告知的患者层面的全面机制模型。
CONCLUSIONS AND FUTURE DIRECTIONS
HFpEF的复杂性给无创诊断和管理带来了挑战。然而,一种整合生物标志物和无创先进成像技术的综合方法可能会增强对HFpEF病理生理功能障碍的理解。除了使用先进的成像生物标志物来确定心肌纤维化和能量代谢等潜在机制外,整合基因组学、代谢组学和蛋白质组学的多组学方法可以提供对HFpEF潜在疾病机制的全面理解。通过将分子通路与成像表型联系起来,这些方法将实现更精确的患者分层。鉴于HFpEF的异质性,ML可用于在个体水平整合机制性生物标志物,从而引领通往精准医疗方法和靶向治疗的路径。