基于机器学习的药物诱导QTc变化预测:以一个大型芬兰生物银行队列为研究对象
《Clinical and Translational Science》:Machine Learning-Based Prediction of Drug-Induced QTc Changes in a Large Finnish Biobank Cohort
【字体:
大
中
小
】
时间:2026年05月07日
来源:Clinical and Translational Science 2.8
编辑推荐:
**摘要**
QT间期的延长是严重心律失常和突发性心脏死亡的已知前兆,通常由药物使用引发。目前的药物风险评估平台依赖于基于文献的综合分析,可能会落后于实际发展。我们的目标是评估一个在真实世界基因组数据和药物数据上训练的机器学习(ML)模型是否能够识别药物使用与QTc持续时间之间
**摘要**
QT间期的延长是严重心律失常和突发性心脏死亡的已知前兆,通常由药物使用引发。目前的药物风险评估平台依赖于基于文献的综合分析,可能会落后于实际发展。我们的目标是评估一个在真实世界基因组数据和药物数据上训练的机器学习(ML)模型是否能够识别药物使用与QTc持续时间之间的关联,从而潜在地实现临床工作流程中的自动风险检测。我们纳入了来自FinnGen生物库扩展区3的10,208名个体的数据,整合了处方记录、临床变量和遗传信息。我们应用了嵌套交叉验证方法来开发一个ML框架,使用临床特征、近期药物购买情况和QTc持续时间的多基因评分来预测QTc持续时间。我们进行了传统的线性回归分析以估计结果的稳健性。只有少数ML检测到的药物–QTc关联与专家整理的参考文献中列出的已知效应一致。观察到几个明显的假阳性结果,而对于真正的阳性结果(如胺碘酮),效应大小很小,可能在临床上没有意义(ML中的+1 ms对比线性回归中的+49 ms)。这些发现突显了使用ML检测ECG上药物效应的挑战。ML模型未能可靠地识别出与QT间期延长相关的药物。因此,在该框架中使用QTc作为电生理脆弱性的中间标志物进行风险量化是有限的。虽然新的方法在药物安全性评估中不断涌现,但在可预见的未来,临床药理学专家进行的系统证据审查不太可能被取代。
**研究亮点**
• 药物引起的QT间期延长是一个重要的安全问题,临床医生依赖基于证据的资源来评估药物风险。最近的研究使用ML来预测特定临床环境中的QT延长,但其直接从真实世界数据检测药物效应的能力仍不确定。
• 该研究探讨了是否可以在基因组、临床和药物数据上训练的ML模型来自动检测与QTc持续时间相关的药物。这项研究为我们增加了哪些知识?
• 在超过10,000名FinnGen参与者中,ML模型仅识别出了少数已知的QT延长药物,并经常突出显示没有已知效应的药物。检测到的效应大小很小且与传统回归不一致,显示出假阳性的高风险和捕捉有意义的药物–QTc关系能力有限。这可能会如何改变临床药理学或转化科学?
• 这些发现表明,广泛的数据驱动ML方法尚未可靠地用于检测和量化可能表明QT风险的ECG变化,并作为临床医生预测即将发生的心律失常事件的早期指标。临床药理学家和其他专家临床医生对药物相关QT风险的评估仍然是不可或缺的。
**1 引言**
心电图(ECG)上QT间期的延长是一个关键标志物,可能预示着诸如尖端扭转型室性心动过速和突发性心脏死亡等严重后果[1]。大多数QT间期延长的情况是后天获得的,通常由电解质失衡或某些药物引发——包括常用的抗心律失常药、抗生素和抗精神病药[2]。患有先天性长QT综合征(LQTS)的患者特别脆弱,因为他们的遗传构成放大了这些外部因素引起的心律失常风险[3]。LQTS每年导致数千人死亡,并非因为缺乏治疗选择,而是因为早期诊断仍然困难[4]。对于容易发生QTc延长的个体(无论是由于先天性倾向还是后天因素),风险缓解依赖于能够及时识别高风险药物的框架。当前的医学风险评估系统,如Medbase的INXBASE,在报告药物不良反应(包括药物引起的QT间期延长等事件)方面非常有价值[5]。然而,这些工具本质上受到科学研究和出版节奏的限制。我们假设,机器学习(ML)的最新进展可以提供一种新的框架,利用注册数据来识别增加QT间期延长风险的药物使用模式。如果一个基于ML的框架首先可以在医院区域内进行训练,然后逐例应用,那么调查被识别为QT延长高风险患者的临床医生可以从电子健康记录系统中收到提示去记录ECG。为了探索这一概念,我们试图了解ML模型在预测静息ECG上的校正QT间期持续时间(QTc)方面的表现。我们利用FinnGen注册库中丰富的基因组和临床数据来构建这些概念验证模型。
**2 方法**
2.1 参与者
FinnGen研究是一个涉及芬兰大学、生物库、医院区域和国际制药公司的研究合作项目[6]。它包括来自六个区域医院生物库的样本,代表了各种专业医疗患者的广泛谱系;一个私人医疗生物库,它贡献了通常在专业护理中代表性不足的个体;以及 Blood Service Biobank,它为队列增加了更健康的个体。本研究使用了FinnGen扩展区3子研究的数据(n = 40,809),该子研究旨在丰富与心力衰竭研究相关的临床信息。值得注意的是,纳入该队列不依赖于心力衰竭的诊断,而仅基于超声心动图数据的可用性。这个子队列中的10,208名个体有标准的12导联静息ECG和其他协变量数据,具体缺失情况详见表1。
2.2 变量定义
QTc是使用Bazett公式计算的:QTc = QT/√RR,基于最早可用的ECG。年龄定义为ECG记录时的年龄。性别是根据遗传数据推断的。 prevalent medical conditions 是使用国际疾病分类(ICD)第9版和第10版代码、药物购买的Anatomical Therapeutic Chemical(ATC)代码、Nordic Medico-Statistical Committee(NOMESCO)代码进行外科手术的代码以及国家药物报销注册的特殊报销代码来识别的。慢性肾病由ICD代码N18、Y84.1、Z99.2、585和特殊报销代码137和138定义。冠状动脉疾病使用医院出院代码I20.0、I21、I22、410和4110以及冠状动脉旁路移植和冠状动脉成形术的手术代码来定义。糖尿病由医院出院代码E10、E11、E12、E13、E14和250,药物费用报销代码E11、E12、E13和E14以及药物购买代码A10B来定义。心力衰竭使用医院出院代码I11.0、I13.0、I13.2、I50、4029B、428、42700、42710、428和7824;药物费用报销代码201;以及药物购买代码C03CA01和C03EB01来定义。
2.3 药物使用的定义
药物使用是根据从芬兰社会保险机构的药品数据库获得的药物购买记录确定的。如果药物在第一次可用的静息ECG测量之前的3个月内被购买,则将其归类为已使用。根据FinnGen的隐私规定,所有用户数量少于五次的ATC代码被排除在外。此外,由于抗生素的治疗时间通常较短,因此也将它们排除在外。
2.4 多基因评分
使用来自391,124名欧洲UK生物库参与者的遗传数据来定义QTc的多基因评分(PGS)[7]。在UK Biobank评估中心,QT间期是通过Cardiosoft ver. 6(GE Healthcare, Chicago, IL, USA)从单次静息12导联ECG测量的,并使用Bazett公式计算QTc。随后通过对490,392个遗传变异应用惩罚线性回归来推导PGS,并对年龄、出生日期、性别、Townsend贫困指数和前16个遗传主成分进行了调整。
2.5 统计方法
拟合线性回归模型来评估QTc与各种药物之间的关联,同时调整了QT间期的PGS、年龄、性别、慢性肾病、冠状动脉疾病、糖尿病和心力衰竭。协变量是根据与心血管疾病相关的已建立临床风险因素预先选定的,PHP for QT interval也被纳入以考虑QTc持续时间的遗传成分。使用Benjamini–Hochberg方法进行了多重检验校正[8]。构建了一个嵌套交叉验证的梯度提升ML平台,使用R包xgboost来评估不同药物对QTc的协同贡献[9]。在内外循环中都应用了三重交叉验证,并重复了整个过程20次以确保稳健性。我们使用R包mlrMBO来调整模型超参数[10]。调整后的超参数包括提升轮数(10–500)、学习率(0.001–0.1)、最小损失减少(0–5)、L2正则化(0–10)、L1正则化(0–10)、最大树深度(2–5)、最小子节点权重(5–100)、子样本比例(0.6–0.9)和每棵树的列子样本比例(0.6–0.9)。一个最小模型基于PGS、年龄、性别、慢性肾病、冠状动脉疾病、糖尿病和心力衰竭来预测QTc,而完整模型还包括所有药物。二十个控制特征是从均匀分布中随机抽取的成功概率的二项式分布生成的,并与模型协变量一起纳入。模型性能使用均方根误差(RMSE)和决定系数(R2)来评估,其中y表示观察值,?表示它们的平均值,?表示预测值。RMSE的点估计值是在没有指定最小临床重要差异的情况下使用的。我们的目标是描述性比较相对预测性能,而不是正式的假设检验;因此,我们没有计算RMSE差异的置信区间。特征重要性是使用增益来量化的,它反映了每个决策树分割时模型性能的改进。平均增益低于控制特征的特征被认为具有可忽略的预测价值。此外,还使用Shapley值来解释特征对个别预测的贡献。通过计算当变量在真实和假之间切换时模型预测的平均差异来估计二元变量对QTc的边际效应。所有分析都是使用R版本4.4.3(R Core Team, Vienna, Austria)进行的。
2.6 伦理
FinnGen研究方案得到了赫尔辛基和Uusimaa医院区伦理委员会的批准。所有参与者都签署了书面知情同意书,自愿参与生物库研究。
**3 结果**
研究人群包括10,208名个体(平均年龄60.0 ± 14.5岁),其中59.0%为女性(表1)。注册数据确认了在ECG记录前3个月内购买了368种不同ATC代码的药物(表S1)。使用任何单一药物的个体比例从<0.1%到14.4%不等。
3.1 临床和药物对QTc间隔影响的线性回归分析
在一个仅包含临床协变量的线性回归模型中(表S2),心力衰竭与QTc间隔延长22.1 ms相关(95% CI: 18.7–25.5;p < 0.001),女性与QTc间隔延长4.4 ms相关(95% CI: 3.2–5.6;p < 0.001),PHP每增加1个标准差与QTc间隔延长4.5 ms相关(95% CI: 3.9–5.1;p < 0.001)(图1)。在调整临床协变量后,八种处方药物与QTc持续时间显著相关。阿昔洛韦和炔诺酮-雌激素组合与较短的QTc持续时间相关,而胺碘酮、非诺贝特、氟卡尼、亮丙瑞林、螺内酯和华法林与较长的QTc间隔相关(图2)。
3.2 临床和药物与QTc关联的机器学习分析
在仅使用临床协变量的ML模型中(表S3),R2为4.5%,RMSE为28.3。当包括368种不同ATC代码的数据时,模型性能略有提高(表S4):在完整模型中,R2增加到4.9%,RMSE降低到28.2。临床协变量始终占模型性能的30%–50%,而单独添加PGS占20%–30%(图3)。华法林是唯一一种在增益、Shapley值和传统线性回归中始终与QTc时间延长相关联的药物(图3)。Shapley值突出显示的大多数药物是用于治疗心血管疾病(如心房颤动、心力衰竭和冠状动脉疾病)的药物。使用模型增益(一种较不严格的重要性衡量标准),我们还发现了几种非心血管药物(包括阿昔洛韦、雌二醇、非诺贝特、左西替利嗪、对乙酰氨基酚、喹硫平、来曲唑和利拉鲁肽)也与QTc时间延长有显著关联。
**图3**(在图形查看器中打开)
**临床协变量和处方药物的的重要性指标及效应大小估计值,比较了线性回归和机器学习模型。仅显示了根据完整机器学习模型增益具有预测价值的处方药物。图表显示了基本模型和完整机器学习模型(增益和Shapley值)的特征重要性,以及线性回归和机器学习分析的效应大小估计值,以彩色背景上的数字形式呈现——蓝色表示负效应,红色表示正效应——从而能够直接比较它们对QTc变化的贡献。β,线性回归;ML,机器学习。**
**4. 讨论**
在这项基于大型注册库的研究中,我们探讨了结合临床和药物数据的机器学习模型在识别QTc时间延长风险个体方面的潜力。作为基准,我们使用了传统的线性回归进行了平行分析,以验证和解释这些发现。与先前的知识一致,我们的分析证实了心力衰竭[11]、女性性别[12]和多基因风险与较长的QTc间隔之间的关联[13]。然而,即使使用较不严格的特征重要性指标,也只有18种处方药物在机器学习模型中与QTc时间延长相关。这些药物大多数传统上并未被认为与QT间隔有影响,这突显了这种方法在识别有意义的药物-QTc关联方面的有限潜力。值得注意的是,华法林是唯一一种在所有分析方法中始终与QTc时间延长相关联的药物,尽管它对QT间隔的影响尚不明确,这凸显了使用机器学习检测药物对QTc影响的挑战和可能出现假阳性的风险。当前的药物风险评估系统(如Medbase的INXBASE)是基于已建立的科学证据构建的,为临床医生提供了关于潜在药物相互作用的宝贵指导[5]。然而,它们的范围受到科学出版物进展速度的限制。由于这些工具依赖于已发表的研究,它们仅反映了已经研究、撰写和同行评审的内容——从而在评估新兴或特征不明确的药物风险方面可能存在差距。在此背景下,我们试图探讨机器学习是否可以通过揭示药物-QTc关联来为此艰巨任务做出贡献。通过首先用真实世界数据训练机器学习模型,这种策略有可能通过与电子健康记录系统的集成实现实时检测。在本研究中,机器学习模型识别的18种药物中,只有四种——胺碘酮、氟卡尼、喹硫平和来曲唑——在INXBASE中被列为对QT间隔有影响。有人可能会认为,如果样本量更大,可能会发现更多的真实阳性结果。然而,真正的限制可能在于本研究中的假阳性数量。氨氯地平就是一个典型的例子:它更可能是一种潜在高血压的标志物,而高血压已被知会延长静息心电图(ECG)的QT间隔[14]。类似的情况也可能适用于华法林,这种药物常用于治疗心房颤动,而心房颤动往往是长期高血压的结果[15]。相反,像氟哌啶醇和阿米替林这样的药物由于其已知的QTc影响,本应能产生可检测的信号[16];然而,它们的低暴露率(0.1%–0.3%)可能降低了在这个人群中的信号检测能力。值得注意的是,回归分析还揭示了一些意外的发现。阿昔洛韦显示出与QTc的负相关,这并未得到先前文献的支持;鉴于暴露人数非常少,偶然性仍是一个合理的解释。相比之下,非诺贝特显示出与QTc的正相关,这是一个新的观察结果,可能的解释是存在潜在的心血管疾病导致的残余混杂 [19]。我们的研究发现还强调了另一个关键挑战,即即使对于被确认为真实阳性的药物,机器学习分析检测到的效应大小也非常微小。例如,尽管胺碘酮是一种公认的延长QT间隔的药物,但机器学习模型估计其对QTc时间延长的影响仅约为+1毫秒——这种增加不太可能具有临床意义。相比之下,线性回归模型显示胺碘酮的效应大小为+49毫秒,这与临床预期更为一致[17]。这种差异突显了在这种背景下机器学习方法在风险量化方面的潜在局限。其他使用更严格暴露标准的研究显示出了更强的预测性能。在一个大型住院患者队列中,基于诊断和药物数据训练的机器学习模型能够以合理的准确性预测QTc间隔延长(定义为QTc > 500毫秒),其中黑盒方法的表现优于更具解释性的传统统计方法(一致性指数分别为0.78和0.65)[18]。在门诊患者队列中也观察到了类似的预测性能(一致性指数为0.80),那里应用了卷积神经网络处理开始用药后6个月内收集的临床和ECG数据[19]。另一项研究表明,结合实验室、ECG和临床数据的机器学习模型在预测接触相互作用药物后24–48小时内QTc延长的能力显著优于传统方法(82.4% vs. 62.0%)[20]。与我们研究的方法论差异之一在于如何定义药物暴露。之前的研究将分析限制在具有已知QT延长潜力の药物上——要么专注于高风险药物的精选列表[18, 19],要么针对已知会增加QTc时间延长的特定药物-药物相互作用[20]。这种目标导向的方法可能增强了模型检测有意义关联的能力。相比之下,我们的研究采用了一种更广泛的策略,包括所有处方药物,不论其已知的QT风险如何。虽然这种设计提高了普遍性,并可能发现新的关联,但也可能引入噪声,从而潜在地稀释了真正延长QT间隔的药物的信号。机器学习方法的主要优势包括其处理缺失数据的能力、管理共线性和非线性的能力,以及捕捉变量之间复杂相互作用的能力[21]。嵌套交叉验证提供了一种获得无偏性能估计和最小化过拟合的稳健方法[22]。与传统统计方法相比,机器学习技术能够充分利用数据的复杂性——尤其是在处理年龄和PGS等合理化的连续协变量时。尽管这些机器学习模型在风险预测方面具有巨大潜力,但仍然存在一些挑战。机器学习算法的复杂性经常引发关于其可解释性和临床适用性的担忧。正如Black等人所指出的,虽然机器学习模型可以胜过传统统计方法,但其“黑箱”特性可能会阻碍其在临床实践中的接受度[23]。因此,我们选择以静息ECG上的QT间隔作为结果,因为在这种框架下,临床医生可以通过获取ECG来验证或排除预测的风险,使其成为一个实际的决策点。本研究的优势包括来自FinnGen队列的大型且相对未经过滤的样本、全面的药物数据整合,以及机器学习分析与线性回归和INXBASE搜索的交叉验证。局限性包括观察性设计、未测量因素可能带来的残余混杂,以及达到足够大样本量以检测药物和QT时间之间关联的固有挑战。尽管我们没有用药前的ECG数据,但由于纳入了PGS,这一限制可能得到了部分缓解。此外,由于注册数据的性质,我们模型可用的大多数信息是二元的,这可能降低了机器学习方法相对于传统统计方法在统计功效上的比较优势。在涉及低流行率特征的情景中(例如,从缺失到少于一半的研究人群),这种限制可能尤为明显。在这种情况下,即使具有潜在强效应的特征也可能由于其罕见性而对模型性能影响甚微。最后,虽然我们的数据反映了药物购买情况,但它仅作为实际使用的代理,而依从性往往不完美——根据治疗方案的不同,依从性范围从10%到70%不等[24]。这项研究应被视为一个新颖的概念验证。某些数据质量和模型设计的改进可能会提高用于预测静息ECG上QTc时间的机器学习模型的性能。例如,结构化的处方数据(如标准化剂量条目,例如mg/天)的可用性可以将解释变量建模为多类或半连续输入。为了支持此类改进的实现,我们通过Zenodo公开了我们的代码和工具,鼓励在这一领域继续进行研究。总之,使用基于真实世界数据训练的机器学习模型自动检测QTc延长药物效应的概念并未得到我们的研究结果的支持。实际上,似乎短期内不会出现一种方法论上的“银弹”——无论是基于机器学习的还是其他方法——来取代目前临床药理学研究人员进行的繁琐的逐药评估。从各种研究中系统地收集证据并将其仔细整合到可信的药物风险评估平台中的工作仍然是不可或缺的。在当前围绕人工智能、机器学习及相关技术的喧嚣中,这个结论可能并不完全令人不快。持续需要专家判断和系统的证据评估,这提醒我们,并非所有临床决策的方面都可以或应该自动化。
**致谢**
开放获取出版由图尔库大学(Turun yliopisto)促成,作为Wiley - FinELib协议的一部分。
**作者贡献**
V.L.和J.P.撰写了手稿;V.L.、A.W.、K.T.、T.P.、J.L.、FG、A.M.、T.J.N.和J.P.设计了研究;V.L.、A.W.、K.T.、T.P.、J.L.、A.M.、T.J.N.和J.P.进行了研究;J.P.分析了数据。
**资金**
V.L.获得了芬兰西南部Wellbeing Services县州研究基金的资助。K.T.获得了芬兰心血管研究基金会、芬兰医学基金会和芬兰酒精研究基金会的研究资助。J.P.获得了Paavo Nurmi基金会和芬兰医学基金的资助。这些资助机构在研究设计、数据收集、分析、解释以及手稿撰写方面没有发挥作用。本研究使用了FinnGen数据,该数据由Business Finland提供的两项资助(HUS 4685/31/2016和UH 4386/31/2016)以及14家行业合作伙伴资助:AbbVie Inc.、AstraZeneca UK有限公司、Biogen MA有限公司、Bristol Myers Squibb(包括Celgene Corporation & Celgene International II Sàrl)、Genentech有限公司、Merck Sharp & Dohme LCC、Pfizer有限公司、GlaxoSmithKline Intellectual Property Development有限公司、Sanofi US Services有限公司、Maze Therapeutics有限公司、Johnson&Johnson Innovative Medicine有限公司、Novartis AG、Boehringer Ingelheim International GmbH和Bayer AG。生物样本由Auria Biobank、THL Biobank、Helsinki Biobank、Biobank Borealis of Northern Finland、Finnish Clinical Biobank Tampere、Biobank of Eastern Finland、Central Finland Biobank、Finnish Red Cross Blood Service Biobank、Terveystalo Biobank和Arctic Biobank提供;所有芬兰生物样本库都是BBMRI.fi基础设施的成员,由Finnish Biobank Cooperative(FINBB)协调。
**利益冲突**
V.L.从Boehringer Ingelheim收到了与本研究无关的演讲酬金。所有其他作者均声明与本研究无竞争利益。
**数据可用性声明**
本研究的分析代码已存放在Zenodo仓库中,DOI为10.5281/zenodo.15223007。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号