基于多图和多维表示的化合物心脏毒性预测

【字体: 时间:2026年03月13日 来源:Chemometrics and Intelligent Laboratory Systems 3.8

编辑推荐:

  本研究提出一种基于多图和多元特征的新方法,结合图神经网络(GNN)和双向门控循环单元(BiGRU)构建九类化合物心脏毒性预测模型,显著提升预测性能并揭示毒性结构特征,并开发在线预测平台CardiacTox。

  
Kairui Liang|Ruihong Wang|Dongya Qin
达尔豪斯大学,哈利法克斯,B3H 4R2,加拿大

摘要

化合物引起的心脏毒性可以从轻微的心电图波动到危及生命的心律失常不等。与实验方法相比,计算方法在预测化合物心脏毒性方面具有成本更低、效率更高的优势。我们提出了一种新的化合物表示方法,该方法利用多图和多维特征来表征与毒性相关的特性。我们通过使用图神经网络和双向门控循环单元(BiGRU)开发了针对九类化合物(心律失常、心力衰竭、心脏毒性、心脏阻滞、高血压、心肌、hERG、CaV1.2和NaV1.5)的心脏毒性预测模型。与以往的研究相比,我们的模型表现出更优或相当的预测性能。此外,我们的模型能够有效捕捉化合物中的毒性警示结构,并阐明结构与毒性之间的关系。我们开发了一个在线服务器CardiacTox(http://cardiactox.cqudfbp.net:88/),用于化合物心脏毒性预测和毒性警示结构的在线检索。

引言

心脏毒性是指药物、化学物质或其他外部因素可能导致心脏出现不良反应或损伤的潜力,从而引发心律失常、心力衰竭和心肌损伤等症状[1]。化合物中的心脏毒性在药物开发的早期阶段带来了显著的风险和成本增加,同时也给患者带来了巨大的痛苦。因此,在药物开发的早期阶段进行心脏毒性评估至关重要。传统的实验方法用于测试化合物的心脏毒性成本高昂且效率低下[2,3]。相比之下,计算方法可以降低药物开发成本并提高效率[4]。最近,系统级和基于组学的研究表明,药物引起的心脏毒性涉及多种结构和功能终点,这促使了更全面的计算机模拟安全工具的开发[5,6]。
近年来,许多研究利用机器学习或深度学习方法开发了化合物的心脏毒性预测模型[[7], [8], [9]]。例如,Delre等人编制了一个包含7983种作为hERG阻断剂的化合物的数据集,并使用了一维和二维描述符以及六种机器学习算法构建了30个模型。结果表明,最佳模型的AUC达到了0.95[10]。Zhang等人基于MACCS和Morgan分子指纹以及多种机器学习算法训练了一个hERG抑制剂预测模型HergSPred[11]。Cai等人开发了一个名为deephERG的框架,用于预测hERG通道阻断剂的活性。该框架使用了7889种化合物的数据集,并采用分子描述符和MOL2VEC对化合物进行多维表示[12]。Arab等人开发了一个名为CToxPred的小分子心脏毒性预测工具,专注于与电压门控钾通道、电压门控钙通道(Cav1.2)和电压门控钠通道(Nav1.5)相关的三种类型的心脏毒性。他们使用了分子指纹、描述符和分子图表示,以及深度神经网络(DNN)和图神经网络(GNN)[13]。
除了这些工具外,一些最近的研究进一步探索了深度学习和多模态策略在心脏毒性风险评估中的应用,包括从大量化合物集合中预测hERG介导的毒性的模型,并整合了基因表达或高内涵成像数据以及监管数据集(如DICTRank[14,15])。此外,新发布的结合了分子指纹、描述符和现代神经网络架构的深度学习框架进一步证实了基于AI的心脏毒性预测的实用性,并强调了在早期药物发现中可解释模型的重要性[16,17]。上述大多数研究主要关注预测hERG阻断剂,这些模型的预测性能和可解释性仍有待进一步提高。
在这项研究中,我们提出了一种基于多视角的新型化合物表示方法,整合了常用的分子指纹和各种分子描述符,形成了分子的多维表示。该方法应用于涵盖九种类型心脏毒性相关毒性的数据集。我们基于GNN和双向门控循环单元(BiGRU)开发了一个模型。与大多数仅关注单一离子通道或毒性终点的现有心脏毒性模型[[10], [11], [12], [13]]相比,我们的多视角GNN-BiGRU框架同时利用了九个心脏毒性数据集的信息,并明确结合了一个子结构挖掘模块来识别毒性警示片段。此外,我们探讨了化合物中的毒性警示结构(见图1),并创建了一个在线服务器CardiacTox(http://cardiactox.cqudfbp.net:88/),用于化合物心脏毒性预测和毒性警示结构的检索。

数据集片段

数据集

为了开发预测化合物诱导的心脏毒性模型,使用了九个数据集(心律失常、心力衰竭、心脏毒性、心脏阻滞、高血压、心肌、hERG、CaV1.2和NaV1.5,详见支持信息中的表S1)。心律失常、心力衰竭、心脏阻滞、高血压和心肌数据集来源于Cai等人的研究[12],代表了在临床环境中观察到的相应不良反应。hERG数据集的来源

用于心脏毒性预测的数据集的骨架特征

为了探索数据集的分布多样性,我们进行了分子骨架分析[19],包括Murcko骨架和碳骨架的分析(前者是指从分子结构中去除所有侧链和连接原子后形成的核心结构,后者是指由碳原子组成的有机分子的主要结构特征)。基于最常见的150个Murcko骨架和碳骨架的云图

讨论

与其他模型相比,所提出网络的主要优势在于其对化合物的多视角和多维表示。该模型结合了图神经网络(GNN)和双向门控循环单元(BiGRU),从多个角度捕捉化合物的结构和理化特征。这种方法使模型能够有效表示复杂的分子结构及其与心脏毒性的关系,从而提高预测性能

结论

在这项研究中,我们基于深度学习方法开发了心脏毒性预测模型。这些模型是在一个分子属性预测框架内实现的,该框架利用了多视角表示和图神经网络(GNN)。通过将多视角图表示与Morgan指纹、MACCS指纹和分子描述符相结合,我们构建了九个高精度的模型来预测化合物的心脏毒性。在外部测试集上,所提出的模型

CRediT作者贡献声明

Kairui Liang:撰写——原始草稿、可视化、验证、概念化。Ruihong Wang:资源、方法论、数据管理。Dongya Qin:撰写——审稿与编辑、监督、研究。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

感谢达尔豪斯大学的Meng He教授、上海交通大学的Dongqing Wei教授、重庆大学的Songtao Guo教授、重庆师范大学的Bo Li副教授以及重庆邮电大学的Yinghong Li副教授提供的宝贵讨论和计算服务器支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号