MFMHIN:通过具有生物感知能力的异构信息网络预测协同药物组合

《Biomedical Signal Processing and Control》:MFMHIN: Predicting synergistic drug combinations via biologically-aware heterogeneous information networks

【字体: 时间:2026年03月25日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  协同药物组合预测框架MFMHIN通过整合化学结构、ATC代码、靶点、通路和类别五种多模态信息构建异构信息网络,采用分层负采样策略(Type I和Type II)解决采样偏差问题,并基于多视图集成提升模型性能。在DCDB和独立抗真菌数据集上验证,其AUC分别达到0.8875和0.954,成功恢复52个已知协同对,23个新预测获文献支持。

  
王琦|田蕾霞|周志恒|严桂英
中国农业大学理学院,北京100083,中国

摘要

协同药物组合对于提高治疗效果和克服药物耐药性至关重要,但实验筛选既昂贵又耗时。当前的计算模型常常由于多模态特征整合不足和有偏的负样本选择而受到限制,这可能会掩盖真正的协同信号,并导致泛化能力不稳定。为了解决这个问题,我们提出了MFMHIN(基于异构信息网络的多信息融合模型),该模型通过整合五种药物模式(化学结构、ATC代码、靶点、通路和类别)来构建一个丰富的、具有生物学意义的背景。MFMHIN引入了两项关键创新:一种基于原则的两层负样本选择策略,将确认的非协同对(类型I)与经过药理学筛选的高置信度负样本(类型II)相结合;以及一种多视图集成方法,融合来自不同异构信息网络的嵌入以捕捉多样的药物关系。在DCDB数据集上的评估表明,MFMHIN显著优于传统基线方法,在包含确认的非协同对(类型I)和药理学筛选的负样本的平衡数据集上达到了0.8875的峰值AUC。其泛化能力在独立的抗真菌组合数据集上得到了验证,AUC为0.954,并成功恢复了所有52对已知的协同组合。重要的是,模型从高质量负样本中得出的近一半(49个中的23个)新预测结果得到了现有文献的证实,这凸显了其实际应用价值。MFMHIN提供了一个强大且可泛化的框架,用于加速协同药物组合的计算筛选。

引言

现代药理学的研究重点已从“一种药物,一个靶点”的范式转向多靶点策略和组合疗法[7]。通过同时作用于多个靶点(通常以较低的个体剂量),组合疗法可以在减少药物耐药性和毒性的同时增强对复杂疾病的治疗效果[1]、[2]、[3]。因此,组合疗法已成为从癌症到传染性疾病等多种疾病的标准治疗方法[4]、[5]。然而,可能的药物组合数量呈指数级增长,使得穷尽性的实验筛选变得极其耗时且成本高昂。因此,开发能够准确优先考虑潜在协同组合的计算模型对于加速药物发现过程和减轻实验负担至关重要[8]。 近年来,通过多种计算方法在预测协同组合方面取得了显著进展。早期的系统生物学方法(如Havaleshko等人[9])利用了基因表达谱,但在应用于机制未知的新组合时往往受到限制。动态模型(例如Komarova等人[10])虽然能够捕捉时间交互动态,但由于复杂性而难以广泛应用。最近,机器学习和深度学习方法(例如Zhang等人的AuDNNsynergy[11])展示了进展,而基于图的方法也提供了新的视角。例如,Han等人[12]通过生物医学知识图谱预测了相互作用,Li等人[13]利用图卷积网络对协同作用进行了建模。此外,还提出了元学习框架来处理数据稀疏性问题并在不同实验条件下传递知识。 尽管这些方法有所改进,当前的模型仍存在关键局限性。首先,许多方法依赖于同质网络或未能充分整合多模态特征,导致缺乏生物学解释性的“黑箱”表示。其次,更重要的是,大多数模型采用简单的随机负样本选择方案,将所有未标记的对都视为非协同的。这通过将真正的拮抗作用与缺失数据(即“易处理负样本”问题)混淆,从而引入了显著偏差,使得模型无法区分真正的拮抗效应和简单的证据缺失。 为了解决这些挑战,我们提出了MFMHIN,这是一种基于异构信息网络(HINs)的多信息融合框架。MFMHIN明确整合了结构、治疗和机制信息,以构建生物学上合理的药物表示。我们框架的一个核心创新是一种基于原则的两层负样本选择策略,它区分了确认的非协同对(类型I)和经过药理学筛选的潜在负样本(类型II),从而在保留生物学透明度的同时减轻了采样偏差。在DCDB数据集和独立的抗真菌基准测试中,MFMHIN表现出优于传统基线的鲁棒性和泛化能力。该框架不仅提供了一个高性能的预测工具,还为合理的组合疗法设计奠定了坚实的基础。

符号和定义

异构信息图:设 G = (V, E, A, R) 为一个图,其中 V 是节点集,E 是边集,A 是节点类型集合(基于特征/角色的不同类别),R 是边类型集合(不同的交互类型)。如果 A+R>2,那么 G 是一个异构图,也称为异构信息网络(HIN)。
元路径:给定一个异构图 G = (V, E, A, R),元路径 是一系列节点和边类型的序列,表示为 A1?R1A2?R2??RlAl+1 或简写为 A1A2?Al+1

参数分析

为了验证我们相似性网络构建的鲁棒性,我们分析了相似性阈值 (Tsim) 对模型性能的影响。我们将 Tsim 从0.3变化到0.7,分别针对化学结构和ATC网络进行了测试。 - 低阈值 (Tsim = 0.3):导致网络过于密集,许多连接较弱,引入了噪声,使AUC降至0.8520。 - 高阈值 (Tsim = 0.7):导致网络变得稀疏,关键生物学信息丢失,使AUC降至0.8410。 - 最优阈值 (T

结论与讨论

在这项研究中,我们解决了准确预测协同药物组合的挑战,这一任务受到多模态生物数据整合碎片化以及普遍存在的有偏负样本选择的阻碍。我们提出了MFMHIN,这是一个基于异构信息网络(HINs)的多信息融合框架,它明确整合了结构、治疗和机制信息。通过表示药物、靶点、通路和治疗类别...
王琦:撰写 – 审稿与编辑,撰写 – 原始草案,验证,方法学,调查,形式分析,概念化。 田蕾霞:撰写 – 原始草案,可视化,验证,监督,软件,资源,方法学,数据管理,概念化。 周志恒:验证,方法学,形式分析。 严桂英:撰写 – 审稿与编辑,监督,项目管理,调查,资金获取。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号