通过双重聚合和协同优化实现药物相互作用预测的多关系知识图谱
《Bioorganic Chemistry》:Multi-relational knowledge graph for drug-drug interaction prediction via dual aggregation and collaborative optimization
【字体:
大
中
小
】
时间:2026年02月22日
来源:Bioorganic Chemistry 4.7
编辑推荐:
药物相互作用预测中,多关系知识图谱的特征提取和交互建模存在计算复杂度高、忽略实体多义性等问题。本文提出MRACO框架,通过双聚合消息传递层实现多关系特征交互,结合协作优化损失函数简化路径计算,有效提升预测稳定性。实验表明,该方法在复杂知识图谱中优于现有模型。
余伟|孟孟伟|赵博伟|尤珠红|王磊
广西科学院人机交互与智能决策重点实验室,中国南宁530007
摘要
识别潜在的药物相互作用在临床护理和新药开发中至关重要,因为药物之间的相互干扰可能导致不良反应。最近,计算方法被广泛用于预测药物相互作用(DDIs)。然而,这些方法在节点特征表示过程中常常遇到高计算复杂性,并且经常忽略实体的交互性和多义性。有效处理异构信息仍然是一个重大挑战。为了应对这些限制,我们提出了一个基于多关系知识图的双重聚合和协作优化学习框架,称为MRACO,用于DDIs预测。MRACO利用这些图的结构信息,高效学习各种关系类型的交互信息。此外,MRACO采用双重聚合操作来显式编码和聚合多类型信息,捕捉药物节点的多样化语义关系。通过使用协作损失优化函数,MRACO简化了复杂的计算过程,消除了冗余信息并增强了模型的鲁棒性。通过整合深度交互信息,MRACO利用知识图中的丰富上下文数据,提高了预测的稳定性。实验证明了MRACO在多关系网络中的特征提取能力,突显了其对DDIs潜在机制的理解。
引言
在临床实践中,多药治疗可以显著提高治疗效果[1]。然而,它也可能导致意外的药物相互作用(DDIs)甚至不良药物反应(ADRs)[2],[3]。因此,在药物开发阶段识别潜在的DDIs至关重要。传统的体内和体外实验严重依赖于环境条件、剂量和药物给药方案[4],[5]。此外,药物审批过程既严格又漫长。这些因素共同导致了DDIs识别的延迟[6],[7]。相比之下,信息学方法在DDIs预测中显示出显著的优势[8],[9]。然而,使用计算方法有效组织、提取和操作这些数据仍然是药物开发过程中的一个紧迫且实际的挑战[10],[11]。
机器学习和深度学习方法在多数据驱动的DDIs预测中取得了相当大的成功[12],[13]。例如,DDIMDL[14]和DDIMDAE[15]利用深度学习框架整合多模态数据来学习药物对之间的跨模态表示。MDDI-SCL[16]提出了一种监督对比方法,结合了潜在的药物特征和监督对比损失模块来学习药物对的特征。DSIL-DDI[17]、SSI-DDI[18]和DDI-GCN[19]都利用图神经网络处理药物化学结构的原始分子图表示。DSIL-DDI关注子结构相互作用,并提出了一种领域不变的表示方法,可以从源领域学习DDIs,而SSI-DDI则专注于配对子结构在下游任务中的重要性。相比之下,DDI-GCN通过图卷积网络聚合节点的直接和间接邻居,更加强调子结构的详细特征。
近年来,在药物-靶点亲和力和相互作用预测方面也取得了快速进展,多尺度表示学习和图优化显示出强大的有效性。例如,基于Transformer-autoencoder架构的关联和交互学习框架已被提出来增强子结构的相关性和可解释性[20]。多尺度信息交互结合图扩散和图优化进一步提高了结构表示的鲁棒性[21],[22]。此外,引入了旋转编码和信息保留机制来更好地捕捉上下文依赖性和长距离分子关系[23]。总的来说,这些进展极大地丰富了表示学习范式,并为后续的药理关系建模提供了宝贵的方法论见解。
知识图在多个研究领域得到了广泛应用,包括知识表示、知识集成、矩阵完成和链接预测等下游任务[24],[25],[26]。在生物信息学领域已经开发了几个大规模的知识图。这些方法通过整合来自多个数据源的信息来构建知识图,并在这些图上训练嵌入模型,为实体和关系生成向量,从而为各种下游任务提供外部知识。许多研究表明,这些方法是可行的,并表现出强大的特征化能力。例如,HAN-DDI[27]提出了一个基于异构图注意力网络的端到端模型,可以使用不同的基于元路径的拓扑特征提取实体之间的丰富语义关系。KG-MTL[28]利用大规模知识图来预测分子相互作用,以协作方式从知识图和分子图中提取特征。HGCNMDA[29]开发了一个多关系卷积网络模型,以监督方式整合不同类型边的表示。
使用知识图嵌入作为特征的理想假设是我们能够一次性获得全面的药物信息,并立即判断药物对之间是否存在关联。目前,大多数现有方法将复杂的多类型相互作用建模为孤立的数据实例,这些方法仅使用浅层关系来构建嵌入函数,而不考虑不同实体之间的相关性。因此,这种方法的嵌入函数缺乏对关键交互信息的显式编码,无法从实体的集体行为中提取完整的交互特征。
为了解决这些挑战,关键在于设计特定于任务的嵌入函数,并使用消息传播方法来捕获和计算知识图中的多关系节点特征。为此,我们最初从DrugBank[30]、KEGG[31]和PubChem[32]收集相关信息,构建了一个包含五种不同类型实体的有向知识图(DKG)。随后,我们将DDIs预测任务概念化为一个链接预测问题,并提出了一个名为MRACO的计算框架。该框架通过表示不同类型的边关系来模拟药物节点与其他实体之间的连通性,并在消息传播层使用双重聚合操作来促进知识图中的信息交互。这项工作的主要贡献如下:
(1)我们构建了一个有向知识图(DKG),可用于知识计算,其中包含247,912个关系对和五种不同类型的实体。
(2)我们开发了一个双重聚合消息传递层,并为多类型实体的交互嵌入设计了一个嵌入函数。该层利用相邻节点的信息来更新中心节点的嵌入,从而在信息传播过程中促进跨关系的聚合和交互。
(3)我们设计了一个面向任务的协作损失优化函数。该函数通过以反向方式指导模型训练,减轻了在复杂知识图中进行路径 materialization 的劳动密集型过程。
实验设置
实验设置
我们使用PyTorch在NVIDIA RTX 3060 GPU上实现了所提出的模型及相关实验,所有代码均使用Python 3.7编写,以处理图数据结构和图神经网络操作。模型使用Adam优化器进行了优化。为了确保梯度稳定性、收敛速度和计算效率,我们将批量大小设置为64,学习率设置为0.001,正则化系数设置为1,边的dropout率设置为0.9。采用了提前停止策略
讨论
在这项研究中,我们提出了一个基于有向知识图和多关系双重聚合及联合优化的网络学习框架,以端到端的方式预测潜在的DDIs。比较实验和案例研究实验表明,我们提出的模型在特定任务中表现出高效的链接预测能力。在未来的研究中,我们计划设计一个更自主的消息传播框架,以提高模型的泛化能力,从而
方法概述
将不同类型顶点和边之间的结构关系映射到潜在空间中,从而编码并保留多关系网络的结构和语义属性,这是我们工作中的一个主要考虑因素[37]。另一个关键方面是如何在特定预测任务中协作利用多个损失函数来优化和解决链接预测过程的劳动密集型问题[38]。为了应对这些挑战,我们提出了一个
CRediT作者贡献声明
余伟:撰写——原始草稿。孟孟伟:方法论,形式分析。赵博伟:资源。尤珠红:监督。王磊:调查,概念化。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了广西科学技术计划(项目编号2024-102-3);广西自然科学基金(项目编号2024GXNSFAA010283、2023GXNSFDA026031);山东自然科学基金(项目编号ZR2024MF042);国家自然科学基金(项目编号62573419、62172355);国家杰出青年科学基金(项目编号62325308)的支持。作者感谢所有匿名审稿人的建设性建议。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号