CL-MHAD:基于对比学习的多超图聚合与扩散模型,用于处方推荐

《Artificial Intelligence in Medicine》:CL-MHAD: Contrastive Learning-based Multi-Hypergraph Aggregation and Diffusion model for prescription recommendation

【字体: 时间:2026年02月21日 来源:Artificial Intelligence in Medicine 6.2

编辑推荐:

  中医个性化处方推荐中多维度知识融合与高阶关系捕捉机制。CL-MHAD模型通过多视图超图构建、扩散增强的高阶关系捕捉及跨视图对比学习,整合症状-处方-草药属性-剂量四维信息,在真实临床数据集GID中验证,推荐准确率最高提升24.67%,有效解决数据稀疏性和特征可区分性问题。

  
Juanzi Zhou|Yin Zhang|Fang Hu|Xiong Zhang|Pin-Han Ho
湖北中医药大学信息工程学院,武汉,430065,中国

摘要

在传统中医(TCM)中,基于多种综合征的处方推荐对于个性化诊断和治疗具有重要意义。然而,有效提取和融合草药中的多维知识以提供准确的基于综合征的处方推荐仍然是一个挑战。为了解决这个问题,我们提出了CL-MHAD,这是一种基于对比学习的多超图聚合和扩散模型,用于处方推荐。该模型关注处方、草药、属性和剂量,采用了一种多视图超图重构机制,并使用一致的Top-K邻居策略生成亲和力和特征矩阵。随后,我们提出了一种增强扩散的方法,利用多步传播和加权映射来捕捉高阶关系。然后,我们提出了一种跨视图对比学习策略来提高区分度,并提出了一种基于拓扑的随机游走增强方法来缓解数据稀疏性问题。我们设计了一个结合分类、对比和增强损失的集成损失函数来优化模型性能。我们使用胃肠道疾病(GID)作为案例研究,在实际临床环境中评估了CL-MHAD的性能。广泛的实验,包括比较评估、消融研究和参数敏感性分析表明,CL-MHAD在多个评估指标上均优于代表性基线模型。具体来说,该模型在所有数据集上的性能提升幅度为1.27%至24.67%。我们进一步通过剂量-综合征交互作用和数据稀疏性鲁棒性测试评估了该模型,结果表明我们的加权融合策略有效,且模型具有出色的稳定性。这项研究为中医中准确的基于综合征的处方推荐提供了一个有效的解决方案和有前景的范式。

引言

在传统中医(TCM)中,精确的处方推荐至关重要,它为个性化治疗提供了基础,并确保了治疗效果和用药安全。TCM的基本原则强调基于综合征差异的个性化治疗,其中“相同药物不同剂量”和“相同处方不同综合征”等剂量变化原则对于确保用药准确性至关重要[1],[2]。胃肠道疾病(GID)是全球最常见的慢性疾病之一[3],这是一个主要的健康挑战。虽然TCM通过草药处方提供了有效的治疗方法[4],但临床数据的异质性和复杂的综合征机制常常使处方模式变得复杂。因此,现有的计算方法无法充分探索隐藏在临床数据中的多维知识和复杂关系,从而限制了它们在满足个性化诊断和治疗要求方面的有效性[5]。
传统的计算模型,如图协同过滤[6]、基于矩阵分解的方法[7]和增强知识图谱的协同过滤[8],在TCM研究和临床实践中被广泛使用。然而,它们在模拟复杂的多关系交互方面往往存在局限性。最近,深度学习模型,如图神经网络(GNNs)[9]和对比学习(CL)[10],在提高处方推荐的精确度和个性化方面展现了巨大潜力。这一进展促进了TCM的现代化,并激发研究人员提出了各种新的处方推荐框架。Long等人利用具有自注意力和自监督的孪生网络(RTGN)改进了TCM胃肠道恶性肿瘤数据集上的患者相似性建模和检索[11]。G??ebakan等人提出了一个基于本体的系统(DIAKID),使用SWRL规则通过整合药物剂量预测和交互警报为2型糖尿病(T2DM)和慢性肾病(CKD)患者推荐安全处方[12]。Dong等人提出了一个模型(PresRecST),结合TCM知识图谱和序列预测来优化处方推荐[13]。Yang等人使用了一个模型(PresRecRF)整合分子知识和TCM语义表示进行处方推荐[14]。Tang等人提出了一个具有语义增强和注意力融合的自监督图模型(BSGAM),通过解决数据稀疏性和表示限制来改进草药推荐[15]。尽管在医学数据分析方面取得了AI的发展,但现有模型大多局限于单视图表示,缺乏对草药剂量的有效探索,并且难以捕捉处方中的高阶关系[16]。
尽管有这些进展,当前的处方推荐方法仍面临几个关键限制。主要挑战总结如下:
  • 当前方法主要依赖于单视图表示,缺乏对多个视图(如草药属性、剂量和共现频率)的系统探索。这些方法可能导致处方模式的建模不足,限制了对其潜在机制的理解[17],[18]。
  • 挖掘草药剂量和整合多视图特征的能力不足,阻碍了处方数据的有效表示,限制了草药和处方嵌入的联合学习,以及捕捉处方中高阶关系的能力[19],[20]。
  • 现有的基于AI的TCM模型由于数据稀疏性和特征区分度有限而面临挑战,这削弱了它们的泛化能力。此外,缺乏集成损失优化进一步限制了整体模型性能[21],[22],[23]。
在医学数据建模中,一个明确定义的框架是必不可少的。提高基于图的复杂模型的可解释性需要对其算法阶段进行清晰和系统的阐述[24]。透明的计算流程阐明了多视图信息的处理和整合过程,从而增强了临床信任并提高了可解释性。一些可解释的GNN框架被提出用于量化TCM中的兼容性[20],还有一些综述讨论了医疗保健中的可解释深度学习[25],[26]。同样,推荐系统[27]的研究,包括处方推荐,需要结构化的、分阶段的设计来支持可靠的预测和可解释性。
因此,本研究旨在开发一个集成多视图知识的模型——包括综合征、处方、草药、草药属性和草药剂量——以实现准确的、个性化的处方推荐。首先,为了克服单视图表示的局限性,我们提出了一种多视图超图建模和重构机制来捕捉多维TCM知识。该机制计算了三个不同视图的相似性矩阵:处方-草药、草药共现和草药属性。然后,它使用灵活的相似性度量和一致的Top-K邻居选择策略来构建多视图超图。接下来,为了克服捕捉处方中高阶关系的局限性,我们设计了一种超图增强策略。该策略在超图中执行多步信息传播,结合多视图融合和加权映射模块来生成处方和草药的联合表示。为了提高模型的泛化能力和特征区分度,我们提出了一种跨视图对比学习技术。此外,为了减轻数据稀疏性的影响,我们提出了一种基于拓扑的随机游走的数据增强策略。然后使用结合分类、对比和增强目标的集成损失函数来优化模型的整体性能。其模块化框架和透明流程可以有效提高可解释性和可靠性。
总体而言,CL-MHAD模型的贡献总结如下:
  • 本研究提出了一种基于对比学习的多超图聚合和扩散模型用于处方推荐,称为CL-MHAD。它提出了一种多视图超图重构机制,使用灵活的相似性度和Top-K邻居选择策略来整合处方、草药共现和草药属性特征,从而实现对处方模式的全面探索。
  • CL-MHAD模型提出了一种通过多步信息传播来捕捉多视图高阶关系的超图增强策略,并生成处方、草药和草药属性的嵌入。它提出了多视图融合和加权映射策略,结合草药剂量,以实现草药和处方嵌入的联合表示。
  • CL-MHAD提出了一种跨视图对比学习策略来提高特征区分度和泛化能力。然后,它还提出了一种基于拓扑的随机游走的数据增强策略来缓解数据稀疏性。研究了一种集成损失函数,考虑了分类、对比和增强损失,以优化模型性能。
本文的其余部分组织如下。第2节总结了相关工作。第3节介绍了CL-MHAD模型,包括其架构、步骤和伪代码。随后,我们在第4节介绍了实验设计、基线、评估指标等。第5节描述了实验结果及其分析。第6节讨论了该模型的优越性和局限性。最后,我们在第7节提出了结论和展望。

相关工作

相关工作

在本节中,我们介绍了基于GNN的医学表示学习模型、对比学习以及应用于医学应用的数据增强方法和基于AI的GID数据分析方法的相关工作。

提出的CL-MHAD

我们提出了一种基于对比学习的多超图聚合和扩散模型用于处方推荐,称为CL-MHAD。它通过探索综合征、处方、草药、草药属性和草药剂量之间的复杂隐藏关系来实现基于综合征的处方推荐。CL-MHAD模型的整体架构如图1所示,包括四个部分:(A) 基于相似性的超图重构:构建多视图超图

实验

为了评估所提出的CL-MHAD模型的性能,我们进行了一系列实验,包括比较实验、消融实验和参数敏感性测试,以及在不同稀疏程度下的剂量-综合征交互实验和鲁棒性评估。

实验结果与分析

基于构建的多超图,我们对所提出的CL-MHAD模型和其他基线模型(包括GCN、GAT、GraphSAGE、HGNN、HGHDA、LAMGCN、HDCTI和DDI-OCF)进行了一系列比较实验。在比较实验中,我们使用了CAG和RE数据集,而其他实验则在CAG数据集上进行。此外,我们还进行了消融和参数敏感性测试,以及剂量-综合征交互建模比较和鲁棒性测试

模型性能分析

我们将我们模型的性能与代表性基线模型在四个评估指标上进行了比较。具体来说,在CAG数据集上,CL-MHAD在准确性、精确度、召回率和F1分数上至少提高了2.3%、2.1%、2.3%和2.4%,与基线模型相比,最大提高了22.5%、24.1%、22.8%和24.7%。在RE数据集上,CL-MHAD的最小提高幅度为1.4%、1.8%、1.5%和1.8%,而最大提高幅度达到了12.0%、12.4%、12.0%和12.5%

结论

本研究提出了CL-MHAD,这是一种使用基于对比学习的多超图聚合和扩散模型的新颖框架,用于多种基于综合征的处方推荐。具体来说,CL-MHAD构建了一个多视图超图,其中包含了草药属性、草药共现和草药剂量,实现了多样化的TCM知识的整合。该设计捕捉了TCM中的复杂草药交互作用,包括剂量变化和综合征差异的原则

CRediT作者贡献声明

Juanzi Zhou:写作 – 审稿与编辑,撰写原始草稿,验证,方法论,数据管理,概念化。Yin Zhang:监督,方法论,形式分析。Fang Hu:写作 – 审稿与编辑,撰写原始草稿,验证,概念化。Xiong Zhang:资金获取,数据管理,概念化。Pin-Han Ho:监督,方法论,调查。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

我们感谢湖北省国际科技合作项目2025EHA011)和湖北省自然科学基金与中国中医药创新与发展基金会2024AFD267)的联合支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号