基于混合图网络与可解释人工智能的慢性病智能诊断新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Enhancing chronic disease management: hybrid graph networks and explainable AI for intelligent diagnosis

【字体：大中小】 时间：2026年01月06日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究针对传统医疗推荐系统在慢性病诊断中难以捕捉复杂患者特征交互且缺乏解释性的问题，开发了结合图神经网络(GNN)与可解释人工智能(XAI)的新型推荐框架。研究人员提出了GHRS、GCFNA和GCFYA三种算法，在真实医院数据和公共数据集上验证显示，图注意力网络GCFYA模型精准度达92.8%，召回率90.4%，显著优于传统方法。通过集成LIME和SHAP解释技术，系统可提供诊断依据的透明解释，为老年慢性病管理的智能决策支持提供了新范式。

随着全球老龄化进程加速，慢性疾病已成为困扰老年群体的主要健康挑战。这些长期健康问题不仅严重影响老年人的生活质量，更给医疗资源和社会经济体系带来沉重负担。传统诊断系统多依赖于规则或统计方法，难以捕捉患者特征、病史和医学知识间复杂的动态交互关系。更棘手的是，当前医疗推荐系统往往如同"黑箱"，无法为诊断建议提供清晰解释，导致医疗专业人员对其推荐结果持谨慎态度。

在这一背景下， Muhammad Aamir、Yang Ke Yu等研究人员在《Scientific Reports》上发表了一项创新研究，提出将混合图网络与可解释人工智能相结合，构建智能诊断框架以优化慢性病管理。该研究直面医疗数据复杂性和模型可解释性两大挑战，旨在开发既准确又透明的医疗推荐系统。

研究人员开展了系统性研究，开发了三种基于图神经网络的创新方法：图混合推荐系统(GHRS)、无注意力图神经网络协同过滤(GCFNA)和带注意力图神经网络协同过滤(GCFYA)。这些方法的核心创新在于应用图神经网络捕捉患者数据中的复杂关系，并通过自适应、数据驱动的方法实现更准确、可解释的协同诊断。

研究团队采用了多项关键技术方法：基于图卷积网络(GCN)的患者-疾病关系建模技术；结合局部可解释模型无关解释(LIME)和沙普利加和解释(SHAP)的双重可解释性框架；针对老年患者数据特点的自适应图构建方法；以及在真实医院数据集和两个公共数据集上的多维度性能验证。

数据库处理与模型构建

研究使用了三个数据集：北京友谊医院数据集(100名患者，230+种慢性病)和两个Kaggle公共数据集。通过K近邻(KNN)插补处理缺失值，使用隔离森林算法检测异常值，对分类特征进行独热编码，连续特征进行归一化处理。

图构建方面，GHRS方法通过计算患者疾病特征的相似性构建图结构，设定相似性阈值α=0.97。GCFNA和GCFYA则通过连接患者与所患疾病构建图边，权重基于疾病频率，采用对称归一化进行消息传递。

深度学习算法比较

研究对比了多种推荐算法性能。在友谊医院数据集上，GCFYA表现最优，精准度92.8%，召回率90.4%，均方根误差(RMSE)仅0.034。传统协同过滤(CF)虽召回率高达99.7%，但缺乏可解释性。SVD++在该数据集上表现最差，召回率和精准度均为0。

在公共数据集1上，GCFNA表现最佳，精准度达100%，召回率94.7%。而在公共数据集2上，GCFNA和GCFYA均实现100%的召回率和精准度，显示出色泛化能力。

图聚类分析与训练过程

GHRS方法采用自编码器神经网络和K均值聚类，通过肘部法和轮廓分数确定最佳聚类数为5。训练过程中，GCFNA和GCFYA均表现出良好的收敛特性，训练损失和验证损失随迭代次数增加而稳定下降。

可解释性分析

研究通过LIME和SHAP技术实现模型可解释性。LIME通过训练局部可解释的代理模型来近似原始模型行为，SHAP则通过沙普利值分解各特征对预测的贡献度。分析显示，不同算法对特征的重要性评估存在差异，但关键临床特征(如高血压对冠心病预测的重要性)在各解释模型中均得到凸显。

SHAP力图为模型预测提供直观解释，正SHAP值表示特征值增加会提高模型预测值，负值则表示降低预测值。这种可视化使用户能理解模型决策的根本原因和特征的相对重要性。

与最新研究的比较

与图注意力网络(GAT)和基于变换器的协同过滤(Transformer-CF)相比，GCFYA在所有指标上均表现更优。GAT虽包含注意力机制，但缺乏混合图构建和协同过滤组件；Transformer-CF擅长序列模式建模，但在处理慢性病诊断的稀疏、非序列数据时表现不佳。统计显著性检验证实，GCFYA相对于GAT和Transformer-CF的性能提升具有统计显著性(p<0.01)。

研究结论表明，基于图神经网络和可解释人工智能的混合推荐框架在慢性病智能诊断中具有显著优势。GCFYA模型在保持高准确性的同时，通过注意力机制和LIME/SHAP解释技术提供了透明的决策依据，有效解决了医疗推荐系统面临的"黑箱"问题。

该研究的实际意义体现在多个方面：提高诊断准确性，通过图神经网络整合多样化医疗数据；增强推荐可解释性，使医疗专业人员能理解诊断建议的依据；改善慢性病管理，重点关注老年人常见慢性疾病；促进预防性医疗，通过准确预测疾病结果实现早期干预。

然而，研究也存在一定局限性，包括数据质量和可用性依赖性强、模型可解释性仍有提升空间、外部医学知识整合细节不足等。未来研究方向应包括扩展疾病种类验证、推进临床实际应用试验、加强时空动态建模等。

总体而言，这项研究为慢性病管理的智能诊断提供了新思路，通过结合先进的图神经网络与可解释人工智能技术，在准确性、可解释性和临床实用性间取得了良好平衡，为医疗人工智能的实际应用奠定了重要基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号