
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于合成数据驱动的糖尿病视网膜病变诊断方法,结合可解释的人工智能技术:一个具有临床解释能力的框架
《Graefe's Archive for Clinical and Experimental Ophthalmology》:Synthetic data-driven diabetic retinopathy diagnosis with explainable AI: a clinically interpretable framework
【字体: 大 中 小 】 时间:2026年05月23日 来源:Graefe's Archive for Clinical and Experimental Ophthalmology 2.4
编辑推荐:
摘要 目的 糖尿病视网膜病变(DR)是糖尿病的严重并发症,也是导致失明的主要原因,因此需要准确且早期的诊断。目前的诊断挑战主要源于两个方面的限制:(i)由于隐私和成本因素,缺乏经过专家标注的临床数据集;(ii)深度学习模型的特性限制了其在临床中的应用。
糖尿病视网膜病变(DR)是糖尿病的严重并发症,也是导致失明的主要原因,因此需要准确且早期的诊断。目前的诊断挑战主要源于两个方面的限制:(i)由于隐私和成本因素,缺乏经过专家标注的临床数据集;(ii)深度学习模型的特性限制了其在临床中的应用。本研究提出了一种新的解决方案,结合了合成数据生成和可解释的机器学习方法来克服这些挑战。
在本研究工作中,生成了模拟糖尿病视网膜病变(DR)严重程度的合成视网膜底片图像,从而创建了一个包含1200个样本的平衡数据集。通过预处理流程提取了手工制作的特征,该流程包括(色调-饱和度-值)HSV颜色空间转换、基于GLCM(灰度共生矩阵)的纹理分析以及针对病变的量化处理,以确保特征具有临床相关性。采用随机森林(RF)分类器进行DR严重程度分级,并通过袋外(OOB)验证对其进行优化。同时,集成了一种基于Shapley加性解释(SHAP)的可解释性方法,以解释特征的重要性和决策模式。
所提出的框架在合成数据上的准确率达到94%,优于多个已建立的深度学习模型,如ResNet-50、VGG16 + DenseNet、EfficientNet-B0。群体图分析显示,预测结果与更高的置信值一致,而SHAP解释突出了具有临床解释意义的特征(如渗出物),验证了分类器的可靠性。
通过领域适应技术将合成数据与真实数据结合,可以缩小性能差距,并提高模型在临床环境中的泛化能力。