使用带有转置解码器的双Swin U-Net Transformer和可解释AI对糖尿病视网膜病变病灶进行分割

《Knowledge-Based Systems》:Diabetic Retinopathy Lesions Segmentation Using Dual Swin U-Net Transformer with Transpose Decoder and Explainable AI

【字体: 时间:2026年05月20日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  Jegan S|Arjun P摘要糖尿病视网膜病变(DR)是糖尿病患者常见的眼部问题。如果不早期治疗,病情会恶化,甚至可能导致失明。为了解决这些问题,本研究提出了一种基于双Swin U-Net Transformer、转置解码器(Transpose Decoder)和可解释人工智

  
Jegan S|Arjun P

摘要

糖尿病视网膜病变(DR)是糖尿病患者常见的眼部问题。如果不早期治疗,病情会恶化,甚至可能导致失明。为了解决这些问题,本研究提出了一种基于双Swin U-Net Transformer、转置解码器(Transpose Decoder)和可解释人工智能(Explainable AI,简称XAI)的糖尿病视网膜病变病灶分割方法,称为DRLD-DSUN-SS。首先,从公开可用的数据集(如Fine-Grained Annotated Diabetic Retinopathy (FGADR)、Indian Diabetic Retinopathy Image Dataset (IDRiD) 和 Digital Retinal Images for Vessel Extraction (DRIVE))中收集视网膜图像,这些数据集提供了带有病灶标注的高分辨率眼底图像。图像经过自适应快速去敏卡尔曼滤波器(Adaptive Fast Desensitized Kalman Filter,简称AFDKF)预处理,包括调整大小、去除噪声以及归一化像素强度值。为了提高模型的泛化能力,还采用了数据增强技术(如旋转、翻转、缩放)并对数值进行归一化处理。外部全性元胞自动机(Outer Totality Cellular Automata,简称OTCA)自动为像素分配标签。预处理完成后,数据集被划分为训练集、验证集和测试集。双Swin U-Net Transformer(DS-TransUNet)作为编码器,通过分层注意力机制提取多尺度上下文特征;而转置解码器(TD)则用于重建高分辨率的分割图。DS-TransUNet-TD模型能够准确分割糖尿病视网膜病变的各类病灶,包括微动脉瘤、出血、硬性渗出物、软性渗出物以及视盘。基于Grad-CAM的可解释人工智能(XAI)方法生成的喷射映射热图会叠加在带有病灶标注的眼底图像上,从而提升模型的可解释性,辅助临床诊断和决策。实验结果表明,DRLD-DSUN-SS模型的分割准确率达到了94.9%,相比现有的最先进模型DMSF-LSDR、ASHF-OCT-DRD和LAD-PEUNet-RS,性能提升了4.9%至7.2%。此外,该模型的Dice系数和平均IoU值也比这些模型提高了3.5%至5.8%。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号