使用带有转置解码器的双Swin U-Net Transformer和可解释AI对糖尿病视网膜病变病灶进行分割

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：Diabetic Retinopathy Lesions Segmentation Using Dual Swin U-Net Transformer with Transpose Decoder and Explainable AI

【字体：大中小】 时间：2026年05月20日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　Jegan S|Arjun P摘要糖尿病视网膜病变（DR）是糖尿病患者常见的眼部问题。如果不早期治疗，病情会恶化，甚至可能导致失明。为了解决这些问题，本研究提出了一种基于双Swin U-Net Transformer、转置解码器（Transpose Decoder）和可解释人工智

Jegan S|Arjun P

摘要

糖尿病视网膜病变（DR）是糖尿病患者常见的眼部问题。如果不早期治疗，病情会恶化，甚至可能导致失明。为了解决这些问题，本研究提出了一种基于双Swin U-Net Transformer、转置解码器（Transpose Decoder）和可解释人工智能（Explainable AI，简称XAI）的糖尿病视网膜病变病灶分割方法，称为DRLD-DSUN-SS。首先，从公开可用的数据集（如Fine-Grained Annotated Diabetic Retinopathy (FGADR)、Indian Diabetic Retinopathy Image Dataset (IDRiD) 和 Digital Retinal Images for Vessel Extraction (DRIVE)）中收集视网膜图像，这些数据集提供了带有病灶标注的高分辨率眼底图像。图像经过自适应快速去敏卡尔曼滤波器（Adaptive Fast Desensitized Kalman Filter，简称AFDKF）预处理，包括调整大小、去除噪声以及归一化像素强度值。为了提高模型的泛化能力，还采用了数据增强技术（如旋转、翻转、缩放）并对数值进行归一化处理。外部全性元胞自动机（Outer Totality Cellular Automata，简称OTCA）自动为像素分配标签。预处理完成后，数据集被划分为训练集、验证集和测试集。双Swin U-Net Transformer（DS-TransUNet）作为编码器，通过分层注意力机制提取多尺度上下文特征；而转置解码器（TD）则用于重建高分辨率的分割图。DS-TransUNet-TD模型能够准确分割糖尿病视网膜病变的各类病灶，包括微动脉瘤、出血、硬性渗出物、软性渗出物以及视盘。基于Grad-CAM的可解释人工智能（XAI）方法生成的喷射映射热图会叠加在带有病灶标注的眼底图像上，从而提升模型的可解释性，辅助临床诊断和决策。实验结果表明，DRLD-DSUN-SS模型的分割准确率达到了94.9%，相比现有的最先进模型DMSF-LSDR、ASHF-OCT-DRD和LAD-PEUNet-RS，性能提升了4.9%至7.2%。此外，该模型的Dice系数和平均IoU值也比这些模型提高了3.5%至5.8%。

联系信箱：

粤ICP备09063491号

摘要

热点排行