GLA-SCNet：一种基于混合注意力机制的螺旋卷积网络，利用眼底图像实现对糖尿病视网膜病变的早期预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月10日 来源：Optics & Laser Technology 4.6

编辑推荐：

　　糖尿病视网膜病变（DR）早期预测对防止视力丧失至关重要，但传统方法存在解释性差、计算复杂和泛化能力不足的问题。本文提出全局局部注意力螺旋卷积网络（GLA-SCNet），通过CLAHE预处理增强图像质量并去除噪声，结合ROI提取聚焦病变区域，利用螺旋卷积和全局局部注意力机制提取多尺度特征，并通过SEOM特征分析微小血管变化。实验表明，在IDRiD数据集上，GLA-SCNet达到97.33%灵敏度、97.62%准确率和98.19%特异性，优于现有方法。

Gaurav Raj | Nidhi Gupta | Chandra Mani | Arun Kumar Rai | Arun Prakash Agrawal

计算机科学与工程系，SSCSE，Sharda大学，印度大诺伊达

摘要

近年来，糖尿病视网膜病变（DR）已成为全球慢性糖尿病患者失明的主要原因之一。早期预测DR对于防止视力丧失至关重要，但传统的检测模型缺乏可解释性，可能会引入偏见。此外，高昂的计算成本、较长的处理时间和大量的参数阻碍了可靠的DR预测。因此，本研究提出了基于全局局部注意力的螺旋卷积网络（GLA-SCNet）模型，以实现有效的DR预测。该模型采用双层并行处理结构，加快了处理速度，并支持多尺度特征学习。全局局部注意力（GLA）功能通过利用局部-全局关系，选择性地增强对复杂和重要特征的解释能力。此外，基于统计渗出物和光学微动脉瘤（SEOM）的特征提取方法能够捕捉细粒度信息，提高对细微变化的表征能力。将GLA-SCNet与现有技术进行比较，在使用印度糖尿病视网膜病变图像数据集（IDRiD）进行90%的训练时，其敏感性为97.33%、准确率为97.62%、特异性为98.19%，显示出优越性。

引言

作为复合感觉器官之一，人眼包含视网膜、视神经、瞳孔和晶状体等精细结构，这些结构有助于视觉感知。这些关键组件的任何异常或疾病都会导致视力障碍或永久性失明。常见的眼部疾病包括DR、白内障、青光眼和年龄相关性黄斑变性（AMD）[1]。DR与较高的失明风险相关，长期糖尿病患者可能会出现这种情况[2]、[3]。据报道，不可逆的眼部损伤从2000年的1.71亿例增加到2030年的3.66亿例[4]。DR的失明率约为2.7%，并且在早期阶段通常没有明显症状。因此，糖尿病患者需要定期筛查以实现早期诊断，从而减缓病情发展并降低失明风险[5]、[6]。鉴于DR的发病率不断增加，需要适当的筛查和持续监测来准确评估病情[7]。为此，已经开发了多种技术，如改进的成像方法和临床实践。

荧光素血管造影技术利用视网膜底片图像来显示受感染区域[8]。光学相干断层扫描（OCT）的发展提供了高分辨率图像，用于检查出血、渗出物和微动脉瘤等异常[9]。手动分级视网膜病变耗时且劳动强度大，同时容易受到观察者差异的影响，这使得大规模人群的筛查变得困难。因此，为了满足诊断需求，设计了人工智能（AI）模块，以实现从视网膜底片图像的自动化预测[10]。尽管AI模型提高了处理速度，但它们仍存在某些局限性，例如需要标记的数据以及计算过程中可能引入的偏见。此外，基于机器学习（ML）的模型对噪声或不完整数据非常敏感，这可能导致预测不准确，特别是当历史数据反映了过去的临床试验排除标准时[11]。

支持向量机（SVM）等模型曾被用于分类，但由于潜在的偏见和特征相关性，导致了误分类。随着深度学习（DL）模块（如卷积神经网络（CNN）的引入[12]、[13]，DR的诊断能力得到了提升。然而，这些方法在处理大型数据集中的复杂视网膜特征时，在有效性、精确度和可靠性方面存在局限性[14]、[15]。此外，不透明的决策过程使得模型对某些类别的预测难以解释[16]、[17]。基于集成学习的模型在DR检测中表现较好，但计算成本较高，且不适用于资源受限的环境[10]、[18]。此外，这些检测模型在处理未见数据时常常表现不佳，导致在实际临床环境中预测不准确[19]、[20]。

本文旨在解决传统DR预测方法的不足之处，如计算复杂性高、因素选择有限、对DR模式的处理不足以及泛化能力差等问题，通过提出的GLA-SCNet模型加以改进。为了改进预处理，采用了对比度受限自适应直方图均衡（CLAHE）技术，通过增强眼底图像的质量来减少不必要的噪声。DR预测依赖于识别微小的血管变化或病变，CLAHE技术在对比度增强和噪声降低之间取得了平衡，这是在标准预处理中难以实现的。此外，从眼底图像中提取感兴趣区域（ROI）有助于精确检测受影响区域的细微异常，同时排除背景区域的不相关处理。为了提取相关信息，设计了基于统计渗出物和光学微动脉瘤（SEOM）的特征提取方法。这种综合方法不仅提升了图像质量，还实现了针对特定特征的分析，更有效地表征了细微变化，并减少了处理时间。GLA-SCNet采用两级处理方式，能够同时从不同尺度提取特征，并通过GLA机制适应结构变化或相关性。其他主要贡献如下：

基于全局局部注意力的螺旋卷积网络（GLA-SCNet）模型：

GLA-SCNet模型通过利用螺旋神经网络（SNN）准确生成输入特征的螺旋得分，从而提高了预测精度，且解释结果保持一致。通过集成预训练的特征增强（PFE）模块，GLA-SCNet模型学习复杂特征的能力得到提升，使其在DR预测方面更加稳健。此外，GLA机制的引入有助于全面理解输入特征，捕捉细粒度和重要信息，进一步提高了GLA-SCNet模型的预测准确性。

本文的其余部分安排如下：第2节回顾了现有的DR模型，第3节解释了提出的GLA-SCNet模型的工作原理，第4节讨论了实验结果，第5节总结了本研究的工作成果。

文献综述

文献调查

本节介绍了各种现有的DR预测方法及其在预测方面的优缺点。

Gadekallu, T.R.等人[2]提出了一种基于主成分分析的深度神经网络模型，使用灰狼优化（DNN-PCA GWO）方法来预测DR。通过GWO算法选择了理想参数，并采用标准标量方法去除异常值。然而，参数调整较为复杂，显著增加了...

利用基于全局局部注意力的螺旋卷积网络模型进行糖尿病视网膜病变预测

本研究的主要目标是提出一种基于全局局部注意力的螺旋卷积网络（GLA-SCNet）模型，利用眼底图像精确预测DR。首先，从Messidor数据集[23]和IDRiD[24]中收集彩色眼底图像。然后，通过基于CLAHE的预处理方法对收集到的眼底图像进行预处理，以去除不必要的噪声。随后，从...

结果与讨论

本部分描述了GLA-SCNet获得的所有结果，以及研究中使用的性能指标、实验设置和数据集。同时，还比较了GLA-SCNet与现有方法的表现。

结论

本文提出的GLA-SCNet模型利用视网膜底片图像准确预测DR。通过基于CLAHE的预处理方法去除了输入眼底图像中的不必要的噪声，提高了图像质量。此外，ROI提取技术提高了GLA-SCNet模型的预测效率，能够准确提取受影响区域。...

作者贡献声明

Gaurav Raj： 数据整理。Nidhi Gupta： 形式分析。Chandra Mani： 数据整理。Arun Kumar Rai： 数据整理。Arun Prakash Agrawal： 数据整理。

利益冲突声明

作者声明没有已知的财务利益冲突或个人关系可能影响本文所述的工作。

联系信箱：

粤ICP备09063491号

摘要

引言