DR-TrustNet：利用可靠高效的网络和不确定性量化技术提升糖尿病视网膜病变的检测能力

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Image and Vision Computing》：DR-TrustNet: Enhancing diabetic retinopathy detection using reliable efficient networks and uncertainty quantification

【字体：大中小】 时间：2026年02月03日 来源：Image and Vision Computing 4.2

编辑推荐：

　　糖尿病视网膜病变（DR）早期筛查依赖高效可靠的AI模型，现有深度学习模型存在过自信预测和不确定性处理不足的问题。本文提出三阶段系统：1）自适应眼底增强流程（AFEP）优化图像质量；2）改进EfficientNet-B0架构，替换Swish为Mish激活函数提升特征提取能力；3）测试时数据增强（TTDA）与温度缩放结合校准不确定性。实验表明，该系统在IDRiD数据集上达到96%准确率，期望校准误差仅0.030，显著提升临床可靠性。

Preeti Verma|Sivasankar Elango|Kunwar Singh

计算机科学与工程系，印度泰米尔纳德邦蒂鲁奇拉帕利国立技术学院，620015

摘要

糖尿病视网膜病变（DR）是导致人们失明的主要原因之一，早期发现对于防止永久性损伤至关重要。目前，医生依赖手动筛查，但这既耗时又不总是可靠。深度神经网络（DNN）的引入在高精度DR检测方面是一个革命性的步骤，但也存在一些问题：这些模型可能对预测结果过于自信，从而在关键医疗保健中导致错误。另一个问题是当前的深度学习方法对不确定性反应不佳，这使得在实际医疗环境中难以信任它们。为了解决这些挑战，我们开发了一个由三个部分组成的新系统。首先，我们使用自适应眼底增强管道（AFEP）提高了视网膜图像的质量。然后，我们使用改进版的EfficientNet-B0从图像中提取更多有用的特征。最后，我们添加了步骤来校准模型的预测，以确保其置信度是准确的。通过使用测试时数据增强和温度缩放，这一步骤减少了错误诊断的可能性。IDRiD数据集测试的结果令人鼓舞。该模型达到了96%的准确率，并显示出更好的不确定性校准，预期校准误差仅为0.030。换句话说，它不仅准确，而且在现实世界中更可靠。总体而言，我们的方法可以使基于AI的DR筛查对医生和患者都更加实用和可靠。

引言

糖尿病视网膜病变（DR）是糖尿病的一种严重并发症，会导致视网膜血管逐渐受损，如果不治疗，可能会导致不可逆的视力丧失[1]。该疾病表现为微动脉瘤、出血、渗出物和棉絮状斑点，因此早期发现对于有效干预至关重要。全球约有34.6%的糖尿病患者受到DR的影响，在非洲和北美等地区的患病率超过35%[2]。随着糖尿病发病率的持续上升，对专业眼科医生和先进诊断工具的需求不断增加，给医疗系统带来了更大的负担[3,4]。尽管有传统的筛查方法，但手动检查眼底图像仍然劳动密集、耗时且因观察者差异而结果不稳定。因此，需要可扩展和自动化的解决方案来提高DR检测的效率和可靠性[5]。

虽然DR筛查的临床动机已经明确，但本研究的主要目标是计算机视觉方面的，重点在于提高应用于眼底图像的深度模型的可靠性、校准性和可解释性。我们没有开发新的医疗流程，而是强调以视觉为中心的方面，如不确定性量化、测试时增强和基于激活的特征分析，以确保在实际成像条件下的可靠预测。

深度神经网络（DNN）彻底改变了医学图像分析，在DR检测、疾病分割和异常分类等领域取得了专家级性能[[6], [7], [8]]。从原始图像中提取层次特征的能力使得能够自动识别复杂的视网膜异常。然而，尽管取得了成功，深度学习模型仍面临一些关键挑战，阻碍了其临床应用。其中一个主要限制是它依赖于大型且文档齐全的数据库。特别是在眼科领域，医疗数据往往有限，导致对不可见数据的泛化能力较差[9]。此外，由于DNN即使在不确定的情况下也倾向于生成高度可靠的预测，因此它们是确定性的，而软最大概率的输出并不一定反映不确定性[10]。这种过高的置信度在像DR这样的高级别医学诊断中尤其令人担忧，因为错误的分类可能导致治疗延迟和永久性视力损害。

为了解决这些挑战，我们提出了一个包含三个关键组件的强大且可解释的深度学习框架：用于预处理的自适应眼底增强管道（AFEP）、用于增强特征提取的改进版EfficientNet-B0架构，以及用于可靠决策的不确定性感知预测校准。每个组件都旨在克服DR检测中的特定限制，并共同提高诊断准确性和置信度。

在DR诊断中的一个主要问题是模型即使在图像模糊或质量较差的情况下也倾向于提供过于自信的预测。为了解决这个问题，我们引入了测试时数据增强（TTDA）和温度缩放来进行不确定性估计。TTDA特别适合组织成像，因为视网膜结构由于照明、成像设备和患者特定条件的不同而存在细微变化。与其他不确定性评估技术（如Monte Carlo Dropout（MC-Dropout）[11]不同，TTDA不需要改变模型架构或重新训练，计算效率高，同时使用数据驱动的转换来提高预测可靠性。

除了不确定性估计外，还应用温度缩放来校准置信度分数，以确保模型的概率估计与实际概率估计一致。这对于DR分类至关重要，因为模型经常将眼底图像中的轻微强度波动误认为是病理变化，从而导致误诊。温度缩放有效地规范了这些概率分布，使模型能够将置信度较低的案例标记出来供专家审查，从而降低假阳性和假阴性的风险。

我们框架中的另一个重大创新是在EfficientNet-B0中用Mish替换了标准的ReLU激活函数。尽管ReLU被广泛使用，但它存在诸如死神经元和激活限制明显等问题[12]，这可能会影响在对比度低和变化微妙的复杂医学图像中的性能。Mish是一种平滑的非单调激活函数，通过允许更好的梯度流动和特征提取来缓解这些缺点。在DR检测的背景下，微异常和小血管起着重要作用，Mish使模型能够保留细节空间，提高对早期异常的敏感性，同时在困难情况下保持鲁棒性。

本研究旨在解决以下研究问题：

•

（RQ1）：眼底图像预处理如何影响深度神经网络在DR检测中的性能？

•

（RQ2）：迁移学习能否在保持高诊断准确性的同时缓解小型医学数据集的局限性？

•

（RQ3）：不确定性估计如何提高深度学习模型在DR分类中的可靠性和可解释性？

•

（RQ4）：不确定性感知校准是否确保预测概率准确反映现实世界的可能性，从而增强临床可信度？

这项工作的主要贡献包括：

•

引入了AFEP，这是一种结构化的预处理方法，通过减少噪声和提高对比度来增强眼底图像质量，从而实现更稳健的特征提取。

•

修改了EfficientNet-B0，用Mish替换Swish，以改善低对比度视网膜图像中的梯度传播和特征保留。

•

实施了不确定性估计技术，包括TTDA和温度缩放，以校准模型置信度并减少过度自信的错误分类。

•

整合了迁移学习，利用预训练的深度模型来提高诊断性能，同时保持实际应用的计算效率。

通过整合这些进步——AFEP用于提高图像质量，TTDA和温度缩放用于不确定性感知预测，以及Mish用于改进特征提取——我们提出的框架显著提高了DR检测的准确性和可靠性。量化不确定性的能力确保高风险案例得到适当的标记，以便专家干预，最终降低了误诊率并改善了患者结果。虽然我们的工作没有提出新的架构范式，但其新颖性在于证明了自适应预处理、轻量级架构修改和不确定性感知校准的可靠性驱动集成可以显著提高实际DR筛查工作流程的可信度。在糖尿病视网膜病变文献中，这种以可靠性为中心的评估很少被探讨，其中校准的不确定性常常被忽视。

本文的其余部分结构如下：第2节讨论了DR检测的相关工作。第3节介绍了所提出的方法，包括预处理、修改后的架构和校准技术。第4节详细介绍了实验结果，包括性能指标和不确定性分析。第5节总结了研究方向。

方法论

本研究的主要目标是开发一个强大且可靠的模型，用于检测糖尿病视网膜疾病（DRs），该模型不仅具有高准确性，还具有可靠的预测能力。所提出的框架是一个多阶段流程，包括关键过程：数据增强、图像处理、使用改进版EfficientNet-B0的迁移学习、模型校准和不确定性估计（图1）。包括校准和不确定性量化

结果与讨论

糖尿病视网膜病变（DR）是一种进行性疾病，早期发现对于防止威胁视力的结果至关重要。尽管DR在临床上分为五个级别——无DR、轻度、中度、重度和增殖性DR（PDR）——但许多国家筛查程序采用二元分流工作流程，将非需要转诊的病例（无DR、轻度）与需要专家评估的病例（中度、重度、PDR）分开。根据这一既定的临床实践，我们的评估重点

结论与未来工作

本研究解决了在深度神经网络中获取糖尿病视网膜病变检测的可靠不确定性估计这一关键挑战。通过将自适应眼底增强管道与使用Mish激活的改进版EfficientNet B0模型相结合，我们显著提高了特征提取和分类性能。先进的预处理、迁移学习和微调的结合不仅提高了准确率，还降低了计算复杂性。

资助

本研究没有获得公共、商业或非营利部门的任何特定资助。

伦理批准

本文不包含任何作者进行的涉及人类参与者或动物的研究。

代码可用性

源代码和训练好的模型将在手稿被接受后，在https://github.com/PreetiVerma-kiet/DR-TrustNet上公开提供。

CRediT作者贡献声明

Preeti Verma：撰写——原始草稿、验证、方法论、调查、形式分析、数据整理、概念化。Sivasankar Elango：撰写——审阅与编辑、验证、监督、方法论、调查、形式分析、概念化。Kunwar Singh：撰写——审阅与编辑、验证、监督、方法论、调查、形式分析、概念化。

未引用的参考文献

[43], [48]

写作过程中使用生成式AI和AI辅助技术的声明

在准备这项工作时，作者使用了Chat GPT来提高手稿的可读性和语言表达。使用该服务后，作者根据需要审查和编辑了内容，并对发表文章的内容负全责。

利益冲突声明

所有作者声明没有利益冲突。

联系信箱：

粤ICP备09063491号

摘要

引言

相关工作

相关研究

方法论