
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种用于糖尿病视网膜病变分类的临床可解释深度学习流程,该流程采用了EfficientNet模型、先进的数据增强技术以及GradCAM算法
《BMC Ophthalmology》:A clinically interpretable deep learning pipeline for diabetic retinopathy classification using EfficientNet, advanced data augmentation and GradCAM
【字体: 大 中 小 】 时间:2026年05月20日 来源:BMC Ophthalmology 1.7
编辑推荐:
摘要背景早期且准确地评估糖尿病视网膜病变对于防止可避免的视力丧失至关重要。尽管深度学习方法在视网膜眼底图像上表现优异,但由于类别不平衡、图像质量参差不齐、相邻病变阶段之间的细微差异以及需要可解释的预测结果,分级仍然具有挑战性。本研究开发了一种临床可解释的深度学习流程,用于五类糖尿
早期且准确地评估糖尿病视网膜病变对于防止可避免的视力丧失至关重要。尽管深度学习方法在视网膜眼底图像上表现优异,但由于类别不平衡、图像质量参差不齐、相邻病变阶段之间的细微差异以及需要可解释的预测结果,分级仍然具有挑战性。本研究开发了一种临床可解释的深度学习流程,用于五类糖尿病视网膜病变的分级。
基于EfficientNet-B1构建了一个分类框架,采用了对比度受限的自适应直方图均衡化进行图像增强、样本混合增强、焦点损失和测试时增强。通过校准分析、梯度加权类别激活映射和t分布随机邻居嵌入进一步检验了模型性能。使用了公开的APTOS 2019数据集。在固定的保留协议下,2,930张图像用于训练,364张用于验证,366张用于测试。通过在包含3,294张图像的开发集上使用分层5折交叉验证,并结合独立的366张图像测试集,进一步检验了模型的鲁棒性。性能评估指标包括准确率、宏观F1分数、加权F1分数、接收者操作特征曲线下的平均面积、混淆矩阵和校准误差。本研究未采用正式的假设检验框架。
在固定分割方案下,最佳验证准确率为84.07%。在独立测试集上,未经测试时增强的模型准确率为83.61%,经过测试时增强后准确率为84.97%。接收者操作特征曲线下的平均面积为90.40%。移除对比度受限的自适应直方图均衡化后,测试准确率降至80.87%,这表明该技术对提升性能起到了重要作用。该模型在应对类别不平衡方面表现出更好的鲁棒性,并提供了具有临床意义的视觉解释,尽管重度糖尿病视网膜病变仍然是最具挑战性的类别。
所提出的流程在五类糖尿病视网膜病变分级方面达到了具有竞争力的基准性能,同时结合了分类准确性、校准支持和可解释性分析。该方法适合作为研究阶段的决策支持工具,但高级病变分级的难度以及仅使用单一公共数据集的事实表明,在临床应用之前仍需进行外部验证。
本研究使用了公开可用的基准数据集,未涉及随机对照试验或人类参与者的前瞻性招募。
早期且准确地评估糖尿病视网膜病变对于防止可避免的视力丧失至关重要。尽管深度学习方法在视网膜眼底图像上表现优异,但由于类别不平衡、图像质量参差不齐、相邻病变阶段之间的细微差异以及需要可解释的预测结果,分级仍然具有挑战性。本研究开发了一种临床可解释的深度学习流程,用于五类糖尿病视网膜病变的分级。
基于EfficientNet-B1构建了一个分类框架,采用了对比度受限的自适应直方图均衡化进行图像增强、样本混合增强、焦点损失和测试时增强。通过校准分析、梯度加权类别激活映射和t分布随机邻居嵌入进一步检验了模型性能。使用了公开的APTOS 2019数据集。在固定的保留协议下,2,930张图像用于训练,364张用于验证,366张用于测试。通过在包含3,294张图像的开发集上使用分层5折交叉验证,并结合独立的366张图像测试集,进一步检验了模型的鲁棒性。性能评估指标包括准确率、宏观F1分数、加权F1分数、接收者操作特征曲线下的平均面积、混淆矩阵和校准误差。本研究未采用正式的假设检验框架。
在固定分割方案下,最佳验证准确率为84.07%。在独立测试集上,未经测试时增强的模型准确率为83.61%,经过测试时增强后准确率为84.97%。接收者操作特征曲线下的平均面积为90.40%。移除对比度受限的自适应直方图均衡化后,测试准确率降至80.87%,这表明该技术对提升性能起到了重要作用。该模型在应对类别不平衡方面表现出更好的鲁棒性,并提供了具有临床意义的视觉解释,尽管重度糖尿病视网膜病变仍然是最具挑战性的类别。
所提出的流程在五类糖尿病视网膜病变分级方面达到了具有竞争力的基准性能,同时结合了分类准确性、校准支持和可解释性分析。该方法适合作为研究阶段的决策支持工具,但高级病变分级的难度以及仅使用单一公共数据集的事实表明,在临床应用之前仍需进行外部验证。
本研究使用了公开可用的基准数据集,未涉及随机对照试验或人类参与者的前瞻性招募。