综述:视网膜血管分割:从经典方法到深度学习发展的综合性回顾(1982–2025年)

《Advanced Intelligent Systems》:Retinal Vessel Segmentation: A Comprehensive Review From Classical Methods to Deep Learning Advances (1982–2025)

【字体: 时间:2026年05月10日 来源:Advanced Intelligent Systems 6.1

编辑推荐:

  摘要 本文综合了四十年来(1982–2025年)视网膜血管分割(RVS)研究的发展历程,追踪了从经典图像处理、传统机器学习到深度学习范式的演变过程。引入了一种跨范式的分类体系,将计算方法与临床可解释性和模型泛化能力联系起来,旨在弥补以往调查中发现的不足。通过对428项研究的比较

  摘要

本文综合了四十年来(1982–2025年)视网膜血管分割(RVS)研究的发展历程,追踪了从经典图像处理、传统机器学习到深度学习范式的演变过程。引入了一种跨范式的分类体系,将计算方法与临床可解释性和模型泛化能力联系起来,旨在弥补以往调查中发现的不足。通过对428项研究的比较性 meta-analysis,整理出了预处理和后处理技术、分割架构以及损失函数,并使用20个标准化评估指标对DRIVE、STARE、CHASE_DB1和HRF等基准数据集的性能进行了评估。包括残差增强U-Net、注意力引导模型、图卷积网络以及基于Transformer的架构(如SGAT-Net、MTPA-UNet)等在内的技术趋势,都与血管连续性、拓扑保留和临床可靠性的显著提升相关。此外,还探讨了注意力映射、显著性可视化和特征归因等新兴的可解释性策略,以增强对自动化RVS系统的临床信任度。尽管取得了进展,但仍存在跨数据集泛化能力不足、注释资源匮乏以及可解释模型临床应用局限性等挑战。未来的研究方向将重点关注领域适应、半监督和弱监督学习以及高效算法的开发,以实现RVS技术在临床实践中的广泛应用。

1 引言

人类视网膜为观察微循环提供了独特的非侵入性窗口,使得可以直接观察视网膜血管。视网膜血管分割(RVS)在精确绘制中央视网膜血管(CRBVs)及其复杂分支结构方面发挥着关键作用。RVS是自动化眼科图像分析的基石,能够提取出与眼部及全身疾病相关的结构和功能生物标志物[1-6]。本文回顾了自1982年1月至2025年7月四十年的RVS研究进展,梳理了该技术从经典图像处理到先进深度学习框架的演变过程,同时讨论了其中的持续挑战、临床意义以及发展出的多种方法。图1展示了一张带有关键解剖标志物的视网膜底片图像,这些标志物对血管分割至关重要。视网膜包含众多结构,但其中最关键的特征包括视盘、黄斑、中央凹和主要视网膜血管。

1.1 视网膜血管分割的临床重要性

RVS在眼科诊断中至关重要,因为视网膜血管状况能反映局部和全身血管的健康状况。诸如血管宽度、迂曲度、分叉角度和分支模式等形态学特征是诊断糖尿病视网膜病变(DR)、高血压性视网膜病变(HR)和视网膜静脉阻塞(RVO)等疾病的关键指标[7-10]。最新研究还表明,视网膜血管异常与糖尿病、高血压和神经退行性疾病等系统性疾病存在关联[4-6]。这凸显了视网膜血管作为全身微循环健康指标的重要性。例如,有研究强调了RVS在新生儿早产儿视网膜病变(ROP)诊断中的重要作用[11],另有研究证实混合分割方法在相关视网膜图像分析任务中的有效性[12]。RVS还支持后续任务,如动静脉分类、中央凹无血管区检测和氧饱和度估计[13-16],使其在计算机辅助诊断(CAD)系统中不可或缺。

1.2 血管分割面临的挑战

尽管RVS具有临床价值,但其技术实现仍面临诸多挑战:

- 低对比度和噪声:血管在视网膜背景下的对比度较低,且受成像伪影、光照不均和图像噪声的影响[17, 18]。
- 解剖结构复杂:血管口径的变化、结构重叠以及分叉处的微小毛细血管需要强大的特征提取能力[19, 20]。
- 细弱血管的分割:由于细小毛细血管的信噪比极低(通常仅为一到两个像素宽),其在图像边缘的分割极为困难。
- 动静脉分类:在标准视网膜图像中,区分动脉和静脉具有高度挑战性[19]。
- 数据集泛化问题:针对特定数据集(如DRIVE、STARE、CHASE_DB1、HRF或专注于婴儿的数据集[23])训练的模型往往难以在不同成像设备、种族群体或病理条件下通用[24, 25]。这种缺乏泛化能力的原因包括:
- 病理干扰和结构遮挡:出血、棉絮状斑点和渗出物等病变常常会掩盖血管片段或模拟血管结构,导致误判,尤其是在晚期糖尿病视网膜病变中[24]。
- 人口统计差异和色素沉着偏见:大多数基础基准数据集(如DRIVE和STARE)来自种族同质的西方人群,这些数据集未能考虑视网膜色素沉着的自然差异。具有较高色素含量的个体(如非洲和南亚人群)产生的视网膜图像背景对比度较低,导致针对这些数据的模型效果不佳[21, 22]。
- 跨队列性能下降:针对特定数据集或单一中心成像设备训练的模型在不同硬件和临床环境下的性能会下降[24]。
- 高质量标注数据的稀缺:由于标注复杂性,高质量的手动标注数据集非常有限,限制了数据密集型模型的训练[25]。
- 算法与临床需求的差距:虽然大多数算法侧重于生成二值掩码,但将这些结果转换为可操作的量化指标(如血管口径和迂曲度)仍是一个尚未充分发展的研究领域[26, 28]。

1.3 计算方法的演变

自1982年以来,RVS方法经历了显著发展。早期依赖匹配滤波、区域生长、形态学处理和无监督聚类等经典技术[7-9]。这些方法在受控环境中有效,但缺乏泛化能力且对参数调整敏感。监督学习的出现,特别是卷积神经网络(CNNs),标志着技术范式的转变。U-Net及其变体通过直接从标注数据中学习层次化特征,实现了前所未有的准确率[10, 13]。最近的发展包括引入注意力机制、多尺度特征提取、残差连接和基于Transformer的架构(GCNs),进一步提升了分割效果[14-16]。2025年的创新,如混合U-Net-GCN模型和基于量子的损失函数,进一步提高了分割精确度和AUC指标,特别是在处理具有挑战性的数据集时[11, 23]。

1.4 研究目标与贡献

本文提供了1982年至2025年RVS方法的按时间顺序的综述,将基础技术与前沿进展相结合。与以往的研究不同,本文基于对428项研究的系统评估,建立了统一的分类体系和深入分析。全文涵盖了从预处理和损失函数设计到后处理和评估的完整流程,重点关注临床相关性、泛化能力和可解释性。主要贡献包括:

- 从早期基于规则和形态学的方法到现代深度学习架构(如U-Net变体、GCNs和Transformer)的完整演变历程。
- 提出了一种新的临床导向的分类体系,根据计算范式(经典、传统、深度学习)和临床适用性对428项研究进行分类,弥补了以往分析的不足。
- 提供了迄今为止最全面的比较性能分析,涵盖了DRIVE、STARE、CHASE_DB1和HRF等标准数据集,使用了包括准确率、AUC和Dice系数在内的20个评估指标,确保评估的一致性和客观性。
- 提供了详细的表格(附录A)和图表(附录B),总结了架构、性能指标和创新点,便于跨模型比较。
- 制定了未来研究的展望性路线图,强调领域适应、半监督和弱监督学习、可解释性提升以及计算效率,以促进RVS技术在临床中的广泛应用。本研究结构如下:第2节概述了研究方法和结构,包括数据集选择、纳入标准和主题分类;第3节讨论了RVS方法的意义、挑战和分类体系;第4节介绍了无监督分割方法;第5节涵盖了监督学习方法(包括非神经网络和基于神经网络的模型);第6节总结了2025年的最新进展;第7节讨论了RVS流程中的预处理和后处理技术;第8节重点讨论了RVS模型训练中的损失函数,介绍了常见的Dice Loss和Binary Cross-Entropy等损失函数,并强调了处理类不平衡和保持血管结构的方法;第9节总结了用于训练和评估RVS算法的关键公共数据集;第10节概述了标准化评估指标;第11节总结了性能趋势、方法演变和临床应用挑战,并提出了未来研究方向;附录A提供了方法论和性能指标的详细汇编,包括按时间顺序排列的RVS技术分类和主要数据集的基准比较;附录B通过图表展示了U-Net变体和先进深度学习模型的架构,直观展示了注意力集成、多尺度特征提取和基于Transformer的组件等创新点;附录C详细介绍了文献搜索策略和PRISMA流程图,确保了研究的透明性和可重复性。

2 研究方法和结构

本研究遵循PRISMA框架[29],确保方法论的透明性、可重复性和严谨性。通过对Scopus、Web of Science、IEEE Xplore和PubMed等主要数据库中44年来的视网膜血管分割(RVS)研究进行系统搜索,选择了428项高质量研究。所选研究主要来自医学图像分析领域知名期刊和会议的同行评审原创文章和综述。为了捕捉该领域的历史发展以及最近的方法学进展,该文集还包括少量技术性预印本和一些来自专业期刊的研究。作为2025年展望的一部分,这些新兴研究被纳入其中以突出前沿的研究方向;然而,在进一步的同行评审验证之前,它们应被视为初步趋势而非确立的临床证据。表1简要总结了多阶段研究选择过程。为了保证完整性和在正文中保持清晰的叙述流畅性,完整的PRISMA流程图显示在图A5中,详细的搜索策略则提供在附录C中。表1. 系统性文献选择过程概要。

通过系统化的文献梳理,为后续分析奠定了基础,该分析按计算范式对视网膜血管分割(RVS)方法进行了分类,追踪了这些方法从传统无监督技术到高级深度学习框架的演变,并建立了该领域的结构化分类体系。

3 视网膜血管分割:重要性、挑战和方法学分类
自动视网膜血管分割(RVS)是一项二分类任务,其中视网膜图像的每个像素都被分类为属于血管或不属于血管(即属于背景),无需人工干预。这个任务可以描述为:设R为视网膜图像,Y为二进制变量,表示像素y是否属于血管,f为分类函数。输出是一个预测的二进制掩码,用于隔离血管结构,如图2所示。

RVS作为通过映射函数获得的二进制掩码,在计算机辅助诊断(CAD)系统中起着关键作用,有助于提取视网膜血管,从而筛查和诊断眼部疾病、视力障碍以及认知衰退和神经退行性疾病等系统性疾病。作为后处理步骤(见第7.2节),这个二进制掩码与原始视网膜图像结合,生成一个分离出血管结构同时抑制背景像素的分割结果。这种掩蔽增强了分割结果的清晰度和可解释性,便于后续的诊断分析。此外,在分割之前,通常会对原始眼底图像进行预处理(见第7.1节),如图像去噪、对比度增强或形态学平滑。这些步骤有助于改善血管边界的定义,并减少成像伪影或噪声的影响。然而,在许多模型表现良好的情况下,广泛的预处理或后处理变得可选,分割结果可以直接从网络中获得,接近最优。尽管RVS非常重要,但它也面临若干挑战:

- 血管的宽度、对比度和迂曲程度各不相同。
- 常常存在噪声和成像伪影。
- 由于病理异常,可能会发生阻塞或变形。

在过去的四十年中,已经开发了大量方法来近似映射函数,反映了多种方法学分类,这些方法通过不同的算法策略应对这些挑战。RVS流程根据学习方法的不同需要不同的输入模式。在无监督方法中,仅需原始视网膜图像即可直接通过模型预测血管结构。而在有监督方法中,训练期间需要原始图像和相应的真实值(GT)掩码。这些方法的基本原理和区别在第3.3节中有详细说明。

3.1 视网膜血管分割的重要性
视网膜血管分割涉及识别和提取整个视网膜中的血管,包括中央和周边血管。其中,中央视网膜血管(CRBVs)具有特别的临床意义,因为它们是最大且最容易通过无创成像和分析访问的血管。视网膜血管的形态和结构特征的变化,包括长度、宽度、迂曲程度、分支模式和角度,是多种系统性和眼部疾病的重要生物标志物。定期监测视网膜血管,特别是在高风险人群(如老年人、糖尿病患者和有心血管疾病的人)中,对于早期诊断和预防视力障碍和其他健康并发症至关重要。然而,相对于全球风险人群,视网膜专家的有限数量给持续和及时的筛查带来了重大挑战。计算机辅助诊断(CAD)系统,在准确的RVS支持下,可以通过自动化血管分割和初步分析来减轻这一负担,使专家能够优先处理复杂病例。视网膜血管的分割允许详细评估血管异常,如血管狭窄、分支角度改变、迂曲程度增加和病理性新生血管。这些特征为高血压、糖尿病视网膜病变、肾脏疾病和各种心血管疾病提供了关键见解。商业诊断平台如Retinalyze(https://www.retinalyze.com)和RetCAD(https://retcad.eu)展示了RVS在临床应用中的实际效用。此外,视网膜血管的模式,特别是CRBVs的独特分支结构,由于其稳定性和独特性,有助于生物识别系统。总之,视网膜血管分割是开发有效CAD系统并推进临床诊断和生物识别应用的基础步骤,特别强调中央视网膜血管的诊断价值。

3.2 RVS中的挑战和方法学限制
由于视网膜血管的复杂性和可变性以及成像条件的变化,RVS面临诸多挑战。主要困难包括:

- 视网膜不同区域的血管长度、宽度、形状和颜色存在显著差异。
- 个体之间的血管模式各不相同,同一人的两只眼睛之间也存在明显不对称。
- 存在非血管结构,如视盘和黄斑,引入了不均匀的照明和对比度变化。
- 视盘内部和周边之间的亮度对比度很高。
- 视盘边界有时会在视网膜图像中显示为虚假的血管结构。
- 细小、低对比度的血管在视网膜背景上难以清晰显示。
- 同一张图像中同时存在高对比度的宽血管和低对比度的细血管,使得分割更加复杂。
- 密集排列的平行血管可能看起来像一根合并的血管。
- 中心光反射:血管中心的一条亮带可能导致一条血管看起来像两条独立的细血管。
- 血管与相邻视网膜组织之间的对比度低。
- 图像曝光不均匀,包括过度曝光或曝光不足的区域,导致血管像素缺失或错误检测。
- 图像采集、传输或存储过程中引入的噪声。
- 复杂的血管交叉和分支模式,有些涉及非常细小或微小的分支。
- 由于非理想的成像条件导致的图像质量退化。
- 由于病理特征(如渗出物、棉絮斑点、出血和新生血管)造成的阻塞,这些都会扭曲血管外观。这些因素共同导致了在不同数据集和临床场景中实现准确和稳健的RVS的复杂性。为了提供简洁的概述,表2总结了各种视网膜血管分割方法的内在限制。这些挑战因所采用的分割方法而异,影响准确性、鲁棒性和泛化能力。这些方法的具体架构和技术细节在第4节和第5节中有深入讨论,表2主要关注第5.2节的方法。

3.3 视网膜血管分割方法的类别
在过去四十年中,RVS经历了巨大的方法学多样性,反映了视网膜血管的复杂性和图像分析技术的不断发展。尽管进行了大量研究,但目前仍没有一个被普遍接受的RVS方法分类框架或分类体系。不同学者提出了不同的分类方案,反映了他们的不同观点、技术趋势和应用背景(见图4)。建立清晰和连贯的分类对于系统评估现有方法、识别研究差距并指导这一关键领域的未来发展至关重要。

RVS方法的分类树展示了从多种文献分类中综合出的主要类别和子类别,包括Fraz等人[1]、Kumar等人[5]、Moccia等人[3]、Khandouzi等人[4]、Almotiri等人[2]、Chen等人[30]和Qin等人[6]的分类。例如,Fraz等人[1]将RVS方法分为七个主要类别:(i) 模式分类(有监督和无监督),(ii) 匹配过滤,(iii) 形态学处理,(iv) 血管追踪/跟踪,(v) 多尺度方法,(vi) 基于模型的方法(参数化和几何的),以及(vii) 基于并行硬件的方法。Almotiri等人[2]将其简化为基于规则的方法和基于机器学习的方法,而Moccia等人[3]则关注三个类别:机器学习、可变形模型和基于跟踪的方法。随着深度学习的兴起,Chen等人[30]提出了一个包含FCN、U-Net、GAN和多模型架构的六类分类法。Khandouzi等人[4]将技术分为经典方法和基于深度学习的方法。Kumar等人[5]提出了一个八分类法,涵盖了匹配过滤、形态学、多尺度技术、可变形模型和血管轮廓模型、自适应阈值和机器学习等传统方法。Qin等人[6]进一步将方法分为有监督和无监督两类。这些不同的分类反映了RVS的方法学多样性和演变,强调了将分类与具体研究目标对齐的重要性。参考方法的总结见表A2-A4(附录A)。在这篇综述中,采用了一种基础且实用的分类方法,将视网膜血管分割方法分为两大类:无监督方法和有监督方法。这种区分基于专家注释的真实值数据的可用性和使用情况,这是影响分割算法设计、复杂性和适用性的关键因素。在有监督方法中,进一步区分了基于神经网络的方法和传统的机器学习技术,突出了近年来深度学习的变革性影响。图5中呈现的分类反映了这一实用且简化的框架。这种分类是基于几个关键考虑因素的。RVS方法的广泛性和重叠性使得使用高度细致的分类变得复杂,这些分类难以一致地导航和应用。许多传统和机器学习方法具有共同特征或结合了多种技术,导致边界模糊,使得严格的分类变得困难。通过关注监督这一基本轴,特别是注释真实值的是否存在,这种分类提供了一个清晰的概念框架,与实际的算法设计和评估非常吻合。

视网膜血管分割(RVS)方法的分类基于监督和模型类型。无监督方法使用非神经的、基于规则的技术,不需要标记的数据或可训练的参数。尽管存在一些基于无监督神经网络的方法,但它们相对少见,因此在这里没有展示。有监督方法需要标记的数据,包括经典的机器学习(非神经的,具有可训练的参数)和基于神经网络的模型。虚线箭头表示共享的非神经特征。其次,如图5所示,有监督方法内的神经和非神经方法之间的划分承认了由深度学习驱动的重大范式转变,由于其卓越的准确性、鲁棒性和适应性,深度学习已成为主导范式。这种简化而有效的分类方法,如图5所示,有助于更清晰地沟通和理解方法类别,反映了视网膜血管分割(RVS)研究的自然演变,并在清晰性与RVS方法的固有多样性之间取得了平衡。这种方法增强了流程图在引导读者理解复杂RVS方法方面的实用性,同时减少了在更详细分类系统中常见的歧义和重叠。后续章节将对每个主要类别进行详细分析。第4节介绍了无监督方法,而第5节重点讨论了有监督方法,包括传统的(非基于神经网络的)和基于神经网络的技术,特别强调了后者。

4 无监督方法

无监督方法用于视网膜血管分割(RVS),无需依赖手动标注的真实数据即可识别血管。相反,它们利用图像的内在特征、数学模型或启发式规则来 delineate 血管结构。在无监督方法中,映射函数(见图2)由一组预定义的规则直接应用于每张输入图像上,以估计血管分割,而无需从手动准备的真实数据(GT)中学习。这些方法在缺乏大规模标注数据集的情景中特别有价值,例如早期筛查或新兴的临床应用。因此,无监督方法缓解了标注瓶颈,尽管仍然需要足够的原始图像。为视网膜图像准备真实数据标注是一个繁琐、耗时且成本较高的过程,需要专门接受过眼底摄影培训的标注员。因此,实施无监督方法避免了与真实数据生成相关的额外成本和努力,将费用限制在仅收集视网膜图像上。一般来说,传统的无监督方法都是基于非神经网络的(见第5.1节),而是依赖于数学模型、手工制作的特征或基于规则的启发式方法,这些方法在图5中也被归类为“非神经”组。尽管也有提出基于无监督神经网络的方法,但它们仍然相对较少见。根据调查的文献,无监督RVS研究主要采用非神经网络技术,而有监督研究则采用神经网络或非神经网络方法。几十年来,几种主要的无监督方法塑造了经典的RVS研究,包括:

1. 匹配滤波:利用血管强度轮廓来检测线性结构。
2. 血管跟踪:利用几何连续性来追踪图像中的血管。
3. 形态学操作:应用基于形状的变换来增强类似血管的结构。
4. 多尺度分析:通过分析空间尺度变化(例如高斯尺度空间)来捕捉不同宽度的血管。除了这些核心策略外,还探索了其他辅助技术来提高鲁棒性、计算效率或捕捉复杂的血管几何结构,包括但不限于:
- 阈值方法:用于二值化血管区域。
- 聚类算法:用于将具有相似强度特征的像素分组。
- 基于模型的分割:利用预定义的血管模型来指导提取。
- 基于图的方法:探索连通性模式以 delineate 血管。

4.1 基于匹配滤波的方法

匹配滤波是RVS中最早和最具影响力的无监督方法之一。Chaudhuri等人[7]首次引入了一种基于高斯血管轮廓的2D匹配滤波器,其在多个方向上操作以检测CRBVs。Hoover等人[8]通过生成灰度匹配滤波器响应并应用直方图阈值来提高血管连续性,进一步改进了这一方法。后续的发展整合了优化和混合策略:Cinsdikici等人[13]使用了蚁群算法,而Li等人[21]使用高斯导数对滤波器响应进行了归一化以改进细血管的检测。Akram等人[16]应用了多层阈值和Gabor小波来抑制非血管像素。Fraz等人[28]针对儿科图像使用了双匹配滤波器,而Odstrcilik等人[57]强调了通过多方向滤波器处理高分辨率图像。Meng等人[67]提出了圆Gabor滤波器和二阶导数算子的融合。最近,Saroj等人[85]引入了一种基于Frechet核的匹配滤波器,并加入了自适应预处理。这些方法及其各自的贡献在表3中进行了简要总结。

4.2 基于血管跟踪的方法

基于血管跟踪的分割方法通过从关键解剖标志点开始,并利用强度和连续性线索跟随血管路径来模拟人类的追踪行为。这些无监督技术对图像质量变化具有固有的抗性,且不需要依赖标注数据,因此特别适合实际筛查场景。Delibasis等人[44]的早期工作使用了分叉检测、血管导向的迟滞阈值和匹配度量(MoM)来精炼血管中心和边缘。为了提高几何适应性,Yin等人[52]在贝叶斯MAP框架内引入了半椭圆形动态搜索窗口,并结合高斯横截面建模,这被证明在 delineate 弯曲和狭窄的血管方面非常有效。Nguyen等人[56]在 inverted 绿色通道上应用了线检测,并结合了自适应线长度和跨尺度融合来提高小血管的检测能力,同时抑制了误报。Christodoulidis等人[71]将多尺度线检测(MSLD)与多尺度张量投票(MTVF)和双树复杂小波预处理相结合,以重新连接细小段落并提高高分辨率图像中的重建效果。Zhou等人[87]进一步将加权线检测器(WLD)与隐马尔可夫模型(HMM)结合起来,强调了中心线的置信度和方向连续性,从而在噪声和血管重叠情况下表现出强大的性能。这些基于跟踪的方法在表4中进行了比较总结。

4.3 基于形态学操作的方法

形态学操作基于形状操作,长期以来一直是视网膜血管分割的基础。早期的努力,如Youssef等人[25]的工作,利用膨胀和腐蚀来增强血管可见性,而Fraz等人[20, 22]通过引入多方向顶帽变换和融合策略进一步扩展了这一方法,用于骨架化血管。后续研究在这些框架的基础上进行了构建:Budai等人[26]和Badsha等人[53]分别结合了形态学后处理和过滤及边缘检测,以减少过分割并提高边界精度。Hassan等人[63]和Roychowdhury等人[68]将形态学预处理与统计或迭代细化相结合。Fraz的QARTZEM系统[62]将这些技术嵌入到一个全面的软件流程中,成为一个里程碑。Jiang等人[76]、Neto等人[78]和Khan等人[80]的后续方法反映了这种方法论的融合,结合了对比度增强、方向过滤和机器学习,以实现更加适应性和抗噪声的血管分割。这种进展在表5中进行了总结。

4.4 基于多尺度分析的方法

基于多尺度分析的方法利用不同分辨率的图像信息来捕捉不同宽度的血管结构,提高分割的鲁棒性。这些技术能够在特定尺度上抑制噪声,并增强细小和粗大血管结构的检测能力。这些技术能够提高分割的准确性和适应性[67, 86]。一些经典方法在多个尺度和方向上应用高斯核或线检测器来增强线性血管模式。例如,Sofka等人[37]使用了多尺度匹配滤波器和方向性高斯核来检测不同宽度的血管,而Martinez-Perez等人[39]结合了高斯过滤、梯度幅度和高斯矩阵来进行尺度感知的血管增强。Farnell等人[39]使用高斯金字塔和区域生长进行分割,Nguyen等人[56]采用了多方向线检测器来高效识别血管。Fraz等人[62]通过通用多尺度检测器扩展了这一概念,该检测器在12个方向上操作,而Christodoulidis等人[71]结合了双树复杂小波过滤和张量投票来捕捉中型和小血管。在不同的方法中,Fathi等人[18]利用多尺度局部二值模式(LBP)描述符和模糊推理系统以及形态学过滤实现了鲁棒的分割。Lam等人[46]和Meng等人[67]利用多尺度拉普拉斯运算符来增强血管。Li等人[21]的MPMF框架和Wang等人[58]的多波小波方法采用了尺度乘法和层次分解来进行血管 delineation。Zhang等人[86]提出了一种快速血管分割方法,使用基于Hessian的Frangi滤波和加速奇异值分解(SVD)。这些发展展示了从纯形态学操作向结合过滤、统计学习和多尺度整合的混合框架的方法论转变。

这些方法的发展反映了从纯形态学操作向融合过滤、统计学习和多尺度整合的混合框架的转变。参考文献

关键方法论

主要贡献与评论

Sofka等人[37]:
多尺度匹配滤波器与方向性高斯核
使用切向高斯核检测不同宽度的血管

Martinez-Perez等人[39]:
高斯核、赫斯矩阵、梯度幅度、区域生长
抑制不需要的结构并提取几何血管特征

Nguyen等人[56]:
多尺度线检测器与方向性模板
使用12个定向线性检测器实现高效检测

Fraz等人[62]:
广义多尺度线检测器
通过多个方向的线响应增强血管

Christodoulidis等人[71]:
双树小波变换、MSLD、张量投票
通过多尺度张量分析检测小型和中型血管

Fathi等人[18]:
多尺度LBP特征、模糊推理、形态学滤波
结合统计和形态学方法进行血管提取

Lam等人[46]:
高斯的多尺度二阶导数
通过多尺度曲率增强实现鲁棒检测

Meng等人[67]:
多尺度方向性滤波、高斯二阶导数
使用阈值处理检测不同尺度和方向的血管

Li等人[21]:
MPMF:具有尺度乘法的多尺度匹配滤波器
结合匹配滤波器和阈值处理以改善分割效果

Wang等人[58]:
匹配滤波器、多小波核、分层分解
迭代增强血管定位并减少噪声

Zhang等人[86]:
基于赫斯的Frangi滤波器、快速SVD
通过多尺度滤波和矩阵分解加速血管检测

5 监督方法
用于视网膜血管分割(RVS)的监督方法使用包含视网膜图像及其对应真实血管掩膜的标记数据集。具体来说,给定一个训练集,这些方法学习一个映射函数(见图2),该函数可以预测未见图像的血管分割掩膜。这些方法从传统的机器学习算法到复杂的深度学习架构都有。它们的成功在很大程度上依赖于高质量标记数据的可用性和足够的计算资源。主要挑战在于人工准备真实掩膜的劳动密集型和成本高昂,这通常限制了数据集的大小和多样性。因此,与不需要标记样本的无监督方法相比,监督方法通常更依赖数据且计算要求更高。RVS中监督学习的演变始于1995年,早期的人工神经网络(ANNs)例如Nekovei等人提出的模型[99]。这些初始系统受到数据和计算资源可用性的限制。自2014年深度学习热潮以来,得益于DRIVE、STARE和CHASE_DB1等公共数据集以及GPU技术的进步,神经网络已成为该领域的基础。如图5所示,监督方法可以大致分为两大类:

1. 非神经方法:依赖手工特征和传统分类器的经典方法。
2. 基于神经的方法:能够自动提取特征的深度学习模型,如全连接网络(FNNs)、卷积神经网络(CNNs)、生成对抗网络(GANs)等,由于它们能够直接从原始数据中学习复杂的层次化表示,已成为RVS的首选方法。在这个类别中,半监督学习作为一种关键策略出现,以解决标记医学数据有限的问题。半监督方法不仅依赖完全标记的数据集,还利用标记和未标记的数据来提高模型性能和泛化能力。常见的方法包括伪标记、一致性正则化和师生架构。这些策略特别适合医学成像任务,如RVS,其中人工注释既耗时又昂贵。此外,弱监督学习也通过使用部分、不精确或低成本的监督信号(如图像级标签、边界框或草图)来训练模型,而不是完整的像素级注释,从而解决了注释瓶颈问题。这种范式对于大规模的眼底成像数据集尤其有价值,在这些数据集中进行详尽的血管注释是不切实际的。尽管与完全监督或半监督技术相比,采用这种方法的RVS研究相对较少,但新兴的架构已经开始利用弱标签来近似血管地图,提供了在注释努力和分割性能之间的有希望的折中。尽管为了清晰起见,半监督和弱监督学习方法在主要分类图中被省略(见图5),但它们在基于神经的RVS研究中构成了一个重要且日益突出的方向。

5.1 非神经方法
在深度学习广泛采用之前,非神经方法是视网膜血管分割研究的基础阶段。这些方法主要依赖于手工特征、领域专业知识和传统的机器学习分类器。它们的优点在于可解释性、计算复杂性低,并且能够在相对有限的数据下提供有竞争力的性能。许多这些方法建立了早期基准,至今仍在用于评估现代分割系统。典型的非神经流程包括预处理、特征提取(例如基于强度的、形态学的或多尺度的边缘特征)以及使用统计或基于规则的模型进行分类。尽管它们在泛化到病理情况或高变异图像方面存在局限性,但这些技术在定义RVS的算法设计空间方面发挥了重要作用,并且在需要模型透明度或资源效率的应用中仍然相关。监督非神经分割方法可以根据所使用的分类器类型进行广泛分类:

1. k最近邻(k-NN)分类器:应用于像素级特征向量的非参数分类器,用于血管分类。
2. 支持向量机(SVMs):适用于具有边界最大化的二分类;核函数允许非线性决策边界。
3. 随机森林(RFs):基于集合的分类器,对特征噪声和过拟合具有鲁棒性,能够处理高维特征空间。
4. 使用高斯混合模型(GMMs)的监督像素分类:基于从标记数据中学习到的高斯混合模型对特征分布进行概率分类的模型。每种分类策略通常与专门的手工特征提取技术相结合,如脊检测、可定向线检测器、形态学操作或Gabor滤波。在以下小节中,为每个分类器类别提供了代表性示例,强调了它们的方法学贡献及其在RVS文献中的相关性。

5.1.1 基于k最近邻(k-NN)分类器的方法
Staal等人[88]引入了最早的监督RVS框架之一,使用k-最近邻(k-NN)分类器进行像素级分类。他们的方法首先使用基于脊的滤波来增强血管中心线,然后提取局部强度轮廓、方向和曲率特征。这些手工特征描述符随后被输入到k-NN模型中以确定每个像素的血管成员身份。进一步采用了血管跟踪机制来保持结构连续性。这种方法在DRIVE数据集上进行了评估,为早期RVS研究建立了强大的基线,并仍然是该领域的基础方法。

5.1.2 基于支持向量机(SVMs)的方法
当与复杂特征提取方案结合使用时,支持向量机(SVMs)已被广泛用于血管分类。Ricci等人[10]使用多尺度线检测器从眼底图像的绿色通道中提取线性模式,随后使用线性SVM进行分类,实现了最小的后处理即可准确划分血管。在此基础上,Xu等人[91]通过将小波和曲波变换与线检测器特征结合起来进一步发展了这种方法,使用具有径向基函数(RBF)核的SVM来处理非线性边界。类似地,You等人[15]使用可定向小波滤波器和径向投影生成以血管为中心的特征,通过修剪并通过二元SVM进行分类。这些方法表明,将线增强滤波器与SVM结合使用可以提供可靠的血管连续性和在不同图像条件下的强泛化能力。

5.1.3 基于随机森林(RFs)的方法
随机森林(RF)分类器也被证明对监督RVS有效。Aslani等人[92]采用了一种监督分割策略,利用随机森林(RF)分类器进行像素级血管检测。他们的方法涉及为每个像素提取一个17维的手工特征向量,捕获强度、边缘和纹理的多样混合。预处理步骤如CLAHE和形态学滤波用于增强血管可见性,而多尺度Gabor小波丰富了方向背景。在这些标准化特征上训练的RF分类器有效地学习了复杂的决策边界,即使在低对比度区域也能实现强大的血管背景分离。Srinidhi等人[81]开发了一个补丁级框架,在其中血管增强和照明校正后使用零相位成分分析(ZCA)进行特征去相关。然后RF分类器进行最终的像素级分类,显示出在高和细血管检测方面的高灵敏度。这些研究强调了随机森林在监督RVS任务中的多功能性,特别是当有强大的预处理和特征工程流程支持时。

5.1.4 基于使用高斯混合模型(GMMs)的监督像素分类的方法
Soares等人[9]引入了一种利用Gabor小波变换提取多尺度和多方向特征的监督RVS方法,模仿人类视觉系统对血管结构的敏感性。这些变换有效地增强了不同宽度和方向的血管检测。提取的特征随后使用基于高斯混合模型(GMMs)的贝叶斯分类器进行分类,这些模型是在通过手动分割注释的像素级数据上训练的。这种监督框架展示了强大的性能,对细血管具有高灵敏度并对照明变化具有鲁棒性,在DRIVE数据集上的ROC曲线下面积(AUC)达到了0.9614。尽管其有效性依赖于标记训练数据,与在真实标签有限的环境中可能更适合的无监督方法形成对比。虽然GMMs传统上被认为是无监督聚类模型,但在这项工作中,它们被集成在监督学习流程中,通过从标记数据估计类条件分布。这种区别表明,监督来自于使用标记数据训练基于GMM的贝叶斯分类器。因此,这种方法与纯粹的无监督方法形成对比。尽管现在在原始准确性和泛化方面被深度神经网络超越,但这些经典的监督机器学习方法在塑造RVS研究中发挥了关键作用。它们促进了严格的基准测试,指导了特征工程实践,并继续在数据稀缺或计算资源受限的领域中作为可解释的替代方案。更多非神经方法及其相应的评估指标可以在附录A的表A3和A4中找到。

5.2 基于神经的方法
基于神经的方法,特别是深度神经网络(DNNs)的出现,改变了视网膜血管分割的格局,使模型能够直接从原始像素数据中学习丰富的层次化特征,而无需手工输入。这些方法在处理血管形态的复杂性、不同对比度和病理变化方面展示了优越的性能。在神经技术中,由于它们的稳定性、性能和对可解释性的日益重视,监督学习框架在文献中占主导地位,这增强了临床信任并有助于理解模型决策。用于RVS的主要神经架构可以如下分组:

1. 全连接神经网络(FNN):使用像素级手工特征作为输入的早期神经模型。
2. 卷积神经网络(CNN):广泛采用的架构(例如U-Net及其变体),利用空间层次结构和局部模式。
3. 生成对抗网络(GAN):通过生成器-判别器交互学习来提高血管真实感的对抗模型。
4. 变换器:能够捕获全局上下文和血管结构中远距离依赖性的注意力驱动模型。
5. 图卷积网络(GCN):通过操作图结构表示来编码血管连通性的模型。可解释性随着这些架构的发展而进步。早期的FNN仅提供了有限的特征重要性洞察,而CNN和GAN逐渐引入了注意力机制和可视化方法来突出影响模型输出的像素或区域。基于变换器的模型自然会产生注意力图,提供对关键血管结构的更全面视图,GCN通过显式建模血管拓扑进一步扩展了这一点,提供了对连通性和解剖学合理性的可解释洞察。这一进步说明了神经架构的进步如何与可解释AI(XAI)的原则保持一致,表明随着模型变得更加复杂,它们的可解释性得到了提高,支持了分割性能和临床信任。在以下小节中,将对每个架构类别进行全面回顾,讨论关键创新、代表性研究和在RVS背景下的比较性能结果。附录A中的表A5和A6提供了包括用于视网膜血管分割的经典和先进技术的监督神经网络方法的全面总结。

5.2.1 基于全连接神经网络(FNN)的方法
全连接神经网络(FNNs),也称为多层感知器(MLPs),是最早探索用于RVS的深度学习方法之一。如图6所示,每个神经元(用一个空白方框表示作为一个计算单元)与前一层的所有神经元完全连接。由于计算限制,这些模型通常只处理局部像素级特征,而不是同时处理整个视网膜图像。每个像素都会提取一个固定大小的特征向量,该向量包含强度、颜色和基于过滤器的描述符,并将其输入到网络中。图6在图查看器中打开。

图6显示了一个基于全连接神经网络(FNN)的视网膜血管分割器(RVS)的示意图。输出层通常包含一个或两个神经元,这些神经元生成血管概率分数,随后通过阈值处理来生成二值分割图。大多数基于FNN的模型都是浅层结构,由一到三个隐藏层组成,其有效性高度依赖于手工制作的特征的质量。尽管这些早期模型展示了可行性,但它们在模拟空间上下文方面的能力有限,且依赖于手动特征工程,因此被更具表现力的架构(如CNN和U-Net)所取代。尽管如此,FNN为RVS中的监督学习奠定了基础。表7总结了使用基于FNN的架构进行RVS分割的关键研究。它表明,FNN分割器通常使用的特征向量维度从2D到200D不等,具有一个到三个隐藏层的浅层结构,以及每层不同数量的神经元,反映了多种手工制作的特征,如小波变换、颜色成分和纹理描述符。

表7. 基于FNN的RVS方法亮点。

| 维度 | 内容 |
|------|-----------------------------------|
| Sinthanayothion等人 [218] | 200D | 来自被分类像素周围10x10像素子图像的第一主成分和边缘强度值 |
| Ghaderi等人 [103] | 2D | 方向Morlet小波 |
| Fathi等人 [105] | 6D | 通过通用旋转不变局部二值模式(LBP)操作符提取的多尺度特征向量 |
| Franklin等人 [106] | 3D | 像素的三个主要颜色成分(红、绿、蓝) |
| Abbasi-Sureshjani等人 [107] | 14D(IOSTER)、12D(DRIVE) | 像素的强度、半蛋糕小波的滤波器响应和多尺度高斯导数的方向分数 |

注:维度(D)指的是特征向量的大小;隐藏层的数量(h);每层神经元的数量(n)。

5.2.2 基于卷积神经网络(CNN)的方法
基于卷积神经网络(CNN)的方法是研究最为广泛的RVS神经架构类别之一。这些方法包括传统的编码器-解码器框架以及各种U-Net变体,由于它们在保留空间细节和理解上下文方面的平衡,已成为该领域的事实标准。

5.2.2.1 编解码器架构
基于编码器-解码器的分割器遵循两阶段架构(见图7):编码器通过卷积和下采样操作捕获上下文和层次特征,解码器通过上采样重建逐像素分割图。下采样通常使用最大池化、平均池化或步长卷积实现,而上采样则通过转置卷积、插值或带有索引的下采样来实现。一些模型在下采样过程中省略了零填充以减少空间占用。

图7显示了一个没有跳跃连接的编码器-解码器分割器的架构。根据架构属性,编码器-解码器RVS模型可以分为:
- 没有跳跃连接(例如,SegNet、FCN-32s)
- 有跳跃连接(例如,U-Net及其变体)

图8展示了文献中提出的几种代表性CNN架构,突出了核心架构组件,如卷积层和编码器-解码器设计。这些模型改编自先前的工作[110, 112, 123, 125, 129, 176],作为基准,展示了基于CNN的方法在RVS中的演变和多样性。

5.2.2.2 U-Net及其变体(2018–2025)
在基于CNN的编码器-解码器架构的基础上,U-Net及其众多变体已成为视网膜血管分割的主要深度学习框架。U-Net架构源自Ronneberger等人的开创性工作[219],通过引入跳跃连接有效地桥接了编码器和解码器路径,从而增强了模型捕捉高级语义信息和细粒度空间细节的能力。如图9所示,U-Net分割器由三个核心组件组成:一个逐步提取层次特征同时降低空间分辨率的收缩路径(编码器),一个通过上采样重建详细分割图的扩展路径(解码器),以及一系列将高分辨率特征从编码器传输到相应解码器层的跳跃连接。这些跳跃连接减少了下采样通常导致的空间细节损失,从而提高了分割精度。

图9展示了U-Net架构,其中用红色虚线箭头标出了编码器和解码器层之间的跳跃连接。在视网膜血管分割的背景下,U-Net的架构创新解决了关键挑战,如细血管结构的保留、训练过程中的高效梯度流动以及从有限标注数据集中学习的能力,使其特别适用于医学成像应用。为了提高RVS中的分割性能,提出了几种U-Net架构的变体:

- 深度变化:在RVS中,神经网络的深度由隐藏层的数量定义,影响其捕捉详细血管结构的能力。浅层网络更简单,收敛更快,但可能难以处理复杂的血管模式。基于CNN的深层网络提供了更好的特征表示。然而,由于标注的RVS数据集有限,这些模型通常比用于自然图像的模型更浅。例如,像ResNet这样的分类模型可以超过150层,而RVS分割器通常少于50层,U-Net变体具有适度的深度,从而在表示精度和数据可用性之间取得了平衡。
- 残差块变化:随着神经网络层度的增加,它们学习复杂模式的能力增强。然而,深度也会引入挑战,如梯度消失和训练精度下降。为了解决这些问题,He等人在ResNet中引入了残差块,使梯度能够更有效地传播。这一概念在U-Net的变体中被广泛采用,提高了性能和架构创新。在RVS的背景下,几种U-Net分割器采用了定制的残差块。例如,Xiao等人提出了Weighted Res-UNet,在编码器和解码器中分别整合了不同的残差块[133];Li等人引入了MResU-Net,在“激活前”使用了残差块[149],其中批量归一化和卷积位于修正线性单元(ReLU)激活函数之前,并添加了dropout以防止过拟合。此外,Wu等人提出了Atrous Residual U-Net(ARU-Net)[217],而Li等人引入了Res2UNet [215],两者都结合了Squeeze-and-Excitation(SE)块来重新校准通道级特征响应。ARU-Net采用了ResNet [220]中最初提出的标准残差块[10d]来解决深度网络中的退化问题。相反,Res2UNet整合了Res2Net [221]中的多尺度残差块[10e],通过更细的感受野粒度增强了多尺度特征表示。

- ROI掩码生成变化:在RVS中,血管通常局限于圆形视网膜区域,而背景信息较少。为了将分割器的注意力集中在相关的圆形兴趣区域(ROI)上,一些基于U-Net的模型引入了ROI掩码来抑制背景噪声。在Weighted Res-UNet [133]中,Xiao等人使用手动提供的ROI掩码或通过全局阈值技术生成的掩码。然后将这些掩码通过逐元素乘法应用于倒数第二层的特征图,从而增强了解剖区域内的分割性能。此外,在Attention-guided U-Net with Atrous Convolution(AA-UNet)[197]中,Lv等人提出了一种可训练的方法,其中ROI掩码直接从编码器的特征图生成。编码器通过均方误差(MSE)损失进行监督,以生成软ROI掩码,实现无需外部掩码注释的自适应ROI关注。

- U-Net中的跳跃连接变化:跳跃连接在基于U-Net的RVS中起着关键作用,通过桥接编码器和解码器特征图之间的语义差距,在上采样过程中保留空间细节。虽然原始的U-Net在相应层直接连接编码器和解码器特征,但各种RVS模型探索了更先进的跳跃连接策略。例如,一些架构结合了密集的跳跃连接、残差跳跃路径或注意力增强桥接,以改善特征融合和上下文理解。这些变化旨在通过增强网络中低级和高级特征的流动来解决分割细血管结构的挑战。

- 卷积类型变化:虽然标准卷积在基于CNN的RVS分割器中常用,但其他卷积操作(如深度可分离卷积[222]、蜂窝卷积和可变形卷积)在各种研究中也显示出改进的性能。在标准卷积中,通道级和空间级的计算是在一步中完成的。也就是说,通过一步应用卷积核从输入特征图获得输出特征图。另一方面,深度可分离卷积是一种分解卷积,其中通道级卷积和点卷积分两步完成。在这种情况下,首先对输入特征图的每个通道应用不同的卷积核得到输出特征图,然后在第二步中对得到的特征图应用另一个卷积核得到最终特征图。

各种用于视网膜血管分割模型的残差构建块:
(a, b) Xiao等人在Weighted Res-UNet的编码器和解码器中使用的残差块。[133]。
(c) Li等人在MResU-Net的编码器和解码器中使用的残差块。[149]。
(d) He等人在ResNet for ImageNet分类中提出的标准残差块。[220]。
(e) Gao等人在Res2Net中引入的多尺度残差块。[221]。
(f) Li等人在Res2UNet中使用的残差块。[215]。

标准卷积与深度可分离卷积的对比。总体而言,这些创新推动了视网膜血管分割的显著进步,如图12所示的基于U-Net的架构以及附录B中提出的其他代表性模型所示。

基于U-Net的代表性架构用于视网膜血管分割。这些模型通过集成高级机制、级联编码器、密集连接、跳跃连接或空间上下文增强,提高了在复杂视网膜图像中的分割精度。更多细节请参考引用的文献。

5.2.3 基于生成对抗网络(GAN)的方法
尽管生成对抗网络(GAN)在RVS中的应用不如纯判别性U-Net架构广泛,但它们在建模血管结构方面提供了有前景的能力。在基于GAN的分割器中,生成器网络(G)生成血管概率图,而判别器网络(D)区分真实和合成的血管图。代表性的基于GAN的RVS分割器包括Son等人的V-GAN [223];DS-ALN [138]、DRPAN [159]、U-GAN [161]、SUD-GAN [178] 和 Park等人的M-GAN [199] [199];以及RV-GAN [184]。图13展示了选定的基于GAN的分割器的架构设计,包括SUD-GAN、RV-GAN和M-GAN。通常,生成器使用U-Net变体,而判别器是基于CNN的二分类器。然而,高级设计集成了架构增强:例如,SUD-GAN结合了类似残差的短连接,RV-GAN使用了挤压-激励块和多尺度判别器以及加权特征匹配损失来更好地捕捉微血管,M-GAN在深度U-Net生成器中集成了空间金字塔池化,并使用了带光谱归一化的PatchGAN判别器。基于GAN的方法在保持微细血管结构和微血管网络方面表现出色;然而,仍存在一些挑战,例如训练稳定性以及训练数据量和质量的依赖性。表8总结了在关键的基于GAN的视网膜血管分割器(RVS)中使用的生成器(Generator)和鉴别器(Discriminator)架构。表8. 基于GAN的视网膜血管分割方法中使用的网络架构。参考文献

生成器(G)


鉴别器(D)








V-GAN(Son等人[223])

U-Net

基于CNN的二进制分类器




DS-ALN(Dong等人[138])

带有深度监督模块的U-Net,即在编码器部分添加了一个额外的侧输出层

基于CNN的二进制分类器




Huo等人[224]

U-Net的变体(具体配置未公开)

基于PatchGAN的鉴别器




Ma等人[152]

带有残差单元的U-Net变体

基于CNN的鉴别器




Rammy等人[154]

基于U-Net的生成器

基于块的CNN分类器




Son等人[223]

带有中间残差连接的编码器-解码器CNN

基于CNN的二进制分类器




DRPAN(Tu等人[159])

完全卷积的编码器-解码器网络,其中编码器是扩张的残差网络,解码器是金字塔池化网络

带有PatchGAN或多尺度输入的鉴别器




U-GAN(Wu等人[161])

在编码器和解码器中都使用了Denseblock,并在解码器中使用了注意力门(AG)

基于CNN的二进制分类器,带有Denseblock




Zhao等人[164]

带有多尺度特征融合的U-Net变体

标准的基于CNN的二进制分类器




Dense U-Net(Guo等人[168])

在编码器中使用Inception模块替换卷积层,在编码器和解码器之间使用Dense块替换跳跃连接

基于CNN的二进制分类器,具有ConvConv-Pooling层




He等人[225]

带有注意力和特征融合的多层U-Net

基于CNN的二进制分类器




Lahiri等人[170]

基于CNN的解码器类型网络,包含一系列上采样、归一化和非线性激活层

U-Net




Park等人[199]

带有空间金字塔池化的深度U-Net

带有光谱归一化的块状鉴别器




SUD-GAN(Yang等人[178])

带有类似残差块的短连接? U-Net

基于CNN的二进制分类器




RV-GAN(Kamran等人[184])

带有挤压和激发块的U-Net以及注意力模块

具有多个尺度和特征匹配的鉴别器



SEGAN(Zhou等人[188])

U-Net




5.2.4 基于Transformer的方法

尽管U-Net变体一直是视网膜血管分割(RVS)的基石,但它们通常难以捕捉长距离依赖性,并且对噪声敏感。为了解决这些限制,研究人员最近探索了基于Transformer的架构,这些架构引入了自注意力机制,以更好地建模全局上下文并提高在复杂眼底图像中的分割性能。这些方法的一个常见趋势是将Transformer架构与U-Net骨干结合,通常是通过将注意力模块集成到编码器、解码器或跳跃连接中。这种结合使得特征表示得到改进,特别是对于细小和不连续的血管。近年来提出了几种基于Transformer的RVS分割器。例如,HT-Net(混合Transformer网络)[213]、MTPA U-Net [212]、GT-DLA-dsHFF [226]和TiM-Net [190]都是在2022年提出的,每种方法都利用不同的Transformer模块进行特征细化、多尺度上下文融合或注意力引导的增强。后续模型如TCU-Net [191]、SGAT-Net [227]和CoViNet [228]引入了进一步的架构创新,包括跨尺度融合、自适应池化Transformer和双向加权特征融合。尽管架构有所不同,所有这些方法都旨在明确捕捉长距离依赖性并改进小而复杂血管结构的分割。表9提供了它们关键组件、注意力策略和集成点的比较总结。表9. 基于Transformer的视网膜血管分割方法总结。参考文献

关键方法

主要贡献和评论







Hu等人[213]

HT-Net:带有高效自注意力(ESA)、特征融合块(FFB)和特征细化块(FRB)的U-Net

通过扩张卷积和瓶颈处的全局上下文建模增强边缘感知分割



Jiang等人[212]

MTPA U-Net:多尺度Transformer自注意力(TMSA)、位置注意力(TPA)和特征提取(FE)

使用多分辨率输入捕捉长距离依赖性和空间线索,以实现精细血管勾勒



Li等人[226]

GT-DLA-dsHFF:全局Transformer、双重局部注意力(DLA)、深浅层级特征融合

整合全局和局部特征,以增强复杂血管结构的连续性和细节



Zhang等人[190]

TiM-Net:带有双重注意力(通道+空间)和加权侧输出的Transformer增强型M-Net

改进深度特征细化和注意引导的跳跃连接,以实现多尺度分割



Shi等人[191]

TCU-Net:高效交叉融合Transformer(ECT)和高效通道交叉注意力(ECCA)

降低注意力计算成本,并解决编码器和解码器之间的语义一致性问题



Lin等人[227]
SGAT-Net:带有SGAP-Former和ResNet-Light的刺激引导自适应Transformer

使用解剖学先验结合局部-全局特征,以实现精确的形态学血管勾勒



Jiang等人[228]
CoViNet:局部-全局特征聚合(LGFA)、双向加权融合(BWF)、自适应侧向融合(ALFF)
通过自适应特征融合和长距离依赖性建模保持血管连续性


5.2.5 基于图卷积网络(GCN)的方法

图卷积网络(GCNs)最近作为建模视网膜血管复杂拓扑结构的分割任务的有效手段而受到重视。传统的卷积神经网络在处理网格结构化的图像数据方面表现出色,但在捕捉血管网络固有的复杂空间关系和连通性模式时遇到限制,而这些关系和模式更好地用带有节点和边的图来表示。GCNs通过直接在图结构化数据上执行卷积操作,将深度学习扩展到非欧几里得领域。在视网膜血管分割中,这允许明确建模血管连通性、分支模式和全局血管拓扑,超越了局部像素邻域。通过编码解剖学和空间血管关系,GCNs提供了更丰富的特征表示,保持了血管连续性并提高了分割精度,特别是在细小毛细血管和分叉等具有挑战性的区域。图14展示了基于GCN的代表性RVS模型的架构图,包括Shin等人[155]和Jalali等人[229]提出的框架。这些模型展示了将基于图的学习模块与CNN骨干相结合,从而实现了增强的上下文特征表示和血管连续性建模。在这些框架中,CNN提取图像级特征,然后将其映射到代表血管结构的图节点上;随后的GCN层从相邻节点聚合并细化血管边界。这一过程使网络能够捕捉对准确视网膜血管勾勒至关重要的长距离依赖性和结构线索。此外,还提供了一个示意图来突出基于图的卷积处理的核心机制。图14展示了基于图卷积网络(GCN)的RVS分割器的架构概述。这些模型结合了图推理能力,以更好地捕捉视网膜血管的结构和拓扑模式。有关更多细节,请参阅引用的文献。总体而言,基于GCN的分割器代表了视网膜血管分割的一个有前景的方向,它结合了局部外观建模和全局拓扑推理,以应对视网膜血管结构的独特挑战。基于U-Net的高级分割模型的补充架构设计在附录B中展示(见图A1-A3–A4)。

5.2.5.1 图例免责声明
本文中的所有图表,包括架构示意图和概念图,都是由作者根据参考文献中的文本描述、图表和示意图手工创建的,并完全归属于原始来源。在适用的情况下,保留了原始的颜色方案和架构语义,并进行了最小程度的调整(例如,为了清晰性和一致性而协调符号或布局)。这些图表,包括附录B中的图表,用于比较和教育目的,并非精确复制,除非另有明确说明。其中一张由作者拍摄的图像包含一个手动创建的真实值(GT)掩膜用于演示。为了简洁起见,某些情况下省略了详细的层描述,但在相关的地方提供了引用,并在所有图例和文本中进行了说明。




6 年度进展:2025年的视网膜血管分割技术

2025年对视网膜血管分割(RVS)来说是一个关键时刻,因为该领域正从简单的像素级分类向多维诊断集成转变。虽然U-Net衍生物仍然是架构的基础,但它们越来越多地通过基于Transformer的注意力机制得到增强,以改善对病理或微血管结构的上下文理解。这些技术进步与可解释的学习方案相结合,如显著性图和特征归因,以增强临床信任和透明度。除了解剖学映射之外,混合多模态框架现在还利用RVS来推断系统状况,包括心血管风险、认知衰退和脑小血管疾病。这种扩展的实用性得到了对通用性的日益关注的支持,利用领域适应性和对比度和谐化来确保在多样化的儿科、成人和兽医人群中的稳健性能。尽管取得了这些进展,但在临床应用方面仍存在重大障碍。高报告的指标往往掩盖了在不同数据集上的有限外部验证,许多流程仍然依赖于手动预处理或后处理启发式方法,这阻碍了全面的自动化。未来的研究必须解决模型复杂性和计算效率之间的权衡,以实现无缝、实时的集成到即时护理筛查系统中。


6.1 2025年的关键发展突显了以下几个趋势







增强型Transformer架构:这些架构通常嵌套在U-Net变体中(例如,GT-DLA、MTPA-UNet、SGAT-Net),它们有效地建模了长距离依赖性,同时保持了精细的血管结构。这些模型中的注意力机制通过突出影响预测最显著的区域来进一步提高可解释性。




病理血管特征表征:越来越重视分割血管异常,包括扭曲、血管重塑和微血管异常,特别是在临床复杂情况下,如早产儿视网膜病变(ROP Plus)或心脏病患者的缺血风险评估。




混合深度学习框架:将这些框架与统计分析、生物标志物数据或临床元数据相结合,这些模型增强了系统性疾病预测的能力,甚至已扩展到兽医研究中的非人类视网膜数据集。




跨数据集泛化和多模态训练:越来越多的努力集中在跨不同数据库和成像模态训练模型上,以提高鲁棒性、领域适应性和临床部署准备度。表10总结了2025年引入了新方法并扩展了RVS应用范围的关键出版物。表10. 2025年发布的选择性视网膜血管分割方法。参考文献

发表状态/期刊
技术





Lamrani等人[230]
《智能医学》期刊
预处理、对比度归一化;分割、深度残差CNN;后处理、概率图平滑和阈值处理
Chetoui和Akhloufi[231]
《生物医学》期刊
分割、多个深度学习模型的集成,包括U-Net、DeepLabV3+和ResUNet;输出融合以实现稳健的血管提取
Wisaeng[232]
《测量》期刊
预处理、图像增强和阈值处理;分割、基于密度的模糊C均值聚类;使用邻域连接进行组件标记
Beuse等人[233]
《眼科科学》期刊
预处理、OCT图像归一化;分割、用于中心视网膜动脉阻塞检测的可解释深度学习;后处理、类别激活映射
Choi等人[234]
《科学报告》期刊
预处理、多模态图像对齐;分割、用于从眼底图像提取特征的深度CNN;预测视网膜静脉阻塞的发展
Vary?ová等人[235]
《国际智能系统期刊》
预处理、感兴趣区域提取和归一化;分割、结合CNN和统计分类器的混合方法;后处理、用于ROP Plus诊断的扭曲度量化
Li等人[236]
《Orphanet罕见疾病期刊》
预处理、视网膜微血管增强;分割、基于视网膜特征的深度学习模型预测脑小血管疾病
Gao等人[237]
《仿生学》期刊
预处理、全分辨率图像归一化;分割、使用轻量级CNN架构的FRNet V2;后处理、血管概率图细化
Senthilkumar等人[238]
预印本(Preprints.org)
预处理、牛视网膜图像的颜色归一化;分割、混合CNN和生物标志物模型;后处理、心血管风险评分
Jayathilaka等人[239]
《IEEE SCSE 2025会议记录》
分割、结合CNN的集成深度学习框架,用于早期检测糖尿病视网膜病变、青光眼、黄斑变性和视网膜静脉阻塞;在多疾病分类中表现出高精度
Fareed等人[240]
《国际成像系统与技术期刊》
预处理、CLAHE和图像归一化;分割、使用CBAM注意力门的轻量级深度CNN进行血管特征增强;后处理、阈值处理以生成最终二值掩膜
Biswas和Banik[241]
《Wiley在线图书馆》书籍章节
分割、基于深度学习的分割模型,用于糖尿病视网膜病变和视网膜疾病;概述早期检测流程;后处理、与临床决策支持的整合
Ye等人[242]
《心脏》期刊
预处理、视网膜图像预处理和增强;分割、使用视网膜生物标志物的深度学习模型检测冠状动脉疾病的轻度认知障碍;应用、风险预测和筛查支持



这些研究共同推动了RVS从传统的解剖学分割向个性化医学、早期多疾病筛查和系统健康监测的进展。许多研究在公共基准测试中取得了具有竞争力的或最先进的性能,突显了领域特定特征提取、可解释性和跨领域泛化的价值。最终,弥合二元分割和自动化临床量化之间的差距仍然是广泛采用的关键障碍。在这一领域的成功将使RVS从研究基准转变为积极主动的非侵入性系统健康监测的基石。


7 图像处理技术

图像处理是RVS流程的基本组成部分,包括预处理和后处理阶段。这些技术对于提高血管可见性、改善分割精度以及确保在不同成像条件下的输出一致性和可靠性至关重要。本节讨论了分割前后使用的主要图像处理方法、它们的作用以及对整体分割性能的影响。

7.1 预处理技术

预处理是视网膜血管分割流程中的关键步骤。其目的是提高图像质量、增强血管的可见性,并去除不相关的背景结构。文献中采用了多种预处理技术来改善视网膜图像并提高血管分割性能。表11总结了一些最常用的预处理技术及其相关参考文献。

表11. 不同RVS分割器使用的预处理技术概述

| 预处理技术 | 描述 | 目的 | 参考文献 |
|----------|-------|------|---------|
| 背景提取 | 去除非血管背景以隔离血管区域 | 提高血管可见性;减少噪声 | [162] |
| AHE, CLAHE | 提高图像对比度 | 在低对比度区域突出血管结构 | [108, 110, 115, 116, 122, 129, 130, 132, 133, 135, 137, 143, 144, 146, 148-150, 157, 158, 162, 167, 172, 174, 176, 177, 181, 185, 187, 189, 192, 200, 203-205, 207-209, 211, 212, 214-216] |
| 灰度转换 | 将RGB转换为灰度或单通道格式 | 减少计算负担和颜色噪声 | [116, 131, 135, 149, 150, 156, 157, 160, 163, 172, 174, 176, 187, 189, 192, 203, 204, 208, 211, 216, 217] |
| 绿色通道提取 | 提取绿色通道(血管对比度高) | 由于血管与背景的对比度高,因此适用于视网膜血管分割 | [110, 115, 129-131, 133, 143, 144, 157, 158, 162, 163, 167, 175, 177, 179, 185, 193, 207, 209, 214, 215] |
| 红色通道提取 | 提取红色通道 | 有时用于背景估计 | [214] |
| 伽马校正 | 应用伽马校正 | 提高亮度和对比度 | [115, 135, 146, 149, 158, 172, 174, 176, 187, 189, 192, 200, 203, 204, 208, 211, 212, 215] |
| 本地自适应伽马校正 | 空间自适应伽马校正 | 提高局部血管可见性 | [162] |
| 标准化 | 将图像强度缩放到固定范围(例如,0–1或均方根规范) | 使输入标准化以适应模型 | [112, 115, 116, 135, 141, 146, 148, 149, 151, 158, 160, 167, 172, 174, 176, 177, 181, 187, 189, 192, 203, 204, 208, 212, 214-217] |
| 高斯滤波 | 应用高斯模糊 | 使图像平滑,减少高频噪声 | [108, 126, 141, 167] |
| 块处理 | 将图像划分为小块 | 实现局部学习,减少内存使用 | [132, 137, 146, 149-151, 163, 166, 167, 181, 182, 192, 193, 195, 200, 202-205, 208, 210, 212, 214, 215] |
| Otsu阈值 | 自动计算自适应阈值 | 将血管像素与背景分离 | [129] |
| 阈值处理 | 应用固定或自适应阈值 | 将灰度图像转换为二值图像 | [126] |
| 不锐化掩码技术 | 使用高通滤波增强边缘 | 提高血管边界的清晰度 | [164] |
| 形态学操作 | 扩张、侵蚀、开运算、闭运算 | 优化血管形状,去除小伪影 | [110, 129, 156, 162, 177] |
| 零相位分量分析(ZCA) | 用于去相关性的零相位分量分析 | 通过去除冗余提高训练性能 | [112] |
| 血管中心光反射去除 | 抑制血管中心线上的光反射 | 避免将反射误分类为血管 | [104] |
| 背景均质化 | 使背景强度均匀化 | 提高血管与背景的分离效果 | [104, 157] |
| 零分数标准化 | 将像素值转换为零均值、单位方差 | 确保输入数据的统计一致性 | [153] |
| 背景减除 | 去除估计的背景 | 突出血管 | [129] |
| 轮廓识别 | 提取血管轮廓 | 用于基于形状的分析 | [129] |
| 模糊C均值算法 | 基于成员级别的软聚类算法 | 根据成员等级分割血管 | [157] |
| 量子预处理 | 使用量子启发的特征编码 | 新颖的增强技术 | [180] |
| 黑色区域替换 | 填充眼底图像的空白(黑色)边界 | 防止模型因伪影而混淆 | [205] |
| LAB颜色空间转换 | 将RGB转换为LAB颜色空间 | 提高亮度对比度 | [205] |
| 自动颜色均衡(ACE) | 平衡颜色分布 | 提高照明一致性 | [199] |
| 连续像素空间 | 在连续空间中表示血管概率 | 有助于概率分割 | [148] |
| 多尺度Top Hat变换 | 在多个尺度上提取明亮/暗特征 | 提高多尺寸血管的检测能力 | [181] |

如图15所示,这些预处理步骤突出了用于提高血管可见性的常见增强策略。从原始图像(见图15a)开始,每种方法针对图像质量的不同方面,如局部对比度、噪声减少或边缘锐化,以促进更好的分割性能。

图15:对原始视网膜图像分别应用的预处理步骤。(a) 原始图像(与图1中的相同)。(b) 在绿色通道上应用CLAHE以增强血管。(c) 应用伽马校正以调整亮度。(d) 应用高斯滤波以减少噪声。(e) 应用不锐化掩码以锐化边缘。(f) 应用直方图均衡以增强对比度。(g) 在Lab颜色空间应用ACE以增强局部对比度。在这些技术中,自适应直方图均衡(AHE/CLAHE)被广泛采用,这一点从表11中的大量参考文献中可以看出。如图15b所示,它的流行源于其在增强局部血管对比度方面的强大能力,特别是在低照明区域。同样,绿色通道提取(见图15g)和灰度转换也经常被使用,因为它们在视网膜眼底图像中提供了出色的血管与背景对比度。标准化方法如伽马校正(见图15c)、标准化和高斯滤波(见图15d)通常用于减少强度变化和噪声,这对于稳定的模型训练至关重要。虽然传统的直方图均衡(见图15f)提供全局增强,但不锐化掩码(见图15e)经常用于特别锐化精细的血管边界。此外,基于块的处理方法也很常见,这突显了它在内存高效训练和局部特征学习中的作用,特别是在基于CNN的方法中。更高级或 niche 的技术,如在Lab颜色空间应用的ACE(见图15h)、血管中心光反射去除、ZCA白化和量子预处理,出现的频率较低。尽管如此,这些方法代表了解决特定领域挑战的创新尝试,包括光反射和冗余输入信息。还应注意,根据每种预处理操作选择的特定参数,可视化效果可能会略有不同。总体而言,对对比度增强和标准化技术的依赖反映了文献中一致的趋势,即提高血管可见性并确保在不同采集条件下的数据质量一致性。

7.2 后处理技术

后处理技术对于完善视网膜血管分割方法的输出至关重要。这些技术通常在初始分割步骤之后应用,以提高血管边界的准确性、去除噪声和伪影,并提高二值血管掩码的整体质量。表12总结了一些常用的后处理策略及其各自的目的。

表12. 不同RVS分割器使用的后处理技术概述

| 技术 | 描述 | 目的沙拉 | 参考文献 |
|------------|------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------|
| 形态学操作 | 在二值分割掩码上使用扩张、侵蚀、开运算、闭运算等 | 删除噪声、填充间隙、连接断裂的血管 | [110, 129, 162, 177] |
| 条件随机场(CRF) | 应用于分割输出的概率图模型 | 通过考虑像素级关系来细化边界 | [148, 168, 172, 212 |
| 连通组件分析 | 对二值掩码中的小孤立区域进行标记和过滤 | 删除小的误判,并保留类似血管的结构 | [149, 174, 176 |
| 轮廓平滑 | 对分割轮廓应用中值或高斯滤波 | 减少预测血管中的锯齿边缘 | [160, 200 |
| 阈值处理(事后) | 在概率图上应用自适应或固定阈值 | 将软预测转换为二值分割 | [108, 177, 205 |
| 孔洞填充 | 二值图像操作,用于填充血管内的小孔洞 | 确保血管结构的连续性 | [162, 205, 215 |
| 骨骼化 | 将血管简化为其中心线 | 适用于定量分析,如宽度或连通性 | [172, 216 |
| 集成平均 | 结合多个模型的输出 | 提高鲁棒性并减少误判 | [167, 204 |
| 通过滤波细化边缘 | 分割后使用边缘滤波器(Sobel, Laplacian) | 锐化血管边界 | [149, 203 |

其中,形态学操作是最常用的技术。它们的流行源于其简单性、计算效率以及在去除噪声、连接断裂血管和细化血管形状方面的有效性。连通组件分析是另一种常用的方法,特别适用于消除小的误判和隔离类似血管的结构,使其成为传统和深度学习流程中的常用技术。条件随机场(CRFs)在基于深度学习的方法中越来越受欢迎,特别是在需要细粒度血管边界的情况下。CRFs通过利用空间上下文和像素间依赖性来提高分割精度,尽管计算成本较高。然而,它们的性能提升通常能够证明其成本是合理的,特别是在追求高解剖学准确性的模型中。孔洞填充和轮廓平滑是常用的辅助步骤,可以改善血管的连续性和视觉质量,而骨骼化则选择性地应用于需要分析血管宽度或连通性的场景。值得注意的是,结合集成平均的方法通常报告出更高的鲁棒性和泛化能力,尽管代价是推理时间增加。总体而言,形态学操作和连通组件分析由于其在简单性和有效性方面的平衡而占主导地位,而CRFs和集成策略则在优先考虑细节和鲁棒性的研究中受到青睐。表11和表12中总结的预处理和后处理技术构成了RVS分割流程的重要组成部分。附录A中的表A2至表A6提供了这些流程的全面列表,包括预处理、后处理和主要的分割步骤,涵盖了无监督、混合、经典监督和基于深度学习的高级方法。一些流程可能不包括预处理或后处理步骤;仅标记了方法中实际使用的步骤。

8 损失函数

选择合适的损失函数是训练RVS模型时的关键设计决策,因为它定义了优化目标,并显著影响收敛行为、稳定性和分割性能。尽管损失函数不是一个可训练的参数,但它被视为一个关键的超参数,在模型配置期间提供,并控制预测误差的惩罚方式。它通过指导训练过程中的梯度更新来塑造学习动态,从而影响收敛速率和最终的分割精度。表13总结了RVS分割中最常用的损失函数及其数学公式和预期的优化目的。

表13. 不同RVS分割器使用的损失函数概述

| 函数名称 | 公式(简化) | 目的 | 参考文献 |
|-----------------|---------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------|
| 二元交叉熵(BCE) | | 惩罚错误的像素级分类 | [108, 116, 133, 157] |
| Dice损失 | | 最大化预测与真实值之间的重叠 | [115, 146, 149] |
| Jaccard损失 | | 最小化交并比误差 | [148, 181, 189] |
| Focal损失 | | 关注难以分类的像素,缓解类别不平衡 | [172, 176, 192] |
| Tversky损失 | | 控制误判(FP)和漏检(FN)之间的权衡(适用于血管) | [200, 209] |
| 组合损失 | | 结合Dice和BCE的优势 | [203, 204, 212 |
| 对抗性损失 | | 训练生成器以欺骗判别器,在GANs中 | [138, 159, 161, 178, 184, 188, 223] |
| 感知损失 | | (来自预训练网络的特征) | 确保超出像素级准确性的语义相似性 | [204, 205] |
| 边缘感知损失 | | BCE + | 强制预测与真实标签之间的边缘相似性 | [150, 211] |
| 拓扑感知损失 | | 使用持久同调或骨架重叠指标 | 保持血管的连通性和拓扑结构 | [158, 216] |

注:在上述公式中, 表示真实值二值标签, 表示模型的预测概率, 是一个小的常数,用于防止除以零, 和 是用于平衡类别权重、焦点难度或损失成分贡献的超参数。 表示边缘检测的梯度运算符, 和 分别表示对抗框架中的判别器和生成器网络, 是来自预训练网络的特征提取器,用于感知损失。值得注意的是,Dice损失及其变体因其对抗类别不平衡的鲁棒性而被广泛采用,这在眼底图像中很常见,因为血管只占像素的一小部分。基于Dice的损失直接优化了重叠并鼓励分割血管的连续性。此外,二元交叉熵(BCE)仍然是一个基础组成部分,经常与Dice结合使用形成组合损失,以平衡像素级准确性和结构一致性。其他公式如Tversky损失和Focal损失提供了对误判的更好控制,或在处理细小血管分支时很有帮助。这些损失之所以占主导地位,不仅因为它们的性能,还因为它们的计算简单性、易于与现代架构集成,以及能够同时确保像素级精度和结构完整性,这些都是RVS任务的关键要求。

9 用于视网膜血管分割的数据库

视网膜血管分割(RVS)算法的开发和评估严重依赖于高质量、带注释的眼底图像数据集。这些数据集大致可以分为两类:公共数据集,对研究社区公开可用;以及私有数据集,通常特定于机构且不公开共享。虽然私有数据集可能提供更大的多样性或体积,但由于患者隐私、机构政策和注释标准不一致,它们的可用性往往受到限制。因此,它们的有限可用性阻碍了研究之间的可重复性和比较分析。相反,公共数据集已成为RVS研究的基础,提供了标准化的成像条件、专家注释和详细的协议。它们的可用性使得公平的基准测试、可重复的实验和传统及深度学习方法之间的有意义进展成为可能。鉴于它们的广泛使用和重要性,本节提供了RVS最常用的公共数据集的结构化概述。表14总结了它们的核心特征,数据集

H × W

图像

视野(FOV)

参与者

年龄

相机

CHASE_DB1 [19]
960 × 999
28
≈30°
14
9–10岁
Nidek NM-200-D眼底相机

DRIVE [88]
584 × 768
40
45
400
25–90岁
Canon CR5非散瞳三电荷耦合器件(CCD)相机

FIVES [243]
2048 × 2048
800
50岁

4–83岁
TRC-NW8眼底相机

HRF_DR [26]
3264 × 4928
45
45
45

Canon CR-1眼底相机

IOSTAR [73]
1024 × 1024
30岁
45岁




LES-AV [244]
1444 × 1958 × 2196
22岁
30, 45岁
45岁




REVIEW [245]
1024 × 1360, 1440 × 2160, 2600 × 3300, 2438 × 3584
16岁
60, 50, 50, 60岁


• 六张图像:Cannon 60紫外线胶片相机
• 八张图像:Zeiss眼底相机和JVC三CCD相机
• 两张图像:Zeiss FF 450眼底相机

RETA [246]
1024 × 1024
81岁





RITE [247]
565 × 584
40岁





STARE [8]
700 × 605
40岁





UoA-DR [248]
2056 × 2124
200岁
45岁


Zeiss VISUCAM 500眼底相机

VICAVR [249]
584 × 768
58岁
45岁
96岁
30–80岁
TopCon非散瞳相机NW-100

注:某些数据集报告的参与者数量远多于图像数量,因为只有部分可用图像被选出来用于研究目的。例如,DRIVE收集了400名糖尿病患者的图像,但只有40张视网膜照片被公开发布。

1. 英国儿童心脏与健康研究数据库(CHASE_DB1):CHASE_DB1是一个公开可用的视网膜血管参考数据集,包含了来自英国儿童心脏与健康研究(CHASE)的视网膜图像子集。该数据库包括来自不同种族背景的9岁和10岁儿童的左右眼底照片,并附有视网膜血管的真实标注。数据集包含了具有不同视网膜色素水平的视网膜眼底图像。

2. 数字视网膜图像用于血管提取(DRIVE):DRIVE数据集是用于视网膜血管分割的广泛使用的基准数据集,来源于荷兰的糖尿病视网膜病变筛查项目。它包含了七例异常病理案例。该数据集中的所有图像均为JPEG压缩格式。在训练集中,一位眼科专家对每张图像进行了手动分割;在测试集中,两位不同的观察者对每张图像进行了两次手动分割,其中第一位观察者的分割结果作为性能评估的基准。

3. 彩色眼底图像血管分割(FIVES):FIVES数据集包含高分辨率的彩色眼底照片,通过标准众包方式由医疗工作人员进行逐像素手动标注。这些图像被赋予了三个标签:疾病、逐像素血管标注和图像质量评分。创建该数据集时,三位眼科医生担任高级标注者,而24位了解视网膜解剖结构的医疗工作人员担任初级标注者。

4. 高分辨率眼底-糖尿病视网膜病变(HRF-DR):HRF-DR数据库是由一个合作研究小组构建的。该公共数据库现在包含15张健康患者的图像、15张糖尿病视网膜病变患者的图像和15张青光眼患者的图像。每张图像都包含二值的黄金标准血管分割图像。

5. IOSTAR:IOSTAR血管分割数据集包含扫描激光检眼镜(SLO)拍摄的图像。一组视网膜图像分析专业人员对所有血管进行了标注。该数据集还包括视盘和动脉/静脉比率的标注。

6. LES-AV:LES-AV包含一张病变图像和21张正常眼底图像。它还具有青光眼/健康的手动标注,用于区分正常张力性青光眼(NAG)和原发性开角型青光眼。注意:IOSTAR和LES-AV数据集的完整命名规范在原始出版物中并未明确定义。尽管LES-AV数据集与鲁汶大学(KU Leuven)的研究相关,并专注于动脉-静脉标注,但这些缩写的确切含义在现有文献中并未正式记录。

7. 视网膜血管图像集用于宽度估计(REVIEW):英国林肯大学计算与信息学系于2008年在线发布了REVIEW数据集。该集合包含16张散瞳照片、193个标注的血管段和5066个由三位不同专家精心标记的轮廓点。数据库分为四部分:HRIS(高分辨率图像集)、VDIS(血管疾病图像集)、CLRIS(中央光反射图像集)和KPIS(踢点图像集)。

8. 视网膜血管树分析(RETA):RETA包含从IDRIrD数据集的第一个子集中继承的81张照片。其中54张用于训练,27张用于测试。在构建数据库期间,他们尝试通过多阶段标注和使用自开发的专用软件进行标签消歧来控制不同标注者之间的差异。除了二值血管掩模外,该数据集还包括其他类型的标注,如动脉/静脉掩模、血管骨架、分叉和异常。

9. 视网膜图片血管树提取(RITE):RITE是一个用于比较研究视网膜眼底图片上动脉和静脉分割或分类的数据库。它基于公开可用的DRIVE数据库。动脉标记为红色;静脉标记为蓝色;重叠的动脉和静脉标记为绿色;未知的血管标记为白色。眼底图像格式为TIF。血管参考标准和动脉/静脉(A/V)参考标准均为PNG格式。

10. 视网膜结构分析(STARE):STARE数据集包含400张视网膜图片,其中20张用于血管分割标注。10张眼底照片显示病变症状。所有图像均由两位观察者手动标注。第一位观察者将有10.4%的像素识别为血管,而第二位观察者为14.9%。两位观察者之间的分割差异在于第二位观察者分割了更多的细小血管。

11. 奥克兰大学-糖尿病视网膜病变(UoA-DR):UoA-DR数据库是奥克兰大学在研究自动筛查糖尿病视网膜病变方法时制作的。该数据库与Al-Salama Eye Hospital和印度合作伙伴共同创建,包含200张照片,其中大部分显示了糖尿病视网膜病变患者。

12. 血管模式分析(VARPA)图像用于计算动脉/静脉比率(VICAVR):VICAVR数据集是在血管模式分析(VARPA)研究计划下开发的,用于支持眼底图像中动脉/静脉比率(AVR)的自动化计算。该数据库包含了从视盘不同半径测量的血管口径以及三位专家识别的血管类型(动脉/静脉)。图16a,b展示了在RVS分割研究中使用该数据集的频率,分别比较了传统(非神经网络)方法和基于深度神经网络(DNN)的方法。这些数据基于过去四十年发表的300多篇同行评审文章的全面回顾,确保观察到的趋势代表该领域的广泛和代表性样本。

RVS分割中数据集的使用频率:(a)非神经网络基方法和(b)基于深度神经网络的方法。在传统方法中(见图16a),DRIVE数据集使用频率最高,出现了50次实验,其次是STARE(44次)和CHASE_DB1(7次)。其他数据集,包括MESSIDOR和各种私人来源的数据集,仅使用了一次,表明在传统流程中的采用率较低。总共113项研究使用了非神经技术。相反,基于DNN的方法(见图16b)显示出更广泛和密集的数据集使用情况。DRIVE数据集再次领先,共有64项研究,其次是STARE(55次)和CHASE_DB1(36次)。IOSTAR、DRIONS和私人收集的数据集使用频率较低,每项研究出现10次或更少。共有187项基于DNN的研究被纳入分析。总体而言,这一趋势突显了DRIVE和STARE作为基准数据集的持久主导地位。它们的广泛应用不仅反映了它们的可访问性和高质量专家标注,还反映了它们在实现公平比较、可重复性和稳健基准测试方面的核心作用。

10. 视网膜血管分割的评估指标
视网膜血管分割(RVS)模型的性能通常通过将其输出与对应的真实图像进行比较来评估。这些参考图像是与输入图像相同尺寸的二值地图,其中每个像素被标记为血管部分或背景部分。RVS中的评估通常被构建为一个逐像素的二分类问题,从而可以使用统计分类中的既定性能指标。本综述考察了文献中常用的20个具体性能指标,如图17所示。其中最常用的指标包括准确性、敏感性(召回率)、特异性、ROC曲线下面积(AUC)和F1分数。

评价指标在RVS研究中的使用频率。这些指标基本上源自逐像素分类的四种可能结果:
- 真正例(TP):正确识别为血管的像素。
- 假正例(FP):错误地分类为血管的背景像素。
- 真负例(TN):正确分类为背景的背景像素。
- 假负例(FN):错误地分类为血管的背景像素。

表15总结了血管和背景像素分类的混淆矩阵。在这个背景下,随机预测意味着根据数据集中每个像素的观测频率将其分配到血管或背景类别。具体来说,将像素随机标记为血管的概率由以下公式给出:

这个概率是计算基于机会校正的指标的预期一致性的基础。值得注意的是,MCC在数学上等同于二元分类中的皮尔逊相关系数。

11. 讨论

视网膜血管分割(RVS)领域在过去四十年中经历了重大变革,这一变革得益于图像处理、机器学习以及最近的深度学习的进步。本综述系统地评估了多种传统和当代的分割方法,并使用了二十个标准化的评估指标来衡量这些方法的表现。在本节中,分析了关键的性能趋势,解释了比较结果,并将RVS方法的方法论演变置于具体背景下。同时,还突出了当前面临的挑战,并提出了旨在提高临床适用性、鲁棒性和可扩展性的未来发展方向。尽管多年来有许多综述文章研究了RVS方法,但它们的范围往往有限,无论是考察的研究数量、考虑的发布时间框架还是方法论分类的完整性,因此往往无法全面理解该领域。如表A1(附录A)所总结的,以往的研究(例如Fraz等人[1]、Almotiri等人[2]和Chen等人[30])通常只涵盖了48到118项研究,而且常常局限于特定时期(例如2016-2021年)或方法类型(例如仅基于神经网络的模型)。相比之下,本综述涵盖了1982年1月至2025年7月期间发表的428篇经过同行评审的研究。此外,通过整合二十个评估指标,本文提供了一个更广泛的分析框架,考察了DRIVE、STARE、CHASE_DB1和HRF数据集上的具体性能趋势,并将分割方法细分为不同的子类别。为了便于理解和提高清晰度,本文提供了一个基于监督和计算模型的RVS方法论的清晰而全面的分类体系。具体来说,无监督方法仅使用非神经技术,而有监督方法则包括非神经和基于神经的模型,突出了这些方法之间的共同点和区别。此外,文章还详细介绍了图像处理技术(包括预处理和后处理步骤)、常用的损失函数,并彻底解释了评估指标。这一全面的视角使我们能够更细致地了解RVS方法在技术和临床应用方面的发展。

11.1 方法论的广度和分类

表A2–A6(附录A)总结了本综述中包含的各种分割方法。具体来说,分类如下:

- 71种无监督方法(见表A2)。
- 4种通常被称为无监督的带监督组件的技术(见表A3)。
- 18种非神经监督方法(见表A4)。
- 89种基于CNN/FCN/U-Net的标准深度学习监督方法(见表A5)。
- 28种高级深度学习方法,包括基于复杂CNN、GAN和混合架构的方法(见表A6)。每张表格都提供了所包含方法的关键组件的详细信息,包括预处理流程、模型架构、损失函数(如适用)和后处理策略。这种结构使读者能够系统地比较各种方法,并理解RVS模型背后的技术基础。总体而言,这种分类体系体现了从早期基于规则的策略到现代深度学习创新的全面而方法论多样化的研究脉络。

11.2 模型和数据集之间的性能趋势

尽管本综述的主要焦点是基于深度神经网络(DNN)的方法,但也分析了传统非神经方法的性能,以提供一个全面的历史视角(见附录A中的表A8–A11)。非DNN方法,包括基于规则的滤波器、匹配过滤和经典监督分类器,在DRIVE和STARE等早期基准数据集上表现出了强劲的结果。在DRIVE数据集上,Hassan等人[75]和Badsha等人[53]在保持血管边界准确性的同时实现了高敏感性。在STARE数据集上,Cheng等人[100]提供了整体的性能表现,Wang等人[102]和Meng等人[67]在特异性和精确度上取得了显著提升。然而,这些方法在CHASE_DB1和HRF等更复杂的数据集上的表现通常较差,因为这些数据集在血管形态、病理病变和光照条件方面存在更大的变异性。对于CHASE_DB1,Wang等人[102]和Fraz等人[28]通过在高图像变异性下保持准确性并减少分割错误(通过提高精确度和减少误报)实现了强劲的表现。在HRF数据集上,Budai等人[26]和Orlando等人[95]尽管面临高分辨率的复杂性,仍实现了稳健的血管检测,增强了血管的一致性和结构保留。虽然个别方法在特定指标上表现出色,但没有一种方法能在所有评估参数上保持一致的优势,这突显了传统模型在面对实际临床变异性时的适应性有限。相比之下,基于DNN的方法在这些基准数据集上取得了显著的改进。如附录A中的表A12–A15所示,Jebaseeli等人[144]、Kamran等人[184]和Wu等人[204]的架构通过利用层次化表示、注意力机制和多尺度学习,实现了更高的准确性、F1分数和敏感性。这些进步使得血管边界更加精确,能够更好地处理复杂的血管结构,并提高了对图像质量和病理变化的鲁棒性。此外,DNN模型在不同数据集上的泛化能力更强,尤其是在使用多样化训练数据或针对特定领域特征进行微调后。这种适应性标志着RVS方法在技术和临床应用方面的重大进化。

11.3 历史进展和方法论转变

视网膜血管分割领域经历了多次方法论转变。20世纪80年代和90年代的早期方法主要依赖于无监督的、基于规则的方法,如匹配过滤、形态学操作和多尺度分析,这些方法基于手工制作的血管外观模型。尽管这些方法具有可解释性和计算效率高,但受到低对比度和病理噪声的限制。21世纪,机器学习模型(如SVM、k-NN和随机森林)的引入通过利用手工制作的特征改进了基于分类的分割效果。这些方法提高了泛化能力,但在处理复杂的血管几何结构和细小毛细血管时遇到了困难。2010年代深度学习的出现标志着一个重大的范式转变。U-Net(2015年)等架构为生物医学图像分割奠定了基础,实现了自动特征提取和上下文感知的预测。随后的创新,如ResUNet、LadderNet和DeepVesselNet,进一步提升了分割性能,尤其是在处理小血管方面。最近(2020-2025年),基于注意力的模型和变换器变体(如SGAT-Net、MTPA-UNet、TransUNet)通过建模长距离依赖性和全局上下文,解决了卷积架构在复杂血管拓扑结构中的某些局限性。

11.4 RVS方法的比较优势和局限性

RVS的发展 clearly 表明了一种从手工制作的启发式方法向学习得到的层次化表示的转变。虽然深度学习模型现在代表了最先进的技术,但比较分析显示没有一种单一框架能成为通用的解决方案。如表16所总结的,方法的选择涉及计算效率、数据需求和解决复杂血管拓扑能力之间的关键权衡。表16展示了RVS方法的比较概览:包括架构优势、拓扑局限性和在标准视网膜基准测试上的相对性能层次。方法类型、优势、局限性、对细/粗血管的表现、典型用途/最佳适用场景、数据需求/速度等方面进行了对比。

11.4.1 方法论的变异性和指标解释

需要注意的是,RVS中的性能指标对实验设置非常敏感。数据划分的变化,例如固定的与随机的训练-验证-测试分割以及不同的分割比例(例如,测试数据极少的严重不平衡分配)、基于补丁的处理与整幅图像的处理,以及视野(FOV)掩膜的选择,都可能导致同一个数据集上的结果有很大差异。例如,在整个图像范围内计算指标与仅在视网膜掩膜内计算相比,可能会因为包含易于预测的背景像素而人为提高准确性。此外,指标计算中的不一致性,特别是在Dice系数(全局Dice)中是否包含背景像素与仅包含血管像素,使得直接的对比变得复杂。同样,其他实验选择或预处理设置也可能扭曲报告的性能,使得跨研究比较变得复杂。因此,虽然某些研究(例如Budak等人[166])报告在DRIVE和STARE数据集上的Dice系数约为0.98,但这些值通常反映了包含背景的计算结果。相比之下,严格关注血管特定细节的严谨评估会得到更低但更具代表性的重叠分数。在这种情况下,最先进的性能是由模型保持细小毛细血管和复杂分支连接的连贯性来定义的,而这些细节往往被全局性的、由背景膨胀的指标所掩盖。这种差异解释了表16中的定性层次结构,强调了架构效率而非直接可比较的数值。传统方法(基于规则和传统的监督方法)在计算上高效且易于解释,适合资源有限的环境。然而,它们在处理细小血管、复杂结构和抵抗噪声及病理变化方面存在不足。相比之下,基于神经网络的方法学习了层次化的空间特征,显著提高了分割性能。CNN在准确性和效率之间提供了良好的平衡,而Transformer和GCN则进一步增强了全局上下文和血管连接性,在基准数据集上实现了更高的准确性和Dice系数,尤其是在处理细小血管和分支结构时。

11.4.2 关键发现和权衡

比较数据显示出明显的性能层次结构,这主要取决于不同架构在处理空间分辨率和连接性方面的能力:

- 细小血管的精确度:利用跳跃连接、残差块或注意力机制(如Weighted Res-UNet和AA-UNet)的架构在细小毛细血管的分割上始终表现优异。这些特性使得模型能够保留标准网络深层通常丢失的高分辨率空间细节。
- 全局上下文与局部细节:虽然基本的CNN和FNN在计算上高效,但由于感受野有限,它们在处理细小血管时往往遇到困难。相比之下,基于Transformer和GCN的模型在捕捉长距离依赖性和血管连接性方面表现出色,为病理复杂图像提供了所需的鲁棒性。
- 临床效用:对于早期检测糖尿病视网膜病变或青光眼(这需要精细的血管识别),基于Transformer的模型和带有注意力增强的U-Net因其边缘保留和噪声处理能力而更受青睐。相反,较大的血管主干从GCN或混合方法中受益最多,因为这些方法明确建模了血管的连续性。尽管有这些进步,但仍然存在若干局限性。没有一种方法能在不同的数据集或成像条件下一致地表现优异。在存在疾病相关伪影(如出血或渗出物)和图像质量变化的情况下,性能往往会下降。此外,深度学习模型通常需要大量的标注数据和计算资源,这限制了它们在现实临床环境中的应用。总体而言,混合CNN-Transformer–GCN架构的趋势代表了有希望的方向。通过结合局部特征提取、全局上下文推理和结构建模,这些方法通常能在现代基准测试中比传统方法提高5%–10%的敏感性。然而,未来的进展不仅取决于架构创新,还取决于泛化能力的提升、标准化评估协议以及可重复性的增强,以支持可靠的临床应用。

11.5 实施、可复制性和实际考虑

虽然前面的分析强调了跨数据集和架构的方法论性能,但这些模型的实际应用还取决于其可复制性、代码的可获得性和标准化的评估实践。尽管最近的RVS研究在基准数据集上表现强劲,但其实际应用价值最终取决于实验设置的一致实施和透明报告。

11.5.1 框架和开发生态系统
大多数当前的RVS模型使用PyTorch或TensorFlow,由于其灵活性(如处理基于注意力的混合模型等复杂架构),PyTorch使用更为频繁。特定领域的基于PyTorch的框架越来越多地被用于标准化预处理、数据增强和医学成像工作流程,包括强度归一化和血管特定裁剪。这些框架有助于减少自定义实现的变异性,尽管它们在各个研究中的采用仍然不统一。

11.5.2 实现的公开可用性
多项研究(2020-2025年)在GitHub等平台上提供了代码。存储库可能包括基线架构(例如U-Net变体)、提出的模型(例如SA-UNet、IterNet、FR-UNet、WA-Net)、预处理脚本、完整的训练流程和评估代码。文档的完备性各不相同:一些存储库提供详细的设置说明和可重复性指导,而其他存储库仅提供部分实现。公开可用的代码支持报告结果的验证,并便于适应新的数据集,尽管尽管社区和期刊努力鼓励代码、数据和协议的共享,但在文献中的可用性仍然不一致。

11.5.3 实现敏感性和基准测试
RVS的可重复性对预处理和训练选择非常敏感。诸如颜色通道选择、对比度增强(例如CLAHE)、尺寸插值和数据增强等决策会显著影响Dice值、AUC和其他分割指标。为了实现公平比较,一些研究在相同的条件下(相同的数据分割、预处理、硬件)重新实现了多种架构。公共基准存储库(如retinal-vessel-segmentation-benchmark)为评估DRIVE、CHASE_DB1和FIVES等数据集上的模型提供了受控环境。尽管这些资源很有价值,但它们尚未被广泛采用,而且目前还没有统一的基准测试标准。

11.5.4 数据和评估考虑
标准基准(DRIVE、STARE、CHASE_DB1)仍然被广泛使用,但其规模有限(通常为50张图像)。更大、更多样化的数据集,如FIVES(包含多种视网膜疾病的800张高分辨率图像)、RETA(专注于血管拓扑)和奥克兰大学糖尿病视网膜病变数据集(UoA-DR;200张图像,主要显示糖尿病视网膜病变病例)越来越多地被用于评估模型的泛化能力(见表14)。传统的像素级指标(准确性、敏感性、Dice值)很常见,但考虑连通性的指标(如clDice和Topological Loss)也越来越受欢迎,因为它们能更好地捕捉到细小或分支血管中的结构连续性,这些连续性对临床解读至关重要。总体而言,虽然公共代码、共享的基准存储库和改进的报告实践变得越来越普遍,但在可用性、文档记录和预处理协议方面的不一致性仍然是一个重要障碍。更广泛地采用开源实现、统一的基准测试框架和详细的实验指南对于提高可重复性、实现公平比较以及将RVS方法可靠地转化为临床应用至关重要。

11.6 RVS中的新兴趋势和方法论进展
近期工作的综合揭示了以下一致且值得注意的趋势:
- 在20个评估指标中,准确性、敏感性、特异性和AUC-ROC在RVS研究中报告最为频繁。然而,由于血管分割任务中存在的严重类别不平衡,这些指标往往提供不完整的评估。相比之下,如Dice系数、Jaccard指数(IoU)和对象级指标(例如mean Average Precision (mAP)@0.5、边界F1分数)等像素级指标能更真实地反映分割质量。
- 非神经方法通常无法在分割准确性、鲁棒性和跨数据集的泛化能力方面超越基于深度学习的方法。
- 最近的深度神经网络(DNN)越来越多地结合了注意力机制、图卷积网络(GCNs)和多尺度特征聚合,以改进细小血管结构的描绘。
- DRIVE、STARE和CHASE_DB1数据集仍然是RVS研究中最广泛采用的基准,它们在算法性能的一致评估和比较中发挥着重要作用。
- 为了减少对像素级注释的依赖,最近的RVS研究开始探索半监督和弱监督学习技术。这些方法利用未标记或标记不充分的数据(如图像级标签或手写注释)来更高效地训练模型。虽然与完全监督的方法相比仍尚处于探索阶段,但它们为减少注释负担和提高泛化能力提供了有前途的途径,特别是在资源有限的临床环境中。
- 尽管技术有所进步,包括混合架构和领域适应策略,模型可解释性、临床信任度和监管准备度等持久性挑战仍然是实际应用的重要障碍。

11.7 持久性挑战和未解决的问题
尽管深度学习彻底改变了视网膜血管分割,但仍存在几个持续存在的挑战:
- 模型在广泛使用的公共数据集上训练后,在未见过的临床数据上的表现往往不佳。原因包括:
- 规模有限:大多数基准数据集(DRIVE、STARE、CHASE_DB1)包含的图像数量很少,限制了模型对自然变异性的接触。
- 人口统计分布狭窄:许多数据集偏向于西方人群、特定年龄组或医院内部群体,限制了其对其它种族或地理区域的适用性。
- 实验室中的高准确率可能在临床应用中无法转化为实际效果:在基准指标上的高性能(例如95%-98%的准确率)可能在应用于具有不同视网膜色素沉着或病理的新人群时下降。
- 新数据集(例如RetinaMix)和指标(如Retinal Pigment Score (RPS))试图捕捉更具有生物学代表性的变异性,但其采用仍然有限。
- 数据分割和指标的敏感性:数据分割、预处理、视野选择和指标计算的差异可能会夸大或掩盖报告的性能,并使跨研究的比较复杂化。
- 高质量注释的稀缺:专家注释的数据集制作成本高昂且耗时,限制了监督学习的潜力。
- 注释的质量和一致性:真实注释的质量和一致性在不同数据集中可能有所不同,尤其是在私有或较少整理的集合中。在某些情况下,注释可能过分强调较粗的血管而忽视了细小毛细血管,这可能导致使用U-Net等标准架构评估时性能虚高。这种变异性可能偏袒模型评估,并阻碍跨研究的公平比较,尽管根据预期的临床应用,这种注释特性可能是适当的。
- 在极端血管丢失、新生血管形成或出血掩盖的情况下,分割会失败。
- 计算负荷:基于GCN和Transformer的架构需要大量的内存和推理时间,限制了它们在边缘设备或移动筛查单元上的应用。尽管有这些具体挑战,但更广泛的问题继续阻碍临床应用。

11.8 未来方向和研究机会
为了克服这些障碍,预计以下几个关键方向将塑造下一代视网膜血管分割研究:
- 领域适应和泛化:如无监督领域适应、自我监督预训练和联邦学习等技术可能有助于弥合整理数据集与实际临床数据之间的差距。急需能够在不同人群、成像协议、设备和实验设置或指标计算变化中通用的模型。
- 弱监督和半监督学习:通过使用图像级标签、伪标记或利用部分标记的数据来减少对像素级注释的依赖,可以使得在大型未标记数据集上的训练更加民主化,这对于服务不足的人群尤为重要。
- 多模态整合:结合眼底图像与OCT、OCTA或临床元数据可能提供更丰富的特征表示,有助于在复杂的病理情况下进行血管分割和分类。
- 轻量级和实时模型:设计计算开销低的高效模型将使其能够在移动筛查单元、资源匮乏的环境和即时诊断中得到应用。
- 基于图的后期处理,以保留血管拓扑:除了像素级准确性之外,未来的方法应包括拓扑正确性,确保血管网络的连续性、连通性和解剖学合理性。
- 联合分割和高保真动脉/静脉(A/V)分类:改进当前的多任务学习模型,以实现临床级别的准确性和同时识别动脉/静脉的拓扑一致性。重点在于稳健地解决难点问题,如交叉点歧义、细小血管分类以及整合自动化流程以实现特定于血管的(A/V)形态测量量化。
- 发展先进的定制损失函数:专注于设计专门的损失函数(如Dice、Focal、Tversky或混合损失),以直接对抗类别不平衡,并结合显式的几何或拓扑惩罚,以提高细小血管的完整性和准确划分。
- 视网膜生物标志物用于系统性和神经血管健康:未来的RVS研究应利用精确的视网膜血管分割和定量血管参数作为非侵入性的替代指标或生物标志物,以支持系统性和神经血管状况的早期风险评估,包括心血管风险、认知衰退、糖尿病患者的脑小血管疾病等。由于视网膜、大脑和肾脏在糖尿病和高血压等疾病中的微血管病理生理学部分共享,自动化分析视网膜图像为机会性筛查提供了实际途径。然而,这些视网膜血管特征应严格被视为辅助性生物标志物,而不是独立的诊断或主要筛查工具。要实现它们的更广泛临床潜力,需要在不同人群(包括年龄、种族和共病情况)中进行严格的前瞻性验证,与多模态临床数据集成,并在决策支持流程中明确其替代地位。
- 可解释和可信的AI:结合可解释AI(XAI)技术可以提高模型的可解释性和临床信任度,特别是在高风险的诊断应用中。这些新兴方向强调了RVS方法不仅需要准确,还需要具有泛化能力、高效性和临床可信度。弥合算法性能与实际应用之间的差距对于将这些模型成功转化为临床实践至关重要。

11.9 实际应用和临床整合
将视网膜血管分割方法应用于临床实践面临的技术性能之外的多重障碍。以下总结了关键因素:
- 批准考虑:从国家或地区监管机构获得许可是临床应用的先决条件。具体要求因地区而异,但大多数框架根据风险水平和自主程度对RVS和诊断AI进行分类。两个主要的例子包括:
- 美国食品药品监督管理局(FDA):基于AI的诊断系统通常被归类为II类(特殊控制)医疗设备。虽然它们属于一般眼科设备法规(联邦法规第21章,第886部分)的管辖范围,但大多数用于DR筛查的自主平台具体在21 CFR 886.1100下注册。主要通过510(k)上市前通知途径建立高级合规性,要求提供临床证据,证明软件的性能符合既定基准。
- 欧盟医疗器械法规(EU MDR 2017/745):根据医疗器械法规,大多数诊断AI工具(包括RetinaLyze和RetCAD)已被升级为IIa类(或更高级别)。这需要由认证机构对技术文件进行严格评估,从简单的“I类”旧规则转向更高的安全标准。除了这些例子,每个国家都有自己特定的规则和质量标准,使得全球商业化成为一个复杂的多阶段过程。监管批准需要广泛的验证,包括前瞻性试验、风险评估和质量管理合规性。机构验证和对数据隐私法规(如通用数据保护条例(GDPR)和健康保险便携性和责任法案(HIPAA)的遵守是强制性的,进一步增加了时间和程序步骤。
- 技术集成挑战:与医院系统(如图片存档和通信系统(PACS)或电子健康记录(EHR)的连接需要标准化通信协议(如DICOM、HL7)、安全的数据传输和设备兼容性。实时或接近实时的处理对于筛查或术中使用至关重要。然而,像Transformer或Graph Convolutional Networks(GCNs)这样的模型的高计算需求通常需要基于云的分析或专门的边缘硬件,引入了延迟或额外的基础设施成本。
- 量化和开源差距:研究代码与临床应用之间的脱节是一个重要的部署障碍。虽然许多RVS模型在GitHub等平台上是开源的,但这些实现几乎仅限于分割任务(生成二值掩码)。自动化下游量化(临床指标)的端到端存储库非常稀缺,例如计算血管宽度、迂曲度或动脉-静脉比率(AVR)。在没有这些集成分析工具的情况下,从分段输出过渡到临床诊断报告仍然是一个手动且技术要求较高的障碍,对医疗保健提供者来说是一个挑战。

11.9.4 临床医生的信任和工作流程兼容性
输出结果必须是可操作的和可解释的(例如,热图或置信度分数),以确保临床医生在高风险决策中能够接受这些结果。为了避免额外的审查时间或工作流程中断,必须将其无缝集成到日常工作中。需要明确区分两种主要的部署模式:
- **计算机辅助检测(CADe)**:这些系统突出显示特征以辅助临床医生进行审查。
- **计算机辅助诊断(CADx)**:这些系统能够自主做出诊断决策,由于减少了人为监督,因此需要更高的监管审查。

11.9.5 已部署工具的例子
- **RetinaLyze (RetinaLyze System A/S)**:具有CE标志(实际应用中通常是Class I或Class IIa)。它可以快速分析糖尿病视网膜病变(DR)、年龄相关性黄斑变性(AMD)和青光眼的迹象(通常在1分钟内)。由于需要临床医生进行审核,因此限制了其自主使用,并增加了成本。
- **RetCAD (Thirona Retina B.V.)**:具有CE Class IIa标志(2022年)。它支持对DR、AMD和青光眼严重程度的分级。尽管正在进行持续的有效性和集成工作,但已经证明了其可靠的性能。
- 其他FDA批准的自主糖尿病视网膜病变(DR)筛查系统:如LumineticsCore(前身为IDx-DR)、EyeArt(Eyenuk)和AEYE-DS(AEYE Health)等系统已经获得了各种批准(例如,2018-2024年),用于DR的检测。这些平台具有高度的可扩展性,但面临系统性的限制,如可变的经济补偿结构和显著的初始资本投资,以及在视网膜色素沉着不同的群体中的性能下降问题。

11.9.6 更广泛采用的途径
为了促进全球采用,开发者必须提高可解释性和透明度,以增强临床医生的信任。此外,为PACS和EHR系统开发标准化的集成协议是必不可少的。需要进行成本效益研究以支持经济补偿,并让临床医生参与设计阶段,以确保工作流程的协调。

11.10 展望和转化考虑
视网膜血管分割技术已经从启发式流程发展到在受控条件下能与专家表现相媲美的深度学习架构。将这些模型引入临床实践需要将重点从原始准确性转移到鲁棒性、算法公平性和可解释性上。成功部署涉及应对监管合规性、确保PACS/EHR的无缝集成,并通过透明的工作流程保持临床医生的信任。减轻在不同人群中的性能下降对于实现公平的医疗保健至关重要。通过促进计算机科学家、临床医生和监管利益相关者之间的跨学科合作,下一代RVS模型可以超越实验室基准,成为可靠的、可扩展的实用诊断支持工具。

12 结论
在过去的四十年中,视网膜血管分割技术经历了显著的变革,从传统的基于规则的技术发展到利用卷积神经网络、基于图的模型和Transformer架构的复杂深度学习框架。这项对1982年至2025年间的428项研究的全面回顾追踪了这一演变过程,提供了一个统一的分类体系,将方法分为无监督和有监督的方法,并重点关注它们的临床适用性。在DRIVE、STARE、CHASE_DB1和HRF等基准数据集上的定量分析表明,现代深度学习模型(特别是U-Net变体和基于Transformer的架构)在捕捉视网膜血管的复杂拓扑方面具有卓越的准确性、灵敏度和鲁棒性。然而,仍然存在一些持续的挑战,如在不同成像条件下的泛化能力有限、人口统计学和色素沉着的偏见、注释数据的稀缺性以及对临床可解释输出的需求,这凸显了技术进步与实际应用之间的差距。通过提出未来的研究方向,包括领域适应、偏见感知训练、半监督和弱监督学习,以及为资源有限的环境量身定制的轻量级模型,本文为RVS的有效整合到常规临床工作流程中指明了路径。最终,RVS方法的持续改进具有巨大的潜力,可以增强计算机辅助诊断,提高眼部和系统性疾病的早期检测能力,并通过精确的血管分析推进个性化医疗。

作者贡献
Avinash Bansal负责概念化、方法论、数据整理和初稿准备。Jan Kubí?ek参与项目管理、数据整理、撰写、审稿和编辑手稿。Jana Bahrová参与审稿和编辑工作。Martin Augustynek、Marek Penhaker和Juraj Timkovi?也参与了手稿的审稿和编辑。

本文得到了欧盟LERCO项目(项目编号CZ.10.03.01/00/22_003/0000003)的财政支持,该项目属于“Just Transition”运营计划的一部分。工作成果还得到了SP2025/032“Biomedical Engineering Systems XXI”项目的支持。

利益冲突
作者声明没有利益冲突。

生成式AI声明
作者使用了语言辅助工具(特别是Grammarly)来提高手稿的清晰度和表达效果。所有材料都经过了作者的彻底审查和修改。作者对最终发布的作品内容负全责。

伦理声明
本文是一篇综述性文章,不涉及从人类或动物受试者那里收集的新数据。因此,不需要伦理批准。

附录A:RVS方法和性能表格
该附录汇总了详细的参考表格(见表A1–A11),这些表格支持和扩展了正文中讨论的发现。这些表格提供了关于RVS分割的先前研究努力、方法分类、性能指标和评估结果的系统化概述。
- 表A1总结了先前综述论文中的关键亮点,展示了分割方法随时间的发展历程。
- 表A2–A6按时间顺序展示了主要的视网膜血管分割(RVS)方法,包括无监督、有监督和基于深度学习的方法,突出了技术的发展历程。
- 表A2:无监督方法。该表列出了1989年至2020年的经典无监督RVS技术,涵盖了匹配滤波、形态学变换、小波分析、多尺度线检测器和阈值方案等多种方法。这些方法在没有任何标记数据的情况下运行,依赖于手工制作的特征和图像增强技术。
- 表A3:通常被称为无监督的带有监督组件的技术。该表强调了那些虽然在文献中常被描述为无监督的方法,但实际上包含了监督组件(如标记数据、训练好的分类器或混合流程)。这有助于澄清方法学分类,并增进对无监督和有监督方法之间界限的理解。
- 表A4:经典的有监督方法(非神经网络)。该表包括了深度学习时代之前的早期有监督方法。这些方法通常使用手工设计的特征(如纹理、血管性、强度轮廓)和常规分类器(如SVM、k-NN或决策树)。特征提取和分类器训练明确依赖于注释数据集的指导。
- 表A5:基于深度学习的有监督方法(CNN和基本U-Net)。该表总结了使用卷积神经网络(CNN)、早期U-Net模型和混合框架的视网膜血管分割方法。这些方法主要侧重于使用编码器-解码器或基于补丁的架构来捕获血管结构,而没有结合注意力机制、对抗性学习或基于图的推理等高级架构改进。
- 表A6:先进的基于深度学习的有监督方法。该表介绍了最近和复杂的深度学习方法,包括改进的U-Net变体(如注意力U-Net、密集U-Net、残差U-Net),以及结合了生成对抗网络(GANs)、图卷积网络(GCNs)和基于Transformer的模块的架构。这些方法旨在提高RVS任务中的上下文理解、边界划分和泛化能力。

表A7定义了RVS分割研究中常用的20个评估指标(M1–M20),如准确性、精确度、IoU、Dice、AUC-ROC和SSIM。值得注意的是,虽然F1分数和Dice系数在标准二分类中数学上等效,但在这篇综述中都保留了它们,以确保与原始研究的一致性。由于许多作者没有明确提供计算公式,特别是在像动脉-静脉(A/V)分割这样的复杂任务中,“Soft Dice”或“Macro-F1”可能会被使用,报告这两个指标可以防止信息丢失,并允许不同研究社区(如机器学习与医学成像)之间进行直接、透明的比较。
- 表A8–A11分别报告了基于非神经网络的有监督方法在标准数据集(DRIVE、STARE、CHASE_DB1和HRF)上的性能,使用了上述指标。
- 表A12–A15展示了基于深度学习的有监督方法在同一数据集上的类似性能结果,使得可以直观比较经典方法和深度学习技术。这些表格共同提供了该领域的全面和比较性的全景,对于希望了解当前RVS分割方法的进展、优势和局限性的研究人员来说是一个宝贵的资源。

关于数据表示的说明
- 表A12–A15中的一些参考文献出现了多次,反映了同一研究中的不同变体或实验配置,例如在架构设置、分类器、预处理技术或融合方法方面的差异。
- 这些变体被分别列出,以便在不同实验条件下进行全面和公平的比较。例如:
- 参考文献[10]在表A8中出现了三次,代表了:(i)基础线检测器,(ii)结合线性支持向量机(SVM)的线检测器,以及(iii)结合最小均方误差(LMSE)分类器的线检测器,后者使用迭代误差最小化进行参数估计。
- 参考文献[72]出现了三次,代表了三种融合策略:(i)使用最优区域选择融合(ORSF)的加权平均,这是一种基于局部质量指标选择特定区域分割候选者的方法;(ii)使用模糊C-Means(FCM)的加权平均;(iii)基于中值的排名融合方法。在所有这些情况下,重复条目的顺序遵循原始文章中呈现的顺序,并在表格中保持一致性和可追溯性。
- 为了保持一致性,最初以百分比格式报告的性能值被转换为0–1的尺度。所有值,无论是转换后的还是已经是小数格式的,都四舍五入到小数点后三位。例如[102]中报告的指标被相应地进行了标准化。

表A8–A15中使用的性能指标标记为M1至M20。它们的定义和公式在表23中提供。在每个表格中,每个指标的最有利值都以粗体显示,仅从有效(非缺失)条目中选择:对于大多数指标,更高的值表示更好的性能。然而,对于M15(假发现率)和M16(假阳性率),较低的值更受青睐,因此最低值也被加粗显示。这种区分也反映在列标题中。
- 在这些表格中,“非NN”指的是非神经网络方法,包括经典的机器学习和基于特征工程的分割技术。

本节总结了基于非神经网络的RVS方法在标准基准数据集上的顶级表现,基于表A8–A11的结果。
- 在DRIVE数据集(见表A8)中,Hassan等人[75]取得了最佳的总体性能,准确率(M1)= 0.979,特异性(M4)= 0.988,AUC-ROC(M7)= 0.982。这些指标反映了精确度、召回率和区分能力的良好平衡。Badsha等人[53]记录了最高的精确度(M2)= 0.980和灵敏度(M3)= 0.990,有利于真实血管的检测。同时,Moghimirad等人[24]实现了最低的假发现率(M15)= 0.006,表明了出色的误分类控制。
- 在STARE数据集(见表A9)中,Cheng等人[100]展现了最一致的总体性能,准确率(M1)= 0.963,灵敏度(M3)= 0.781,特异性(M4)= 0.984,AUC-ROC(M7)= 0.984。相比之下,Wang等人[102]实现了最高的特异性(M4)= 0.989,F1分数(M5)= 0.813和Kappa值(M11)= 0.799,而Meng等人[67]报告了最佳的精确度(M2)= 0.825和阴性预测值(M17)= 0.970,各自在特定指标上表现出色。
- 在CHASE_DB1数据集(见表A10)中,Wang等人[102]再次以最佳准确率(M1)= 0.960,特异性(M4)= 0.979和F1分数(M5)= 0.781以及Kappa值(M11)= 0.759领先。Fraz等人[28]记录了最高的精确度(M2)= 0.773和最低的错误率、假发现率(M15)= 0.227以及假阳性率(M16)= 0.023,展示了减少假阴性和分割错误。
- 在HRF数据集(见表A11)中,Budai等人[26]报告了最佳的整体分割质量,准确率(M1)= 0.961和灵敏度(M3)= 0.985。Orlando等人[95]在精确度(M2)= 0.663,F1分数(M5)= 0.716,Kappa值(M11)= 0.690和SSIM(M13)= 0.869方面取得了强劲的结果,表明了良好的血管重叠和评分者间的一致性。总的来说,非神经方法在各个数据集上表现良好,在精确度和灵敏度等特定指标上表现出色。尽管这些传统方法有效,但深度学习模型在鲁棒性和精确度方面越来越具有优势。下一节将回顾基于DNN的主要方法及其在视网膜血管分割领域的进展。基于DNN的监督方法性能总结

本节根据表A12–A15中的结果,总结了在标准基准数据集上表现最佳的基于神经网络的RVS(Retinal Vasculature Segmentation)分割方法。

• DRIVE数据集(见表A12):在评估的基于DNN的方法中,Jebaseeli等人[144]取得了最高的准确率(M1)= 0.990和特异性(M4)= 0.998,显示出了出色的整体分类和真正例检测能力,同时具备较高的敏感性(M3)= 0.803。Guo等人[124]获得了最高的精确度(M2)= 0.925,以及稳健的敏感性(M3)= 0.899和F1分数(M5)= 0.907,反映了强大的正向预测能力和平衡的性能。Guo等人[123]记录了最高的敏感性(M3)= 0.986,以及有竞争力的AUC-ROC(M7)= 0.974和Dice系数(M9)= 0.761,在真正例检测和分割重叠方面表现出色。Li等人[207]在AUC-ROC(M7)= 0.990方面处于领先地位,同时具有高准确率(M1)= 0.977和敏感性(M3)= 0.815,展现了优秀的辨别和分类能力。Kaur等人[118]实现了最低的假发现率(M15)= 0.013,这得益于高特异性(M4)= 0.987和敏感性(M3)= 0.872,表明有效控制了错误的分类。

• STARE数据集(见表A13):在评估的基于DNN的方法中,Jebaseeli等人[144]同样取得了最高的准确率(M1)= 0.997和特异性(M4)= 0.997,显示出了出色的整体分类和真正例检测能力,同时具备较高的敏感性(M3)= 0.806。Shin等人[155]获得了最高的精确度(M2)= 0.920,以及稳健的F1分数(M5)= 0.837,反映了强大的正向预测能力和平衡的性能。Guo等人[123]记录了最高的敏感性(M3)= 0.986,以及有竞争力的AUC-ROC(M7)= 0.954和Dice系数(M9)= 0.650,在真正例检测和分割重叠方面表现出色。Wang等人[202]在AUC-ROC(M7)= 0.996方面处于领先地位,同时具有高准确率(M1)= 0.985和F1分数(M5)= 0.918,展现了优秀的辨别和分类能力。Kaur等人[118]实现了最低的假发现率(M15)= 0.027,这得益于高敏感性(M3)= 0.831和特异性(M4)= 0.973,表明有效控制了错误的分类。

• CHASE_DB1数据集(见表A14):在评估的基于DNN的方法中,Liskowski等人[112]获得了最高的准确率(M1)= 0.985,这得益于较高的敏感性(M3)= 0.879和Kappa分数(M11)= 0.787,显示出了出色的整体分类和一致性。Wu等人[204]获得了最高的精确度(M2)= 0.880,以及高AUC-ROC(M7)= 0.989和F1分数(M5)= 0.837,反映了强大的正向预测能力和平衡的性能。Mishra等人[171]获得了最高的敏感性(M3)= 0.880,以及有竞争力的AUC-ROC(M7)= 0.976和准确率(M1)= 0.960,在真正例检测方面表现出色。Zhang等人[132]实现了最高的特异性(M4)= 0.991,这得益于高AUC-ROC(M7)= 0.990和准确率(M1)= 0.977,表明了卓越的真正例检测和分类能力。Noh等人[153]在AUC-ROC(M7)= 0.992方面处于领先地位,同时具有高准确率(M1)= 0.978和敏感性(M3)= 0.852,展现了优秀的辨别能力。

• HRF数据集(见表A15):在评估的基于DNN的方法中,Jebaseeli等人[144]取得了最高的准确率(M1)= 0.990和特异性(M4)= 0.997,显示出了出色的整体分类和真正例检测能力,同时具备较高的敏感性(M3)= 0.808。尽管没有方法报告精确度(M2),因此无法评估正向预测性能。Kaur等人[118]记录了最高的敏感性(M3)= 0.875,以及较低的假发现率(M15)= 0.018和特异性(M4)= 0.982,在真正例检测和控制错误分类方面表现出色。Wu等人[186]在AUC-ROC(M7)= 0.987方面处于领先地位,这得益于高准确率(M1)= 0.971和敏感性(M3)= 0.826,展现了优秀的辨别和分类能力。Kaur等人[118]还实现了最低的假发现率(M15)= 0.018,这得益于他们的高敏感性(M3)= 0.875和特异性(M4)= 0.982,表明了对错误分类的稳健控制。基于这些数据集的性能分析,Jebaseeli等人[144]在基于DNN的视网膜血管分割方面展示了卓越的有效性,在DRIVE、STARE和HRF数据集上实现了最高的准确率(M1)= 0.990–0.997和特异性(M4)= 0.994–0.998,同时具备较高的敏感性(M3)= 0.803–0.826。他们在整体分类和真正例检测方面的一致性表现突出,证明了他们在多个数据集上的稳健性。在CHASE_DB1数据集上,由于Jebaseeli等人没有报告结果,Liskowski等人[112]以最高的准确率(M1)= 0.985和较高的敏感性(M3)= 0.879处于领先地位,而Wu等人[204]在精确度(M2)= 0.880和AUC-ROC(M7)= 0.989方面表现优异,突显了他们在正向预测能力和辨别能力方面的竞争力。附录B:用于RVS的U-Net变体和高级模型

本附录展示了基于U-Net模型的代表性架构图(见第5.2.2节)以及其他用于RVS的高级模型(见第5节的相关小节)。这些图表展示了用于提高血管分割准确性和稳健性的结构创新,具体包括网络深度、跳跃连接机制、注意力整合、多尺度特征提取和递归细化策略的差异。虽然大多数模型都是U-Net框架的直接衍生版本,但有些模型结合了混合或替代的架构设计,如特定领域的模块、光谱特征编码器或递归细化组件,超越了传统的编码器-解码器范式。这些架构图突出了基于U-Net的高级RVS模型的关键技术创新。常见的改进包括用于改善梯度流的残差连接、用于捕捉不同尺度血管的多尺度和孔径卷积,以及用于增强特征表示的密集特征融合。注意力机制有选择地强调相关血管结构,而递归或迭代模块逐步细化分割输出。此外,一些模型结合了混合或特定领域的组件,超越了传统的编码器-解码器设计,有效处理视网膜血管的复杂形态和微妙对比度变化。在这些模型中,IterNet[195]、CRA-UNet[211]和M2U-Net[147]因在精细血管结构 delineation 方面的出色表现而广受认可。最近的架构如Res2UNet[215]、TCU-Net[191]和MTPA U-Net[212]通过引入增强的多尺度特征提取、注意力机制和基于变压器的模块,进一步提升了分割准确性和稳健性。总体而言,这些架构创新显著提高了准确分割薄且对比度低的视网膜血管的能力,这些血管一直是自动分析的挑战性目标。

图中A1–A4的架构图遵循了一致的视觉规范,以便于在不同RVS模型之间进行比较分析。每个垂直或水平的颜色编码块表示特定的网络层或功能组件,如卷积层、池化或下采样操作、上采样或解码器模块以及注意力或特征融合机制。箭头指示架构内的数据流动方向;虚线箭头通常代表跳跃连接,而粗箭头表示标准的前向传播路径。附录中的图表由作者创建,并基于引用的工作进行了重新绘制。在适用的情况下,保留了原始设计的架构语义,并进行了少量调整,包括协调颜色方案和优化布局,以提高视觉清晰度。有关完整的架构规范和设计理由,建议读者参考原始参考文献。

这里展示的架构图对应于表A5和A6中选定的方法子集,这些表格提供了详细的架构规格、预处理步骤、损失函数和后处理策略;这些方法被选中是为了代表视网膜血管分割方法的多样性。每个表格条目概述了关键的设计选择,包括输入转换、主干架构、新颖模块(例如残差单元、注意力门)以及在监督方法中使用的优化标准。附录中的架构图通过提供所列方法的结构视角,对这些表格描述进行了视觉补充。

图A1展示了代表性的基于U-Net的RVS模型架构图。展示了CRA-UNet[211]、DRPAN[159]、DDNet[198]、DU-Net[146]、HybridNet[137]和IterNet[195],每种模型都包含了不同的结构修改,以增强视网膜血管分割性能。更多详细信息,请参考引用的作品。

图A2展示了用于RVS的高级模型的代表性架构设计,主要是U-Net变体。特色模型包括带有孔径结构的U-Net[210]、M2U-Net[147]、MPCN-Net[201]、MResU-Net[149]、MSCS[200]和MTPA[212],它们都基于U-Net架构。此外,MSCNN-AM[193]虽然采用了U形设计,但采用了结合多尺度孔径卷积和注意力机制的独特架构。这些模型结合了特定领域的增强措施,如残差连接、多路径特征融合和注意力模块,以改进血管 delineation。更多详细信息,请参考引用的作品。

图A3展示了最近基于U-Net或密切相关的RVS模型的代表性架构图。展示的网络包括NFN+[204]、PixelBNN[148]、RCED-Net[194]、Res2UNet[215]、S-UNet[142]、SCS-Net[186]、SETUNet[216]、Sine-Net[181]和TCU-Net[191]。这些模型结合了多样的增强措施,如残差编码、光谱特征、自注意力模块和正弦激活函数,以更好地捕捉视网膜图像中的血管模式。更多详细信息,请参考引用的作品。

图A4展示了用于RVS的两种最新模型的架构图:SID2Net[179]引入了大小不变的双域学习,而VSSC-Net[185]结合了空间-光谱上下文来增强血管定位。这两种设计旨在在不同照明和血管宽度条件下提高分割准确性。更多详细信息,请参考引用的作品。

附录C详细介绍了本综述中使用的文献搜索策略和研究选择过程,遵循PRISMA指南以确保透明度和可重复性。数据库和搜索策略

进行了结构化且系统的文献搜索,涵盖了四个广泛使用和权威的数据库:

Scopus
Web of Science
IEEE Xplore
PubMed

搜索策略使用了反映本综述范围的明确定义的关键词组合。使用布尔运算符和截断来最大化覆盖范围和相关性。使用了以下关键词集和组合:

• 视网膜血管分割
• 眼底血管分割
• 视网膜血管结构分割
• 视网膜图像分析
• 深度学习视网膜分割
• 综述视网膜血管分割
• 中央视网膜血管分割

这些关键词通过AND、OR和通配符(例如,retinal* vessel* segment*)等运算符组合使用。尽管在搜索过程中没有语言限制,但只包括了英文研究。

本综述采用了与PRISMA指南一致的结构化三阶段筛选过程。从四个主要数据库中识别出3,782篇文章,通过连续的筛选阶段移除了重复项和不相关的研究。详细的研究选择过程如图A5所示。

PRISMA流程图展示了视网膜血管分割综合综述的研究选择过程。

入选和排除标准

本综述选中的研究遵循了预定义的纳入和排除标准,以确保在处理视网膜血管分割时的相关性和方法论严谨性。

纳入标准:
- 提出或评估视网膜血管分割方法的原创研究或综述
- 涉及2D眼底摄影或三维视网膜成像技术(如光学相干断层扫描(OCT)和光学相干断层扫描血管造影(OCTA)的研究,这些技术通过提供详细的结构和血管信息,极大地推动了视网膜血管分割的发展
- 提供分割性能定性或定量评估的文章
- 被纳入选定数据库的同行评审期刊或会议出版物

排除标准:
- 非视网膜分割(例如,冠状动脉、肺血管、脑血管)
- 缺乏方法学细节的研究
- 重复项、论文、海报或非同行评审的内容
- 非英文文章

表A1. 以往综述论文的亮点。参考文献
年份
突点
Fraz等人[1]
2012年
审查了基于神经网络和非神经网络的论文
审查了1982–2010年间发表的69篇论文
报告了四种指标的分割性能:敏感性、特异性、准确率和ROC曲线下面积
1. 模式分类和机器学习
(a) 监督方法 [12篇论文 [9, 10, 15, 88, 91, 99, 104, 218, 252-255]
(b) 无监督方法 [6篇论文 [45, 47, 256-259]]匹配滤波 [11篇论文 [7, 8, 13, 34, 49, 260-265]]

3. 形态学处理 [7篇论文 [20, 32, 35, 36, 42, 50, 266]]

4. 血管追踪/跟踪 [7篇论文 [40, 44, 267-271]]

5. 多尺度方法 [9篇论文 [31, 37-39, 41, 48, 90, 272, 273]]

6. 基于模型的方法 [12篇论文]

(a) 血管轮廓模型 [7篇论文 [44, 46, 274-279]]

(b) 可变形模型 [5篇论文]

7. 基于并行硬件的方法 [5篇论文 [43, 285-288]]

Almotiri等人 [2],2018年:回顾了基于神经网络和非神经网络的论文。回顾了1989年至2017年发表的48篇论文。RVS算法被分为两个主要类别,并进一步细分。

1. 基于规则的方法
(a) 基于核的技术 [12篇论文 [7, 47, 57, 262, 265, 289-295]]

(b) 血管跟踪/追踪技术 [8篇论文 [37, 269, 296-301]]

(c) 多尺度技术 [4篇论文 [302-305]]

(d) 基于数学形态学的技术 [3篇论文 [76, 306, 307]]

(e) 基于可变形模型的技术
(i) 参数化可变形模型 [2篇论文 [69, 308]]

(ii) 几何可变形模型 [2篇论文 [309, 310]]

(f) 自适应局部阈值技术
(i) 统计自适应阈值技术
(ii) 基于知识的自适应阈值技术
(iii) 基于模糊集的自适应阈值技术

2. 基于机器学习的方法 [14篇论文]

(a) K最近邻(KNN)

3. 基于可变形模型的方法
(a) 基于边缘的方法

4. 基于跟踪的方法

5. Chen等人 [30],2021年:仅回顾了基于神经网络的论文。回顾了2016年至2021年发表的88篇论文。RVS算法被分为六个主要类别。

6. Khandouzi等人 [4],2022年:回顾了基于神经网络和非神经网络的论文。回顾了2016年至2022年发表的56篇论文。RVS算法被分为两个类别。

7. Kumar等人 [5],2023年:回顾了2000年至2021年发表的118篇论文。RVS算法被分为八个类别。

8. Qin等人 [6],2024年:回顾了1989年至2022年发表的52篇论文。RVS算法被分为两个主要类别,并进一步细分。坎德等人[45]
2010年
利用红色成分的直方图修改绿色成分的直方图;使用高斯形状曲线近似灰度剖面;匹配滤波器核与原始图像进行卷积以增强血管;空间加权模糊C均值算法通过考虑灰度的空间分布进行阈值处理以保持空间结构;连通组件标记法去除错误分类的像素;扩展模糊隶属函数以考虑相邻像素对中心像素的影响;去模糊化将模糊划分矩阵转换为清晰划分。

林等人[46]
2010年
提出一种可微凹度度量方法,用于在存在亮病变的情况下稳健地检测视网膜血管;感知变换法模拟人类在视网膜图像分析中的感知方式;梯度算子用于估计变化率;凹度检测算法以多尺度方式计算二阶梯度导数;线形凹度度量法区分暗病变和血管;局部归一化凹度度量法抑制噪声影响。

维拉洛博斯-卡斯塔尔迪等人[47]
2010年
选择绿色通道以提取绿色信息;生成掩膜标记属于眼底感兴趣区域(ROI)的像素;匹配滤波器检测血管的分段线性部分;计算共生矩阵;二熵阈值分割。

弗拉霍斯等人[48]
2010年
对亮度进行局部归一化以补偿亮度和对比度的变化;提取最合适的像素作为血管候选者;映射量化法分离噪声线条;中值滤波法重建多个血管线条的连接;形态学方向滤波法去除剩余的异常点;形态学重建法消除如小斑点等错误区域;仅保留类似血管的结构。

阿明等人[49]
2011年
使用对数-Gabor小波获取信号的局部频率和相位信息;傅里叶变换计算相位一致性;正交滤波器对信号及其希尔伯特变换进行近似。

科塞等人[14]
2011年
采用圆形采样方法对每个像素进行采样;种子填充算法确定碎片化的像素数量;尺度无关识别、旋转无关识别、平移无关识别;统计方法提取健康背景图像。

米里等人[50]
2011年
使用Otsu阈值算法检测眼底区域;形态学闭运算消除小对象;快速离散小波变换(FDCT)修改小波系数以增强图像边缘;背景减除法去除不均匀的背景光照;开运算算子估计背景;多结构元素形态学检测边缘;通过重建的形态学算子去除虚假边缘;连通组件分析(CCA);长度滤波法去除不属于血管树的像素。

佩雷斯-罗维拉等人[51]
2011年
使用二维可定向滤波器增强类似管状的结构并检测灰度图像上的纹理或边缘;对高响应区域进行惩罚以减少噪声部分的误报;高斯窗滤波器平滑响应图像;自动全局阈值算法对惩罚后的响应进行二值化。

阿克拉姆等人[16]
2012年
使用二维Gabor小波增强血管图案和细小血管;多层阈值技术进行血管分割;自适应阈值技术提高分割精度并生成二值掩膜。

班克黑德等人[17]
2012年
使用各向同性非采样小波变换(IUWT)进行血管分割;形态学细化算法去除检测到的血管外的像素;最小二乘三次样条进行中心线细化;线性插值生成图像轮廓。

法蒂等人[18]
2012年
使用局部二值模式(LBP)算子提取多尺度特征向量;自适应神经模糊推理系统(ANFIS)估计血管度;顶帽变换后进行全局阈值处理以突出细小血管;基于累积密度函数(CDF)的阈值处理突出粗大血管;适当长度滤波器去除小区域;逻辑OR函数整合细血管和粗血管。

弗拉兹等人[20]
2012年
使用形态学位平面切片法检测血管中心线和生成血管形状及方向图;高斯一阶导数(FoDoG)滤波器通过评估导数符号检测血管中心线;形态学顶帽变换增强血管。

弗拉兹等人[22]
2012年
使用二值掩膜提取感兴趣区域(ROI);方向微分算子提取主要血管的骨架;数学形态学量化眼底图像中的血管;多方向顶帽算子强调特定方向的血管;位平面切片提取信息;迭代区域生长法整合主要骨架和来自血管方向依赖形态学滤波器的图像结果。

李等人[21]
2012年
生成多尺度匹配滤波器的尺度比例以增强血管并抑制噪声;双阈值法区分血管和噪声;各向异性形态学操作连接MPMF分割的断裂血管。

莫吉米尔拉德等人[24]
2012年
使用加权中心线函数提取血管的中心线;特征值之和强化血管的中心响应;骨架化提取血管的骨架。

尹等人[52]
2012年
使用迭代跟踪算法检测血管边缘点;半椭圆动态搜索窗口处理视网膜血管的复杂几何特征;结合贝叶斯方法和最大后验(MAP)概率准则识别局部血管结构并找出边缘点;高斯模型近似血管的截面强度剖面;似然函数计算离散灰度的条件概率;吉布斯公式将配置与能量函数关联以惩罚高能量配置;分割匹配因子(SMF)表征算法性能;高斯白噪声用于测试。

优素福等人[25]
2012年
使用霍夫变换检测视盘;Canny边缘检测器识别视盘候选像素;简化蛇形或可变形模型检测视网膜图像中的轮廓;Sobel算子计算差值;形态学闭运算生成渗出的最终估计值。

巴德沙等人[53]
2013年
使用Kirsch模板增强边缘;灰度转换和平均滤波将RGB图像转换为灰度形式;直方图均衡化;二值化;形态学闭运算关闭Kirsch模板创建的血管内的孔洞或空区域;对象分类去除小对象;形态学腐蚀最小化Kirsch滤波器的副作用(使其使血管显得更粗)。

布代等人[26]
2013年
使用直方图拉伸增加对比度便于算法检测微小变化和区分不同组织;双边滤波平滑强度变化;高斯分辨率层次结构降低分辨率;镜面反射校正修正厚血管中间的明亮镜面反射;迟滞阈值二值化;像素级OR运算生成最终分割图像。

法蒂等人[27]
2013年
调整对比度以减少非均匀照明的影响;区域生长算法减少图像边框的影响;复合连续小波变换(CCWT)增强图像;WaveShrink去噪;基于自适应直方图的阈值处理与长度滤波结合提取视网膜血管(RBVs)。

卡巴等人[54]
2013年
使用偏置校正算法修正视网膜图像的强度不均匀性;匹配滤波器响应增强血管外观;期望最大化(EM)算法从匹配滤波器响应图像中提取血管树;长度滤波器消除所有非血管像素;高斯函数近似血管的强度剖面;高斯混合模型(MLE)。

劳等人[55]
2013年
使用段图建模血管段;约束优化从图中搜索最佳血管树集合;约束优化问题(COP);GraphTracer算法。

阮等人[56]
2013年
使用基本线检测器识别血管像素;多尺度线检测器克服基本线检测器的缺点。

奥德斯特西尔尼克等人[57]
2013年
基于B样条的方法进行照明校正和对比度均衡;二维匹配滤波;Kittler最小误差阈值法;形态学清洗删除面积小于选定值的未连接对象。

王等人[58]
2013年
使用多小波核(MFMK)进行匹配滤波增强血管;多尺度层次分解去除噪声并定位血管;局部自适应阈值生成血管的二值图。

迪兹达罗格卢等人[59]
2014年
基于迹的方法减少噪声;冲击滤波器锐化图像;改进的相位图估计法估计图像结构。

阿佐帕尔迪等人[60]
2015年
使用组合移位滤波器响应(B-COSFIRE)分割血管树;预处理增强血管对比度并平滑视野(FOV)边界;中心差分高斯(DoG)滤波器检测输入图像的强度变化;半波整流抑制负值;模糊运算允许相应点位置的灵活性。

戴等人[61]
2015年
使用2D-Gabor滤波器提取血管的主要结构;灰度投票算法获取更多细小血管信息;GMM分类器对融合结果中的像素进行分类;Cemal Kose和Cevat Ikibas的碎片消除算法去除非血管噪声碎片。

弗拉兹等人[62]
2015年
使用广义多尺度线检测器(MLD)测量每个像素的血管度;基于迟滞阈值的形态学重建进行分割;距离变换计算每个血管像素与其最近非血管像素的欧几里得距离。

哈桑等人[63]
2015年
使用数学形态学平滑图像并去除噪声;K均值聚类算法进行分割。Hassanien等人[64]
2015年
使用gMean计算图像亮度的全局平均值,wMean用于局部调整亮度;人工蜂群(ABC)算法用于最小化簇内模糊紧凑性;模式搜索(PS)算法;等级顺序过滤器用于去除小的连通分量;并填补微小的间隙。

Kar等人[65]
2015年
提取绿色通道信息;利用小波变换将图像分解为多个子带以增强边缘对比度;应用CLAHE算法提高对比度;使用形态学开运算突出视盘并消除小于结构元素(SE)大小的物体;通过对比度拉伸使用伽玛函数增加图像的动态范围;使用二维核的匹配滤波器提取完整的血管结构;采用最大模糊熵算法获得所有模糊参数的最佳组合;连通分量分析(CCA)用于去除孤立的小像素块。

Lazar等人[66]
2015年
使用高斯平滑进行预处理;对不同方向的离散线段上的强度值进行逐像素方向处理;生成一维多尺度对称匹配滤波器响应;一维灰度倒帽响应;方向响应向量图(DRVMs)。

Meng等人[67]
2015年
结合加权改进的圆形Gabor滤波器(ICGF)和多方向多尺度二次导数的高斯滤波器(MMSDG)来增强血管结构并标准化背景分布;使用单一全局阈值粗略分割血管;使用拉伸滤波器去除噪声,保留真实的血管边缘结构,并填充皮质血管中的空洞像素。

Roychowdhury等人[68]
2015年
通过形态学倒帽变换增强对比度;使用全局阈值提取分割后的血管;采用自适应阈值识别血管像素;设置停止准则以终止迭代过程,从而提高血管分割的准确性。

Zhao等人[69]
2015年
使用二维勒贝格测度更准确地检测小振荡(分支)结构;创建血管度量图以提取具有不规则和振荡边缘的血管。

BahadarKhan等人[70]
2016年
使用CLAHE算法获得局部对比度增强的视网膜图像;修改后的形态学倒帽变换用于比较输入图像和开运算后的图像;利用赫斯矩阵和特征值变换获得宽窄血管的增强图像;改进的Otsu方法基于血管结构抑制不需要的噪声和几何物体;采用基于像素/面积的阈值分割方法去除非血管像素。

Christodoulidis等人[71]
2016年
使用双树复小波变换(DT-CWT)滤除噪声;通过多尺度线检测(MSLD)分割血管;采用自适应阈值提取大中型血管;使用多尺度张量投票框架(MTVF)识别和重新连接最小血管;通过基于感知的方法重建小血管。

Oliveira等人[72]
2016年
使用匹配滤波器提取血管;结合Frangi滤波器和Gabor小波滤波器增强血管可见性;使用遗传算法在抑制背景结构的同时增强小血管;采用Otsu算法和模糊C均值进行血管分割;使用可变形模型。

Zhang等人[73]
2016年
进行亮度归一化以实现均匀照明;使用测地线开运算和形态学倒帽变换减少错误检测;对方向得分应用LID滤波器(LID-OS)以增强每个方向层的血管部分;对方向得分应用LAD滤波器(LAD-OS)对局部结构进行对齐;重新缩放和阈值处理以生成二值图像。

Farokhian等人[74]
2017年
使用帝国主义竞争算法(ICA)优化Gabor滤波器参数;通过阈值分割血管。

Hassan等人[75]
针对整个图像计算全局平均值(gMean);使用窗口平均值(wMean)与gMean匹配;采用鲸鱼优化算法确定最佳阈值。

Jiang等人[76]
使用倒帽变换重新分配灰度;通过数学形态学处理去除多余元素;通过强度阈值区分血管和非血管组织;使用一阶导数滤波器突出毛细血管中心线;使用腐蚀算法去噪重叠图像。

Nergiz等人[77]
2017年
使用Frangi血管度量滤波器(FVF)增强血管可见性;使用结构张量(ST)分析低级特征;利用主特征值增强各向异性;使用CLAHE算法提高对比度;通过增强平均曲率乘法减少误报;使用Otsu算法进行血管分割。

Neto等人[78]
2017年
使用高斯滤波减少噪声;使用形态学倒帽算子增强血管可见性;采用局部阈值进行粗略检测;使用累积分布函数(CDF)、灰度共生矩阵(GLCM)、最小主曲率、形态学方向滤波和二值重建进行精细化处理。

Rezaee等人[79]
2017年
使用高斯匹配滤波器和导数高斯滤波器检测血管和边界;基于模糊熵的阈值分割;使用梯形隶属函数处理不同厚度的血管;使用骨架强度图(SSM);采用各向同性扩散算法。

Khan等人[80]
2018年
使用CLAHE和形态学滤波器去除低频伪影;使用高提升滤波器增强粗血管;使用Frangi滤波器增强血管可见性;采用改进的Otsu和迟滞阈值算法进行二值化;使用逐像素AND运算处理最终图像。

Srinidhi等人[81]
2018年
进行预处理以消除光照/对比度的变化;使用K均值聚类进行无监督滤波器学习;进行全局对比度归一化;使用ZCA算法;在多尺度块上进行双三次插值。

Zhao等人[82]
2018年
应用对称滤波器处理不同方向和尺度的图像;使用高斯模糊、位移和组合滤波响应,并结合加权贡献来检测不同大小/方向的血管。

Khawaja等人[83]
2019年
使用SVD、CLAHE和GLM增强对比度;使用PPB斑点去噪器;使用改进的Frangi方法检测血管;使用阈值进行二值化。

Sheng等人[84]
2019年
使用CLAHE和边界生长算法去噪;使用边界生长算法扩展关注范围;使用Gabor小波进行纹理处理;使用Kruskal算法构建MSST;基于MSST的检测器;使用路径开运算避免错误检测。

Saroj等人[85]
2020年
使用主成分分析(PCA)将彩色图像转换为灰度图像;使用CLAHE增强灰度图像;使用基于Frechet概率分布函数的匹配滤波器生成匹配滤波器响应(MFR)图像;使用基于熵的最优阈值生成分割后的血管和背景的二值图像;使用长度滤波和掩蔽处理生成清晰的完整血管树,去除异常值、伪影、误分类和孤立像素。

Zhang等人[86]
2020年
使用基于赫斯的多尺度Frangi滤波器提取血管;使用SVD算法替代耗时的赫斯矩阵特征值分解,加快血管提取速度。

Zhou等人[87]
2020年
使用基本线检测器识别类血管结构并去除大部分背景;使用加权线检测器修正基本线检测器在明亮和宽血管附近的错误响应;通过为不同像素分配不同权重来处理交叉区域和细小血管;使用隐马尔可夫模型(HMM)追踪方法处理线检测器对细小血管的漏检;使用去噪算法去除由视盘和暗病变引起的噪声;使用联合运算获得最终分割结果。

表A3. 常被称为无监督的技术,但实际上包含监督成分的参考文献。

年份
技术

Cheng等人[100]
2014年
使用中风宽度变换(SWT)提取血管宽度特征;使用Weber局部描述符(WLD)解决血管检测中大低对比度区域的挑战;使用Gabor小波滤波器进行纹理表示;使用随机森林框架。

Ganjee等人[101]
2014年
使用自适应直方图均衡化提高图像对比度;结合一阶导数高斯滤波器(FDOG)提取不同宽度的血管;使用支持向量机(SVM)和RBF核对区域进行分类并提供血管与非血管的区分。

Geetharamani等人[93]
2016年
使用CLAHE提高对比度;使用二维Gabor滤波器增强视网膜血管;结合无监督学习(PCA和聚类)和监督学习(集成分类)进行血管分析。

Wang等人[102]
2019年
使用中值滤波器减少图像强度波动;使用截断滤波器在封闭区域内减弱孤立噪声,同时保留细血管等重要细节;提取100个与血管相关的特征,其中32个特征通过匹配滤波器获得,8个特征通过二维Gabor小波变换获得,35个特征通过灰度变化统计量获得,20个特征通过Frangi滤波器获得,5个特征通过高斯差分(DoG)内核获得;使用非对称主成分分析(APCA)去除100维特征向量中的不可靠维度;使用级联分类网络将像素分类为血管或背景;使用血管几何属性操作检测病理区域;使用形态学操作去除病理区域。

表A4. 用于视网膜血管分割的监督(非神经)方法中的技术。参考文献。

年份
技术

Staal等人[88]
2004年
提取图像脊线并用于构建线元素;使用KNN分类器进行像素分类;使用顺序前向选择方法进行特征选择;使用局部归一化补偿光照变化并增强局部对比度。

Soares等人[9]
2006年
在绿色通道上使用二维Gabor小波变换提取特征;对每个图像的特征空间分别应用归一化变换;使用高斯混合模型对像素进行分类。

Ricci等人[10]
2007年
使用绿色通道;结合目标像素的灰度值使用两个正交线检测器构建特征向量;使用SVMlight进行像素分类。

Salem等人[89]
2007年
[部分监督] 从绿色通道提取三个特征;使用基于半径的聚类算法(RACAL)进行像素聚类;使用部分监督的RACAL结合一些标记对象指导聚类过程;使用归一化距离矩阵测量对象之间的相对距离。安扎洛内等人[90]
2008年
使用CLAHE增强对比度,赫斯算子结合二维高斯函数突出几何管状结构,对0到255之间的灰度级别进行直方图拉伸,采用清洁算法删除不属于血管网络的伪元素,使用最大平均准确率(MAA)表示正确分类的像素数量,使用K值衡量两位观察者之间的一致性,使用Q值量化图像质量。

徐等人[91]
2010年
通过从原始灰度图像中减去近似背景来消除灰度级变形,使用中值滤波器估算近似背景,使用自适应局部阈值将归一化图像转换为二值格式,使用小波变换将图像分解为不同大小的子图像以便于特征提取,使用曲线波变换将图像分解为不同大小的曲线波子带,使用基本线检测器识别细小血管的方向,使用支持向量机将像素分类为血管和非血管,使用高斯径向基函数将输入向量映射到更高维空间以增强SVM分类。

尤等人[15]
2011年
使用径向投影定位血管中心线,使用双线性插值估算不在中心网格上的像素的灰度值,使用修剪操作删除错误检测到的血管像素,使用可导向复小波变换分析方向并适应性增强定向结构,使用半监督自训练提高性能,使用监督二元分类SVM将像素分类为血管像素和非血管像素,使用形态学桥接操作连接不连续的像素。

弗拉兹等人[19]
2012年
使用形态学变换消除亮部病变,结合多个尺度的加博尔滤波器响应测量线强度以消除暗部病变,使用梯度方向分析(GOA)图包含增强后的血管,使用集成分类器。

弗拉兹等人[28]
2013年
使用广义多尺度线检测器测量每个像素的血管性并减少误报,使用双高斯模型校正响应并模拟具有中心光反射的血管,使用简单线性变换通过估算和去除背景光照变化进行阴影校正,使用多尺度加博尔滤波器进行多尺度和多方向边缘检测并抑制背景噪声,使用形态学帽运算增强血管,使用包装决策树的集成分类器进行最终分割。

阿斯拉尼等人[92]
2016年
对输入图像中的每个像素提取特征向量(17维),扩展视野区域以减少视野边界附近的误检测,使用对比度限制的自适应直方图均衡(CLAHE)进行预处理,使用标准化变换将特征归一化到零均值和单位标准差,使用形态学变换减少噪声并提取有用信息,使用多尺度加博尔小波增强血管对比度并过滤噪声,使用RF分类器进行分类。

吉特拉拉马尼等人[93]
2016年
预处理步骤:裁剪图像以去除不属于感兴趣区域(ROI)的区域,将图像转换为YCbr、L*a*b或高斯色彩空间以增强对比度,从YCbr模型中提取Y通道,从RGB模型中提取绿色通道,从L*a*b模型中提取L值,从高斯色彩空间模型中提取G1值以增强对比度,使用对比度限制的自适应直方图均衡(CLAHE)提高对比度,使用二维加博尔滤波器增强视网膜血管,使用半波整流重新计算像素强度并提高血管对比度;分割步骤:使用无监督方法(主成分分析和K均值聚类)以及监督学习(集成分类)分析血管;后处理:使用数学形态学技术和连接组件分析去除孤立血管像素、尖刺和弧线。

科瓦奇等人[94]
2016年
基于局部阈值的迭代方法提取ROI,使用形态学孔填充生成最终ROI,使用Sobel算子、直方图均衡和背景减法减少由于光照条件变化引起的强度变化,使用皮尔逊相关系数(PCC)、反向特征子集选择(BFSS),使用经过训练的模型对在不同情况下拍摄的未见输入图像进行盲校准。

奥兰多等人[95]
2016年
基于局部邻域的CRFs(LNB-CRFs)、全连接CRF(FC-CRF)将每个像素与其他像素连接起来,使用结构化输出SVM学习CRFs。

吉特拉拉马尼等人[93]
预处理步骤:裁剪图像以去除不属于ROI的区域,将图像转换为YCbr、L*a*b或高斯色彩空间以增强对比度,从YCbr模型中提取Y通道,从RGB模型中提取绿色通道,从L*a*b模型中提取L值,从高斯色彩空间模型中提取G1值以增强对比度,使用对比度限制的自适应直方图均衡(CLAHE)提高对比度,使用二维加博尔滤波器增强视网膜血管,使用半波整流重新计算像素强度并提高血管对比度;分割步骤:使用无监督方法(主成分分析和K均值聚类)以及监督学习(集成分类)分析血管;后处理:使用数学形态学技术和连接组件分析去除孤立血管像素、尖刺和弧线。

贾维迪等人[96]
2017年
使用视野(FOV)表示二值图像,使用Otsu阈值生成掩膜,使用形态学开运算和闭运算去除漏标记的像素,使用高斯混合模型(GMM)生成血管图像图,使用Morlet小波识别所有可能的微动脉瘤(MA)候选者,使用两个判别字典区分MA和非MA对象。

梅马里等人[97]
2017年
使用33层中值滤波器减少图像噪声,使用对比度限制的自适应直方图均衡(CLAHE)增强血管和背景之间的对比度,使用形态学帽运算和帽下运算进一步增强图像,使用基于双边滤波器的Retinex算法去除图像中的光照不均匀性,使用选择性组合的位移滤波器响应(BCOSFIRE)和高斯差分(DoG)检测条状图案,使用Frangi滤波器增强血管轮廓,使用灰度共生矩阵(GLCM)通过计算像素的邻域相关性来表征图像纹理,使用加博尔滤波器进行纹理特征提取,使用最小冗余最大相关性(mRMR)选择最佳特征集,使用AdaBoost分类器进行二元分类。

夏等人[98]
使用13*13大小的加博尔滤波器,经典K均值聚类算法。

斯里尼迪等人[81]
预处理步骤:提取绿色血管以增强背景和血管之间的对比度,使用Joshi的几何特征增强视网膜图像以去除非均匀光照和对比度变化;分割步骤:将图像分割成块,并使用双三次插值进行视网膜变换以增强视网膜血管;K均值聚类进行无监督学习,全局对比度归一化进行数据预处理,使用零相位成分分析(ZCA)去除线性相关性,使用非线性映射函数跟踪新块;分类步骤:使用随机森林分类器对非血管和血管像素进行分类。

**表A5. 用于视网膜血管系统(RVS)的监督(神经网络)方法中使用的技术。**参考文献

年份

技术

Ghaderi等人 [103]
2007
[NDNN + DNN] 预处理:需要;分割:通过消除孔径效应来减少边界误检测,使用2-D Morlet小波检测定向特征并过滤背景噪声,使用最大模值提取最大响应,使用监督分类将像素分为血管和非血管类别,使用具有一个隐藏层的前馈神经网络;后处理:需要

Marin等人 [104]
2011
预处理:需要;分割:使用形态学开运算去除血管中心的光反射,使用3x3均值滤波器平滑椒盐噪声,使用高斯核进一步平滑噪声,使用69x69均值滤波器生成背景图像,使用灰度全局变换函数生成均匀图像,使用形态学顶帽变换通过去除明亮的视网膜结构来增强血管,基于矩不变量的特征,检测这些准线性形状,(神经网络)NN用于将每个像素分类为血管或非血管,使用迭代填充运算去除血管中的间隙;后处理:需要

Fathi等人 [105]
2014
预处理:需要;分割:使用通用旋转不变的LBP运算(LBPGRI)为每个视网膜图像的像素提取6-D多尺度特征向量,使用多层感知器人工神经网络(MLP-ANN)增强血管结构,使用均匀平均滤波器减少噪声的影响,使用形态学顶帽变换使用圆形结构元素提取细血管和粗血管,使用阈值分割得到二值图像,使用长度滤波器消除小区域,使用逻辑OR函数通过整合特定宽度的血管图像得到最终血管网络;后处理:需要

Franklin等人 [106]
2014
预处理:需要;分割:使用多层感知器神经网络(MLP-NN)将每个像素分类为血管或非血管,使用反向传播训练MLP-NN,使用自适应直方图均衡化提高对比度,使用累积分布函数(CDF);后处理:需要

Abbasi-Sureshjani等人 [107]
2015
预处理:需要;分割:使用亮度和对比度归一化方法来减弱噪声并提高对比度,使用方向性蛋糕小波在方向得分变换中进行去噪并增强血管,使用伽马变换减弱低方向得分响应(噪声)并增强高值(血管),使用多尺度高斯导数的方向得分提取特征向量,使用第二局部最大强度投影,使用前馈神经网络(NN)对每个像素进行分类为血管或非血管,使用迭代填充运算去除血管中的间隙;后处理:需要

Wang等人 [108]
2015
预处理:需要;分割:使用直方图均衡化与高斯滤波结合减少噪声,使强度更加均匀并提高血管的对比度,使用简单线性迭代聚类(SLIC)减少像素样本之间的冗余,使用卷积神经网络提取可训练特征,使用随机森林(RF)作为集成分类器,使用赢家通吃算法结合多个RF分类器的决策以做出最终决策;后处理:需要

Fu等人 [109]
2016
预处理:需要;分割:DeepVessel架构包含三个主要层,使用卷积层学习多尺度判别表示,使用侧输出层生成伴随的局部输出,使用条件随机场(CRF)模拟非局部像素相关性,前层网络是类似四阶段HED(整体嵌套边缘检测)的架构,使用Sigmoid函数作为侧输出层的激活函数,使用类平衡交叉熵损失作为损失函数,使用平均场近似最小化CRF能量,使用标准随机梯度下降最小化目标函数;后处理:需要

Khalaf等人 [110]
2016
预处理:需要;分割:使用自适应直方图均衡化提高图像对比度,使用形态学白顶帽滤波增强血管并去除明亮结构,基于CNN的架构具有3个卷积层,使用下采样步骤减少权重数量以降低计算开销;后处理:需要

Li等人 [111]
2016
跨模态数据转换,使用五层神经网络提取完整的血管地图,使用去噪自编码器模型进行预训练,使用输入和输出的连接利用视网膜图像和标签图之间的关系,使用标准反向传播算法训练网络,使用合成策略构建概率图;后处理:需要

Liskowski等人 [112]
2016
预处理:需要;分割:使用CNN处理视觉信息,使用局部连接减少权重数量并模拟自然视觉系统的某些方面,使用参数共享在同一层的单元之间共享权重,使用最大池化聚合多个单元的输出,使用误差反向传播算法修改权重,使用Dropout暂时关闭一部分网络单元,使用全局对比度归一化(GCN),使用零相位分量分析(ZCA白化)去除普遍相关性;后处理:需要

Lu等人 [113]
2016
预处理:需要;分割:使用卷积层对空间局部像素执行线性操作,使用最大池化层选择空间局部区域中最强烈的特征,使用数据层从数据库加载训练样本,使用块状网络处理图像块,使用交叉熵作为损失函数,使用随机梯度下降(SGD)优化损失函数;后处理:需要

Barkana等人 [114]
2017
预处理:需要;分割:提取绿色通道并使用自适应直方图均衡化(AHE)通过均匀分布图像强度级来增强图像对比度,使用形态学运算(侵蚀和膨胀)创建均匀的背景图像,使用侵蚀修剪对象边界上的像素,使用膨胀将像素添加到对象边界,使用模糊化器将清晰的输入映射到模糊集,使用模糊推理引擎确定输入空间中的模糊集到输出空间中的模糊集的映射,使用去模糊化器将输出空间中的模糊集映射到清晰输出,使用高斯和Sigmoid隶属函数指定模糊集,使用中心点方法计算输出模糊集下的中心区域,使用阈值从模糊输出获得二值图像,使用ANN分类器测试特征集的性能,使用支持向量机,使用分类器融合结合多个分类器的决策;后处理:需要

Dasgupta等人 [115]
2017
预处理:需要;分割:使用CLAHE和伽马调整增强对比度,使用修正线性单元(ReLU)作为激活函数,使用交叉熵损失处理多标签学习问题,使用池化层对输入特征图进行空间下采样;后处理:需要

Feng等人 [116]
2017
预处理:需要;分割:使用CNN作为基础架构,使用RGB到灰度转换,使用归一化调整图像强度,使用3x3中值滤波器减少噪声,使用CLAHE增强对比度,使用局部熵采样从最高熵的补片中选择一组训练数据,使用滑动窗口方法提取补片,使用修正线性单元(ReLU)作为激活函数,使用最大池化操作下采样以减少参数数量和计算量,使用Dropout减少过拟合,使用Sigmoid操作缩放输出分割图,使用类平衡损失函数学习血管分割任务;后处理:需要

Guo等人 [117]
2017
预处理:需要;分割:使用小波变换在更灵活的几何结构中分析,并在多尺度上揭示方向性和各向异性信息,使用中性不确定性滤波减少不确定性和不确定性,使用多尺度滤波增强线状结构;后处理:需要

Kaur等人 [118]
2017
预处理:需要;分割:使用非锐化掩蔽通过使边缘清晰和锐利来提高图像质量,使用基本匹配滤波器(MF)进行血液血管的比较匹配,使用多尺度匹配滤波器及其高斯的一阶导数(MF-FDOG)区分血管结构和非血管结构,使用基于神经网络的分类器对提取的样本进行分类;后处理:需要

Mo等人 [119]
2017
预处理:需要;分割:使用最大池化捕获判别性语义信息,使用下采样模块减小输入图像大小,使用上采样模块,使用Sigmoid函数计算概率图,使用辅助分类器在训练期间提供额外监督,使用Sigmoid交叉熵损失层计算这些辅助分类器中的伴随损失,使用加权融合层融合每个分支输出的多尺度分割图,使用随机梯度下降优化提出的网络的参数;后处理:需要

Song等人 [120]
2017
预处理:需要;分割:从20张训练图像中提取重叠的补片,使用卷积层和上采样层制作连接的特征图,使用批量归一化减少内部协变量偏移,使用上采样操作增加特征图的大小,使用Dropout防止过拟合,使用Softmax将像素分类为血管或非血管,使用交叉熵损失和ADAM优化器训练网络;后处理:需要

Tan等人 [121]
2017
预处理:需要;分割:从RGB颜色空间到LUV颜色空间的归一化,使用卷积神经网络(CNN)架构,使用泄漏整流线性单元(ReLU)作为激活函数,使用Xavier初始化权重,使用标准反向传播学习,使用随机梯度下降训练CNN,使用对数似然函数作为训练期间的成本函数;后处理:需要

Guo等人 [122]
2018
预处理:需要;分割:通道选择结合75%的红色通道灰度和25%的绿色通道灰度,使用CLAHE增强对比度,使用双线性插值去除瓦片边界,使用多层卷积神经网络实现视网膜血管分割,使用最大池化方法提取最高响应并下采样,使用SoftMax层获取每个像素的分类结果,使用ReLU作为激活函数和随机梯度下降作为优化器,使用Dropout防止过拟合,使用K维树找到最近的邻居以重新连接断裂的血管段然后清理孤立的像素;后处理:需要

Guo等人 [123]
2018
预处理:需要;分割:使用CNN通过其多层和前馈结构的自动适应自动提取不同特征,使用修正线性单元(ReLu)对输入的每个元素执行阈值操作,使用池化层减小特征图的空间大小,使用反卷积层上采样特征图,使用全连接层将特征图展平并连接到底层输出,使用多个深度卷积神经网络(MDCNN),使用投票方案确定像素的最终分类;后处理:需要

Guo等人 [124]
2018
预处理:需要;分割:使用CNN通过其多层和前馈结构的自动适应自动提取不同特征,使用Dropout层提高网络的泛化能力,使用池化层减小特征图的空间大小,使用交叉熵损失函数在最终softmax层测量误差,使用强化样本学习策略;后处理:需要

Hu等人 [125]
2018
预处理:需要;分割:使用多尺度CNN从彩色眼底图像中学习判别特征,使用更丰富的卷积特征提取多尺度和多级特征,使用改进的交叉熵损失函数解决类别不平衡问题,使用全连接条件随机场(CRFs)细化分割;后处理:需要

Jiang等人 [126]
2018
预处理:需要;分割:使用深度监督和光滑正则化的网络(DSSRN)进行像素到像素的图像分割,使用整体嵌套边缘检测(HED)检测边缘和对象边界,使用加权融合层更好地捕获每个侧输出的优势;后处理:需要

Oliveira等人 [128]
2018
预处理:需要;分割:使用静态小波变换(SWT)丰富(全卷积神经网络)FCN的输入,使用补片提取,使用Xavier初始化初始化网络的参数,使用修正线性单元(ReLU)加速训练,使用最大池化丢弃可能冗余的特征,使用最近邻插值将特征图恢复到初始尺寸,使用空间Dropout而不是仅丢弃某些节点,使用随机梯度下降配合Nesterov动量最小化分类交叉熵损失函数;后处理:需要

Sangeethaa等人 [129]
2018
预处理:需要;分割:使用CLAHE增强对比度,使用数学形态学检查图像与选定的结构元素(SE)之间的交互,使用形态学开运算和关闭运算平滑血管边缘并平滑区域,消除小孔,并填充轮廓中的间隙,使用背景减除消除背景变化,使用阈值将血管减少为二值图像,通过去除所有灰度信息将血管减少为二值图像,使用Softmax生成0到1之间的输出范围表示像素属于正类的概率,使用AdamOptimizer进行梯度计算和权重优化以优化成本;后处理:需要

Xia等人 [130]
[CTF-Net] 预处理:需要;分割:使用U-Net作为基础结构,使用自适应直方图均衡化增强对比度,每个卷积和反卷积阶段使用单个卷积层以克服特征传播的阻抗,使用少量特征图处理过拟合,使用通道连接改善输入图像的特征传播,使用均方误差(MSE)作为损失函数;后处理:需要

Yan等人 [131]
2018
预处理:需要;分割:使用骨架化方法获取骨架,使用分段级损失测量厚度不一致性,使用硬阈值0.5从概率图生成二值图,使用像素级损失惩罚粗血管的厚度不一致性,使用厚度偏差确定分段级损失的超参数,使用权重矩阵调整像素损失权重;后处理:需要

Zhang等人 [132]
2018
预处理:需要;分割:使用U-Net学习分层特征,使用残差连接提高鲁棒性并帮助收敛,使用Dropout和BatchNorm分别减少过拟合和梯度消失,使用开运算区分粗血管和细血管,使用膨胀运算定位靠近血管的像素,使用深度监督解决前向传播过程中的信息丢失问题并提高详细准确性,使用交叉熵损失和类平衡计算最终输出和每个侧输出的损失并纠正不平衡,使用随机梯度下降算法(SGD)配合动量优化模型,使用CLAHE增强图像并提高对比度;后处理:需要

Xiao等人 [133]
[Weighted Res-UNet] 预处理:需要;分割:使用CLAHE增强图像对比度,使用数据增强(水平翻转、宽度位移范围),使用加权注意力机制针对ROI区域并丢弃无关的噪声背景,使用跳跃连接增加深度并提高准确性,使用二元交叉熵作为损失函数;后处理:需要

Zhuang等人 [134]
[LadderNet] 预处理:需要;分割:LadderNet:一种用于语义分割的多分支卷积神经网络,使用共享权重残差块减少参数数量和训练难度,使用交叉熵损失和Adam优化器;后处理:需要

Biswas等人 [135]
2019
预处理:需要;分割:将颜色转换为灰度,使用归一化过程最小化小的强度变化,使用CLAHE增强对比度,使用伽马调整在特定强度范围内提高图像的敏感性,使用卷积神经网络(CNNs)以数据驱动的方式解决挑战性问题,使用最大池化下采样图像并增加感受野,使用全卷积网络(FCNs)进行语义分割,使用膨胀卷积增加感受野的大小;后处理:需要

Cherukuri等人 [136]
2019
预处理:需要;分割:使用几何表示层获得适用于血管分割的几何定制的表示,使用方向多样性约束通过调整滤波器响应来启用方向多样性,使用数据自适应噪声鲁棒性减少噪声,使用残差网络架构改善血管分割,使用多尺度表示层处理变化的红细胞厚度并增强细血管分割,使用交叉验证方法确定最佳层数;后处理:需要

Dharmawan等人 [137]
[Hybrid] 预处理:需要;分割:使用U-Net作为基础架构,使用CLAHE增强图像对比度,使用Dolph-Chebyshev类型I函数(MDCF-I)匹配滤波器检测所有可能尺寸的血管,使用Dropout层减少过拟合问题,使用最大池化下采样,使用上采样,使用Soft-max分类器将多通道特征映射到首选类别,使用交叉熵损失函数训练网络,使用留一法交叉验证在STARE数据库上进行训练/测试;后处理:需要

Dong等人 [138]
2019
[DS-ALN] 预处理:需要;分割:使用生成器获取血管分割的概率图,使用鉴别器区分概率图来自分割网络还是真实注释,使用深度监督模块提取更多语义特征并有助于收敛,使用多个交叉熵损失,使用L1损失和对抗损失;后处理:需要

Guo等人 [139]
[BS-DSN] 预处理:需要;分割:使用U-Net作为基础架构,使用深度监督减轻梯度消失问题并获得良好的血管图,使用类平衡交叉熵作为损失函数,使用加权融合层利用每个侧输出的血管概率图,使用底-顶短连接将低级详细信息传递到高级别以减少模糊情况,使用顶-底短连接将高级别结构信息传递到第一个侧输出层以减少其噪声;后处理:需要

Guo等人 [140]
2019
[SD-Unet] 预处理:需要;分割:SD-Unet是DropBlock和U-Net架构的组合,使用DropBlock方法防止神经网络过拟合,使用DropBlock(一种简单的正则化方法)从层的特征图中移除连续区域,SDUnet由三个下采样块和三个上采样块组成,每个下采样块包括两个连续的卷积层和一个最大池化层,上采样块与之前的相同,除了它使用转置卷积层而不是池化层;后处理:需要

Hemelings等人 [141]
[LikeUNet] 预处理:需要;分割:使用U-Net作为基础架构,使用局部对比度增强来抵消由于视网膜曲率导致的图像内的光照变化,使用高斯滤波增强对比度,使用归一化减少训练集中的图像方差,使用随机裁剪和数据增强增加训练实例数量,使用批量归一化层标准化输出,使用自定义权重图强调血管中心线像素,使用分类交叉熵作为损失度量以及adam优化器;后处理:需要

Hu等人 [142]
[S-UNet] 预处理:需要;分割:使用U-Net作为基础架构,使用级联方法增强输入图像并继承前一个网络块的学习经验,使用最小U-Net(Mi-UNet)大幅减少参数数量以防止在小数据集上的过拟合,使用显著性机制有效解决数据不平衡问题,使用辅助二元交叉熵损失函数;后处理:需要

Jebaseeli等人 [143]
连等人[150]
2019
预处理:需要;分割:使用CLAHE增强视网膜图像对比度,加权U-Net进行粗略的视网膜血管分割,加权Res-UNet细化分割结果,加权注意力机制用于关注目标ROI区域并剔除无关噪声背景,跳过连接方案增加深度并提高深度CNN的准确性,二元交叉熵函数用于训练所提出的模型;后期处理:需要

洛佩斯等人[151]
2019
预处理:需要;分割:以U-Net为基础架构,使用扩张卷积增加感受野范围,进行归一化处理以获得零均值和单位方差,使用分类交叉熵作为损失函数,Adam优化器最小化损失函数,循环余弦退火调度器调整学习率;后期处理:需要

马等人[152]
2019
预处理:需要;分割:GAN网络由生成器和判别器组成,生成器生成与输入大小相同的概率分割图像,判别器区分真实图像和生成器的输出,使用扩张卷积提取更多特征并提高分辨率,ReLU作为激活函数,Dropout层防止过拟合,Dice层用于观察分割结果的准确性,最小二乘生成对抗网络(LSGAN)用于缓解梯度损失问题并提高分割图像质量;后期处理:需要

诺等人[153]
2019
预处理:需要;分割:使用尺度空间近似技术在CNN中进行多尺度表示,采用下采样、卷积和上采样在频域进行分析,使用双线性插值更好地近似高斯模糊,使用二项式滤波器,跳过连接和残差模块增加层深度以弥补感受野范围的减少;后期处理:需要

拉米等人[154]
2019
预处理:需要;分割:提取低级特征以获得更精细的分割结果;借鉴UNet和SegNet提取低级特征;特征传播将低级特征复制到对应的高级特征;基于块的判别器网络用于区分每个块是真实分割图还是合成分割图;后期处理:需要

申等人[155]
2019
[VGN] 预处理:需要;分割:以深度视网膜图像理解(DRIU)作为基础网络;使用像素级交叉熵损失训练CNN模块,进行阈值处理、骨架化、顶点生成、边缘生成以构建图谱,使用两层前馈模型将顶点分类为血管或非血管,使用顶点级交叉熵损失训练GCN模块,使用Reproject函数进行空间维度归一化,使用五个卷积层将稀疏激活分布在整个图像区域,采用序列训练方案,使用总损失函数训练VGN;后期处理:需要

苏姆罗等人[156]
2019
预处理:需要;分割:使用形态学技术消除不均匀照明问题并实现均匀对比度图像,使用主成分分析(PCA)将彩色图像转换为单灰度图像,使用数学形态学闭合操作估计背景,使用步进卷积层减小特征尺寸,使用泄漏修正线性单元(LReLU)作为激活函数,使用类平衡交叉熵损失函数训练模型;后期处理:需要

苏姆罗等人[157]
2019
预处理:需要;分割:使用深度修改的U-Net生成分割血管图像;网络由编码器和解码器组成;使用跳过连接将详细特征从编码器传递到解码器;使用LReLU作为激活函数;使用步进卷积层减小特征分辨率并加速训练过程,使用反卷积层提高特征分辨率并重建分割图像,使用Soft-max层生成前景(血管)和背景像素的概率图,使用Dice损失函数进行模型训练;后期处理:使用形态学重建操作生成最终的二值图像

唐等人[158]
2019
预处理:需要;分割:以U-Net为基础架构;使用多比例通道集成模型(MPC-EM)提高分割精度;编码器部分生成特征向量,解码器部分将特征向量转换为概率图,使用三重卷积(TC)残差模块优化并避免梯度消失问题;后期处理:需要

涂等人[159]
2019
[DRPAN] 预处理:需要;分割:以GAN为基础结构,由生成器和判别器组成;生成器从眼底图像生成视网膜血管分割图像;判别器区分血管图像;使用金字塔池化网络(PPN)提取特征图;后期处理:需要

王等人[160]
2019
预处理:需要;分割:使用密集U-net作为网络模型;使用随机提取策略提取训练和标记的图像块;基于Dice系数的损失函数;后期处理:需要

吴等人[161]
2019
[U-GAN] 预处理:需要;分割:U-GAN由判别器和生成器组成;使用注意力门机制自动学习关注目标结构而无需额外监督;生成器生成与输入大小相同的视网膜血管概率图;判别器判断血管图像是否为生成器的输出;使用二元交叉熵作为损失函数;后期处理:需要

修勤等人[162]
2019
预处理:提取绿通道,通过双边滤波进行去噪,使用CLAHE,局部自适应伽马校正和多尺度形态学帽变换;分割:以U-Net为基础结构;使用深度ResUNet,使用二元交叉熵作为损失函数;后期处理:需要

颜等人[163]
2019
预处理:需要;分割:采用三阶段模型进行分割;使用ThickSegmenter进行粗血管分割,使用ThinSegmenter进行细血管分割,使用FusionSegmenter进行血管融合;三个模型分别和顺序训练;后期处理:需要

赵等人[164]
2019
领域适应,使用R-sGAN技术生成合成图像,使用重置门决定前一单元状态的信息有多少可以进入当前单元,使用Sigmoid激活函数,使用更新门控制前一状态的信息有多少可以更新为新单元状态。阿达尔什等人[165]
2020
预处理:需要;分割:提取图片块以有效分割,使用残差路径和33及11滤波器消除低层次特征与高层次特征之间的差异,所有卷积层使用ReLU作为激活函数,最后一层使用Sigmoid激活函数;后期处理:需要

布达克等人[166]
2020
预处理:需要;分割:使用随机梯度下降(SGD)优化网络权重,最大池化层连接最大下采样层,批量归一化层对激活值分布进行归一化(考虑零均值和标准差),使用修正线性单元(ReLU)层对激活输入的每个元素进行阈值处理,使用像素分类层将分类结果转换为二值图像,使用串联的多编码器-解码器网络(CMED);后期处理:需要

冯等人[167]
2020
预处理:需要;分割:使用CNN检测更抽象的特征,使用CcNet融合多尺度特征并采用交叉连接结构,使用卷积-ReLU-最大池化(CRM)减少网络参数,使用ADAM优化方法训练CcNet;后期处理:需要

郭等人[168]
2020
[DI-U-net] 预处理:需要;分割:以U-net架构为基础,使用密集块替代跳过连接,使用Inception模块替代传统卷积操作;使用Denseblocks将特征从浅层融合到深层;使用Inception模块提取特征并通过增加网络宽度提高性能;后期处理:需要

郭等人[169]
2020
[DRNet] 预处理:需要;分割:以U-Net为基础架构;使用双残差块(DRB)提取更复杂的特征;使用残差学习块解决梯度消失问题;使用DropBlock减少过拟合问题;使用最大池化操作下采样;使用转置卷积进行上采样;后期处理:需要

拉希里等人[170]
2020
预处理:需要;分割:使用GAN,由生成器和判别器组成;生成器生成图像;判别器区分真实样本和生成样本;使用半监督学习算法进行训练;使用特征匹配进行生成器训练;后期处理:需要

米什拉等人[171]
2020
预处理:需要;分割:使用分层有效感受野(LERF)量化输入对输出节点的影响范围;使用偏导数测量影响程度;使用阈值处理忽略贡献不显著的区域;使用骨架化计算血管宽度;使用数据感知深度监督确定对血管特征提取贡献最大的卷积层;结合U-Net和CUMed-视觉网络提高血管分割效果;后期处理:需要

纳赛里等人[172]
2020
预处理:需要;分割:使用 vignetting 遮罩、对比度限制自适应直方图均衡(CLAHE)、伽马校正、U-Net、随机梯度下降(SGD)优化器以及分类交叉熵损失进行网络训练;后期处理:需要

奥兹古纳尔普等人[173]
2020
预处理:需要;分割:使用语义像素级分割(SegNet)分割视网膜血管;使用加权分类层最小化类别分布不平衡造成的后果;后期处理:需要

苏莱等人[174]
2020
预处理:灰度变换、归一化、CLAHE和伽马校正;分割:使用U-net结合编码器-解码器路径,使用卷积进行特征提取和最大池化操作进行下采样和降低空间分辨率;使用转置卷积进行从低分辨率到高分辨率的上采样;后期处理:需要

塔米姆等人[175]
2020
预处理:需要;分割:构建24特征向量用于像素表示;使用形态学白帽变换在暗背景下突出光照物体,使用形态学黑帽变换在亮背景下突出暗物体,使用相位一致性的主矩检测图像中的边缘和角点,使用多尺度二阶局部图像结构(Hessian矩阵)根据像素周围的强度变化检测血管结构,使用高斯差分(DoG)检测边缘,使用归一化通过缩小不同特征之间的范围便于分类,使用修改后的多层感知(MLP)作为二值分类器,使用修正线性单元(Relu)作为激活函数,使用交叉熵(CE)作为损失函数;后期处理:需要

乌伊萨尔等人[176]
2020
预处理:灰度变换、归一化、CLAHE和伽马校正;分割:使用CNN提取特征,使用池化缩小尺寸,使用有序补丁生成准备测试集;后期处理:需要

瓦利库蒂等人[177]
2020
预处理:需要;分割:使用随机梯度下降(SGD)优化网络权重,将最大池化层连接到最大下采样层,使用批量归一化层考虑零均值和标准差对激活值分布进行归一化,使用修正线性单元(ReLU)层对激活输入的每个元素进行阈值处理,使用像素分类层将分类结果转换为二值图像,使用串联的多编码器-解码器网络(CMED);后期处理:需要

冯等人[167]
2020
预处理:需要;分割:使用CNN检测更抽象的特征,使用CcNet融合多尺度特征并采用交叉连接结构,使用卷积-ReLU-最大池化(CRM)减少网络参数;后期处理:需要

郭等人[168]
2020
[DI-U-net] 预处理:需要;分割:使用U-net架构,用密集块替代跳过连接,用Inception模块替代传统卷积操作;使用Denseblocks将特征从浅层融合到深层;使用Inception模块提取特征并通过增加网络宽度提高性能;后期处理:需要

郭等人[169]
2020
[DRNet] 预处理:需要;分割:以U-Net为基础架构;使用双重残差块(DRB)提取更复杂的特征;使用残差学习块解决梯度消失问题;使用DropBlock减少过拟合问题;使用最大池化操作下采样;使用转置卷积进行上采样;后期处理:需要

拉希里等人[170]
2020
预处理:需要;分割:使用GAN,由生成器和判别器组成;生成器生成图像;判别器区分真实样本和生成样本;使用半监督学习算法进行训练;使用特征匹配进行生成器训练;后期处理:需要

米什拉等人[171]
2020
预处理:需要;分割:使用分层有效感受野(LERF)量化输入对输出节点的影响范围;使用偏导数测量影响程度;使用阈值处理忽略贡献不显著的区域;使用骨架化计算血管宽度;使用数据感知深度监督确定对血管特征提取贡献最大的卷积层;结合U-Net和CUMed-视觉网络提高血管分割效果;后期处理:需要

纳赛里等人[172]
2020
预处理:需要;分割:使用 vignetting 遮罩、对比度限制自适应直方图均衡(CLAHE)、伽马校正、U-Net、随机梯度下降(SGD)优化器以及分类交叉熵损失进行网络训练;后期处理:需要

奥兹古纳尔普等人[173]
2020
预处理:需要;分割:使用语义像素级分割(SegNet)分割视网膜血管;使用加权分类层最小化类别分布不平衡造成的后果;后期处理:需要

苏莱等人[174]
2020
预处理:灰度变换、归一化、CLAHE和伽马校正;分割:使用U-net结合编码器-解码器路径,使用卷积进行特征提取和最大池化操作进行下采样和降低空间分辨率;使用转置卷积进行从低分辨率到高分辨率的上采样;后期处理:需要

塔米姆等人[175]
2020
预处理:需要;分割:构建24特征向量用于像素表示;使用形态学白帽变换在暗背景下突出光照物体,使用形态学黑帽变换在亮背景下突出暗物体,使用相位一致性主矩检测图像中的边缘和角点,使用多尺度二阶局部图像结构(Hessian矩阵)根据每个像素周围的强度变化检测血管结构,使用高斯差分(DoG)检测边缘,使用归一化通过缩小不同特征之间的范围便于分类,使用修改后的多层感知(MLP)作为二值分类器,使用修正线性单元(Relu)作为激活函数,使用交叉熵(CE)作为损失函数;后期处理:需要

乌伊萨尔等人[176]
2020
预处理:灰度变换、归一化、CLAHE和伽马校正;分割:使用CNN提取特征,使用池化缩小尺寸,使用有序补丁生成准备测试集;后期处理:需要

瓦利库蒂等人[177]
2020
预处理:需要;分割:使用下采样控制参数、计算和过拟合,使用修正线性单元(RelU)作为激活函数为网络引入非线性,使用梯度下降算法更新网络参数,使用交叉熵损失函数平衡像素数量不平衡问题,使用局部归一化进行照明归一化;后期处理:需要

杨等人[178]
2020
[SUD-GAN] 预处理:归一化;分割:基于GAN的SUD-GAN架构,由生成器和判别器组成;生成器生成尽可能接近真实值的新的概率图;判别器区分输入的真实样本和生成样本;使用对称编码器-解码器结构端到端分割眼底图像;使用短连接结构防止网络梯度消失;后期处理:无

卓等人[179]
2020
[SID2Net] 预处理:提取绿通道、计算绿通道均值;分割:使用瓶颈结构减少计算损失;使用大小不变的DNet(SIDNet)在特征图中保持与输入图像相同的长度和宽度尺寸;使用密集连接(SID2Net)鼓励特征图重用并提高参数利用率;后期处理:全局阈值分割算法将概率图转换为二值图

阿尔瓦拉多-卡里略等人[180]
2021
[D-GaussianNet] 预处理:使用量子卷积层(QCL)生成多通道眼底图像;分割:以UNet为基础结构;使用高斯匹配滤波器(GMF)突出二维图像中的管状结构;使用弹性变形变换为原始GMF滤波器添加曲率;重新定义卷积块映射函数防止训练提前收敛或精度下降;后期处理:无

阿特利等人[181]
2021
[Sine-Net] 预处理:灰度变换、归一化;使用多尺度帽变换(MTHT)增强图像对比度和细节;应用CLAHE;分割:[Sine-Net]网络先进行上采样然后下采样分别捕捉细血管和粗血管特征;使用残差连接将更多上下文信息传递到架构的更深层次;后期处理:无

格贡德斯-阿里亚斯等人[182]
2021
预处理:无;分割:使用全卷积神经网络分割血管结构;使用转置卷积恢复信息大小;使用距离矩阵(DMI)量化每个像素与血管结构的距离;使用交叉熵损失函数与DMI结合;后期处理:无。郭等人[183]
2021
[SA-UNet] 预处理:无;分割:使用U形编码器-解码器作为基础结构;使用DropBlock防止过拟合问题;使用空间注意力模块(SAM)进行分类和检测;后期处理:无。Kamran等人 [184]
2021年
[RV-Gan]
预处理:无;分割:采用多尺度(粗调和精细)生成器来生成高质量的特定领域视网膜图像合成结果;使用残差下采样和上采样模块获取所需的特征图和输出;在生成器和判别器中加入残差身份块,在网络正向传播过程中提取和保持深度和空间特征;空间特征聚合模块用于结合空间和深度特征;轻量级判别器作为自编码器,用于提取全局和局部特征并防止过拟合;为粗调和精细生成器分别设计多尺度判别器;加权特征匹配损失用于改进像素级分割并优先处理特定特征;对抗训练采用铰链损失(Hinge-loss);重建损失(均方误差)确保合成图像的真实感;后处理:无。

Samuel等人 [185]
2021年
[VSSC-Net]
预处理:使用原始绿通道、经过CLAHE增强的绿通道以及在去除伽玛校正后的线性化绿平面构建三个三通道图像;分割:VSSC Net用于执行图像到图像/端到端的血管分割;血管特定卷积(VSC)模块从基础网络的特征图输出中提取感兴趣区域;后处理:无。

Wu等人 [186]
2021年
[SCS-Net]
预处理:无;分割:基于U形结构;尺度感知特征聚合(SFA)模块用于提取多尺度上下文信息并聚合多尺度特征;自适应特征融合(AFF)模块用于结合语义信息和空间信息,同时抑制无关背景噪声;多层语义监督(MSS)模块用于学习更丰富的语义表示并细化血管图;扩张卷积层用于多尺度特征提取;压缩-激励(Squeeze-and-Excitation)操作用于建模相邻层之间的特征通道相关性;后处理:无。

Yang等人 [187]
2021年
预处理:灰度转换、归一化、直方图均衡化和伽玛校正;分割:多任务分割网络用于精确分割眼底图像中的粗细血管;分别分割粗细血管;改进的U-net网络用于构建多任务分割网络;融合网络模块用于融合多任务分割网络的两种分割结果;后处理:无。

Zhou等人 [188]
2021年
预处理:归一化;分割:以U-net作为基础架构,对称平衡生成对抗网络(SEGAN)用于提升U-net的血管分割能力;多尺度特征细化块(MSFRB)用于保持高分辨率特征;MSFRB中的注意力机制(AM)用于为各通道分配不同权重,迫使网络关注具有信息量的通道;加权二元交叉熵(BCE)和加权平均绝对误差(MAE)用于提高微小血管的检测性能;后处理:无。

Zou等人 [189]
2021年
预处理:灰度转换、通过对比度拉伸方法进行归一化,应用CLAHE和伽玛校正;局部回归(LODESS)将二值标签转换为多类标签;分割:采用U-net基本结构的CNN进行多标签分类;上采样和下采样模块的数量、卷积滤波器的大小、最大池化滤波器的大小均与U-net相同;后处理:局部回归(LOESS)操作将CNN得到的多标签概率图输出转换为二值标签视网膜血管图像。

Zhang等人 [190]
2022年
[TiM-Net]
预处理:无;分割:基于M-net衍生而来;在其跳跃连接中加入变压器模块。变压器中的跳跃连接包含自注意力机制,用于建模整个图像的长距离关系;双注意力机制用于抑制噪声并优化模型;通道注意力用于识别包含更多血管分割有用信息的通道;解码器中的四层结构用于生成不同输出;后处理:无。

Shi等人 [191]
2023年
[TCU-Net]
预处理:无;分割:将OCTA视网膜血管分割方法中的卷积计算嵌入到变压器中以实现全局特征提取;高效交叉融合变压器用于融合不同尺度的特征并降低自注意力机制的计算复杂性;CTrans模型作为U-net跳跃连接的替代方案,解决语义间隙并实现准确分割;高效通道交叉注意力(ECCA)用于解决有效Transformer和解码器之间的语义不一致性;后处理:无。

表A6. 用于RVS的监督(神经网络)方法中的先进技术。

年份 技术名称
Francia等人 [192] 2020年 [LikeUNet] 预处理:将RGB输入图像转换为灰度图像,进行数据归一化,使用CLAHE增强对比度,通过伽玛校正调整亮度;分割:以U-net为基础架构,包含捕获语义和上下文信息的编码部分以及恢复空间信息的解码部分;使用残差块减少退化问题;负对数似然损失函数处理类别不平衡;后处理:无。
Fu等人 [193] 2020年 [MSCNN-AM] 预处理:提取绿通道;分割:采用U形结构的编码器和解码器;多尺度密集块(MSDB)捕获全局血管信息并在不同尺度上分割血管;过渡降维模块降低特征图的空间维度;注意力块用于精确分割视网膜血管;重采样操作生成注意力系数;后处理:无。
Khan等人 [194] 2020年 [RCED-Net] 预处理:无;分割:基于残差连接的编码器-解码器网络,保留并利用低级语义边缘信息以实现鲁棒的血管分割;在编码器的第一个块和解码器的最后一个块之间引入残差连接以保持血管信息;后处理:无。
Li等人 [195] 2020年 [IterNet] 预处理:无;分割:以UNet为基础模型,包含一个U-net和N-1个mini-UNet的迭代;模块内连接将编码层与解码层连接;基础UNet与所有精炼mini-UNet的连接确保从基础UNet的第一层访问特征;后处理:无。
Li等人 [196] 2020年 [Improved U-net] 预处理:无;分割:改进的U-net,提供压缩的特征空间并降低特征空间复杂性;减少跳跃连接的数量;采用Dropout防止过拟合;通过主动学习解决血管分割精度问题;后处理:无。
Lv等人 [197] 2020年 以U-net为基础架构;在特征层和输出层的前一层之间引入注意力模块,估计最可能的视网膜血管区域;采用两个孔状卷积增加感受野并减少计算量;后处理:无。
Mou等人 [198] 2020年 [DDNet] 预处理:无;分割:用ResNet替换U-Net中的原始模块以提取特征;密集扩张块以密集形式组织孔状卷积;后处理:概率规整 wander(PRW)用于连接断裂的血管段。
Park等人 [199] 2020年 [M-GAN] 预处理:自动颜色均衡化以使血管更易识别;分割:条件GAN,包含两个深度全卷积网络(FCNN)作为生成器和一个FCNN作为判别器;多核池化(MKP)减小血管厚度和大小的变化;后处理:Lanczos重采样以平滑图像并进一步减少误负概率。
Tang等人 [200] 2020年 [MSCS] 预处理:灰度转换、归一化、CLAHE和伽玛调整;分割:多尺度卷积提取特征图信息;解码器中的空间注意力机制处理不同尺度的空间信息;全卷积编码器-解码器模块增强像素间的全局相关性;多尺度非对称级联卷积模块提高效率并提取特征;通道重要性排序模块提升准确性;空间注意力机制提取多尺度特征图的位置信息;后处理:无。
Tian等人 [2020] [MPCN-Net] 预处理:无;分割:使用扩张卷积扩展感受野;高斯低通滤波器提取低频信息;高斯高通滤波器提取高频信息;残差网络改进网络结构。后处理:无

Wang等人 [202]
2020年
[CTF-Net] 预处理:灰度转换;分割:使用Coarse SegNet作为U形编码器-解码器网络,同时捕捉低级细节和高级全局上下文;使用Fine SegNet细化预测的粗略血管图;FAM残差块用于避免梯度消失和过拟合;后处理:无

Wang等人 [203]
2020年
[HAnet] 预处理:灰度转换、归一化、CLAHE和伽玛校正;分割:以U-net为核心架构,结合编码器提取高级图像特征,以及三个解码器分别用于容易区分的区域、难以区分的区域和粗略分割;注意力门和两级阈值用于确定哪些血管区域易于或难以分割;通过训练HAnet实现多任务学习过程以提升图像分割性能;使用注意力图和差异图突出显示难以分割的血管特征;后处理:无

Wu等人 [204]
2020年
[NFN+] 预处理:灰度转换、归一化、CLAHE和伽玛校正;分割:网络由两个级联的U形编码器-解码器组成,前端网络生成视网膜血管的概率图,后端网络生成细化的概率血管图作为分割结果;网络间的跳跃连接将前端网络学到的特征传递到后端网络;后处理:无

Boudegga等人 [205]
2021年
[RV-Net] 预处理:用视网膜的平均颜色替换背景;将RGB图像转换为LAB格式并提取L通道;应用CLAHE;然后将调整后的L通道与A和B通道合并;转换回RGB格式;分割:扩展U-net结构,加入轻量级卷积模块(LCMs);LCMs用于提高分割性能并减少计算时间;后处理:使用形态学变换侵蚀去除预测结果中的噪声

Gegundez-Arias等人 [182]
2021年
[LikeUNet] 预处理:无;分割:以U-Net模型为基本架构的FCNN;卷积用于生成特征图;最大池化用于减小特征图大小;转置卷积用于恢复信息大小;后处理:无

Li等人 [206]
2021年
[带注意力机制的CNN] 预处理:无;分割:以U-Net为基本架构;注意力模块用于捕获全局信息并在CNN中提取相似特征;后处理:无

Li等人 [207]
2021年
[FANet] 预处理:提取绿色通道,使用CLAHE增强对比度;分割:双向注意力块用于捕获长距离上下文信息;水平和垂直平均池化分别用于捕获行内和列内像素之间的关系;选择性核(SK)单元用于自适应选择神经元的感受野大小以生成多尺度信息;后处理:无

Lian等人 [150]
2021年
[GLUE] 预处理:灰度转换,在图像和补丁级别应用CLAHE;分割:由WUN和WRUN组成的级联CNN模型;加权U-Net(WUN)从全局增强的补丁生成粗略分割图;加权残差UNet(WRUN)细化分割结果;通过将模型特征图与注意力掩码相乘实现加权注意力机制;后处理:无

Wang等人 [208]
2021年
[CSU-Net] 预处理:灰度转换、归一化、CLAHE和伽玛校正;分割:使用Context Spatial U-Net(CSU-Net)进行分割;上下文通道用于捕获更多感受野信息;空间通道用于保留空间信息;注意力跳跃模块(ASM)与自空间注意力机制结合用于增强原始特征;特征融合模块(FFM)用于融合来自上下文和空间通道的特征;后处理:无

Vallikutti等人 [209]
2021年
[EEA-Unet] 预处理:提取绿色通道,应用CLAHE;分割:以U-Net为基本架构;使用孔状卷积扩大感受野;转置卷积恢复空间信息;使用非对称收缩和扩展路径;使用深度连接将编码器的特征图连接到相应的解码器;添加层改进连接到解码器的特征图;后处理:使用形态学开运算去除预测结果中的噪声

Zhang等人 [210]
2021年
[LikeUNet] 预处理:归一化;分割:基于U-net架构的网络;在编码器路径中使用混合扩张卷积(HDC)扩大感受野而不损失分辨率;像素转置卷积(PixelTCL)模块用于上采样;瓶颈网络用于识别映射函数以降低复杂性并解决梯度消失问题;后处理:无

Dong等人 [211]
2022年
[CRAUNet] 预处理:灰度转换、归一化、CLAHE和伽玛校正;分割:由两个级联的编码器-解码器对组成的网络,基于U-Net结构;使用带有DropBlock和MFCA模块的残差块逐步提取特征;将第一个U形网络的特征图与原始图像结合以增强重要特征;后处理:无

Jiang等人 [212]
2022年
[MTPA-Unet] 预处理:灰度转换、归一化、CLAHE和伽玛校正;分割:混合CNN-Transformer架构用于提取局部信息和长距离依赖性;从Transformer提取的特征传递到相应的CNN中的编码器;编码器块包括特征提取模块和下采样模块;解码器用于特征重建;编码器和解码器块之间的跳跃连接;后处理:无

Hu等人 [213]
2022年
[HT-Net] 预处理:无;分割:受到U-Net的启发;HT-Net结合高效自注意力机制(ESM)以克服卷积操作中的长距离依赖性问题;使用Dropblock防止过拟合;特征融合块(FFB)用于捕获多尺度特征并丰富特征空间;特征细化块(FRB)用于细化血管的边缘结构并提高准确率;扩张卷积用于扩大感受野;后处理:无

Huang等人 [214]
2022年
[CSAUNet] 预处理:融合红色和绿色通道,使用CLAHE增强对比度,归一化去除强度变化的干扰;分割:CSAUNet由两个级联的U形网络组成:自注意力U形网络(SAUNet)生成粗略分割结果,残差自注意力U形网络(ResSAUNet)细化粗略结果;两个网络的解码器中均使用自注意力模块建模图像区域间的长距离依赖性;后处理:无

Li等人 [215]
2022年
[Res2Unet] 预处理:提取绿色通道,应用标准化和归一化,使用CLAHE提高质量和对比度,伽玛校正增强对比度和动态范围;分割:以U-Net作为骨干网络;使用Res2Net代替单尺度卷积,采用组卷积策略;使用Squeeze和Excite块进行通道注意力机制以学习组间关系;后处理:使用局部阈值方法和加权校正方法

Shen等人 [216]
2022年
[SETUnet] 预处理:灰度转换、归一化和CLAHE;分割:CNN带有残差注意力块作为特征提取器;残差注意力块包括具有空间和通道注意力的残差密集网络;Squeeze-excitation变压器作为编码器;CNN作为解码器;后处理:无

Wu等人 [217]
2022年
[ARU-Net] 预处理:灰度转换和归一化;分割:以U-Net为基本框架,使用Squeeze-and-excitation块进行通道注意力,自适应特征重新校准,增强特征表达力;混合孔状卷积扩大感受野;后处理:无

表A7. 用于评估分割性能的指标公式。ID
指标
描述
公式

M1
准确率(Acc)
正确分类的像素数

M2
精确度(Pr)
阳性预测值

M3
灵敏度(Sn)
真正例率

M4
特异性(Sp)
阴性预测值

M5
F1分数(F1)
Pr和Sn的调和平均值

M6
Jaccard指数(IoU)
交并比

M7
AUC-ROC
ROC曲线下面积

M8
AUC-PR
PR曲线下面积

M9
Dice系数(DSC)
重叠相似度

M10
Matthews相关性系数(MCC)
二分类质量

M11
Kappa系数(Kappa)
一致性得分

M12
G-mean(G)
Sn和Sp的平衡

M13
SSIM
结构相似度

M14
融合分数(FS)
整合MCC、F1和G

M15
假发现率(FDR)
错误判断为正例的像素数

M16
假阳性率(FPR)
背景被错误地分类为 foreground 的像素数

M17
阴性预测值(NPV)
负例中的真正例数

M18
加权精确度-召回率(Weighted Precision-Recall)

M19
增强对齐度量(Enhanced Alignment Measure)
全局+局部匹配质量

M20
平衡准确率(Balanced Accuracy,BAcc)
注意1:上述公式中使用的符号定义如下:分别表示真正例、真正例、假正例和假负例; 表示预测的和真实的血管像素集, 表示集合的基数; 表示阈值点的数量; 和 分别表示第个阈值处的假阳性和真正例率; 和 表示加权精确度和灵敏度; 表示总像素数; 和 分别表示预测和实际正例的比例; 和 分别表示SSIM中使用的均值、标准差和协方差; 和 表示图像的宽度和高度; 和 表示预测和真实的 foreground 对齐图; 表示元素级(Hadamard)乘积; 和 表示数据集中的总血管和背景像素数。注意2:虽然大多数指标(M1–M14、M17–M20)的解释是数值越高表示性能越好,但M15(假发现率)和M16(假阳性率)是反向指标,数值越低表示性能越好。在所有性能表格中,粗体突出显示了每个指标的最佳值。注意,M15和M16的列标题也用粗体表示这种反向关系,但这种粗体的目的与突出显示最佳性能的单元格不同。

表A8. 非神经网络在DRIVE数据集上的RVS分割性能。评估使用表A7中定义的20个指标(M1–M20)。参考文献
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
M16
M17
M18
M19
M20

[16]
0.947







0.963


























[92]
0.951

0.754
0.980


0.968

























































[53]
0.973
0.980
0.990
0.860







0.037


















































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































参考文献
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
M16
M17
M18
M19
M20

[16]
0.950








0.971



























[92]
0.961

0.756
0.984


0.979
































[70]
0.946

0.758
0.963


0.861






























[26]
0.939

0.580
0.982



































[100]
0.963

0.781
0.984


0.984

































[61]
0.936

0.777
0.955



































[59]
0.944
0.763
0.693
0.973




0.678


0.966

















[18]
0.941

0.759





0.043
























[27]
0.959
0.703
0.806
0.972

































[19]
0.953
0.796
0.755
0.976




0.977














0.204












[20]
0.944
0.741
0.731
0.968







0.032


















[22]
0.942
0.729
0.732
0.966





0.691

0.271
























[101]
0.954

0.722



































[64]
0.947
0.649
0.982


































[96]
0.952


































[76]
0.958



0.777
0.971

































[80]
0.951


0.790
0.965





























[83]
0.956


0.786
0.973





























[66]
0.949


0.725






















0.061








[97]
0.951


0.808
0.980


























[67]
0.957
0.825
0.741
0.983




0.754
























[24]
0.976
0.813




0.968

















0.009








[77]
0.931
0.813
0.944





























[78]
0.944
0.741
0.944






























[56]
0.934

0.785
0.951


























[72]
0.943

0.838
0.917



0.648



0.049














[72]
0.953
0.825


0.954




0.725







0.035






[95]
0.774
0.768
0.974
0.764




















[10]
0.958






























[10]
0.960






























[10]
0.965





























[68]
0.956


0.732
0.984




























[85]
0.951


0.728
0.972





























[9]
0.948


























[58]
0.952


























[102]
0.964

0.752
0.989
0.813
0.799
0.773
0.959
0.799
0.781
0.776
0.960
0.759
0.786
0.962
0.773
0.967
0.880
0.834
0.944
0.798
0.725
0.945
0.728
0.971
0.945
0.879
0.924
0.725
0.744
0.958
0.733
0.922
0.761
0.954
0.982


[15]
0.947
0.742
0.722
0.971



























[86]
0.951

0.799
0.962
0.880
0.967



























[87]
0.954

0.786
0.973





0.776
0.999

























[83]
0.958

0.786
0.973






























[68]
0.956

0.732
0.984






























[9]
0.948



























[58]
0.952






























[102]
0.964
0.752
0.989
0.813
0.799
0.773
0.959
0.781
0.962
0.967
0.880
0.799
0.776
0.786
0.965

















[10]
0.960
































[10]
0.965
































[68]
0.956


0.732
0.984































[85]
0.951

0.728
0.972






























参考文献
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
M16
M17
M18
M19
M20

[125]
0.953

0.777
0.979


0.976





















[166]
0.969

0.744
0.990


0.982

0.983

















[167]
0.953

0.762
0.981


0.968




















[197]
0.956

0.794
0.980
0.822
0.957
0.985

















[198]
0.959

0.813
0.979


0.980



















[198]
0.961

0.813
0.978






















[217]
0.969

0.804
0.984
0.818

0.984

















[208]
0.957

0.807
0.978
0.825

0.980
















[202]
0.957

0.785
0.981
0.824

0.979


















[207]
0.977

0.815
0.988



0.990
















[150]
0.969
0.864
0.828
0.986




















[203]
0.958

0.799
0.981
0.829

0.982
















[195]
0.957

0.779
0.983
0.822

0.981















[195]
0.957

0.773
0.984
0.821

0.982















[205]
0.982

0.845
0.990





0.865











[192]
0.970
0.834
0.816

0.825



















[182]
0.955






0.984


















[141]
0.943




0.943


















[210]
0.966

0.788
0.986


0.986

















[210]
0.968

0.784
0.987


0.983

















[199]
0.971
0.830
0.835
0.984
0.832
0.713
0.987
















[201]
0.958

0.864
0.969



0.956















[212]
0.972

0.841
0.984


0.988

0.832














[204]
0.958
0.862
0.800
0.981
0.830
0.983














[148]
0.911
0.777
0.696
0.957
0.733

0.827

0.682
0.679
0.816












[194]
0.965

0.825
0.979



0.978















[184]
0.979

0.793
0.997
0.869
0.976
0.989













[186]
0.970
0.829
0.984


0.984

















[178]
0.956

0.834
0.982



0.979
0.882














[155]

0.906



0.820


















[185]
0.963

0.783
0.982


0.979
















[105]
0.945

0.765
0.963




















[251]







0.981

0.828
0.802













[182]
0.955






0.984

















[123]
0.961

0.986
0.705



0.974

















[124]
0.907
0.925
0.899
0.928
0.907

0.965



















[143]
0.990

0.701
0.995



















[144]
0.990

0.803
0.998



















[126]
0.962

0.754
0.983


0.981

















[118]
0.948

0.872
0.987





















[111]
0.953

0.757
0.982



0.974















[112]
0.953

0.815
0.975


0.979



0.795












[104]
0.945
0.843
0.707
0.980


0.959



0.958












[171]
0.954

0.892
0.960


0.972
















[119]
0.952

0.778
0.978


0.978















[153]
0.957

0.835
0.975


0.982















[128]
0.958

0.804
0.980



0.982















[175]
0.961
0.863
0.754
0.984
0.748

















[121]

0.754
0.969


















[108]
0.977

0.817
0.973


0.948
















[132]
0.950

0.873
0.962


0.980

















[160]
0.951

0.799
0.974


0.974

















[176]
0.953
0.842
0.778
0.978
0.808

















[187]
0.958
0.835
0.975
0.830



















注:参考文献中,“—”表示未报告的数据。表A13:基于深度神经网络(DNN)的RVS分割在STARE数据集上的性能评估。评估使用了表A7中定义的20个指标(M1–M20)。参考文献
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
M16
M17
M18
M19
M20




[125]
0.963

0.754
0.981


0.975





















[197]
0.964

0.760
0.988
0.814
0.962
0.982



















[167]
0.963

0.771
0.985


0.970



















[202]
0.985

0.902
0.993
0.918

0.996



















[166]
0.973

0.801
0.988


0.986

0.985
















[198]
0.969

0.839
0.977


0.986

















[198]
0.970

0.840
0.976




















[150]
0.974
0.882
0.834
0.992



















[203]
0.967

0.819
0.984
0.838

0.988
















[195]
0.978

0.771
0.992
0.815


0.992















[210]
0.950

0.821
0.982


0.979


















[210]
0.961

0.821
0.982


0.983

















[199]
0.988
0.842
0.832
0.994
0.837
0.720
0.987















[204]
0.967
0.870
0.796
0.986
0.830

0.988
0.922

















[148]
0.904
0.664
0.643
0.947
0.646

0.795

0.596
0.592
0.780










[194]
0.966

0.840
0.979


0.981

















[184]
0.975

0.836
0.986
0.832
0.975



















[186]
0.974

0.821
0.984


0.986
















[178]
0.966

0.833
0.990


0.973
0.872
















[155]

0.920

0.837



















[185]
0.974

0.874
0.981



















[182]
0.975






0.993















[123]
0.954

0.986
0.563



0.954

0.650













[143]
0.991

0.707
0.996


















[144]
0.997

0.806
0.997


















[126]
0.973

0.835
0.985



0.990















[118]
0.959

0.831
0.973








0.027








[111]
0.963

0.773
0.984



0.988













[150]
0.974

0.834
0.992



















[112]
0.970

0.907
0.977



0.993



0.845










[104]
0.953
0.823
0.694
0.982


0.977







0.966




[171]
0.957

0.877
0.965



0.974














[119]
0.967

0.815
0.984


0.989



0.816












[153]
0.976

0.854
0.986



0.992















[128]
0.969

0.832
0.986


0.991

















[175]
0.963
0.834
0.781
0.983
0.772










0.970





[176]
0.959
0.823
0.756
0.981
0.788






0.835




0.799
0.946


[108]
0.981

0.810
0.979

















[160]
0.954

0.791
0.972


0.970
















[187]
0.963

0.795
0.963
0.816


















[132]
0.971

0.797
0.990


0.988















izzer:

注意:参考文献:“—” 表示未报告。表 A14. 基于深度神经网络(DNN)的 RVS 分割在 CHASE_DB1 数据集上的性能。评估使用了表 A7 中定义的 20 个指标(M1–M20)。参考文献
M1
M2
M3
M4
M5
M6
M他在2023年从马萨里克大学获得了博士学位,研究方向是用于医学图像分析的几何方法。他的研究兴趣包括计算机视觉和深度学习在生物医学成像中的应用。目前他的工作主要集中在视网膜解剖结构和病理的自动化分析与表征上,重点在于提取客观参数以支持早产儿视网膜病变(ROP)的临床诊断。Jan Kubí?ek(项目负责人)是捷克奥斯特拉瓦VSB技术大学控制论与生物医学工程系的学术研究人员。他于2012年获得生物医学工程硕士学位,2018年获得技术控制论博士学位,所有这些学位均来自VSB–TUO。他的研究领域包括医学图像与信号处理、数据科学以及人工智能在生物医学工程中的应用,尤其致力于通过先进的计算方法提高诊断准确性。

**数据可用性声明:**

本研究未创建或分析任何新的数据。所有引用的数据均来自手稿中提到的先前已发表的研究成果。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号