随着光谱成像技术的不断进步,遥感在理论和实际应用方面都取得了显著飞跃。高光谱成像产生的高光谱图像(HSI)通常包含数百个波段。由于不同物体在光谱中的吸收和反射特性不同,HSI能够准确捕捉物理结构和化学成分的细微差异。因此,HSI已被广泛应用于多个领域[1]、[2]、[3]、[4]。
尽管HSI可以提供丰富的信息,但其庞大的数据量也给数据传输、处理和存储带来了前所未有的挑战[5]。HSI数据的巨大体积不仅导致计算资源消耗显著增加,还由于噪声和冗余波段的干扰而难以保持高分类精度。因此,有效降低HSI的数据维度至关重要。波段选择(BS)[6]、[7]是一种广泛使用的HSI降维技术,它通过识别关键波段并丢弃噪声或冗余波段来减少数据量。另一种降维策略是特征提取[8]、[9],它通过线性或非线性变换将原始光谱数据转换为另一种表示形式,并选择最重要的特征。然而,特征提取常常会破坏原始HSI数据的结构。相比之下,BS可以在保留原始数据物理特性的同时实现降维,并为后续处理提供更准确可靠的基础。
根据对标记样本的依赖程度,高光谱BS可以分为三种类型:监督式[10]、半监督式[11]、[12]和无监督式[13]、[14]。监督式BS依赖于大量标记样本,并根据波段与标签之间的相关性来确定所选波段。然而,在实际应用中,获取足够多的标记样本往往具有挑战性。因此,无监督式和半监督式方法更为实用,成为主流方法。无监督式BS不依赖任何标签信息。通常,无监督式BS分析原始HSI数据,根据某些标准构建模型来评估波段的信息内容、波段间相关性或其他信息,并选择最有价值的波段。半监督式BS引入了一些无标签的标记样本,以进一步评估波段区分不同物体的能力,并选择对分类最有利的波段。考虑到标签信息的稀缺性,在半监督式BS中只使用部分标记样本。这与实际应用场景密切相关,具有重要的实际意义。
根据采用的策略,高光谱BS可以分为两大类:基于进化算法(EA)的方法[13]、[14]、[15]、[16]、[17]、[18]、[19]和基于非EA的方法[20]、[21]、[22]、[23]、[24]、[25]。具体来说,基于非EA的方法利用空间、几何、图或统计特性通过排名[20]、[26]、聚类[27]、[28]、搜索[29]、[30]、混合策略[31]以及基于深度学习的方法[32]、[33]、[34]等来选择波段。需要注意的是,HSI中的波段可以嵌入到图中,聚类策略被用来确定最优波段子集[28]、[35]。由于EA具有强大的全局搜索能力[36]、[37]、[38]、[39]、[40],并且被用于解决许多离散决策问题[41]、[42]、[43],一些研究人员引入了EA来解决高光谱BS问题[1]、[44]。如果有两个或多个目标需要优化,多目标EA(MOEA)可以确定一系列平衡多个冲突目标的最佳解决方案。基于MOEA的BS不需要为不同目标设置任何权衡参数,最近受到了越来越多的关注[17]、[45]、[46]。
此外,高光谱BS本质上是一个特征选择问题。因此,BS问题通常从特征选择的角度来解决。目前,主流的特征选择算法可以分为三类[47]:包装器[12]、[48]、[49]、基于滤波器的方法[11]、[12]、[17]、[19]、[25]、[46]、[50]、[51]、[52]和嵌入[53]、[54]、[55]。基于滤波器的方法分析特征本身的属性或特征之间的相关性来选择特征。其显著优势是速度快,但往往会牺牲精度。基于包装器的方法根据分类性能来选择特征。因此,在基于包装器的方法中需要分类器。然而,当所选特征发生变化时,需要重新训练分类器,这无疑会增加时间复杂性,对于大规模数据来说效率较低。显然,大多数无监督式BS算法属于滤波器类型,而许多监督式和半监督式BS算法属于包装器类型。在这项工作中,我们考虑结合包装器和滤波器方法的优点来获得更好的波段子集。
深入研究基于滤波器的BS方法,传统的无监督基于滤波器的BS方法设计了各种指标来评估所选波段子集的性能,而不是实际分类器的性能,而这些指标通常与分类性能不一致。如图1所示,我们对Indian_Pines数据集上SVM分类器的分类精度与波段子集的方差或互信息之间的关系进行了统计分析。众所周知,方差和互信息是基于滤波器的BS算法中常用的指标。然而,在实际情况中,随着方差的增加或互信息的减少,分类性能可能并不会必然得到改善。为了解决这个问题,我们提出了一种辅助包装器引导的多标准基于滤波器的进化波段选择算法(WFBS)用于高光谱图像分类。一方面,从多个角度同时优化更多的滤波器指标,以提高基于滤波器的BS的鲁棒性。另一方面,构建了辅助包装器任务来纠正和指导基于滤波器的BS任务的解决过程。在辅助包装器任务中,仅使用少量标记样本和简单的分类器来评估分类性能,从而避免复杂性大幅增加。这两个任务相互配合,以确定不同大小的最优波段子集。本研究的主要贡献包括以下三个方面:
(1) 与现有的多目标EA基BS(特别是多任务基BS(MTBS)[12]不同,提出的多标准基于滤波器的BS旨在获得连续大小的高质量波段子集。对于这个滤波器任务,同时优化波段内包含的信息、波段间的互信息和空间结构维护,从多个角度评估波段子集。为了提高滤波器任务的性能,将仅使用少量标记样本和简单分类器的辅助包装器任务嵌入到滤波器任务中,以指导和纠正基于滤波器的BS。
(2) 在基于滤波器的BS中,提出了基于领导者的学习策略来生成后代个体。该策略旨在连接滤波器和包装器任务,纠正滤波器指标与分类性能之间的不一致性,同时保持所选波段的大小。滤波器种群中的个体被分为领导者和非领导者。领导者作为学习目标,指导非领导者的进化。
(3) 在一次运行中,WFBS可以输出包含不同大小选定波段的子集。实验结果表明,我们提出的WFBS在广泛使用的高光谱数据集上优于现有的最先进BS算法。
本文的其余部分组织如下:第2节回顾相关工作。第3节介绍我们提出的WFBS的主要组成部分和细节。第4节展示并讨论了我们提出的WFBS与最先进BS算法的实验结果。最后,我们在第5节总结我们的发现。