一种加权融合策略,用于从高光谱数据中稳健地提取端元

《Advances in Space Research》:A Weighted Fusion Strategy for Robust Endmember Extraction from Hyperspectral Data

【字体: 时间:2026年05月10日 来源:Advances in Space Research 2.8

编辑推荐:

  赛义德·戈利内贾德(Saeid Gholinejad)|阿里雷扎·阿米里-西姆库伊(Alireza Amiri-Simkooei) 摘要:从高光谱图像中提取端元数据,通过无监督地识别场景中存在的材料,是高光谱图像处理的基本步骤。现有方法通常分为两大类:基于极端投影的方法和基于单

  赛义德·戈利内贾德(Saeid Gholinejad)|阿里雷扎·阿米里-西姆库伊(Alireza Amiri-Simkooei)

摘要:从高光谱图像中提取端元数据,通过无监督地识别场景中存在的材料,是高光谱图像处理的基本步骤。现有方法通常分为两大类:基于极端投影的方法和基于单纯形的体积方法,每种方法都有不同的端元提取策略,并且在不同数据集上的性能各不相同。为了结合这两种方法的优势,本研究引入了一种基于决策级别的融合框架——DFEE(Decision-Level Fusion for Endmember Extraction)。DFEE通过图像重建误差(RE)引导的无监督加权过程,整合了四种众所周知、简单且计算效率高的基础算法(ATGP、VCA、PPI和N-FINDR)的结果。本质上,DFEE提供了一个通用的融合框架,能够整合这些算法的输出以获得最优解,同时保持了对各种基础方法的灵活性。在合成和真实高光谱数据集上的实验结果表明,DFEE的表现始终优于现有方法。计算分析进一步表明,由于基础算法的高效率和轻量级的融合流程,DFEE不会带来显著的计算开销。

引言:高光谱图像(HSI)具有数百个狭窄且连续的光谱带,覆盖了电磁波谱的宽广范围,被认为是地球表面进行详细材料识别和监测的最强大资源之一。这些图像的高光谱分辨率使得即使在光谱特征相似的情况下,也能够准确区分场景中的不同材料。这一能力使它们成为农业科学(Pande和Moharir,2023年)、环境监测(Rajabi等人,2024年)、军事行动(Shimoni等人,2019年)和矿产勘探(Peyghambari和Zhang,2021年)等多种应用中的强大工具。另一方面,高光谱成像知识与技术的进步,以及免费和最先进的高光谱卫星及传感器(如PRISMA)的发射,提高了遥感社区及其产品最终用户对高光谱图像的关注度。尽管HSI具有高识别能力,但混合像素(即在单个空间单元中包含多种材料的像素)却构成了一个主要挑战。这类像素的产生通常是由于传感器分辨率低、多次光散射和微观材料混合(Bioucas-Dias等人,2012年)所致,从而降低了高光谱分析的有效性。为了应对混合像素问题并识别其组成材料,出现了高光谱解混(HU,Hyperspectral Unmixing)方法。

HU是将混合像素分解为材料的光谱特征(称为端元)并估计其相应分数贡献(称为丰度)的过程。根据混合程度——宏观混合(由低空间分辨率引起)或微观混合(由多次散射或紧密材料混合引起)——HU方法可以分为线性混合模型(LMM,Bioucas-Dias等人,2012年)和非线性混合模型(NLMM,Heylen等人,2014年)。由于高光谱传感器的低空间分辨率是混合像素的主要原因,且LMM在数学上更为简单,因此在HU研究中被最广泛使用。HU的整体过程通常包括三个主要步骤:(1)估计端元数量;(2)端元提取;(3)估计丰度分数。第一步是使用子空间识别、虚拟维度或内在维度估计方法来估计高光谱场景中存在的纯材料数量。其中最著名的技术包括基于最小误差的高光谱信号子空间识别(HySime,Bioucas-Dias和Nascimento,2008年)及其图正则化变体(GHySime,Gholinejad等人,2017年),以及基于HySure(Rasti等人,2015年)和阈值脊比(TRR)的方法(Zhu等人,2020年)。第二步是端元提取,即识别HSI中纯材料的光谱特征。最后一步是估计每个像素中已提取端元的丰度。在这些步骤中,端元提取是本研究的主要焦点,因为此阶段的错误不仅会阻碍场景中材料的准确识别,还会对后续的丰度估计过程产生不利影响。通常,可以使用多种方法提取端元,包括几何方法、统计方法、深度学习算法和元启发式策略。值得注意的是,同样的分类也可以应用于HU方法。

几何方法基于这样一个假设:特征空间中包围单纯形的数据顶点对应于端元(Bioucas-Dias等人,2012年)。统计方法是另一类重要的HU技术,它们基于HSI像素的统计特性进行操作。这些方法能够同时估计端元光谱及其相应的丰度。在统计方法中,非负矩阵分解(NMF,Feng等人,2022年)被认为特别适合HU,因为它具有非负性约束,这与HU的物理特性相符,并且具有高可解释性。基于深度学习的方法也是为HU提出的另一类重要方法。自Palsson等人(2018年)首次进行基于深度学习的研究以来,已经开发了许多基于自动编码器架构的HU变体(Su等人,2019年;Palsson等人,2020年;Elkholy等人,2020年;Jin等人,2021年;Chen等人,2023年;Su等人,2024年;Zhao等人,2024年)。专门为HU开发的元启发式方法通常优化目标函数,如重建误差(RE)或单纯形体积,从而与几何方法紧密对齐。近年来,提出了许多单一目标(Yang等人,2015年;Xu等人,2017年;Soares等人,2019年)和多目标(Liu等人,2017年;Cheng等人,2019年;Jiang等人,2022年;Cheng等人,2023年;Ye等人,2023年)的元启发式算法,采用搜索策略来识别HSI中的纯像素。除了上述方法外,基于稀疏回归的方法也是另一类HU技术。这些方法以半监督的方式运行,从预定义的端元矩阵(称为光谱库)中估计丰度矩阵,从而避免了显式的端元提取。

在各种HU方法中,几何方法通常比其他技术更简单、更易解释,同时在广泛的应用中仍能提供满意的表现。此外,它们通常比其他类别的HU方法快得多。此外,“端元估计”这一术语特别适用于这类方法,因为它们专门用于识别端元。相比之下,统计方法没有明确的端元提取阶段,而基于回归的方法则依赖于从光谱库获得的光谱。几何方法可以分为两大类:基于纯像素假设的方法和基于非纯像素假设的方法。从用于端元提取的标准来看,该领域提出的方法还可以分为基于单纯形体积的方法和基于投影的方法。据我们所知,基于单纯形体积的方法起源于Michael Winter在1999年的工作,他提出了这样一个观点:特征空间中由纯像素构成的单纯形具有最大的体积,这促成了著名的N-FINDR算法(Winter,1999年)的开发。这项工作激发了许多扩展和改进版本,如基于优化的改进(Chan等人,2011a;Chang等人,2006年)、更快的变体(Xiong等人,2011年;Luo等人,2012年;Dowler等人,2012年;Zhao等人,2015年;Chang等人,2009b;Ganjimala,2022年)、对初始化具有鲁棒性的版本(Chang等人,2010年)以及对噪声具有鲁棒性的版本(Chan等人,2011b;Chan等人,2013年)。当存在纯像素时,最大体积单纯形方法表现良好,但在没有纯像素的高度混合高光谱场景中则失效。为了解决这个问题,提出了最小体积包围单纯形(MVES,Chan等人,2009年)方法,该方法将端元估计为包围所有数据点的最小单纯形的顶点。在MVES之后,开发了几个增强版本,其中通过分裂增广拉格朗日(SISAL,Bioucas-Dias,2009年)和最小体积单纯形分析(MVSA,Li等人,2015年)尤为值得注意。

近年来,多项研究使用基于单纯形体积的方法改进了端元提取。为了降低MVSA的计算负担,Jamshid-Moghaddam等人采用了聚类和多标准决策进行数据降维(Jamshid Moghadam等人,2021年),而Li和Tan(2024年)引入了一个凸项以提高对初始化的鲁棒性。除了基于体积的方法外,还类似地利用了凸性,例如基于熵的凸集优化(ECSO,Shah等人,2020年),该方法使用带状熵进行凸集优化,以及基于分散指数的端元提取(DIEE,Shah和Zaveri,2021年),该方法基于分散指数应用凸几何。此外,还提出了诸如快速子空间基预处理模块(FSPM,Shen等人,2021年)之类的预处理模块,在端元提取之前减少高光谱数据中的噪声和异常值。如前所述,基于投影的方法是另一类用于端元提取的几何方法。在基于投影的方法中,数据首先从原始空间映射到低维子空间。该领域最早的研宄之一是著名的自动目标生成过程(ATGP,Ren和i Chang,2003年),它使用了正交子空间投影(OSP,Harsanyi和Chang,1994年)的概念。在此基础上,提出了顶点成分分析(VCA,Nascimento和Dias,2005年),这是最广泛使用的端元提取方法之一。另一种广泛使用的基于投影的端元提取方法是像素纯度指数(PPI)。PPI方法最初由Boardman(Boardman,1993年)提出,后来Chang和Plaza(2006年)提出了一个更快、改进的版本,由于其更高的计算效率而更常被使用。然而,随后提出的大多数基于PPI的方法主要集中在提高计算效率上(Gu等人,2015年;Wu等人,2013年;Sánchez和Plaza,2010年;Heylen和Scheunders,2012年;Chang和Wu,2015年)。尽管如此,除了速度外,PPI还面临多个挑战,包括需要事先知道串的数量、由于随机选择而导致的不稳定性和结果不可重复性,以及在使用NMF变换时需要预先定义降维的数量。为了克服这些限制,开发了一些改进的PPI版本(Chang等人,2009a;Chang等人,2017年)。

尽管上述端元提取方法有一些优点,但它们通常依赖于单一标准(如最大/最小单纯形体积或极端投影),这限制了它们充分利用数据的潜力,经常导致某些材料和场景的光谱不准确。最近引入的基于凸性的纯度指数(CPI,Shah等人,2025年)方法通过结合两种标准来缓解这一限制;然而,它仍然受到计算效率有限和在特定场景下性能不佳的限制。为了克服这些挑战,我们提出了一种基于决策融合的端元提取(DFEE)框架,该框架整合了几种快速且简单的算法的输出,包括ATGP、VCA、PPI和N-FINDR。每种方法独立执行,由于它们不同的底层逻辑,产生不同的光谱。然后使用完全约束最小二乘(FCLS,Heinz和Chein-I-Chang,2001)估计丰度矩阵,并计算重建误差(RE)度量来评估和加权输出,最终融合这些输出以生成最终光谱。值得注意的是,尽管仅用四种基础方法进行了演示,但DFEE框架本质上是可扩展的,可以轻松适应更广泛的端元提取技术。

总而言之,所提出的DFEE框架的主要贡献如下:
- **一种新颖的无监督加权融合架构用于端元提取**:我们引入了一种完全无监督的融合框架,系统地整合了多种基础端元提取算法的输出。关键的方法创新在于使用RE作为动态计算融合权重的原则性标准,实现了自适应和数据驱动的整合策略。
- **一种组合多策略融合机制**:DFEE框架将基于根本不同提取原理的基础方法(如极端投影和最大体积策略)统一在一个组合结构中。这种整合比任何单一策略都能提供更全面的端元空间表征。
- **一种计算效率高且具有内在并行性的设计**:通过利用基础算法的速度并采用支持并行执行的结构,DFEE框架在不牺牲准确性的情况下实现了高计算效率。该设计使得融合后的解决方案在保持较低计算复杂度的同时,显著优于每种基础方法。
• 引入了一种与方法无关且可扩展的融合架构:DFEE框架被明确设计为独立于基础端元提取方法的选择。任何合适的技术都可以在公平且一致的条件下嵌入到该架构中。这种方法论的通用性表明,即使是简单且计算量不大的算法,通过所提出的融合机制系统集成后,也能产生稳健且准确的结果。

本研究的其余部分组织如下:第一节简要介绍了LMM和基础方法,并介绍了所提出的DFEE端元提取框架。第二节展示了从合成和真实高光谱数据集中获得的实验结果并进行了分析。最后,第四节对研究进行了总结。

**方法论**
在本节中,在介绍LMM公式之后,我们简要概述了使用四种基础方法(包括ATGP、VCA、PPI和N-FINDR)的概念和端元提取过程。前三种方法属于基于极值投影的方法,而最后一种方法则被归类为基于单纯形的体积方法。选择这些方法的主要原因是它们具有较高的计算效率,旨在结合简单快速的方法来实现端元提取。

**数据集描述**
在本节中,进行了一系列实验来评估所提方法的性能。使用了四个高光谱数据集:Data Cube-3(DC3)、Samson、Jasper Ridge和Urban。DC3数据集是由Rasti等人(2024年)首次提出的合成高光谱数据集,而其余三个数据集是广泛使用的真实高光谱图像,作为高光谱研究中的标准基准。

**结论**
在本研究中,提出了一种基于决策级的融合框架DFEE,用于改进高光谱图像的端元提取过程。该框架基于四种著名、简单且计算效率高的基础方法构建:ATGP、VCA、PPI和N-FINDR。在所提出的框架中,首先使用FCLS方法估计这些基础方法提取的端元的相应丰度,然后将其组合起来。

**利益冲突声明**
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:[Saeid Gholinejad报告称其获得了伊朗克尔曼省高级技术大学科学与高科技环境科学研究所的财务支持。报告了一项涉及……的关联。如果还有其他作者,他们声明没有已知的财务利益或个人关系。]

**致谢**
本研究得到了伊朗克尔曼省高级技术大学科学与高科技环境科学研究所的支持,资助编号为03/595。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号