《Analytica Chimica Acta》:A Semi-Supervised Domain Adaptation Framework with Attention-Enhanced ResNet50 for LIBS-Based Soil Classification under Spectral Distribution Shift
编辑推荐:
激光诱导击穿光谱(LIBS)土壤分类中采用半监督域适应(SSDA)框架,通过Gramian Angular Field(GAF)将一维光谱转为二维图像,结合SE-ResNet50与注意力机制,有效缓解跨域光谱分布偏移,在目标域测试集达到97.67%分类精度。
何一华|丁宇|李向初|徐建安|谭强|于伟业|李金毅|庞茂园|刘欣欣|周旺平
南京信息科学技术大学自动化学院,中国南京 210044
摘要
背景
激光诱导击穿光谱(LIBS)作为一种快速且无损的分析技术,在土壤分类研究中得到了广泛应用。近年来,LIBS与深度学习的结合显著提升了土壤分类任务的性能。然而,由于土壤物理和化学性质的变化导致的光谱分布偏移对模型性能构成了重大挑战。因此,迫切需要一种有效的方法来解决光谱分布偏移问题,并减轻其对分析结果的影响。
结果
本研究提出了一种半监督领域适应(SSDA)框架,用于LIBS光谱的跨领域分类。具体而言,经过特征降维处理的一维光谱数据通过Gramian角场(GAF)技术被编码为二维图像,以增强特征表示能力。随后,基于SE-ResNet50的深度卷积神经网络被设计用来通过注意力机制关注关键特征。在此基础上,通过结合基于模型的迁移学习(MBTL)和伪标签学习(PLL),开发出了SSDA框架,逐步提高模型对目标领域的适应性。在该框架中,MBTL利用源领域的知识对目标模型进行初始化,而PLL则通过利用高置信度预测来扩展监督信号。实验结果表明,所提出的方法在目标领域测试集上的分类准确率达到97.67%,显著优于其他对比模型。
意义与创新
本研究验证了所提出方法在减轻光谱分布偏移方面的有效性,并成功解决了由于土壤样本差异引起的光谱分布偏移问题。基于该方法,LIBS技术在跨领域土壤分类中的性能得到了显著提升,展示了其在土壤分析领域的应用潜力。
引言
近年来,激光诱导击穿光谱(LIBS)作为一种实时分析技术,因高效性和准确性而受到了广泛关注[1][2]。LIBS技术能够快速、无损地提供关于土壤元素组成的信息,对于环境监测和农业管理具有很高的价值[3][4][5]。随着深度学习算法的发展,LIBS数据分析能力得到了显著提升,特别是在土壤分类和元素浓度量化方面,其能力超越了传统的机器学习方法[6][7]。此外,深度学习模型能够自动从原始数据中提取特征,有效处理高维、复杂的光谱数据,消除干扰和噪声,提高分类准确率。
目前的基于深度学习的LIBS光谱分析方法主要采用两种数据表示策略:一维光谱向量或从一维光谱向量重塑而成的二维特征矩阵。在一维光谱建模中,Xu等人[8]构建了一个一维卷积神经网络(1DCNN)用于LIBS光谱分析,无需预处理即可预测土壤类型及多种物理化学性质(如pH值、SOM、TN、TP和TK)。Khalilian等人[9]采用CNN-LSTM架构对珠宝岩石进行分类,利用CNN提取特征,LSTM进行预测。Chen等人[10]提出了一种基于深度信念网络(DBN)的便携式LIBS钢分类方法,优化后的DBN在全谱数据上的测试准确率达到100%,优于其他方法。这些研究表明,1DCNN和DBN等深度学习模型能够有效从一维LIBS数据中提取光谱特征,并在分类和回归任务中表现出优于传统机器学习方法的性能。在二维光谱建模中,Chen等人[11]将LIBS与2D卷积神经网络(2D-CNN)结合使用,将1×6144的光谱向量重塑为64×96的矩阵作为模型输入,这种方法提高了分类准确率。Li等人[12]探索了LIBS与深度CNN模型的结合,用于铜样品的分类,所有模型的准确率均超过92%。这些研究表明,将一维光谱数据转换为二维结构化表示有助于改善特征表示。同时,Gramian角场(GAF)最近被应用于将一维光谱数据转换为二维形式,并取得了有希望的结果[13][14][15]。与基于重塑的方法不同,GAF包括Gramian角和场(GASF)和Gramian角差场(GADF),它产生了一种结构化的二维表示:其对角线元素编码了序列中不同点之间的角度关系,而对角线上的GASF保留了每个点的信息,GADF则为零。基于这一优势,我们使用GAF将提取的一维序列转换为二维表示,并将其与深度卷积神经网络和注意力机制结合用于LIBS分类。
然而,深度学习模型通常在训练和测试数据遵循相同分布的假设下进行训练[16]。但在LIBS数据分析中,由于土壤样本的物理化学性质差异、实验条件变化以及光谱噪声干扰,可能会出现光谱分布偏移(领域偏移)[17]。例如,在同一土壤样本的不同位置进行激光烧蚀会导致等离子体形成、矩阵效应和微观结构差异,从而引起光谱分布偏移,影响模型的泛化性能[18]。为了减轻光谱分布偏移,采用了无监督领域适应(UDA)和特征迁移学习[19][20][21]。例如,Huang等人[20]提出了一种结合自学习和类平衡自适应学习的UDA方法用于土壤分类,利用迭代伪标签优化和动态类选择策略来提高模型适应性。Rao等人[19]引入了一种基于迁移成分分析(TCA)的特征迁移学习方法,以建立特征映射关系,减轻LIBS定量分析中压块样本和岩石样本之间的光谱分布差异。然而,由于缺乏标记的目标领域数据,无监督领域适应方法和特征迁移学习方法可能会导致伪标签生成不准确和特征对齐不佳,从而影响模型稳定性和性能。
为了解决这一挑战,我们提出了一种优化的LIBS光谱分析方法。首先,使用GAF技术将光谱特征编码为二维图像。基于ResNet50架构的分类模型结合了Squeeze-and-Excitation(SE)通道注意力模块,以优化模型性能。此外,为了减轻跨领域的光谱分布偏移,采用了半监督领域适应(SSDA)策略,结合基于模型的迁移学习(MBTL)和伪标签学习(PLL),有效利用有限的目标领域标记数据,并通过迭代更新的伪标签进行联合微调来提高模型泛化能力。以下部分详细介绍了所提出的方法及其实验验证。
实验设置和数据集
本研究使用的数据集改编自公开的LIBS基准分类数据集[22],该数据集最初包含12个类别的138个样本。最终处理后的数据集包含11个类别的132个物理样本,分为源领域(94个样本,18,800个光谱)和目标领域(38个样本,20,000个光谱)。
源领域和目标领域的构建分别基于原始数据集的训练集和测试集。
数据分析和光谱维度转换
以源领域和目标领域中的赤铁矿类别为例来说明光谱分布偏移问题,数据集包含七个子类(H1至H7)。源领域包含四个子类(H1、H2、H3、H4),而目标领域包含三个子类(H5、H6、H7)。每个子类在元素组成上有所不同,具体细节见附表Ⅱ。这种配置揭示了源领域和目标领域之间的分布差异。
结论
本研究通过开发半监督领域适应(SSDA)框架,解决了基于LIBS的土壤分类中的光谱分布偏移问题。该框架结合了基于模型的迁移学习(MBTL)和伪标签学习(PLL),以适应性地减少领域差异并提高跨领域分类性能。在此框架中,MBTL通过微调实现高效适应目标领域,而PLL则迭代更新伪标签。
CRediT作者贡献声明
李向初:可视化、验证、软件开发。
谭强:可视化、验证。
徐建安:形式化分析、数据管理。
李金毅:验证、形式化分析。
于伟业:方法论、研究设计。
刘欣欣:监督、资金筹集。
庞茂园:监督、项目管理。
周旺平:监督、项目管理。
丁宇:写作——审稿与编辑、监督、资金筹集、概念构思。
何一华:写作——初稿撰写、方法论设计。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
数据可用性
支持本研究结果的数据可向相应作者索取。
致谢
本研究得到了以下机构的资助:
国家自然科学基金(62105160、62203225)、
江苏省自然科学基金(BK20220443)、
江苏省高等教育机构自然科学基金(22KJB120005)、
江苏省研究生研究与实践创新计划(SJCX25_0494)、
教育部的
吉林大学地球物理勘探装备重点实验室(GEIOF 20240402),
以及
青兰项目。