一种两阶段迁移学习框架,用于利用原位激光诱导击穿光谱(LIBS)数据进行少量样本火星氧化物定量分析

【字体: 时间:2026年02月14日 来源:Spectrochimica Acta Part B: Atomic Spectroscopy 3.2

编辑推荐:

  定量分析模型在MarSCoDe小样本场景下的跨仪器迁移学习研究。摘要:本研究提出Two-Stage Transfer Learning(TTL)框架,通过光谱对齐与分层微调解决MarSCoDe小样本问题,将氧化物预测误差降低70.2%,优于传统方法与端到端迁移学习。

  
张卓贤|刘思聪|童晓华|谢焕|金彦敏|姜龙|熊永刚|罗凯月
同济大学测绘与地理信息学院,中国上海200092

摘要

利用火星原位激光诱导击穿光谱(LIBS)数据开发主要氧化物的稳健定量模型依赖于合适的校准数据集。然而,对于诸如“祝融”号火星车上的火星表面成分探测器(MarSCoDe)这样的仪器来说,获取此类校准样本受到限制。为了解决这一挑战,我们开发了两阶段迁移学习(TTL)框架。TTL框架将跨仪器迁移学习分为光谱对齐和模型微调两个阶段。在第一阶段,通过使用共享的校准目标来对齐ChemCamMarSCoDe的光谱,建立一个统一的光谱空间。这一过程保留了特征光谱线,同时消除了仪器特有的差异。在第二阶段,利用ChemCam数据集预训练的模型,并通过逐层微调将其适应到MarSCoDe数据集。尽管数据限制严格,这种方法仍能有效地使模型适应目标领域。我们评估了五种模型,用于预测MarScoDe校准样本中八种主要氧化物的浓度,分别应用了完整的TTL框架或相应的阶段。实验结果表明,与传统的光谱对齐方法和端到端迁移学习方法相比,TTL框架将预测误差降低了70.2%和46.7%。在框架内,LIBSFormer模型取得了最佳性能,均方根误差(RMSE)为2.56 wt%,比基线CNN模型提高了41.0%。消融研究证实了逐层微调显著提升了性能。此外,使用原位ChemCam数据作为源域比实验室模拟的光谱获得了更优越的结果。这些发现表明,TTL框架结合深度学习模型,有效地解决了与火星原位LIBS定量分析中的少样本场景和跨仪器光谱迁移相关的问题。

引言

对火星表面的原位探索对于理解这颗红色星球的地质历史、气候演变和潜在宜居性至关重要。在各种有效载荷中,由于激光诱导击穿光谱(LIBS)能够对表面材料进行定量元素分析,因此在火星任务中广泛部署了这类仪器。迄今为止,已有三种LIBS仪器在火星上成功进行了原位测量[1]:美国国家航空航天局(NASA)“好奇号”火星车上的ChemCam[2]、[3]、“毅力号”火星车上的SuperCam[4],以及中国国家航天局(CNSA)“祝融”火星车上的火星表面成分探测器(MarSCoDe[6]。目前,ChemCamSuperCam已经共同收集了超过30,000个LIBS观测数据,并且仍在持续收集新数据,而MarScoDe在“祝融”号进入休眠状态之前获得了94个原位LIBS观测数据。
针对火星原位LIBS数据的定量分析方法已经从单变量方法发展到复杂的多变量技术。早期研究主要采用线性拟合方法,包括内标校准[7]、[8]和多变量线性校准方法[9]。这些方法基于LIBS定量分析的基本原理,即假设目标元素的特征光谱线强度与其在样品中的浓度之间存在线性关系[10]、[11]。然而,这些线性方法的定量精度常常受到LIBS物理特性的复杂性的限制,主要是偏离局部热力学平衡(LTE)条件以及地质样品中的显著矩阵效应。此外,不同的仪器响应和特定的实验条件进一步复杂化了光谱-成分关系,需要采用更复杂的非线性解决方案。
随后,研究人员引入了各种机器学习方法。例如,基于ChemCam校准数据集并使用独立成分分析(ICA)和偏最小二乘(PLS)方法训练的多变量氧化物成分(MOC)模型,对主要氧化物实现了平均2.31 wt%的均方根误差(RMSE)[12]。其他方法,包括支持向量回归(SVR)[13]和反向传播神经网络(BPNN)[14]也得到了研究。最近,深度学习技术在LIBS分析中展现了巨大潜力[15]。曹等人[16]优化了卷积神经网络(CNN)模型,将ChemCam校准数据集的主要元素平均RMSE降低到了1.71 wt%。刘等人[17]进一步推进了这一领域,使用LIBSFormer模型实现了相同数据集的平均RMSE为1.25 wt%,比MOC基准提高了45.9%。然而,深度学习方法的有效性严重依赖于足够的训练数据。由于NASA在行星数据系统(PDS)平台上发布的ChemCam数据集是最大的公开可用资源(包含超过20,000个标记观测数据),目前使用深度学习模型进行火星原位分析的研究主要依赖于ChemCam数据集。
由于火星探索任务的限制,MarScoDe仅收集了94个原位LIBS光谱[18],其中只有34个光谱适合用于模型训练。这个有限的数据集不足以开发可靠的定量模型,因为通常需要更大的样本量来学习复杂的光谱-成分关系。为了解决这一少样本挑战,通过迁移学习利用其他LIBS仪器的数据已成为一种关键策略。这些方法的实际实现差异很大,从数据级别的光谱对齐到模型级别的领域适应都有。
传统的跨仪器迁移方法主要集中在光谱对齐上。ChemCamSuperCam团队已经成功实现了此类数据级别的迁移,以弥合地球工程模型和火星飞行模型之间的差距[12]、[19]、[20]。对于包括MarScoDe在内的异构仪器,刘等人[21]使用共享的橄榄石校准目标将ChemCam的光谱线强度转换为MarScoDe的光谱强度,从而能够将为ChemCam数据建立的多变量模型应用于MarScoDe数据集。金等人[22]提出了一种四步光谱转换方法,将山东大学开发的SDU-LIBS系统和MarScoDe-LIBS数据转换为ChemCam格式。
深度迁移学习在捕捉非线性关系和跨领域知识转移方面展现了显著的能力。特别是端到端迁移学习,能够直接从数据中自动学习最优的领域适应,无需手动特征工程或显式建模仪器差异。因此,最近的研究越来越多地关注端到端方法。王等人[23]使用了领域自适应全连接网络(DAFCN)来弥合MarScoDe和其他LIBS仪器之间的光谱领域,并在SDU-LIBS数据集上验证了该方法。崔等人[24]引入了一种迁移学习方法,使用预训练的卷积神经网络(CNN)代替数据转移进行知识转移,证明了其在ChemCam原位光谱上的泛化性能。
除了这些方法,一些研究还使用火星模拟环境作为直接迁移的替代方案。万等人[25]和刘等人[26]在地球实验室的模拟火星条件下使用复制品/类似仪器收集了更多数据。然后使用这些来自实验室的LIBS数据为MarScoDe原位数据集开发了定量分析模型。
然而,MarScoDe数据集的少样本问题对现有的跨仪器定量分析方法提出了三个主要挑战:
  • 1)
    端到端迁移学习方法通常试图从头开始学习光谱特征映射(例如,线位置和强度)。这个过程非常耗数据,使得在没有显式光谱对齐的情况下很难为MarScoDe数据实现高定量精度。
  • 2)
    在少样本限制下,迁移模型经常对有限的MarScoDe训练数据表现出严重的过拟合,使其不适合分析未知的火星目标。
  • 3)
    依赖地球实验室数据集作为源域存在挑战,因为实验室设置与MarScoDe飞行模型之间存在显著的仪器差异(例如,激光参数和光学设计)。这些硬件差异使得建立校准一致性变得困难,从而影响了领域转移的有效性。
  • 为了解决上述挑战,本研究提出了两阶段迁移学习(TTL)框架,旨在促进火星原位光谱对齐和定量建模的跨仪器数据迁移。该框架能够在少样本场景下对MarScoDe LIBS数据集中的主要氧化物进行高精度定量分析。主要创新和贡献总结如下:
  • 1)
    TTL框架在传统的端到端迁移学习之前引入了光谱对齐阶段,减少了原位数据集之间的领域差异。通过结合逐层微调,它将大规模ChemCam数据集的光谱知识转移到MarScoDe的少样本数据集。这种方法提高了MarScoDe校准数据在少样本场景下的氧化物浓度预测精度,减少了过拟合,并改善了对未见数据的泛化性能。
  • 2)
    新颖的TTL框架仅使用火星LIBS数据实现了完全的原位跨仪器模型迁移,显著减少了对新的地球校准数据或MarScoDe参考光谱库的依赖。通过利用直接在火星上获取的数据集,迁移模型受益于具有相似环境背景的源域,从而有效弥合了领域差异,缓解了仪器不匹配的挑战。
  • 本文的其余部分结构如下:第2节介绍了本研究中使用的LIBS数据集。第3节详细介绍了提出的TTL框架。第4节展示了实验结果和分析。最后,第5节总结了本研究。

    部分摘录

    MarScoDe数据集

    截至第276太阳日(2022年2月21日),MarScoDe已收集了94个LIBS光谱,包括54个校准光谱和40个科学光谱。在校准光谱中,由于数据质量问题,第21太阳日收集的第一个光谱被排除在外。校准光谱是数据处理的关键基准。表1列出了用于收集校准数据的12个MarScoDe校准目标(MCCT)。这些MCCT具有八种主要氧化物(SiO2、TiO2、Al2O)的已知化学成分

    方法论

    本研究提出了用于MarScoDe LIBS数据分析的两阶段迁移学习框架,即TTL框架。该框架包括两个阶段:使用共享的橄榄石校准目标进行光谱对齐,以及使用MarScoDe校准数据进行模型微调。图3展示了整个框架。

    TTL框架的性能

    • 1)
      光谱对齐
    如图5所示,BEADS算法预处理有效消除了基线漂移,同时保留了特征光谱线。为了定量评估光谱对齐阶段的改进效果,采用了曾等人的评估策略[21]。每个ChemCam通道选择了八条光谱线,总共得到24条参考线。这些参考光谱线涵盖了主要的造岩元素,并且具有清晰的发射特征

    结论

    本研究提出了TTL框架,以解决火星探索任务中校准样本严重有限下的定量分析挑战。原位校准数据的稀缺性是行星探索中的一个固有限制,历史上一直阻碍了诸如MarScoDe等仪器的先进分析方法的部署。所提出的TTL框架结合了光谱对齐和逐层解冻微调,以增强知识转移

    CRediT作者贡献声明

    张卓贤:撰写——原始草稿、验证、方法论、概念化。刘思聪:撰写——审阅与编辑、监督、方法论、调查、资金获取、正式分析、概念化。童晓华:撰写——审阅与编辑、项目管理、资金获取、正式分析。谢焕:可视化、验证、资源管理、正式分析。金彦敏:验证、调查、正式分析。姜龙:验证、资源管理、数据整理。

    利益冲突声明

    作者没有需要声明的利益冲突。

    致谢

    本工作部分得到了国家自然科学基金(项目编号42221002、42241130)和中央高校基本科研业务费的支持。作者感谢火星科学实验室(MSL)的科学和工程团队、“ChemCam”团队、“天问一号”任务团队、CNSA以及山东大学空间科学与物理学院的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号