DIRV:一种基于深度学习的可解释框架,用于利用多模态无人机图像评估多湿地场景中的植被物种多样性

《Expert Systems with Applications》:DIRV: a novel deep learning-informed interpretable framework for vegetation species diversity assessment in multi-wetland scenes using multi-modal UAV images

【字体: 时间:2026年02月15日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本研究提出DIRV框架,整合多尺度光谱空间融合网络与α、β多样性计算,有效评估喀斯特和红树林湿地植被多样性,精度达R2>0.8,并揭示水文梯度对物种多样性的影响机制。

  
Bolin Fu|Hongyuan Kuang|Xifeng Deng|Yeqiao Wang|Ertao Gao|Hui Zheng|Tengfang Deng
桂林理工大学地理信息与测绘学院,中国桂林541006

摘要

湿地是全球生物多样性热点地区之一,为稀有物种提供了重要的栖息地,并作为重要的“蓝色碳汇”。保护湿地对于维持全球生态平衡和促进可持续发展至关重要。量化植被多样性是湿地保护和恢复的基础。尽管遥感技术已被用于这一目的,但它仍然面临诸多挑战,包括多样性估计不准确、模型通用性有限以及遥感特征与多样性指标之间的关系不明确等问题。为了解决这些限制,本研究提出了一种基于深度学习的可解释框架——DIRV(Deep Learning-informed Interpretable Framework for Remote sensing assessment of Vegetation species diversity),用于遥感评估植被物种多样性。DIRV结合了多尺度光谱空间融合网络(MSSFNet)和从物种级别分类中得出的α-多样性和β-多样性计算方法,实现了遥感图像到植被物种多样性映射的高度精确转换(R2 = 0.813–0.997)。结果表明,MSSFNet能够准确描绘出异质湿地生态系统中25种土地覆盖类型的空间分布(总体准确率=0.869–0.942)。与HRNetV2、DeepLabV3+和Swin Transformer相比,MSSFNet在三种湿地场景中均表现出最高的性能,其总体准确率和Kappa系数分别高出这些主流模型0.3%–12.7%和0.2%–14.8%。我们发现,结合光谱数据和LiDAR数据对于喀斯特湿地植被物种的分类准确性提升更为显著。此外,喀斯特湿地表现出更高的局部物种丰富度(α-多样性=1.87)以及斑块间的明显组成异质性(β-多样性:Bray-Curtis=0.0–0.93;Jaccard=0.16–1.00),而红树林湿地虽然物种丰富度较低(α-多样性=1.74),但在潮汐高度区域显示出明显的β-多样性梯度(Bray-Curtis=0.0–0.93;Jaccard=0.18–1.00)。在这两种湿地类型中,植被物种多样性都呈现单峰分布,随着洪水频率的增加而先增加后减少。此外,RBRI、GRRI、GBDI和CanopyCover对于估算红树林物种多样性至关重要。DIRV框架为湿地植被多样性监测建立了新的范式——从单纯的模式映射转向了机制性理解——并提供了在环境变化背景下保护全球湿地生态系统的可扩展工具。

引言

湿地是全球重要的生态系统,以其卓越的生物多样性和生产力而闻名,约占地球陆地表面的9%(Peng等人,2024年)。作为这些生态系统的重要组成部分,红树林和喀斯特湿地在维持全球生物多样性、碳封存、气候调节和水净化方面发挥着不可或缺的作用(Li等人,2023年;Yang等人,2023年)。然而,全球气候变化、人为活动和地质灾害带来的压力正在导致湿地生态价值的下降,生物多样性减少,并给依赖湿地的社区带来重大生计损失(Wang & Gu,2021年)。植被多样性是生态系统稳定性、恢复力和长期健康的关键决定因素(Sun等人,2024年)。这种多样性直接影响生态系统的生产力和服务提供,并深刻影响包括生物多样性维持、碳储存和气候调节在内的基本生态过程(Liang等人,2022年)。因此,准确评估和监测湿地植被多样性是科学管理和有效恢复这些关键生态系统的基本前提。
传统的植被多样性测量方法主要依赖于在指定样地内的实地采样。这种方法通常资源密集且劳动强度高,阻碍了大规模植被多样性的有效监测(Onaindia等人,2004年)。相比之下,遥感技术具有连续、大规模、跨区域观测的突出能力,已被用于植被多样性的评估和制图(Liu等人,2023年)。当前的遥感方法主要用于植被多样性监测,通常分为四类:栖息地制图、物种制图、功能多样性和光谱多样性(Wang & Gamon,2019年)。虽然这些方法在结构简单的栖息地(如森林)中表现出较强的估算能力(Almeida等人,2021年),但在空间异质性高的生态系统中(如湿地),它们面临显著的限制。湿地植被的冠层反射率往往具有高光谱相似性。此外,这些模糊的光谱信号受到底层土壤、变化的水文条件和大气水蒸气的干扰,特别是降低了近红外波段的实用性(Adam等人,2009年)。这种光谱复杂性阻碍了使用遥感图像有效区分植被类型。此外,湿地植被的空间模式具有显著的尺度依赖性;植被斑块的形态、连通性和分布在不同观测尺度上差异很大(Chen等人,2024年)。然而,基于深度学习的物种制图技术可以从图像中提取复杂的层次特征信息,有效区分不同植被类型之间的细微光谱和尺度依赖性变化(Kattenborn等人,2019年)。这种能力提供了高精度的数据,支持湿地植被多样性的遥感评估。
α(α)和β(β)多样性指数是量化植被多样性的常用指标(Laliberté等人,2019年)。α-多样性表征了定义生态单元内的物种丰富度和均匀性,反映了局部尺度上的多样性。相反,β-多样性衡量了不同社区之间物种组成的变化,这些变化受环境梯度、栖息地异质性和扩散限制的驱动(Schweiger & Laliberté,2022年)。Marzialetti等人(2021年)验证了这些指数在沿海湿地中的有效性,并强调了它们在复杂环境中的潜在适用性。然而,植被光谱信号容易受到各种因素的干扰(例如,底层土壤反射率、植被含水量、大气条件)。这些复杂的相互作用可能导致光谱数据偏离实际的植被分布,从而可能影响α-和β-多样性指数的准确性(Somers等人,2015年)。然而,Vanguri等人(2024年)证明,将森林物种空间分布数据与α-和β-多样性指数结合使用,可以更精确地了解Kampinos国家公园的多样性模式。这种方法通过从离散点进行空间外推,有助于评估复杂湿地生态系统中的植被多样性。
目前基于物种制图评估湿地植被多样性的方法主要依赖于机器学习模型。然而,这些模型往往像“黑箱”一样运行,限制了其决策过程的透明度(Sun等人,2025年)。这种不透明度阻碍了对分类结果的直观解释,也妨碍了理解特定遥感变量(例如植被指数、纹理特征、LiDAR指标)对多样性估计的贡献。Shapley加性解释(SHAP)方法通过量化每个特征对模型输出的贡献,提供了对特征影响估计准确性的局部和全局解释(Zhou等人,2022年),显著提高了过程的透明度。然而,SHAP需要评估所有可能的特征组合,导致计算复杂性较高,特别是对于使用大量特征的模型。相反,局部可解释模型不可知解释(LIME)为单个预测(局部样本)生成解释(Meng等人,2024年)。LIME采用事后方法,使用一个更简单、更可解释的模型来近似原始模型的行为。在保持强解释性的同时,LIME提供了更高的实用性和计算效率。这种效率使得大规模遥感特征机制的分析变得快速。LIME在解释不同领域的复杂模型方面表现出稳定性(Imbwaga等人,2024年;Venkata Krishnamoorthy等人,2024年)。这些研究为提高湿地植被多样性估计中多模态特征的可解释性提供了有价值的见解。
为了解决上述挑战,本研究开发了一种基于深度学习的可解释框架——DIRV(Deep Learning-informed Interpretable Framework for Remote sensing assessment of Vegetation species diversity),通过将无人机多模态数据与植被多样性理论相结合。该框架的可靠性和稳定性已在三种异质湿地生态系统中得到验证:国际重要性的Huixian喀斯特湿地、钦州和连州湾沿海红树林湿地。我们的研究目标是准确估计复杂湿地植被的物种多样性,并阐明无人机多模态特征对多样性指标的影响机制。主要贡献如下:
  • (1)
    开发了一种新的DIRV框架,该框架结合了多尺度光谱空间融合网络(MSSFNet)和基于遥感的α-和β-多样性计算方法,实现了喀斯特和红树林湿地中高精度的植被物种多样性评估;
  • (2)
    量化MSSFNet在复杂湿地环境中对植被物种的分类能力,并分析多模态特征对物种区分准确性的影响;
  • (3)
    综合α-和β-多样性指数,以表征异质湿地中植被物种多样性的空间分布模式,揭示了喀斯特和红树林生态系统中由淹没梯度驱动的多样性机制;
  • (4)
    引入LiME方法来量化多模态特征对多样性估计的贡献,识别出十个代表性湿地植被物种的诊断敏感特征。
  • 研究区域

    研究区域

    国际重要性的Huixian喀斯特湿地(HX)(25°05′20″N–25°06′55″N,110°10′50″E–110°14′21″E)位于东亚喀斯特地区的核心区域,这是世界上第三大喀斯特集中区,属于典型的喀斯特峰林平原景观。该湿地分布着广阔的草本沼泽和湖泊,主要植被包括Sapium sebiferumCynodon daclylonCladium chinense NeesLotus leafEichhornia crassipes。钦州

    方法

    本研究设计了新的DIRV框架,以实现喀斯特和红树林湿地中高精度的植被物种多样性评估(图2)。实验方法包括四个关键步骤:(1)结合无人机RGB和无人机LiDAR数据,构建代表三个结构复杂湿地站点的多模态数据集;(2)开发用于湿地植被物种多样性评估的DIRV框架,涉及设计多尺度特征融合提取

    MSSFnet与主流深度学习算法的比较

    在所有三种湿地场景中,MSSFNet算法均表现出优越的分类性能(表5)。在HX场景中,MSSFNet的表现显著优于其他模型,其总体准确率(OA)高出0.051–0.127,Kappa系数高出0.063–0.148,MIoU高出0.077–0.147。值得注意的是,Swin Transformer在喀斯特湿地植被物种识别方面的表现最弱(OA = 0.742),而HRNetV2和DeepLabV3+的OA均超过0.8,Kappa系数超过0.7。在SJ和DJ场景中,

    MSSFNet的迁移学习性能

    本研究提出的MSSFNet网络在喀斯特湿地和红树林湿地中均表现出较高的植被物种分类准确率(图8)。与其他深度学习算法相比,MSSFNet的总体准确率(OA)和Kappa系数分别提高了12.7%和14.8%。此外,我们还将光谱空间特征交互注意力(SSFIA)与CA、SE、CBAM和ELA注意力机制进行了比较(表8)。SSFIA取得了最高的

    结论

    本研究提出了一种基于深度学习的可解释框架——DIRV(Deep Learning-informed Interpretable Framework for Remote sensing assessment of Vegetation species diversity),成功提取并实现了多个国际重要湿地中植被物种多样性的映射。我们确认DIRV在喀斯特和红树林湿地中均表现出较高的植被物种多样性估计准确性(R2 > 0.8)。MSSFNet表现出优异的分类性能,

    CRediT作者贡献声明

    Bolin Fu:撰写 – 审稿与编辑、概念化、资金获取、资源协调、监督。Hongyuan Kuang:撰写 – 原稿撰写、正式分析、方法论、软件开发。Xifeng Deng:调查工作。Yeqiao Wang:监督工作。Ertao Gao:软件开发、资源协调。Hui Zheng:监督工作、资源协调。Tengfang Deng:监督工作、资源协调。

    资助

    作者感谢匿名编辑和审稿人的评论,这些评论有助于提高本文的质量。本研究得到了国家自然科学基金(项目编号42371341;42401071)、广西壮族自治区自然科学基金(项目编号2025GXNSFFA069008;2024GXNSFAA010351)、海南省自然科学基金(项目编号224MS057)以及广西研究生教育创新项目(项目编号YCSW2025397)的支持

    利益冲突声明

    作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号