GreenSegNet-A：面向机载激光扫描点云的植被分割深度学习架构创新与基准评测

《Science of Remote Sensing》：Advancing vegetation segmentation from ALS point clouds: From benchmarking to GreenSegNet-A

【字体：大中小】 时间：2026年01月31日 来源：Science of Remote Sensing 5.2

编辑推荐：

　　本研究针对机载激光扫描（ALS）点云中植被分割模型选择模糊的问题，系统评估了七种代表性深度学习模型在三个不同ALS数据集上的性能。研究团队进一步提出了专为ALS植被分割设计的GreenSegNet-A模型，其核心创新在于引入了ALS自适应几何编码（AAGE）模块，能够有效捕捉植被点的三维空间分布和邻近性特征。实验结果表明，GreenSegNet-A在Eclair、Dales和WHU-Urban3D数据集上均取得了领先的mIoU性能（分别为96.56%、94.29%和80.87%），为大规模植被精准分割提供了强有力的技术工具，对生态环境监测和资源管理具有重要意义。

精准的大规模植被分割是环境监测、资源管理和保护工作的前沿课题。传统的二维遥感模态在捕捉植被复杂三维结构方面存在根本局限，而激光雷达（LiDAR）传感器通过生成能够穿透植被冠层并捕获详细三维环境的点云，已成为该任务的首选数据源。在各类激光扫描点云中，机载激光扫描（ALS）因其对大尺度植被分割的特殊价值而脱颖而出。然而，尽管深度学习（DL）已催生了三维点云处理的范式转变，但针对ALS植被分割的专门研究仍显不足，现有模型选择缺乏明确指导，且通用模型未能充分考虑植被区别于人造物体的几何不规则性、层次组织和生态系统依赖性等独特特征。

为填补这一研究空白，本研究开展了针对ALS植被分割的全面基准评测，涉及七种代表性DL模型（KPConv、RandLANet、SCFNet、PointNeXt、SPoTr、PointMetaBase和GreenSegNet），并在三个地理各异、场景复杂性不同的ALS数据集（Eclair、Dales和WHU-Urban3D）上通过十折交叉验证进行评估。基准研究发现，现有模型性能虽佳但缺乏一致性，且通用模型并非专为应对ALS植被分割的固有挑战（如稀疏采样、天底视角和冠层遮挡）而设计。基于此，研究团队提出了GreenSegNet-A，一个专门为ALS植被分割定制的深度学习架构。

GreenSegNet-A在GreenSegNet基础上构建，引入了新颖的ALS自适应几何编码（AAGE）模块。该架构包含两个核心模块：AAGE模块和向量化特征表示（VFR）模块。AAGE模块是核心创新，它明确考虑了ALS植被点的两个显著几何特征：局部邻域内点在所有三个维度上的空间散布（空间分布），以及表征邻近点之间空间接近度的局部点间距（空间邻近性）。通过特征调制机制，利用空间相对位置对学习到的特征进行加权，使模型能够利用空间分布和空间邻近性来增强特征表示，从而更好地捕捉冠层几何和间距模式。VFR模块则沿用自GreenSegNet，利用冠层内部的有限点生成更具判别性的特征表示。

研究采用十折交叉验证策略，使用平均交并比（mIoU）、总体精度（OA）等指标进行评估。在三个数据集上，GreenSegNet-A均取得了最佳或极具竞争力的性能。在Eclair数据集（以森林为主，植被点比例高，约57.49%）上，GreenSegNet-A的mIoU达到96.56%，略优于KPConv（96.24%）。在Dales数据集（城市、郊区、乡村和商业场景混合，植被点比例约28.69%）上，GreenSegNet-A的mIoU为94.29%，优于GreenSegNet（93.91%）。在最具挑战性的WHU-Urban3D数据集（高场景复杂性，植被点比例低，约13.41%，且存在水体导致的数据缺失）上，GreenSegNet-A的mIoU达到80.87%，显著高于GreenSegNet（79.27%）及其他对比模型。统计检验（配对t检验和Wilcoxon符号秩检验）证实了GreenSegNet-A与其他模型性能差异的显著性。消融实验验证了AAGE模块中不同特征学习配置的有效性，最终采用的配置（对分组特征GF进行调制得到MF，然后将MF与位置嵌入PE拼接后聚合）性能最优。

GreenSegNet-A的成功归因于其ALS特异性的设计。AAGE模块能够有效编码植被点独特的空间分布（各向异性，三维分散）和较大的空间邻近性（由于冠层孔隙和遮挡，点间距较大）特征。这使得模型即使在植被与地面交界处等具有挑战性的区域也能实现更好的类别区分。相比之下，通用模型或为移动激光扫描（MLS）设计的模型难以有效捕捉ALS数据的这些特性。此外，GreenSegNet-A在保持较高精度的同时，参数量（1.32百万）和计算量（GFLOPs为5.50）相对适中，优于SPoTr等复杂模型，体现了其效率优势。

本研究的主要技术方法包括：1) 数据预处理与准备：对三个ALS数据集进行重新标记，分为“植被”和“非植被”两类，并划分为十个区块用于十折交叉验证。2) 模型实现与训练：在Nvidia Tesla V100 GPU上，使用TensorFlow或PyTorch框架实现七种对比模型及GreenSegNet-A，采用相同的预处理和数据增强方法。3) 特征学习机制：GreenSegNet-A的核心是AAGE模块，它通过分组、相对位置计算、特征调制（利用空间几何加权特征）和位置嵌入拼接，来捕获ALS植被的几何特征。随后由VFR模块进行进一步的特征提炼。4) 性能评估：采用十折交叉验证计算mIoU、OA、植被交并比（IoU-Veg）和非植被交并比（IoU-NVeg）等指标，并进行统计显著性检验和消融研究以验证设计选择。

4.1. 数据集驱动的植被分割分析

评测结果揭示了数据特性对模型性能的深刻影响。Eclair数据集场景复杂度低，植被占比高，且包含颜色信息，因此所有模型在此数据集上均获得最高mIoU。Dales数据集具有中等场景复杂度和植被多样性，但缺少颜色信息，模型性能略有下降。WHU-Urban3D数据集场景最为复杂，包含多样化的城市地物、水体导致的数据缺失以及极低的植被点比例，对模型挑战最大，所有模型在此性能最低。这表明数据集的地理位置、地形、场景复杂度、植被组成、点密度和属性等因素共同决定了分割难度。

4.2. 架构性能分析

不同模型因其架构差异在不同数据集上表现各异。KPConv在Eclair数据集上表现最佳，得益于其卷积操作能有效利用颜色等丰富的点特征。RandLANet和PointMetaBase在多个数据集上表现稳健且高效。SCFNet的局部极坐标表示使其对ALS的天底视角具有^z轴旋转不变性，表现良好。PointNeXt依赖MLP进行点级特征提取，在捕捉复杂空间上下文方面稍逊。SPoTr的通道级点注意力机制和复杂的全局注意力模型对于二分类的植被分割任务可能过于复杂，且参数量巨大，导致性能不佳且可能过拟合。GreenSegNet（原版）作为植被专用模型，在MLS数据上表现优异，但在ALS数据上因点密度低、冠层内点少导致其向量化特征表示效果受限。GreenSegNet-A通过引入AAGE模块，专门针对ALS植被点的空间分布和邻近性进行优化，从而在所有数据集上实现了显著且一致的性能提升，尤其在复杂的WHU-Urban3D数据集上优势明显。

5. 结论与讨论

本研究通过系统的基准评测，明确了现有深度学习模型在ALS植被分割任务上的性能与局限，强调了针对ALS数据特性设计专用模型的必要性。所提出的GreenSegNet-A架构，通过其核心的AAGE模块，成功地捕获了ALS植被点云的关键几何特征（三维空间分布和空间邻近性），实现了优于现有代表性模型的分割精度和鲁棒性。统计检验和消融研究证实了其设计有效性。尽管GreenSegNet-A参数量略高于原版GreenSegNet，但仍比其他多数模型更轻量。

该研究的重要意义在于：首先，它提供了首个针对ALS植被分割的全面基准研究，为后续研究提供了可靠的基线。其次，它通过细致的分析，将模型性能与具体数据属性和架构组件联系起来，为模型选择和改进提供了清晰见解。最重要的是，它提出的GreenSegNet-A模型，作为一个领域专用架构，为ALS植被分割设立了新的性能基准，展示了显式几何编码在处理特定领域点云分析任务中的潜力。

GreenSegNet-A的成功对于依赖精准植被信息的环境监测、生态系统建模、碳储量估算、森林砍伐监测以及应对气候变化影响的减缓策略等领域具有重要的实际应用价值。它为从大范围ALS数据中自动化、高精度地提取植被信息提供了强有力的工具，可支持决策者、保护主义者和其他利益相关者做出数据驱动的决策。未来工作可探索将该架构应用于更多样化的地理环境和植被类型，并进一步优化模型效率以适应更大范围的应用场景。

热点排行

新闻专题