《International Journal of Applied Earth Observation and Geoinformation》:A semi-supervised framework for UAV-based individual tree crown segmentation in structurally heterogeneous planted forests
编辑推荐:
本研究针对结构异质人工林中单木树冠(ITC)分割面临的高标注成本与算法鲁棒性不足的挑战,提出了一种创新的半监督框架。该框架通过整合无监督伪标签生成(MCWS/itcSegment)、深度实例分割(Mask R-CNN)和阶段式微调策略,仅需40%的人工标注(约0.6人时)即可在三个不同林龄(11-67年)、密度(450-2500 stems·ha-1)和海拔(192-1047 m)的杉木林中实现高精度分割(F1-score: 0.826, 0.836, 0.711),显著优于LiDAR和融合数据输入,为精准林业提供了可扩展的解决方案。
在全球气候变化加剧、森林面临干旱、病虫害和野火等前所未有的压力背景下,精确监测树木尺度的生理响应变得至关重要。树冠作为生物圈-大气交换的主要界面,直接控制着光合生产力和林下微环境。然而,传统的监测方法在单木尺度上存在根本性不足:卫星遥感分辨率通常无法识别单木树冠,而地面调查又受空间限制且劳动密集型。无人机(UAV)遥感凭借其独特的机动性、成本效益和高时空分辨率,已成为单木监测的重要工具。尽管基于无人机激光雷达(LiDAR)和可见光影像的单木树冠(ITC)提取方法取得了进展,但当前算法仍面临显著挑战。深度学习方法需要大量高质量标注样本,成本高昂;而无监督算法在结构复杂的森林中表现不佳,存在过度分割或分割不足的问题,且通常需要繁琐的人工参数调整。因此,开发一种能够平衡标注成本与分割精度的鲁棒性方法,是推动精准林业发展的关键。
为了应对这一挑战,研究人员开展了一项主题为“结构异质人工林中基于无人机的单木树冠分割半监督框架”的研究。该研究旨在通过集成无监督伪标签生成、深度实例分割和阶段式微调策略,实现高效且高精度的ITC分割,并评估不同数据源(RGB、LiDAR及其融合)对分割精度的影响。研究在浙江省三个具有不同林龄、密度和地形梯度的杉木人工林(JC:11年,KH:25年,BYS:67年)中进行验证。
本研究主要采用了以下几项关键技术方法:首先,利用无人机获取高空间分辨率的RGB影像和LiDAR点云数据,并预处理生成数字正射影像图(DOM)、冠层高度模型(CHM)等。其次,采用简单的无监督算法(标记控制分水岭算法MCWS和区域生长算法itcSegment)从CHM中自动生成初始的树冠伪标签。然后,使用这些伪标签预训练Mask R-CNN实例分割模型,使其学习树冠形态的基本表示。最后,提出一种两阶段微调策略:第一阶段冻结主干网络参数,仅微调检测头(RPN和RoI Head),使其快速适应真实数据分布;第二阶段解冻深层主干网络进行更精细的特征学习,使用有限的真实标注数据(研究中使用40%的标注数据,约0.6人时)来校正伪标签噪声,提升模型性能。研究还系统比较了RGB影像、LiDAR衍生影像及其融合数据在分割任务中的表现。
4.1. 无监督方法生成的伪标签质量
分析显示,无监督方法生成的伪标签质量因林分结构而异。在年轻的JC林分中表现最佳(MCWS F1=0.569),但在冠层交错密集的KH成熟林和冠层遮蔽严重的BYS过熟林中性能显著下降(F1 < 0.3)。伪标签能较好地定位树冠区域(IoU普遍较高),但在边界精确 delineation 方面存在困难,尤其在复杂林分中表现出明显的欠分割倾向。
4.2. 伪标签和多源影像驱动的实例分割模型精度
使用伪标签训练的Mask R-CNN模型在所有林分上均显著优于其无监督基线方法。基于RGB影像的模型性能最优(例如,JC林分F1=0.755),其次是融合影像(RGB_LiDAR_IMG),LiDAR衍生影像(LiDAR_IMG)表现最差。这表明RGB影像的光谱纹理特征对树冠边界 delineation 更具判别力。模型性能与伪标签初始质量呈正相关,且伪标签的误差(如KH林分的低召回率)会在模型预测中有所体现。
4.3. 伪标签驱动和微调策略的树冠分割模型性能
阶段式微调策略有效纠正了伪标签的系统性偏差,大幅提升了模型性能。仅使用40%的微调数据集,模型在JC、KH和BYS林分的F1分数分别达到0.826、0.836和0.711。微调后,不同伪标签源(MCWS vs. itcSegment)模型间的性能差异缩小。结果表明,该策略对初始伪标签质量不敏感,即使伪标签质量较低,通过有限标注微调也能达到较高性能,展现了强大的误差校正能力和样本效率。消融实验证实了两阶段微调策略的有效性和稳定性。
4.4. 树冠测量验证和林分水平分割结果
基于微调后的模型进行林分水平的树冠分割,提取的树冠面积和直径与人工标注结果具有高度一致性(冠面积:R2≥ 0.88, rRMSE ≤ 16.4%;冠直径:R2≥ 0.76, rRMSE ≤ 11.3%)。该框架成功分割出JC林分8000余株、KH林分19000余株、BYS林分5000余株单木,证明了其在大范围应用中的可行性。
研究结论与讨论部分强调,该半监督框架通过巧妙地结合无监督伪标签的效率和有监督微调的精度,实现了在结构异质森林中高精度、低成本的单木树冠分割。其重要意义在于:1)显著降低了深度学习对大量人工标注的依赖(仅需约0.6人时),为大规模森林精准监测提供了可操作的解决方案;2)展现了RGB影像在单木树冠分割中的主导作用,降低了数据采集成本和复杂度;3)框架对不同林龄、密度和地形条件下的杉木林均表现出良好的鲁棒性和泛化能力;4)精确分割得到的树冠结构参数为森林碳储量估算、生物多样性评估等应用提供了可靠数据基础。尽管简单融合RGB和LiDAR数据在本研究中未显优势,但未来探索更先进的跨模态交互架构有望进一步提升性能。此外,将框架扩展到多物种混合林,以及探索结合视觉-语言模型(VLM)和几何先验(如StarDist)以优化树冠形状 delineation,是未来有价值的研究方向。该研究发表于《International Journal of Applied Earth Observation and Geoinformation》,为精准林业的发展提供了重要的方法论支持。