《Frontiers in Plant Science》:PointNeXt-DBSCAN: a hybrid point cloud deep learning framework for multi-stage cotton leaf instance segmentation
编辑推荐:
本文提出了一种融合PointNeXt深度学习网络与DBSCAN密度聚类算法的两阶段框架(PointNeXt-DBSCAN),有效解决了棉花点云器官级分割中因形态变异和叶片遮挡带来的挑战。该研究通过多视角图像重建构建了包含1,065株棉花的数据集,在语义分割阶段达到mIoU 0.9846,实例分割阶段ARI达到0.983,显著降低过分割率63%,为叶面积指数(LAI)等关键表型性状的自动化提取提供了可靠技术支持。
1 引言
棉花叶片表型作为评估棉花健康状态和光合生产力的关键指标,其精准分析对优化栽培策略具有重要意义。传统二维图像分析方法在处理叶片重叠和遮挡问题时存在明显局限,而三维点云技术通过空间数据有效解决叶片间重叠问题。近年来,基于深度学习的实例分割技术在水稻、小麦等作物中取得进展,但在多生长阶段棉花叶片分割中仍面临严重遮挡和形态变异的挑战。
2 材料与方法
2.1 点云预处理
研究以阿拉尔市国有农场的棉花为实验对象,涵盖营养生长阶段(2-4叶)、现蕾期(5-12叶)、成铃期(13-24叶)和吐絮期(>24叶)四个关键生长阶段。通过多视角摄影测量技术获取高精度三维点云,使用数码单反相机(Canon EOS 200D II)配合50mm微距镜头,在恒定人工光照条件下从30°、60°和90°三个角度采集图像。利用RealityCapture软件进行三维重建,最终构建包含1,065个样本的数据集,并通过统计滤波和体素滤波进行去噪和密度标准化处理。
2.2 研究方法
研究采用两阶段流程:首先使用PointNeXt网络进行语义分割,其残差MLP模块增强了对边缘和局部特征的学习能力;随后应用密度自适应的DBSCAN聚类算法对语义结果进行实例分割。PointNeXt采用编码器-解码器结构,包含Set Abstraction(SA)模块、Feature Propagation(FP)模块和Inverted Residual MLP(InvResMLP)模块,通过多尺度特征传播机制优化局部几何特征建模。
2.3 网络架构
PointNeXt相比PointNet++在复杂局部特征提取方面具有优势,其倒置残差设计有效缓解梯度消失问题。DBSCAN算法无需预设聚类数量,基于密度分布自动划分实例,特别适合处理形状多变的叶片结构。算法通过邻域半径参数ε和最小样本数min_samples控制聚类粒度,其中ε=0.04时表现最优。
2.4 参数设置
实验在AMD RYZEN 7 3700X处理器和NVIDIA GeForce RTX 2080TI GPU的服务器上进行,使用PyTorch 1.10.1框架,批量大小为16,初始学习率0.001,采用动量SGD优化器。
2.5 评价指标
语义分割任务采用整体准确率(OA)和平均交并比(mIoU),实例分割使用调整兰德指数(ARI)、调整互信息(AMI)、标准化互信息(NMI)和Fowlkes-Mallows指数(FMI)进行评估。
3 实验结果与分析
3.1 语义分割结果比较
PointNeXt在语义分割任务中达到mIoU 0.954和OA 0.985,显著优于PointNet、PointNet++、DGCNN和SceneEncoder等基线模型。训练过程显示,PointNeXt在25轮时mIoU即达0.728,收敛速度优于对比算法,最终性能标准差仅0.003,证明其训练稳定性。
3.2 实例分割算法比较
DBSCAN在实例分割中表现最佳,ARI达0.983,明显优于MeanShift、K-means等算法。可视化结果证实DBSCAN能有效保持叶片边缘完整性,自然呈现虫蛀空洞等细节,而K-means类算法在叶片边缘出现不合理碎片化。
3.3 参数ε影响分析
系统测试表明,当ε=0.04时DBSCAN达到最优性能(ARI=0.983)。在叶片排列密集时较小ε值(0.02-0.03)效果更好,而稀疏分布时较大ε值(0.05-0.06)更合适,ε=0.04在两种情况下均保持较高分割精度。
4 讨论
4.1 分割性能与研究意义
本研究首次将PointNeXt-DBSCAN框架应用于棉花叶片分割,相比同期棉花器官分割研究(如Laplacian骨架提取结合Quickshift++方法),在mIoU(0.9846)和准确率(0.9537)方面均有提升。端到端推理流程仅需0.88秒/样本,为大规模高通量表型分析奠定基础。
4.2 局限性与展望
模型在可控环境下验证,开放式田间应用的稳健性有待检验;点云标注效率仍是瓶颈;固定DBSCAN参数在高密度区域导致7.1%的过分割。未来将探索自适应聚类(如HDBSCAN)、结合叶片曲率约束,并引入超图注意力机制建模复杂空间关系。
5 结论
PointNeXt-DBSCAN框架在棉花点云叶片分割中展现优异性能,为作物三维表型分析提供了创新技术路径。该方法成功将点云深度学习从木本果树拓展至一年生大田作物,推动了无损表型分析技术的发展。后续研究将重点开展田间验证、开发物理引擎合成数据系统,并建立语义-几何双驱动自适应分割框架。