《International Journal of Applied Earth Observation and Geoinformation》:From canopy segmentation to accurate prediction: An UAV-based multi-feature fusion framework for plot-scale ratoon sugarcane seedling counting
编辑推荐:
本研究针对再生甘蔗田间人工计数效率低、传统方法难以适应高密度群体结构等难题,创新性地提出了一套基于无人机多源遥感与机器学习的幼苗数量高通量表型分析框架。研究人员通过无人机获取RGB与多光谱影像,利用K均值聚类实现冠层精准分割,并提取植被指数与纹理特征构建综合特征集,结合多种特征选择方法与机器学习模型,筛选出由梯度提升回归与KBest-F方法组合的最优预测模型。结果显示,该模型的决定系数达0.7641,均方根误差为19.42,平均绝对误差15.93,成功实现了田块尺度的高密度再生甘蔗幼苗数量高效、准确预测,为甘蔗产业的精准田间管理和产量预估提供了有力的技术工具。
甘蔗是全球最重要的糖料作物,贡献了全球80%以上的糖产量。在中国广西,甘蔗种植面积占全国的65%以上,是该区域农业经济的支柱产业。其中,再生甘蔗(即利用宿根发芽的第二年及以后的甘蔗)因其显著的成本优势和高效的生产模式,已成为当地规模化种植的主流。然而,再生甘蔗出苗具有“高密度、多芽萌发”的特点,幼苗初期密度大,后期冠层完全重叠,个体植株茎叶边界难以清晰分辨,这使得传统人工计数方法效率低下、代表性差,也无法满足大田管理的需求。同时,直接应用基于无人机RGB影像和深度学习的目标检测技术进行个体识别和计数,在此高密度、冠层重叠的晚期出苗阶段面临瓶颈,精度大幅下降。因此,如何快速、准确地获取再生甘蔗在出苗期的幼苗数量分布,成为诊断苗情、调控群体结构、实现精准管理的关键,也是智慧农业和精准作物栽培领域亟待突破的研究重点。
在这一背景下,由广西师范大学电子与信息工程学院、脑计算与智能芯片广西重点实验室的研究团队开展了一项创新性研究,成果发表在《International Journal of Applied Earth Observation and Geoinformation》期刊上。该研究旨在开发一种高效、可扩展的田块尺度甘蔗幼苗数量预测方法,以应对高密度再生甘蔗出苗期监测的挑战,并为“控苗”管理提供技术支持。
为了达成这一目标,研究人员综合运用了多项关键技术方法。研究在广西桂林农业科学院种植基地进行,以当地主栽品种“桂糖42号”的第一年再生幼苗为对象,将试验田划分为200个独立的样本小区。技术核心流程包括:1) 无人机多源数据采集与预处理:在甘蔗出苗期末期,使用配备RGB和四波段(绿、红、红边、近红外)多光谱集成传感器的DJI Mavic3M无人机,在12米高度同步采集影像,并经过图像拼接、几何校正、辐射校准等处理,生成高质量的数字正射影像图。2) 冠层精准分割与特征提取:以归一化植被指数为基础,采用K均值聚类(K-means)等无监督学习方法,将甘蔗冠层从土壤、杂草等背景中精确分割出来,并基于此掩膜提取每个样本小区的冠层面积、平均光谱反射率。随后,系统计算了9种植被指数和基于灰度共生矩阵的4种空间纹理特征,构建了包含光谱和空间信息的综合特征集。3) 特征优化与机器学习建模:为了消除特征冗余,研究集成了六种特征降维方法对特征集进行优化。在此基础上,构建并比较了八种机器学习回归模型,包括线性模型、非线性模型和集成学习模型,以筛选最佳的幼苗数量预测方案。
研究结果如下:
3.1. 三种无监督学习方法的冠层分割
比较了双峰法、K均值聚类法和高斯混合模型三种方法的冠层分割效果。通过简单结构指数、轮廓系数和Calinski-Harabasz指数等定量指标评估,并结合视觉特征,研究发现K均值聚类法在分割精度和稳定性上表现最佳。其轮廓系数最高(0.69),CHI指数显著高于其他方法(34785.57),生成的冠层掩膜轮廓与实际甘蔗生长形态一致性好,边缘连续,能有效区分连续生长的甘蔗区域与非植被背景,因此被选作后续冠层特征提取的掩膜生成方法。
3.2. 特征提取结果
通过系统遍历1至30维特征空间,确定了六种特征降维方法各自的最优特征数量。结果显示,不同方法筛选出的最优特征集普遍包含了冠层面积、红边波段相关特征以及纹理对比度特征。例如,基于F检验的KBest-F方法和基于互信息的KBest-MI方法均在27个特征时达到最优;而递归特征消除法仅用11个特征即可获得良好的预测性能,体现了其高效去除冗余信息的能力。
3.3. 基于有效特征的甘蔗幼苗数量预测
综合比较了八种机器学习模型与不同特征降维方法组合的预测性能。总体而言,集成学习模型的表现优于线性模型和单一非线性模型。其中,梯度提升回归与KBest-F特征选择方法的组合取得了最优的预测性能。在测试集上,该组合模型的决定系数R2达到0.7641,均方根误差为19.42,平均绝对误差为15.93。进一步的分析指出,冠层面积、归一化红边指数、红边对比度和绿色熵是核心预测特征,它们共同贡献了超过60%的总特征重要性,其协同效应支撑了准确的幼苗数量估算。
结论与讨论部分强调,本研究成功开发并验证了一个从冠层分割到精准预测的完整无人机多特征融合框架,用于田块尺度高密度再生甘蔗的幼苗数量估算。该框架的核心贡献在于:第一,针对再生甘蔗冠层高密度、重叠严重的难题,验证了K均值聚类等无监督学习方法在冠层精准分割中的有效性,为后续特征提取奠定了基础。第二,突破了单一类型遥感特征的局限,通过融合植被指数(光谱特征)和纹理特征(空间特征),构建了更全面的特征集,并系统比较了多种特征优化方法,显著提升了模型对幼苗数量变化的敏感性。第三,确定了梯度提升回归模型与基于F检验的特征选择方法为最优组合,并识别出冠层面积、归一化红边指数等核心预测因子,从机理上解释了遥感特征如何协同作用于幼苗数量估计。
这项研究的意义深远。在实践层面,它为再生甘蔗出苗期的“间苗定苗”管理提供了高效、准确的量化工具,有望替代传统低效的人工计数,助力精准农业实践。在理论层面,该研究丰富了高密度作物群体参数遥感反演的理论体系和方法库,展示了无人机多源遥感与机器学习在复杂农业场景中的强大应用潜力。尤其对于像广西这样的甘蔗主产区,该技术框架的推广将有力推动甘蔗产业的智能化、精细化发展,为保障糖业安全和提升农业生产效率提供重要的技术支撑。