《European Journal of Agronomy》:Retrieval of cotton defoliation rate using random forest model based on rate of vegetation index change
编辑推荐:
本研究基于UAV多光谱数据构建植被指数变化率(VIc)模型,动态跟踪棉花脱叶进程,相比传统静态植被指数模型,VIc模型在R2、RMSE和RRMSE指标上显著提升,有效支持机械采收精准决策。
王玉坤|肖晨宇|张特|于星华|王瑶|徐云鑫|李方军|万素梅|陈国栋|田晓丽|杜鑫|杜明伟|李照虎
中国农业大学农学与生物技术学院植物生长调节剂工程研究中心,北京100193
摘要
化学脱叶对于棉花的机械化收割至关重要,脱叶率是监测脱叶进程和确定最佳收获时间的关键指标。传统的脱叶率评估方法劳动强度大且效率低下。本研究利用基于无人机多光谱数据得到的植被指数变化率(VIc)开发了一种脱叶率反演模型。与仅基于植被指数(VI)的脱叶率反演模型相比,该模型表现出显著改进:决定系数(R2)提高了0.046,均方根误差(RMSE)降低了1.372%,相对均方根误差(RRMSE)降低了2.758%。随后在2021年获取的独立数据集上进行测试,基于VIc的脱叶率反演模型的优势更加明显,R2提高了0.445,RMSE降低了7.446%,RRMSE降低了11.312%。该模型在不同种植密度下的验证集RMSE值均低于12%,RRMSE值均低于24%。总体而言,使用植被指数的“变化率”来预测脱叶率(本身也是一种变化度量)在统计上更优越,在概念上也更为连贯。这种方法能够快速、无损地监测脱叶情况,为精准管理决策(如二次施用脱叶剂或确定收获时间)提供支持。
引言
棉花(Gossypium spp.)是一种重要的经济作物,对全球纺织业和农业经济具有重大影响。传统的棉花收割方式劳动强度大且成本高。2023年,新疆部署了近7000台棉花收割机,使机械化收割率从2014年的35%提升至85%以上,从而稳步提高了棉花生产的整体效率(Meng等人,2021年)。同时,农艺管理措施(如早期施用氯甲喹酸调节植株生长和优化株型)是高效机械化收割的必要前提(?inar和ünay,2021年)。化学脱叶是机械化棉花收割的核心支持技术,对提高机械采摘棉花的收割效率至关重要。传统上,化学脱叶的效果是通过脱叶率来评估的,但这种方法繁琐且效率低下。在全机械化棉花生产的背景下,需要一种更快、更精确的方法来监测脱叶过程。
基于冠层反射光谱的作物遥感技术具有速度快、无损性强和信息丰富等优点,为农业生产提供了高效、快速的监测工具。分析不同条件下的作物冠层反射光谱特征,可以为监测和诊断作物生长指标提供先进有效的技术手段(Araus和Cairns,2014年;Weiss等人,2020年)。与传统的卫星和有人驾驶飞机遥感相比,无人机(UAV)遥感具有时效性强、空间分辨率高、可在云层下方低空飞行、风险低和灵活性高等优势(Mukherjee等人,2019年)。它已被广泛应用于农业领域,通过分析植被指数、纹理特征和点云数据来监测出苗率、绿叶面积指数(LAI)、植被覆盖度、病虫害发生情况、生物量、叶绿素含量以及氮、磷、钾等养分元素含量(Messina和Modica,2020年;Rahman和Fan,2021年;Argento等人,2021年;Chen,2019年;Maimaitijiang等人,2020年;Garcia-Ruiz等人,2013年)。
机器学习能够处理大量遥感数据,加速数据分析并提取更有效的信息。通过特征选择和降维优化数据,为作物遥感监测提供更准确的数据分析和预测能力(Rehman等人,2019年;Shaikh等人,2022年)。例如,在棉花育种中,精确的数据分析对于揭示产量和纤维质量之间的复杂遗传权衡至关重要,以确保作物改良的平衡(?akmak等人,2023年)。常用的机器学习模型包括偏最小二乘回归(PLSR)、支持向量回归(SVR)、高斯过程回归(GPR)、梯度提升回归树(GBRT)、岭回归(RR)、最小绝对收缩与选择算子(Lasso)、卷积神经网络(CNN)和随机森林(RF)。Vanitha等人还应用了K-Means、KNN、SVM和贝叶斯网络等数据挖掘技术来分析农业气候和产量数据,以有效预测作物产量(Vanitha等人,2019年)。统计分析表明,在无人机遥感图像处理中,线性回归和RF是最常用的回归模型(Eskandari等人,2020年)。RF是一种基于决策树的集成学习算法,结合了多棵决策树的预测结果,在许多遥感作物监测案例中被证明是有效的机器学习方法。Dhakal等人使用PLSR、SVR和RF模型预测燕麦生物量,其中RF的预测精度最高(Dhakal等人,2023年)。Khose等人使用光谱指数预测叶片SPAD值,RF的预测精度优于SVR和PLSR(Khose和Mailapalli,2024年)。在另一项研究中,Zhai等人收集了小麦拔节期和灌浆期的地上生物量(AGB)数据及无人机RGB图像(飞行高度分别为30米、60米和90米),使用不同的机器学习算法(包括RF、GBRT、RR、Lasso和SVR)预测小麦AGB,结果显示RF的表现优于其他机器学习方法(Zhai等人,2023年)。
目前利用无人机遥感监测棉花脱叶的研究主要遵循两种方法。第一种方法是利用无人机遥感在施用脱叶剂前后提取植被覆盖度;Yan等人使用最大熵阈值法和植被指数阈值法提取植被覆盖度(即需要脱叶的叶片信息),并根据植被覆盖度与脱叶率的关系生成变量率脱叶剂施用图。第二种方法是基于植被指数、颜色特征或纹理特征建立脱叶率模型。Ma等人从RGB图像中提取植被指数,并利用多元线性回归和偏最小二乘回归构建模型,通过计算各成分的贡献率并确定最佳模型组件数量来提高多变量模型的准确性(Ma等人,2021年)。随后,Ma等人结合了无人机RGB图像的纹理特征、植被指数和颜色空间,选取了10个相关特征,使用RF和粒子群优化极值学习机(PSO-ELM)模型实现了最佳的脱叶率估计(R2 = 0.59,RMSE = 19.37%,rRMSE = 34.54%)(Ma等人,2023年)。
在现有研究中,大多数研究者直接使用植被覆盖度、植被指数、纹理特征或颜色空间来建模脱叶率。然而,脱叶率是基于施用脱叶剂前后叶片数量的差异计算得出的,这是一种从两种不同生长状态分析得出的间接指标。相比之下,植被指数和其他特征参数是直接反映冠层状态的指标。使用直接指标来建模间接指标不可避免地会引入不必要的误差(Wang和Xiao,2024年)。
因此,本研究提出了一种基于时间序列无人机遥感图像的植被指数变化率(VIc),旨在动态匹配棉花脱叶的时空进展。通过量化光谱轨迹变化(例如,脱叶后840纳米处的近红外反射率下降),VIc指标消除了冠层变化率与脱叶动力学之间的概念差距,显著提高了反演精度。
实验地点
研究区域位于中国河北省河间市西九集乡(38°23′N,116°08′E),属于黄河棉花种植区(图1)。
2021年、2022年和2023年的脱叶期间,平均气温分别为14.87℃、17.17℃和22.26℃;降水量分别为99.97毫米、66.58毫米和5.72毫米;平均每日日照时长分别为3.08小时、4.26小时和4.32小时。土壤pH值为7.46,总氮含量为
方法
获取并预处理无人机图像后,使用QGIS 3.22.10提取2022年和2023年每个子区域的植被指数,然后计算植被指数的变化率。随后对植被指数及其变化率进行相关性分析和特征选择,以评估选定的30个植被指数及其对应的变化率。
不同年份的脱叶率差异
图4显示了施用脱叶剂后不同时间的脱叶率,也展示了施用后脱叶率的动态变化。2021年的脱叶率结果仅包括处理后13天的数据,因此使用条形图(图4a)来展示不同处理之间的差异。对照组(CK)的脱叶率明显低于其他处理组。1500毫升/公顷和7500毫升/公顷处理组的脱叶率
植被指数的变化率更适合用于反演脱叶率
植被指数提供了简单可靠的作物状况和健康状况评估方法。基于植被指数,可以监测植物生长和发育的各个方面,如叶绿素含量、叶面积和水分状态(Kapari等人,2024a)。与棉花的结铃率类似,脱叶率也是一种相对的变化度量。以往使用植被指数时间序列的研究主要集中在植被的动态特征上
结论
本研究利用2021年至2023年的实验数据确定了植被指数变化率的特征:CVI、DVIGREEN、LCI、MCCCI、MTCI、NGBDI、TCARI、TVI。利用植被指数的变化率建立了RF模型来预测脱叶率,并将其与仅使用植被指数的模型进行了比较。对于基于2022年和2023年收集的数据建立的预测模型,植被指数变化率的R2有所提高
CRediT作者贡献声明
徐云鑫:调查、数据整理。
李方军:监督、正式分析。
于星华:调查、数据整理。
王瑶:调查、数据整理。
田晓丽:监督、项目管理。
杜鑫:撰写-审稿与编辑、监督、项目管理、正式分析。
万素梅:资源协调、正式分析。
陈国栋:监督、资源协调。
杜明伟:撰写-审稿与编辑、监督、项目管理、正式分析。
李照虎:项目管理
资助
本研究得到了中国生物育种-国家科技重大专项(2023ZD04039-05)和中国农业大学-塔里木大学联合研究基金(ZNLH202301)的支持。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。
致谢
无