无人机遥感结合冠层垂直分层信息提升棉花叶片氮含量估算精度研究

《Agronomy》:UAV Multispectral Imagery Combined with Canopy Vertical Layering Information for Leaf Nitrogen Content Inversion in Cotton Kaixuan Li, Chunqi Yin, Yangbo Ye, Xueya Han and Sanmin Sun

【字体: 时间:2026年03月15日 来源:Agronomy 3.4

编辑推荐:

  本文提出了一种集成冠层累积氮指标与多源特征的框架,以解决棉花叶片氮含量(LNC)垂直异质性导致的无人机遥感诊断精度问题。该研究引入冠层分层逻辑、基于CNN的特征融合及CNN-XGBoost混合模型,实现了多生育期LNC的精确估算,为精准施氮提供了理论支持。

  
引言
棉花作为全球重要的纤维作物,其产量和品质与氮素营养状况密切相关。氮是调控作物生长、光合作用及碳氮代谢的关键元素。传统测定叶片氮含量的方法(如凯氏定氮法)具有破坏性且费时费力。随着遥感技术的发展,基于卫星和无人机的平台被广泛应用于作物生长指标的快速、无损监测。然而,与卫星遥感相比,搭载多光谱传感器的无人机平台具有更高的空间分辨率和更灵活的操作性,受大气干扰更小。现有的研究多将冠层视为均质单元,忽略了氮素分布的垂直异质性及其引发的冠层结构-光谱相互作用,这限制了叶片氮含量估算模型的精度。在氮胁迫条件下,由于遮荫和衰老,下层冠层叶片通常首先表现出失绿,而中层叶片是连接养分再分配和光合功能的过渡区,上层叶片则通过优先的氮分配维持较高的光合活性。玉米等作物的研究表明,冠层在光截获、生理活动和氮分布方面存在显著的垂直异质性,这显著影响了叶片氮含量与冠层光谱响应之间的关系,进而影响诊断精度。传统的基于冠层的LNC模型通常将冠层视为均质单元,忽略了其垂直异质性,这可能降低估算的稳定性。
为解决此问题,本研究采用分层采样策略,逐步整合冠层信息。具体分析了上层叶片、上层加中层、以及整个冠层,以量化各层的边际贡献,并检验“冗余-互补”假说。该假说探讨纳入中间冠层是否能在最小化冗余信息的同时提升模型性能。尽管分层冠层分析考虑了氮的垂直异质性,但传统的单源光谱指数仍不足以进行准确的氮诊断。相比之下,纹理特征能有效表征植物冠层内部的空间异质性和结构变化。因此,本研究整合了光谱植被指数和纹理特征,以利用其互补优势,从而增强冠层氮估算的鲁棒性和泛化能力。本研究针对棉花不同冠层叶片氮浓度的垂直异质性,构建了一个集成冠层累积氮指标、多光谱植被指数和纹理特征的估算框架,并提出了CNN-XGBoost混合模型,以在整个棉花生育期内提高预测精度和模型稳定性。
材料与方法
试验地描述
试验在中国新疆维吾尔自治区阿拉尔市农业科学院专家工作站进行。该地区属暖温带大陆性干旱沙漠气候,年降水量低,日照时间长,蒸发量大。试验土壤质地为沙质。
试验设计
棉花品种为“塔河2号”。在生长季,灌溉定额设为375 m3·hm?2,设置三个灌溉处理:标准灌溉量的0.8倍(I1)、1.0倍(I2)和1.2倍(I3)。设置四个施氮水平:0 kg·hm?2(N0)、170 kg·hm?2(N1)、340 kg·hm?2(N2)和510 kg·hm?2(N3)。棉花于2023年4月30日播种。共设置12个试验小区,每个面积533 m2。种植配置采用“一膜三管六行”及宽窄行交替的 pattern。
数据收集与预处理
无人机数据获取与处理
无人机遥感数据使用大疆Matrice 350 RTK平台搭载MS600Pro多光谱相机采集。相机集成六个光谱通道,捕获蓝、绿、红、红边和近红外五个主要波段。数据采集在棉花的四个关键物候期进行:苗期后期、蕾期、铃期和吐絮期。每次飞行前对校准灰板进行反射率测量以进行辐射校正。无人机在固定高度20米、恒定速度2.8 m·s?1下飞行,前后和旁向重叠度均设为80%。所有飞行在北京时间13:00至14:00之间无风晴朗条件下进行,以最小化光照变化。
地面数据采集
每次无人机飞行后立即进行田间采样。在每个小区选择生长均匀的棉株,从上、中、下冠层各采集四片代表性叶片。每个生长阶段共采集144个样本,总数据集为576个样本。采集的叶片送至实验室测定叶片氮浓度。总样本的70%随机分配为训练集用于模型开发,剩余30%留作独立测试集用于模型验证。
光谱数据预处理
使用Pix4Dmapper进行图像拼接、几何校正和辐射校准。随后在ENVI 5.3.1软件中进行大气校正和感兴趣区域提取,以消除土壤背景和塑料薄膜阴影的干扰。计算每个小区的平均冠层反射率值。基于这些反射率数据,计算了15个与棉花氮状况相关的植被指数,以定量表征冠层结构和生长。为捕捉与氮分布相关的冠层结构异质性,使用ENVI 5.3.1中实现的灰度共生矩阵方法提取纹理特征。为蓝、绿、红、红边和近红外波段计算了纹理特征。采用3×3移动窗口和45°方向进行GLCM计算。对每个波段,提取了八个纹理指标:均值、方差、熵、对比度、相关性、二阶矩、同质性和相异性。
棉花叶片氮含量的测定
采集的叶片样品先在105°C加热30分钟以使酶失活,随后在80°C烘箱中干燥48小时至恒重。干燥样品用研钵磨细。称取约15 mg粉末材料密封于锡囊中进行分析。使用元素分析仪测定叶片氮浓度。
模型构建与评估
特征选择与冠层融合
为提高棉花叶片氮浓度预测精度,采用了多源特征融合策略。总共15个植被指数和8个纹理特征被整合为模型反演的输入变量。三种冠层配置(上层叶片、上层加中层叶片、上层加中层加下层叶片)的氮含量被视为因变量。这些特征共同捕捉了棉花冠层的多维光谱特征和空间结构属性,实现了对氮分布的更全面表征,从而提高了反演精度。
机器学习模型
使用不同冠层氮组合作为因变量,各种特征组合作为自变量,使用三种机器学习算法建立了多源特征与冠层氮指标之间的关系:随机森林、卷积神经网络-极限梯度提升混合模型和K近邻。这些模型分别代表了集成学习、深度学习和基于距离的经典学习方法。所有模型在RStudio 4.5.1中实现,随机种子固定为123以确保可重复性。RF是一种代表性的集成学习方法,通过构建多个决策树并聚合其预测来提升模型精度和鲁棒性。由于每棵树在随机抽样的数据和特征子集上训练,RF降低了模型方差并提高了泛化性能。本研究中,使用randomForest包进行回归建模,caret包进行数据分区和性能评估,ggplot2用于可视化。CNN_XGBoost混合模型首先使用卷积神经网络进行自动特征提取,随后将提取的深度特征输入XGBoost回归器进行预测。CNN组件使用keras包构建特征提取网络,而xgboost包用于执行梯度提升回归。K近邻算法通过计算查询样本与训练集中所有样本的距离,选择K个最近邻,并聚合其对应输出来预测目标值。为控制模型复杂度并减轻过拟合,实施了正则化策略。在XGBoost中,最大树深限制为两层以防止模型过度拟合植被指数和纹理特征的微小波动。采用相对较低的学习率以确保逐步优化,并设置较高的最小子权重以惩罚对小子样本集的极端拟合。CNN架构包括两个卷积层、两个池化层和两个全连接层。第一个全连接层包含128个神经元,丢弃率为0.3以减少过拟合。第二个全连接层包含23个神经元,对应融合输入特征的维度。此外,应用了行子采样和列子采样以随机抽取训练观测和特征子集。这些策略减少了高维预测变量之间的冗余,并增强了泛化性能。没有手动调整超参数,而是进行了五折交叉验证以系统识别最优参数组合,从而确保统计严谨性和可重复性。
模型评估
使用决定系数、均方根误差和平均绝对误差评估模型在预测棉花叶片氮浓度方面的性能和稳定性。
结果
棉花冠层氮分布的时空动态
云雨图展示了不同生长阶段和冠层组合下叶片氮浓度的动态分布。在这些图中,纵轴代表不同的冠层配置,横轴代表LNC值。总体而言,LNC在早期发育阶段增加,在花期(铃期)达到峰值,平均值为108.1 g·kg?1,随后在吐絮期下降至最低水平,平均值为71.9 g·kg?1。图中,LNCt代表上层冠层叶片的氮含量;LNCtm代表上中层冠层叶片的累积氮含量;LNCtmb代表上中下层冠层叶片的累积氮含量。子图a-d分别代表苗期、蕾期、铃期和吐絮期。
相关性分析
在三个LNC指标与四个生长阶段的植被指数之间进行了相关性分析。苗期:所有LNC指标与VI均呈正相关,相关系数范围分别为0.54–0.72(LNCt)、0.50–0.74(LNCtm)和0.50–0.75(LNCtmb)。与RETVI、CIre、MTCI、NDVI和GNDVI的相关性最强,其中CIre的系数最高。LNCt、LNCtm和LNCtmb之间高度一致的相关性模式表明早期生长阶段具有相似的光谱响应和调控机制。蕾期:正相关仍占主导,范围分别为0.73–0.82(LNCt)、0.71–0.79(LNCtm)和0.68–0.75(LNCtmb)。LNCt表现出最强的关联,尤其是与CIre。随着下层冠层的纳入,相关性强度呈现明显的下降趋势。铃期:此阶段表现出最强的整体相关性,范围分别为0.54–0.82(LNCt)、0.53–0.83(LNCtm)和0.50–0.78(LNCtmb)。LNCt和LNCtm表现出相似的相关性模式,特别是对于RERDVI、MTCI、NDVI和GNDVI。纳入下层冠层降低了相关性强度。吐絮期:相关性范围收窄至0.71–0.75(LNCt)、0.72–0.77(LNCtm)和0.72–0.76(LNCtmb),不同冠层配置之间差异最小。这种稳定可能归因于冠层倒伏和氮从叶片向棉铃的再动员,使得各层的光谱响应均质化。
在LNC指标与纹理特征之间也进行了相关性分析,为每个阶段保留了相关系数最高的TF。苗期:所有相关性均为正,范围分别为0.42–0.47(LNCt)、0.32–0.49(LNCtm)和0.45–0.48(LNCtmb)。LNCt与var_Blue、ent_Green和var_Red的相关性最强。不同冠层配置的相关性模式高度一致。蕾期:观察到正负相关性,系数范围分别为-0.80–0.64(LNCt)、-0.77–0.63(LNCtm)和-0.65–0.60(LNCtmb)。LNCt响应最强的TF包括var_Green、hom_Green、ent_Green等。检测到hom_Green的强负相关,而var_Green和ent_Green呈正相关。当下层冠层被纳入时,相关性强度略有下降。铃期:相关系数范围分别为-0.49–0.58(LNCt)、-0.51–0.59(LNCtm)和-0.53–0.60(LNCtmb)。与蕾期相反,当考虑累积冠层时,相关性强度略有增加。关键的TF包括mean_Green、man_Nir、var_Nir等。吐絮期:相关性范围为-0.35–0.67(LNCt)、-0.37–0.68(LNCtm)和-0.39–0.66(LNCtmb)。相关性结构在不同冠层配置间趋于稳定。与所有LNC指标关联最强的TF是var_Blue、ent_Green、sec_Green、var_Nir、con_Nir和var_Red,其中var_Blue的系数最高。总体而言,LNCtmb与VI和TF均表现出持续强的相关性。因此,选择LNCtmb作为后续建模的目标变量。
LNC估算模型的建立与评估
基于相关性分析和变量重要性,选择了阶段特定的特征子集作为模型输入。使用随机森林、卷积神经网络-XGBoost和KNN构建了评估模型,其性能已汇总。总体而言,建模算法的选择和输入变量的配置都显著影响预测性能,校准集和验证集之间观察到明显差异。在所有棉花生长阶段,结合植被指数和纹理特征的模型 consistently 比单源输入产生更高的R2值,这表明多源特征融合能有效提升模型对棉花冠层氮的估算能力。在单一植被指数输入和联合VI-TF特征集下,CNN_XGBoost模型在所有生长阶段的校准精度和稳定性方面 consistently 优于其他模型。其最佳性能出现在棉花开花结铃期,校准R2达到0.921。该框架显著提高了棉花LNC的估算精度,为精准氮管理和农业可持续发展提供了理论基础和技术支持。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号