《Artificial Intelligence in Agriculture》:Integrating hyperspectral radiation transfer modeling and deep transfer learning to estimate nitrogen density in winter wheat canopies
编辑推荐:
为了解决传统经验模型和物理反演模型在估算冬小麦冠层氮密度(CND)时存在的泛化能力弱、反演不适定及对标记数据依赖性强等问题,本研究创新性地将N-PROSAIL辐射传输模型与深度迁移学习(DTL)相结合,构建了一种物理机制与数据驱动融合的混合框架。该研究利用N-PROSAIL生成的大规模模拟光谱数据集预训练带有双注意力机制的一维卷积神经网络(SCAR-CNN),再通过少量实测数据微调,成功实现了冬小麦CND的高精度(R2=0.81, RMSE=0.14)、稳健估算,有效缓解了小样本过拟合,并在不同生育阶段、氮梯度及地空平台间展现出优异的泛化能力,为作物氮营养精准监测提供了可解释、高效的新范式。
“民以食为天”,粮食安全是国之根本。在众多粮食作物中,冬小麦占据着重要地位,而其产量和品质的核心调控者之一便是氮元素。氮是构成植物蛋白质、酶和光合色素的关键成分,可谓作物的“生命元素”。然而,农田里的氮管理却如同走钢丝:施用量不足,小麦“吃不饱”,产量和品质会严重受限;施用量过度,不仅造成资源浪费、增加成本,更会带来面源污染等环境风险。因此,对冬小麦冠层氮密度进行精准、动态的监测,是实现定时、变量施肥,优化氮营养指数,提高氮肥利用效率的前提。
传统上,人们依赖破坏性取样和实验室分析来测定氮含量,这种方法成本高、时效性差,且难以满足大田尺度的监测需求。高光谱遥感技术能够无损、快速地获取植被反射光谱,并与生化成分建立关联,为大规模、实时评估作物氮状况提供了理想的技术途径。围绕如何从光谱数据中准确、稳健地估算植被参数,科学家们发展出了经验模型和物理模型两大主流方法。但两者各有短板:经验模型(如各种统计或机器学习算法)的性能严重依赖训练数据,容易受环境噪声干扰,在不同品种、生育期或地域间泛化能力弱;物理模型(如基于辐射传输理论的模型)虽能从机理上模拟光在冠层内的传播,但其反演过程存在“不适定性”——高维且相互依赖的输入参数可能导致解不唯一。此外,无论是经验模型还是物理模型,都严重依赖大量高质量的野外标注数据,而农业应用中常面临样本稀少、标注成本高、时空代表性有限等挑战,限制了模型在实际生产中的推广应用。
近年来,将物理模型的机理性与经验模型的灵活性相结合的混合建模方法,成为提升植被参数遥感估算精度和鲁棒性的重要研究方向。与此同时,迁移学习被引入该领域,它能够将从一个领域(如其他作物、区域数据或模拟数据)学到的可迁移特征,应用到目标领域,有效缓解目标域真实数据不足带来的挑战。然而,现有方法在数据稀疏和跨域任务场景中仍面临显著挑战。例如,现有的混合建模研究大多依赖单一生长阶段或有限参数范围的模拟数据进行预训练,导致预训练特征对场景的适应性不足;而一些结合迁移学习的氮估算研究,又缺乏辐射传输模型物理机制的约束,导致特征学习与冠层光传输过程脱节,反演结果的物理可解释性弱。
为了攻克这些难题,一项发表在《Artificial Intelligence in Agriculture》上的研究提出了一种全新的框架,将物理机制与深度迁移学习深度融合。这项研究由河南理工大学的杨波、周龙飞、杨贵军、张光胜、亓经纬和李长春等人合作完成。他们的核心思路是:首先,利用改进的N-PROSAIL辐射传输模型,耦合叶片和冠层辐射传输过程,生成一个覆盖典型生化参数和冠层结构的大规模、标签准确的模拟光谱与CND数据集作为源域。接着,在此模拟数据集上预训练一个名为SCAR-CNN的一维卷积神经网络,该网络结合了双注意力机制和残差连接,以学习从光谱数据到氮含量的通用映射关系。最后,采用深度迁移学习策略,利用少量实地测量的冬小麦高光谱数据和真实CND数据,对预训练模型进行有监督的微调,从而弥合模拟数据与真实数据之间的域差距。
该研究在河南焦作市农科院进行了连续两年(2023年10月至2025年6月)的冬小麦田间试验,设置了不同品种和氮肥处理梯度,在拔节、抽穗、开花和灌浆四个关键生育期采集了共计384个样本。数据获取方面,研究者使用了地面ASD FieldSpec4高光谱辐射计和搭载在DJI M350 RTK平台上的GaiaSky-mini3-VN无人机高光谱成像系统,分别获取了地面点尺度和无人机空尺度的冠层光谱反射率数据。同时,通过破坏性取样测量了植株的叶面积指数、干重、氮浓度等,并计算出叶片氮密度和冠层氮密度。在数据处理和建模阶段,研究采用了遗传算法筛选对CND敏感的高光谱波段,并构建了基于查找表的传统物理反演方法、纯数据驱动的SCAR-CNN深度学习模型以及本研究提出的物理-数据双驱动的深度迁移学习模型进行对比。
研究结果通过一系列图表清晰地展示了不同方法的性能与发现:
3.1. 不同氮胁迫条件下的CND分析
两年间不同生育期冬小麦的光谱反射特征及对应CND分布表明,冬小麦的光谱和CND指数存在明显的季节性和年际变化。例如,第一年灌浆期光谱反射率显著增加,尤其是可见光和近红外波段,这主要与叶片衰老、叶绿素含量下降及细胞结构降解有关。CND的分布也显示,抽穗和开花期的离散度较大,而灌浆期CND值普遍较低,表明氮积累在此时期趋于稳定。这些变化为后续氮反演模型的开发提供了有力的数据支持。
3.2. 基于遗传算法的敏感波段选择与验证
为提升高光谱估算冬小麦CND的精度,研究采用遗传算法在400-1000纳米范围内筛选敏感波段,最终确定了位于可见光和近红外区域的若干波段,这些波段与植被氮吸收特征及冠层结构密切相关。利用PROSAIL模型进行验证的结果显示,基于这些波段构建的CND估算模型拟合优度极高,R2达到0.98,RMSE为0.02,证明了所选波段的可靠性。
3.3. 基于RTM、深度学习和迁移学习的CND估算
对比了查找表(LUT)反演、SCAR-CNN深度学习以及深度迁移学习(DTL)三种方法的估算精度。结果显示,传统LUT方法反演精度最低(第一年R2=0.45,第二年R2=0.24)。纯数据驱动的SCAR-CNN模型性能有显著提升(第一年R2=0.78,第二年R2=0.66)。而本研究提出的DTL模型表现最优,在第一年实现了R2=0.81,RMSE=0.14;在第二年实现了R2=0.68,RMSE=0.07。这表明DTL通过利用先验知识,进一步提升了模型在小样本学习中的预测精度。
3.4. 跨生育期和氮梯度的CND估算
为验证DTL模型在不同生长阶段和氮水平下的适用性,研究分析了模型在跨生育期和氮梯度下的估算表现。结果显示,当使用部分生育期数据微调并在其余阶段测试时,模型始终表现出良好的拟合性能,R2在0.43到0.89之间。在抽穗、开花和灌浆期的预测精度高于拔节期。在氮梯度测试中,模型在中等氮水平下预测相对稳定,在低氮和高氮极端条件下估算精度略有下降。这证明了DTL模型在估算不同生长阶段和氮梯度下的CND时具有较强的适应性和泛化能力。
3.5. 在无人机平台的应用及年际可迁移性
研究成功将基于地面数据训练的DTL模型应用于无人机高光谱影像,实现了从点到田块尺度的空间扩展。在拔节、抽穗、开花和灌浆期,估算CND的R2分别为0.44、0.58、0.56和0.68,其中灌浆期精度最高。无人机影像的空间分布结果清晰显示了田间氮分布的异质性,能够区分不同施氮梯度下的差异。在年际可迁移性分析中,模型使用一年数据微调后在另一年数据上测试,取得了R2=0.50,RMSE=0.27的预测性能,表明DTL能够在一定程度上适应由气候和管理措施差异引起的数据分布变化,具备跨年应用的潜力。
本研究成功开发并验证了一个融合辐射传输建模与深度迁移学习的混合框架,用于冬小麦冠层氮密度的遥感估算。该框架充分发挥了N-PROSAIL模型在生成物理约束数据方面的泛化能力,以及深度学习在非线性特征提取方面的优势。通过迁移学习策略,该框架仅需少量实地样本进行微调即可实现CND的高精度估算,其性能显著优于传统的查找表反演方法和纯数据驱动的深度学习模型,有效解决了有限样本条件下模型训练与泛化的核心难题。
模型在不同生育阶段和氮肥处理梯度下均保持了较高的估算精度和鲁棒性,展现出对复杂田间条件的优异适应性。将其应用于无人机高光谱影像,成功实现了从点到面尺度的空间扩展,证明了该方法在精准农业变量施肥中的实用潜力。尽管在跨年迁移时模型的泛化能力仍面临数据分布变化的挑战,但研究结果已显示出其应对年际差异的潜力。
总之,这项研究不仅为冬小麦氮营养无损监测提供了一种新颖可靠的技术方案,更重要的是,它提出了一个整合物理机制与数据驱动以解决农业遥感中模型可迁移性和小样本学习挑战的创新研究范式。该框架兼具物理可解释性与高计算效率,对于推动农业遥感从理论走向实际应用,实现作物生长过程的精准感知与智能管理,具有重要的理论价值和广阔的应用前景。未来的研究可进一步探索增强辐射传输模型对三维冠层结构的表征,并发展“地面-无人机-卫星”多尺度融合的反演体系,以促进大尺度农业遥感监测的业务化应用。