生成式人工智能为农业光谱学带来了强大的支持:通过AE-DDIM和TimeLLM技术提升地下养分预测的准确性

《Computers and Electronics in Agriculture》:Generative AI empowers agricultural spectroscopy: Enhancing subsurface nutrient prediction with AE-DDIM and TimeLLM

【字体: 时间:2026年03月06日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  花生根系氮磷钾多元素联合预测框架研究。提出AutoEncoder-Denoising Diffusion Implicit Model-Time-series Large Language Model(AE-DDIM-TimeLLM)集成物理约束生成高光谱数据与语义回归预测的创新方法,突破样本稀缺与非线性建模瓶颈。通过物理先验嵌入和时空语义建模,实现光谱生成PSNR达32.5dB,预测R2提升5-12%且RMSE降低20%,为地下根系精准营养管理提供新范式。

  
胡亚婷|张琪|王伟|李培武
中国农业大学工程学院,北京100083

摘要

花生根系是养分吸收和储存的主要器官,其氮(N)、磷(P)和钾(K)含量的时空变化对产量形成有重要影响。然而,由于根系位于地下,获取根系样本十分困难,且高光谱信号与养分含量之间的复杂非线性关系限制了传统反演模型的准确性。本研究提出了一种AutoEncoder-Denoising Diffusion Implicit Model-Time-series Large Language Model(AE-DDIM-TimeLLM)框架,该框架结合了物理约束的生成增强技术和大型模型的语义回归能力,用于生成花生根系的高光谱数据,并实现生长阶段的多元素联合预测。在AE阶段,嵌入了反射率范围、波段组平滑度和光谱一致性等物理先验信息,以确保潜在表示的物理一致性。在DDIM阶段,引入了波长位置编码(WPE)、波段注意力(Bandwise Attention)和双域块(Dual-Domain block)等机制,进一步提高光谱结构的真实性。结果表明,生成的光谱在PSNR、MRAE、RMSE和Valley-Corr等指标上表现优于传统生成模型,同时在结构准确性和物理真实性方面也更具优势。基于生成的数据,TimeLLM模型利用特征驱动的提示重建方法联合预测了生长阶段的N、P和K含量,使Rp2提高了5–12%,并使RMSEp降低了约20%。此外,研究还确定了能够最大化模型泛化能力而不导致过拟合的最佳增强比例。这些结果表明,将光谱物理约束与生成式人工智能(GAI)和语义光谱元素建模相结合,为准确的反演地下养分提供了有前景的方法,为花生种植中的精准施肥和养分管理提供了新的数据驱动见解。

引言

根系中氮(N)、磷(P)和钾(K)的动态变化直接影响植物生长和产量,是针对不同生长阶段进行精准施肥和养分管理的重要基础(Islam等人,2025年;Zhou等人,2025b年)。作物组织中的养分元素浓度与生长状况和产量高度相关(D. Zhou等人,2025年)。然而,大多数现有研究主要关注地上器官或果实,而对根系的关注相对较少(Kadirimangalam等人,2022年;Samarakoon等人,2025年;Zhao等人,2025a年)。根系作为养分吸收和调节的主要场所,能够在最早阶段反映土壤养分的可用性和植物的养分缺乏状况,比地上器官提供更直接和及时的诊断信息(Kirschner等人,2025年)。相比之下,叶片养分浓度容易受到光照强度、蒸腾作用和代谢分配的影响,环境变异性较大,而根系组成更能反映植物内在的养分吸收能力和内部储备,因此具有更高的准确性和稳定性(Kang等人,2025年)。目前,根系分析的发展受到高质量标注数据稀缺的严重限制。与非破坏性冠层检测不同,获取根系数据需要破坏性挖掘和繁琐的高成本化学分析(Chrysargyris和Tzortzakis,2025年;Gandhi等人,2024年),这使得在实际中构建大规模的配对光谱-养分数据集变得困难。样本的稀缺性对模型开发构成了重大障碍:在高维光谱数据面前,有限的样本量容易导致模型过拟合,从而阻碍了从复杂信号中学习通用特征表示的能力,降低了模型在未见数据上的泛化能力和预测鲁棒性。迫切需要一种绿色、快速且非破坏性的检测技术,以实现根际养分元素的连续预测,并为精准养分管理提供可靠的基础。
新兴的光学传感技术,如高光谱成像(HSI)、近红外光谱(NIRS)和拉曼光谱(RS)已广泛应用于各个研究领域(Gu等人,2025年;He等人,2024年;Zhang等人,2025a年)。HSI通过捕获丰富的空间和光谱信息,已成为定性和定量材料表征的重要工具(Wang等人,2023年;Zhou等人,2023年)。在农业领域,HSI在食品安全评估(Yu等人,2024年)、肉质新鲜度(Jue Zhang等人,2025年)、病虫害监测(Lin等人,2023年)和种子活力评估(Qi等人,2024年;Zhu等人,2025年)等方面显示出显著优势。然而,在应用于高光谱根系养分建模时,现有方法面临两个方法学挑战(见表1)。
在样本增强方面,传统的简单数据增强方法(例如添加高斯噪声和几何变换)易于实现,但它们只能引入浅层次的数值扰动,无法模拟根系光谱的复杂内在分布模式,因此难以从根本上解决小样本量导致的数据流形稀疏问题。因此,提出了生成式人工智能(GAI)来缓解样本稀缺问题。生成对抗网络(GANs)和扩散模型在生成高质量农业高光谱数据方面显示出巨大潜力(Chen等人,2024年;Tan等人,2025年;Zhang等人,2025c年)。然而,GANs面临训练不稳定、模式崩溃和光谱细节丢失等挑战(Cohen和Giryes,2023年)。尽管扩散模型提供了更好的稳定性(Du等人,2025年;Ho等人,2020年),但它们通常缺乏领域特定约束,导致生成的数据无法保持光谱曲线的物理一致性(Egusquiza等人,2025年;Oulmalme等人,2025年)。自动编码器(AE)在小样本光谱表示方面也显示出潜力(Yang和Hu,2025年)。然而,仅依赖基于AE的重建学习往往难以同时保留精细的光谱形状细节和扩展样本多样性。总之,由于根系光谱的强波长耦合和复杂特性,在小样本条件下,现有的基于深度学习的生成模型(如GANs、扩散模型和AE)通常难以通过单一方法同时实现物理一致性和鲁棒生成。
在预测建模方面,根系光谱与元素含量之间的关系涉及复杂、非线性的语义依赖性。传统的化学计量方法受线性假设的限制(Yang等人,2025年),而传统的深度学习模型往往缺乏先验知识和语义推理能力(Singh等人,2024年),倾向于关注局部特征或短期依赖性,难以捕捉光谱序列中的长距离语义关联。更重要的是,目前结合生成方法的研究通常将数据增强和预测建模视为两个独立阶段,仍缺乏一种能够将物理约束的数据生成与基于语义推理的准确预测深度结合的机制。
为了解决这些限制,本研究提出了一个基于生成式AI的综合性预测框架,明确整合了生物学目标和方法学目标。主要的生物学目标是实现花生根系中N、P和K含量的定量预测。为此,方法学目标包括两个层面:首先,为了解决样本限制,使用AutoEncoder-Denoising Diffusion Implicit Model(AE-DDIM)建立了物理约束的生成机制,提高了数据可用性,同时不牺牲光谱真实性;其次,为了克服传统回归方法的局限性,本研究引入了改进的TimeLLM框架,利用大型模型的强大推理和表征能力来捕捉高光谱特征与养分含量之间的复杂多尺度依赖性。整个工作流程如图1所示,包括三个主要模块:光谱收集与分析、增强与验证、建模与性能评估。这种方法为智能根系养分预测提供了有效途径。

章节片段

根系样本制备

本研究使用的是小白沙(baisha308)花生品种,该品种在中国科学院油料作物研究所武昌试验站种植。为了全面捕捉根系中养分元素的动态变化,在四个关键生长阶段采集了根系样本:幼苗期、开花期、结荚期和成熟期。这四个阶段对应于花生生长的主要阶段。

光谱分析

不同生长阶段的花生根系光谱曲线及其对应的标准差曲线如图4所示。右上角的插图显示了第一光谱导数的波长依赖性均方根(RMS)强度,表明了反射率变化的整体变化幅度,为后续的特征波段选择或建模加权提供了参考。主要的光谱峰和谷值

AE–DDIM在数据生成中的优势

结果表明,传统生成模型在光谱真实性和物理一致性方面存在固有局限性。VAE由于其高斯潜在假设的限制,生成的光谱过于平滑,关键吸收谷值减弱,降低了对N、P和K变化的敏感性。尽管GAN能够再现整体趋势,但存在模式崩溃和局部伪影,表现为某些区域的高频振荡,这影响了光谱的

结论

为了克服在样本有限条件下地下花生根系元素量化的挑战,本研究开发并验证了一个涵盖多个生长阶段的高光谱数据增强和预测框架。所提出的AE–DDIM模型生成的增强光谱具有出色的真实性和物理一致性,准确保留了花生根系的反射率范围、波段组平滑度和光谱一致性特征。该模型实现了

CRediT作者贡献声明

胡亚婷:撰写——原始草稿、验证、软件开发、方法论设计、正式分析。张琪:撰写——审稿与编辑、监督、资金获取、数据整理。王伟:撰写——审稿与编辑、可视化处理、验证、监督。李培武:监督、调查、资金获取、概念构思。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本工作得到了国家自然科学基金(项目编号:32441047)、湖北省科技重大项目(项目编号:2023BBA002)、浙江省“先锋”和“领头雁”研发计划(项目编号:2024SSYS0103)以及中国农业科学院的重大科技创新任务(项目编号:CAAS-ZDRW202416)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号