《Food and Energy Security》:Interspecies Prediction of Nitrogen Content in Processed Plant Samples Using Spectroscopic Modeling and Transfer Learning
编辑推荐:
本综述系统评估了利用光谱技术结合机器学习模型(PLSR和RF)预测多物种植物叶片氮含量的可行性与局限性。研究表明,基于预处理样本的PLSR模型具有更高预测精度(R2=0.95),并揭示了C3与C4植物在400-670 nm波段的光谱差异。研究为农业精准施肥提供了跨物种模型泛化的重要理论依据。
引言
氮素是影响农作物生长、产量和品质的关键营养元素,直接参与蛋白质合成、叶绿体形成等生理过程。传统氮含量检测方法耗时费力,而光谱技术结合机器学习为快速无损检测提供了新途径。本研究通过分析咖啡、甘蔗、豆类等7类作物的预处理样本,系统探讨了光谱模型在跨物种氮含量预测中的潜力。
材料与方法
研究收集555份田间样本,经60°C烘干研磨后,使用FieldSpec 3光谱仪(350-2500 nm)采集光谱数据。通过多元散射校正(MSC)和Savitzky-Golay滤波进行光谱预处理,分别建立偏最小二乘回归(PLSR)和随机森林(RF)预测模型。迁移学习评估涵盖三个维度:物种间迁移、时序稳定性验证以及独立数据集测试。
结果与讨论
描述性统计显示,C3植物(如豆类)氮含量(均值45.55 g·kg-1)显著高于C4植物(甘蔗均值14.11 g·kg-1)。光谱特征分析发现,所有作物在530 nm、615 nm和670 nm处均出现特征吸收峰,这些在鲜样中被水分掩盖的特征在预处理样本中清晰显现。PLSR模型在全球数据集上表现最优(R2=0.95,RMSE=2.16 g·kg-1),显著优于RF模型(R2=0.88)。变量重要性分析表明,可见光区(450-680 nm)和红边区域(680-750 nm)波段对预测贡献最大,其中702 nm(PLSR)和707 nm(RF)波段尤为关键。
模型泛化测试显示,PLSR对"其他作物"类别预测效果最佳(R2=0.77),而RF更适用于甘蔗物种。季节性验证发现, forage作物在春季(10月)的预测误差(RMSE≈3.50 g·kg-1)显著高于夏季(2月)和秋季(4月),表明物候期变化会影响模型稳定性。
结论与展望
研究表明,基于预处理样本的光谱建模能有效克服水分干扰,提升氮含量预测精度。未来研究可重点关注三个方向:开发融合深度学习的新算法、通过样本增强策略优化模型泛化能力、建立作物专属预测模型。该技术为构建跨物种营养诊断系统提供了重要技术支撑,对推进智慧农业发展具有积极意义。