一种基于机器学习的生菜鲜重估算框架,该框架结合了农艺特性和图像特征

【字体: 时间:2026年03月04日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  生菜鲜重估算模型比较与可解释性分析。本研究提出融合农艺特性和图像特征的机器学习框架,通过对比随机森林、梯度提升树等七种模型发现深度神经网络(DNN)具有最高精度(R2=0.975)和最佳稳定性。SHAP分析表明农艺特征贡献度高于图像特征,其中叶数影响最显著,同时构建了包含两种生菜品种的基准数据集。

  
Feng Yu|Jun Xiao|Xining Zhang|Jinmeng Zhang|Ming Wang|Rupeng Luan|Yuhan Wang|Yuntao Ma|Qian Zhang
中国科学院人工智能学院,北京100049,中国

摘要

新鲜重量是量化生菜生长状态的重要指标。利用原始RGB图像和多维特征,并结合机器学习等先进技术,已成为估算生菜新鲜重量的流行趋势。然而,目前缺乏全面的研究来比较各种机器学习模型在估算生菜新鲜重量方面的性能。此外,由于机器学习模型是数据驱动的,这些模型基于多源输入所做的决策背后的机制并不容易解释。在这项研究中,我们开发了一个基于机器学习的生菜新鲜重量估算框架,该框架以农艺特征和图像特征作为输入,使用了两个自建的数据集。我们的比较研究表明,在评估的七个机器学习模型中,深度神经网络(DNN)在估算新鲜重量方面表现出最高的准确性,并且模型稳定性和跨品种适用性最强。对于表现相对较好的DNN和额外树(ET)模型,我们实施了Shapley加性解释(SHAP)算法来定量分析输入特征对模型的影响。结果表明,与图像特征相比,农艺特征对估算结果的贡献更大,其中叶片数量是最重要的因素。该框架能够识别影响模型输出的主要因素,不仅提供了高精度的估算,还增强了了对模型决策过程的理解。

引言

随着生活水平的提高,人们越来越意识到高质量蔬菜在人类饮食中的重要性(Fanasca等人,2006年;Ferguson等人,2014年)。生菜作为全球消费最广泛的叶类蔬菜之一,因其独特的营养成分和多样的用途而受到重视。它热量低、水分含量高且营养丰富,含有大量的类胡萝卜素、维生素C、维生素E和膳食纤维(Medina-Lozano等人,2021年;Zhang等人,2022a)。这些成分有助于预防贫血、癌症、衰老和高血压。健康饮食概念的日益推广进一步增加了生菜的消费量。因此,开发科学的栽培方法和有效的生长监测技术已成为研究的重点(Zhang等人,2022a)。新鲜重量的动态变化是反映生菜生长状态的重要指标。准确的新鲜重量评估使种植者能够评估植物健康状况、跟踪生物量积累并优化栽培管理,从而提高资源利用效率和产量(Chang等人,2021年;Lin等人,2022年)。在市场流通方面,精确的新鲜重量数据也为响应市场需求和管理供应链提供了可靠的支持。
传统的生菜新鲜重量测量方法通常依赖于手动称重单个植株,这在大规模监测中既耗时又费力,且估算结果容易受到主观因素的影响,导致准确性和一致性不足(Lin等人,2022年)。图像分析、计算机视觉和机器学习的最新技术进步使得生菜新鲜重量的准确监测成为可能,显著提高了作物管理的效率(Tian等人,2022年)。许多研究致力于建立生菜图像或表型测量与新鲜重量之间的相关性,旨在建立模型以准确估算新鲜重量,从而便于大规模实时监测。例如,Jung等人(2015年)建立了水培生菜的冠层像素面积与新鲜重量之间的相关性;Jiang等人(2018年)开发了一个用于实时重量估算的集成图像处理系统。随着计算机技术的进步,机器学习和深度学习已广泛应用于图像识别。这些方法通常比传统的统计模型更有效地捕捉输入特征与生菜新鲜重量之间的复杂非线性关系。最近的研究成功应用了深度学习模型,特别是卷积神经网络(CNN)来估算生菜新鲜重量。例如,Tan等人(2023年)针对植物工厂中受限和非开放环境带来的挑战,提出了一种利用倾斜视角图像的定位引导网络架构来估算新鲜重量。随着多传感器系统的普及,多模态融合方法变得尤为重要。Lin等人(2022年)开发了一个集成RGB-D数据的多分支网络,通过结合几何、深度和光谱特征,实现了0.938的精度。
从上述研究案例可以看出,输入数据和所选拟合模型是估算生菜新鲜重量的关键因素。首先,在输入数据方面,利用多模态数据的互补优势,如深度图像以及从原始图像中提取的几何、纹理和颜色特征,已成为新鲜重量估算的重要趋势。然而,更有效的机器学习和深度学习方法本质上是数据驱动的黑箱模型(Yuan等人,2020年)。当前的方法主要关注新鲜重量建模过程,但缺乏对多模态特征如何影响预测的分析——这对实际农业应用来说是一个关键限制。实际上,在使用数据驱动模型进行农业决策支持时,模型的可解释性尤为重要。换句话说,明确每个特征在模型决策过程中的作用至关重要。虽然模型可解释性问题在实践中的机器学习和深度学习应用中开始受到关注,但据我们所知,目前还没有研究专注于提高生菜新鲜重量估算模型的可解释性。其次,关于所使用的模型,一些浅层机器学习算法和深度学习模型已被应用于作物新鲜重量估算。然而,目前缺乏对这些模型的比较研究。目前尚不清楚哪种模型最好,或者深度学习是否优于浅层机器学习。在类似的研究中,Zhang等人(2020年)将CNN与线性回归、支持向量机和随机森林(RF)等没有深度网络结构的机器学习方法进行了比较,以估算三种生菜的新鲜重量、干重和叶面积。结果表明,CNN在估算准确性方面优于其他方法。然而,复杂的深度学习模型在应用过程中容易面临样本量不足和过拟合等风险(Ma等人,2021年),其黑箱性质更加明显(Castelvecchi,2016年)。因此,对用于生菜新鲜重量估算的模型进行公平和全面的比较至关重要。
为了研究常用机器学习模型在生菜新鲜重量估算方面的性能,并揭示多源输入特征对估算结果的影响机制,本研究尝试结合了六种浅层机器学习模型——RF、Lasso、额外树(ET)、梯度提升机(GBM)、XGBoost和AdaBoost——以及一个深度神经网络(DNN)模型,并使用了Shapley加性解释(SHAP)算法(一种基于博弈论的方法,用于解释机器学习模型输出)(Lundberg & Lee,2017年)。目的是设计一个新的、可解释的生菜新鲜重量估算框架。在这个框架中,五个手动测量的生菜农艺特征(新鲜重量、生长周期天数、植株高度、叶片数量、最大叶片宽度和最大叶片长度)和四种类型的图像特征(冠层面积、植被指数、几何特征、纹理特征)被很好地组织起来,使得即使样本量小也能实现高精度的新鲜重量估算。除了比较七个模型的估算准确性外,该研究还使用SHAP对模型输出的可解释性进行了分析,具体量化了多维输入特征的重要性,识别了影响模型输出的主要因素,并分析了这些因素对新鲜重量估算的影响机制。这反过来增强了我们对模型的理解。本文的主要贡献如下:
(1) 通过结合农艺特征和图像特征,设计了一个基于机器学习的生菜新鲜重量估算框架,实现了高精度和可解释的估算。
(2) 定量分析了农艺特征和图像特征的重要性,确定了生菜新鲜重量估算中的关键特征,并解释了主要因素对新鲜重量估算的影响机制。
(3) 使用从真实温室场景收集的数据构建了一个生菜新鲜重量估算的基准数据集,其中包括两种生菜品种的农艺特征和RGB图像。

数据

生菜样本来自中国北京市海淀区白王种植园的一个蔬菜温室设施(116.294399 E,40.078363 N)。在这项研究中,使用了两种不同的生菜品种——Mero直立生菜(Lettuce1)和Rosha散叶生菜(Lettuce2)进行新鲜重量估算实验。Lettuce1主要用于评估新鲜重量估算模型、进行可解释性分析以及分析主要因素

生菜新鲜重量估算与比较分析

表6展示了测试集上的生菜新鲜重量估算结果。模型比较显示,DNN获得了0.975的R2分数,表明它在所有模型中拟合数据集的效果最好。这可能表明DNN模型捕捉到了数据中的复杂模式和非线性关系。此外,DNN的RMSE和MAE值在所有模型中最低,分别为21.072和8.984,表明DNN

优秀DNN性能的机制分析

DNN模型在准确性、稳定性和跨品种适用性方面的优异表现可以归因于其内在的架构优势。与基于树的模型不同,DNN的深层分层结构使其能够自动学习输入数据的越来越抽象的表示(LeCun等人,2015年)。这种能力对于建模农艺特征和图像衍生特征之间的复杂非线性相互作用至关重要

结论

本文提出了一个基于机器学习的生菜新鲜重量估算框架,为监测生菜生长状态提供了支持。该框架使用农艺特征和图像特征作为输入,并使用两个自建的数据集和七种机器学习算法进行了新鲜重量估算实验。SHAP算法用于解释模型的决策过程。结果表明,所有七个模型的估算结果

CRediT作者贡献声明

Feng Yu:监督、项目管理、资金获取、概念构思。Jun Xiao:监督、概念构思。Xining Zhang:撰写——原始草稿、可视化、监督、软件、方法论、形式分析、概念构思。Jinmeng Zhang:撰写——原始草稿、可视化、软件、方法论、调查、形式分析、数据整理。Ming Wang:撰写——审阅与编辑。Rupeng Luan:撰写——审阅与编辑。Yuhan Wang:调查、数据

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了国家重点研发计划项目(2023YFD2201805)和北京智慧农业创新联盟项目(BAIC10-2026)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号