《Horticulturae》:Linking Cucumber Surface Color to Internal Hydration Level Using Deep Learning for Freshness Classification
Amin Taheri-Garavand,
Theodora Makraki,
Omidali Akbarpour,
Aggeliki Sakellariou,
Georgios Tsaniklidis and
Dimitrios Fanourakis
编辑推荐:
本文综述了将深度学习与植物生理学测量相结合,通过标准RGB图像实现黄瓜新鲜度无损分级的新方法。该研究构建了一个时间分辨数据集,将黄瓜表面颜色、纹理特征与基于重量法测定的相对水含量(RWC)进行关联,训练了定制卷积神经网络(CNN)对四个生理学意义明确的新鲜度等级进行分类,总体准确率达91.35%(Cohen’s Kappa = 0.875)。模型可解释性分析(Grad-CAM和显著性映射)证实CNN聚焦于与脱水相关的、有生理学意义的表面区域。这项工作展示了生理学信息驱动的深度学习在推进采后新鲜度评估方面的潜力,为基于水合状态的智能分选、货架期管理和供应链质量监控提供了现实路径。
基于深度学习关联黄瓜表面颜色与内部水合状态的无损新鲜度分级
1. 引言
新鲜园艺产品的采后损失,特别是脱水,是全球性的主要挑战。对于含水量超过95%的黄瓜而言,即使是中等程度的内含水合水平下降,也会迅速导致硬度丧失、表皮皱缩、视觉吸引力下降和货架期缩短,直接影响其市场价值。传统基于视觉分级和基本物理测量的采后评估方法,往往难以在内部水分已开始流失但外部症状尚不明显的早期脱水阶段进行有效检测。
内部水合状态是决定黄瓜新鲜度的关键生理指标。相对水含量(RWC)综合了细胞水合、膜完整性和组织膨压,被认为是衡量生理新鲜度的可靠指标。然而,传统的RWC测量依赖于破坏性、劳动密集型的重量法,不适合常规的采后监控或大规模质量控制。
近年来,计算机视觉和深度学习为园艺产品的无损质量评估开辟了新的机遇。卷积神经网络(CNN)尤其擅长从RGB图像中提取复杂的颜色和纹理特征。虽然深度学习已广泛应用于水果成熟度评估、缺陷检测和外部品质分级,但明确将图像衍生的表面特征与内部生理变量(如水合状态)联系起来的研究相对较少。弥合这一差距对于开发具有生物学意义且与生产实际相关的AI评估工具至关重要。
本研究旨在开发一个生理学信息驱动的深度学习框架,将黄瓜表面颜色和精细纹理特征与其内部水合水平相关联,以实现新鲜度分级。在黄瓜果实中,渐进性脱水会降低细胞膨压,改变表皮机械稳定性,导致角质层微变形、表面皱缩和光反射特性变化。组织水合度的丧失也会改变内部光散射和色素光学表现,影响感知的颜色均匀度和光泽度。这些由脱水驱动的结构和光学变化,为将外部表面外观与内部水合状态联系起来提供了生理学基础。
2. 材料与方法
2.1. 植物材料与采后贮藏条件
实验在希腊克里特岛Rethymno的一个商业温室(0.63公顷)中进行。选用单性结实黄瓜杂交品种'Cretasun RZ',因其在采收时果实形状、大小和表面颜色具有高度均匀性,从而最小化背景变异,便于稳健评估外部颜色性状与内部水合状态之间的关系。
种植在冬季进行,以降低蒸腾需求,促进稳定的植物水分状况,并在采收时最大化果实水合。温室采用主动加热,维持最低气温14°C。整个栽培期间,植物在充分灌溉条件下生长,以确保高植物膨压和果实完全水合。
果实于光周期开始前1小时采收,此时木质部水势接近日最大值,果实组织最接近完全水合。所有果实立即置于内衬湿纸的预冷穿孔聚乙烯容器中,在10°C的保温箱中运送至实验室。果实表面未进行任何处理(如清洗、打蜡或涂层),以防止表面光学性质的改变。
果实分别在10°C或25°C下贮藏,样本平均分配于两种贮藏条件。在为期4周的贮藏期内,每隔7天进行一次评估。来自两种贮藏温度(10°C和25°C)的数据合并用于模型开发和分析,以鼓励CNN学习与水合状态本身相关的视觉特征,而非温度特定的伪影。
2.2. 相对水含量测定
果实水合状态采用相对水含量(RWC)进行量化。通过将采收果实进行受控采后贮藏,建立了水合梯度。每个果实在各自贮藏温度下每隔7天称重一次,每次称重后立即采集一张RGB图像。
果实RWC根据以下公式计算:RWC = (鲜重 - 干重)/ (饱和鲜重 - 干重) × 100。
根据RWC值,果实被分为四个新鲜度类别:非常新鲜(≥98%)、中度新鲜(95-98%)、低新鲜度(90-95%)和腐败(<90%)。这些类别被用作模型训练和评估的真实标签。
2.3. 图像采集
果实成像使用定制的成像站(44×44×44厘米)进行,以提供标准化RGB颜色采集的稳定、封闭环境。内部表面涂覆哑光白漆以增强漫反射。
二维RGB图像使用CCD数码相机采集,相机设置在所有图像采集中保持一致。实验室成像环境条件维持在25±0.1°C和50±5%相对湿度。在此配置下,每个果实的成像流程约需1分钟。
2.4. 数据集准备与预处理
原始图像经过自动裁剪算法,将黄瓜主体与背景分离。完整数据集通过分层随机抽样分为训练集(70%)、验证集(15%)和测试集(15%)。所有图像在输入模型前被调整为256×64像素的统一空间分辨率,像素强度值归一化到[0,1]范围。
为增强模型鲁棒性和减轻过拟合,在训练集上应用了在线数据增强流程,包括随机旋转、水平翻转、缩放、平移和剪切变换。验证和测试图像仅进行尺寸调整和归一化。
2.5. 卷积神经网络架构
开发了一个定制的CNN,用于基于RGB图像的四类黄瓜新鲜度分类。网络架构旨在逐步提取与表面颜色和纹理相关的分层视觉特征,同时控制模型复杂度以减少过拟合。
输入层接收尺寸为256×64×3的RGB图像。网络包含四个具有递增滤波器深度(16、64、128和256个滤波器)的顺序卷积块。每个卷积块包含一个3×3卷积核、批归一化、ReLU激活函数和2×2最大池化层。在每个卷积块后应用了逐渐增加的Dropout正则化率(0.2、0.3、0.4、0.5),并对卷积核应用了L2权重正则化。
卷积特征提取后,将所得特征图展平并传递至包含512个神经元的全连接密集层。网络终止于一个具有Softmax激活的四神经元输出层。
2.6. 模型训练与优化
CNN使用Adam优化器进行训练,初始学习率为1×10-5。使用稀疏分类交叉熵作为损失函数。模型训练最多进行200个轮次,批次大小为32。应用了基于验证损失的平台学习率衰减策略和早停策略。
2.7. 模型评估与可解释性分析
在独立测试数据集上使用多种互补指标综合评估模型性能。计算了整体分类准确率和Cohen’s Kappa系数。按类别计算了精确度、召回率、特异性和F1分数。生成了混淆矩阵以可视化类别预测结果。
为进一步评估模型在不同决策阈值下的区分能力,采用“一对多”策略为每个新鲜度类别构建了受试者工作特征(ROC)曲线,并计算了相应的曲线下面积(AUC)。
为增强深度学习模型的透明度与可解释性,进行了梯度加权类激活映射(Grad-CAM)和显著性图分析,以识别对类别特定预测贡献最大的输入图像空间区域,并验证CNN是否聚焦于与渐进性脱水相关的、有生理学意义的表面区域和颜色-纹理模式。
3. 结果
3.1. 整体模型性能
数据集包含非常新鲜(n=1040)、中度新鲜(n=1040)、低新鲜度(n=1109)和腐败(n=971)图像。CNN在分类黄瓜新鲜度方面表现出强大性能。在独立测试集上,模型实现了91.35±0.42%的整体分类准确率和0.875±0.008的Cohen’s Kappa系数,表明预测与真实新鲜度类别之间具有高度一致性。加权平均精确度、召回率和F1分数值均超过0.97。
3.2. 按类别分类性能
最强的分类性能出现在腐败类别(RWC < 90%)和非常新鲜类别(RWC ≥ 98%)。腐败类别实现了0.966的召回率和0.956的F1分数。非常新鲜类别实现了0.943的F1分数和0.978的特异性。
中间新鲜度类别的性能相对较低。中度新鲜果实(95-98% RWC)的F1分数为0.811,低新鲜度果实(90-95% RWC)的F1分数为0.837。这些类别表现出更大的重叠,这与采后水分流失的渐进性以及相邻水合状态之间缺乏突变的视觉过渡相符。
3.3. 混淆矩阵分析
混淆矩阵显示了相邻新鲜度类别之间的系统性误分类模式。大多数分类错误发生在非常新鲜与中度新鲜样本之间,以及低新鲜度与腐败样本之间。这些误分类反映了脱水进程的生理连续性,靠近类别边界的果实在表面颜色和纹理特征上存在重叠。极端类别之间的直接误分类很少见,突显了模型在区分商业相关性高的新鲜度极端状态方面的鲁棒性。
3.4. 受试者工作特征分析
ROC曲线显示所有新鲜度类别都获得了高AUC值,证实了模型在不同决策阈值下对各类别的强大区分能力。腐败和非常新鲜类别表现出最高的AUC值。中间类别显示出略低的AUC值,反映了其固有的过渡性。
3.5. 模型可解释性与特征归因
模型可解释性通过Grad-CAM和显著性图进行分析。对于非常新鲜的果实,激活图突出显示了具有光滑纹理和一致着色的均匀表面区域。相反,腐败果实的激活图在表面皱缩、颜色异质性和光泽丧失相关的区域表现出强烈激活。
中间新鲜度类别显示出空间上更弥散的激活模式,表明模型依赖于细微的颜色梯度和局部纹理变化。定量分析进一步揭示了平均Grad-CAM激活强度与RWC之间存在显著的负相关,表明随着脱水进展,局部激活强度系统性增加。显著性图进一步证实CNN主要响应于表面颜色和纹理线索,而非背景伪影。
4. 讨论
本研究证明,通过标准RGB成像捕捉的黄瓜表面颜色信息,可以有效地通过深度学习与内部水合状态相关联,从而实现准确、无损的新鲜度分类。通过将基于生理学的RWC测量与CNN建模和可解释性分析相结合,该方法弥合了外部视觉性状与内部水分状态之间的差距,这是采后质量评估中长期存在的挑战。
4.1. 关联表面颜色与内部水合状态
水分流失是黄瓜采后品质劣化的主要驱动因素。CNN的强大整体性能表明,当使用深度学习进行分析时,基于RGB的表面颜色和纹理信息包含足够的潜在线索来推断内部水合状态。结合两种贮藏温度的数据,确保了模型预测由与水合相关的视觉线索驱动,而非贮藏特定条件,增强了该方法的生理相关性和实际适用性。
4.2. 类别性能与误分类模式
混淆矩阵分析揭示了大多数误分类发生在相邻的新鲜度类别之间。这种模式具有生理学意义,因为靠近类别边界的果实在内部水合状态上仅有微小差异,因此在表面特征上存在重叠,包括颜色饱和度、表面光泽的逐渐变化以及局部纹理不规则性的早期发展。这种重叠反映了采后脱水的连续性,期间结构和光学变化是渐进出现的,而非离散的转变。
ROC分析进一步证实了这些发现。ROC曲线在所有新鲜度类别上都表现出高AUC值,显示了模型的强大整体区分能力。非常新鲜和腐败类别显示出特别高的AUC值,而中间新鲜度类别略低的AUC值则反映了中度脱水的内在过渡性。
4.3. 模型可解释性的生理相关性
可解释性分析为CNN决策过程与已知的黄瓜脱水生理学之间提供了直接联系。Grad-CAM激活图显示,随着RWC下降,CNN的注意力逐渐从均匀的表面区域转移到表现出结构退化和光学变化的区域。这种空间注意力转移与脱水过程中表皮细胞膨压丧失、角质层变形和表面皱缩发展的理解一致。
平均Grad-CAM激活强度与RWC之间的显著负相关,为模型激活的生理相关性提供了定量证据,表明CNN不仅学习了统计模式,还捕捉到了与组织水合状态在光学上编码方式相关的生物学基础视觉特征。
4.4. 实际意义与未来方向
该方法在采后质量控制和供应链管理中具有直接的实际意义。基于RWC的分类框架为新鲜度评估提供了一个客观、可量化的基础,能够检测脱水早期阶段,此时内部水分已开始流失但外部症状尚不明显,从而可以采取主动措施来减少损失。
标准化的成像设置和消费者级相机的使用,表明该方法的实施具有成本效益,可轻松集成到现有的分选线中。未来的工作可以探索将该框架扩展到其他高水分园艺产品,评估其在商业规模和高通量环境中的性能,并研究将CNN与补充传感模式(如高光谱成像)相结合,以进一步提高早期质量劣化检测的准确性。