编辑推荐:
苹果内部霉变(AMC)早期检测方法研究,提出集成传输近红外光谱、定制柔性传输盘和深度学习模型(CNN-LSTM)的综合解决方案。通过优化光谱预处理(Savitzky-Golay、SNV、MSC、中心化)和波段选择策略(SCARS-SPA),在340个训练集和202个验证集中实现健康/霉变98.82%二分类精度和健康/轻/重三级分类97.65%精度。柔性传输盘有效稳定光学路径、抑制环境光干扰和果体振动噪声,使光谱信号增强4.3倍,为工业在线分选提供可靠技术支撑。
郭志明|桑伟星|陈阳|叶学斌|道格拉斯·费尔南德斯·巴宾|希拉·贾扬|陈旺|孙昌军|邹晓波
中国轻工业食品智能检测与加工重点实验室,江苏大学食品与生物工程学院,镇江212013,中国
摘要
苹果霉心病(AMC)会导致严重的产后损失,但由于缺乏可见症状,早期感染仍然难以检测。本研究提出了一种集成的、适用于工业环境的方法,该方法结合了近红外(NIR)光谱传输技术、定制的柔性传输托盘和深度学习分类算法,以实现早期AMC的准确、高效率检测。该托盘的设计旨在稳定果实位置,减少环境光干扰,并引导NIR光照穿过果芯,从而获得可重复的光谱数据。光谱数据经过Savitzky-Golay平滑处理、标准正态变量变换、乘法散射校正和均值中心化处理。研究系统评估了不同的波长选择策略(CARS、SCARS以及CARS与SPA的组合),并使用BP、CNN、LSTM和混合CNN-LSTM架构开发了两类(健康/患病)和三类(健康/轻度/重度)的分类器。基于SCARS-SPA选定的波长训练的CNN-LSTM模型表现最佳,两类分类的准确率为98.82%,三类分类的准确率为97.65%。这些结果表明,SCARS-SPA + CNN-LSTM流程结合柔性传输托盘,为早期、精确的AMC检测提供了一个可靠且可重复的框架。所提出的系统适用于基于传送带的集成和实时分选,为减少经济损失和提高商业苹果供应链的质量控制提供了实际解决方案。
引言
苹果霉心病(AMC)是一种隐蔽的内部真菌病害,在储存和分销过程中会降低果实品质,并导致生产和供应链中的重大经济损失。通常,感染发生在开花期,真菌孢子通过花萼进入果实并定殖在果心部位,这些感染在早期往往没有症状[1]。多种真菌,尤其是常见的Alternaria属真菌,都可引发AMC。AMC的发生率受果园开花条件、品种易感性和产后处理方式的影响。这些因素共同导致了潜伏感染,这些感染通常会逃避田间分选,并在储存期间表现为果芯腐烂。这些流行病学特征使得果园级别的控制措施不够有效,因此迫切需要可靠的早期检测和分离策略[2]。AMC的经济影响深远。统计数据显示,在主要苹果生产区,像‘Fuji’这样的易感品种在长期冷藏期间的感染率可达到15%–25%。由于受感染的苹果外观上看起来健康,单个“腐烂的果芯”到达消费者手中会导致品牌声誉的严重损失和出口拒绝,每年给行业造成数百万美元的损失。近红外(VIS-NIR)光谱传输技术可以穿透果皮,探测与水分、糖分和细胞壁成分相关的吸收特征,以及由于组织退化引起的散射变化。这使得该技术非常适合检测表面反射方法无法捕捉到的内部病害[3]。早期霉心病病灶与健康组织的光谱对比度很低,这种微弱信号容易被光散射、基线漂移和仪器噪声掩盖[4]。尽管NIR技术在实验室环境中取得了成功,但在工业在线系统中仍存在一个关键的实际问题:光路的不稳定性[5]。在传统的滚筒式传送带上,果实的持续旋转和振动会产生“动态光路”,引入大量噪声,掩盖了早期AMC的微弱光谱信号。此外,大多数现有研究仅关注软件改进,忽视了稳定物理传感接口所需的硬件-软件协同作用[6]。在工业在线环境中,其他变量因素进一步降低了信噪比,限制了模型的通用性。果实大小、方向、固定几何形状、环境照明和传送带运动的变化都会影响光路长度和散射特性,从而导致测量不稳定[7]。这些物理和工程限制在应用研究和综述中已被多次提及,强调了需要协调设计光学硬件、信号处理和模型简洁性的必要性,而不仅仅是依赖建模方法[2]。解决这些限制需要采取措施来稳定光路传输、控制环境光,并使用反映实际在线操作条件的数据集来评估方法。
针对性的光谱预处理和简洁的波长选择可以解决测量变异的主要来源,提高模型稳定性[8]。预处理可以消除基线漂移并补偿散射,同时保留化学意义上的吸收特征;变量选择方法将分析集中在携带最强病灶信号的波段上,降低维度,减少过拟合风险,提高可解释性,并降低实时分选的计算成本[9]。降低维度可以减少过拟合风险,提高可解释性,减轻实时分选的计算负担,并为传感器设计提供依据[10]。胡等人[11]使用连续投影算法结合最小绝对收缩和选择算子(SPA-LASSO)基于NIR光谱的特征选择来预测葡萄成熟度。张等人[12]将声学或振动数据与传输的VIS-NIR信号结合,以提高对早期内部缺陷的检测灵敏度,尤其是在单模态光谱对比度较低的情况下。预处理、合理的变量选择和多模态融合可以共同提高在线检测系统中弱病灶的检测能力[13]。
机器学习和深度学习的同步发展为检测微弱、低对比度的光谱特征带来了实际优势[14]。2025年的最新研究强调了向更复杂神经架构的转变。例如,Lekhya等人[15]提出了一个基于RNN的框架,用于水果和坚果果皮管理,利用循环架构从序列组成信号中提取长期时间依赖性;该研究展示了序列模型如何支持自动化的产后决策规则和价值化路径,同时减少对人工特征工程的依赖。Maruthai等人[16]引入了一种混合视觉图神经网络(HV-GNN),将卷积局部特征提取与基于图的关系建模相结合,以捕捉图像区域之间的空间和语义关系,与仅使用CNN的基线相比,在早期害虫和疾病检测方面取得了显著改进。Sai Tejasree等人[17]提出了一种端到端的基于CNN的水果识别和分级流程,结合了区域检测和特征嵌入以实现实时分选;该工作强调了多模态集成(例如,视觉与光谱传感器的结合)在提高吞吐量和系统鲁棒性方面的实际应用价值。优化算法的并行进展,如环境遥感中的应用[18],进一步展示了AI处理多样化、高维农业数据的能力。
然而,将这些视觉或静态模型适应于滚动果实的1D光谱领域仍然是一个具体挑战。与手工制作的特征相比,端到端的神经网络通过自动发现上下文关系来减少人工工程[19]。深度模型也天然适用于多模态融合[20],如声学-光谱苹果果芯检测所示[13]。基于这些近期趋势,Dhiman等人[21]利用CNN和LSTM的融合来提高对仪器变化的鲁棒性。受此算法演进的启发,我们的研究提出了一种专门的CNN-LSTM架构,旨在从动态光谱序列中捕捉霉心病的时空“指纹”,有效地证明了超越传统机器学习方法的必要性。这些建模策略可以与精心设计的硬件和预处理流程相结合,帮助弥合实验室演示与可靠在线苹果分选之间的差距[22]。
尽管NIR光谱技术在受控实验条件下可以检测到内部病害,但其在高效率包装线上的实际应用仍受到工程和物理限制[23]。Jie等人[24]表明,传送过程中果实的摆放位置和方向会改变有效光路长度和散射特性,这些变化会修改光谱基线和吸收信号的相对强度,从而迅速掩盖早期病灶的微弱光谱特征。Cortés等人[25]报告称,不受控制的环境照明和光源漂移会增加背景干扰和基线偏移,降低不同时间和批次之间的光谱可比性。Tian等人[26]发现,早期霉心病病灶仅引起轻微的化学和结构变化,这些变化出现在狭窄的光谱带中,其微弱的对比度容易被仪器噪声和果实间的自然生物变异掩盖。Zhang等人[27]指出,许多高精度研究依赖于离线测量、严格控制的数据集或有限的样本量,这限制了模型在现实操作条件下的鲁棒性和泛化能力。Jiang等人[28]证明,分析挥发性化合物可以提供关于感染阶段和致病因素的补充信息。目前,工业分选线的主要实际问题是吞吐量和检测灵敏度之间的权衡。现有的在线NIR系统通常使用滚筒传送带,苹果在传送带上快速旋转,这种运动会引入由于光路长度和果实方向变化而产生的显著干扰噪声,这常常掩盖了早期AMC的微弱光谱特征(尤其是病灶较小时)。尽管最近的趋势倾向于使用复杂的深度学习算法,但这些算法往往无法补偿这种基本的物理不稳定性[29]。因此,迫切需要一种“硬件-软件集成”的解决方案,既能稳定果品-传感器接口,又能提供实时提取微弱信号的计算能力。为了解决几何不稳定性、环境光和病灶对比度弱的问题,本研究引入了一种环形传输托盘。该托盘的设计旨在稳定果实位置,减少果实损伤,缩小光路变化范围,并减弱杂散光。
高效准确的分类和区分模型对于在线应用也非常重要。研究中比较了四种标准的预处理方法:Savitzky-Golay滤波(SG)、标准正态变量变换(SNV)、乘法散射校正(MSC)和均值中心化(Center)。评估了多种波长选择策略,包括竞争性自适应加权采样(CARS)、稳定的CARS(SCARS)及其与连续投影算法(SPA)的组合。测试了多种分类器,包括BP、CNN、LSTM和混合CNN-LSTM,用于两类(健康 vs. 患病)和三类(健康、轻度、重度)的分类任务。
样本制备
苹果购自中国的五个生产区域,选取了形状均匀、大小相似且表面无损伤的样本。使用数字卡尺测量赤道直径,范围从65毫米到95毫米,平均值为78毫米。为确保模型的鲁棒性和可重复性,数据集分布详见表1。共使用了542个样本,包括一个主要建模集(340个样本)和一个独立验证集(202个样本)进行测试
托盘性能验证
为了量化柔性水果托盘在工业在线检测条件下的性能,本节进行了专注于光谱可重复性和环境光抑制的性能验证测试。在可重复性测试中,选择了10个苹果(涵盖三个直径组:65毫米、78毫米和95毫米),每个苹果放置10次,每次放置后收集平均光谱(积分时间=300毫秒,平均三次扫描)。
结论
本研究开发并验证了一种基于柔性托盘的VIS-NIR传输系统,用于苹果检测,并将其与一个系统化的数据分析流程相结合,该流程包括四种光谱预处理方法(SG、SNV、MSC和Center)、四种变量选择策略(CARS、SCARS、CARS-SPA和SCARS-SPA)以及四种分类器(CNN、BP、LSTM和混合CNN-LSTM)。柔性托盘显著提高了果芯区域的光谱均匀性,而SCARS-SPA多级选择
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本研究得到了国家自然科学基金(W2412103)、江苏省重点研发项目(BE2022363)和巴西圣保罗研究基金会(FAPESP)的资助。项目编号2024/15243-0。Douglas Fernandes Barbin教授是CNPq研究员(303478/2024-1)。