一种新颖的光谱校正方法,用于消除外壳干扰并提高Torreya grandis坚果内部缺陷的近红外(NIR)检测精度

《Food Research International》:A novel spectral correction method for eliminating shell interference and improving NIR detection accuracy of internal defect in Torreya grandis nuts

【字体: 时间:2026年02月09日 来源:Food Research International 8

编辑推荐:

  针对青椒果壳光谱干扰导致内缺陷检测精度下降的问题,提出融合全连接神经网络(FNN)与高斯滤波(GS)的近红外光谱校正方法。实验对比显示传统方法DS和PDS对模型性能提升有限甚至下降,而FNN+GS校正方法使RF和SVM模型准确率、灵敏度均达100%,显著优于未校正及壳光谱校正方法,有效消除壳谱干扰并增强缺陷特征,为坚果类作物内品质评估提供新思路。

  
詹家军|侯碧燕|杜园|胡宇|孙莉莉|吴家胜|孙彤
浙江农林大学光机电工程学院,中国杭州311300

摘要

外壳产生的光谱干扰显著影响了Torreya grandis坚果内部缺陷的检测,降低了检测精度。为了解决这个问题,本研究开发了一种近红外光谱校正方法,该方法结合了全连接神经网络(FNN)和高斯滤波(GS),以消除外壳光谱的干扰并提高黑核缺陷检测的准确性。比较了三种方法的校正性能,包括直接标准化(DS)、分段直接标准化(PDS)以及所提出的FNN与GS的组合方法。同时,还使用RF、SVM、XGBoost和LightGBM构建了检测模型。结果表明,DS和PDS的校正效果有限,甚至导致模型性能下降;而FNN与GS的组合方法则实现了更有效的校正,显著提高了分类精度。在预测集上,RF和SVM模型的准确率、灵敏度和特异性均达到了100%。XGBoost和LightGBM的准确率为95.83%,特异性为100%,灵敏度为91.67%。与使用未校正原始光谱开发的模型相比,RF和SVM模型的灵敏度分别提高了16.67%和19.44%,准确率分别提高了8.33%和9.72%。与使用核光谱开发的模型相比,RF和SVM模型在准确率和灵敏度上均更胜一筹。所提出的校正方法有效去除了与外壳相关的气谱干扰,增强了与缺陷相关的气谱特征,实现了高精度的无损黑核缺陷检测。这种方法为使用NIRS进行其他坚果品种的内部质量评估提供了有价值的参考。

引言

Torreya grandis是一种原产于中国的坚果,富含脂肪、蛋白质、碳水化合物和多种维生素,具有很高的营养价值以及独特的风味(Wang等人,2021年)。Torreya grandis的果实被绿色果皮包裹,如图1所示。去除果皮后即可获得可食用部分。坚果核中含有单宁(Wang等人,2023年),因此在食用前需要经过后熟处理。通常,收获绿色果实后,会将它们堆放在一起,利用其呼吸作用产生的热量在低温下促进后熟过程(Zhou等人,2019年)。然而,堆放过程中通风不良或局部过热可能导致果皮腐烂。腐烂组织中的芳香油会渗透到坚果核中,产生难闻的气味。这种现象被称为Torreya grandis的黑核缺陷(Zhang等人,2020年)。这种缺陷主要表现为坚果核内有霉味,严重影响其可食用性。虽然偶尔也会影响果皮颜色,但主要指标还是集中在坚果核内部。传统的检测方法依赖于感官评估或实验室分析,这些方法往往具有破坏性且耗时,不适合高通量处理和分发。因此,开发一种快速、无损且高精度的Torreya grandis坚果内部缺陷检测方法至关重要。
近年来,近红外(NIR)光谱技术在农业(Tsuchikawa等人,2022年;Li等人,2024年)、食品(Grassi & Alamprese,2018年;Li等人,2025年)和工业(Razuc等人,2019年;Reboucas等人,2010年)领域得到了广泛应用,因为它具有速度快、效率高和无损的特点。研究人员也利用NIR光谱技术检测坚果的内部缺陷。Moscetti等人(2014年)开发了一种线性判别分析(LDA)模型,使用NIR光谱检测栗子内部的虫害,错误率仅为8.41%。Carvalho等人(2019年)使用PCA-LDA模型评估了澳洲坚果的质量缺陷,正确识别出83%的带内部缺陷的带壳坚果。Rahman等人(2021年)结合NIR光谱和变量选择算法及校准模型检测澳洲坚果的内部缺陷,准确率达到91.4%。Rogel-Castillo等人(2016年)使用NIR光谱和化学计量方法检测杏仁的潜在内部损伤,PLS-DA模型的错误率在8.2%到9.2%之间。Zhang等人(2021年)将NIR光谱与贝叶斯分类器结合,用于检测花生中的黄曲霉毒素B1污染,最大判别准确率达到91%。Zhang和Wang等人(2025年)使用NIR光谱结合多重投票方法快速无损检测山核桃的空洞缺陷,准确率达到87.11%。其他研究也利用NIR光谱检测了多种坚果的内部缺陷(Canneddu等人,2016年;Li等人,2019年;Zhang和Cai等人,2025年)。这些研究表明,大多数关于带壳坚果内部缺陷的NIR研究都使用了包括外壳和核在内的整个坚果的光谱数据。由于内部缺陷位于坚果核内部,外壳光谱会成为干扰,不可避免地影响检测结果并降低缺陷检测模型的准确性。此外,在实际应用中,近红外光谱常受到表面粗糙度、组织结构不均匀性、包装材料和外壳等外部因素的影响,这些因素会导致散射效应、基线偏移和非线性光谱失真,从而掩盖与内部质量属性相关的吸收特征(Yu等人,2024年)。因此,原始光谱可能包含大量非目标信息,导致检测精度和鲁棒性降低,凸显了适当光谱校正策略在农业应用中的重要性。
一些研究人员已经开展了减少外部光谱干扰影响的研究。Mishra等人(2023年)提出将近红外高光谱成像与光谱正交化相结合,以消除塑料对成像场景的影响,提高了塑料袋中果实的识别能力。Sohrabi等人(2018年)应用乘法散射校正和导数预处理技术,校准了聚氯乙烯(PVC)和高密度聚乙烯(HDPE)薄膜中樱桃番茄的NIR光谱,校正后的光谱产生的可溶性固体含量预测模型的决定系数(R2)提高了0.91。Ding等人(2023年)研究了聚氯乙烯(PVC)、聚乙烯(PE)和可膨胀聚乙烯(EPE)等各种包装材料对芒果NIR基质量评估的光谱干扰。通过结合光谱过滤和变量选择与最小二乘支持向量机(LS-SVM)模型,包装芒果的预测性能得到改善,残差预测偏差(RPD)从2.31增加到3.05。大多数旨在去除外部光谱干扰的研究都集中在水果和蔬菜包装上,而关于坚果外壳光谱影响的研究仍然有限。特别是Torreya grandis坚果的外壳不透明且具有强散射特性,这使得近红外信号在穿透过程中容易受到干扰,导致外壳和核的光谱特征混合。因此,这种光谱复杂性阻碍了模型准确检测Torreya grandis坚果内部缺陷的能力。
光谱滤波可以在数据采集和分析过程中减少或消除光谱干扰,提高近红外(NIR)模型的预测精度(Mohammadi-Moghaddam等人,2018年)。传统的光谱校正方法,如直接标准化DS和PDS(Xue等人,2023年),因其简单性、可解释性和相对较低的计算成本而被广泛使用。这些方法在相对稳定的测量条件下能有效校正线性基线偏移、散射效应和仪器相关变化。然而,这些传统校正方法的性能往往受到线性假设和预定义预处理规则的限制。在光谱受复杂农业产品影响的情况下,如结构不均匀、强散射和光与生物组织之间的非线性相互作用,线性校正策略可能无法完全分离目标信息和背景干扰。在某些情况下,不适当的校正甚至可能扭曲内在吸收特征,导致模型鲁棒性下降和检测精度降低。最近,基于机器学习和深度学习的光谱校正方法受到了越来越多的关注。这些方法可以直接从数据中学习非线性映射,自动提取相关光谱特征,更好地处理复杂的干扰模式。与传统方法相比,基于深度学习的校正技术通常具有更强的适应性和泛化能力,近年来已成为光谱校正研究的主要方向(Cheng等人,2023年;Chatzidakis和Botton,2019年;Fan等人,2023年)。
本研究旨在消除Torreya grandis坚果外壳对近红外内部缺陷检测的光谱干扰。为了克服传统校正方法的局限性,本研究提出了一种结合全连接神经网络(FNN)和高斯平滑(GS)的光谱校正方法,用于校准带壳坚果核的NIR光谱,从而去除外壳引起的光谱成分,恢复接近核的光谱,显著提高Torreya grandis坚果黑核缺陷无损检测的准确性。

章节片段

样本

本研究中的Torreya grandis坚果样本采集自中国浙江省绍兴市。为确保随机性,样本选择遵循随机抽样原则。研究团队与当地Torreya种植者合作,根据形态特征对样本进行分类,区分出疑似有内部缺陷的样本和正常样本,并随机选取部分样本送往实验室进行进一步分析。
收集光谱数据后

光谱分析

图4展示了正常Torreya grandis核和黑核缺陷的近红外光谱曲线,包括带壳和去壳的情况。图4(a)和4(b)显示了带壳核的原始和平均光谱曲线,而图4(c)和4(d)显示了去壳后的核光谱。如图4所示,带壳核和核样本在吸光度上存在明显差异,表明它们在成分上有显著差异。

结论

本研究提出了一种利用近红外光谱快速无损检测Torreya grandis带壳坚果黑核缺陷的方法。为了解决外壳光谱干扰掩盖缺陷核特征信号的问题,开发了一种新的光谱校正方法,该方法结合了全连接神经网络和高斯平滑技术。结果表明,传统的校正方法(如DS和PDS)无法提高模型性能,并存在风险。

作者贡献声明

詹家军:撰写——原始草案、方法论、研究、数据分析、概念化。侯碧燕:验证、方法论、研究、数据分析。杜园:方法论、数据分析。胡宇:方法论、数据分析。孙莉莉:资源准备、研究。吴家胜:项目管理、研究。孙彤:撰写——审稿与编辑、可视化、监督、项目管理、资金获取、概念化。

资助

本工作得到了浙江省省级高校基本科研经费(编号:2021TD002)和杭州市自然科学基金(编号:2024SZRYBC130001)的支持。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号