《Journal of Food Composition and Analysis》:Quality Evaluation and Variety Discrimination of Pear, Apple, Nectarine and Potato Using Optical Properties Coupled with Machine Learning
编辑推荐:
本研究针对水果蔬菜品质检测中传统光谱技术忽略散射效应的问题,通过单积分球系统测定梨、苹果、油桃和马铃薯的吸收系数(μa)与约化散射系数(μs′),结合偏最小二乘回归(PLSR)和随机森林(RF)等算法,实现了可溶性固形物含量(SSC)和果实硬度(FF)的精准预测(最优Rp2达0.884)及品种鉴别(最高准确率100%),为农产品无损检测提供了新方法。
随着全球农业生产和食品消费模式的演变,水果蔬菜的品质已成为影响消费者决策的关键因素。可溶性固形物含量(SSC)和果实硬度(FF)作为衡量果蔬品质的核心指标,不仅直接影响消费者的食用体验,更与产品的储运稳定性密切相关。传统可见/近红外(Vis/NIR)光谱技术虽已广泛应用于农产品品质检测,但其基于朗伯-比尔定律的分析方法往往忽略了光在生物组织中复杂的散射效应。实际上,光在果蔬组织这类非均匀介质中传播时,光子会经历不同程度的吸收和多次散射,导致光衰减。因此,深入理解光在果蔬组织中的传输机制,对提升检测性能具有重要意义。
近日发表于《Journal of Food Composition and Analysis》的研究通过创新性地结合光学特性测量与机器学习算法,为解决这一技术瓶颈提供了新思路。该研究团队开发了一套基于单积分球系统的光学特性测量平台,系统测定了梨、苹果、油桃和马铃薯四大类共10个品种的吸收系数(μa)和约化散射系数(μs′),并构建了多种预测模型,实现了品质参数的精准预测和品种的有效鉴别。
关键技术方法包括:使用单积分球系统测量漫反射率(Rd)和漫透射率(Td),通过逆加倍算法(IAD)计算光学参数;采用标准正态变量变换(SNV)等光谱预处理方法;建立偏最小二乘回归(PLSR)和人工神经网络(ANN)定量预测模型,以及线性判别分析(LDA)和支持向量机(SVM)等分类模型;所有样本(共320个)均来自杭州当地超市,涵盖4个梨品种、2个苹果品种、2个油桃品种和2个马铃薯品种。
光学特性分析结果:
研究发现不同果蔬品种的光学特性存在显著差异。苹果表现出最高的漫反射率,这与其光滑表面促进光反射有关;而梨和马铃薯因表面粗糙导致漫反射率较低。在约化散射系数方面,苹果显著高于其他品种,这与其果肉组织的物理结构密切相关。所有品种在970纳米附近均出现水分吸收峰,证实光学参数能有效反映组织内部化学成分。
品种鉴别结果:
基于主成分分析(PCA)发现不同品类样品呈现明显聚类趋势。随机森林(RF)模型在品种鉴别中表现最优,基于吸收系数(μa)的模型对油桃和马铃薯的鉴别准确率达100%,梨和苹果的鉴别准确率分别为92.9%和92.9%。特别是马铃薯作为块茎类蔬菜,其光学散射特性与水果存在本质差异,模型仍能实现完美鉴别,证明该方法适用于不同生物结构类型。
品质评价结果:
在梨的品质预测中,基于吸收系数(μa)的偏最小二乘回归(PLSR)模型表现最佳,SSC和FF的预测集决定系数(Rp2)分别达到0.877和0.884。在混合样品预测中,随着样本量增加,人工神经网络(ANN)模型表现出更强的适应性,对于苹果和油桃混合样本的SSC预测Rp2达到0.878。
讨论与结论:
研究表明,传统化学计量学方法与机器学习算法在果蔬品质检测中各具优势。偏最小二乘回归(PLSR)在小样本场景下稳定性更强,而随机森林(RF)在处理复杂数据集时表现出更好的鲁棒性。特别值得关注的是,通过将马铃薯纳入研究范围,验证了光学特性方法在不同生物结构类型(块茎与果实)间的适用性。该研究不仅为果蔬品质无损检测提供了新方法,更为光学特性在农产品质量评估中的推广应用奠定了理论基础。未来可进一步探索深度学习等先进算法,并结合多模态光学技术,提升模型的泛化能力和实用价值。