《Future Foods》:Machine Learning-Based Prediction of Cold-Pressed Oil Storage Time Using NIR and Electronic-Nose Data
编辑推荐:
针对传统油脂货架期评估方法破坏性强、参数单一且无法反映脂质氧化复杂性的问题,研究人员开展了结合近红外光谱(NIR)与电子鼻(e-nose)数据的机器学习研究。该研究成功构建了ANN模型,准确预测了脂肪酸、多酚及挥发性氧化产物的变化,并整合形成多指标指纹,最终利用PLSR和RF模型实现了对冷榨油贮藏时间的非破坏性估测,误差(MAPE)为23%,为实时质量监控和减少食品浪费提供了创新方案。
冷榨植物油因其富含多不饱和脂肪酸(PUFA)和生物活性物质而备受青睐,但这也使其极易发生氧化变质,产生令人不悦的哈败味,从而降低产品接受度和市场价值。传统的货架期评估主要依赖于过氧化值等破坏性的实验室单指标分析,这些方法耗时费力,且难以全面反映油脂在储藏过程中复杂的、多因素共同作用的劣变本质。因此,开发快速、非破坏性的技术来动态监控油脂品质、预测其剩余货架期,对于生产商控制产品质量、零售商管理库存以及消费者避免食用变质产品、减少食物浪费都具有重要意义。
本研究正是为了应对这一挑战而开展。研究人员在《Future Foods》上发表论文,提出了一种创新的解决方案:他们巧妙地将两种快速扫描技术——近红外光谱(NIR)和电子鼻(e-nose)——与先进的人工智能算法相结合,旨在仅通过非破坏性的测量,就能预测冷榨油的化学劣变程度及其实际储藏时间。这就像是为油脂装上了“智能嗅觉”和“智能视觉”,无需打开瓶子进行复杂化验,就能洞察其内部化学变化的“年龄”。
为了开展这项研究,团队选取了六种具有不同脂肪酸组成的冷榨油(黑孜然、向日葵、高油酸向日葵、菜籽、亚麻籽和大麻籽油),在模拟家庭使用条件下(透明PET瓶,25°C,每日光照)储藏168天,并在10个时间点取样。关键的技术方法主要包括:1)使用手持式近红外光谱仪和包含九个金属氧化物半导体传感器的定制电子鼻,对所有油样进行非破坏性测量,获取光谱和气味指纹数据;2)运用气相色谱、液相色谱-串联质谱等传统分析技术,精确测定每份样品的五种脂肪酸、48种多酚和18种次级脂质氧化产物的含量,构建高质量的化学“真相”数据集;3)采用人工神经网络(ANN)等多种机器学习算法,建立从传感器数据预测化学成分的模型,并将预测出的多指标化学指纹进一步输入到偏最小二乘回归(PLSR)、主成分回归(PCR)和随机森林(RF)等模型中,最终预测油脂的储藏时间。
近红外光谱评估储藏过程
通过分析储藏过程中的近红外光谱变化,研究发现光谱能灵敏地捕捉油脂的氧化信息。在1699–1776 nm区域(与不饱和脂肪酸C-H伸缩的一级倍频相关)的吸光度下降,反映了PUFA的消耗;而在2269–2396 nm区域(与脂酰链的C-H伸缩/变形组合带相关)的吸光度降低,则与油脂次级氧化导致的链断裂和结构变化有关。例如,黑孜然油在1595–1630 nm区域的吸光度独特上升,可能与其富含的芳香族酚类物质(如百里醌)的氧化转化有关。这些结果表明,近红外光谱能够区分不同油脂的氧化阶段和特异性降解模式。
电子鼻评估
电子鼻的传感器响应同样显示出清晰的随时间变化的模式。对醛类和酮类敏感的传感器(如MQ138)以及广谱传感器(MQ135)响应最为强烈,这与油脂氧化过程中产生的己醛、戊醛等关键挥发性物质的积累相符。富含PUFA的油脂(如大麻籽油、亚麻籽油)传感器信号下降最陡峭,表明其氧化速率最快、挥发性产物生成最多。相关性分析进一步证实,电子鼻信号与气相色谱-质谱测定的多种次级氧化产物(如己醛、(E)-2-壬烯醛)含量显著相关,验证了其用于监测氧化过程的化学可靠性。
机器学习建模
在分类任务中,基于近红外光谱的人工神经网络模型能够以96.2%的整体准确率区分六种油类,而基于电子鼻的模型准确率为77.6%。在更困难的按生产商分类任务中,两者准确率均较低,表明传感器技术更擅长捕捉油类本身的化学差异而非细微的产地差异。
在回归预测任务中,模型表现出色。使用贝叶斯正则化算法的ANN模型,能够基于近红外光谱准确预测五种主要脂肪酸的含量,测试集相关系数R达到0.95。使用Levenberg–Marquardt算法的模型,对48种多酚的预测取得了R=0.97的高精度。基于电子鼻数据预测18种次级脂质氧化产物的模型,测试集R为0.82。这些模型在未参与训练的第77、147和213天的“部署”样本上也表现稳健,验证了其泛化能力。
用于储藏时间预测的多指标分析
这是本研究的核心创新。研究人员将上述ANN模型预测出的所有化学指标(共71个特征)整合起来,构建了多指标回归模型来预测储藏时间。在偏最小二乘回归、主成分回归和随机森林三种模型中,偏最小二乘回归展现了最佳的线性预测能力(R=0.87),而随机森林取得了最低的预测误差(平均绝对百分比误差MAPE为23.3%)。重要的是,这些模型能够正确地对未见过样品的储藏时间进行排序(77天 < 147天 < 213天),证明基于传感器预测的化学指纹能够有效反映油脂氧化的“时间轨迹”。
研究结论与讨论部分强调,这项工作首次证明,结合近红外和电子鼻的非破坏性快速扫描技术与机器学习,能够准确预测家庭储藏条件下多种冷榨油的化学劣变和储藏时间。通过构建“传感器数据 → 化学成分预测 → 多指标指纹整合 → 储藏时间估测”的框架,该研究实现了从分子层面理解氧化过程到实际应用场景预测的跨越。与以往专注于单一质量参数或分类的研究不同,本研究提出的多指标框架能够非破坏性地重建油脂的储藏历史,为实时质量监控、早期变质预警以及减少与氧化哈败相关的食物浪费提供了强有力的工具。尽管未来需要在更多油种、包装条件和环境变量下进行验证,但该研究为冷榨油行业乃至整个食品工业迈向数据驱动的、可持续的质量控制新范式奠定了坚实的基础。