将离子迁移谱技术与机器学习相结合,用于橄榄油的地理溯源鉴定

《Food Control》:Integrating ion mobility spectrometry and machine learning for geographical authentication of olive oils

【字体: 时间:2026年02月03日 来源:Food Control 6.3

编辑推荐:

  本研究优化了HS-GC-IMS方法,结合随机森林算法和Shiny平台实现橄榄油四个产地的准确鉴别(100%),专家感官测试平均准确率68%,为地理标志保护提供新工具。

  
安娜·伊莎贝尔·罗德里格斯-古铁雷斯(Ana Isabel Rodríguez-Gutiérrez)、玛尔塔·巴雷亚-塞普尔韦达(Marta Barea-Sepúlveda)、乌迈玛·布图布(Oumaima Boutoub)、玛丽亚·何塞·阿利亚尼奥-冈萨雷斯(María José Alia?o-González)、米格尔·帕尔马(Miguel Palma)、塞费里诺·卡雷拉(Ceferino Carrera)
卡迪斯大学(University of Cadiz)理学院分析化学系,葡萄酒与农业食品研究所(IVAGRO),国际卓越农业食品校区(ceiA3),西班牙普埃尔托雷亚尔(Puerto Real),邮编11510

摘要

近年来,确保高价值农业食品(如橄榄油)的地理来源真实性和可追溯性的需求显著增加。这一需求源于保护原产地命名产品(Protected Designation of Origin, PDO)以及满足出口市场的质量标准。本研究优化了一种基于顶空气相色谱-离子迁移谱(Headspace-Gas Chromatography-Ion Mobility Spectrometry, IMSS)的方法,用于分析来自四个不同地区(西班牙、葡萄牙、摩洛哥和意大利)的橄榄油样品中的挥发性有机化合物。通过Box-Behnken设计和响应面方法(Response Surface Methodology)优化了实验条件,最终确定最佳参数为:样品量0.33克,在35°C下以500转/分钟的速度振荡孵育9分钟,顶空形成时间为9分钟,进样体积为0.11毫升。通过评估重复性和中间精密度(变异系数低于5%)来验证该方法的准确性。随后,将该方法应用于来自这四个地区的24个商业橄榄油样品,并利用IMSS方法结合先进的机器学习技术(Random Forest算法)进行预测分析,成功区分了不同地区的橄榄油。最后,开发了一个基于随机森林算法的Web应用程序,根据最佳条件分析四个新的商业样品,分类准确率达到100%。同时,由香气品尝专家组成的小组对这些样品进行了评估,平均辨别准确率为68%。

引言

自古以来,橄榄油在地中海文明的文化认同和经济发展中发挥了重要作用。它不仅是重要的饮食成分(Mataix Verdú & Barbancho Cisneros, 2007),还具有重要的药用价值(Abdalla et al., 2024)。现代科学研究(González-Acedo et al., 2023)证实,橄榄油中的酚类化合物(如羟基酪醇、酪醇和橄榄苦苷)具有显著的抗炎和抗氧化作用。
初榨橄榄油(Virgin Olive Oil, VOO)和特级初榨橄榄油(Extra Virgin Olive Oil, EVOO)的质量由欧洲法规定义的一系列标准进行监管,最新更新见实施条例(EU)2024/2707(European Commission, 2024)。该条例规定了符合市场标准的物理化学和感官特性要求以及橄榄油表征的分析方法。为确保地理真实性并打击欺诈行为,使用差异化的质量认证至关重要,尤其是原产地命名(Protected Designation of Origin, PDO)认证,如欧盟理事会条例(Council Regulation 510/2006)所定义。该认证由欧盟正式认可,确保橄榄油生产的所有阶段(种植、加工和包装)都在具有独特地理和文化特征的特定地区进行,这些特征包括气候、土壤类型、橄榄品种和传统工艺。PDO认证对原材料来源及栽培和加工方法有严格要求。因此,PDO认证的橄榄油不仅保证了产品质量,还提升了消费者偏好和商业价值。
由于严格的监管,PDO认证的橄榄油通常售价远高于未经认证的产品,这引发了诸如掺假和使用虚假地理来源或加工方法等欺诈行为。这种非法活动不仅构成经济欺诈(以PDO价格销售非认证产品),还引发了关于法规合规性和消费者保护的担忧(Alia?o-González et al., 2019a, Alia?o-González et al., 2019b; Calle, Punta-Sánchez, et al., 2023)。
在这种情况下,区分影响橄榄油行业的各种欺诈形式至关重要。与质量相关的欺诈主要涉及掺假、错误分类(例如将普通橄榄油或劣质橄榄油标榜为特级初榨橄榄油)或掩盖感官缺陷(Ferran, 2025; MAPA GOB, 2023)。这类欺诈已得到广泛研究,并通过官方法规规定的物理化学参数和感官分析加以解决。
相比之下,与地理来源或PDO认证相关的欺诈是一个日益严重的挑战(Kelly et al., 2005)。与质量相关的欺诈不同,地理来源欺诈即使产品符合常规质量标准也会发生,因为它主要涉及故意误导地理来源的虚假声明(例如滥用PDO标签或虚假声明生产国/地区)(Casadei et al., 2021)。尽管经济激励(如声誉、价格溢价和消费者信任)是这种行为的主要驱动力,但地理来源的真实性也对消费者保护有影响:不同生产区域的农艺实践和植物保护措施可能不同,农药残留也可能影响橄榄油的质量(Likudis et al., 2014; Razzaghi et al., 2018)。因此,错误标注来源可能导致消费者购买到在不同监管或控制体系下生产的橄榄油,从而暴露于受限或禁用的化合物中。这些因素凸显了需要强大的分析工具来验证来源声明的必要性。
尽管与质量相关的欺诈受到更多关注,但与地理来源相关的欺诈却相对较少受到重视。这主要是因为定义地理特征本身的复杂性,这些特征取决于多种相互作用的因素,如品种、土壤气候条件、农艺实践和加工技术。传统质量控制方法往往不足以验证来源声明,因此需要先进的分析方法来捕捉全面的成分特征。在这种情况下,结合多变量数据分析和机器学习(ML)的指纹技术成为地理认证的有希望工具,因为它们不依赖于单一标记的识别,而是利用与来源相关的复杂多变量差异。
离子迁移谱(Ion Mobility Spectrometry, IMS)是一种强大的分析工具,用于检测挥发性有机化合物(VOCs),通过测量离子化分析物在气体填充的漂移管中的移动时间来实现(Borsdorf & Eiceman, 2006)。由于多项优势,IMS在橄榄油行业受到广泛关注:它可以快速自动化地进行指纹分析,具有低检测限(ppb级别),在大气压下操作(便于便携式现场分析),并且符合绿色化学原则(非破坏性和无溶剂使用,Cumeras et al., 2015; Putri et al., 2020)。
IMS常与顶空(Headspace, HS)技术结合使用,可预浓缩主要和微量VOCs,这对于区分成分相似的样品(如不同类型的橄榄油)至关重要。此外,IMS还常与气相色谱(Gas Chromatography, GC)等分离技术结合,以提高化合物离子化效率并避免竞争性离子化现象(Eiceman et al., 2016)。尽管HS-GC-IMS配置在质量控制方面具有明显优势,但也会产生包含数百万数据点的复杂数据矩阵。
为应对这一挑战,提出了离子迁移谱总和谱(Ion Mobility Sum Spectrum, IMSS)方法。该方法利用HS-GC-IMS进行全局特征分析,无需单独识别化合物,从而生成特定样品的指纹。在农业食品行业中,这种方法特别适用于质量保证。已有研究表明,该方法可用于果汁(Calle, Vázquez-Espinosa, et al., 2023)、咖啡品种(Piotr Konieczka et al., 2020)、蜂蜜中掺杂物的检测和定量(Alia?o-González et al., 2019a, 2020)以及检测掺有棕榈油的芝麻油(Putri et al., 2020)。
机器学习(ML)最初用于模式识别任务,现在可为处理复杂的高维数据集提供强大解决方案,例如HS-GC-IMS生成的数据集。与传统统计方法不同,ML算法能够建模非线性关系,自动选择相关特征,并处理噪声或共线数据(这是食品基质中VOC分析的常见挑战)。ML不仅实现了准确分类和预测,还能提取常规技术难以发现的模式。因此,结合HS-GC-IMS和ML是一种强大的创新方法,适用于橄榄油行业的地理认证和质量控制,尤其是在欺诈行为增加和市场对可追溯性和透明度的要求不断提高的情况下(Calle, Punta-Sánchez, et al., 2023)。
已有研究证明了GC-IMS结合多变量分析或机器学习工具在区分橄榄油来源方面的潜力。特别是非靶向HS-GC-IMS分析已成功应用于来源区分和认证,无论是单独使用还是与其他光谱数据结合使用(Gerhardt et al., 2017; Schwolow et al., 2019)。最新数据集进一步支持了GC-IMS指纹技术在地理分类任务中的适用性(Christmann et al., 2022)。本研究的目的不仅在于证明区分橄榄油来源的能力,还在于推进基于GC-IMS方法的实际应用。研究的创新之处在于在温和的条件下优化了IMSS策略,通过Box-Behnken设计和响应面方法系统优化了HS-GC-IMS参数,以最大化地理区分效果,并将验证的分类模型应用于开源Web应用程序。这些方面有助于弥合分析开发与实际应用之间的差距。
出于这些原因,本研究的主要目标是开发并优化一种实用的基于HS-GC-IMS的方法,结合ML,用于橄榄油样品的地理区分,特别关注分析效率、鲁棒性和在常规质量控制及监管筛查中的适用性。

样本信息

橄榄油样本

为了评估橄榄油的地理真实性,选择了24个样本,代表四个国家:葡萄牙、摩洛哥、意大利和西班牙,每个国家六个样本(n = 6)。如表1所示,不同的地理来源确保了样本的多样性。数据集包括不同质量级别的橄榄油(普通橄榄油、初榨橄榄油和特级初榨橄榄油),以及每个国家获得PDO认证的两个样本

BBD-RSM优化

首先评估了HS-GC-IMS条件对橄榄油样品区分能力的影响,旨在最大化来源之间的差异。为此,采用BBDRSM方法优化了四个关键参数:样品量、孵育温度、顶空生成时间和进样体积。共进行了27次实验(表2),并按照前述方法获得IMSS数据,计算了总差异(Total Diff. (ES-IT + ES-MR + ES-PT + IT-MR + IT-PT + MR-PT)。

结论

本研究提出了一种稳健且可重复的橄榄油地理真实性分析方法,结合了HS-GC-IMS和IMSS技术以及先进的机器学习模型。多变量优化策略(BBD-RSM)和机器学习算法(特别是随机森林RF)的集成,实现了高达100%的准确率,能够区分来自四个地中海国家的橄榄油。

CRediT作者贡献声明

安娜·伊莎贝尔·罗德里格斯-古铁雷斯(Ana Isabel Rodríguez-Gutiérrez):撰写初稿、进行形式分析、数据管理。玛尔塔·巴雷亚-塞普尔韦达(Marta Barea-Sepúlveda):撰写、审稿和编辑、概念构思。乌迈玛·布图布(Oumaima Boutoub):资源获取、实验实施。玛丽亚·何塞·阿利亚尼奥-冈萨雷斯(María José Alia?o-González):撰写初稿、软件开发、项目管理、形式分析。米格尔·帕尔马(Miguel Palma):审稿和编辑、监督、资金申请。塞费里诺·卡雷拉(Ceferino Carrera):审稿和编辑、方法设计、实验实施、资金申请、数据管理。

感官测试

嗅觉测试在卡迪斯大学非生物医学实验和转基因生物伦理委员会(CEENB-GMOs)的伦理批准下进行。

研究数据

本研究使用的数据代码可访问:https://github.com/mjarodas/Oil_Origin_IMS_ML.git

数据声明

数据可应要求提供。

资金来源

本研究未获得公共、商业或非营利机构的任何特定资助。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号