《Food Chemistry》:Assessing different extracts of
Laurencia obtusa algae for the green fabrication of magnetic nanoparticles: their characterization and bioactivities
编辑推荐:
黑茶快速检测技术:开发并验证了整合FTIR、NIR和XRF光谱学及机器学习数据融合的工作流程,成功识别89份商业茶样本中6.74%的不合规产品,为发展中国家提供低成本非破坏性地理标志认证方案。
李一聪|娜塔莎·洛根|阿万韦·佩奇孔考|洪云鹤|刘晓桐|尼古拉斯·伯斯|西蒙·豪吉|特里·F·麦格拉思|吴迪|克里斯托弗·T·埃利奥特
国家计量实验室:农业与食品完整性卓越中心,全球食品安全研究所,贝尔法斯特女王大学生物科学学院,19 Chlorine Gardens,贝尔法斯特,北爱尔兰,英国
摘要
全球食品供应链日益脆弱的现状凸显了快速、准确且无损的真实性检测的必要性。在这项研究中,我们开发并验证了一种工作流程,该流程结合了傅里叶变换红外光谱、近红外光谱和X射线荧光光谱以及基于机器学习的数据融合技术,用于红茶的鉴定。共有532个正宗的阿萨姆茶、大吉岭茶、锡兰茶和祁门茶样本使用五种监督模型进行了分析。我们开发并比较了一系列信息级、特征级和决策级的融合策略,其中决策级融合在校准集、验证集和测试集上的F1分数达到了100%,优于单独使用的方法或其他融合方法。该工作流程进一步应用于89种商业茶叶,识别出6.74%的不合格产品,这些产品均来自在线平台。这种方法无需昂贵的质谱仪或稳定同位素仪器,非常适合在非专业实验室中进行准确且经济高效的食品真实性检测,尤其是在发展中国家。
引言
通过国际贸易协议和物流系统的改进,世界食品市场的全球化使得许多食品能够在全球范围内广泛且迅速地流通。全球COVID-19大流行、气候变化和能源危机引发了诸如劳动力短缺、极端天气事件、全球农作物产量下降以及食品资源失衡等紧迫问题(Rockstr?m等人,2020年)。这些众多复杂的问题凸显了采用“同一健康”和可持续生产方法以及提高全球食品供应链透明度的紧迫性(Tyagi,2023年)。同时,大数据驱动的人工智能技术正在推动基于第四次工业革命原则的信息化生成与解读(Oosthuizen,2022年)。因此,面对所有这些挑战,可以利用数字革命来帮助开发和实施非侵入性和快速的食品追溯技术。这些方法将在确保全球市场上交易的食品和饮料的安全性和真实性方面发挥关键作用,从而保护企业和消费者免受经济动机驱动的食品欺诈。
几个世纪以来,茶一直是主要的饮料之一,并在全球范围内每天被消费(Mohamed A. Mohamed等人,2023年)。每年全球茶叶产量超过170亿美元,茶叶贸易额估计约为95亿美元,是重要的出口收入来源(FAO,2022年)。茶叶在45多个国家种植,其中红茶占总量的78%(Khizar等人,2015年)。主要红茶生产区包括中国、印度(大吉岭和阿萨姆)、肯尼亚和斯里兰卡。由于栽培品种(Camellia sinensis var. assamica 和 Camellia sinensis var. sinensis)的差异、气候、土壤、海拔、农业实践和发酵过程的不同,来自不同地理区域的红茶表现出不同的化学、元素和感官特性(Jing等人,2021年)。其中,中国的祁门茶、印度的阿萨姆茶和大吉岭茶以及斯里兰卡的锡兰茶是非常受欢迎的高价值商品,以其独特的感官品质而闻名。红茶的公开市场价格和消费者兴趣取决于特定地区的口味和香气特性。
地理来源被视为红茶的重要增值属性,许多国家对此进行了保护。例如,大吉岭茶已被认证为保护地理标志(PGI)产品,并受到欧盟(EU)的保护(Patrizia等人,2019年)。同样,锡兰茶受到斯里兰卡茶叶委员会的保护,而祁门茶则作为注册商标受到中国法规的保护(Jing等人,2021年)。然而,其他地理区域的红茶虽然经过类似的制造过程,但往往缺乏知名PGI茶叶所拥有的消费者认可度和价格溢价。这种情况促使不法分子将劣质茶叶标注为高端产品以获取更高的经济回报。尽管专家可以通过感官评估确定红茶的地理来源,但由于个体差异,结果具有主观性和不一致性。根据研讨会期间咨询的行业专家,目前没有快速、低成本、适用于实际需求且商业上可获得的实验室测试方法能够区分不同品种的茶叶。因此,利用新兴的分析技术来识别红茶的地理来源至关重要,特别是对于主要在国际市场上交易和消费的大批量茶叶。
近年来,几种分析技术已被证明有助于区分红茶的地理来源。同位素比值质谱(Chuanyi等人,2019年;Mehmet Fatih等人,2017年;Yinfeng等人,2022年)和电感耦合等离子体质谱(Yinfeng等人,2022年)被广泛用于红茶的追溯分析。这是由于不同地理来源之间的元素组成和稳定同位素分布存在差异。然而,样品制备耗时较长,且使用高腐蚀性的硝酸进行消化存在安全隐患。高通量代谢组学技术,包括超高效液相色谱-轨道阱质谱(Li等人,2021年)、超高效液相色谱-四极杆飞行时间质谱(Chuanyi等人,2022年)、顶空-固相微萃取气相色谱质谱(Fang等人,2019年;Zhichao等人,2023年)和质子核磁共振(Chuanjian等人,2023年),也被用于区分红茶的地理来源(Jianfeng等人,2023年;Jing Jing等人,2021年;Kasim & Aydemir,2022年;Mehmet等人,2023年;Qiushuang等人,2023年;Fang等人,2019年)。这些技术可以提供全面的代谢信息,从而实现高准确性和重复性。然而,它们成本高昂且需要日常维护,限制了某些实验室和应用的使用,尤其是在发展中国家。此外,这些复杂的分析技术需要较长的样品制备和元数据预处理时间,使其在经济和时间上不适合快速地理来源的区分。
光谱分析工具通常需要最少的样品制备,提供快速且劳动强度低的分析,因此有潜力用于红茶追溯的快速筛查。Ren等人应用了表面增强拉曼光谱(SERS)结合银纳米粒子来区分72个祁门茶样本的地理来源,准确率达到93.5%(Yinfeng等人,2023年)。然而,SERS的性能受到纳米粒子组成、大小和形状的显著影响,且增强能力可能会随时间下降,这引发了关于红茶追溯信号一致性的担忧。相比之下,傅里叶变换红外(FTIR)、近红外(NIR)和X射线荧光(XRF)光谱是稳定且无需试剂的茶叶鉴定替代方法。FTIR和NIR提供高分辨率的振动信息,有助于表征与区域差异相关的功能团、生物化学成分和分子结构(Patrizia等人,2019年)。XRF则有助于快速且无损地量化元素组成(Cia Min等人,2021年)。这些技术快速、易于操作、成本效益高,适用于高通量常规筛查,其无溶剂的特点符合绿色分析化学的原则。
光谱数据集具有高维度且表现出显著的共线性,这使得先进的化学计量和机器学习方法在食品真实性评估中至关重要(Wang等人,2022年)。与传统的偏最小二乘判别分析(PLS-DA)相比,现代机器学习模型展示了更强的预测能力和捕捉复杂非线性关系的能力,例如橄榄油(Skiada等人,2023年)和紫米(Xueqing等人,2024年)。由于细微的区域差异和复杂加工程序的影响,红茶地理来源的快速筛查仍然具有挑战性。近年来,食品真实性和安全性评估越来越多地转向基于融合的分析策略,将多种光谱平台与机器学习相结合,以实现更强大、可靠和透明的食品污染和欺诈检测(Selorm等人,2025年)。这种多样信息源与先进建模技术的整合对于在复杂鉴定场景中做出准确和明确的决策非常重要(Zeng等人,2023年;Wu等人,2023年)。数据融合已成为增强光谱分析鉴别能力的强大方法。多层次融合框架,包括信息级融合、特征级融合和决策级融合,提供了互补数据的系统组合。这些方法有潜力提高分类性能并增强食品真实性研究中的模型鲁棒性。然而,尽管这些融合策略很有前景,但当与多种监督机器学习算法结合使用时,对其系统的评估仍然不足。
在这项研究中,使用FTIR、NIR和XRF光谱对来自阿萨姆、大吉岭、锡兰和祁门的532个经过认证的红茶样本进行了全面表征。为了充分利用这些技术提供的互补分子和元素信息,我们实施了一个多层次数据融合框架,包括信息级融合、五种基于特征的融合策略和决策级整合。进一步使用五种监督机器学习算法评估了分类性能。通过这种综合分析方法,本研究旨在提高预测性能和泛化能力,提供一种可靠且经济高效的红茶地理来源鉴定方法,以及更广泛的食品真实性应用,从而加强对消费者的前端保护。
部分摘录
红茶样本收集与制备
通过茶叶行业的专家联系,直接从认证的茶园、种植园、工厂和小农户处收集了532个红茶样本。这些样本来自4个主要栽培区域:阿萨姆(225个样本)、大吉岭(145个样本)、祁门(115个样本)和锡兰(47个样本)。样本收集的详细信息见补充材料表S1。茶叶样本来自多个茶园和不同的季节。
通过XRF进行多元素指纹分析
我们首先进行了XRF分析,以量化可能反映区域特定积累模式的元素组成,并从矿物学角度增强地理区分。在茶叶样本中检测并量化了16种元素。表S5总结了四个PGI区域每种元素的平均浓度和标准偏差。主要元素包括K、Ca、P、Mg和S;次要元素包括Mn、Si、Cl和Fe;而微量元素
结论
在这项研究中,从四个主要地理区域(阿萨姆、大吉岭、祁门和锡兰)收集了532个正宗的红茶样本,并使用XRF、FTIR和NIR光谱进行了分析。应用了五种监督机器学习算法,并对单个分析数据集和融合数据集进行了评估。我们的发现表明,LDA和SVM在FTIR和NIR数据上表现更好,而深度学习模型在XRF数据上更有效。
CRediT作者贡献声明
李一聪:撰写——原始草稿、软件、方法论、调查、正式分析、数据管理、概念化。娜塔莎·洛根:撰写——审阅与编辑、可视化、方法论、概念化。阿万韦·佩奇孔考:可视化。洪云鹤:验证、软件、概念化。刘晓桐:可视化、方法论。尼古拉斯·伯斯:撰写——审阅与编辑、软件。西蒙·豪吉:撰写——审阅与编辑、方法论。特里·F·麦格拉思:撰写——审阅与
未引用参考文献
Haipeng等人,2022年
Hervé和Williams,2010年
Kuncheva,2004a
Kuncheva,2004b
Kuncheva,2004c
Shimao等人,2019年
Shimao等人,2019年
Tiehan等人,2021年
Xijun等人,2023年
Yicong等人,2021年
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本工作得到了Agilent Thought Leader Award、皇家学会(NIF\R1\192293、IEC/NSFC/211328)、生物技术和生物科学研究委员会(BBSRC)以及中国奖学金委员会(202108110070)的支持。作者还感谢欧洲特种茶叶协会、祁门(祁门)红茶协会、Thompson's Tea和Suki's Tea提供的用于本研究的茶叶样本。