《Food Control》:Toward Trustworthy Non-Destructive Mango Quality Prediction Using Hyperspectral Imaging and Explainable AI
编辑推荐:
本研究结合可解释人工智能(XAI)与高光谱成像(HSI)技术,系统评估芒果成熟度及可溶性固形物(SSC)、可滴定酸(TA)和硬度等关键内部属性。结果表明,内部属性变化早于外观变化,SVM模型分类准确率达100%,随机森林模型预测SSC、TA和硬度的R2分别为0.946、0.825和0.793,并通过SHAP分析揭示940-960 nm和1697-1784 nm波段对预测至关重要,并生成可视化图谱。该研究为芒果品质无损检测提供了新方法。
丁海珍|赵景远|王文思|丁瑞|云永欢|刘彦德|涂康|兰伟杰|潘雷青
中国海南省三亚市南京农业大学三亚研究院,572024
摘要
作为一种跃变型水果,芒果由于储存不当每年都会遭受相当大的损失。本研究结合了可解释人工智能(XAI)和高光谱成像(HSI),以高效区分和可视化芒果的成熟度及其关键内部属性:可溶性固形物含量(SSC)、可滴定酸(TA)和硬度。结果表明,在果皮出现可见变色之前,内部属性已经发生了显著变化,这使得仅依靠外观来判断成熟度变得不可靠。根据储存过程中的质量变化,将芒果分为三个成熟阶段。支持向量机分类(SVMC)模型结合SNV预处理后,在区分这些阶段时达到了100%的准确率。对于内部属性的预测,随机森林(RF)模型利用原始光谱数据表现最佳,其硬度、SSC和TA的R2、RMSEP和RPD值分别为0.946、2.515和4.311、0.793、0.609和2.209、0.825、0.172和2.411。XAI进一步确定了940–960 nm和1697–1784 nm波段在预测所有属性中的关键作用,强调了C–H键在糖类、O–H键在水分子以及羧基在TA中的重要性。基于最优预测模型生成的内部属性可视化图谱,有效捕捉了不同成熟阶段和果实区域间属性分布的空间差异。这些发现突显了HSI在评估芒果内部状态中的重要性,而XAI提高了化学计量模型的透明度和可靠性,从而有助于向消费者提供更高质量的产品。
引言
芒果(Mangifera indica L.)是一种全球流行的热带水果,因其独特的风味、丰富的营养成分(包括维生素A和C以及多种酚类化合物)以及多样的加工应用(如制作果汁、果酱和冰淇淋)而具有重要的经济价值(Sung等人,2019年)。作为一种跃变型水果,芒果在采后储存期间会迅速成熟,其特征是呼吸作用增强、乙烯产生、细胞壁降解以及色素合成和积累(B. Liu等人,2022年)。这些显著的质量变化给后续加工和利用带来了挑战。最近的研究表明,高达19%的芒果在采后成熟过程中会出现质量下降和营养损失,这通常是由于过早加工或过熟造成的。这不仅导致了巨大的经济损失,还显著增加了农业系统的碳排放(O’Brien等人,2024年)。因此,准确判断芒果的成熟度对于整个供应链中的决策至关重要。传统的判断芒果成熟度的方法主要依赖于外部颜色变化。然而,成熟是一个复杂的生理过程,涉及细胞壁降解、淀粉转化和有机酸代谢等复杂的生化反应(Cárdenas-Pérez等人,2018年)。此外,采前因素(如品种和生长条件)也会影响成熟过程,从而导致采后果实质量的显著差异(Jha等人,2013年)。这种复杂性凸显了主观视觉评估在精确判断成熟度方面的不足。而且,仅依赖外部颜色作为主要评估标准限制了对内部属性的准确评估,而这些内部属性往往只有微小的可见变化。硬度、SSC和TA等内在质量参数是判断芒果质量的关键指标。这些属性直接影响甜度、风味和成熟度,从而影响市场接受度和加工可行性(de Freitas等人,2022年)。全面了解芒果批次的物理化学特性可以改善成熟度评估,并为后续加工、储存和运输提供有价值的见解。尽管目前的物理化学方法主要涉及破坏性程序,导致样品浪费和分析延迟。鉴于内部质量属性与经济影响之间的直接关联,开发快速、无损的芒果质量评估技术具有重要的实际意义。
高光谱成像(HSI)是一种光学传感技术,它结合了光谱学、成像和化学计量学,能够对农产品的外部特征和内部属性进行非侵入性评估。它已成为食品工业中质量评估和加工的宝贵工具(Ma等人,2019年)。HSI通过捕获样品中C–H、N–H和O–H等官能团的振动数据来工作,从而揭示它们的物理化学性质(Wan等人,2025年)。该方法在众多窄光谱带中获取空间信息,为每个像素生成独特的光谱轮廓,为果实质量评估提供了有前景的方法。然而,HSI数据的大量和高度维度给数据处理带来了显著挑战(J. H. Lee等人,2025年)。为了优化数据利用,采用了化学计量方法来抑制噪声、校正不必要的光学效应并减少冗余,从而促进了稳健的质量评估模型的发展(Shi、Zhang等人,2025年)。HSI与化学计量学结合在农产品质量评估方面的潜力得到了广泛认可,已成功预测了多种水果和蔬菜的硬度、SSC和TA等属性(S. Wang等人,2025年)。然而,许多现有模型更注重预测准确性而非可解释性,其复杂的非线性结构往往难以解读,使其成为“黑箱”模型。许多学者倡导数据驱动的模型应具有透明度、可靠性和用户交互性(Vilone & Longo,2021年)。这种透明度的不足激发了对可解释人工智能(XAI)的日益关注。
XAI涵盖了一系列技术和方法,旨在使人工智能模型的决策过程、预测结果和内部工作原理对人类用户透明、可理解且可追溯(Ahmed等人,2024年)。近年来,随着AI在食品工业各个领域的广泛应用,XAI受到了广泛关注。Shapley Additive exPlanations(SHAP)被认为是一种有价值的模型解释方法,它基于合作博弈论并利用Shapley值(Ahmed等人,2025年)。SHAP构建了一个将所有特征视为贡献者的加性解释模型,其基本原理是计算每个特征对模型输出的增量贡献,从而能够在全局和局部尺度上解释“黑箱”模型(Y. Wang等人,2025年)。作为提高模型透明度和可靠性的关键工具,SHAP已在医疗和金融等关键领域得到广泛应用,增强了AI系统的可用性和可信度。其在复杂模型中的应用涉及近似模型结构中每个波长的影响,从而提供了关于特征影响的多样化视角,并在光谱分析中展示了出色的能力。然而,SHAP在光谱学领域的应用仍然相对有限,需要进一步与化学计量学结合,以增强对质量属性预测模型的信心,并深入揭示光谱特征与物理化学性质之间的关联。
因此,本研究的目标是:(1)研究芒果在果皮出现可见变色之前的物理化学变化;(2)利用HSI建立快速的芒果质量评估和成熟度分类预测模型;(3)运用XAI阐明不同光谱带对模型构建的贡献,从而提高模型透明度;(4)可视化关键内部属性的空间分布。所提出的方法旨在推动高光谱技术在芒果质量评估中的应用,并促进其从实验室实验向可靠的工业规模应用的转变。
实验部分
样品制备
本实验选择了商业成熟期的‘Guifei’品种芒果。样品来自中国海南省三亚市的一个果园。收获后,果实立即被运送到实验室并进行了彻底清洗。所有芒果在大小和形状上均一致,没有明显的损伤或污染。本研究共使用了200个芒果,并将其分为五组
物理化学性质的变化
选择了不同成熟阶段的芒果,系统地分析了成熟过程中的物理化学变化。如图2a所示,在初期阶段几乎没有可见差异,直到第8天才开始出现明显的黄化现象。L*值在整个储存过程中保持稳定,而a*值从–9.16 ± 0.51增加到–1.55 ± 1.26,从第8天起观察到了统计学上的显著差异。同时,b*值也有所增加
结论
本研究结合了XAI和高光谱成像技术,开发了预测模型,用于预测芒果成熟过程中的三个关键内部属性(硬度、SSC和TA)以及成熟阶段。研究量化了特定光谱带对模型构建的贡献,以提高模型的可解释性。此外,还通过基于预测模型的光谱反演实现了内部质量的像素级可视化。结果表明,内部属性的变化
CRediT作者贡献声明
王文思:验证、正式分析。赵景远:软件、方法论。云永欢:可视化、监督。丁瑞:可视化、监督。涂康:撰写——审稿与编辑。刘彦德:撰写——审稿与编辑、项目管理。兰伟杰:资源、调查。潘雷青:撰写——审稿与编辑、项目管理、资金获取。丁海珍:撰写——初稿、正式分析、数据管理、概念构思
未引用的参考文献
Lee等人,2025;Liu等人,2022;Shi等人,2025;Wang等人,2025。
关于写作过程中生成式AI和AI辅助技术的声明
在准备本作品时,作者使用了deepseek工具来提高论文的可读性。使用该工具/服务后,作者根据需要审查和编辑了内容,并对出版物的内容承担全部责任。
利益冲突声明
我代表所有合作者声明,此处描述的工作是原创研究,尚未在其他地方发表,也未被考虑用于其他地方的出版。提交的手稿及其支持信息不存在任何利益冲突。所有列出的作者均已批准了附上的手稿。
致谢
作者感谢海南省重点研发计划(编号ZDYF2024XDNY197)、海南省教育厅博士科研创新基金、三亚亚洲湾科技城联合项目(HSPHDSRF-2024-09-004)以及海南省外国专家项目(G20241024011E)的支持。