《Food Chemistry》:Identification of roasting degree and interpretability analysis of Yunnan arabica coffee beans based on multi-dimensional visual features and CNNs-SHAP
编辑推荐:
通过融合CIE L*a*b*颜色直方图、GLCM-LBP复合纹理特征和形态学参数构建三维特征系统,结合CNN模型和SHAP可解释性分析实现云南阿拉比卡咖啡豆烘焙程度的精准识别与决策透明化,外部验证准确率达91.5%-100%。
卢思恒|赵静|秦倩|邓文轩|余月|黄月|李明|董浩|李占明
江苏科技大学粮食科学与技术学院,镇江212100,中国
摘要
本研究通过加权融合CIE L*a*b*颜色直方图、灰度共生矩阵-局部二值模式复合纹理和形态学参数,提取了云南阿拉比卡咖啡豆的特征,旨在实现准确的烘焙程度识别和透明的决策过程。卷积神经网络在准确性方面优于所有其他模型。随后的Shapley加性解释分析表明,关键特征与预测输出之间存在显著的强负线性相关性;对于浅烘焙样本,负面贡献占主导地位;而对于深烘焙样本,则是正向贡献占主导。外部验证结果显示,深烘焙样本的准确率为100.0%,浅烘焙样本为91.5%,中烘焙样本为93.8%。所提出的智能系统实现了自动图像采集、特征提取和推理,并支持与企业资源规划系统的连接,以实现数据可追溯性。本研究突破了深度学习的黑箱限制,为咖啡烘焙标准化提供了一种精确且可解释的技术。
引言
作为全球消费量最大的饮料之一,精确控制咖啡的质量和风味是产业链中的核心技术问题(Cordoba等人,2020年)。烘焙程度是决定咖啡豆最终质量的关键因素,直接影响风味化合物的形成和转化效率(Seninde和Chambers,2020年;Urugo等人,2025年;Várady等人,2022年)。具体来说,浅烘焙能保留绿原酸和奎宁酸等酸性物质,赋予咖啡明亮的水果酸味;而深烘焙则通过美拉德反应和焦糖化产生呋喃和吡嗪,从而产生丰富的焦糖和坚果风味(Gancarz等人,2022年;Marek等人,2020年;Santanatoglia等人,2023年)。即使烘焙程度的微小偏差也会使风味从平衡柔和变为焦糊、苦涩和收敛(Febrianto和Zhu,2023年;Rusinek等人,2024年)。目前,行业中的烘焙程度识别仍依赖于人工经验判断,这容易受到光照条件和操作员熟练程度的干扰。这种不准确性使得难以确保同一批次咖啡豆的质量一致性,从而严重阻碍了咖啡产品向高端化的升级(Wan等人,2024年;Zhai等人,2024年)。
通过提取样本的视觉特征(如颜色和纹理)进行定量分析,机器视觉已在许多行业中得到广泛应用。然而,在咖啡豆烘焙分析中,机器视觉方法存在两个核心局限性。首先,特征工程依赖于人工设计,这阻碍了深度区分信息的捕获,例如咖啡豆表面颜色的梯度变化和烘焙过程中的细微纹理损伤。因此,在浅烘焙和中烘焙之间的关键过渡区间,识别准确性显著下降。其次,模型的决策机制缺乏透明度,无法明确哪些特征主导了烘焙程度以及特征值如何影响分类结果。这种较差的可解释性最终使得检测结果难以获得工业界的认可和信任(Bergamin等人,2025年)。
深度学习技术凭借其端到端的特征学习能力,突破了传统方法的瓶颈。在各种深度学习技术中,卷积神经网络(CNN)在茶叶等级分类、酒精质量识别和谷物作物质量评估等领域表现出色(Chai等人,2023年;Firmani等人,2019年;Yu等人,2025年)。CNN自动提取高维视觉特征的能力使它们能够有效捕捉咖啡豆在烘焙过程中的细微变化。然而,在食品质量分析中,黑箱问题尤为突出,这种决策透明度的缺失使得CNN模型在工业场景中面临结果不可信的风险。当检测结果与人工经验不一致时,无法通过特征可追溯性来验证结果的合理性,这限制了该技术的大规模应用(Yu等人,2025年;Zhao等人,2025年)。
云南阿拉比卡咖啡豆的品种特性进一步增加了检测难度。这些咖啡豆的颗粒较小,且来自不同海拔地区的咖啡豆在烘焙过程中的颜色变化率不同,这两个因素增加了视觉特征提取的复杂性,从而提高了检测难度(Pe?uela-Martínez等人,2023年)。因此,传统的通用模型在这种特定场景下适应性不足。因此,开发出具有高准确性和强可解释性的专用检测模型成为解决云南咖啡烘焙标准化挑战的关键。
作为可解释性分析工具,Shapley加性解释(SHAP)可以量化特征对预测结果的贡献,从而实现对模型决策逻辑的全面解释和个体特征的追溯(Wani等人,2024年)。SHAP已在许多领域成功解决了黑箱问题(Zou等人,2024年),并在一项将实验方法与机器学习预测模型相结合的研究中得到应用,其中利用特征敏感性分析和SHAP来阐明剪切率和油浓度对蛋黄酱粘度的影响(Kubra等人,2026年)。然而,关于咖啡豆烘焙程度识别中基于SHAP的可解释模型的研究仍然相对较少。
本研究以云南阿拉比卡咖啡豆为研究对象,构建了一个具有多维视觉特征的可解释深度学习模型,以实现准确的烘焙程度识别和透明决策。提出了一种颜色-纹理-形状三维特征系统;通过加权融合CIE L*a*b*颜色直方图、灰度共生矩阵-局部二值模式(GLCM-LBP)复合纹理特征和形态学参数,捕捉了云南小粒咖啡豆的独特特征。SHAP分析从三个维度(全局特征重要性、特征依赖性、单个样本贡献)解释了CNN模型的决策机制,以筛选出高度区分性的特征。还开发了一个本地化智能决策系统,实现了从特征检测到结果输出的整个过程的可视化。本研究为咖啡烘焙程度的识别提供了高精度解决方案,并为咖啡行业的标准化发展提供了技术支持。
材料
本研究使用的阿拉比卡咖啡豆来自云南,具有不同的烘焙程度,由云南紫源咖啡厂提供(该公司具备数据可追溯性)。其他材料包括JW500工业相机(分辨率:2592×1944像素,帧率:30 fps)、8毫米定焦镜头和条形LED补光灯设备(色温:5500 K,可调照度范围:0–2000 lx)。
基于对三个标准的综合比较……
模型性能
数据合并后,将组合数据集按7:3的比例划分为训练集和测试集,然后比较了五种经典预测模型的性能。为了减少过拟合,采用了5折交叉验证和贝叶斯优化进行超参数优化。表S2展示了这些模型在区分不同烘焙程度咖啡豆特征方面的性能对比。虽然CNN在准确性方面优于所有其他模型,……
结论
本研究通过建立三维特征系统(颜色、纹理、形状)并将其与CNN模型和SHAP可解释性分析相结合,实现了对云南阿拉比卡咖啡豆烘焙程度的高度准确和透明识别。结果验证表明,在外部验证中,经过SHAP优化的轻量级模型对深烘焙、浅烘焙和中烘焙样本的识别准确率分别为100.0%、91.5%和93.8%。此外,t-SNE……
CRediT作者贡献声明
卢思恒:撰写 – 审稿与编辑,撰写 – 原稿,软件,方法论,数据管理。赵静:撰写 – 原稿,可视化,软件,数据管理。秦倩:可视化,软件,数据管理。邓文轩:可视化,软件,数据管理。余月:撰写 – 审稿与编辑,监督,方法论,概念化。黄月:撰写 – 审稿与编辑,监督,方法论,概念化。李明:撰写 – 审稿与编辑,软件,……
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本研究得到了江苏科技大学“人才启动项目”(项目编号:1182932009)的支持。