《Heliyon》:Bayesian optimization of convolutional neural network for identifying red wines using colorimetric sensors
编辑推荐:
本研究针对传统比色传感器数据分析依赖人工特征提取、效率低且精度受限的问题,开发了一种结合低成本比色传感器与贝叶斯优化卷积神经网络(BO-CNN)的智能系统,用于高效鉴别高度相似的红酒。研究人员通过智能手机采集经14种化学染料处理的传感器阵列图像,利用BO-CNN自动提取特征并进行分类,避免了繁琐的RGB差值手工计算。结果表明,该框架在11类红酒识别中准确率高达94.81%,显著优于传统机器学习方法(如SVM的57.53%),为食品质量控制的快速、精准检测提供了创新解决方案。
在食品工业的质量控制与风味评价领域,快速、准确地鉴别食品真伪与品质是一项持续存在的挑战。红酒,作为一种成分复杂且价值较高的商品,其品牌、产地和年份的鉴别尤为重要。传统的化学分析方法,如气相色谱-质谱联用(GC-MS),虽然精确但成本高昂、操作复杂且耗时,难以满足现场快速检测的需求。比色传感器阵列(CS)技术应运而生,它通过一系列对特定化学成分敏感的染料产生颜色变化,
,从而实现对样品的“指纹”识别。然而,传统的CS数据分析方法严重依赖人工从图像中提取RGB(红、绿、蓝)颜色特征值,这个过程不仅繁琐、易出错,而且在处理类别间差异细微的复杂数据集时,分类准确率往往不尽如人意。
为了解决上述瓶颈,一项发表在《Heliyon》杂志上的研究提出了一种创新的解决方案:将低成本的纸基比色传感器与经过贝叶斯优化(Bayesian Optimization, BO)的卷积神经网络(CNN)相结合,构建了一个高效的红酒自动识别系统。该研究的核心目标是探索一种能够直接从传感器图像中自动学习特征并完成分类的深度学习框架,避免了对人工设计特征的依赖,以期在保证高精度的同时,提升分析的效率和鲁棒性。
研究人员为开展此项研究,主要依托几个关键技术环节。首先是样本制备与传感器构建:研究选取了11种不同的商业红葡萄酒,并对其进行包括氧化、不同比例的水或缓冲液(pH 3.5和10)稀释在内的11种预处理,以模拟真实世界中的变量并扩大数据集多样性,最终获得726个样本图像。传感器采用蜡印技术在滤纸上制作而成,包含16个反应池,其中14个负载了不同的化学响应染料。其次是图像采集与预处理:使用智能手机在严格控制的光照条件下拍摄传感器反应前后的图像,并通过裁剪和缩放将图像统一处理为834×834像素的标准输入尺寸。最核心的技术是模型构建与优化:研究采用贝叶斯优化算法自动搜索并确定卷积神经网络(CNN)的最佳超参数(如卷积层数、滤波器尺寸和数量、学习率等),从而构建出性能最优的贝叶斯优化CNN(BO-CNN)模型,用于直接从图像中进行端到端的特征提取和十一分类任务。
研究结果
自动特征提取与建模性能:研究结果表明,经过贝叶斯优化的CNN(BO-CNN)模型在红酒分类任务上取得了显著优势,测试准确率达到94.81%。相比之下,使用从图像中手动提取的RGB差值特征并结合传统机器学习算法(如支持向量机SVM、K-近邻KNN、朴素贝叶斯NB、梯度提升GB和人工神经网络ANN)进行分类,最高准确率仅为71.23%(ANN)。即使是未经验化的普通CNN模型,其准确率也远低于BO-CNN。这充分证明了自动特征提取框架以及超参数优化对于提升模型在复杂、高相似度数据集上性能的关键作用。BO-CNN的混淆矩阵显示,大多数样本都能被正确分类,仅存在少量介于化学组成可能非常接近的酒款之间的误判。
与手工特征提取方法的比较:通过主成分分析(PCA)对手工计算的RGB差值特征进行降维后,再输入各种经典机器学习模型,其分类效果普遍不理想。这表明手工设计的特征可能无法充分捕捉传感器图像中蕴含的细微且复杂的空间颜色模式和信息,而这些信息恰恰是深度学习模型能够自动学习和利用的。BO-CNN的成功在于其能够通过多层网络结构从原始像素中自动学习到具有判别性的低层次(如边缘、颜色斑块)、中层次(如纹理、梯度)和高层次特征(如全局响应模式),从而实现对高度相似样本的有效区分。
模型优化与泛化能力:贝叶斯优化过程通过高效地探索超参数空间,为当前相对小规模的数据集(726张图像)找到了最适合的CNN架构,有效避免了过拟合,并显著提升了模型的准确性和训练效率。研究还指出,通过引入多样化的样品预处理(如不同温度、pH和氧化条件),增加了数据集的化学变异性和代表性,这在数据量有限的情况下对于增强模型的泛化能力至关重要。
研究结论与意义
本研究成功地开发并验证了一个集成低成本纸基比色传感器和贝叶斯优化卷积神经网络的智能系统,用于红酒的快速、准确鉴别。该研究的主要结论是:基于贝叶斯优化的自动特征提取CNN框架能够显著优于依赖手工特征的传统机器学习方法,在处理来自比色传感器阵列的复杂图像数据时表现出色,准确率高达94.81%。
这项研究的重要意义在于多个方面:首先,在方法论上,它展示了贝叶斯优化在针对特定小数据集定制深度学习模型方面的强大能力,为在数据收集成本高昂或样本量有限的科学领域(如食品科学、医学诊断)应用深度学习提供了有益借鉴。其次,在应用层面,它为实现食品(尤其是高价值饮品如红酒)的现场、快速、低成本质量控制和真伪鉴别提供了一条切实可行的技术路径。该系统结合了智能手机的便携性和深度学习的强大模式识别能力,具有很高的实用价值和推广潜力。最后,该框架具有良好的通用性,通过更换对目标分析物敏感的染料,并可适应不同的预处理策略,该体系稍作调整即可应用于咖啡、茶叶等其他食品饮料乃至环境监测、医疗诊断等领域的化学传感与识别任务。
总之,这项工作不仅为红酒鉴别提供了一种高效的新方法,更重要的是为如何将低成本传感技术与先进的人工智能算法相结合,以解决实际应用中的复杂分类问题,树立了一个成功的范例,推动了智能传感与分析技术的发展。