《Fermentation》:A Review of Artificial Intelligence Applications in Baijiu Research: From Experience to Data
Hai Huang,
Jinsong Zhao,
Yue Deng,
Jingcheng Liu,
Liping Xu and
Hui Lv
编辑推荐:
问题3:摘要翻译
白酒作为中国传统的蒸馏酒,具有重要的文化和经济意义,但由于其经验驱动的生产模式,长期面临标准化、质量一致性和技艺传承的挑战。人工智能(AI)和多组学技术的快速发展正推动白酒研究从经验驱动向数据驱动的范式转变。本综述系统总结了AI在整个白酒产业
问题3:摘要翻译
白酒作为中国传统的蒸馏酒,具有重要的文化和经济意义,但由于其经验驱动的生产模式,长期面临标准化、质量一致性和技艺传承的挑战。人工智能(AI)和多组学技术的快速发展正推动白酒研究从经验驱动向数据驱动的范式转变。本综述系统总结了AI在整个白酒产业链中的应用现状,批判性地探讨了传统机器学习、深度学习、多模态数据融合及可解释人工智能(XAI)、基因组尺度代谢模型(GEMs)、少样本学习等新兴范式的应用。深入讨论了数据孤岛、小样本量、模型可解释性以及技术与传统之间的张力等关键瓶颈,并提出了多模态融合、数字孪生、机理-数据混合建模、闭环控制、人机协作、标准化和伦理治理等未来方向。本综述为AI融入白酒研究提供了全面框架,并为其他发酵食品系统的智能化转型提供参考。
问题4:论文主体内容总结
1. 引言
白酒作为世界六大蒸馏酒之一,其复杂的微量成分(乙醇和水占98%,剩余1–2%为醇、酸、酯、醛、酮等)形成独特风味,但传统酿造依赖“眼看、鼻闻、手摸、口尝”的经验传承模式,存在标准化困难、技艺失传风险及微生物群落功能解析不足等问题。多组学技术(宏基因组学、转录组学、蛋白质组学、代谢组学)虽拓展了微生物认知,但海量数据的复杂性限制了高效解读。人工智能凭借处理非线性关系、挖掘多维数据关联的优势,为白酒生产控制、质量识别及风味分析提供了新路径。本综述旨在系统梳理AI在白酒全产业链的应用现状,覆盖生产端(酿造控制、智能制曲)、产品端(质量识别、溯源)和价值端(风味分析、消费者洞察),并探讨技术瓶颈与未来方向。
2. 白酒领域常用人工智能方法
2.1 传统机器学习算法
传统机器学习广泛用于白酒风味分析、质量预测及产地溯源。特征降维与选择方面,主成分分析(PCA)及其改进方法(核主成分分析、稀疏主成分分析)用于高维色谱/光谱数据预处理;基于过滤式、包裹式和嵌入式方法的Spearman相关分析、竞争性自适应重加权采样(CARS)、遗传算法(GA)等可实现特征筛选。分类与回归模型中,支持向量机(SVM)适用于小样本非线性数据(如产地溯源、香型分类),极端学习机(ELM)因输入权重随机初始化而训练速度极快,XGBoost(梯度提升决策树集成算法)通过正则化项减少过拟合,在基酒年份识别、感官等级预测中表现优异。集成学习策略(如GA-Bagging-SVM)通过优化基分类器组合降低单一模型的不确定性。
2.2 深度学习方法
深度学习在图像识别场景优势显著,如基于Faster R-CNN的目标检测与ResNet分类网络结合的两阶段框架,实现大曲块截面自动分级;YOLO系列、RetinaNet等目标检测模型在实时性与小目标检测中各有取舍。
2.3 数据融合策略
多模态融合通过协同分析异构数据提升模型性能,分为低层融合(原始数据拼接)、中层融合(特征级融合)和高层融合(决策级融合)。例如,气相色谱-质谱(GC-MS)与电子鼻(E-Nose)数据的中层融合,可更准确预测白酒感官评分;发酵过程中温度、pH、黄水理化指标等多源传感器数据融合,实现窖池淀粉含量、水分含量的实时预测。
2.4 新兴方法与技术范式
基因组尺度代谢模型(GEMs)与机器学习结合,通过预测基因功能和代谢途径辅助构建微生物代谢网络(如iSP_1513模型预测酿酒酵母代谢产物);可解释人工智能(XAI)中的SHAP值(沙普利加性解释)量化特征贡献,识别异常发酵的微生物标志物(13个)和风味标志物(9个);少样本学习与迁移学习通过预训练模型微调、元学习等方法,缓解白酒行业小样本数据瓶颈。
3. 人工智能在白酒生产智能化中的应用
3.1 发酵过程建模与预测
发酵是白酒质量形成的核心,机器学习结合近红外光谱实现关键指标动态监测。例如,酱香型白酒堆积发酵中,GA-XGBoost模型对发酵轮次分类准确率达99.26%,RFS-SVR模型对酸度、淀粉含量的预测R2分别为0.9674和0.9610;浓香型白酒发酵中,CNN-LSTM混合模型融合环境参数(温度、湿度、CO2浓度),总酸、总酯、总醇的预测R2较单一LSTM分别提升17.40%、3.80%、5.70%。发酵状态判定方面,近红外光谱结合分类模型可自动识别发酵阶段,解决传统人工判断的主观性问题。
3.2 智能制曲与视觉识别
大曲作为糖化发酵剂,其质量直接影响出酒率和风味。基于计算机视觉的两层分级模型(形态融合法分割图像,RF-MDA特征选择结合Stacking分类),实现生曲、碎曲、陈曲的三分类准确率96.67%;宏基因组分析显示,优级曲与次级曲的微生物群落结构差异显著(优级曲富集能量代谢相关菌,次级曲富集碳水化合物代谢相关菌)。
3.3 智能摘酒与经验资本化
传统“看花摘酒”依赖人工观察酒花形态判断酒精度与质量,通过高速成像采集酒花图像并结合酿酒师分级数据训练深度学习模型,将隐性经验转化为可复制的算法模型,实现摘酒过程的自动化与技艺数字化保存。
3.4 过程监控与异常诊断
针对发酵异常(如浓香型白酒二次升温),机器学习结合多组学分析识别异常发酵的生物标志物(如乳酸菌快速积累抑制其他菌群生长),SHAP值揭示关键特征的贡献度,为智能预警系统提供基础。
4. 人工智能在白酒质量识别与溯源中的应用
4.1 基酒质量评估与等级分类
基酒等级决定成品酒质量,风味组学与机器学习结合实现精准分级。浓香型基酒中,HS-SPME-GC-TOFMS与HS-GC-IMS联用结合随机森林(RF)、逻辑回归(LR)模型,五等级分类准确率达91.3%;酱香型基酒中,11种机器学习分类模型结合16种细菌标志物(如Komagataeibacter)和7种真菌标志物(如Aspergillus),实现不同轮次基酒的质量分级。感官质量预测方面,XGBoost-K-means组合模型对酱香型白酒感官等级的预测准确率达97%,SHAP分析识别20种关键香气化合物(如丁二酸二乙酯、四甲基吡嗪)并确定其质量浓度阈值。
4.2 品牌与产地分类
基于色谱-质谱(SPME-MS)与近红外光谱(NIRS)的多技术融合,实现不同香型(浓香、清香、酱香)和产地(四川、江淮、北方)白酒的分类。SPME-MS结合正交偏最小二乘判别分析(OPLS-DA),香型分类正确率94.44%,产地分类正确率100%,优于GC-E-Nose的91.53%和93.94%。
4.3 真实性鉴别与溯源
多技术集成方法(SPME-GCMS、傅里叶变换红外光谱FTIR、定量核磁共振氢谱qNMR)可有效识别假冒产品:SPME-GCMS通过挥发性成分聚类区分不同酒厂产品,qNMR定量乙醇及微量成分(酯、甲醇、杂醇油),发现3个样品乙醇含量异常、2个样品缺乏主要微量成分。机器学习通过融合色谱、光谱等多维数据,构建产地溯源模型,提升鉴别准确性。
5. 人工智能在白酒风味分析与产品开发中的应用
5.1 风味感知预测与关键化合物识别
酱香型白酒七轮次基酒的风味呈阶段性变化(早期酸感、中期酱香、后期焦香),通过香气提取物稀释分析(AEDA)和气味活性值(OAV)识别18种关键气味活性物质(如丁酸乙酯、异戊酸乙酯);MLP-HCA、XGBoost-K-means等模型实现感官等级预测(准确率85%–97%),SHAP值确定关键化合物的质量浓度阈值(如乙偶姻的阈值)。
5.2 微生物资源挖掘与代谢网络分析
AI驱动的多组学分析突破传统培养法局限:机器学习实现宏基因组数据的高分辨率物种注释(识别低丰度物种);深度学习预测基因功能与酶活性(如发现发酵食品中840万个酶簇含84.4%未知功能);代谢通路重建模型(如iSP_1513)模拟微生物代谢通量,指导风味物质定向合成。
5.3 风味复杂性的多维分析框架
整合动态感官分析(TDS、TCATA)、高分辨代谢组学(HRMS)和先进质谱技术(PTR-MS、GC-IMS),构建“感官-分子”关联模型,克服传统静态分析的局限性,实现风味形成机制的系统性解析。
5.4 从风味分析到产品开发
通过SHAP值确定的关键化合物阈值指导勾调工艺(如调整丁二酸二乙酯浓度优化酱香);机器学习识别的18种化学参数经加减实验验证,可定向提升商业白酒的感官体验;AI驱动的微生物资源挖掘加速下一代发酵剂开发(如设计合成微生物群落定向合成目标风味物质)。
6. 挑战与展望
6.1 主要瓶颈
数据层面:数据孤岛(企业间信息不互通)、多组学数据整合困难(高维异质性、批次效应)、小样本困境(生产周期长导致标注数据稀缺);模型层面:可解释性不足(“黑箱”模型难以获得酿酒师信任)、泛化能力有限(跨批次/区域数据性能下降)、机理模型与数据模型脱节(传统代谢动力学与数据驱动模型未融合);组织与伦理层面:技术与传统的张力(算法是否替代人工经验)、数据隐私与算法偏见(训练数据偏差导致质量评估同质化)。
6.2 未来方向
多模态数据融合与数字孪生:整合传感器、光谱、图像、组学等多源数据,构建发酵过程数字孪生系统(实时监测、状态预测、闭环优化);机理-数据混合建模:以传统代谢机制模型为基础,机器学习拟合残差项(如微生物互作效应),提升模型泛化与解释性;动态建模与闭环控制:基于LSTM、GRU等时序模型实现发酵过程动态预测,结合自动化控制调整温度、pH等参数;可解释AI与知识发现:通过SHAP、LIME等方法解析模型决策逻辑,引导新的科学发现(如识别与传统认知不符的关键特征);人机协作与知识传承:AI负责重复监测任务,人类聚焦创新与异常诊断,通过AR培训系统缩短技艺传承周期;标准化与开源生态:制定数据采集、模型评估、接口协议标准,建立共享数据集与开源算法库;伦理框架与治理机制:明确数据隐私保护、算法公平性评估及人机责任边界。
7. 结论
人工智能在白酒领域的应用已从孤立突破转向系统整合,形成覆盖机器学习、深度学习、多模态融合的技术谱系。未来需通过多学科协作,构建“机理-数据”双驱动的智能化范式,在尊重传统酿造原理的基础上,实现风味形成机制解析、传统技艺数字化传承及新产品开发的创新,推动白酒产业可持续发展。