牛奶是全球营养的基本组成部分,提供了必需的蛋白质、维生素和矿物质。因此,确保牛奶的安全性和质量对于公众健康和消费者信任至关重要。尽管FDA和欧洲食品安全机构等监管机构实施了严格的监管框架[1]、[2],但实际生产中仍会出现质量问题。历史上的事件(如2008年中国的三聚氰胺污染事件[3])表明,牛奶质量控制的疏漏可能导致严重的健康、经济和社会后果。这些挑战凸显了乳制品行业需要更加可靠和主动的质量管理策略。
当前的牛奶交付前质量控制系统存在固有的局限性。质量检测通常依赖于抽样方法,这种方法可能无法检测到大规模生产批次中的低水平或偶发污染。例如,当李斯特菌或沙门氏菌等微生物以低浓度存在时,可能无法被检测出来。此外,对潜在质量问题发生时间和地点的不确定性增加了检测过程中人为错误的可能性,使得有缺陷的产品得以流入市场,引发昂贵的召回和声誉损失。这些局限性表明,传统的质量控制方法不足以确保产品安全的一致性。
为了解决这些问题,乳制品加工领域越来越多地采用先进的传感器技术和数据驱动的方法。以往的研究利用分析仪器和光谱技术探索了生产过程的在线监控和实时控制[4]、[5]、[6]、[7]、[8]。这些发展反映了向工业4.0的转型,工业4.0的特点是网络物理系统、物联网和人工智能[9]、[10]。在这一背景下,“乳制品4.0”概念应运而生,旨在建立集成的、数据驱动的生产生态系统,以提高可追溯性和质量保证[11]、[12]。虽然之前的研究已经成功地将工业4.0技术(如在线传感器和基于AI的分析)应用于特定的加工阶段[13]、[14],但这些方法主要集中在孤立的过程监控或异常检测上。
然而,乳制品4.0的潜力尚未得到充分发掘。目前仍存在一个关键空白,即如何理解和预测由不同生产阶段中多个因素之间的复杂非线性相互作用引起的产品质量问题。实际上,在保质期内观察到的牛奶质量问题往往不是由单一异常参数造成的,而是由原奶微生物、加工条件和冷链波动等多种因素共同作用的结果。使用传统的监控方法很难识别这种多因素相互作用,通常只有在产品到达消费者手中后才能被发现。
消费者投诉为解决这一空白提供了宝贵的但尚未充分利用的信息来源。除了在客户服务中的作用外,投诉还反映了潜在的产品质量问题[15]。以往的研究从统计或态度的角度探讨了乳制品行业的消费者反馈[16]、[17]、[18],而以管理为导向的研究则强调了投诉处理绩效指标、数据管理和决策支持系统[19]、[20]、[21]、[22]。然而,现有的研究大多将消费者反馈视为一种定性或事后的评估工具,很少尝试将投诉模式与上游生产参数定量关联,以进行主动的质量控制。
最近的人工智能进展使得对消费者反馈数据的分析更加复杂化。AI和深度学习技术已被广泛应用于食品质量预测和过程监控[23]、[24]、[25]、[26],以及利用机器学习和自然语言处理方法对消费者投诉进行分类[27]、[28]、[29]。尽管这些研究展示了AI在投诉分类和质量评估方面的有效性,但投诉类别与多阶段生产监控数据之间的定量关系仍缺乏深入探索。
此外,当AI预测模型扩展到包含多阶段生产监控参数时,预测框架变得非常复杂且难以解释。这种不可解释性成为在工业乳品厂实际应用中的重大障碍。质量工程师和操作人员往往需要根据模型输出及时做出决策,但基于神经网络的预测模型通常表现为“黑箱”,掩盖了生产参数、投诉类别和预测质量风险之间的关系。如果没有直观且结构化的关系表示,将基于投诉的质量预测模型整合到日常生产工作中仍然具有挑战性。
知识图谱为解决这一部署挑战提供了有前景的方案,因为它能够明确表示复杂系统中的实体、关系和因果结构。它们已被广泛用于将异构和非结构化信息组织成结构化网络,从而在工业应用中实现风险识别和直观解释[30]、[31]。最近的研究进一步表明,基于知识图谱的界面可以将非结构化知识转化为可操作的洞察,并可视化AI推理路径,以支持专家验证和决策[32]、[33]。这些特性使得知识图谱特别适合于可视化基于投诉的质量预测过程,并便于乳制品工程师采用。
基于对研究差距的分析,本研究提出了一种基于消费者投诉数据和生产过程监控参数的交付前牛奶质量控制框架,以防止问题牛奶流入市场。采用神经网络定量建模生产指标与投诉类别之间的关系,从而在产品交付前进行质量预测。具体来说,选择了多层感知器(MLP)作为模型,因为它适用于大规模工业数据集,并能够捕捉多个输入变量与输出目标之间的复杂非线性关系。选择MLP时,优先考虑了模型的鲁棒性、可解释性和工业部署的便利性,而非架构复杂性。MLP在支持分类和回归任务方面的灵活性使其适合于建模生产过程参数、消费者投诉类别和质量结果之间的关系。
为了便于实际应用并提高乳制品工程师的理解能力,开发了一个基于知识图谱的人机界面,以可视化因果关系。本研究的主要贡献有三个方面:[34]开发了一种基于投诉的质量预测模型用于交付前牛奶质量控制;[35]将神经网络和知识图谱结合,以实现预测性能和操作可解释性;[19]通过在一家生产两种盒装牛奶的工业乳品厂的应用验证了所提出的方法。
本文的其余部分安排如下:第2节描述了材料和方法,包括研究场景、数据集、神经网络模型和知识图谱实现;第3节展示并分析了实验结果,包括预测性能、消融研究和界面评估;第4节总结了本文并讨论了未来的研究方向。