下一代信息技术(如物联网、大数据和人工智能(AI)的快速发展正在推动智能制造(IM)的演进(Kusiak, 2024; Lee and Su, 2024; Liu et al., 2025)。自动化设备(A-Equip)是IM的核心(Yin et al., 2022),在新能源汽车生产中的应用中,装配和焊接的装备覆盖率分别达到了80%和97.5%(Wang et al., 2023b)。确保稳定生产需要先进的功能,例如异常诊断、故障预测和智能维护(Zhang et al., 2025b)。这些功能对于实现设备智能化至关重要。智能设备(I-Equip)集成了传感、分析、决策和控制功能,体现了先进制造、信息技术和AI的融合。例如拧紧机器人、高端计算机数控机床和智能测量设备。I-Equip可以自主监控、分析并在加工过程中响应异常状态(Zhou and Wang, 2021)。产品加工过程中的时间序列数据提供了关于产品质量的见解(Fang et al., 2025),使得数据驱动的决策对于确保制造过程的一致性和稳定性至关重要。IAD能够识别出与正常行为模式的偏差(Blázquez-García et al., 2022, Yan et al., 2024),从而支持智能维护。然而,由于I-Equip操作的复杂性、长服务周期、技术更新以及多品种、小批量生产的普遍性,仍然存在挑战。这些因素导致了“大数据小样本”和“数据稀疏”的问题(Li et al., 2024),使得在数据有限的情况下进行IAD成为一个重要的研究挑战。
工业时间序列(ITS)数据对于理解I-Equip的运行行为及其时空演变建模至关重要。尽管AI技术,特别是深度学习(DL),已经促进了制造过程的智能化转型和升级(Liu et al., 2025; Wang et al., 2022, Wang et al., 2024b),但它们对大型高质量数据集的依赖在IM中带来了挑战(Jha and Babiceanu, 2023; Zhang et al., 2025a)。监督学习作为主要的DL方法,需要大量的标记数据,但由于缺陷产品发生率低和样本分布不平衡,这类数据往往很稀缺(Ye et al., 2025; Zhang et al., 2022d)。如图1(b)所示,传统AI模型在制造中的应用涉及收集大量多类异常数据,这既耗时又昂贵。此外,传感器数据分布会随时间变化,从而降低模型在动态环境中的准确性(Singh et al., 2023)。这些问题在新兴工厂或小批量生产场景中尤为突出。因此,在动态环境中(如新工厂、新产品和新设备)确保AI技术的有效应用是一个关键的研究挑战。
为了解决数据稀缺问题,研究人员专注于几个关键领域,包括合成数据生成(SDG)(Karletsos et al., 2022)、少样本学习(FSL)(Feng et al., 2022)和零样本学习(ZSL)(Zhang et al., 2022b)。生成式AI方法,如生成对抗网络(GANs)(Li et al., 2022)、去噪扩散概率模型(DDPMs)(Saharia et al., 2022)和变分自编码器(VAEs)(Gull and Arif, 2022),在生成真实和多样化数据方面显示出潜力,提高了模型的泛化和稳健性。FSL利用先验知识来补偿数据不足(Tyagi et al., 2023, Yang et al., 2025),而ZSL则利用辅助领域信息来识别未见类别(Tang et al., 2025, Yin et al., 2025)。如图1(c)所示,生成式AI解决方案可以缓解制造环境中的数据稀缺问题。然而,制造过程涉及大量的专业知识,使得在实际应用AI模型时难以利用领域专长。
制造商的专家知识在智能分析和决策中起着至关重要的作用(Lu et al., 2022)。将这些知识与DL的数据挖掘能力结合起来对于构建高效的AI模型至关重要。DL凭借其自动特征学习、非线性建模和出色的泛化能力,可以从原始数据中挖掘出高层次的抽象特征表示,从而对未见数据做出准确的预测和决策。这对于涉及多个工厂和设备的制造企业尤为重要(Su et al., 2024)。然而,DL模型需要大量的高质量数据进行训练,因此在处理具有大数据、小样本和稀疏值特征的ITS数据时效果较差(Lu et al., 2025)。因此,将专家知识与DL的数据挖掘能力结合起来可以提高模型的效率和适应性(Gong et al., 2024; Zhang et al., 2022c)。这种整合保留了传统的企业知识,同时将AI模型定位为人类智能的延伸,从而在复杂环境中有效解决问题(Wu et al., 2023)。
为了解决I-Equip加工过程中有效样本数据不足和数据分布不均的问题,我们提出了一种基于TimeGAN和时间扩散模型的ITS数据合成模型(SyntheITS)。我们的目标是构建一个具有泛化和生成能力的ITS数据基础设施模型,开发出适用于制造场景的智能模型。首先,我们对I-Equip加工过程中的IAD进行了深入分析,并建立了一种结合专家知识的ITS数据表示方法。其次,我们基于先验知识和深度生成模型(DGMs)开发了一种工业数据生成方法来解决数据不足的问题。最后,我们使用新能源汽车制造中的关键电池包拧紧过程(BPTP)作为案例研究,验证了我们方法的有效性和稳健性。此外,我们还验证了该方法在另外两个场景的时间序列数据上的泛化能力。本研究的主要贡献包括:
(1)提出了一种创新的ITS数据表示方法,该方法通过将专家知识融入现有的时间序列生成方法中,增强了生成数据的真实性、上下文多样性和细节丰富性。这是首次解决生成数据与现实世界工业场景复杂性对齐的问题。
(2)开发了一个基于深度生成的ITS数据生成框架。该框架在生成数据的准确性和多样性方面进行了改进,同时解决了工业生产中数据稀疏和分布不均的问题。该框架的一个关键特点是能够调整数据特征,使生成的数据具有可解释性,并适用于各种工业环境。
(3)构建并发布了BPTP-DS ITS数据集,包含2265个精确标注的时间序列数据点,用于评估ITS数据生成、预测和分类任务。BPTP-DS的规模和详细注释为评估生成模型在工业应用中的性能提供了基础资源,支持未来的研究。