在流化床干燥过程中,含水量是影响颗粒质量的关键因素,对颗粒的流动性、稳定性、硬度等有着重要影响[[1], [2], [3], [4], [5], [6]]。对于桂枝颗粒,目标含水量通常要求在3%到5%之间。含水量过高会导致颗粒结块、流动性降低以及储存过程中微生物污染的风险增加;相反,含水量过低会导致颗粒易碎、压缩性差、活性成分(如肉桂醛)流失以及能耗增加。对于流化床干燥这一颗粒生产中的关键单元操作,实时监测含水量是确保过程稳定性的必要条件。它可以防止过度干燥或干燥不足,同时保持产品质量的一致性。传统的含水量监测方法依赖于人工测量,工人需要定期(例如每5-10分钟)从干燥设备中取出小样本,使用水分分析仪进行离线测试,这一过程通常需要几分钟时间。这种累积的延迟导致显著的时间滞后和不足的实时性能,使得难以在生产过程中确保中药产品质量的一致性和稳定性。随着新一轮科学和技术革命以及工业革命的推进,制药行业正在迅速向先进的制药技术应用方向发展,逐渐从传统制药制造转向数字化制药制造和智能制药制造的新阶段[[7], [8], [9], [10], [11]]。在这一时期,随着工业大数据和人工智能技术的不断发展,为制药行业的转型提供了新的思路。工业大数据包含了大量关于生产过程的信息,包括设备运行数据、原材料数据、过程参数数据、产品质量数据等,这些数据背后蕴含着丰富的信息,为深入分析制药过程提供了新的方法[[12], [13], [14]]。人工智能技术具有强大的数据处理和预测分析能力,可以从工业大数据中挖掘有价值的信息,从而为制药生产过程提供准确的决策支持[[15], [16], [17], [18], [19], [20]]。
近红外光谱是一种利用光谱数据对物质进行定性和定量分析的方法。目前,在生产过程中对药品含水量的在线检测依赖于近红外光谱技术,其原理是利用近红外光与药品中化学键的相互作用,不同化学键对近红外光的吸收和散射率不同,从而产生不同的光谱信号[[21], [22], [23], [24]]。通过分析这些光谱信号,可以获得有关药品成分和含水量的信息。然而,这种近红外光谱分析技术存在一定的局限性:一方面,在实际应用中,不仅需要花费大量资金购买光谱仪来收集近红外光谱数据,而且容易受到数据收集过程中外部环境因素的影响,如环境温度、湿度、噪声和光强度的变化,可能导致光谱数据异常;另一方面,收集到的近红外光谱数据在用于含水量预测之前需要经过异常数据清洗、预处理和特征提取,这增加了模型的复杂性和计算量,与本研究中直接使用生产过程中的过程参数进行回归预测相比更为复杂。
除了近红外光谱之外,还探索了其他非破坏性检测方法,如微波共振和电容传感器用于含水量监测。然而,这些方法往往对材料密度变化和环境干扰敏感。在采用深度学习之前,已经探索了各种传统的机器学习算法用于含水量监测。例如,偏最小二乘回归(PLSR)和支持向量回归(SVR)等方法已被广泛用于将过程变量或光谱数据与含水量相关联[25,26]。然而,这些浅层学习模型通常侧重于静态特征映射,往往缺乏有效捕捉流化床干燥过程中复杂非线性时间序列动态的能力。
随着人工智能(AI)技术的蓬勃发展,其在数据挖掘、模式识别和复杂系统建模方面的强大优势带来了制药生产过程智能化的革命性变化[[15], [16], [17], [18], [19], [20]]。机器学习算法能够从大量生产数据中提取关键特征,并建立准确的生产预测模型;深度学习在各个领域展示了强大的模式识别和复杂系统建模能力,从医学诊断[[27], [28], [29], [30], [31]]到工业过程控制。因此,在机器学习和深度学习技术的帮助下,本研究构建了一个基于深度神经网络的含水量预测模型,并以流化床干燥过程中的过程参数作为预测模型的输入,最终实现了中药干燥过程中含水量的快速准确预测。然而,AI在制药生产过程中的应用也面临一些挑战:在数据质量方面,生产过程中生成的数据往往具有复杂性和多样性,数据质量参差不齐,可能存在缺失值和异常值等问题,这些都会影响预测模型的准确性和稳定性;在AI算法和模型的应用方面,虽然提出了许多先进的算法和模型,但如何将这些算法和模型与智能生产过程有效结合以解决实际生产过程中的问题仍需要进一步深入研究。
针对现有研究的不足,本研究提出了一种用于桂枝颗粒流化床干燥的含水量监测方法:一种结合近红外光谱辅助标签扩展的TCN–GRU方法。通过数据处理、光谱分析、特征工程和机器学习(深度学习)等技术,实现了对桂枝颗粒湿颗粒在流化床干燥过程中含水量的实时准确监测。
具体来说,本研究的主要贡献包括以下几个方面:
(1)综合应用多种数据处理和分析技术,构建了一个完整的智能制药方法体系,实现了从数据处理到模型构建再到生产监测的全过程智能化。
(2)为了解决手动测量得到的含水量标签稀缺的问题,提出使用PLSR算法根据近红外光谱数据拟合干燥过程中的含水量变化曲线,以扩展含水量标签。
(3)在特征工程方面,为了解决传统特征提取对时间序列动态响应不足的问题,提出了添加新的温度差、温度变化率、温度比特征、滑动窗口统计特征和时间特征的方法,扩展了特征参数集,提高了模型的预测能力。
(4)基于TCN-GRU的深度神经网络预测模型结合了卷积神经网络的并行计算能力和循环神经网络的记忆性能,能够更好地处理时间序列数据,提高含水量预测的准确性和实时性能。
研究的其余部分结构如下:第2节详细介绍了本研究提出的方法框架;第3节通过实验验证了所提出的方法;第4节总结了本研究的工作。
部分摘录
总体框架
本研究提出的方法总体框架如图1所示。
数据处理环节是整个框架的基石:通过烤箱方法测得的含水量数据经过清洗以识别和剔除异常数据;收集的近红外光谱数据经过预处理,包括标准正态变换、移动平均平滑处理。含水量标签扩展和特征工程是关键环节:使用PLSR方法构建
数据准备
为了验证本研究提出的方法在流化床干燥过程中预测含水量的有效性,本实验基于一家制药企业实际干燥生产过程中获得的数据进行,选择了该企业干燥生产过程中的一种常见药材(桂枝)作为研究对象。数据包括
结论
本研究提出了一种用于桂枝颗粒流化床干燥的含水量监测方法:一种结合近红外光谱辅助标签扩展的TCN–GRU方法,旨在解决流化床干燥过程中含水量实时预测的问题。该方法通过整合数据处理、光谱分析、特征工程、机器学习、深度学习等方法,实现了流化床干燥过程中含水量的实时预测。
作者贡献声明
宋晓琳:撰写——原始草案、方法论。
赵大:撰写——审阅与编辑、方法论。
张欣:撰写——审阅与编辑、监督、形式分析。
徐芳芳:验证、监督、数据整理。
王振中:撰写——审阅与编辑、项目管理、资金筹集。
焦文华:撰写——审阅与编辑、方法论、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
致谢
本研究得到了中药制药过程控制与智能制造技术国家重点实验室(SKL2024Z0206)的支持。