在线近红外检测模型实时评估与维护方法:一种基于相关性分析的校正策略

《Journal of Spectroscopy》:Real-Time Evaluation and Maintenance Method of Online Near-Infrared Detection Model

【字体: 时间:2026年03月17日 来源:Journal of Spectroscopy 2.1

编辑推荐:

  这篇综述性研究聚焦于近红外光谱(NIRS)在线检测模型的稳定性难题,提出了一种创新的实时评估与维护框架。该方法利用离线模型作为稳定基准,通过分析在线与离线预测值的相关性来评估在线模型状态,并运用斜率-截距校正(Slope-Intercept Correction)算法,有效校正因仪器漂移和环境波动引入的误差。实验验证该方法可显著提升烟草成分(总糖和烟碱)在线检测的准确度,为工业在线近红外检测系统(NIR Online Detection System)的长期稳定运行提供了可行方案。

  
1. 引言
近红外光谱分析技术作为一种高效、无损的快速检测方法,已被广泛应用于农产品成分检测、生物细胞检测、制药过程监控及石油化工等工业领域。随着在线检测需求的增长,如何确保在线检测系统在运行中的长期稳定性和准确性,已成为该技术工业化应用的关键挑战。现有研究表明,在线检测环境中的温度波动、光学元件老化及物料物理特性变化等因素会导致光谱响应漂移,最终造成在线模型在实际运行条件下预测性能的下降。尽管传统的周期性采集新样本进行模型更新的方法能缓解此问题,但频繁的模型重构需要耗费大量人力物力,且难以满足工业生产的连续性与智能化需求。当前,关于近红外模型迁移与校准的研究大多集中于实验室离线仪器和便携设备开发的模型,而对在线检测模型可靠性评估与维护的关注相对较少。特别是在复杂的工业场景中,如何利用成熟稳定的离线分析模型,构建在线检测模型的实时评估与维护策略,仍有很大探索空间。为应对这些挑战,本研究主要研究了一种在线近红外检测模型的实时评估与维护方法。
2. 材料与方法
2.1. 材料准备
本研究采用了云南中烟工业有限责任公司于2022年9月至2023年5月期间,在昆明产区采集的1187个烟草样品。仪器方面,使用了布鲁克公司的一台MATRIX-F在线近红外检测仪和一台赛默飞的Antaris II离线近红外分析仪。
2.2. 样品化学成分测量
1187个烟草样品分不同时期采集,在线检测时样品被实时平铺在传送带上,通过在线近红外光谱仪在12000至4000 cm-1范围内进行扫描,并应用定期维护的在线近红外测量模型获得总糖和烟碱的定量在线检测数据。完成在线检测后,对烟叶进行去梗、切丝(切成3毫米颗粒),随后在实验室通过离线近红外光谱仪在10000–4000 cm-1范围内实时扫描,并使用定期维护的离线近红外分析模型预测总糖和烟碱的离线定量数据。为验证方法在不同时期的适用性,根据光谱扫描时间将实验数据划分为三个时期:2022年9月至12月、2023年1月至3月、2023年4月至5月。每个时期的数据按4:1的比例进一步划分为用于构建校准模型的数据集和用于验证校准性能的数据集。
2.3. 在线近红外检测系统评估与维护原理
本研究核心是评估在线模型与离线模型预测值的一致性,并据此进行校正。评估与维护流程如图1所示:定期从大量在线检测样本中抽取部分样本,通过离线光谱仪获取光谱数据,并由离线分析模型生成预测值。随后,计算离线模型预测值与在线模型预测值之间的平均绝对误差(MAE)和均方根误差(RMSE),判断其是否在可接受范围内。若超出,则利用部分预测数据建立在线检测模型与离线分析模型之间的斜率-截距校准模型,并用剩余数据进行验证,最终应用该模型对当期所有在线检测数据进行校正,以提升模型精度与稳定性。
2.3.1. 皮尔逊相关系数
皮尔逊相关系数(r)主要用于评估两个变量之间的线性相关程度。由于在线近红外检测模型和离线近红外分析模型均为线性模型,且其预测结果是关于天然化学成分的连续变量,因此本研究采用皮尔逊相关系数来评估两种模型结果的一致性。
2.3.2. 平均绝对误差(MAE)
MAE用于评估模型预测值与实际值的偏离程度,其计算公式中包含绝对值运算,可有效防止正负误差相抵消,从而更真实地反映预测误差。
2.3.3. 均方根误差(RMSE)
RMSE用于衡量模型预测值与实际值之间误差的离散程度,可评估模型预测的波动性。由于其公式包含平方项,可放大较大误差的影响,从而更有效地反映模型的稳定性。
2.3.4. 平均绝对百分比误差(MAPE)
MAPE用于评估预测值与实际值之间误差的相对大小,有效反映误差相对于真实值的比例。
2.3.5. 斜率-截距校正(Slope-Intercept Correction)
斜率-截距校正是一种通过建立两个模型之间的线性关系,利用直线方程对其中一个模型的预测值进行调整的方法。其中,斜率k反映了预测值之间的比例关系,截距b反映了预测值之间的基线偏移。与在线检测模型相比,实验室的离线近红外分析模型受环境和样品不均匀性影响较小,结果更为稳定,因此离线模型预测值非常适合作为在线模型预测值的参考标准。本文以在线检测模型为自变量,离线分析模型为因变量,构建两者间的线性关系,并利用该线性方程对在线检测数据进行校正。参数k和b可根据在线与离线模型的预测数据,通过最小二乘法求得。
3. 结果与讨论
3.1. 在线近红外检测模型的评估
对三个不同时期在线检测与离线分析数据进行相关性分析,计算皮尔逊相关系数。结果显示,总糖和烟碱的在线与离线预测值在三期均存在较强的正相关性(相关系数见表2)。然而,线性回归分析(图2、3、4)表明,不同仪器、不同时间段之间,在线检测模型与离线分析模型之间存在线性差异。在线模型预测值不仅受到乘性效应影响,还存在一定的系统误差。对校准模型构建数据计算MAE、RMSE和MAPE(见表3),结果显示尽管在线与离线数据间存在强相关性,但差异仍然存在,且在不同时间段有所变化,因此有必要为每个时期构建独立的校准模型。
3.2. 斜率-截距校正模型的构建
基于评估结果,计算了线性回归系数和截距(见表4)。数据表明,在线检测模型与离线分析模型之间的线性漂移程度因仪器、时期和检测目标的不同而异。利用回归模型对回归数据进行校正,并计算校正后在线模型对总糖和烟碱预测值的MAE、RMSE和MAPE(见表5)。结果显示,模型校准后,总糖值相对于离线分析数据的平均MAE从1.069%降至0.959%,平均RMSE从1.360%降至1.252%,平均MAPE从3.81%降至3.42%;烟碱值的平均MAE从0.135%降至0.120%,平均RMSE从0.177%降至0.155%,平均MAPE从4.82%降至4.39%。
3.3. 斜率-截距校正方法的验证
基于建立的线性回归模型,对各季度的校正验证数据进行校正,并计算校正前后在线模型预测值的MAE、RMSE和MAPE(见表6)。综合校正前后数据(表3、5、6)可以看出,应用斜率-截距校正后,在线检测模型预测值与离线分析模型预测值之间的MAE、RMSE和MAPE均有所降低。具体而言,对于三个时期,总糖的平均MAE从1.205%降至1.063%,平均RMSE从1.526%降至1.345%,平均MAPE从4.28%降至3.75%。对于烟碱值,平均MAE从0.148%降至0.135%,RMSE从0.188%降至0.171%,平均MAPE从5.23%降至4.81%。这些结果表明,在线检测模型与离线分析模型之间的实时一致性得到了增强,从而验证了所提出的实时校准方法的有效性。
4. 结论
本研究提出了一种在线近红外检测模型的实时评估与校准方法。设计了用于评估在线检测模型性能及校正效果的指标,并利用离线近红外分析数据构建了在线近红外检测数据的校准模型,以烟叶样品进行了验证。结果表明,该方法可以实时评估在线检测模型与离线分析模型之间的相关性及线性漂移程度,并能构建斜率-截距校正模型对在线检测模型进行维护与校准。校正后,在线检测模型与离线分析模型预测值之间的MAE、RMSE和MAPE均有不同程度的降低。该方法为常见领域(如食品、药品、石化产品)在线近红外检测系统的长期稳定运行提供了理论支持和技术方案,在推动近红外光谱技术工程应用方面具有重要的实用价值。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号