索引强化集成系统(IRIS):一种用于多索引融合与预测优化的双循环分析框架

《Microchemical Journal》:Index Reinforcement Integration System (IRIS): A dual-loop analytical framework for multi-index fusion and prediction optimisation

【字体: 时间:2026年02月20日 来源:Microchemical Journal 5.1

编辑推荐:

  柑橘皮非破坏性检测中提出双循环强化学习驱动的融合指数(FI)集成系统IRIS,通过标准化干物质、可溶性固形物及pH值实现多指标融合,内循环自编码器完成非线性压缩重构,外循环ε-greedy DQN优化光谱建模与波段选择。实验表明Savitzky-Golay预处理最优(贡献率99.52%),SVR(RMSEP=0.1136,R2=0.8685)和随机森林(R2=0.8420)模型性能优异,融合率达0.999以上。

  
邱一鹏|田海成|尹恒|冯敖
四川农业大学机电工程学院,雅安,625000,中国

摘要

本研究提出了一种基于双循环强化学习的指数增强集成系统(IRIS),用于春建柑橘果肉的高光谱无损检测。该系统通过融合指数(FI)将干物质含量、可溶性固形物和pH值统一到一个标准化尺度上。内循环使用自动编码器对多个指标进行非线性压缩和重建,而外循环采用??-贪婪DQN策略来优化光谱建模和波段选择。实验结果表明,Savitzky—Golay(SG)预处理方法最适合柑橘果肉的光谱数据(累积贡献率:99.52%)。在六个回归模型中,支持向量回归(SVR)表现出最佳性能(RMSEP = 0.1136,R2= 0.8685),而随机森林(RF)在使用11个光谱波段时也达到了高准确率(R2= 0.8420)。所有模型的融合率均超过0.999,验证了IRIS框架在指标融合和预测优化方面的高保真度和可靠性。这为农产品的多目标光谱分析提供了新的见解。

引言

柑橘类水果是全球经济价值最高的水果作物之一,在产量、消费量和加工价值方面一直处于领先地位。质量评估对整个产业链至关重要[1]、[2]、[3]、[4]、[5]。水果质量由多种理化指标决定,包括糖分含量、酸度和水分,这些指标之间存在耦合关系。单一指标无法全面反映真实的质量结构[6]、[7]、[8]、[9]、[10]。随着消费者对“外观-风味-营养”综合感知要求的提高,迫切需要一个能够整合多种指标的信息评估框架[6]、[11]、[12]、[13]、[14]、[15]、[16]。
传统的实验室检测方法(如滴定和色谱法)存在破坏性、耗时且成本高昂等局限性,不适合大规模和实时监测场景[12]、[17]、[18]、[19]、[20]。高光谱成像(HSI)能够同时捕获空间和光谱信息,在无损水果检测中表现出识别可溶性固形物、酸度和干物质等指标的巨大潜力[1]、[7]、[21]、[22]、[23]。为了提高数据质量,常用的光谱预处理和降维方法(如散点校正、标准化和平滑处理以及主成分可视化)被广泛用于抑制噪声、突出光谱峰值并便于模型解释。常见的预处理方法包括:多重散点校正(MSC)、标准正态变量转换(SNV)、一阶和二阶导数转换(例如Savitzky–Golay平滑)、均值中心化(MC)和去趋势处理[24]、[25]。其中,MSC和SNV能有效消除由散射效应引起的基线漂移,而SG平滑处理在保留光谱峰值形状的同时抑制高频噪声。降维方法如主成分分析(PCA)和独立成分分析(ICA)可以显著压缩高维光谱数据,增强关键成分的区分度,从而便于后续建模和特征选择[26]、[27]。一些研究结合使用多种预处理方法(例如SG + SNV或SG + MSC)以获得更好的回归性能,预处理方法的选择对最终建模精度有显著影响[28]、[29]。
在模型层面,化学计量学、机器学习和深度学习三种方法在水果高光谱建模中形成了互补的生态系统。化学计量学模型如偏最小二乘回归(PLSR)由于其可解释性和线性建模能力,在早期研究中得到广泛应用,适用于小样本量和高维数据[30]。机器学习算法,包括支持向量机(SVM)、随机森林(RF)和K-近邻(KNN),具有更强的非线性建模能力,适用于揭示变量之间的复杂关系并实现泛化[4]。近年来,深度学习(DL)方法(包括卷积神经网络(CNN)、1D-CNN和长短期记忆(LSTM)网络)在端到端建模和自动化光谱特征提取方面展现出巨大潜力。这些方法特别适合大规模水果图像处理和复杂质量属性预测[31]、[32]。此外,随着多模态感知和联邦计算的兴起,一些研究进一步探索了化学计量学与深度学习的集成策略(例如将PLS因子嵌入DL框架中),增强了模型的可解释性和迁移适应性[33]。在模型评估方面,交叉品种建模、跨时间预测和领域自适应迁移学习等新兴方法逐渐被引入,为构建更强大的农业AI系统提供了方法论支持[2]、[34]。
然而,现有研究主要采用单一指标建模。面对水果的高维、强耦合理化属性,构建能够充分利用多指标数据内在结构的统一框架具有挑战性。这不仅限制了模型在实际生产场景中的泛化能力,还降低了识别复杂质量特征的准确性[35]。一些研究尝试融合多源光谱-图像-纹理特征或使用多目标回归模型来捕捉变量之间的潜在耦合关系[36]。然而,这些方法通常存在特征冗余、模型可解释性差和迁移能力弱的问题[37]。因此,建立一种结合特征融合能力、通用建模和可解释变量结构的统一建模策略成为多参数无损检测中的关键挑战。为了解决这些问题,本文提出了指数增强集成系统(IRIS):首先构建一个融合指数(FI),将干物质含量(DMC)、糖分和pH值等理化参数映射为标准化的潜在变量作为统一的表示目标。随后,采用双循环强化学习进行协同优化:内循环利用自动编码器实现多指标的非线性压缩和重建,强调信息保真度和表示稳定性;外循环结合光谱回归和波段选择,采用??-贪婪策略,其中奖励信号驱动特征子集和预测性能的同时提升。以春建柑橘为研究对象,本文系统验证了IRIS在多指标无损评估中的有效性和适用性,为智能农业中的多目标光谱建模提供了方法论参考。

部分内容片段

样本和光谱采集

本研究使用春建柑橘(Citrus reticulata Chunjian)作为实验材料。该品种是通过‘青建’和‘F-2432’柚子的杂交培育而成的优质杂交柑橘品种。2024年11月初,在中国云南省采集了处于商业成熟阶段的果实样本。为了确保代表性,从购买的20个样本中随机选择了16个完全成熟的果实。经过手动去皮后...

PCA结果展示

在对春建柑橘果肉的光谱样本进行PCA分析时,可以清楚地观察到不同预处理方法对样本分布结构的影响(如图1(e)所示)。未经处理的原始光谱主要由第一主成分(PC1)解释,占总方差的90.34%,并显示出明显的整体趋势。同样,SG预处理也保持了较高的主成分...

结论

本研究提出的IRIS框架在春建柑橘果肉的高光谱分析中表现出卓越的性能。通过引入FI,将干物质含量(DMC)、糖分和pH值这三个理化指标统一到一个标准化尺度上,有效捕捉了多个指标之间的内在耦合关系,克服了单一指标无法全面表征样本质量的局限性。IRIS采用双循环...

CRediT作者贡献声明

邱一鹏:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,研究,资金获取,正式分析,概念化。田海成:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,项目管理,资金获取,正式分析。尹恒:验证,监督,软件,资源,项目管理,方法论,正式分析。冯敖:验证,监督,软件,资源,项目

资金

本研究未获得公共部门、商业部门或非营利组织的任何特定资助。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文的研究结果。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号