《Information Processing in Agriculture》:LGCA-Net: A time-series anomaly detection method for multiple types of agricultural sensors
编辑推荐:
本研究针对农业传感器数据在复杂环境下易受干扰导致数据质量下降的问题,提出了一种融合全局与局部特征的时序异常检测方法LGCA-Net。该方法通过多尺度卷积神经网络提取局部细节特征,利用Transformer捕捉全局长期依赖关系,并引入交叉注意力机制实现特征交互融合。实验结果表明,LGCA-Net在农田和温室两种场景下的F1分数分别达到0.9580和0.9721,异常样本识别准确率较单结构模型平均提升6.66%,为多类型农业传感器数据质量管控提供了可靠解决方案。
农业传感器作为智能农业的重要组成部分,在作物生长监测、土壤水分测量、气象环境观测等领域发挥着关键作用。然而,在真实的农业生产环境中,传感器极易受到强风、暴雨、农事操作及设备老化等多种外部因素的干扰,导致采集的数据存在噪声和异常值。这些异常数据会直接降低后续分析、建模和决策的准确性,严重制约智能农业的适用性和运行效率。传统异常检测方法(如阈值法、移动平均法)在农业应用中存在固有局限性:阈值法高度依赖专家定义的判断标准,跨区域、跨作物及多变气候条件下的适应性差;移动平均法在复杂环境中会导致细节信息丢失,识别精度下降。农业生产受季节变化、气候波动、作物生长周期等多因素影响,水分利用模式和数据特征呈现动态变化,传统模型参数灵活性有限,对新兴数据模式的适应性较弱,显著限制了农业水资源管理向智能化、精细化发展。
在此背景下,深度学习技术因其能够从海量数据中自动学习复杂模式和特征表示的能力,为农业传感器时序异常检测带来了新的机遇。然而,农业数据与气候变化和作物生长密切相关,具有较强的时间特性。基于数据重构的异常检测方法往往难以充分捕捉时间序列数据中每个时间点相邻点的归纳偏置,且需要计算整个序列进行检测,资源消耗大,实时检测困难。此外,农业数据在不同时间尺度上表现出显著差异的波动规律:短期尺度上,气温骤变、突发降雨、灌溉等会导致土壤水分等数据快速变化,波动尺度差异大,特征在特征空间内相互交织;长期尺度上,农业数据遵循明显的季节性和周期性规律,同时还受到气候变化、种植结构调整等长期因素的影响。大多数现有的实时判别式异常检测方法基于单一模型或串行融合,单一模型难以适应农业环境的高度可变特性,串行融合方法(如CNN-LSTM模型)的特征提取质量完全依赖于前序模块,若前序模块未能捕获关键信息,后续学习效果会恶化。
为了解决这些挑战,本研究提出了一种面向多类型农业传感器的时间序列异常检测方法LGCA-Net(Local and Global Cross-Attention Network)。该方法核心在于通过并行融合全局与局部特征,适应农业时间序列的短期波动和长期周期双重特征。具体而言,LGCA-Net包含三个核心模块:(1)局部特征提取模块:基于多尺度卷积神经网络(MCNN),利用不同尺寸的卷积核挖掘数据的局部特征信息,捕捉数据的细微波动和瞬时变化;(2)全局特征提取模块:基于Transformer神经网络,通过多头自注意力机制并行计算多个子空间的注意力分布,从多角度捕捉数据的全局相关性,识别不同季节、气候和作物生长周期等导致的长期变化差异;(3)特征融合模块:基于交叉注意力(Cross-Attention)机制,建立局部特征与全局特征之间的交互连接,促进信息交换与整合,形成一个从局部到全局的完整特征提取体系,增强模型对复杂数据的表征能力。
为了评估LGCA-Net的有效性,研究团队利用来自农田和温室两种农业场景的数据集进行了实验。结果表明,LGCA-Net在农田和温室场景下的F1分数分别达到0.9580和0.9721,全面衡量了精确率和召回率。与单结构模型相比,异常样本识别准确率(ACC)平均提高了6.65%(农田)和6.67%(温室)。该模型通过全局和局部特征的并行融合,克服了单结构模型在特征捕获方面的局限性,为多类型农业传感器提供了可靠的异常检测解决方案。
在技术方法层面,研究人员为开展此项研究主要应用了以下几项关键技术:首先,利用多尺度一维卷积神经网络(MCNN)并结合卷积残差块来提取时间序列的局部多尺度特征,以捕捉短期波动;其次,采用Transformer编码器结构,利用其多头自注意力机制来捕获时间序列中的长期依赖关系和全局模式;最后,创新性地引入了双向交叉注意力机制,实现了局部特征与全局特征之间的交互融合,而非简单的串联或叠加,从而更有效地整合了不同尺度的信息。实验数据来源于真实的农田(土壤水分含量,采样间隔1小时)和温室(空气温湿度,采样间隔5分钟)监测场景。
2.1. 多尺度局部特征提取
该模块采用一维CNN(1D-CNN),通过多个不同尺度的卷积核滑动输入序列,提取对应不同时间跨度的局部特征。为了适应农业数据中并存的多尺度特征(如短期降水波动、中期长势变化),研究采用了多尺度卷积结构,并构建了卷积残差块替代单层卷积,通过跳跃连接将原始信息无损传递至后续层,确保关键信息不被卷积操作过度平滑。
2.2. 全局特征提取
该模块采用Transformer的编码器部分,其结构包括位置编码、多头自注意力机制和前馈神经网络。自注意力机制可以直接对序列中任意位置间的依赖关系进行建模,特别适合捕捉农业数据中的全局模式,例如同时关注“夏季高温”与“冬季低温”之间的长期关联性。
2.3. 基于交叉注意力机制的特征融合
该模块构建了基于交叉注意力机制的全局和局部特征融合模块。交叉注意力机制允许一个输入序列“关注”另一个序列中的相关信息,实现了“全局→局部”和“局部→全局”的双向交互。这种“双”交叉注意力机制充分利用了不同尺度下的特征交互,结合了全局信息并强化了局部细节。
3. 实验结果与讨论
研究在农田和温室两种场景的数据上进行了实验分析。农田场景选取0-20厘米和20-40厘米土层土壤水分含量数据,温室场景选取空气温度和湿度数据。这些数据构成了自然条件和可控条件下两种典型农业场景的关键时间序列监测数据,具有较强的代表性。通过对测试集的评估表明,LGCA-Net模型在两种场景下均取得了最优的检测性能。在F1-Score指标上,该模型在农田场景达到0.9580,在温室场景达到0.9721。与单结构模型相比,对异常样本的识别准确率平均提升了6.65%(农田)和6.67%(温室)。
3.2. 模型对比分析
研究将LGCA-Net与随机森林(RF)、支持向量机(SVM)、多尺度CNN(MCNN)、Transformer、时间卷积网络(TCN)、LSTM以及串行融合的TCN-LSTM模型进行了对比。实验结果表明,传统机器学习方法(RF、SVM)在两种场景下均表现不佳。深度学习模型(MCNN、TCN、LSTM、Transformer等)因其自动特征学习能力而展现出优势,但不同模型结构的适应性存在差异。LGCA-Net通过融合MCNN和Transformer,在正常和异常样本的识别准确率上均超过90%,高于其他模型。
3.3. 交叉注意力机制消融分析
为评估所提出的交叉注意力特征融合的优势,研究将其与传统的特征拼接方法进行了比较。结果表明,对于受自然环境影响更大的田间土壤数据,使用交叉注意力机制的特征融合方法在各项性能指标上均有整体提升,特别是异常样本的识别准确率提升最为显著。对于干扰较小的温室环境数据,交叉注意力机制也能带来性能的略微提升。
3.4. 模型复杂度与推理效率分析
对模型参数量、模型大小、计算复杂度(FLOPs)和平均推理时间的统计分析表明,LSTM和TCN-LSTM模型受限于网络结构无法实现并行计算,推理时间较长。TCN和Transformer虽轻量且推理速度快,但准确率不足。LGCA-Net在取得显著准确率提升的同时,其20.209毫秒的推理时间远低于田间(1小时)和温室(5分钟)场景的采样频率,满足了实时监测需求。
4. 结论
本研究针对农业时序传感器数据表现出的长短期变化规律,提出了一种基于全局与局部特征融合的、面向多类型农业传感器的通用时序异常检测方法LGCA-Net。该方法利用多尺度CNN(MCNN)提取局部特征,通过Transformer的多头注意力机制捕捉全局特征,并采用交叉注意力机制实现全局与局部特征的交互融合,从而能够针对不同农业场景的时序数据进行有效的异常检测。实验证明,该融合模型在农田和温室场景下均表现出优异的检测性能,并且保持了良好的计算效率。未来的工作将扩展研究范围至更多类型的农业传感器数据和应用场景,优化模型结构,并考虑引入自监督学习方法以降低对标注样本的依赖,同时关注模型的轻量化优化以增强其在资源受限的农业物联网场景中的适用性。