《Information Processing in Agriculture》:An efficient compressive CNN and transformer hybrid framework for long-term dissolved oxygen prediction in aquaculture
编辑推荐:
本研究针对水产养殖中多参数非线性耦合关系复杂、传统方法预测精度有限的问题,提出了一种基于高效压缩CNN与Transformer的混合框架,用于长期溶解氧浓度预测。通过CNN提取多传感器数据的局部空间特征,引入压缩感知策略减少信息损失,并利用Transformer捕获全局时间依赖性。实验结果表明,该模型在96步和168步预测中R2分别达到0.969和0.963,RMSE和MAE显著降低,收敛速度提升13.59%,为水产养殖水质管理提供了高效精准的预测工具。
在水产养殖环境中,溶解氧是维持水生生物生存的关键指标,其浓度变化直接影响养殖效益和生态安全。然而,传统水质预测方法存在明显局限性:一方面,它们难以充分捕捉多参数(如pH、温度、盐度等)间的非线性耦合关系;另一方面,现有模型对长期时间序列依赖性的建模能力不足,导致预测精度和泛化能力受限。例如,循环神经网络虽能处理序列数据,但易出现梯度消失问题;而传统Transformer模型在局部波动捕捉上存在不足。这些缺陷使得水产养殖管理者难以提前应对溶解氧骤降等风险,亟需一种能兼顾多因子交互和长期时序特征的高效预测框架。
针对这一挑战,海南大学信息与通信工程学院的研究团队在《Information Processing in Agriculture》发表论文,提出了一种创新性的高效压缩CNN-Transformer混合框架。该框架通过卷积神经网络提取多传感器数据的局部空间特征,引入基于二值伯努利观测矩阵的压缩池化策略以减少信息损失,并利用Transformer的多头自注意力机制捕获全局时间依赖性,最终实现对未来4-7天溶解氧浓度的高精度预测。
研究的关键技术方法包括:1)采用滑动窗口和最小-最大归一化对4000条水产养殖水质数据进行预处理;2)设计压缩感知层,通过快速傅里叶变换分析数据稀疏性,用固定伯努利矩阵实现特征降维;3)构建1D-CNN模块(两层卷积,滤波器数32/128)提取局部特征;4)使用Transformer编码器-解码器结构(2层,4头注意力)建模长期依赖关系;5)采用均方误差损失函数和Adam优化器进行模型训练。
研究结果验证了该框架的优越性能:
模型收敛性分析表明,压缩池化策略使模型收敛速度提升13.59%,且训练/验证损失曲线保持稳定,无显著过拟合。
特征提取效果上,频域采样相比时域采样使RMSE降低52.32%,证明频域处理能更好保留信号结构。
预测精度方面,在96步预测中,该模型的RMSE为0.022±0.004 mg/L,R2达0.969±0.004,显著优于LSTM、GRU等基线模型;即使延长预测至168步(7天),R2仍保持在0.963±0.003。
极端事件预测中,模型对54个溶解氧突变事件(变化阈值>0.1 mg/L)的预测误差保持稳定,证明其对突发水质恶化的鲁棒性。
效率方面,模型在GPU内存占用(11.40 GB)和推理时间(0.0156 s)上均优于传统Transformer等对比模型。
讨论部分指出,该研究的主要创新在于将压缩感知理论与深度学习相结合,解决了传统池化操作的信息损失问题。通过二值观测矩阵实现特征压缩,既保留了多传感器数据的耦合关系,又降低了计算复杂度。此外,CNN-Transformer的混合架构有效平衡了局部特征提取和全局依赖建模的需求,尤其适合水产养殖环境中多因子、强非线性的水质预测场景。
该研究的实际意义在于:首先,预测误差(0.02 mg/L级)远低于缺氧预警阈值(2-3 mg/L)的1%,可可靠支撑水产养殖风险管控;其次,模型对168小时的长时预测能力,为制定增氧机调度等生产决策提供了充足响应时间;最后,框架的通用性使其可扩展至其他水质参数预测,为智能水产养殖系统开发奠定了技术基础。未来工作可融入气象数据等外生变量,进一步提升模型在复杂环境下的适应性。