水产养殖是全球蛋白质供应和食品安全的重要支柱产业(Li等人,2025a)。其可持续发展需要准确的水质参数预测技术(Saeed等人,2024)。溶解氧(DO)是关键的水质指标(Wang等人,2025)。准确预测DO可以提供缺氧风险的早期预警和动态调节,减少缺氧和压力事件的发生(Sun等人,2025)。这些因素可以提高存活率和生长效率(Ji等人,2025)。因此,本研究专注于DO预测,并通过建立准确的预测方法为水产养殖的可持续发展提供支持。
水质预测方法主要分为基于物理的模型和数据驱动的模型(Li等人,2025b)。基于物理的模型源于质量和动量守恒定律,通常表示为对流-扩散-反应偏微分方程(PDEs),描述了在水动力传输和生物地球化学过程下水质变量随时间的变化(Michel等人,2022)。为了减少预测不确定性,经常结合数据同化技术——如四维变分同化(Nystrom等人,2025)和集合卡尔曼滤波器(EnKF)(Poursaeid,2025)——使用观测时间序列来校正模拟状态。这些模型的主要优势在于其可解释性,能够清晰地洞察控制水质动态的因果机制(Wang等人,2022)。然而,它们的实际应用面临重大挑战。首先,求解复杂的PDE计算量巨大,限制了它们在实时时间序列预测中的应用(Brunton和Kutz,2024)。其次,构建这些模型需要大量的边界条件和水动力参数的先验知识,使得校准过程繁琐且成本高昂(Zhang和Fu,2023)。第三,它们通常基于简化的假设来处理复杂的生化相互作用,可能无法捕捉动态水产养殖环境中快速的非平稳波动(Jones等人,2023)。
数据驱动的模型使用历史观测作为输入,并学习时间序列中的变化模式,以此来预测未来的DO变化(Zhang等人,2023)。与基于物理的模型相比,这种方法对先验知识和额外输入的依赖性较低,但在建模和迁移方面具有高度灵活性(Shlezinger等人,2023)。数据驱动的模型可以进一步分为两类:基于机器学习的模型和基于深度学习的模型。机器学习已被广泛用于水质预测(Ahmed等人,2023)。为了捕捉复杂的非线性关系,常用的方法包括支持向量机(SVM)(Kuo和Chiu,2024)、隐马尔可夫模型(Avinash等人,2024)和集成学习算法(Guan等人,2025),例如AdaBoost(Kowshal等人,2025)。此外,统计方法如线性回归(Masteali等人,2025)常被用作线性基准,而贝叶斯模型(Chen等人,2024)用于概率预测。实际上,上述机器学习和统计模型对异常值和测量噪声仍然敏感,其预测误差在长时间预测范围内往往会放大和累积(Zhu等人,2023)。
随着人工智能的快速发展,深度学习模型已成为数据驱动模型中的热门技术(Liu等人,2022a)。典型方法包括循环神经网络(Gorgij等人,2023)及其变体、长短期记忆网络(Zhang等人,2022)和门控循环单元(Mei等人,2022)。这些模型通过递归记忆结构描绘时间依赖性,能够在序列中积累上下文信息,捕捉长期和短期因素对DO变化的影响。诸如卷积神经网络(CNNs)(Ehteram等人,2024)及其扩展的时间卷积网络(TCNs)(Cheng等人,2025)等模型已被应用于时间序列建模。尽管这些深度学习方法在时间序列建模方面取得了进展,但它们在面对具有超长跨度的全球依赖性时容易发生记忆衰减,难以平衡长期趋势和快速扰动(Sun等人,2024)。此外,它们受到局部感受野和固定卷积核的限制,难以完全捕捉复杂的变化(Dong等人,2024)。在处理复杂的多尺度时间序列时仍存在若干挑战。
Transformer的自注意力机制可以直接建立任意两个时间步骤之间的连接,并在同一层内聚合全局和局部上下文。其计算不需要顺序递归,支持并行训练。因此,它能有效捕捉长序列场景中的长距离依赖性(Wei等人,2023)。然而,自注意力的计算复杂度随序列长度呈二次方增长,导致长序列训练和推理的时间消耗显著增加,以及视频内存开销的急剧增加(Zhai等人,2023)。为了解决上述瓶颈,研究人员提出了多种改进模型:稀疏注意力,如Reformer(Kitaev等人,2020)和Informer(Zhou等人,2021);基于分解的Transformer,如Autoformer(Wu等人,2021)和FEDformer(Zhou等人,2022);以及用于局部建模的基于补丁的表示方法,包括PatchTST(Nie等人,2023)和Fredformer(Piao等人,2024)。这些方向在减少计算负担的同时,通常提高了模型对长距离和多尺度依赖性的建模能力。
尽管上述方法在时间序列预测方面取得了进展,但在水产养殖中的DO预测仍存在关键挑战。DO序列表现出显著的多尺度和非平稳特性。短期内受潮汐和气象干扰的影响,长期受季节性和生态周期的影响。现有方法通常使用单尺度平滑或固定窗口处理,难以在保留高频细节和稳定低频趋势之间取得平衡。这导致趋势和季节信号之间的相互泄漏,使长期预测出现偏差并累积误差。DO序列经常与多个周期重叠,如半日、日、周、月甚至季节周期。传统的注意力方法通常基于波形幅度测量相似性,没有明确捕捉相位信息。当不同时间周期之间发生相位错位时,模型容易将错位的峰值和谷值误解为同质模式,导致周期性混叠。这使得根据场景自适应选择主导周期变得困难,从而导致峰值时间的偏移和泛化性能下降。由于暴雨径流、突然的潮汐涌浪和生产干预等因素,单个周期内经常出现相位提前和滞后,伴随局部异常波动。标准注意力方法倾向于过分强调这些部分,导致预测曲线中的峰值和谷值出现系统性偏差,放大不稳定性。为系统地解决这些挑战,我们提出了一个名为多尺度自适应变换器(MAformer)的新深度学习框架。本研究的主要贡献总结如下:
1. 开发了一种分层自适应平滑分解器(HASD),解决了传统单尺度分解引起的趋势漂移和误差累积问题。它通过多尺度下采样和可学习的指数移动平均(EMA)提取不同尺度上的趋势和季节性术语,并使用门控网络自适应融合它们,以提高模型提取非平稳特征的能力。
2. 开发了一种多周期相位对齐注意力(MPAA),解决了传统自注意力机制仅依赖序列波形的幅度而忽略不同周期之间相位差异的问题。MPAA编码了每个周期的幅度和相位,使用复杂的厄米点积测量相似性,并通过路由器整合上下文,以区分和整合多个周期的影响。
3. 开发了一种相位偏移校正注意力(PSCA),解决了由于暴雨或突然的潮汐涌浪等数据波动引起的单个周期内的相位提前或滞后问题。我们引入了相位偏差惩罚项,并将其与能量抑制聚合器(ESA)结合,动态抑制异常片段的权重。因此,我们提高了模型在干扰场景下的预测准确性和稳定性。
综合来看,这些组件提高了模型在各种水产养殖环境中提供准确DO预测的能力。
本文的结构如下。第2节概述了数据集和整体工作流程。第3节报告了多个数据集上的性能结果及可视化验证。第4节总结了研究并指出了未来工作的方向。