MAformer:一种用于水产养殖环境中水质预测的多变量框架,具备自适应多尺度分解和相位校正功能

《Environmental Modelling & Software》:MAformer: A multivariate prediction framework with adaptive multi-scale decomposition and phase correction for water quality in aquaculture environments

【字体: 时间:2026年02月13日 来源:Environmental Modelling & Software 4.6

编辑推荐:

  精准预测溶解氧(DO)对智慧水产管理至关重要,但DO时序的非平稳性、多周期混叠及局部相位偏移导致传统方法效果受限。本文提出MAformer模型,通过三阶段创新:1)多尺度自适应分解器(HASD)平衡长短期特征;2)多周期相位对齐注意力(MPAA)解决周期混叠;3)相位校正注意力(PSCA)抑制局部扰动。实验表明MAformer在6个异质海域数据集上显著优于7种基准模型,平均MAE降低9.59%,RMSE降低7.96%,R2和KGE分别提升8.39%和6.25%,验证其高效性与泛化能力。

  
邢浩然|李颖|李大舍|杨焕海
山东技术商学院计算机科学与技术学院,中国山东省烟台市264005

摘要

准确预测溶解氧(DO)对于水产养殖中的智能决策至关重要。然而,由于DO序列固有的非平稳性、多周期混叠和局部相位偏移,实现这一目标具有挑战性。我们提出了多尺度自适应变换器(MAformer)用于水质预测。首先,分层自适应平滑分解器稳定了长期模式,同时保留了短期细节。其次,多周期相位对齐注意力模块实现了跨周期同步。第三,相位偏移校正注意力模块增强了模型对短期干扰的鲁棒性。在来自不同地理和气候区域的六个海洋养殖数据集上的实验表明,MAformer显著优于七种最先进的基线模型。例如,它在平均绝对误差(MAE)上降低了9.59%,在均方根误差(RMSE)上降低了7.96%,在R2上提高了8.39%,在KGE上提高了6.25%。这些结果证实了MAformer作为智能水产养殖管理中可靠且通用工具的优越能力。

引言

水产养殖是全球蛋白质供应和食品安全的重要支柱产业(Li等人,2025a)。其可持续发展需要准确的水质参数预测技术(Saeed等人,2024)。溶解氧(DO)是关键的水质指标(Wang等人,2025)。准确预测DO可以提供缺氧风险的早期预警和动态调节,减少缺氧和压力事件的发生(Sun等人,2025)。这些因素可以提高存活率和生长效率(Ji等人,2025)。因此,本研究专注于DO预测,并通过建立准确的预测方法为水产养殖的可持续发展提供支持。
水质预测方法主要分为基于物理的模型和数据驱动的模型(Li等人,2025b)。基于物理的模型源于质量和动量守恒定律,通常表示为对流-扩散-反应偏微分方程(PDEs),描述了在水动力传输和生物地球化学过程下水质变量随时间的变化(Michel等人,2022)。为了减少预测不确定性,经常结合数据同化技术——如四维变分同化(Nystrom等人,2025)和集合卡尔曼滤波器(EnKF)(Poursaeid,2025)——使用观测时间序列来校正模拟状态。这些模型的主要优势在于其可解释性,能够清晰地洞察控制水质动态的因果机制(Wang等人,2022)。然而,它们的实际应用面临重大挑战。首先,求解复杂的PDE计算量巨大,限制了它们在实时时间序列预测中的应用(Brunton和Kutz,2024)。其次,构建这些模型需要大量的边界条件和水动力参数的先验知识,使得校准过程繁琐且成本高昂(Zhang和Fu,2023)。第三,它们通常基于简化的假设来处理复杂的生化相互作用,可能无法捕捉动态水产养殖环境中快速的非平稳波动(Jones等人,2023)。
数据驱动的模型使用历史观测作为输入,并学习时间序列中的变化模式,以此来预测未来的DO变化(Zhang等人,2023)。与基于物理的模型相比,这种方法对先验知识和额外输入的依赖性较低,但在建模和迁移方面具有高度灵活性(Shlezinger等人,2023)。数据驱动的模型可以进一步分为两类:基于机器学习的模型和基于深度学习的模型。机器学习已被广泛用于水质预测(Ahmed等人,2023)。为了捕捉复杂的非线性关系,常用的方法包括支持向量机(SVM)(Kuo和Chiu,2024)、隐马尔可夫模型(Avinash等人,2024)和集成学习算法(Guan等人,2025),例如AdaBoost(Kowshal等人,2025)。此外,统计方法如线性回归(Masteali等人,2025)常被用作线性基准,而贝叶斯模型(Chen等人,2024)用于概率预测。实际上,上述机器学习和统计模型对异常值和测量噪声仍然敏感,其预测误差在长时间预测范围内往往会放大和累积(Zhu等人,2023)。
随着人工智能的快速发展,深度学习模型已成为数据驱动模型中的热门技术(Liu等人,2022a)。典型方法包括循环神经网络(Gorgij等人,2023)及其变体、长短期记忆网络(Zhang等人,2022)和门控循环单元(Mei等人,2022)。这些模型通过递归记忆结构描绘时间依赖性,能够在序列中积累上下文信息,捕捉长期和短期因素对DO变化的影响。诸如卷积神经网络(CNNs)(Ehteram等人,2024)及其扩展的时间卷积网络(TCNs)(Cheng等人,2025)等模型已被应用于时间序列建模。尽管这些深度学习方法在时间序列建模方面取得了进展,但它们在面对具有超长跨度的全球依赖性时容易发生记忆衰减,难以平衡长期趋势和快速扰动(Sun等人,2024)。此外,它们受到局部感受野和固定卷积核的限制,难以完全捕捉复杂的变化(Dong等人,2024)。在处理复杂的多尺度时间序列时仍存在若干挑战。
Transformer的自注意力机制可以直接建立任意两个时间步骤之间的连接,并在同一层内聚合全局和局部上下文。其计算不需要顺序递归,支持并行训练。因此,它能有效捕捉长序列场景中的长距离依赖性(Wei等人,2023)。然而,自注意力的计算复杂度随序列长度呈二次方增长,导致长序列训练和推理的时间消耗显著增加,以及视频内存开销的急剧增加(Zhai等人,2023)。为了解决上述瓶颈,研究人员提出了多种改进模型:稀疏注意力,如Reformer(Kitaev等人,2020)和Informer(Zhou等人,2021);基于分解的Transformer,如Autoformer(Wu等人,2021)和FEDformer(Zhou等人,2022);以及用于局部建模的基于补丁的表示方法,包括PatchTST(Nie等人,2023)和Fredformer(Piao等人,2024)。这些方向在减少计算负担的同时,通常提高了模型对长距离和多尺度依赖性的建模能力。
尽管上述方法在时间序列预测方面取得了进展,但在水产养殖中的DO预测仍存在关键挑战。DO序列表现出显著的多尺度和非平稳特性。短期内受潮汐和气象干扰的影响,长期受季节性和生态周期的影响。现有方法通常使用单尺度平滑或固定窗口处理,难以在保留高频细节和稳定低频趋势之间取得平衡。这导致趋势和季节信号之间的相互泄漏,使长期预测出现偏差并累积误差。DO序列经常与多个周期重叠,如半日、日、周、月甚至季节周期。传统的注意力方法通常基于波形幅度测量相似性,没有明确捕捉相位信息。当不同时间周期之间发生相位错位时,模型容易将错位的峰值和谷值误解为同质模式,导致周期性混叠。这使得根据场景自适应选择主导周期变得困难,从而导致峰值时间的偏移和泛化性能下降。由于暴雨径流、突然的潮汐涌浪和生产干预等因素,单个周期内经常出现相位提前和滞后,伴随局部异常波动。标准注意力方法倾向于过分强调这些部分,导致预测曲线中的峰值和谷值出现系统性偏差,放大不稳定性。为系统地解决这些挑战,我们提出了一个名为多尺度自适应变换器(MAformer)的新深度学习框架。本研究的主要贡献总结如下:
1. 开发了一种分层自适应平滑分解器(HASD),解决了传统单尺度分解引起的趋势漂移和误差累积问题。它通过多尺度下采样和可学习的指数移动平均(EMA)提取不同尺度上的趋势和季节性术语,并使用门控网络自适应融合它们,以提高模型提取非平稳特征的能力。
2. 开发了一种多周期相位对齐注意力(MPAA),解决了传统自注意力机制仅依赖序列波形的幅度而忽略不同周期之间相位差异的问题。MPAA编码了每个周期的幅度和相位,使用复杂的厄米点积测量相似性,并通过路由器整合上下文,以区分和整合多个周期的影响。
3. 开发了一种相位偏移校正注意力(PSCA),解决了由于暴雨或突然的潮汐涌浪等数据波动引起的单个周期内的相位提前或滞后问题。我们引入了相位偏差惩罚项,并将其与能量抑制聚合器(ESA)结合,动态抑制异常片段的权重。因此,我们提高了模型在干扰场景下的预测准确性和稳定性。
综合来看,这些组件提高了模型在各种水产养殖环境中提供准确DO预测的能力。
本文的结构如下。第2节概述了数据集和整体工作流程。第3节报告了多个数据集上的性能结果及可视化验证。第4节总结了研究并指出了未来工作的方向。

研究区域和数据来源

本研究以DO为核心参数,使用了来自不同地理和气候区域的六组海洋养殖环境数据(详见表1)。这些数据涵盖了多样的水体和人类活动梯度,代表了水产养殖研究中使用的典型环境。为了确保数据适合模型,我们应用了标准的预处理流程。首先,对于每个水质变量,我们进行了基于Z分数的异常值筛选。

模型训练和验证策略

为了确保公平比较,所有模型都在相同的实验协议下进行训练和评估。对于每个数据集,我们使用滑动窗口方案构建了训练样本:将多变量时间序列分割成重叠的输入窗口及其后续的未来段作为预测目标。然后按时间顺序将完整时间序列分为训练、验证和测试三个子集,比例为7:1:2。
所有模型都采用了

结论

本文提出了一个用于DO预测的深度时间序列建模框架,展示了出色的预测性能和实际应用潜力。HASD旨在提取和门控多个尺度上的趋势和季节性成分。这有效地压缩了冗余信息,保留了高频细节,并稳定了长期结构,减轻了单尺度处理引起的趋势漂移和误差累积。引入了MPAA算法,该算法结合了

软件和数据可用性

CRediT作者贡献声明

邢浩然:撰写——原始草稿、可视化、验证、软件、方法论、概念化。李颖:软件、项目管理、调查、数据整理。李大舍:资源、项目管理、调查、资金获取。杨焕海:验证、资金获取、数据整理。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

所有作者感谢编辑和审稿人对本文的关注。我们恳请编辑和审稿人提供宝贵的评论和修改建议。本工作得到了国家自然科学基金(项目编号:71973106)和山东省自然科学基金(项目编号:ZR2025MS689)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号