ConvNeXt-PIV：一种用于粒子图像测速的现代卷积框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Ocean Engineering》：ConvNeXt-PIV: A modern convolutional framework for particle image velocimetry

【字体：大中小】 时间：2026年02月21日 来源：Ocean Engineering 5.5

编辑推荐：

　　粒子图像测速模型研究：提出基于ConvNeXt的轻量级编码器，通过深度可分离卷积和大核扩展感受野，保持高空间分辨率，在多个数据集上降低平均端点误差达37.6%-68.6%，参数量减少至1.7M，平衡精度与效率。

肖志峰|洪波|山亮

中国浙江吉利大学信息工程学院，浙江省电磁波信息技术与计量学重点实验室，杭州，310018，中国

摘要

近年来，基于深度学习的粒子图像测速（PIV）模型在估计复杂流动的速度场方面取得了显著进展。传统的基于CNN的PIV网络依赖于小的卷积核和池化层，在捕捉全局结构和大规模运动方面存在局限性。基于Transformer的模型虽然缓解了这一限制，但会带来较大的计算和内存成本。为了解决这些问题，我们提出了ConvNeXt-PIV，该模型基于ConvNeXt模块构建，其中深度卷积作为主要特征提取器，大核扩展了感受野。通过重新设计特征层次结构并将输出分辨率降低到输入分辨率的四分之一，该网络能够更好地捕捉粒子间距和速度梯度细节。在问题类I上的实验结果表明，与基线方法相比，ConvNeXt-PIV在Backstep、JHTDB Channel和DNS湍流数据集上的平均端点误差（AEE）分别降低了50.0%、68.6%和37.6%。同时，模型参数数量减少到了170万，而计算成本保持不变，体现了准确性和效率之间的良好平衡。这些结果验证了现代卷积架构在流体运动估计中的潜力，并为轻量级和高精度PIV建模提供了新的设计范式。

引言

粒子图像测速（PIV）是一种非接触式技术，通过估计连续图像帧之间粒子的位移来测量流场。由于其能够可视化和定量表征瞬态速度分布，PIV被广泛用于实验流体力学中的湍流分析、边界层诊断以及复杂流动现象的研究（Uksul等人，2025年；Yao等人，2025年）。

传统的PIV方法主要分为两类：互相关方法和光流方法。互相关技术通过识别图像对中查询窗口之间的峰值相关性来估计粒子位移，在实际PIV处理中仍占主导地位。例如，Window Deformation Iterative Multigrid（WIDIM）算法（Scarano，2001年）通过多尺度迭代和窗口变形补偿机制提高了匹配精度和收敛性，被认为是最精确的经典PIV方法之一。光流方法，如Lucas–Kanade和Horn–Schunck公式，通过最小化亮度恒定性残差并施加局部（LK）或全局平滑性（HS）约束来计算速度场（Horn和Schunck，1981年；Lucas和Kanade，1981年）。尽管这些方法理论上可以实现更高的空间分辨率和更平滑的速度场，但它们的性能严重依赖于亮度恒定性假设（粒子运动期间像素强度恒定）。在实际PIV图像中，由于照明变化、粒子散射波动和成像噪声的影响，这一假设的偏差会降低光流方法的鲁棒性和准确性。

近年来，深度学习在计算机视觉领域的进步使得PIV算法取得了显著进展，几种基于深度学习的方法达到了与传统技术相当的性能。2017年，Lee等人引入了PIV-DCNN，它使用四个级联的CNN直接从原始粒子图像对中估计速度场，从而减少了传统PIV所需的预处理步骤（Lee等人，2017年）。2019年，Cai等人将FlowNetS（Dosovitskiy等人，2015年）光流框架应用于流体运动估计，证明了将深度光流网络应用于PIV的可行性。这种方法后来通过LiteFlowNet（Cai等人，2019a，2019b）得到了扩展，实现了更准确的速度预测，并大幅降低了计算成本。2021年，RAFT（Recurrent All-Pairs Field Transforms）（Teed和Deng，2020年）模型被用于流体运动估计，Lagemann等人随后通过将RAFT的相关体积构建与迭代细化相结合，开发了RAFT256-PIV和RAFT32-PIV（Lagemann等人，2021a）。这些模型有效地提取了微妙的粒子特征，并显著提高了速度场预测的准确性。RAFT32-PIV在多个基准数据集上实现了最高的准确性，但由于其全分辨率输入，计算成本和推理时间限制了其在实时或大规模流场研究中的应用。为了缓解这一限制，Yu等人从RAFT中移除了上下文编码器，并简化了特征提取流程，得到了LightPIVNet（Yu等人，2021年），这是一种轻量级变体，保持了具有竞争力的估计性能。

研究人员通过集成注意力机制进一步改进了深度光流模型（Han和Wang，2023年；Vaswani等人，2017年）。2023年，Han等人提出了ARaft-FlowNet（Han和Wang，2023年），它在RAFT框架中加入了注意力模块，以提高在噪声较大或局部粒子稀疏情况下的粒子跟踪能力，从而提高了鲁棒性和泛化能力。GMA-PIV（Wang等人，2023年）采用了来自光流研究的全局运动聚合技术，并通过全局注意力模块对粒子运动相关性进行建模，使得在涉及大位移或遮挡的情况下能够进行更可靠的估计。Yu等人随后提出了DeepST-CC（Yu等人，2024年），它采用了基于Swin Transformer的分层编码器。通过结合局部卷积和基于窗口的自注意力，该方法增强了全局和上下文感知的特征表示，同时保持了空间分辨率。Twins-PIVNet（Reddy等人，2025年）采用了双分支注意力机制，同时建模局部细节和全局上下文信息，有助于多尺度流动结构的协调表示，并减少了背景噪声和静止区域的影响。Ding等人提出了FTGM（Ding等人，2025年），它将PIV光流估计重新定义为全局特征匹配任务。通过引入专为PIV定制的Transformer，该方法改进了全局特征表示，并进行了特征相似性匹配和全局流动传播优化，实现了更全面的对应搜索。基于注意力的深度光流模型显著提高了复杂流动中的特征表示和预测准确性。然而，这些方法通常涉及较高的计算和内存成本，限制了它们在工程场景中的实际应用。同时，传统的卷积神经网络在感受野和全局上下文建模方面存在局限性，难以同时捕捉大规模流动结构和细小尺度运动细节。

面对这些限制，本研究重新审视了面向PIV的网络的编码器设计，并采用了ConvNeXt架构（Liu等人，2022年）作为卷积主干，该架构在保持高空间保真的同时高效捕捉了扩展的空间相关性。与传统轻量级CNN编码器相比，ConvNeXt提供了更灵活的感受野扩展和特征聚合机制，使网络能够同时建模细小尺度的粒子纹理和更广泛的流动结构，同时保持卷积操作的计算效率。首先，使用大核深度卷积与点卷积相结合，将空间聚合与通道级特征交互解耦。这种设计在纯卷积框架内扩大了有效感受野，使编码器能够捕捉到估计流体流动中相干结构和大位移所需的长距离粒子运动相关性。其次，特征提取分辨率保持在输入大小的四分之一，以保留细小粒子纹理和小尺度运动线索。保持较高的空间保真度可以最小化小尺度上的信息损失，从而更准确地解析剪切层、涡旋和其他在高度下采样编码器中常常模糊的局部流动特征。通过这些改进，所提出的ConvNeXt-PIV模型在与基线RAFT模型相当或更优的流动场预测准确性方面取得了显著成果，同时大幅减少了参数数量。这些结果表明，当现代卷积设计被仔细适配到PIV数据的特性时，可以在表示能力和计算效率之间实现有效的平衡。

部分摘录

提出的方法

在这项研究中，设计了一种基于ConvNeXt模块的轻量级特征编码器，旨在为光流估计提供高分辨率的特征表示，同时保持可控的计算开销。ConvNeXt编码器设计主要包括：（1）使用ConvNeXt模块作为核心特征提取器，通过堆叠的卷积块和通道交互机制来增强感受野和特征表示

实验超参数设置

所有训练和测试都在Windows10环境中使用PyTorch 2.7.1（Paszke等人，2019年）执行，并通过NVIDIA GeForce RTX 3090 GPU上的CUDA 12.8加速，该GPU具有24GB内存。模型参数使用PyTorch的默认方案进行初始化，训练采用AdamW优化器（Loshchilov和Hutter，2019年），批量大小为5，训练周期为200个，初始学习率设置为

问题类I数据集的评估和讨论

第一步是对问题类I数据集进行评估。如表1所示，平均端点误差（AEE）比较展示了ConvNeXt-PIV与现有代表性方法的对比。在本文中，RAFT256-PIV（Lagemann等人，2021a）作为基准，误差单位表示为每100像素的像素数。结果表明，在Backstep、Cylinder、JHTDB Channel、DNS湍流和SQG数据集上，ConvNeXt-PIV分别提高了50.0%、21.4%和68.6%

结论

在这项工作中，我们提出了一个基于现代卷积架构的粒子图像测速模型，称为ConvNeXt-PIV，其编码器输出分辨率设置为1/4。这种设计旨在保留高频粒子纹理和小尺度位移信息，这些信息可能会因过度下采样而丢失，从而为后续的光流估计提供更强的空间线索。特征提取主干采用了优化的ConvNeXt模块

CRediT作者贡献声明

肖志峰：写作 – 审稿与编辑，撰写原始草稿，可视化，验证，软件，方法论，调查，形式分析。洪波：写作 – 审稿与编辑，监督，软件，资源，项目管理，方法论。山亮：写作 – 审稿与编辑，软件，资源，资金获取，概念化。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号