利用迁移学习和基于物理的融合技术，实现缓慢移动且体积较小的水下目标的少量样本识别

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Ocean Engineering》：Few-shot recognition of slowly moving and small underwater targets with transfer learning and physics-informed fusion

【字体：大中小】 时间：2026年02月28日 来源：Ocean Engineering 5.5

编辑推荐：

　　水下缓慢移动小目标识别中，基于物理信息的少数样本学习框架FUSTR-Net通过多域特征交互融合、方位散射特性引导分类和静态-动态域自适应策略，显著提升目标识别准确率，实验验证其即使在样本量降至40时仍保持73.32%的高识别精度。

严武|杨阳|范俊|王斌

教育部海洋智能装备与系统重点实验室，上海交通大学，上海200240，中华人民共和国

摘要

对于缓慢移动且体积较小的水下目标进行少样本识别具有挑战性，因为这些目标尺寸小、速度低，在现实环境中出现频率低，并且特征不明显，这进一步增加了识别的难度。在主动感知水下小型目标时，由于海水的阻碍，数据采集成本高昂且困难；此外，由于声纳系统的分辨率和精度较低，可利用的特征也有限。尽管深度神经网络能够学习到具有区分性的表示，但来自小型目标的回波样本稀缺，限制了网络的性能。通过充分利用多种特征类型以及关键的物理先验，可以减轻少样本情况下的识别精度下降问题。本文提出了FUSTR-Net，这是一种基于物理知识的迁移学习方法，用于缓慢移动和小型水下目标的少样本识别。FUSTR-Net整合了时间、频率和时间-频率域的表示，并将方位角相关的散射信息作为潜在先验。为了解决训练集和测试集分布不匹配的问题，使用多核最大均值差异算法最小化了特征空间中的跨域距离，从而减少了样本差异引起的偏差，并提高了对移动目标的泛化能力。实验中收集了包括无人水下航行器（UUV）和潜水员在内的代表性小型目标的静态和动态数据，并构建了用于评估的静态和动态数据集。当每个类别的训练样本数量减少到40个时，FUSTR-Net在移动目标识别任务上的准确率仍能达到92.24%；即使样本数量进一步减少到20个，准确率仍保持在73.32%。这些结果表明，结合多域特征和物理先验可以有效缓解数据稀缺问题，并在少样本条件下提升识别能力。

引言

水下小型目标识别（USTR）已成为水下声学领域的一项重要任务，特别是在军事监视、水下救援和自主导航等场景中，对智能感知的需求不断增长（Aslam等人，2024年）。目前，小型目标主要通过高频成像声纳进行检测。虽然高频声纳具有较短的探测范围和较强的散射能力，但结构和材料信息往往被忽略。与大型目标或船舶辐射噪声相比（Hummel等人，2024年），小型水下目标（如UUV和潜水员）产生的回波信号较弱，信噪比（SNR）较低，使得准确检测和识别尤为困难。海洋环境的复杂性和标记数据的有限性（Chungath等人，2023年；Wang等人，2022年）进一步加剧了这些问题，从而阻碍了传统机器学习方法的直接应用。

该领域的早期研究主要依赖于从声学信号中手工提取的特征。这些方法利用领域知识设计了时间、频率或时间-频率域的特征（例如能量熵和小波系数）（Li等人，2016年；Qiao等人，2021年；Wei等人，2023年）。尽管在特定条件下这些特征具有可解释性和有效性，但作为主要表示方式时，它们难以泛化且需要手动调整，限制了实际应用中的可扩展性和鲁棒性。此外，手工设计的特征提取流程通常繁琐，不适合自动化或自适应系统。

深度学习的兴起为水下目标识别提供了新的动力（Jiang等人，2024年；Williams等人，2016年；Xu等人，2023年；Zhou等人，2023年）。特别是卷积神经网络（CNN）和变换器，具有强大的表示学习能力，能够从原始输入中自动提取高级特征（Doan等人，2020年）。深度学习已成为声学信号识别的主要工具。然而，对于小型水下目标来说，获取足够的标记数据进行训练仍然是一个主要瓶颈（Ghavidel等人，2022年）。与一般的音频任务不同，收集水下声学样本成本高昂且耗时。在大多数现实场景中，这导致样本数量有限，严重限制了依赖大规模数据集的深度网络的性能。

为了解决上述问题，最近的研究尝试结合手工特征和深度特征，旨在在一定程度上保持可解释性的同时提高表示能力（Ke等人，2020年；Zhang等人，2022年；Zhang等人，2023年）。不同的融合策略产生了截然不同的识别结果。大致上，这些方法分为两类：第一类方法并行提取手工特征和深度特征，然后将其连接或加权求和以获得最终表示（Feng等人，2024年；Zhang等人，2021年）；第二类方法采用串行设计，先计算手工特征，再将其输入网络进行深度提取。这是因为神经网络对输入数据具有一定的敏感性。如果对输入数据进行预处理以增强显著成分并抑制干扰，网络可以更稳定、更高效地学习深度表示，尤其是在少样本条件下。此外，注入关键先验以指导网络训练非常重要。

即使在同一类型的小型水下目标中，它们的物理属性也存在差异。例如，UUV的尺寸从小到大不等，且通常是金属制成的。潜水员是生物实体，其装备包括干式或湿式潜水服、氧气面罩和鳍。几何形状、内部结构和材料的差异导致主动声纳回波随方位角变化。因此，方位角是影响识别准确性的关键因素。传统流程通常将目标方位角作为预处理步骤来辅助识别，但这种方法高度依赖于方位角估计的准确性，如果估计失败，识别效果会下降。研究表明，在训练过程中将方位角信息作为潜在变量引入可以显著提高识别性能（Oh等人，2020年；Zhao等人，2024年）。然而，结合关键方位角信息的机制应根据具体问题进行定制。

在探测移动小型目标时，主动声纳受到截面限制、姿态和入射角快速变化以及高频波束范围狭窄的影响。因此，有效的回波仅出现在非常小的角度窗口内。观测时间短以及每个方位角下的回波稀疏导致样本总量不足。相比之下，静态目标数据在多个方位角和范围内更容易获取，可以构建完整的散射特性以辅助检测和决策。这种全角度信息可以通过测量或基于物理的模拟获得。使用静态数据进行训练是一个合理的选择，但由于运动引起多普勒效应、辐射噪声增加和频谱变化（Xiang等人，2023年），同一目标的移动和静态数据可能会表现出不同的分布（Gao等人，2023年；Sun和Boukerche，2018年），这种不匹配会导致特征偏移，需要加以缓解（Yang等人，2024a）。

为了解决方位角敏感性和移动目标识别中的少样本问题，本研究提出了一种基于少样本的水下小型目标识别网络（FUSTR-Net），包括一个“特征提取”主干网络和一个“分类”头部，具有明确的模块化过渡以确保信息流动。在主干网络中，嵌入了一个多域交互式特征融合模块（MDIF），将时间-频率表示作为主线，并设置了时间和频率域分支。通过差异加权实现跨域交互，MDIF抑制了冗余相关性，增强了互补敏感性，从而产生了更具区分性的多域特征。在分类器中，一个全方向散射引导的分类器（OSGC）在贝叶斯框架内将方位角作为先验，通过联合学习类别条件概率子网络和方位角概率子网络来明确整合方位角相关的散射信息到最终决策中。为了应对移动目标样本的稀缺问题，采用了静态到移动域的适应策略，其中静态目标构成源域，移动目标构成目标域。特征对齐损失最小化了两个域之间的分布差异，实现了从静态场景到移动场景的知识迁移。总之，所提出的FUSTR-Net充分利用了时间和频率信息的互补性，在整个分类过程中结合了方位角先验，保持了在少样本条件下对移动小型目标识别的鲁棒性能。本研究的主要贡献如下：

(a)

提出了一个用于水下移动小型目标少样本识别的迁移学习框架FUSTR-Net。其创新之处在于集成了多域交互式特征融合、在分类阶段显式注入方位角相关散射先验以及静态到移动域的对齐策略。框架主干网络包含MDIF模块，以获得更具区分性的表示。分类器采用OSGC，使方位角散射差异能够主动影响最终决策。为了解决移动样本稀缺问题，建立了从静态对象到移动对象的特征迁移机制，从而减少了样本分布不一致性引起的偏差。

(b)

为水下小型目标识别任务构建了专门的数据集，涵盖了静态和移动目标。

(c)

在构建的数据集上进行的广泛实验证明了所提出的FUSTR-Net的有效性。

小型目标的物理特性分析

本节分析了小型目标的物理特性。目标类型之间的差异主要源于尺寸、材料和测试条件的不同。本研究重点关注了四种代表性水下小型目标：UUV、潜水推进器（DPV）、潜水员和标准半球形鼻圆柱体。目标的尺寸和材料参数在表1中进行了总结。这四种目标在规模上具有可比性。

方法论

本节介绍了所提出的FUSTR-Net，这是一种基于迁移学习的架构，如图3所示。FUSTR-Net包括三个子模块：多域特征提取、全方向散射引导的分类器和特征迁移。在移动目标识别的迁移学习设置中，静态目标样本作为源域，移动目标样本作为目标域。模型以目标的时间域信号作为输入进行训练

实验

所有计算实验都在配备有Intel i7-12700 CPU、NVIDIA RTX 2080Ti GPU和32 GB RAM的个人计算机上进行。网络训练、验证和测试在Python环境中使用PyTorch深度学习框架和CUDA 11.8进行加速。优化器使用AdamW，批量大小为32。初始学习率设置为0.0001，如果连续20个周期内准确率没有提高，则减半。识别

结论

本文提出了一种新颖的FUSTR-Net架构，用于在主动声学条件下进行高效的水下移动小型目标识别。该方法强调有效利用多域物理特征、整合散射线索以及易于获取的静态数据，以增强样本有限的移动目标的识别能力。具体而言，MDIF模块在特征提取过程中实现了多域特征的深度交互融合，从而增强了

CRediT作者贡献声明

严武：撰写——原始草案、方法论、研究、形式分析。杨阳：撰写——审阅与编辑、验证、监督、资金获取。范俊：概念化。王斌：项目管理。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本工作得到了中国声学科学技术实验室稳定支持基金（项目编号JCKYS2024604 SSJS005）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

相关工作

相关研究

小型目标的物理特性分析

方法论

实验

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行