结合知识图谱和深度学习方法对船舶违法行为进行分类

《Regional Studies in Marine Science》:Incorporating knowledge graph and deep learning method for the classification of ship offense activities

【字体: 时间:2026年01月19日 来源:Regional Studies in Marine Science 2.4

编辑推荐:

  船舶违法行为分类中,传统方法因无法捕捉复杂特征而效果受限。本研究提出Enhanced KG+GCN模型,通过知识图谱整合语义相似实体并融合TF-IDF特征,构建标准化特征,结合半监督GCN实现五类违法行为的精准分类,实验F1值达0.95,显著优于传统方法。

  
余洪楚|韩彦欣|徐磊|魏天明|张学全
武汉理工大学航海学院,中国武汉430063

摘要

船舶违法行为不仅危及海洋资源和生态系统,还对多机构之间的联合执法构成了严峻挑战。识别和分类船舶违法行为对于执法机构迅速响应至关重要。由于对船舶违法行为描述的不规范,传统的方法(如支持向量机(SVM)、图卷积网络(GCN)和随机森林(RF)无法捕捉到复杂特征。为了解决这一难题,提出了一种基于知识图谱的特征增强图卷积网络(Enhanced KG+GCN),用于精确分类船舶违法行为。该方法将语义上相近但表述不同的知识图谱实体整合为统一的表示形式,并将其与TF-IDF提取的核心领域特征对齐,从而生成标准化、无冗余的特征,更适用于后续的分类。首先对来自最高人民法院和中国海事安全管理局的判决文件和官方公告进行标准化处理,用于构建船舶违法行为事件的知识图谱。然后利用领域知识和相关法规提取具有区分性的实体和属性,并通过分层融合策略进行组织。通过融合的实体和属性丰富了船舶违法行为的语义表示。最后,应用半监督GCN对船舶违法行为进行分类,利用了特征增强的知识图谱。实验结果表明,该方法在五种违法行为类别(非法捕鱼、采砂、倾倒、污染排放、走私)上的F1分数达到0.95,平均精度为0.97,优于传统方法。

引言

随着中国对海洋资源开发利用的加剧,管理海洋空间和保护海洋环境变得越来越具有挑战性(Yu等人,2025年)。宁波两级检察机关的数据表明,在“十三五”计划(2016-2020年)期间,海洋违法行为显著增加(https://www.spp.gov.cn/spp/llyj/202201/t20220104_540745.shtml),案件数量增长了2.77倍(年均增长69.2%)。被判非法捕鱼的案件共涉及1,099吨海鲜,其中30起案件超过1吨(最大240吨)。海上走私案件规模庞大且持续存在,共计1,662起走私航次(平均每起案件11.3次航次,每次航次约470吨)。47起走私案件持续时间超过六个月(32%),62起案件涉及的税款超过250万元人民币(42%)。仅走私案件的数量在2016年至2020年间就增加了6.8倍。虽然这些数据是区域性的,但它们反映了船舶违法行为带来的日益沉重的执法负担。
船舶违法行为的增加对海洋生态环境构成了严重威胁,并影响了海洋经济的健康发展。因此,迫切需要一个高效准确的系统来自动识别和分类此类违法行为,以支持海洋治理。细粒度的分类框架可以促进海岸警卫队、海事安全管理局和海关之间的及时协调和执法决策。
船舶违法行为可以分为三类:(1)针对海洋环境资源的违法行为(例如非法捕鱼、非法采砂、非法倾倒废物);(2)违反货物和人员流动边境控制规定的违法行为(例如海上走私、人口贩卖);(3)威胁航行安全及船上人员和财产安全的违法行为(例如海上交通事故)。其中,非法捕鱼、非法采砂、非法倾倒废物、非法排放污水和海上走私这五种类型的违法行为最为常见,对环境或经济造成的危害最大。因此,本研究考虑了这五种违法行为的复杂特征,并提出了一种分类方法,以促进有效的监管和治理。
目前,船舶违法行为分析有丰富的数据资源支持,包括自动识别系统(AIS)数据、合成孔径雷达(SAR)数据、视频监控数据和官方报告(Iitembu等人,2023年)。AIS数据能够自动提取异常船舶行为(Kontopoulos等人,2020年;Renso等人,2021年;Shu等人,2024年;Yu等人,2025a年;Yu等人,2025c年;Zaman等人,2024年)并追踪船舶污染(Liu等人,2021年;Shu等人,2023年;Yu等人,2024年)。合成孔径雷达(SAR)可用于监测捕鱼活动并识别可疑行为(Bakirci,2025年;Galdelli等人,2021年)。视频监控数据结合AIS可实现对内河船舶交通的高精度监测和跟踪(Ding & Weng,2024年;Guo等人,2023年)。然而,与船舶相关的违法行为经常涉及关闭AIS系统和夜间操作。由于SAR图像的获取频率相对较低,难以区分具体的非法行为。视频监控涉及复杂的数据处理以进行对象识别。此外,由于船舶违法行为特征多样且相互关系复杂,仅基于法律法规或行为特征的传统分类方法难以有效捕捉其动态模式(Bueger和Edmunds,2020年)。
因此,本文提出了Enhanced KG+GCN模型用于船舶违法行为分类。该模型在现有KG+GCN框架的基础上进行了创新,其创新点在于采用了一种特征增强策略,利用规则和语义相似性来优化知识图谱构建的特征表示。同时使用知识图谱(KG)和图卷积网络(GCN),因为这两种模型在船舶违法行为分类中具有互补性。KG通过建模实体和关系提供了结构化的知识表示,即使在特征稀疏的情况下也能提供有意义的语义线索,从而增强了特征的语义表达能力。GCN利用KG提供的拓扑结构进行半监督学习,有效聚合了邻域信息,提高了分类准确性。此外,该模型还减少了KG规模对GCN效率的影响,进一步提升了所提模型的实际应用效果。该模型减少了过拟合现象和计算资源需求,显著提高了识别准确性,为海事当局、海岸警卫队和海关的联合执法和管理提供了可行的技术支持。
本文的其余部分安排如下:第2节回顾了船舶违法行为分类的现有文献,并分析了知识图谱和图卷积网络(GCN)的能力;第3节详细描述了研究方法,包括基于知识的数据标准化、特征提取和增强以及GCN驱动的分类模型;第4节展示了实验结果并进行了深入分析;第5节总结了主要结论和局限性,并指出了未来研究的方向。

文献综述

中国的船舶违法行为多种多样且复杂,包括非法捕鱼、采砂、废物倾倒、污水排放和走私,这些行为都威胁着沿海资源和生态系统。例如,邻国船只的跨境入侵加剧了非法捕鱼行为,耗尽了海洋资源,并使执法工作变得复杂化(Belhabib和Le Billon,2022年;Yu等人,2025b年)。非法废物(如建筑废料和危险物质)的倾倒会

方法

本研究提出了一种基于GCN和KG的半监督方法来分类船舶违法行为,如图1所示。Enhanced KG+GCN采用了一种特征增强策略,利用规则和语义相似性来优化效率和适用性。关键部分包括知识图谱构建和规范化、具有分层映射的特征分析、GCN架构设计以及分类实验的实施和验证。

研究数据

实验数据集涵盖了五种类型的船舶违法行为,数据来自政府网站,如中国裁判网(CJO)。非法捕鱼、非法采砂、非法倾倒废物、非法排放污水和海上走私的数据根据国家法律法规的定义、证据和处罚条款进行了预处理。数据包括违法行为者、行为细节、设备类型和地点等信息。

结论与未来工作

本文提出了一种基于知识图谱和特征增强的GCN的分类方法,用于海洋违法行为事件。该方法通过构建统一的知识图谱,提高了语义和特征提取能力。同时,利用分层映射策略结合语义相似性来优化特征表达,从而在信息稀疏和非法事件文本较短的情况下有效增强了细粒度的语义理解。研究结果

未引用的参考文献

(Fan等人,2023年;Galal等人,2024年;Galal等人,2024年;Garrido-Merchan等人,2023年;Kipf和Welling,2016年;中华人民共和国最高人民检察院,2022年;Xu等人,2023年;Yu等人,2024年)

CRediT作者贡献声明

余洪楚:撰写 – 审稿与编辑,撰写 – 原稿,资源,方法论,概念化。韩彦欣:撰写 – 原稿,方法论。徐磊:撰写 – 审稿与编辑,方法论。魏天明:撰写 – 审稿与编辑,资源。张学全:撰写 – 审稿与编辑,方法论。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

作者感谢匿名审稿人和编辑提出的建设性意见,这些意见有助于改进和澄清手稿。本研究得到了国家自然科学基金(编号42371415、42101429和42201509)和中国国家重点研发计划(编号2022YFC3302703)的支持。

利益冲突声明

作者声明他们没有已知的可能会影响
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号