《Biomedical Signal Processing and Control》:Entropy-guided semi-supervised framework for robust chest X-ray segmentation using dynamic competition and patch-wise contrastive learning
编辑推荐:
CXR图像分割中半监督学习面临伪标签噪声与不确定性传播问题,本文提出熵引导的动态竞争与对比学习框架,通过自适应网络竞争提升伪标签可靠性,结合像素级熵引导修正和区域对比学习增强特征区分,在公开数据集上肺/心区域Dice系数达0.963/0.915,较现有方法提升3-7%,边界定位精度显著提高。
Mohammad Mahdi Ershadi | Zeinab Rahimi Rise | Seyed Taghi Akhavan Niaki
伊朗德黑兰Amirkabir技术大学工业工程与管理系统系
摘要
背景
胸部X光(CXR)图像的准确分割是生物医学图像分析中的一个基本而具有挑战性的任务,这主要是由于对比度低、解剖结构重叠以及病理表现微妙所致。尽管半监督学习(SSL)作为一种减少对注释依赖的解决方案已经出现,但其性能往往受到不可靠的伪标签和不确定性传播的限制。
方法
为了解决这些挑战,本研究提出了一种基于熵的半监督分割框架,该框架结合了动态竞争和块级对比学习来提高监督的可靠性和特征区分能力。该框架包含三个协同工作的组成部分:动态竞争机制(DCM),该机制利用熵感知的Dice评估自适应地识别更可靠的子网络用于伪标签生成;像素级熵引导的标签细化(PELR)策略,通过选择性纠正高不确定性预测来减轻噪声监督;以及熵引导的块级对比学习(E-PCL)模块,该模块通过对齐语义一致的区域同时分离不确定特征来提高表示的鲁棒性。
结果
所提出的方法在公开可用的CXR数据集上进行了评估,在有限的注释设置下,肺部区域分割的Dice系数达到了0.963,心脏区域分割的Dice系数达到了0.915,比现有的半监督方法高出3-7%。值得注意的是,该框架在解剖结构模糊的区域(如肺尖和心肺界面)中表现出更好的边界划分能力。
与其他方法的比较:与现有的半监督框架相比,我们的模型在有限的标注数据下表现出更优越的性能,在模糊区域具有更高的稳定性,同时保持了计算效率。
结论
所提出的基于熵的竞争性和对比框架有效地传播了可靠的监督信息,减轻了噪声伪标签的影响,并增强了特征学习的区分能力。这种方法为半监督CXR分割提供了一种鲁棒的解决方案,具有更高的准确性和结构保真度,适用于临床应用。
引言
医学图像分割是计算机辅助诊断和治疗计划的一个基本组成部分,因为它能够精确地划分解剖结构和病理区域。近年来,完全监督的深度学习方法,特别是基于卷积神经网络(CNN)的架构,在各种医学分割任务中展示了令人印象深刻的性能(Aruta等人,2025年;Cui等人,2023年)[1],[5]。尽管取得了这些成功,但这些方法严重依赖于大规模、高质量的标注数据集,而这些数据集的获取既费时又需要专门的临床专业知识。因此,标注医学图像的有限可用性仍然是监督分割模型广泛部署的主要障碍(H?m?l?inen等人,2023年;Ma等人,2023年)[12],[21]。
为了减轻手动标注的负担,半监督学习(SSL)作为一种有效的方法应运而生,它利用少量的标注样本和大量的未标注数据。在SSL技术中,伪标记已被广泛研究,并通过为未标注图像分配人工标签并迭代细化模型预测显示出显著的效果(Sun等人,2024年;Wang等人,2024年)[24],[27]。同时,一致性正则化和对比学习也被引入来通过增强预测的稳定性并在潜在空间中学习区分性特征表示来提高模型的鲁棒性(Ekong等人,2025年;Xiao等人,2024年)[6],[31]。这些策略共同推动了半监督医学图像分割的发展。
然而,现有的SSL方法仍然面临几个未解决的挑战。伪标记方法特别容易受到噪声预测的影响,这往往会传播错误并降低分割性能,尤其是在解剖边界附近。此外,许多SSL框架对超参数的选择敏感,并且在跨成像模态的泛化能力方面有限。在低注释情况下,准确分割小结构或不经常出现的结构仍然特别困难(Li等人,2025年;Lv等人,2025年)[18],[20]。尽管最近结合了CNN、Transformer和基础分割模型的混合架构在上下文建模和跨域适应性方面表现出改进,但它们通常会引入大量的计算开销和集成复杂性,限制了它们的实际应用性(Ekong等人,2025年;Xu等人,2025年)[6],[35]。
受这些限制的启发,本研究提出了一个统一的半监督分割框架,该框架在单一架构中整合了伪标记、一致性强制和对比学习。所提出的方法采用了一个混合CNN-Transformer框架,并增加了受Segment Anything Model(SAM)启发的解码器,以共同捕获局部纹理信息、全局上下文依赖性和结构掩码先验。通过利用互补的学习策略和熵感知的监督机制,该框架旨在提高伪标签的可靠性,增强特征区分能力,并在有限的注释设置下实现稳健的分割性能,特别关注胸部X光成像(输入CXR → CNN编码器 → Transformer编码器 → SAM风格解码器 → 特征融合 → 分割头)。
本文的其余部分组织如下。第2节回顾了半监督医学图像分割的相关工作,重点介绍了伪标记、一致性正则化和对比学习技术。第3节详细描述了所提出的框架,包括网络架构和基于熵的学习机制。第4节介绍了实验设置和定量结果,并与最先进的方法进行了比较。第5节报告了分析关键组件贡献的消融研究。最后,第6节总结了本文并讨论了所提出方法的含义和潜在扩展。
相关工作
相关工作
本节回顾了半监督医学图像分割的最新进展,重点介绍了伪标记策略、一致性正则化和对比学习以及混合网络架构。讨论了关键的方法学趋势,并分析了促使提出基于熵的半监督框架的现有局限性。
方法
本节介绍了一种用于胸部X光的基于熵的半监督分割框架,该框架结合了混合CNN-Transformer-SAM框架、动态网络竞争、像素级熵引导的标签细化和块级对比学习,以确保在有限的注释设置下伪标签的可靠性、特征表示的鲁棒性和稳定的教师-学生优化。
实验
本节对所提出的半监督CXR分割框架进行了全面的实验评估。描述了数据集、预处理、实现细节和比较基准,并分析了性能、统计显著性、最先进技术(SOTA)比较、超参数敏感性、计算开销和训练稳定性。结果表明,在各种胸部数据集上实现了稳健、准确且保持边界的分割。
消融研究
为了系统地评估EGCF框架中每个组件的单独贡献,我们进行了广泛的消融研究。该分析检查了主要模块和损失函数在所有四个数据集的不同标注数据比例(10%、15%和20%)下对分割性能的影响。研究强调了每个组件如何促进未标注数据的有效利用,从而实现稳健和准确的分割结果。
结论
本研究提出了一种新颖的胸部X光分割半监督框架,该框架协同结合了竞争学习、像素级熵引导的标签细化(PELR)和熵引导的块级对比学习(EGPCL)。在多个基准数据集上的广泛评估表明,所提出的方法在完全标记和部分标记的情况下始终优于基线模型。当使用20%的标记数据时,集成框架实现了
CRediT作者贡献声明
Mohammad Mahdi Ershadi:写作 - 审稿与编辑、可视化、软件、方法论、数据管理、概念化。Zeinab Rahimi Rise:写作 - 原始草稿、验证、资源收集、调查、形式分析、数据管理。Seyed Taghi Akhavan Niaki:写作 - 审稿与编辑、监督、项目管理。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。