基于分形引导的多尺度对比学习方法在超声成像中用于实现稳健的肝脏肿瘤分类
《Engineering Applications of Artificial Intelligence》:Fractal-guided multi-scale contrastive learning for robust liver tumor classification in ultrasound
【字体:
大
中
小
】
时间:2026年05月11日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
张旭平|张清华|张涛|宋格|王鹏
山东第一医学大学第一附属医院及山东省千佛山医院医学超声科,山东医学与健康重点实验室腹部医学成像方向,济南,山东250000,中国
**摘要**
基于超声的肝脏病变分类仍然具有挑战性,因为诊断相关的线索通常是局部的、结构上异质的,并且
张旭平|张清华|张涛|宋格|王鹏
山东第一医学大学第一附属医院及山东省千佛山医院医学超声科,山东医学与健康重点实验室腹部医学成像方向,济南,山东250000,中国
**摘要**
基于超声的肝脏病变分类仍然具有挑战性,因为诊断相关的线索通常是局部的、结构上异质的,并且容易受到斑点噪声、边界模糊性和采集变异性的影响。现有的深度学习方法主要强调全局图像级别的表示,因此可能在建模与病变相关的局部形态方面不够理想。我们提出了一种基于结构约束的多尺度对比学习框架用于肝脏超声分类。在训练过程中,采用语义引导的锚定机制来识别信息丰富的局部区域,在这些区域内,正样本在语义相似性、局部统计一致性和基于分形的结构复杂性的联合约束下被选中。进一步引入了多尺度局部正样本挖掘策略和多正样本监督对比目标,以捕捉不同空间粒度下的病变模式并增强类别区分能力。重要的是,该框架在推理过程中不需要辅助注释,并且可以直接在完整的超声图像上运行。在私有四类肝脏超声数据集和两个公共超声数据集上的实验表明,与代表性的卷积神经网络、Transformer基、自监督和超声特定方法相比,该方法具有持续的改进效果。在私有数据集上,提出的方法达到了97.27%的准确率,并在独立的外部验证队列中保持了91.15%的准确率。消融研究和可解释性分析进一步表明,该方法提高了结构可区分性和对病变的关注度。总体而言,提出的框架为超声成像中鲁棒性的肝脏病变分类提供了一种有效且实际可行的解决方案。
**引言**
肝脏是人体最大的实体器官,受到多种病理状态的影响,从良性病变(如肝囊肿和血管瘤)到恶性肿瘤(包括肝细胞癌(HCC)和转移性腺癌)(Sung等人,2021年)。这些病变类型在病理特征、治疗管理和预后意义方面存在显著差异(Massarweh和El-Serag,2017年)。例如,肝囊肿和血管瘤通常是良性的,通常采用保守治疗,而HCC(原发性肝癌的主要形式)和转移性腺癌通常需要根据分期进行手术、局部区域或系统性治疗(Wang等人,2017年;Lang等人,2005年)。因此,准确区分肝脏病变亚型对于治疗计划和结果优化具有重要意义(Ali等人,2021年;Wan等人,2022年)。
在临床成像方式中,超声(US)因其非侵入性、低成本和实时成像能力而被广泛用作一线工具(Hu等人,2020年)。它 routinely 用于高风险人群的监测,包括肝硬化或慢性乙型肝炎患者,并在资源有限的环境中发挥着重要的早期肝癌筛查作用(Cao等人,2022年)。然而,由于斑点噪声、对比度低、病变边界模糊以及采集条件下的外观变化,肝脏超声的解释仍然具有挑战性。在区分HCC和转移性腺癌等病变时,这些问题尤为明显,因为它们的超声纹理和形态可能有很大重叠(Han等人,2023年;吴X等人,2025年)。在常规临床实践中,不确定的超声结果通常需要补充计算机断层扫描(CT)、磁共振成像(MRI)或活检(Zhang等人,2024年)。然而,CT和MRI受到辐射暴露、对比剂相关风险和可及性等因素的限制,而活检具有侵入性,并不总是适合重复评估(Li等人,2024年)。这些限制激发了开发准确且实用的基于超声的计算机辅助诊断模型的需求,用于肝脏病变分类(Reddy等人,2021年)。
更广泛地说,人工智能已成为医学成像领域的一个强大范式,深度学习在其中发挥着核心作用,因为它能够从复杂和异构的数据中自动学习区分性表示(Song等人,2025年;吴S等人,2025年)。这些进展大大提高了计算机辅助诊断系统在包括病变检测、组织表征、分割和疾病分类等任务中的性能(Zhao等人,2024年;Li等人,2025年;Hao等人,2025年;Zhang等人,2026年)。近年来,深度学习在肝脏超声分析方面取得了显著进展。早期的研究主要集中在肝脏脂肪变性、纤维化和良性与恶性病变的区分上。随着更具表现力的架构和更大数据集的出现,研究逐渐转向更具挑战性的多类肝脏病变亚型识别(Liu等人,2019年;Nakata和Siina,2023年;Xi等人,2021年;Sutthirak等人,2023年)。同时,模型设计从单流卷积神经网络发展到多分支、时间和弱监督框架。典型的例子包括多分支特征融合策略、基于对比增强超声(CEUS)的时空模型以及基于注意力的多实例学习方法,这些方法减少了对密集注释的依赖(Wang等人,2023年;Zhang等人,2023年;Zhou等人,2024年;Kamiyama等人,2024年;Oezsoy等人,2025年)。此外,最近的研究探索了ROI引导的建模、多模态融合和轻量级架构,以提高超声分析的可解释性、效率和鲁棒性(Kim等人,2023年;Marques等人,2024年;Wu等人,2024年;Huang等人,2023年)。尽管取得了最近进展,但在超声中可靠的多类肝脏病变识别仍然具有挑战性。一个核心困难是,诊断相关的线索往往是局部的、结构性的和多尺度的。不同的病变类别可能在全局灰度外观上相似,而仅在微妙的局部形态、边界不规则性或内部异质性上有所不同。这一挑战在超声中尤为突出,因为图像纹理受到组织-波相互作用的强烈影响,并且常常伴随着异质的斑点组织和采集敏感的外观变化(Seoni等人,2023年;Shan等人,2021年)。然而,许多现有的深度学习方法仍然主要依赖于全局图像级别的监督,或者采用在全局实例级别定义正样本对的对比策略。例如,SimCLR通过随机增强构建正样本,MoCo通过动量编码表示进行实例级别匹配,NNCLR在全局嵌入空间中检索正样本(Chen等人,2020年;He等人,2020年;Dwibedi等人,2021年)。尽管这些范式对于一般的视觉表示学习有效,但它们并没有明确强制病变相关局部区域之间的结构一致性,因此可能不太适合肝脏超声分类,因为在肝脏超声中,诊断重要的形态通常是局部化的和结构上异质的。
与传统的基于ROI的监督分类器不同,后者通常只优化以病变为中心区域的最终类别预测,对比公式可以明确规范特征空间中局部表示之间的成对关系。这种区别对于肝脏超声非常重要,因为在肝脏超声中,诊断相关的线索往往是微妙的、局部化的,并且分布在多个尺度上。在这种情况下,仅强制类别级别监督可能不足以保持形态相似的局部区域之间的结构一致性。相比之下,对比学习允许将结构相关的局部模式拉得更靠近,同时分离不相似的模式,从而提供了一种更自然的结构感知表示学习机制。因此,在本研究中,采用对比框架的动机不仅仅是为了减少注释需求,而是为了明确建模超出传统监督分类目标通常所要求的病变相关局部结构关系。
为了解决这些限制,我们提出了一种基于病变感知和结构约束的对比学习框架,用于基于超声的肝脏病变分类。重要的是,诊断相关区域的定位仅在训练过程中作为弱监督信号引入,以指导正样本的构建,在推理过程中不需要。训练好的模型可以直接在完整的超声图像上运行,无需依赖任何辅助注释,确保在实际临床场景中的实用性。
为了进一步建模与病变相关的结构复杂性,我们引入了基于分形的特征描述来补充传统的局部统计线索。与常用的纹理描述符(如灰度共生矩阵(GLCM)、局部二值模式(LBP)和小波基特征)不同,后者主要描述灰度共生统计、局部编码模式或多分辨率频率响应(Haralick等人,2007年;Ojala等人,2002年;Mallat,2002年;Laine和Fan,2002年),分形描述符提供了多尺度结构复杂性和几何不规则性的更直接测量(Al-Kadi等人,2015年;Verhoeven和Thijssen,1993年)。这种区别对于肝脏超声尤其相关,因为病变外观往往受到异质斑点组织、边界不清晰以及不同空间尺度上的微观结构变化的影响(Seoni等人,2023年)。先前的研究表明,肿瘤异质性本质上是多尺度的,单分辨率分析可能不足以捕捉微妙的病变内变化,而基于分形的分析特别适合(Al-Kadi等人,2015年)。在我们的框架中,目标不是在一般超声分析中替代传统的纹理描述符,而是在对比对构建过程中识别结构上一致的局部正样本。为此,基于分形的特征描述特别适合,因为它能够基于结构复杂性而不是仅依赖强度统计或局部编码模式来比较局部区域。因此,在这里引入分形描述符作为在病变感知特征空间中过滤候选正样本的结构导向一致性标准。
**本工作的主要贡献总结如下:**
- 我们提出了一种基于病变感知的对比学习框架,用于肝脏超声分类,在训练过程中引入语义引导的锚定机制来关注诊断相关区域,而在推理过程中不需要任何辅助注释。
- 我们引入了一种结构约束的局部正样本挖掘策略,结合了局部统计过滤和基于分形的复杂性建模,使网络能够保持与病变相关的结构一致性并提高区分性表示学习。
- 我们开发了一种多尺度局部对比匹配方案,采用多正样本监督对比优化,共同捕获细粒度和粗粒度的病变形态,并在私有和公共超声数据集上提高了多类肝脏病变的识别能力。
**方法片段**
本研究提出了一个由语义线索指导并受结构一致性约束的多尺度对比学习框架(图1)。该框架首先使用卷积主干提取空间特征图,然后在信息丰富的局部区域内进行以锚点为中心的局部对比建模。正样本在语义相似性、局部统计一致性和基于分形的结构复杂性的联合约束下被选中。
**数据集**
**私有数据集(表1):** 本研究使用的肝脏肿瘤超声数据集是从一家三级A级医院的超声科回顾性收集的,包括1713名患者的临床数据。在数据整理过程中,两位经验丰富的超声专家独立审查了每项检查,并选择了最能反映病变形态和诊断特征的代表性切片。对于每位患者,保留了1-5张二维超声图像。
**讨论**
本研究提出了一种基于结构约束的多尺度对比学习框架,用于基于超声的肝脏病变分类,并在其内部验证、公共跨器官数据集和独立外部测试中展示了其有效性。主要发现是通过结构一致性明确约束局部正样本对,同时在多个空间尺度上联合建模病变特征,从而获得更具区分性和鲁棒性的表示。
**结论**
在本研究中,我们提出了一种基于结构约束的多尺度对比学习框架,用于基于超声的肝脏病变分类。通过结合语义引导的锚定、局部统计过滤、基于分形的结构一致性建模、多尺度局部正样本挖掘和多正样本监督对比优化,所提出的方法能够为超声中结构上异质的肝脏病变实现更具区分性和鲁棒性的表示学习。
**作者贡献声明**
张旭平:撰写——原始草稿、可视化、方法学、资金获取、数据整理。
张清华:撰写——原始草稿、可视化、方法学、资金获取、正式分析。
张涛:撰写——原始草稿、可视化、验证、资金获取、数据整理。
宋格:撰写——原始草稿、可视化、验证、监督。
王鹏:撰写——审阅与编辑、撰写——原始草稿、可视化、验证。
**资助**
本工作得到了齐鲁医科大学医学技术学科开放基金[2025414]、滕州市中心人民医院航海计划基金[202404]和枣庄市科学技术发展计划[2025NS45]的支持。
**利益冲突声明**
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号