基于深度学习和影像组学的多任务框架在孕早期超声中对胎儿解剖结构的检测与分类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：A multi-task deep learning and radiomics framework for fetal anatomical structure detection and classification in ultrasound imaging

【字体：大中小】 时间：2026年03月03日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究致力于解决孕早期超声筛查中胎儿解剖结构评估主观、耗时的难题。研究人员开发了一个整合YOLOv11/Swin Transformer定位模型与TabTransformer分类器的多任务管道，利用来自9个中心的4532例超声扫描，融合影像组学特征与深度特征。结果显示，该框架在外部测试集上达到了96.1%的分类准确率和96.89%的AUC，其高重复性和泛化能力为胎儿异常的早期、客观筛查提供了有力工具。

孕早期的超声检查是胎儿发育筛查的第一道重要关口，医生需要通过超声图像观察胎儿大脑、面部等关键解剖结构的发育情况，以期尽早发现潜在的出生缺陷。然而，传统的评估方法很大程度上依赖于超声医师的经验和主观判断，这不仅可能导致诊断结果在不同观察者之间存在差异，也使得大规模筛查工作繁重且难以标准化。如何能够快速、准确、客观地对超声图像中的胎儿结构进行定位和识别，成为提升产前筛查质量与效率、实现早期干预的关键。

为了回答这一临床挑战，来自国内多所医学中心的研究团队在《Scientific Reports》上发表了一项研究。他们开发并验证了一个将深度学习与影像组学（radiomics）深度融合的多任务框架，旨在实现对孕早期超声图像中九种关键胎儿脑与颅面解剖结构的自动检测与精确分类。该研究最大的亮点在于，它不仅利用先进的目标检测模型来“找到”结构，更通过提取并融合影像的定量特征与深度语义特征，来“读懂”并“判断”结构的类别，最终构建了一个端到端的智能化分析管道。这项工作的成功，意味着向自动化、高精度的早期胎儿畸形筛查迈出了坚实的一步。

研究人员采用了几个关键技术方法来实现这一目标。首先，他们构建了一个大规模、多样化的数据集，该数据集回顾性收集了来自九个不同医疗中心的共4532例孕11-14周的胎儿超声扫描，确保了模型的泛化能力。其次，在技术路线上，他们并行训练了两个先进的目标检测模型——YOLOv11和Swin Transformer，专门用于在图像中精确定位九种目标解剖结构。接着，从每个被检测出的区域内，他们系统性地提取了215个定量影像组学特征和1792个源自深度网络的深度特征。为确保特征的稳定与可靠，研究团队进行了严格的筛选，包括计算组内相关系数（Intra-class Correlation Coefficient, ICC，阈值≥0.75）、皮尔逊相关性分析以及LASSO回归。最后，他们将筛选出的稳健特征输入一个专为表格数据设计的基于Transformer的模型（TabTransformer），训练其根据超声表现将解剖结构分类到预定义的临床类别中。模型的性能在训练集、内部验证集和外部测试集上，通过准确率（Accuracy）、受试者工作特征曲线下面积（Area Under the Receiver Operating Characteristic Curve, AUC）和灵敏度（Sensitivity）等指标进行了全面评估。

研究结果

检测模型性能比较：在胎儿解剖结构的定位任务中，基于滑动窗口的Transformer（Swin Transformer）模型表现优于YOLOv11模型。Swin Transformer取得了更高的交并比（Intersection over Union, IoU）值，最高可达0.97，同时其F1分数也≥0.94，显示出卓越的定位精度和召回率。

特征稳定性与可重复性：通过对提取的影像组学特征和深度特征进行严格的ICC分析，研究证实了所选特征在不同中心和不同观察者间具有高度可重复性，稳定性水平保持在75%以上。这为模型在不同医疗机构间的可靠应用奠定了基础。

多模态特征融合的优势：研究比较了仅使用影像组学特征、仅使用深度特征以及两者融合的模型性能。结果显示，融合了影像组学特征和深度特征的模型在检测和分类任务上均一致地超越了任何单一模态的模型。这证明两种特征提供了互补的信息，融合能更全面地描述解剖结构的本质。

分类模型的诊断性能：基于TabTransformer的分类器在外部独立测试集上展现出了强大的诊断能力。其整体分类准确率达到了96.1%，对于关键解剖结构的分类，AUC值最高可达96.89%，灵敏度（Sensitivity）超过95%。这表明该模型不仅能高精度区分不同结构，也对目标结构具有很高的识别能力。

模型的泛化性与鲁棒性：TabTransformer分类器在来自不同中心的外部测试数据上表现稳健，成功验证了该框架良好的泛化能力。模型能够有效利用融合特征空间进行高精度分类，克服了单一中心数据可能带来的偏差。

结论与讨论

本研究成功构建并验证了一个完全集成的、基于深度学习和影像组学的多任务分析框架。该框架能够自动化地完成从孕早期超声图像中检测再到分类关键胎儿解剖结构的全过程。核心结论在于，融合了定量影像组学特征与深度语义特征的模型，其性能显著优于依赖单一信息源的模型；同时，基于Transformer的先进架构（包括Swin Transformer用于检测和TabTransformer用于分类）在此任务中表现出了卓越的效能。

这项研究的重要意义体现在多个层面。在方法论上，它提供了一套可复现、标准化的全流程解决方案，将目标检测、特征工程与分类建模无缝衔接，为医学图像分析领域提供了新的技术范式。在临床上，其高达96.1%的外部验证准确率和强大的泛化能力，表明该工具具备转化为实际临床应用的巨大潜力。它能够辅助超声医生进行快速、客观的评估，减少主观差异，有望提升孕早期胎儿异常筛查的效率和准确性，从而实现更早的发现与干预。此外，研究所采用的多中心大数据策略，有效增强了模型的鲁棒性和普遍适用性，为人工智能在真实世界医疗环境中的部署树立了良好范例。总之，这项工作为实现智能化、精准化的早期产前筛查迈出了关键一步，具有重要的科研价值与广阔的临床前景。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号