一种用于血液恶性肿瘤骨髓核型图自动细胞遗传学分析的集成AI流程:基于Pix2Pix增强与深度学习检测的方法

《Journal of Pathology Informatics》:An integrated AI pipeline for automated cytogenetic analysis of bone marrow karyograms in hematological malignancies: A Pix2Pix enhancement and deep learning detection approach

【字体: 时间:2026年05月22日 来源:Journal of Pathology Informatics CS6.3

编辑推荐:

  本研究开发并评估了一种面向临床的AI辅助细胞遗传学分析流程,该流程整合了图像增强、染色体检测、数值与靶向结构异常评估以及标准化报告生成。研究人员采用基于Pix2Pix的条件生成对抗网络(cGAN)进行图像质量增强,继而使用YOLOv8检测器进行染色体定位,并采

  
本研究开发并评估了一种面向临床的AI辅助细胞遗传学分析流程,该流程整合了图像增强、染色体检测、数值与靶向结构异常评估以及标准化报告生成。研究人员采用基于Pix2Pix的条件生成对抗网络(cGAN)进行图像质量增强,继而使用YOLOv8检测器进行染色体定位,并采用Siamese ResNet-18架构进行结构分类。输出结果转化为符合美国病理学家协会(CAP)要求的ISCN格式报告。该系统在临床骨髓核型图数据集上进行了回顾性评估,评价指标包括图像级保真度指标、分析性能以及专家监督下的系统级可行性。

图像增强显示出较高的结构保真度(平均SSIM >0.98)。在受控的质量控制流程内,染色体检测实现了稳健的性能,结构分类器对靶向异常t(9;22)表现出较强的区分能力。在病例级别,与专家解读的初步一致率为85.8%,在对临床上可接受的报告差异进行裁决后,一致率提升至92.35%。在预定义的质量控制约束下,实现了CAP对齐的ISCN报告的自动化生成,并强制要求专家验证。

本研究提出了一个以临床为基础的概念验证性AI辅助细胞遗传学决策支持流程,整合了增强、门控分析、异常评估和结构化报告。虽然系统级性能令人鼓舞,但该框架旨在作为决策支持工具,仍处于可控可行性评估阶段。在临床应用之前,还需要进一步的前瞻性验证、扩大的结构覆盖范围以及部署级治理。
研究背景与问题

细胞遗传学分析在血液恶性肿瘤的诊断、预后分层和治疗决策中占据核心地位。染色体数目异常(增减)和复发性结构重排在髓系和淋巴系肿瘤的疾病分类与风险评估中发挥关键作用。尽管分子技术不断进步,核型分析仍是检测平衡重排、复杂核型及克隆演变的不可替代手段。然而,常规细胞遗传学工作流存在劳动密集、耗时长、依赖专家解读等固有缺陷,导致显著的观察者间差异和延长的周转时间(TAT)。标准流程需要高质量的染色体中期分裂相制备、手工染色体识别以及基于《国际人类细胞基因组学命名系统》(ISCN)的准确解读,这些均需深厚的专业积累。近年来,人工智能(AI)和深度学习技术在医学图像任务中展现出巨大潜力,但在细胞遗传学领域,现有研究多聚焦于孤立任务、依赖精选数据集,或缺乏与临床实际工作流的整合,限制了其转化应用价值。此外,图像质量是自动化细胞遗传学分析性能的关键决定因素,而生成模型(如Pix2Pix条件生成对抗网络)在医学图像增强中的应用为改善对比度和结构清晰度提供了可能。

研究设计与方法

基于上述背景,研究人员开展了此项回顾性研究,旨在构建一个临床导向的模块化、端到端AI决策支持流程。研究使用了来自CAP认证临床细胞遗传学实验室的存档数据,队列包含183例病例、共3190张核型图。所有数据经过去标识化处理,并严格按患者水平进行数据划分以防止数据泄漏。

该AI流程架构分为两个主要阶段:图像增强阶段(Phase 1)和核型图分析阶段(Phase 2)。Phase 1采用Pix2Pix条件生成对抗网络进行图像增强,该网络以U-Net为生成器、PatchGAN为判别器,通过3000轮训练,使用包含对抗损失、L1损失和结构相似性保持的复合损失函数,旨在稳定对比度并改善G带显带清晰度,同时保留染色体形态。增强性能通过峰值信噪比(PSNR)和结构相似性指数(SSIM)等指标定量评估。

Phase 2包含四个互联模块:(1)模块1为染色体检测、分类与计数,采用YOLOv8物体检测器进行染色体实例定位,并进行可分析性筛查——将存在严重技术限制(如广泛染色体重叠、断裂、截断或显带不足)的核型图标记为不可分析并转交专家评估;同时,两个独立训练的YOLOv8模型通过基于共识的枚举策略实现染色体计数和性别核型推断。(2)模块2为结构异常分类,采用带有挤压激励(SE)模块的Siamese ResNet-18架构,针对慢性髓系白血病的标志性格异常t(9;22)进行靶向检测,训练数据为532张核型图(266例正常,266例异常),输入为成对的9号和22号染色体图像。(3)模块3为病例级诊断,通过规则指导的多模态融合层整合前面模块的输出,并输入确定性专家系统以构建符合ISCN规则的诊断核型字符串。(4)模块4为ISCN指导的报告生成,将输出汇总并应用确定性ISCN规则,生成符合CAP报告标准的临床可读细胞遗传学报告。报告元素明确分为三类:基于规则的组成部分、模型衍生的输出结果(需专家验证),以及强制要求专家完成的字段(包括临床解读和最终报告验证签出)。系统预设质量控制标准,包括每例至少需有5张可分析核型图等;未达标准者将被阻止自动生成报告并标记供人员复核。

图像质量评估与增强结果

研究人员首先使用三种无参考图像质量评估(NR-IQA)指标——自然图像质量评价器(NIQE)、基于感知的图像质量评价器(PIQE)和盲/无参考图像空间质量评价器(BRISQUE)对基线图像质量进行评估。Pix2Pix增强模型在全数据集(N=3190张核型图)上表现出色:平均SSIM超过0.98,PSNR为35.07±1.45 dB,平均绝对误差(MAE)为1.78±0.17,均方误差(MSE)为23.48±7.90,表明增强后染色体形态得以保留。病例级分析显示平均PSNR为35.11 dB,平均SSIM为0.9823,证实跨病例增强质量稳定。定性视觉评估显示对比度和G带清晰度改善,未观察到明显的增强伪影(如带漂移、光晕效应或结构扭曲)。值得注意的是,NR-IQA指标在增强后呈上升趋势,这与生成对抗网络强调边缘锐化和对比度归一化有关,但并不伴随细胞遗传学可解读性的降低。

染色体检测与分析系统性能

在增强后的图像上,集成流程执行染色体定位、总览性可分析性筛查以及数值和靶向结构评估。自动总览性核型图质量分类的AUC为0.82,在操作阈值(召回率=0.75,假阳性率=0.15)下,系统保守地将技术上受限的核型图标记并转交专家评估,防止低质量输入进入下游分析。对于结构异常检测,Siamese ResNet-18分类器在独立评估队列(N=183例)中对t(9;22)的检测达到AUROC=0.88(95% CI: 0.82-0.94),准确率=92%,F1=0.85,精确率-召回率曲线下面积(PR-AUC)=0.84;Brier分数为0.218,表明预测概率与观察结果之间存在适度一致性,但距离临床决策所需的置信度估计仍有待完善。

临床病例研究展示了端到端的系统性能:复杂异常病例中数值异常和t(9;22)可被正确识别并以ISCN合规术语报告;正常核型(46,XY)可实现可靠的真阴性分类;边界病例则显示因显带质量不佳导致结构异常漏检,突显上游图像质量和分割局限性对下游结构分类的影响,强化了该平台作为临床决策支持工具需与专家复核联用的定位。

临床报告工作流与决策支持整合

最终模块将所有前期分析阶段的输出整合于决策支持平台中,以辅助生成临床对齐的细胞遗传学报告。报告字段按来源明确标注为"基于规则""模型衍生"或"专家完成",确保透明度和适当的临床解读。自动化质量控制检查确保仅在满足最低可分析性标准时才生成报告;未达标病例将被阻止自动报告并转交专家评估。额外保障措施包括ISCN字段完整性自动标记、不一致发现(包括性染色体分配差异)的强制验证。最终解读、验证和报告授权仍由认证细胞遗传学人员负责,系统不允许未经人工验证的全自动报告发布。报告以CAP对齐的PDF格式生成,适用于实验室信息系统(LIS)整合。

AI辅助解读与专家复核的临床一致性

在评估队列(N=183例)中,AI辅助病例级解读与最终专家细胞遗传学诊断的一致性分析显示:原始一致率(完全匹配)为85.8%(157/183),26例(14.2%)存在分歧需进一步复核。对分歧病例的结构化错误分析揭示,大多数分歧并非真正的分析失败,而是克隆优先级排序、报告侧重点及图像质量限制导致的差异。真实算法错误仅占少数(3.83%,7/183),包括数值(n=3)和结构(n=4)误分类;质量受限病例(n=2, 1.09%)与严重图像质量问题相关且被适当地标记为不可分析;克隆排序差异(n=12, 6.56%)反映优先级或报告顺序的变异而非未能检测临床相关异常;基准真值差异(n=3, 1.64%)代表AI输出与初始手工报告之间的差异。经对临床上可接受的报告差异进行裁决后,一致率提升至92.35%(169/183)。该次要分析提供额外解读背景,但不替代原始一致率作为主要性能终点。

临床可行性与决策支持影响

为提供AI辅助细胞遗传学决策支持潜在临床价值的背景,研究人员在数据收集期间进行了常规手动细胞遗传学工作流基线TAT的回顾性实验室流程审查。在可分析病例(n=202)中,从样本接受到最终细胞遗传学报告的总TAT中位数为30.5天(IQR: 23-44天),第90百分位数为72.3天,显著超过CAP推荐的14天报告时限。该分析为当前工作流提供操作背景而非AI辅助改进的直接测量,凸显了常规细胞遗传学工作流的固有限制,为AI辅助优化策略的潜在评估建立了基线。

研究结论

本研究证明了以临床为基础的概念验证性AI辅助细胞遗传学决策支持系统的可行性,强调整合、安全性和可解读性而非独立诊断性能。通过整合图像增强、门控分析、结构化ISCN报告和专家参与的工作流,所提出的框架为AI在常规细胞遗传学实践中的采用勾勒了一条务实且负责任的途径。这些发现共同支持了持续开发和前瞻性验证临床可部署系统的基础,这些系统将在保留专家判断的同时支持诊断一致性和工作流效率。尽管该系统展示了令人鼓舞的系统级性能,但仍处于可控的概念验证评估阶段,尚未准备好临床部署。更广泛的结构覆盖范围和前瞻性验证将是临床应用前的必要步骤。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号