全切片扫描仪组织检测算法的比较分析：对高通量数字病理工作流程中扫描区域、扫描时间及文件大小的影响

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Pathology Informatics》：Comparative analysis of whole-slide scanner tissue detection algorithms: Implications for scan area, scan time, and file size in high-volume digital pathology workflows

【字体：大中小】 时间：2026年05月22日 来源：Journal of Pathology Informatics CS6.3

编辑推荐：

　　背景：全切片成像（Whole-Slide Imaging, WSI）系统的组织检测算法存在差异，会改变扫描区域、扫描时间及文件大小，在高通量实验室中，这些差异会对工作流程和成本产生实质影响。数字病理工作流程需要对玻璃切片进行高分辨率数字化，这可通过专用WSI系

背景：全切片成像（Whole-Slide Imaging, WSI）系统的组织检测算法存在差异，会改变扫描区域、扫描时间及文件大小，在高通量实验室中，这些差异会对工作流程和成本产生实质影响。数字病理工作流程需要对玻璃切片进行高分辨率数字化，这可通过专用WSI系统实现。不同全切片扫描仪在技术特征上存在差异，会影响放大倍率、通量、图像质量及最终的文件格式与大小。扫描区域的差异会深刻影响运营效率，而扫描区域由扫描仪特定的组织检测算法决定，直接影响扫描时间，进而影响工作流程与人员规划，同时文件大小也是存储与数据管理的主要成本来源。本研究比较四种商用全切片扫描仪模型的组织检测模式，评估其对上述指标的影响，采用经典计算机视觉方法建立基于周长的基准。设计：选取260张常规诊断玻璃切片（平衡苏木精-伊红染色与免疫组化切片类型，以及活检/切除组织类型），在代表4种不同商用制造商的8台全切片扫描仪（ designated 扫描仪模型A–D）上进行扫描。采用经典计算机视觉流程勾画每张切片的最小组织周长，作为参考区域。从WSI元数据中提取扫描仪扫描区域、扫描时间及文件大小，计算绝对与相对面积差异，并通过线性回归量化面积与下游指标的关系。采用单因素方差分析（One-way ANOVA）检验不同扫描仪模型间的差异，并按切片类型和组织类型分层。结果：260张切片均成功扫描，共获得1040张WSI。扫描仪模型A和B适度高估组织面积，中位高估76 mm2（范围0–481 mm2）；模型D低估组织面积，中位低估196 mm2（范围61–584 mm2）。扫描时间随扫描面积线性增加（模型A–C的斜率为0.08–0.13 s·mm?2；模型D为0.75 s·mm?2）。文件大小随扫描面积缩放（模型A和B为1.05–1.59 MB·mm?2；模型C和D为3.51–3.86 MB·mm?2）。分层单因素方差分析证实所有分层中各模型间差异均显著（p < 0.001）。结论：不同扫描仪模型的组织检测算法存在显著差异，影响扫描区域估计及下游性能。尽管扫描区域检测并非通量的唯一决定因素，但其是影响时间与存储成本的基础参数。在高通量数字病理环境中，了解这些算法差异对制定合理的扫描仪选择建议和工作流程优化至关重要。

该研究发表于《Journal of Pathology Informatics》，针对数字病理转型中全切片成像（Whole-Slide Imaging, WSI）系统组织检测算法异质性带来的运营效率问题展开。当前，医疗机构从传统显微镜转向数字优先工作流程时，扫描仪选择、基础设施设计与数据管理的决策会对长期运营效率产生深远影响。然而，商用WSI设备在扫描策略、机械工程、光学设计与文件格式上存在显著差异，导致扫描区域、采集时间与图像大小的下游指标变异度极高。厂商通常基于15×15 mm的理论组织区域宣传通量与速度，无法反映真实世界病理切片的复杂性，且非扫描时间（如操作员操作时间）未被纳入考量。此外，扫描仪元数据因专有文件结构与非标准化报告格式难以跨平台获取，使得机构难以精准规划资源、预测存储需求与网络负载。这种异质性在高通量环境中会被快速放大，直接影响人员配置、网络容量与存储需求，因此亟需客观评估不同扫描仪组织检测算法的实际影响。

研究人员开展了跨设备回顾性比较研究，关键技术方法如下：研究纳入260张常规诊断玻璃切片（涵盖187张苏木精-伊红染色切片、73张免疫组化切片，以及114张活检标本、146张切除标本），在代表4家制造商的8台扫描仪（模型A–D）上完成扫描。采用经典计算机视觉流程构建最小组织周长基准作为参考，通过OpenSlide Python库提取扫描仪报告的扫描区域、扫描时间与文件大小元数据，采用线性回归与单因素方差分析（One-way ANOVA）量化指标关联与组间差异，并按染色类型与标本类型分层验证一致性。

研究结果部分的主要发现如下：

1.
扫描仪报告的扫描区域跨模型差异显著：模型A–C的组织扫描区域较经典计算机视觉（Classical Computer Vision, CCV）基准平均高估0–50 mm²，模型D则平均低估50–250 mm²。分层分析显示，该差异模式在活检与切除标本、苏木精-伊红与免疫组化切片中保持一致，无组织类型或染色类型特异性偏倚，单因素方差分析证实所有分层中模型间差异均显著（p < 0.001）。
2.
扫描区域对数字文件大小的影响：文件大小与扫描区域呈强正相关。模型A–C的单位面积文件大小缩放率为1.5–2.2 MB/mm²，模型D达3.4 MB/mm²。相关性强度从模型A（R²=0.43）逐步提升至模型D（R²=0.80），表明单位面积文件越大的模型，其文件大小缩放行为越可预测。
3.
扫描区域对扫描时间的影响：扫描时间随扫描区域线性增加，但斜率差异显著。模型A–C的斜率较低（0.001–0.002 min·mm^?2），单位面积扫描时间惩罚较小；模型D的斜率高达0.013 min·mm^?2，且线性相关性最强（R²=0.97），表明其扫描时间与面积耦合最紧密；模型C的相关性最弱（R²=0.09），提示除面积外还有其他算法或机械因素影响扫描时长。
4.
综合模型比较：模型A–C形成聚类，表现为适度高估组织面积、单位面积扫描时间与文件大小适中且稳定；模型D形成独立聚类，表现为显著低估扫描区域，但单位面积扫描时间与文件大小最高，且两项指标对面积的依赖性最强。

讨论与结论部分指出，组织检测算法的系统性偏差会通过其与扫描时间、存储占用的线性关系被放大，产生可预测的下游工作流程差异。例如，模型A–C每50 mm²的面积高估仅增加单张切片3–6秒扫描时间，但每日2000张切片的累积效应会导致100–200分钟的额外扫描仪占用，延误标签、质控与报告等下游流程；模型D每200 mm²的面积低估则会增加单张切片2.6分钟扫描时间，每日2000张切片将额外消耗近87小时扫描时间，同时单张切片存储需求增加约680 MB。这些差异不仅影响运营效率，还可能引入多中心研究的站点级混杂因素，降低深度学习算法的跨中心泛化能力。研究强调，实验室在选择WSI系统时，应结合真实切片评估组织检测算法的实际表现，而非仅依赖厂商宣传的理论通量。未来需进一步扩展扫描仪模型的基准测试、整合诊断准确性研究与成本效益分析，并推动建立标准化的 vendor-agnostic 组织检测参数元数据 schema，以提升数字病理采购的透明度与跨平台可比性。

联系信箱：

粤ICP备09063491号

热点排行