在一家学术医学中心，将人工智能模型应用于前列腺癌病理诊断的常规实践中的验证、实施及其影响

《Journal of Pathology Informatics》：Validation, implementation, and impact of an AI model in routine practice for pathologic diagnosis of prostate cancer in an academic medical center

【字体：大中小】 时间：2026年05月11日 来源：Journal of Pathology Informatics CS6.3

编辑推荐：

　　阿格尼斯·I·乌多赫 | 爱德瓦多·埃伊萨吉雷 | 维达尔希·穆图库马拉纳 | 哈什瓦尔德汉·M·塔克尔美国德克萨斯州加尔维斯顿市德克萨斯大学医学分部病理学系 **摘要** **背景** 前列腺针刺活检的病理评估工作量大，通常需要辅助的免疫组化（IHC）检测，

　　阿格尼斯·I·乌多赫 | 爱德瓦多·埃伊萨吉雷 | 维达尔希·穆图库马拉纳 | 哈什瓦尔德汉·M·塔克尔
美国德克萨斯州加尔维斯顿市德克萨斯大学医学分部病理学系

**摘要**
**背景**
前列腺针刺活检的病理评估工作量大，通常需要辅助的免疫组化（IHC）检测，这增加了成本和诊断周转时间（TAT）。基于人工智能（AI）的决策支持工具可能提高效率，但临床应用前需进行机构验证和实际效果评估。

**方法**
在一个完全数字化的病理实践环境中，我们使用常规临床病例对AI辅助的前列腺活检决策支持工具进行了机构验证，以病理学家出具的诊断结果作为真实标准。验证通过后，该工具被纳入常规病理报告中。我们进行了回顾性前后分析，比较了实施前后三个月内的前列腺活检病例（排除过渡期）。诊断周转时间定义为从全切片图像扫描完成到最终报告的间隔时间。记录了IHC的使用情况。通过标准统计方法比较了加权中位周转时间和IHC使用率。

**结果**
验证队列满足所有预定义的接受标准，显示出较高的AI性能（敏感性91–100%，特异性99%，阳性预测值98%，阴性预测值96%，曲线下面积0.97）。临床应用后，诊断周转时间减少了30%，IHC使用率减少了38%。

**结论**
AI辅助的前列腺活检决策支持工具的机构验证和临床应用显著减少了诊断周转时间和IHC使用率。作为数字化工作流程中的辅助工具，AI可以提高效率，同时保留病理学家对最终诊断的责任。

**引言**
前列腺癌是男性中第二常见的恶性肿瘤，也是癌症相关死亡的主要原因之一。2022年，美国有超过33,000名男性死于前列腺癌，预计到2025年这一数字将增加到36,500人。准确及时的组织病理学诊断对于适当的风险分层和治疗计划至关重要。尽管前列腺癌往往发展缓慢，但活检、诊断和治疗之间的延迟很常见，缩短诊断时间有助于更早地做出临床决策并开始治疗。已经开发了几种基于AI的工具来提高手术病理学的诊断准确性和效率，其中许多工具是专门为前列腺癌的诊断和检测而设计的。在病例量不断增加和劳动力短缺的背景下，AI可以通过协助病理学家审查切片来提高效率。AI模型可以系统地分析全切片图像，突出可能细微或容易被忽略的区域，起到“第二双眼睛”的作用，增强诊断信心。早期识别可疑或令人担忧的区域可以减少对确认性免疫组化（IHC）的依赖，特别是在形态学发现最终为良性或明确的情况下，从而节约资源并减少延迟。更短的诊断周转时间可以减轻患者的焦虑，并支持更及时的治疗计划。AI技术的进步还可能使其未来与分子和定量病理数据结合，进一步提高诊断准确性和临床实用性。

我们的病理学部门是数字化病理学的早期采用者，已在2021年9月通过全切片图像（WSI）审核验证了初步诊断，并于2023年7月过渡到完全数字化的工作流程。这一数字化基础设施使得基于AI的前列腺活检决策支持系统的机构验证和实施成为可能，该系统旨在生成全切片图像的恶性概率评估。需要强调的是，即使是经过商业市场推广并具有临床应用监管批准的分类器AI工具，也需要严格的本地验证和细致的工作流程整合，并应作为决策支持系统而非自主诊断工具使用。

在这里，我们描述了该AI辅助前列腺癌检测工具在我们学术医疗中心的本地机构验证、临床应用及其对日常工作流程的即时影响。具体来说，我们报告了：（1）内部验证研究的结果，比较了AI生成的概率评估与病理学家给出的“真实”诊断；（2）将AI工具整合到现有的数字化病理工作流程中；（3）临床应用后AI辅助审查对诊断周转时间和IHC使用率的影响。

**材料与方法**
Ibex Prostate系统的诊断有效性和临床实用性已通过制造商和独立研究者进行的盲法临床验证研究和实际临床应用得到证实。根据FDA CDRH 510(k) K241232（2025年1月24日）的决定摘要，Galen? Second Read?（也称为Ibex Prostate Detect）被批准为仅软件形式的设备，用于协助病理学家分析前列腺活检。因此，本研究重点关注本地机构验证和确认，符合外部验证的AI驱动诊断工具的实验室部署要求。

在临床应用之前，AI辅助的前列腺活检工具（Ibex Prostate，Ibex Medical Analytics）根据我们机构的实验室政策和临床标准进行了机构验证和确认。此次验证的目的是评估AI模型在本地技术环境、工作流程和病例组合中生成恶性概率评估的性能。

大约两个月内由外科病理学服务接收的前列腺针刺活检病例被回顾性地选入验证范围。所有病例均使用Philips Ultra Fast扫描仪数字化，并在Philips图像管理系统中查看。每个病例包含至少250个独立活检样本。每个病例最初由指定的泌尿外科病理学家在没有AI辅助的情况下进行了报告。报告完成后，所有诊断结果由第二位病理学家（本文的资深作者）独立确认，该作者未参与原始诊断的生成。这个诊断结果被指定为“真实”诊断。对于每个活检“部分”（代表活检容器的内容），真实诊断结果被记录并分为“存在癌症”或“不存在癌症”。被分类为非典型或可疑的诊断结果为了验证目的被保守地认定为非癌症。验证病例的WSI通过加密的虚拟专用网络（VPN）隧道安全传输到Ibex Prostate平台进行分析。AI模型在每个切片上运行，生成恶性的概率评估，根据预定义的阈值将每个活检部分划分为高、中或低可能性。当多个切片与同一活检部分相关时，使用该部分中可能性最高的分类作为AI的综合输出。

AI生成的概率评估与病理学家给出的真实诊断结果在活检部分层面进行了比较。诊断性能通过敏感性、特异性、阳性预测值和阴性预测值进行评估，其中高可能性类别被视为恶性的主要阈值。额外的分析评估了将高可能性和中等可能性类别合并时的敏感性，以及低可能性类别识别无恶性活检部分的阴性预测值。我们的机构接受标准要求高可能性类别的敏感性至少为0.85，高/中等可能性和低可能性阴性预测值的组合至少为0.90。成功满足这些标准支持了将AI工具作为常规前列腺活检工作流程中的决策支持系统的临床应用。此外，还进行了接收者操作特征（ROC）分析，以评估AI系统在不同置信水平上的诊断性能。AI解释被编码为有序变量（低=0，中等=1，高=2）。在预定决策阈值下计算了敏感性（真阳性率）和假阳性率。通过绘制真阳性率与假阳性率的关系曲线来构建ROC曲线，并使用梯形规则估计曲线下面积（AUC）。所有分析都以真实诊断为参考标准。除了ROC之外，还使用Cochran–Armitage趋势检验评估了AI置信类别（低、中等、高）与真实诊断（恶性 vs 良性）之间的关系，以具体评估恶性概率是否在有序AI置信水平上单调增加。双侧p值<0.05被认为是统计显著的。

验证成功后，AI辅助的前列腺活检工具被纳入外科病理学服务的常规临床实践。该部门此前已过渡到完全数字化的工作流程，所有组织学审查和病例报告均使用WSI进行。这一现有数字化基础设施使得AI工具的实现无需改变标本处理、切片扫描或报告工作流程。AI系统作为可选的决策支持工具提供给病理学家。所有外科病理学接收的前列腺活检均由泌尿病理学家和名为“Ibex-Prostate”的指定用户处理。该分配标记案件由Ibex平台专门进行分析，并提供恶性的概率评估和全切片图像上感兴趣区域的视觉热图叠加。

**图1. 研究设计和工作流程**
图示概述了研究过程，包括AI辅助前列腺活检决策支持工具的机构验证、在完全数字化病理工作流程中的临床应用，以及评估实施后对诊断周转时间和IHC使用率影响的回顾性前后分析。

AI输出的使用是自主决定的，最终诊断仍由病理学家根据形态学评估和临床相关性作出。

为了评估AI辅助审查的即时运营影响，我们进行了回顾性前后应用研究，比较了AI可用前的前列腺针刺活检病例的诊断周转时间和IHC使用情况。AI可用前的三个月内报告的病例被指定为“AI前”队列，而在实施后的三个月内报告的病例被指定为“AI后”队列。两个队列中的所有病例均使用数字WSI进行解读，AI辅助仅在AI后期间可用。诊断周转时间定义为从全切片扫描完成到最终病理学家报告的间隔时间。选择这一定义是为了分离由病理学家控制的流程组件，并尽量减少与标本接收、处理或切片制备相关的变异性。记录每个病例的周转时间，并计算AI前后的加权中位周转时间。通过记录每个研究期间每个病例的IHC染色数量来评估IHC使用情况。比较了两个队列之间的总体IHC使用情况和平均染色数量，以评估AI应用后的辅助检测订单变化。

**统计分析**
进行了统计分析，以比较AI应用前后诊断周转时间（TAT）和IHC使用情况。周转时间是一个非正态分布的连续变量，使用中位数和四分位数范围进行总结，并使用Mann–Whitney U检验进行比较。IHC使用情况被视为分类变量，使用Fisher精确检验在组间进行比较。所有统计测试均为双侧检验，显著性阈值p<0.05，并报告了确切的p值。分析作为回顾性质量和工作流程评估的一部分进行。

**验证结果**
共有318个来自常规前列腺针刺活检病例的活检部分参与机构验证。每个部分都有3张经过苏木精和伊红（H&E）染色的切片，均由AI模型进行评估。AI模型为每个活检切片生成恶性的概率评估，将输出分为高、中或低可能性。部分的最终解释基于三个H&E切片中的最高概率类别。例如，如果三个切片的AI分类分别为“低可能性癌症”、“高可能性癌症”和“低可能性癌症”，则整个部分被分类为“高可能性癌症”。这种方法将切片级别的诊断转换为部分级别的诊断，体现了常规操作中的实际情况——例如，如果切片A1和A9是良性的，但切片A5含有癌症，则整个部分A的诊断为癌症。

在分析的318个部分中，104个被分类为恶性，214个被分类为良性（非恶性），基于病理学家给出的真实诊断结果。在97个被分类为高恶性可能性的部分中，95个与恶性真实诊断结果一致，2个为非恶性。在124个被赋予中等可能性的活检样本中，有9个是恶性的，115个是良性的。所有被赋予低恶性可能性的活检样本在最终诊断中都被确认为良性。以高可能性类别作为主要阈值，AI模型在恶性检测方面的敏感度为0.91，特异性为0.99，阳性预测值（PPV）为0.98，阴性预测值（NPV）为0.96。当高可能性和中等可能性类别结合使用时，恶性检测的敏感度达到了1.00，这表明所有含有癌症的活检样本都被AI系统至少赋予了中等程度的恶性可能性。相反，被赋予低恶性可能性的活检样本的阴性预测值为1.00，该组中没有恶性病例。总体而言，所有预定义的验证性能标准都得到了满足或超过，支持将AI工具作为常规前列腺活检工作流程中的决策支持系统进行临床应用。验证研究的结果见表1。

表1. 前列腺AI系统的本地机构验证结果。

原始诊断“真实情况” AI生成的恶性可能性总样本数
恶性 97（30.5%） 318（100%）
良性 104（32.7%） 214（67.3%）
低可能性 97（30.5%） 124（39.0%）

2×3列联表
空单元

原始诊断“真实情况” AI系统输出（恶性可能性）
恶性良性总计
高可能性 95 297 104
中等可能性 91 151 214
低可能性 0 97 97

指标值（%）
仅高可能性敏感度 95/104（91.0%）
特异性 212/214（99.0%）
PPV 95/97（98.0%）
NPV 212/221（96.0%）
高可能性+中等可能性组合敏感度 104/104（100%）

ROC分析也显示了AI系统的出色区分性能。ROC曲线下面积（AUC）为0.97，表明在AI置信度增加的情况下，恶性病例和良性病例之间的分离非常明显。在最高置信度阈值（仅高置信度）下，敏感度为91.3%，假阳性率为0.9%；而结合高置信度和中等置信度解释时，敏感度达到了100%，但假阳性率有所增加。与ROC分析中观察到的高诊断区分能力一致，随着AI置信度的增加，恶性病例的比例也显著增加（Cochran–Armitage趋势检验，p<0.001）。恶性率从低置信度类别的0%上升到中等置信度类别的7.3%，再到高置信度类别的97.9%（图2），显示出AI系统的有效序数风险分层。

下载：下载高分辨率图像（149KB）
下载：下载全尺寸图像

图2. AI验证性能。
图例：AI辅助前列腺活检工具在机构验证期间的诊断性能。指标包括敏感度（91-100%）、特异性（99%）、阳性预测值（98%）、阴性预测值（96%）以及接收者操作特征曲线下面积（AUC=0.97），在预定义的接受标准下显示出高准确性。

在AI实施后的影响分析中，共包含了139例前列腺针刺活检病例，其中AI实施前有80例，实施后有59例。研究时间跨度为七个月，包括三个月的实施前期和三个月的实施后期，中间有一个月的过渡期以减少用户熟悉度相关的混淆。所有病例都使用了数字全切片图像进行审查，AI辅助审查仅在实施后期可用。

AI辅助审查的实施显著减少了诊断周转时间。加权中位数周转时间从实施前的36.3小时减少到实施后的25.3小时（?11.0小时；?30.3%；p=0.0186）（表2，图3）。

表2. AI实施前后的周转时间（TAT）。
时期月份数量（n）中位数TAT（小时）加权中位数TAT（小时）绝对变化（小时）百分比变化
实施前 2024年8月至10月 80 30.2 36.3 ?11.0 ?30.3%
实施后 2024年12月至2025年2月 59 25.0 25.3 ?11.0 ?30.3%

下载：下载高分辨率图像（115KB）
下载：下载全尺寸图像

图3. AI实施前后的诊断周转时间。
图例：AI实施前后前列腺活检病例的诊断周转时间比较。实施AI决策支持后，中位数TAT减少了约30%。TAT定义为从全切片图像扫描完成到最终病理学家签字之间的时间间隔。

免疫组化利用率在AI实施后也有所下降。每例病例的免疫组化染色平均数量从实施前的2.37次减少到实施后的1.47次，相当于每例病例的免疫组化使用量减少了38%（图4）。

除了总体性能指标外，对个别验证案例的分析还提供了关于如何在实践中解释AI生成的概率评估的重要见解。在两个案例中，AI模型将良性腺泡增生评估为恶性可能性较高（图5 A, C）。这两个病灶最初都被认为是可疑的，需要进行免疫组化（IHC）检测，只有在对腺泡基底细胞进行p63染色后，才被确认为良性（图5 B, D）。相反，在被赋予中等恶性可能性的活检样本中，有一小部分含有癌症，这些癌症都是低级别的，且大多数体积较小（图6 A-D）。这一类别中的一个较大病灶是一种假性增生型腺癌，原始病理学家通过免疫染色确认其为恶性（图6 E, F）。

讨论
过去七年中，AI模型在辅助外科病理学中的模式识别任务方面的可用性不断增加。前列腺癌症的检测是这项技术最早应用于临床的例子之一，这并非偶然。传统评估这些活检的方法特别繁琐，需要病理学家高度警惕，因为前列腺癌症的显微镜下表现可能非常微妙，癌症病灶可能非常小，错过癌症的后果可能很严重。这些正是AI擅长的领域，它可以不 fatigue 地对每个样本和像素进行彻底评估。这些特性在诊断病理学的其他多种情况下也非常有益，因此越来越多的AI模型被用于辅助检测其他类型的癌症和量化生物标志物。实际上，正是AI工具的可用性以及对其能力和必要性的认识，激发了对数字病理学采用的高度兴趣。

鉴于训练这些AI模型的深度学习方法的普遍性和某种程度的标准化，一个模型相对于另一个模型的优势在于其基础训练数据的质量、规模和多样性。本研究中描述的Ibex Prostate模型是基于一个大型的多机构WSI数据集开发的，并在全球各种环境中进行了技术和临床验证。FDA的监管批准为AI模型提供了强大的信心保障，因此可以认为它具有“临床级别”的可靠性。该软件的一个重要且有用的特点是与现有工作流程的良好集成以及结果的热图可视化呈现。最后，模型进行的额外评估不仅报告了癌症的存在与否，还报告了癌症的亚型、数量、级别和神经周围侵犯情况——这些特性提供了有价值的辅助信息，有助于对活检进行全面评估。然而，需要注意的是，这些额外的辅助信息仅具有信息性，并未提交给FDA进行审批。

本研究的一个关键优势是在临床部署之前进行了结构化的机构验证。AI系统仅作为决策支持工具使用，提供恶性的概率评估，不作出最终诊断；所有最终诊断均由病理学家做出。对AI辅助工具的本地验证是降低患者安全风险和确保在本地技术环境、病例组合和工作流程中性能可接受性的关键步骤。验证是使用由病理学家独立解释的常规临床前列腺活检材料进行的，采用保守的“真实情况”定义和预定义的敏感度、特异性和预测值接受阈值。这种方法符合临床AI验证的最佳实践建议，强调本地性能评估，而不仅仅是依赖供应商报告的指标。通过确认AI模型一致地生成可靠的恶性概率评估并满足预定义的接受标准，验证支持其作为决策支持系统的使用，同时保留了病理学家对最终诊断的责任。重要的是，我们的验证策略反映了这样的共识：即用于临床的AI工具应在反映预期使用的真实世界条件下进行评估，包括本地扫描平台、图像管理系统和解释工作流程。专业组织和监管机构强调，病理学中AI的验证应与其他实验室工具的验证类似，具有清晰的文档、预定义的性能标准和持续的质量保证。ROC结果表明，AI置信度分数提供了稳健的区分信息，可以灵活应用于临床工作流程。高置信度的AI预测显示出高特异性和极低的假阳性率，支持其用于简化诊断审查或优先级排序。降低决策阈值虽然提高了敏感度，但牺牲了特异性，允许根据临床环境和风险容忍度来定制AI的集成。总体而言，高的AUC强调了AI置信度分层作为病理学家解释的临床上有意义的补充的可靠性。我们的发现与Kris Lami及其同事在2024年的研究结果一致，他们评估了Galen Prostate算法在日本队列中的性能，并报告了0.969的前列腺癌症检测AUC。在那项研究中，AI系统表现出很强的区分能力，能够识别恶性活检核心，并额外检测到临床相关的病理特征，如神经周围和淋巴血管侵犯。与我们的结果类似，他们的发现支持了AI衍生的概率或置信度分数可以可靠地区分恶性组织和良性组织的概念，可能作为辅助病理学家进行常规诊断审查的实际决策支持工具。我们的AUC结果与不同地理人群和临床环境中独立验证队列报告的结果一致，进一步支持了该AI模型的稳健性和普遍性。

图中描述的例外情况（图5, 图6）提醒我们，AI输出代表概率评估而非确定性决定，并加强了病理学家监督的必要性。在我们的验证队列中，只有两个被赋予高恶性可能性的活检样本最初被分类为良性，这导致了高阳性预测值，体现了这种敏感筛查工具的预期行为。同样，图6中的癌症示例突出了中等可能性类别的中间性质及其作为需要更仔细形态学检查的提示的作用，而不是二元分类。重要的是，所有被评估为恶性肿瘤可能性较低的活检样本在最终病理学家的解读中都被确认为良性，这支持了将低可能性结果作为专家审核中判断恶性肿瘤缺失的更可靠指标的使用。总的来说，这些案例层面的观察结果补充了整体验证指标，这些指标显示出了高敏感性、特异性和预测值。当高可能性和中等可能性类别被综合考虑时，恶性肿瘤的敏感性达到了1.00，表明所有含有癌症的活检样本都被AI系统标记为需要病理学家关注的级别。这些发现支持将AI工具作为筛查和优先级辅助工具使用，而不是作为诊断的最终决定者，并为其集成到临床工作流程中提供了依据。在验证之后，AI工具被纳入了常规前列腺活检评估中，使得AI生成的概率评估和热图可视化可以在订购免疫组化染色之前与整个切片图像一起进行审查。这种方法允许病理学家在解释过程中尽早使用AI输出，同时保留对其使用的完全自主权。该工具还提供了额外的功能，包括Gleason分级模式的可视化和神经周围侵犯的识别，进一步支持了高效的审查，而不会取代形态学评估。据我们所知，这是美国学术病理部门最早实施此类常规前列腺活检诊断工作流程的案例之一。重要的是，AI工具的使用完全是自主决定的，病理学家可以根据每个病例的情况来判断AI输出对其审查的影响程度。这种灵活的集成模式反映了现实世界的实践，并减少了过度依赖自动化输出的风险。在实施后的分析中，显示诊断周转时间和免疫组化使用的减少，表明早期获取AI生成的概率评估可能会提高诊断效率，同时保持病理学家的判断力和责任感。

前列腺AI决策支持工具的实施与常规临床实践中前列腺活检的总体诊断周转时间显著缩短有关。这一发现与之前的实际应用研究结果一致，包括Deman等人的研究，他们展示了用户在初步熟悉AI辅助工具后的周转时间有所改善。在我们的研究中，加权中位周转时间从36.2小时减少到了25.4小时，绝对减少了10.9小时，即大约30%。这种改善在统计上是显著的（p<0.05）。本研究中描述的AI模型（Ibex Prostate）的性能特性与FDA首次批准的AI模型（Paige Prostate）非常相似。尽管我们没有在我们的机构评估或验证该模型，但我们的经验和结果与之前使用Paige Prostate的报告非常相似。在本研究中，每个病例的免疫组化染色平均数量从2.37次减少到1.47次，代表了免疫组化使用量减少了38%。这一发现与之前评估AI辅助前列腺活检审查的研究结果一致。Eloy等人和Flach等人也报告了在诊断工作流程中加入AI决策支持后，恶性和非恶性病例的免疫组化使用量都有显著减少。观察到的周转时间和辅助测试使用量的改善可能反映了多种因素的共同作用，而不仅仅是一个机制。AI生成的概率评估和热图可视化可能有助于更有效地识别整个切片图像上的感兴趣区域，特别是在肿瘤体积较小的病例中。此外，对恶性肿瘤可能性较低的活检样本增加的诊断信心可能会减少审查非诊断区域的时间，并减少对确认性免疫组化的依赖。重要的是，AI工具仅仅作为一个决策支持系统发挥作用；所有最终诊断都是由病理学家结合形态学发现、AI输出和临床背景来做出的。

免疫组化使用的减少不仅影响了周转时间，还可能降低材料和劳动力成本，减少组织学工作流程的负担，并提高整体实验室效率。此外，AI辅助的可疑区域和非可疑区域的可视化可能具有教育价值，特别是对于经验较少的病理学家来说，通过强化与恶性肿瘤和良性相似病变相关的形态学模式。虽然这些教育效果在本研究中没有正式评估，但它们是一个重要的未来研究领域。我们的发现增加了越来越多的文献，支持AI辅助工具在各种组织病理学应用中提高效率的作用。多项研究表明，在学术和非学术环境中，AI集成后周转时间和工作流程效率都有所改善。总体而言，这些观察结果表明，在高容量实践和资源受限的环境中，AI决策支持可能特别有益，尽管益处的程度可能因病例组成、工作流程和用户经验而异。

这项研究有几个局限性，在解释研究结果时应当予以考虑。首先，分析是在一个完全数字化的病理工作流程中运行的单一学术医疗中心进行的。虽然这种环境便于AI的高效集成，但结果可能不直接适用于数字化成熟度不同、病例组成或人员配置不同的机构。需要在多个机构中进行研究，以确认不同实践环境下的可重复性。其次，实施后的影响分析仅限于相对较短的时间段和适量的病例。尽管观察到诊断周转时间和免疫组化使用的显著减少，但仍需要长期研究来评估这些效果的持久性、潜在的学习曲线以及随时间发生的适应情况。此外，下游临床结果，包括开始治疗的时间和患者报告的指标，没有进行评估，超出了本研究的范围。第三，周转时间被定义为完成整个切片图像扫描与病理学家最终签字之间的时间间隔。这个定义是有意选择的，以隔离在病理学家控制下的工作流程组成部分；然而，它没有考虑到样本接收、组织处理或切片制备等不受AI辅助影响的上下游变量。因此，观察到的减少反映了诊断流程中特定部分的改进，而不是整个实验室操作。最后，本研究评估的是一个为特定临床用途验证和实施的商业可用AI平台。先前的研究表明，AI工具可以支持多种功能，包括预筛查、病例优先排序和辅助研究的预期订购，这突出了更广泛工作流程优化的机会。AI系统的设计、目的和实施策略差异很大，跨平台的普适性需要谨慎评估。一些机构使用商业可用工具，而其他机构则使用内部开发的模型，如Mayall等人描述的模型。因此，我们的发现仅针对Ibex Prostate平台，不应在没有独立验证的情况下推广到其他AI系统。重要的是，AI工具仅仅作为一个决策支持系统发挥作用，所有最终诊断都是由病理学家做出的。与任何AI辅助的工作流程一样，持续的监督、定期重新验证和性能监控对于确保其安全和有效的临床使用至关重要。

结论

在这项研究中，我们描述了一个在完全数字化的学术病理实践中，用于前列腺活检评估的AI辅助决策支持工具的机构验证、临床实施和实施后的即时影响。通过结构化的验证过程，AI模型在生成恶性肿瘤概率评估方面显示出了可靠的性能，支持将其作为病理学家解读的辅助工具安全部署。实施后，AI辅助的审查与诊断周转时间和免疫组化使用的显著减少相关，表明工作流程效率和资源优化有所提高。这些改进是在不改变病理学家核心角色的情况下观察到的，病理学家仍然负责做出最终诊断。总的来说，这些发现支持将AI作为决策支持工具负责任地整合到常规前列腺活检实践中。在适当的机构验证之后，并在数字化病理工作流程中实施AI辅助，有可能在保持诊断质量和专业监督的同时提高效率。需要进一步的跨机构研究和长期评估，以明确AI辅助病理工作流程的更广泛和持续的影响。

热点排行