在当代前列腺活检队列中,直肠数字检查的情境依赖性作用:结合与不结合mpMRI时的差异预测价值

《Prostate International》:Context-Dependent Role of Digital Rectal Examination in a Contemporary Prostate Biopsy Cohort: Differential Predictive Value With and Without mpMRI

【字体: 时间:2026年05月07日 来源:Prostate International 2.6

编辑推荐:

  霍斯特·埃马努埃尔·拉戈斯-贝茨 | 亚历克莎·博尔博拉-鲁伊斯 | 沃尔夫冈·冈萨雷斯-索萨 | 卡洛斯·安东尼奥·冈萨雷斯-基罗斯 | 理卡多·阿隆索·卡斯蒂列霍斯-莫利纳 |豪尔赫·奥古斯托·阿尔卡西奥-门多萨 | 杰拉尔多·特纳-冈萨雷斯·门德斯 墨西哥城萨尔瓦多·祖

  霍斯特·埃马努埃尔·拉戈斯-贝茨 | 亚历克莎·博尔博拉-鲁伊斯 | 沃尔夫冈·冈萨雷斯-索萨 | 卡洛斯·安东尼奥·冈萨雷斯-基罗斯 | 理卡多·阿隆索·卡斯蒂列霍斯-莫利纳 |豪尔赫·奥古斯托·阿尔卡西奥-门多萨 | 杰拉尔多·特纳-冈萨雷斯·门德斯
墨西哥城萨尔瓦多·祖比兰国家医学与营养科学研究所泌尿科

**摘要**
**目的**
量化数字直肠检查(DRE)在当代活检队列中对预测临床显著前列腺癌(csPCa,ISUP分级≥2)的贡献,比较非mpMRI临床路径与包含PI-RADS的mpMRI指导路径。

**材料与方法**
我们对2017年7月至2024年12月期间一家学术中心进行的666例连续前列腺活检进行了回顾性分析。DRE由泌尿科住院医师和主治泌尿科医生执行。构建了两个多变量逻辑回归模型:模型A(完整队列,N=612)包括年龄、log-PSA、log-PSAD、既往活检和DRE;模型B(mpMRI亚组,N=306)还包括PI-RADS评分。使用AUC和似然比测试评估区分能力。敏感性分析评估了所有癌症(ISUP≥1)和高级别癌症(ISUP≥4)。

**结果**
csPCa的患病率为30.7%(202/660),DRE在52.3%(346/662)的病例中提示可疑。在模型A中,DRE与csPCa独立相关(aOR 2.18,95% CI 1.45–3.28,p<0.001),尽管区分能力的提升较为有限(ΔAUC=0.009)。在模型B中,DRE显示出边缘显著性(aOR 1.88,95% CI 1.01–3.52,p=0.048),但区分能力的提升微不足道(ΔAUC=0.002)。敏感性分析结果一致。观察到剂量-反应梯度:正常情况下csPCa的检出率为19.2%,cT2a为31.6%,cT2b–T4为58.9%(p-trend <0.0001)。

**结论**
在没有mpMRI的情况下,DRE与csPCa独立相关,但其增量区分贡献有限;当纳入PI-RADS后,这一贡献变得可以忽略不计。这些发现支持了DRE在当代活检路径中有限且依赖于具体情境的作用。

**1. 引言**
自PSA时代之前,数字直肠检查(DRE)一直是前列腺癌(PCa)检测的基石,但其在当代诊断路径中的作用仍存在争议。多参数磁共振成像(mpMRI)和靶向活检协议的应用使诊断范式转向了以影像学为导向的路径,这引发了DRE在具有高级影像数据时是否提供临床意义增值的疑问。先前的研究结果不一。大规模筛查队列一致显示,单独使用DRE的敏感性和特异性较低,而基于活检的系列报告由于验证偏倚而具有更高的诊断性能。关键的临床问题是DRE是否能在PSA、PSA密度(PSAD)和PI-RADS提供的信息之外提供额外信息。此外,在培训环境中,泌尿科住院医师掌握DRE技能是一个重要的教育成果。本研究的目标是:(1)量化DRE在两种当代诊断路径(非mpMRI路径和包含PI-RADS的mpMRI指导路径)中的预测贡献;(2)评估DRE通过临床T分期类别保留的预测价值;(3)探索在有培训数据的子集中考官的表现。

**2. 材料与方法**
2.1 研究设计及人群
本研究是对2017年7月至2024年12月期间在[研究机构名称]进行前列腺活检的连续患者进行的回顾性队列研究。符合条件的患者包括有临床指征的前列腺活检(PSA升高、DRE可疑或影像学发现)。排除病理数据不完整的患者(n=6),共获得660例可评估病例。研究获得了机构伦理委员会的批准(URO-5623-25-26-1)。
2.2 临床变量
DRE由检查泌尿科医生(住院医师或主治医师)在活检前进行。DRE结果根据机构规定的临床检查分类记录。G1–G4表示基于直肠指检估计的前列腺大小的分级增大模式,大致对应于良性前列腺增生;cT2a表示单侧可触及结节,cT2b–cT4表示逐渐更可疑或更高级别的可触及病变。主要二元分析中,G1–G4分类为非可疑(正常)DRE结果,cT2a–cT4结果分类为可疑。活检时获取PSA和前列腺体积数据。接受mpMRI的患者由专业放射科医师分配PI-RADS v2.1评分。mpMRI的决定基于临床判断和影像学可用性,这些在研究期间随着mpMRI逐渐纳入机构活检路径而变化。
2.3 活检技术
所有活检均通过经直肠超声引导的系统性活检(12个核心)。mpMRI检测到病变(PI-RADS≥3)的患者还进行了认知或软件辅助的融合靶向活检。根据临床指征,10例(1.5%)进行了经会阴活检。
2.4 结果定义
主要结果是临床显著前列腺癌(csPCa),定义为活检病理学上的ISUP分级≥2。次要结果包括任何前列腺癌(ISUP≥1)和高级别癌症(ISUP≥4)。
2.5 统计分析
预先设计了两个多变量逻辑回归模型:模型A包括完整可评估队列(年龄、log-PSA、log-PSAD、既往活检和DRE,不包括影像学变量);模型B仅限于接受mpMRI的患者,并添加PI-RADS评分作为额外协变量。由于与PI-RADS概念上的重叠(是否进行融合活检取决于PI-RADS评分),两个模型均未包含融合活检方式。PSA和PSAD通过对数转换以标准化其分布。
2.6 区分能力评估
通过接收者操作特征曲线(AUC)下的面积来评估区分能力。通过比较包含DRE和不含DRE的模型的AUC以及似然比测试来评估DRE的增量价值。使用Hosmer-Lemeshow测试进行校准。
2.7 敏感性分析
使用(1)任何前列腺癌(ISUP≥1)和(2)高级别癌症(ISUP≥4)作为结果,重复了对整个队列的DRE诊断性能(敏感性、特异性、预测值、似然比)的评估,以评估DRE在疾病严重程度范围内的预测价值。另外一项分析将DRE视为三个级别变量(正常、cT2a、cT2b+)来评估剂量-反应关系。通过比较包含和排除患者的关键变量特征来描述缺失数据模式,并使用统计测试(连续变量用Mann-Whitney U,分类变量用卡方)来评估缺失是否符合完全随机缺失(MCAR)机制。

**3. 结果**
3.1 队列特征
共注册了666例活检 procedure。排除6例病理数据不完整的患者后,660例可评估。中位年龄为68岁(IQR 63–73岁),中位PSA为8.6 ng/mL(IQR 5.8–14.6),中位PSAD为0.16 ng/mL2(IQR 0.10–0.27)。DRE在662例中有346例(52.3%)提示可疑,316例(47.7%)正常。321例(48.3%)在活检前接受了mpMRI,191例(28.7%)接受了融合靶向活检。180例(27.2%)之前接受过活检。660例中有323例(48.9%)检测到前列腺癌,其中202例(30.6%)为csPCa(ISUP≥2),91例(13.8%)为高级别癌症(ISUP≥4)。表1显示了完整队列的特征。患者选择和分析队列见补充图1。

**表1. 队列特征(N=666例,660例可评估)**
| 变量 | 值 | N |
|---------------|-------------|------------|
| 年龄,中位(岁) | 68(63–73) | 660 |
| PSA,ng/mL | 8.6(5.8–14.6) | 658 |
| PSA密度,ng/mL2 | 0.16(0.10–0.27) | 617 |
| DRE可疑,n (%) | 346(52.3%) | 662 |
| 接受mpMRI,n (%) | 321(48.3%) | 659 |
| PI-RADS 1–2 | 116(36.1%) | 321 |
| PI-RADS 3 | 56(17.4%) | 321 |
| PI-RADS 4 | 95(29.6%) | 321 |
| 融合活检,n (%) | 191(28.7%) | 660 |
| 既往活检,n (%) | 180(27.3%) | 659 |
| 任何PCa(ISUP ≥1),n (%) | 323(48.9%) | 660 |
| csPCa(ISUP ≥2),n (%) | 202(30.6%) | 660 |
| 高级别癌症(ISUP ≥4),n (%) | 91(13.8%) | 660 |

**3.2 DRE诊断性能**
DRE对csPCa的总体敏感性为70.3%(142/202),特异性为55.7%(254/456),阳性预测值(PPV)为41.3%,阴性预测值(NPV)为80.9%。阳性似然比为1.59,阴性似然比为0.53。在患病率低于活检队列(30.7%)的情况下,NPV增加(例如,在10%患病率时为94.4%),而PPV降低(在10%患病率时为15.0%),这与贝叶斯预期一致。

**3.3 多变量分析:模型A(完整队列,N=612)**
在未包含PI-RADS的完整病例分析中(N=612,表2),DRE与csPCa独立相关(aOR 2.18,95% CI 1.45–3.28,p<0.001)。log-PSAD是最强预测因子(aOR 3.18,95% CI 2.12–4.76,p<0.001)。年龄的贡献较小(aOR 1.03/年,p=0.008)。调整PSAD后,log-PSA不再显著(aOR 0.82,p=0.36),这与PSA和PSAD之间的已知相关性一致。模型A的AUC为0.798,不含DRE时为0.788(ΔAUC=0.009)。添加DRE的似然比测试非常有显著性(χ2=14.3,p<0.001)。Hosmer-Lemeshow拟合优度适当(χ2=9.2,p=0.33)。

**表2. 多变量逻辑回归(csPCa,ISUP ≥2):模型A(完整队列,不含PI-RADS,N=612)**
| 变量 | aOR | 95% CI | p值 |
|------------|---------------|-------------|------------|
| 年龄(每年) | 1.03 | 1.01–1.06 | 0.008 |
| log(PSA) | 0.82 | 0.54–1.25 | 0.36 |
| log(PSAD) | 3.18 | 2.12–4.76 | <0.001 |
| 既往活检 | 1.17 | 0.75–1.83 | 0.488 |
| DRE(可疑) | 2.18 | 1.45–3.28 | <0.001 |
| AUC无DRE: | 0.788 | AUC含DRE: | 0.798 | ΔAUC:0.009 | χ2=14.3,p<0.001 |
| Hosmer-Lemeshow: | 9.2 | p=0.33 | |

**3.4 多变量分析:模型B(mpMRI亚组,N=306)**
在包括PI-RADS的306例完整数据患者中(表3),DRE的显著性边缘(aOR 1.88,95% CI 1.01–3.52,p=0.048)。PI-RADS是主要预测因子(aOR 2.13/类别,p<0.001),其次是log-PSAD(aOR 3.40,p<0.001)。添加DRE后,AUC从0.804提高到0.806(ΔAUC=0.002,LR测试χ2=3.9,p=0.047)。VIF值均低于2.5(范围1.01–2.44),表明相关性可接受。

**图1. 多变量预测因子**
森林图显示了多变量逻辑回归模型预测临床显著前列腺癌(ISUP≥2)的调整后比值比(aOR)。模型A包括完整队列(不含PI-RADS),模型B包括包含PI-RADS的mpMRI亚组。在模型A中,DRE与csPCa独立相关,在模型B中呈边缘显著性。

**图2. DRE在预测模型中的增量区分能力**
接收者操作特征(ROC)曲线比较了包含和不含DRE的模型在预测完整队列(模型A)和mpMRI亚组(模型B)中临床显著前列腺癌的能力。当包含PI-RADS时,DRE的区分能力提升很小。

**3.5 DRE与临床T分期的剂量-反应关系**
根据临床T分期将DRE分为三个级别(补充表1),观察到csPCa检测的明显剂量-反应梯度:正常DRE的检出率为19.2%,cT2a为31.6%,cT2b–T4为58.9%(χ2趋势=69.3,p<0.0001)。在包含3个DRE分级的模型B中,cT2a类别与正常相比具有独立显著性(aOR 2.24,95% CI 1.12–4.48,p=0.022),而cT2b+不显著(aOR 1.82,95% CI 0.74–4.48,p=0.196),可能是因为PI-RADS已经捕获了关于高级可触及疾病的相同信息。DRE临床T分期与癌症检测之间的剂量-反应关系见图3。

**3.6 敏感性分析**
为了评估在疾病严重程度范围内的稳健性,我们使用不同的结果定义重复了两个模型(补充表2)。对于任何前列腺癌(ISUP≥1,患病率48.9%),DRE在模型A中仍显著(aOR 1.43,95% CI 1.00–2.04,p=0.050),但在模型B中不显著(aOR 1.33,95% CI 0.80–2.19,p=0.27)。对于高级别癌症(ISUP≥4,患病率13.8%),DRE在模型A中显著(aOR 2.31,95% CI 1.28–4.16,p=0.006),在模型B中呈边缘显著性(aOR 2.71,95% CI 0.98–7.49,p=0.055)。这种模式——模型A中显著但在模型B中减弱——在所有结果定义中都存在,证实了PI-RADS涵盖了DRE提供的大部分信息。

**3.7 缺失数据评估**
从模型B中排除的患者(未接受mpMRI的N=360)在几个关键变量上与纳入的患者(N=306)有显著差异(补充表3)。排除的患者PSAD较高(p=0.004),DRE可疑率较高(58.4% vs. 45.1%,p<0.001),csPCa患病率较高(36.2% vs. 24.2%,p=0.001),既往活检次数较少年龄和前列腺特异性抗原(PSA)水平没有显著差异。这种模式与“随机缺失”(MAR)假说一致,因为在整个研究期间逐步采用了多参数磁共振成像(mpMRI),而早期风险较高的患者较不可能接受影像学检查。19被纳入和排除在mpMRI亚组中的患者特征显示在补充图2.3.8中。

**住院医师直肠指检(DRE)表现(子集分析,N=204):**
206/666例(30.9%)的病例记录了检查者培训水平,其中204例的数据包括完整的DRE和病理学信息。第一年住院医师(PGY-1)进行了76次检查,第二年住院医师(PGY-2)进行了115次,第三年住院医师(PGY-3)进行了13次。在这个记录的子集中,PGY-1和PGY-2住院医师的DRE表现估计值相似(敏感性分别为65.4%和65.7%,特异性分别为62.0%和66.2%,阴性预测值(NPV)分别为77.5%和81.5%;见补充表4)。13 由于样本量非常小(n=13),仅描述性地报告了PGY-3的表现。由于69.1%的病例缺少检查者数据,这些发现应被视为探索性结果,而不能作为培训水平差异的决定性证据。住院医师培训水平对诊断表现的影响显示在补充图3.4中。

**讨论:**
本研究不应被视为再次证明DRE能改善基于MRI的风险分层,而应视为量化其在不同诊断情境下作用的变化。在我们的队列中,即使在非mpMRI的情况下,DRE仍与临床前列腺癌(csPCa)独立相关,尽管其辨别能力的提升较为有限(模型A:调整后比值比(aOR)2.18,p<0.001;AUC增量ΔAUC=0.009)。一旦纳入前列腺影像报告系统(PI-RADS),DRE的额外辨别贡献变得可以忽略不计(模型B:ΔAUC=0.002),尽管统计显著性接近临界值。跨结果定义的敏感性分析显示了相同的趋势,这支持了DRE提供的信息在基于影像学的路径中被mpMRI大部分替代的观点,而在MRI不可用或未常规执行的情况下,DRE可能仍能保留一些临床信息。这种模式表明,在当前实践中,DRE在基于MRI的路径中不太作为一个独立的鉴别工具,而更多是在影像学检查不可用时作为辅助或分期工具使用。

模型A中观察到的独立关联与之前的生物活检队列研究结果一致,这些研究表明可疑DRE与csPCa的比值比在1.5到3.0之间。5, 6, 9 我们的研究发现aOR为2.18,处于这一预期范围内,并得到了充足的样本量(N=612)、合理的模型校准(Hosmer-Lemeshow p=0.33)以及显著的似然比检验(p<0.001)的支持。然而,在我们的数据中,这种关联只带来了有限的辨别能力提升,这表明统计显著性并不一定意味着临床效用的显著增加。模型B中,临界统计显著性和几乎为零的辨别能力提升(ΔAUC=0.002)强烈表明,PI-RADS已经捕获了DRE在活检决策中传递的大部分信息,这在生物学上是合理的,因为这两种评估通过不同的方式反映了肿瘤负荷和局部范围。21, 24

本研究的一个新颖贡献是使用详细的DRE数据展示了明确的剂量-反应关系:在正常DRE的情况下,临床前列腺癌的检出率为19.2%,在cT2a阶段为31.6%,在cT2b–T4阶段为58.9%(p-trend <0.0001)。25 在调整后的cT2a阶段,这一关系仍然存在(aOR 2.24,p=0.022),但在cT2b+阶段则不再明显(aOR 1.82,p=0.196),这表明最晚期的可触及疾病已经在mpMRI亚组中被捕获。尽管如此,描述性的剂量-反应关系仍然支持DRE在临床分期中的持续作用,这与其在活检决策模型中的作用不同。

**流行率调整分析:**
了解DRE预测价值需要结合流行率背景。在本活检队列中(患病率为30.7%),DRE的阴性预测值(NPV)为80.9%;在患病率为10%(初级保健转诊)时为94.4%,在患病率为5%(筛查)时为97.3%。相反,在这些较低的患病率下,阳性预测值(PPV)分别降至15.0%和7.7%。这意味着DRE在低风险人群中具有合理的阴性预测价值,但在阳性预测价值方面表现较差,这支持了其作为排除工具而非确认工具的角色,尤其是在没有影像学检查的情况下。

**住院医师表现数据:**
666例中只有204例(30.9%)的病例提供了住院医师的表现数据,在这个记录的子集中,PGY-1和PGY-2住院医师的敏感性估计值似乎相似。13 然而,大量数据缺失、PGY-3的样本量非常小,以及缺乏检查者标识或时间调整,使得无法得出关于培训水平差异或能力下降的明确结论。PGY-1和PGY-2表现之间的表面相似性可能反映了早期技能掌握或病例选择的混淆效应。在没有个体检查者标识、重复检查或观察者间一致性数据的情况下,这些结果应被视为探索性描述,而不是稳定表现可重复性的证据。

**与先前文献的比较:**
我们的发现与越来越多的共识一致,即DRE对基于影像学的诊断路径的增量价值有限。22, 23, 26, 27 PRECISION和MRI-FIRST研究确立了基于mpMRI的风险分层在当前活检路径中的核心作用。4, 28 在这一背景下,我们的模型B结果显示,即使加入DRE后,其辨别能力提升也很小(ΔAUC=0.002),表明PI-RADS已经捕获了DRE之前用于活检决策的大部分临床相关信息。然而,模型A的结果表明,在mpMRI不可用或未常规执行的情况下,DRE仍可能具有实际价值,这种情况在许多医疗系统中仍然常见。29 本研究的一个重要贡献是,这两种情况都是在同一当代 institution 队列中,使用平行多变量模型进行评估的,这使得可以直接估计DRE在PI-RADS纳入诊断框架后的作用变化。从实际角度来看,这些发现表明,当mpMRI不可用、延迟或未常规集成到活检路径中时,DRE最有用;而在已有高质量mpMRI和PI-RADS评分的情况下,DRE不太可能显著改善活检决策模型。30

**局限性:**
在解释这些发现时,应考虑几个局限性。首先,这是一个回顾性的单中心活检队列,这使得观察到的关联难以推广到其他实践环境。由于所有患者都接受了活检,无论DRE结果如何,因此存在验证偏差,无法估计DRE在更广泛的高PSA男性人群中的真实特异性和阴性预测值。31 其次,mpMRI亚组(模型B,N=306)并非随机选择,且在包括PSAD、可疑DRE频率、csPCa患病率和先前活检状态等多个临床相关特征上与非mpMRI组存在差异。此外,mpMRI在整个研究期间逐步采用,这引入了潜在的日历时间效应和时间上的混淆因素,影响了影像学与非影像学路径之间的比较。这带来了选择偏差的风险,意味着模型B中DRE效果的减弱应谨慎解释,因为观察到的部分效应可能反映了亚组构成,而不仅仅是PI-RADS的固有优势。19 mpMRI可用性的数据缺失机制与“随机缺失”假说一致,但这一假设无法验证。19 第三,69.1%的病例缺少检查者培训水平数据,大大限制了住院医师水平的分析,因此应将其视为探索性研究。第四,由于DRE本质上依赖于操作者,缺乏个体检查者标识和重复评估数据,无法进行聚类或观察者间一致性分析。32 这限制了我们确定观察到的DRE效应是真实临床信号还是检查技术或分类标准变异性所致的能力。最后,该研究的统计功效不足以检测非常微小的AUC差异,因此模型B中观察到的几乎为零的辨别能力提升主要应被视为增量效用的有限证据,而不是零效应的确切估计。

**结论:**
DRE在当前活检路径中具有有限的、依赖情境的作用。在没有mpMRI的情况下,它仍与csPCa独立相关,并在不同临床T分期类别中保持剂量-反应关系,尽管其辨别能力的提升较为有限。一旦纳入PI-RADS,其额外的辨别贡献变得可以忽略不计,这表明MRI捕获了DRE在活检决策中传递的大部分信息。这些发现支持在mpMRI不可用或未常规集成时保留DRE作为实用的床边辅助和分期工具,同时认识到它在改善基于MRI的活检决策模型方面的作用有限。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号