应用于磁共振引导下前列腺癌放疗的多领域深度学习配准的分割正则化训练

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Physics and Imaging in Radiation Oncology》：Segmentation regularized training for multi-domain deep learning registration applied to magnetic resonance-guided prostate cancer radiotherapy

【字体：大中小】 时间：2026年05月11日 来源：Physics and Imaging in Radiation Oncology 3.4

编辑推荐：

　　苏达桑·马德哈万（Sudharsan Madhavan）| 郭成成（Chengcheng Gui）| 兰多·博斯马（Lando Bosma）| 乔赛亚·西梅斯（Josiah Simeth）| 江珏（Jue Jiang）| 尼古拉·科泰（Nicolas C?té）| 尼玛·哈桑·雷扎埃安（Nima Hassan Rezaeian）| 希曼舒·纳格尔（Himanshu Nagar）| 维多利亚·布伦南（Victoria Brennan）| 尼拉姆·泰亚吉（Neelam Tyagi）| 哈里妮·维拉拉加万（Harini Veeraraghavan）

美国纽约州纽约市的纪念斯隆凯特琳癌症中心（Memorial Sloan Kettering Cancer Center）

**摘要**

**背景与目的**
精确的可变形图像配准（DIR）对于磁共振引导的自适应放疗（MRgART）中的轮廓传播和剂量累积至关重要。本研究旨在训练基于分割正则化的深度学习（DL）DIR方法，并评估其在不同领域间的适用性。

**材料与方法**
我们开发了基于DL-DIR的逐步细化配准和分割技术（ProRSeg）以及VoxelMorph算法。这两种方法分别在使用带有器官加权分割正则化的情况下和无此正则化的情况下进行了训练，数据来源于同一领域内的262对MR对被，这些数据来自接受放射治疗前及治疗后每3个月进行的3特斯拉MR模拟（MR-Sim）扫描。通过在同一领域数据集（58对）、跨领域数据集（72对1.5特斯拉MR-Linac扫描，对应连续每日治疗分次）以及混合领域数据集（42对MRSim规划－MR-Linac首次治疗分次）上，比较了这些模型的准确性（通过测量器官和临床靶区体积CTV的轮廓传播精度）。此外，还对42名接受5次分次MRgART治疗的患者的剂量累积情况进行了分析。

**结果**
ProRSeg在跨领域（所有器官）和混合领域（膀胱、CTV）数据集上均表现出强大的性能，尤其在处理高度变形的器官（如膀胱和直肠）时表现优异。分割正则化显著提高了ProRSeg和VoxelMorph的准确性。剂量累积可行性研究表明，83.3%的患者满足了CTV覆盖和膀胱保护的关键机构性要求。

**结论**
ProRSeg为前列腺癌患者的多领域MR-MR配准提供了一种可行的方法。剂量累积分析表明，该方法初步具备了评估实际治疗是否符合临床要求的潜力。

---

**1. 引言**
磁共振成像（MRI）引导的自适应放疗（MRgART）结合了内置的MRI成像设备和线性加速器，通过优越的软组织对比度实现每日治疗调整[1]，[2]。每日调整需要快速、精确的器官分割，这通常通过可变形图像配准（DIR）来完成，以实现轮廓传播[3]，[4]，[5]。DIR还支持剂量累积，从而评估治疗效果[6]，[7]，[8]。然而，多机构间的分析显示现有DIR实现存在显著差异，算法差异会导致累积剂量指标的临床相关性差异[6]。因此，开发出能跨不同成像平台应用的鲁棒DIR方法仍然是一个未解决的问题。已经开发了基于变分法和深度学习（DL-DIR）的MR-to-MR配准技术，用于骨盆和腹部癌症的MRgART[6]，[9]，[10]。与变分法不同，DL-DIR方法直接计算一对图像之间的变换，无需在推理过程中迭代优化图像对齐。使用无监督训练的DL-DIR方法（如VoxelMorph[11]等）[10]，[12]通过最大化变形图像与目标图像的相似性来直接计算变形场，从而无需真实变形数据作为监督。然而，当应用于与训练数据集不同的数据集时，DL方法容易受到MR成像差异的影响[6]，[13]。通过生成对抗网络（GAN）进行数据增强，可以创建具有真实图像变化的示例，从而提高模型的泛化能力[14]，[15]。不过，GAN需要额外的数据集，并增加了训练框架的复杂性。另一种方法利用器官几何结构来约束DIR过程，这种策略在迭代法、变分法[16]，[17]，[18]以及DL-DIR方法[20]，[21]，[22]中均显示出有效性。器官轮廓可以作为输入掩码或条件信息被明确包含进来[16]，[23]，或用于优化计算DIR的成本函数[20]。因此，我们采用了名为ProRSeg的联合配准-分割方法，该方法之前已被证明对胰腺癌患者的MR-MR扫描对齐有效[10]，现在也用于前列腺癌患者的骨盆MRI扫描对齐。通过应用几何正则化作为损失函数来训练配准和分割网络，分割网络的并行训练为配准网络提供了额外的正则化。训练完成后，仅保留配准网络用于测试。

本研究评估了ProRSeg在前列腺癌放疗中的多领域MR-MR配准性能，具体目标包括：(1) 使用纵向3特斯拉MRSim数据通过加权分割正则化损失来训练ProRSeg；(2) 评估ProRSeg在同一领域（MRSim-MRSim）、跨领域（MR-Linac-MR-Linac）和混合领域（MRSim-MR-Linac）数据集上的泛化能力；(3) 评估使用ProRSeg生成的DIR进行剂量累积以评估治疗质量的可行性。

---

**2. 材料与方法**
2.1. 数据集与实验
这项回顾性分析得到了MSKCC机构审查委员会（IRB协议#21-129）的批准。数据集包括34名患者在接受放射治疗前及治疗后每3个月进行的3特斯拉T2加权MRI（TR: 4740 ms, TE: 100 ms）扫描，用于治疗计划模拟（MRSim）和随访。随访频率因患者而异，并非所有患者都在每个预定时间点完成影像检查。共有320对图像体积数据用于模型开发（n=262）和测试（n=58）。数据按患者划分：27名患者（79%）用于模型开发，7名患者（21%）用于测试，两组患者之间无重叠。超参数优化使用了5折交叉验证，患者在开发数据上的分配是按层进行的。最终模型基于27名开发患者的全部262对数据进行训练。7名测试患者的全部58对数据仅用于最终评估，且在模型开发过程中未被使用。

跨领域测试使用了8名接受5次分次放射治疗的患者的1.5特斯拉MR-Linac图像（TR: 1300 ms, TE: 87 ms），生成了72对测试对，这些图像来自分次间的3D T2WI MRI扫描。混合领域测试评估了不同扫描仪类型之间的配准效果，这些患者同时接受了纵向MRSim随访和MR-Linac治疗。每个患者的MRSim时间点都与其对应的第一次MR-Linac治疗分次进行了对齐，生成了42对混合领域测试对（图1B）。这些患者未用于模型训练。

2.2. ProRSeg网络架构与训练细节
图1A展示了ProRSeg的架构：包括一个循环配准网络（RRN）和一个循环分割网络（RSN），两者同时进行优化。RRN通过8次CLSTM迭代来细化变形场；RSN使用9次CLSTM步骤进行分割。RRN的优化结合了图像相似性（Lsim，基于补丁的均方误差）、变形平滑度（Lsmooth=‖?u‖2）和加权分割正则化（Lcons）。我们的分割正则化损失通过使用加权Dice（DSC）损失来调整ProRSeg方法，赋予高度变形的器官（如膀胱）比直肠和临床靶区体积（CTV）更高的重要性。分割正则化损失在每次CLSTM步骤计算，通过逐步细化的轮廓提供深度监督。该损失计算公式为：
$$Lcons = \sum_{i=0}^{N} \sum_{k \in K} w_{k1-DSC} y_f^{k,g}, x_m, y_m, k_i, x_m, h_g^i $$
其中：κ=膀胱、直肠、前列腺；$w_{\text{膀胱}}=0.40$，$w_{\text{直肠}}=0.30$，$w_{\text{前列腺}}=0.30$。DSC表示Dice相似系数，$y_f$是目标或固定图像的分割结果，$g()$是RRN的输出，$x_m$和$y_m$是经过CLSTM步骤i处理后的移动图像和传播的轮廓，$h_g^i$是相应的隐藏状态。总配准损失结合了图像相似性、变形平滑度和分割一致性：
$$L_{\text{total}} = L_{\text{sim}} + \lambda_{\text{smooth}} L_{\text{smooth}} + \lambda_{\text{cons}} $$
轮廓仅在训练期间用于计算损失，在推理阶段不需要。RSN在每次CLSTM步骤中使用多类别交叉熵损失进行优化，提供深度监督：
$$L_{\text{seg}} = \sum_{t=0}^{N} \log_P y_f^s | x_t, y_t, x_m, h_g^i $$
RSN网络用于多任务训练，训练完成后仅保留ProREnc的RRN，从而在测试期间形成一个单一的骨干网络。

通过网格搜索优化了损失权重，评估了λsmooth ∈ {1, 10, 30, 50}和λcons ∈ {1, 5, 10}的不同组合。最佳模型在验证集上选择，其中λsmooth为30，λcons为5。

2.3. 几何指标
ProRSeg在保留的同领域、跨领域和混合领域数据集上进行了评估。在同领域数据集上，ProRSeg与刚性配准基线和两种迭代方法（SyN[26]，[27] 和 Evolution[28]）进行了比较。使用Dice相似系数（DSC）、第95百分位Hausdorff距离（HD95）和平均距离一致性（MDA）量化了膀胱、直肠、CTV和尿道的几何精度。VoxelMorph采用其原始的单一骨干架构，其中一个U-Net预测变形场（DVF），空间变换器将移动图像和分割掩码扭曲到目标空间。对于VoxelMorph-Seg，在训练期间应用了特定于器官的Dice损失，并通过空间变换器反向传播以规范DVF预测。

每个治疗分次的剂量分布使用模型生成的变形场和三线性插值（trilinear）及最近邻插值（nearest-neighbor）重新采样到256×256×128体素。对于混合领域数据对，MRSim图像被刚性对齐到MR-Linac的第一次治疗分次。分割掩码使用临床验证的自分割系统生成，并得到放射肿瘤科医生的批准。强度值被剪切到第10和第90百分位，并缩放到[0,1]范围内。

---

**3. 结果**
3T MRSim和1.5T MR-Linac平台之间的成像差异（补充图S1）给跨数据集模型应用带来了挑战，我们通过使用分割正则化的ProRSeg解决了这一问题。在同领域（MRSim-MRSim）数据上（图2），所有非刚性方法的平均CTV DSC值均超过0.80，ProRSeg的DSC值为0.85±0.04。对于高度变形的器官（如膀胱和直肠），ProRSeg的准确性最高（膀胱：DSC 0.88，HD95 2.99 mm；直肠：DSC 0.86，HD95 2.50 mm），其次是Evolution（膀胱：DSC 0.81，p < 0.001；直肠：DSC 0.83，p < 0.001）。所有方法在尿道的表现最差（ProRSeg：DSC 0.52，HD95 3.05 mm；Evolution：DSC 0.60，HD95 3.17 mm）。

ProRSeg在所有膀胱、直肠和CTV指标（DSC、HD95、MDA；所有p < 0.001）以及尿道的DSC和MDA指标（p < 0.001）上显著优于VoxelMorph。与VoxelMorph-Seg相比，ProRSeg在所有结构上均获得了更好的DSC结果（p < 0.05）。完整指标和统计细节见补充表S4。ProRSeg在同领域和混合领域数据集上对膀胱和CTV的精度与同领域数据相当（表1）。直肠和尿道的准确率在混合领域数据集中略高于同领域数据集，但在混合领域的准确性明显较低，表明MRSim-MR-Linac对齐存在挑战。剂量-体积直方图（DVHs）是使用ProRSeg对膀胱、CTV（肿瘤控制体积）、直肠和尿道进行剂量累积后得出的。图中显示了平均值（实线）、±一个标准差（浅色阴影区域）以及最小值到最大值的范围（最浅的阴影区域）。对于前列腺CTV，95%的目标体积始终接收到至少40.3 Gy的剂量，且标准差较小，表明尽管存在解剖结构差异，但覆盖范围仍然足够。对直肠DVH的分析显示，总体上对直肠组织的保护效果较好，平均值表明只有25%的直肠体积接受了超过20 Gy的剂量。值得注意的是，所有患者都满足了V30的限制要求，而大多数患者也满足了V24的限制要求（即接受24 Gy剂量的体积）。在剂量中间区域（10–30 Gy），标准差的范围相对较宽，这突显了在治疗过程中根据患者具体情况进行适应性调整策略的重要性。尿道大约有80%的体积接受了30 Gy的剂量，在超过40 Gy后剂量迅速下降。

使用跨领域MR-Linac-MR-Linac数据集（图5）评估了机构剂量约束的合规性。所有病例（100%）都达到了平均目标剂量约束（CTV平均剂量≥40.4 Gy），83.3%的病例满足了覆盖要求（CTV D95≥40.0 Gy）。只有9.5%的病例的CTV平均剂量低于42.0 Gy，表明超出机构标准的剂量增加情况并不常见。膀胱的剂量约束（D50≤20.0 Gy）在83.3%的病例中得到满足，其余病例尽管进行了适应性规划，但仍显示出较高的膀胱暴露量。

**图5.** 散点图显示了基于ProRSeg计算的CTV和膀胱剂量分布以及机构剂量约束（n=42例患者）。

**4. 讨论**
本研究评估了ProRSeg，这是一种基于分割正则化的DIR模型，用于多领域MR引导的前列腺癌放射治疗。ProRSeg为跨领域和同一领域的数据集生成了可靠的DIR（Dirección de Radiosondaje，即放射方向）模型，并被应用于剂量累积分析以评估临床合规性。剂量累积分析证明了ProRSeg在临床合规性评估中的可行性。结果显示，平均CTV剂量的合规性达到100%，CTV D95覆盖率的合规性为83.3%，同时膀胱组织的保护效果也得到了保障，这些数据为治疗方案的优化提供了反馈。本研究展示了使用器官特定权重（膀胱：0.40，直肠：0.30，前列腺：0.30）的分割正则化训练对于实现高度变形器官的可靠性能的重要性。这种权重设置确保了将每日剂量分布映射回参考解剖结构的几何准确性，从而能够进行累积剂量约束的评估。这些结果与心脏成像[14]和盆腔CT-CBCT[29]中展示的分割引导配准原理一致，并通过对VoxelMorph进行分割正则化训练直接验证了其性能提升。我们工作中使用的分割正则化方法与用于约束配准的输入条件处理或掩码方法不同，后者始终需要将目标分割掩膜作为输入[30][31][32]来计算配准的成本函数[23][34]。因此，在推理过程中，我们的方法不需要目标分割。

尽管我们的研究在跨领域和同一领域的数据集上都显示出相似或更好的性能，但之前的研究[35]表明不同领域数据集之间的泛化能力较差；然而，我们的研究重点是在同一患者在不同场强（3 T MRSim vs. 1.5 T MR-Linac）条件下进行跨领域DIR分析，且治疗过程中解剖结构变化较小。相比之下，Chaudhari等人[35]考虑了疾病阶段、标记协议和扫描仪差异等多种因素。我们在3个月随访间隔时进行的纵向DIR扫描显示，即使在相同领域内成像（MRSim-MRSim），性能也出现了显著下降，这与他们关于解剖结构变异性的发现一致。

ProRSeg采用了VoxelMorph的注册网络架构，但增加了用于逐层变形的CLSTM层和仅在训练阶段使用的分割子网络作为多任务学习的目标，而在测试阶段则省略了该分割子网络。因此，在测试过程中仅使用单一的骨干注册网络，这与VoxelMorph和VoxelMorph-Seg方法的处理方式一致。在MRSim测试集上，VoxelMorph-Seg的性能有了显著提升（例如，直肠的剂量标准一致性DSC从0.65提高到了0.84），证实了分割正则化对注册精度的好处。ProRSeg进一步提升了性能（直肠DSC达到0.86），与VoxelMorph-Seg相比，所有结构的剂量标准一致性差异都具有统计学意义（p<0.05）。对于跨领域泛化（MR-Linac-MR-Linac），VoxelMorph-Seg在跨领域数据上的表现较训练数据有所下降。另一方面，ProRSeg相对于训练领域保持或提升了性能，表明分割子网络提供的多任务学习增强了测试性能，即使在测试过程中不再使用分割网络也是如此。这一结果与之前的研究一致，这些研究指出多任务训练可以提高泛化能力[36][37][38]。当训练和测试领域相同时，单一任务训练方法可能更为高效；而对于多领域应用来说，多任务训练方法具有优势。

尽管ProRSeg在跨领域上的表现良好（剂量标准一致性DSC：0.51， HDR95：3.97 mm），但在尿道方面的表现不如Evolution方法（剂量标准一致性DSC：0.61， HDR95：3.17 mm），这表明直接使用DIR计算方法难以准确处理细小的管状结构。

本研究存在一些局限性。首先，领域泛化分析仅考虑了两种不同的采集平台。未来的分析将扩展到多机构数据。其次，我们的剂量合规性分析只是一个初步的可行性研究，大规模分析将是后续的工作重点。此外，我们的剂量累积分析仅使用了ProRSeg生成的变形数据，因此与其它方法的比较只能显示方法之间的差异，不足以确定与真实值的准确性。未来可以考虑结合具有已知变形的数字孪生模型或物理模型来评估变形矢量场的准确性。计划使用数字孪生模型或具有已知变形的物理模型来进行进一步评估。最后，与以往的研究一致，我们使用了基于轮廓的指标来评估配准精度[39][40][41]。如先前研究所指出的[3][42]，对于包括膀胱、直肠和前列腺在内的高度可变形器官，目标配准误差（TRE）难以识别。尽管如此，据我们所知，本研究首次提供了从DL-DIR方法的泛化性能评估到基于剂量累积的临床合规性评估的完整分析流程。此外，跨领域泛化解决了医学成像领域适应性的关键挑战[43]，即在不同的成像协议下保持性能是临床应用的一个障碍。

**伦理批准**
这项回顾性分析得到了MSKCC机构审查委员会的批准。

**作者贡献声明**
Sudharsan Madhavan：撰写原始草稿、可视化处理、验证、软件开发、方法设计、数据整理、概念构建。
Chengcheng Gui：数据整理、正式分析。
Lando Bosma：验证、方法设计、正式分析。
Josiah Simeth：撰写、审稿与编辑、软件开发、数据整理、正式分析。
Jue Jiang：验证、软件开发、正式分析。
Nicolas C?té：验证、数据整理。
Nima Hassan Rezaeian：验证、数据整理。
Himanshu Nagar：撰写、审稿与编辑、资源管理。
Victoria Brennan：撰写、审稿与编辑、方法设计、数据整理、概念构建。
Neelam Tyagi：撰写、审稿与编辑、项目管理、方法设计、资金获取、概念构建。
Harini Veeraraghavan：撰写、审稿与编辑、项目管理、方法设计、资金获取、概念构建。

联系信箱：

粤ICP备09063491号

热点排行