基于多期相DCE-MRI深度学习的乳腺癌Ki-67表达术前预测模型的构建与验证

《Frontiers in Oncology》：A deep learning model based on multiphase DCE-MRI for preoperative prediction of Ki-67 expression in breast cancer

【字体：大中小】 时间：2026年03月17日 来源：Frontiers in Oncology 3.3

编辑推荐：

　　本文推荐一篇聚焦人工智能辅助精准医疗的前沿研究，其开发并验证了一种基于多期相动态对比增强磁共振成像(DCE-MRI)的深度学习方法，用于术前、无创地准确预测乳腺癌的关键增殖标志物Ki-67表达水平，为个体化治疗决策提供了新的有力工具。

引言

乳腺癌是全球女性中最常被诊断的恶性肿瘤，也是癌症相关死亡的主要原因，其异质性导致生物学行为、临床预后和治疗反应存在显著差异。作为细胞增殖的成熟标志物，Ki-67与乳腺癌的肿瘤增殖活性和侵袭性密切相关。大量证据表明，升高的Ki-67表达与较差的临床结局、复发风险增加以及不良病理特征相关。圣加仑国际专家共识和中国抗癌协会乳腺癌诊疗指南均强调Ki-67作为指导个体化治疗的关键生物标志物的临床相关性，广泛采用的20%阈值用于区分低表达与高表达。低风险肿瘤应避免过度治疗，而高风险肿瘤则需要强化干预。然而，Ki-67表达的评估主要依赖于空心针穿刺活检和术后组织病理学检查，前者具有侵入性且易产生取样偏倚，后者结果滞后，无法提供及时的临床指导。因此，术前准确评估Ki-67表达水平对评估乳腺癌侵袭性至关重要。虽然组织病理学是检测Ki-67的金标准，但其为术后侵入性检查，无法为术前治疗计划提供实时指导。相比之下，基于动态对比增强磁共振成像的Ki-67预测是一种术前无创的影像学方法，不仅能避免空心针穿刺活检的取样偏倚和侵入性，还能在术前为乳腺癌患者实现及时、个性化的治疗决策。

磁共振成像在个性化乳腺癌管理中占有重要地位。具体而言，动态对比增强磁共振成像通过追踪组织灌注和微血管通透性，提供了一种无创可视化肿瘤血流动力学的手段。许多研究已应用机器学习方法开发基于动态对比增强磁共振成像的模型，用于预测Ki-67表达水平、分子亚型、新辅助化疗反应及患者预后。然而，许多先前的研究受限于对主观影像特征的依赖，这些特征因放射科医生经验而异，且采用的特征大多为手动设计的影像组学特征。

深度学习技术通过多层神经网络架构自动提取高级的、抽象的数据特征，从而最大限度地减少对手工特征工程的依赖，并有效捕捉视觉数据中复杂的、与任务相关的模式。在Ki-67预测方面，一些研究开发了基于多参数磁共振成像的影像组学-深度学习融合模型，其术前预测性能优于传统影像组学方法。然而，大多数现有研究仅依赖于单期相动态对比增强磁共振成像，从而限制了全面获取造影剂通过期间的时间动态信息，而这对于评估肿瘤微环境异质性至关重要。因此，需要进一步研究探索通过深度学习模型结合多期相动态对比增强磁共振成像对乳腺癌Ki-67表达进行无创评估。在各种深度学习架构中，DenseNet121因其独特的密集连接设计而成为本研究中特别合适的框架。在该架构中，每个卷积层接收来自所有先前层的直接输入，这促进了有效的特征重用，缓解了梯度消失问题，并增强了模型捕捉多期相成像序列中细微时空依赖性的能力。这些属性使得DenseNet121在数据可用性有限的临床场景中具有高度优势，因为它可以充分利用多期相动态对比增强磁共振成像固有的丰富时空信息，而无需过大的数据集。

本研究旨在利用多期相动态对比增强磁共振成像和DenseNet121深度学习架构，开发一种用于术前预测乳腺癌Ki-67表达水平的模型。通过利用多期相动态对比增强磁共振成像序列固有的丰富时空信息，我们寻求建立一种准确、可靠的无创评估Ki-67表达的方法，从而促进乳腺癌临床管理中的个性化治疗规划。

材料与方法

患者

本研究为回顾性分析，经相关单位伦理委员会批准。纳入2017年6月至2024年12月期间确诊的女性乳腺癌患者。纳入标准包括：年龄≥18岁；经组织病理学证实为乳腺癌且有可用的Ki-67表达水平；在初始治疗前一周内进行了磁共振成像检查。排除标准包括：图像质量差；存在其他原发性恶性肿瘤；磁共振成像前有乳腺癌抗癌治疗史。最终共纳入404名患者，并根据其磁共振成像检查时间按7:3的比例随机分配到训练集和测试集。

收集患者的基线数据，包括年龄、绝经状态、病灶位置、病灶数量、最大肿瘤直径、腋窝淋巴结状态。

Ki-67评估

Ki-67增殖指数通过免疫组织化学进行评估。使用10%中性缓冲福尔马林固定组织标本并石蜡包埋。制备厚度为4微米的连续切片。切片与一抗孵育，然后与辣根过氧化物酶偶联的二抗孵育。使用3,3’-二氨基联苯胺作为显色剂进行免疫检测。具有明显棕色染色的细胞核被视为Ki-67表达阳性。Ki-67指数通过量化阳性染色细胞数与细胞总数的比率来计算。在本研究中，参考2015年圣加仑共识，将患者分为低Ki-67表达组和高Ki-67表达组。对于多发灶患者，使用最大病灶的组织进行Ki-67指数的组织病理学评估。

磁共振检查与图像预处理

磁共振扫描在3.0T扫描仪上进行。患者在俯卧位下进行检查。扫描范围覆盖双侧乳房和腋窝。注射对比剂前，获取轴向T1加权快速自旋回波序列。动态对比增强成像使用脂肪抑制序列。钆喷酸葡胺以2毫升/秒的速率经肘前静脉注射。

本研究从多期相动态对比增强磁共振成像序列中选择了四个关键时间点：对比剂注射前的平扫期、早期、峰值期和晚期。在对原始数据进行匿名化、各向同性重采样和N4偏置场校正后，使用平扫期作为参考进行图像配准。此程序最大限度地减少了由扫描参数引起的变异，并确保了后续定量成像特征的一致性和可比性。

肿瘤分割

使用ITK-SNAP软件进行感兴趣体积的分割，选择最大横截面积作为模型输入。两位分别具有7年和8年放射学经验的放射科医生在不知道临床和病理信息的情况下独立手动勾画感兴趣体积。为了测试分割方案的可靠性，从研究队列中随机选择30个病例进行观察者间和观察者内一致性评估。一位放射科医生在4周间隔后重复了分割。使用戴斯相似性系数来评估不同分割之间的一致性。观察者间一致性的戴斯相似性系数为0.91，观察者内一致性的戴斯相似性系数为0.89，这表明我们的感兴趣体积分割是稳定且可重复的。当磁共振成像上存在多个可疑乳腺病灶时，仅选择最大的一个进行分析。

模型开发与验证

研究总体工作流程如图所示。我们使用DenseNet121作为主干网络，构建了四个单期相深度学习模型，每个模型处理来自四个期相中某一个的最大横截面病灶区域。为了减轻过拟合，所有模型均训练50个周期，并使用数据增强和归一化。优化采用随机梯度下降。每个单期相深度学习模型的输出概率构成了其各自的深度学习特征签名。然后，使用梯度提升决策树将这四个特征签名整合起来，构建一个多期相预测模型。最后，我们将梯度加权类激活映射应用于DenseNet121模型，以可视化解释其决策过程并识别对分类最关键的图像区域。

通过分析受试者工作特征曲线来评估模型的诊断性能。计算曲线下面积及其95%置信区间以量化判别能力，并使用DeLong检验比较模型之间的曲线下面积差异。此外，我们还计算了准确度、灵敏度、特异度和F1分数作为补充性能指标。分别使用校准曲线和决策曲线分析进一步评估了模型的稳健性和临床适用性。为了解释模型决策，我们应用了SHAP分析。计算出的SHAP值以两种方式可视化：说明全局特征重要性的摘要条形图，以及显示个体特征值分布和影响的蜂群图。

统计分析

连续变量总结为平均值±标准差，并使用独立样本t检验或Mann-Whitney U检验进行比较。分类变量以频率和百分比表示，使用卡方检验或Fisher精确检验进行比较。使用DeLong检验评估模型之间曲线下面积的差异。所有检验的双尾p值≤0.05定义为具有统计学意义。

结果

患者特征

总共404名乳腺癌患者被随机分配到训练集和测试集。训练集和测试集中高Ki-67表达患者的比例相当。如表1所示，两组在年龄、绝经状态、病灶位置、病灶数量、最大肿瘤直径或腋窝淋巴结状态方面未观察到统计学上的显著差异。单变量和多变量逻辑回归分析确定腋窝淋巴结状态是高Ki-67表达的独立预测因子，随后用于构建临床模型，在测试集上实现了0.587的曲线下面积。

单期相深度学习模型的性能

我们对三种架构进行了比较，以确定最佳模型。结果表明，DenseNet121在测试集的每个单期相中表现出最高的曲线下面积，并且训练和测试性能之间的差异最小。因此，我们选择它作为基础架构。单期相深度学习模型在测试集上的性能总结如表4。其中，SP_DL3表现出最稳健的整体性能，实现了0.761的最高曲线下面积和0.787的最高准确度，具有良好平衡的灵敏度(0.811)和特异度(0.719)。

梯度加权类激活映射热图证实，模型的决策过程集中于瘤内区域。图3展示了两名患者的代表性梯度加权类激活映射可视化结果。

融合深度学习模型的性能

四个深度学习特征签名在高、低Ki-67表达组之间显示出显著差异。四个深度学习特征签名的整合使得能够构建一个基于梯度提升决策树的多期相融合模型，该模型在独立测试集中实现了0.810的曲线下面积。DeLong检验证实，该曲线下面积显著优于所有单期相深度学习模型。随后，将四个深度学习特征签名与腋窝淋巴结状态相结合，开发了临床多期相梯度提升决策树模型。总结如表4，临床多期相梯度提升决策树模型在测试集上达到了0.814的曲线下面积、0.787的准确度、0.800的灵敏度和0.750的特异度，表现出与多期相梯度提升决策树模型相当的性能。

校准曲线显示，临床多期相梯度提升决策树模型和多期相梯度提升决策树模型的预测结果与实际结果之间具有良好的一致性。决策曲线分析表明，在0.3至0.9的阈值概率范围内，两种模型都比“全部治疗”和“全部不治疗”策略提供了更高的净收益。模型的受试者工作特征曲线、校准曲线和决策曲线如图4所示。

通过SHAP分析对特征重要性进行评估表明，SP_DL3签名是多期相梯度提升决策树模型和临床多期相梯度提升决策树模型预测中最重要的贡献者。基于平均绝对SHAP值的条形图显示了每个特征的相对贡献。此外，蜂群图详细展示了每个特征值如何影响模型预测，显示了它们对所有样本效应的密度和方向。

讨论

本研究通过整合临床数据和从动态对比增强磁共振成像中提取的深度学习特征签名，开发并验证了用于术前评估乳腺癌Ki-67表达水平的预测模型。在评估的临床变量中，腋窝淋巴结状态被确定为独立预测因子。在峰值期动态对比增强磁共振成像图像上训练的单期相深度学习模型优于其他单期相模型。此外，多期相深度学习融合模型和临床多期相融合模型均表现出优于所有单期相深度学习模型的性能，且两种融合方法的性能无显著差异。SHAP分析显示，SP_DL3签名是融合模型中最有影响力的特征。

我们的研究采用DenseNet121作为主干网络，利用其密集连接促进特征重用并缓解梯度消失。这些特性在数据稀缺的场景中尤其有益。我们将其性能与医学成像中其他常见架构进行了比较。在我们小样本量的背景下，DenseNet-121实现了更高的预测性能，并表现出更优越的训练-测试稳定性。其密集连接设计促进了特征重用并减轻了梯度消失，降低了过拟合风险。为了验证模型的关注点，我们生成了梯度加权类激活映射可视化，这证实了所有单期相模型的注意力图都适当地集中在瘤内区域，从而为其决策过程提供了可解释的支持。

在单期相深度学习模型中，在峰值期动态对比增强磁共振成像图像上训练的模型表现出优越的性能，突显了峰值增强期内嵌入的独特信息。峰值期深度学习特征对Ki-67表达增强的预测能力可以通过其捕捉肿瘤微血管通透性和灌注最大状态的能力来解释，这两个基本病理特征与Ki-67介导的细胞增殖密切相关。然而，这些研究大多依赖于成像特征或传统影像组学。相比之下，本研究将这种生理机制与深度学习相结合，使SP_DL3能够在Ki-67预测中实现更高的准确性。

多期相深度学习模型实现了比所有单期相模型具有统计学意义的性能提升。这一结果强调了整合时间信息的价值，因为不同期相共同提供了肿瘤微环境更全面的表征，从而产生更稳健的预测。我们的发现与日益增长的对多期相方法的共识相一致。

多变量逻辑回归分析确定腋窝淋巴结状态是Ki-67表达的独立预测因子，这与先前的研究一致。然而，在我们的研究中，仅基于腋窝淋巴结状态的临床模型仅表现出中等的预测性能。相比之下，将腋窝淋巴结状态与四个单期相深度学习特征签名整合的融合模型实现了0.814的曲线下面积，这与仅使用这些特征签名的模型相当。两种模型之间未观察到统计学上的显著差异，这表明除了多期相深度学习特征签名之外，纳入腋窝淋巴结状态并未提供额外的预测价值。这些结果意味着，从多期相动态对比增强磁共振成像衍生的深度学习特征签名可能已经固有地捕捉了嵌入在腋窝淋巴结状态中的增殖相关生物学信息。两种融合模型都表现出良好的校准性，并且与默认策略相比，在广泛的决策阈值范围内表现出更优越的临床净收益。这些模型有效地识别了高Ki-67表达的患者，从而能够进行准确的风险分层以指导治疗决策。总之，我们的研究结果支持基于预测的增殖活性对个体化调整新辅助和辅助治疗强度。

SHAP分析量化了SP_DL3作为集成模型中预测的主要驱动因素，突显了峰值期信息的主导地位。蜂群图进一步说明了特征值的变化如何影响高Ki-67表达的预测概率。在这些图中，红色标记的高特征值一致地表明高Ki-67表达的高预测概率接近1，而蓝点代表接近0的低预测概率。这种SHAP可解释性和梯度加权类激活映射注意力图共同创建了一个透明且可查询的系统，有效缓解了“黑箱”问题。这种全面的可解释性对于建立临床医生信心至关重要，并促进我们的人工智能方法转化为实际应用。

决策曲线分析证实，两种融合模型在0.3至0.9的阈值概率范围内提供了有利的净临床效益。为了支持对活检结果处于临界状态的患者进行临床决策，我们使用临床多期相融合模型训练集的最大约登指数确定了一个初步的临床截止值。当模型预测的高Ki-67表达概率超过此最佳阈值时，临床医生可能会更重视模型预测，而非临界性的空心针穿刺活检结果。这个预定义的截止值在独立的测试集中得到了进一步验证，并显示出稳定的性能。然而，在将该方法纳入常规临床实践之前，仍需要进行前瞻性的多中心验证。最后，阐明我们的多期相动态对比增强磁共振成像深度学习模型的临床角色非常重要。该模型并非旨在取代组织病理学这一评估Ki-67表达的金标准，而是作为一种有价值的术前辅助工具。一方面，我们的模型能够无创、快速地评估Ki-67表达。另一方面，通过关注最大的肿瘤横截面而不是局部组织取样，我们的深度学习方法提供了相对全面的肿瘤异质性视图。通过这种方式，它有助于解决病理检测的侵入性、取样偏倚和及时性限制。我们的方法可以改善乳腺癌患者的术前风险分层，并为临床实践中更合理的个性化治疗决策提供支持。模型的良好校准和高净效益进一步证实了其临床转化的潜力。

本研究有几个局限性。首先，样本量相对较小；因此，在未来研究中扩大队列对于提高统计功效和普适性至关重要。第二，该研究是在单一机构回顾性进行的。使用历史数据可能会引入选择偏倚，未来的工作应涉及前瞻性、多中心验证。第三，深度学习分析仅依赖于动态对比增强磁共振成像图像。结合额外的磁共振成像序列，如扩散加权成像和T2加权成像，可以提供更全面的肿瘤表征，并可能提高诊断准确性。

总之，我们的研究表明，基于多期相动态对比增强磁共振成像的深度学习融合模型允许对乳腺癌Ki-67状态进行无创且准确的术前预测。我们模型设计的两个关键创新是核心。首先，深度学习模块专门定制用于从多期相动态对比增强磁共振成像中提取时间特征。其次，自动学习到的深度特征被输入到梯度提升决策树模型中，该模型保留了深度学习强大的特征学习能力，同时有效减轻了过拟合并增强了模型的可解释性。整合梯度加权类激活映射和SHAP等可解释人工智能技术进一步提高了模型决策过程的透明度。该模型有助于解决病理学Ki-67评估的一些临床局限性，并具有作为乳腺癌个性化管理术前辅助工具的强大潜力。

热点排行

新闻专题