综述：从影像学到多组学：深度学习在骨肿瘤诊断中连接MRI与液体活检

《Journal of Bone Oncology》：From imaging to omics: deep learning is bridging MRI and liquid biopsy in bone tumor diagnosis

【字体：大中小】 时间：2026年03月03日 来源：Journal of Bone Oncology 3.5

编辑推荐：

　　本文聚焦于骨肿瘤诊断的精准医学前沿，系统综述了如何通过多模态深度学习框架，将能提供高分辨率解剖信息的磁共振成像（MRI）与可无创获取肿瘤分子特征的液体活检（liquid biopsy）技术（包括循环肿瘤DNA（ctDNA）、微小RNA（miRNA）等）进行深度融合。文章详述了该整合策略在骨肉瘤、尤文肉瘤等原发性骨肿瘤的早期诊断、亚型分类、疗效监测（如化疗反应评估）、预后预测（如转移风险、生存期）及微小残留病灶（MRD）检测等方面的应用潜力和初步临床证据，并探讨了所面临的挑战与未来发展方向。

^{1. 引言}

原发性骨肿瘤，如骨肉瘤和尤文肉瘤，因其生物学异质性、影像学特征重叠及分子图谱多样，始终是肿瘤学中最复杂的诊断挑战之一。传统诊断方法，如组织活检和解剖成像，提供的信息往往有限或碎片化。磁共振成像（MRI）在肿瘤形态和灌注动力学评估中扮演核心角色，但其解读很大程度上依赖于放射科医师的经验，且缺乏对驱动肿瘤行为的分子改变的洞察。与此同时，液体活检通过分析循环肿瘤DNA（ctDNA）、RNA、外泌体等生物流体成分，已成为肿瘤学领域的变革性工具，为评估肿瘤负荷、突变谱、克隆演变乃至微小残留病灶（MRD）提供了微创手段。然而，单独的液体活检数据通常缺乏空间背景信息，且在早期疾病中检测灵敏度受限。深度学习，作为人工智能的一个子集，为此提供了新的范式。它擅长识别跨数据类型的复杂、高维模式。最近的多模态深度学习进展使得影像数据（如MRI）与通过液体活检获得的基因组、转录组或表观基因组信息得以整合，从而构建出对肿瘤更全面、系统级的视图。这种多模态融合方法有望解锁超越单一成像或组学技术的诊断能力。本综述探讨了通过深度学习驱动的多模态框架，将MRI与液体活检协同整合的现状与前景。

^{2. MRI在骨肿瘤评估中的应用}

磁共振成像在评估骨肿瘤方面作用关键，常用于区分良恶性病变、描绘骨内范围、评估软组织侵犯以及指导分期和手术计划。良性病变通常边界清晰、信号均匀、强化程度低，而恶性肿瘤往往边界不清、在T₁加权像上显示不均匀的骨髓替代、在T₂/STIR序列上呈高信号，并具有侵袭性的灌注或扩散特征。MRI对于局部分期、评估皮质突破、神经血管受累和跳跃性转移也至关重要。基于U-Net（尤其是3D U-Net变体）的架构已用于骨磁共振图像（及类似的CT/PET研究）中的病灶自动勾画，这些方法报告了较高的分割精度（Dice系数约为0.85–0.9），实现了可重复且高效的肿瘤体积估算，用于后续的影像组学分析。一项使用EfficientNet-B0模型对超过1000个经组织学确认的骨病变常规T₁和T₂加权磁共振图像进行分析的里程碑式工作，在外部验证中取得了约0.79–0.82的曲线下面积（AUC）值，其性能与经验丰富的放射科医师（准确率约76%）相当。MRI衍生的影像组学特征（纹理、形状、强度等）与深度学习特征相结合，越来越多地用于预测临床相关结局，如转移风险或总生存期。例如，在前列腺癌骨转移中，多参数MRI影像组学结合临床数据（如PSA水平、Gleason评分）在治疗前预测骨转移状态方面取得了约0.92的AUC。

^{3. 液体活检与多组学在骨肿瘤中的应用}

骨肿瘤的液体活检是一个新兴但尚不成熟的领域。循环肿瘤DNA（ctDNA）指的是死亡肿瘤细胞释放到血液中的短DNA片段，通常占细胞游离DNA（cfDNA）总量的不到1%。cfDNA清除半衰期仅数小时，意味着其水平可实时反映肿瘤负荷，这是监测和早期检测的关键优势。数字PCR（ddPCR）可实现低至约0.01%突变等位基因频率的检测，非常适合追踪已知的热点突变或融合。CAPP-Seq能够量化极罕见的变异。靶向二代测序（NGS）panel，包括肿瘤知情MRD检测（如Signatera），通过分析患者肿瘤组织，选择数十至数千个个体化体细胞变异，然后在连续血浆样本中进行追踪，以超高特异性监测MRD。新一代液体活检方法现已超越单纯检测突变；它们分析cfDNA中的片段化模式和表观遗传标记，以推断基因表达或组织来源。一个显著的例子是EPIC-Seq（表观遗传表达推断cfDNA测序），它靶向选定基因的启动子区域，并使用启动子片段熵（PFE）和核小体缺失区域（NDR）深度等片段组学指标，从cfDNA推断转录活性。液体活检应用在乳腺癌、肺癌、结直肠癌、前列腺癌和血液系统恶性肿瘤中已显示出重要前景，特别是在突变检测、耐药性监测和MRD评估方面。相比之下，在原发性骨肿瘤（如骨肉瘤、尤文肉瘤、平滑肌肉瘤）中的应用仍处于起步阶段，但新兴研究令人鼓舞。在骨肉瘤中，靶向NGS研究揭示了ctDNA中的TP53、ATRX、DLG2和MET突变以及染色体拷贝数增加（如8q），其水平与肿瘤负荷和临床病程相关。软组织肉瘤液体活检综述表明，简单核型肿瘤（如尤文肉瘤、胃肠道间质瘤、促结缔组织增生性小圆细胞肿瘤）适合ddPCR或突变靶向检测，而复杂核型恶性肿瘤（如骨肉瘤、平滑肌肉瘤）则需要更广泛的panel，目前更具挑战性，但初步NGS panel已在约75–86%的平滑肌肉瘤队列样本中检测到ctDNA。循环miRNA和长链非编码RNA（lncRNA）已在骨肉瘤中得到评估。例如，几种致癌miRNA（如miR-21、miR-221、miR-214等）在患者血清中升高并与不良预后相关，而肿瘤抑制miRNA则常常减少。最近骨肉瘤的液体活检生物标志物主要集中在循环核酸（miRNA、lncRNA、环状RNA（circRNA）、ctDNA）和细胞/囊泡成分（循环肿瘤细胞（CTC）和细胞外囊泡（EV））。这些panel仍处于探索阶段，但已有几个panel在人类队列中显示出诊断和预后价值。循环miRNA已成为诊断、分期、转移和治疗反应的微创标志物。例如，miR-497和miR-125b在骨肉瘤中通常下调，其较低水平与晚期、远处转移、不可切除疾病和化疗反应差相关。其他microRNA，包括miR-21、miR-27a、miR-199a-5p和miR-195家族成员，已被报道在骨肉瘤中失调。血清lncRNA，包括91H和UCA1，在骨肉瘤中升高并与肿瘤体积增大、晚期和不良预后相关，而循环circRNA在血液中表达改变，似乎与疾病负荷和结局相关。携带肿瘤特异性突变或拷贝数变异（CNV）的ctDNA可在部分骨肉瘤患者中检测到，尽管灵敏度仍然有限；cfDNA的片段组学分析可能会提高可靠性。经典的血清标志物如乳酸脱氢酶（LDH）和碱性磷酸酶（ALP）仍在临床使用，但缺乏特异性，目前被视为分子检测的补充。骨肉瘤细胞的EV携带肿瘤来源的RNA和蛋白质，提供了稳定的生物标志物“货物”，而CTC在预后方面显示出潜力，但在技术上仍具挑战性。在尤文肉瘤中，针对融合转录本（如EWSR1–FLI1）的ddPCR检测正在评估中，用于复发监测。在平滑肌肉瘤中，更广泛的NGS panel已证明了可行性。总体而言，骨肿瘤的液体活检仍处于早期阶段，但结合ctDNA、片段组学、miRNA/lncRNA/circRNA panel、EV“货物”和CTC指标的多层次方法，很可能提供临床转化所需的灵敏度和特异性。主要挑战包括分析物丰度低、肿瘤异质性高以及检测缺乏标准化。

^{4. 多模态深度学习：架构与融合策略}

骨肿瘤因其显著的生物学异质性、重叠的影像学表现和多样的分子图谱，成为肿瘤学中最复杂的诊断挑战之一。传统的、依赖单一影像学或分子谱的诊断范式通常只能提供零碎且不完整的见解。MRI在描绘肿瘤形态、局部范围、骨髓受累和软组织侵犯方面不可或缺，而液体活检方法则通过循环肿瘤DNA（ctDNA）、RNA和表观基因组信号提供动态分子信息。然而，每种模态单独使用都无法捕捉骨肿瘤生物学的完整空间-分子复杂性。因此，通过多模态深度学习整合这些互补数据流，已成为一种变革性策略，能够在骨肿瘤学中实现更全面、无创和个体化的诊断与预后框架。图1概括了这一多模态流程的整体概念框架，展示了MRI衍生的影像组学特征与液体活检衍生的组学数据在深度学习融合架构中的顺序整合。图神经网络（GNN）和基于Transformer的模型等深度学习架构特别适合多模态融合。GNN擅长建模关系和结构化数据，可将从MRI提取的影像组学特征、ctDNA改变和临床参数表示为互连的节点，并将空间、生物或分子相互作用编码为边。这种基于图的范式能够捕捉跨异构数据源的复杂依赖关系，而基于注意力的GNN变体通过识别信息量最大的影像-分子关系，进一步增强了可解释性。相比之下，Transformer利用自注意力机制动态权衡和整合跨模态的高维特征。在骨肿瘤中，多参数MRI序列（包括T₁加权、T₂加权、扩散加权和对比增强成像）可与ctDNA突变谱、拷贝数改变或甲基化特征相融合。这种在统一架构中学习模态内和模态间依赖关系的能力，使得基于Transformer的模型在肿瘤亚型分类、治疗反应预测和结局分层方面尤其强大。其他恶性肿瘤的影像基因组学研究为多模态融合策略的可行性和转化相关性提供了令人信服的证据。例如，在胶质母细胞瘤中，MRI衍生的影像组学特征与IDH突变状态和MGMT启动子甲基化相关；在肺癌中，CT和PET影像组学特征与EGFR和KRAS改变相关。类似地，乳腺癌研究表明，将MRI特征与基因表达谱结合可以提高治疗反应和复发风险的预测。这些发现验证了一个核心前提：当通过适当的深度学习框架进行分析时，影像表型可以反映潜在的分子过程，这为在骨肿瘤中的应用提供了重要的概念指导。尽管骨肿瘤学的多模态深度学习仍处于早期阶段，但新兴研究提供了令人鼓舞的初步证据。探索性研究已整合了MRI衍生的特征（如肿瘤边缘特征、强化动力学、瘤内异质性和瘤周水肿）与液体活检生物标志物（包括TP53突变、拷贝数变异模式和DNA甲基化特征）。这些融合模型已显示出在提高骨肉瘤患者诊断准确性、区分侵袭性表型以及预测化疗反应方面的潜力。此外，将MRI与连续的ctDNA测量相结合，能够实现对微小残留病灶的纵向监测和早期复发检测，为重复组织活检提供了无创替代方案。除了诊断和监测，多模态深度学习框架在骨肿瘤中还有更广泛的临床应用前景。通过将结构、空间和分子信息在单一模型中对齐，这些方法可支持个体化预后判断、指导治疗强度，并促进临床试验的患者分层。例如，GNN等空间感知架构可以将肿瘤位置和范围与组学数据结合，以优化生存预测；而基于Transformer的融合模型可以捕捉跨模态的全局依赖关系，以增强亚型鉴别能力。随着多模态数据集的扩展和跨学科合作的成熟，通过深度学习整合MRI和液体活检，有望成为骨肿瘤精准肿瘤学的基石，为肿瘤生物学提供更丰富、更准确且更具临床操作性的见解。

^{5. 临床应用与影响}

MRI与液体活检数据（特别是ctDNA）的融合，在骨肿瘤的临床管理中具有变革潜力。当通过深度学习模型（尤其是多模态架构）整合时，这种联合方法提升了诊断精度、治疗监测和结局预测。由于良恶性病变的影像学特征重叠，骨肿瘤的早期准确诊断 notoriously 困难。此外，亚型区分（如区分骨肉瘤与尤文肉瘤或软骨肉瘤）需要侵入性活检和专业病理学。在此，整合MRI影像组学和ctDNA谱的多模态深度学习模型提供了一种创伤更小、更精确的解决方案。例如，从多参数磁共振图像（如T₁、T₂、DWI序列）中提取的影像组学特征可用于量化肿瘤异质性、边缘锐利度和骨膜反应，这些特征因肿瘤类型而异。同时，液体活检可通过突变谱、拷贝数变异和甲基化特征提供分子线索。两者结合，使得模型能够学习与肿瘤生物学相关的细微模式。最近在其他实体瘤（如胶质母细胞瘤和肺癌）中的工作表明，此类融合模型在亚型分类和预测高风险疾病方面优于单一模态系统。对于骨肿瘤，初步数据提示了类似的潜力：早期研究表明，ctDNA可以检测到TP53、RB1和ATRX突变，这可能有助于区分侵袭性骨肉瘤表型。通过在配对的MRI和ctDNA数据上训练深度学习模型，有可能创建即使在早期也能标记不典型或高级别肿瘤的决策支持系统，从而实现及时干预。预测和监测化疗反应仍然是骨肿瘤管理的基石，尤其是在骨肉瘤患者中。传统上，化疗后的肿瘤坏死被用作反应的回溯性标志物，但这需要手术切除，且仅在治疗完成后才能获得。相比之下，多模态深度学习模型可以在治疗期间提供实时、无创的评估。MRI可以捕捉治疗期间肿瘤体积、血管分布和细胞结构的动态变化，这些变化与治疗效果相关。深度学习模型可以训练来检测与组织学坏死相关的、超出人类视觉能力的细微影像特征。几项使用卷积神经网络（CNN）和基于Transformer网络的研究表明，仅使用MRI扫描预测骨肉瘤患者手术前的肿瘤坏死具有前景。当与连续的ctDNA测量（捕捉肿瘤特异性变异或甲基化变化的减少）融合时，这些模型变得更加强大。此外，通过ctDNA进行微小残留病灶（MRD）检测可作为复发风险的替代指标。例如，纵向ctDNA谱已用于尤文肉瘤和横纹肌肉瘤患者，在影像学检测到复发前数月预测复发。这些发现表明，MRI加ctDNA模型可以支持个体化监测策略，减少过度治疗和晚期复发风险。骨肿瘤的预后模型传统上依赖于临床变量，如肿瘤大小、位置、组织学分级和对化疗的反应。然而，这些发现对肿瘤生物学的洞察有限。整合影像和组学数据允许开发更具生物学依据的预后模型，对治疗计划和临床试验分层均有意义。在胶质母细胞瘤和乳腺癌中，结合MRI与基因表达或蛋白质组数据的多模态深度学习模型已被用于将患者分层为具有显著改善准确性的生存风险组。将类似的模型应用于骨肿瘤，在联合MRI影像组学和ctDNA分子谱上进行训练，可能导致个体化生存预测。这些模型可以识别侵袭性分子亚型，例如那些携带染色体碎裂或高基因组不稳定性的亚型，这些与骨肉瘤较差结局相关。此外，如图神经网络等空间感知模型可以将来自影像的肿瘤位置和范围与组学数据结合，以优化预测。这种个体化预后判断可以指导关于治疗强度、手术切缘和纳入实验性治疗试验的决策，为骨肿瘤治疗带来新的精准水平。通过深度学习整合影像和分子数据，临床医生得以获得关于每个肿瘤行为的统一、数据丰富的视图。MRI提供结构和空间洞察，而ctDNA和其他组学方法提供分子背景。两者结合，赋能了更准确、动态和个体化的诊断、监测和预后方法。随着更多多模态数据集的可用，这些融合模型的真实世界部署可能显著减少诊断延迟、优化治疗选择并改善生存结局，标志着骨肿瘤临床管理的范式转变。从未来的临床视角来看，整合MRI和液体活检数据的多模态深度学习框架可以嵌入到原发性骨肿瘤的现实诊断和监测工作流中。在这种路径中，出现可疑骨病变的患者将首先接受标准化的多参数MRI和基于血液的液体活检采样。然后，从磁共振图像提取的影像组学特征和来自循环核酸或细胞外囊泡的分子特征，可以通过多模态深度学习模型联合分析，以实现活检前风险分层和肿瘤表征。在治疗期间，连续的MRI和液体活检评估可以支持基于融合的治疗反应监测和微小残留病灶的早期检测。在确定性治疗后，整合的ctDNA和MRI监测可能有助于更早识别复发并指导个体化随访策略。尽管该工作流程具有潜力，但它阐释了一条可行的转化路径，通过该路径，多模态人工智能系统可以在骨肿瘤管理中增强临床决策，同时最大限度地减少侵入性操作。

^{6. 挑战与局限性}

多模态建模中最紧迫的问题之一是输入数据的异质性。MRI采集方案在不同机构间差异显著，包括磁场强度、脉冲序列、分辨率和对比剂设置。这些不一致性给影像组学特征带来了变异性，并限制了跨队列的可比性。类似地，ctDNA检测也缺乏标准化；不同平台（如靶向NGS panel、全基因组亚硫酸氢盐测序或数字PCR）可能产生不同的灵敏度、测序深度和生物信息学输出。此外，标注仍然是一个主要瓶颈。通过MRI进行肿瘤分割通常是手动完成的，需要专家放射科医师，且跨数据集缺乏统一性。在分子领域，对具有临床意义的ctDNA突变进行标记需要广泛的验证，且常常不完整。这造成了嘈杂和稀疏的数据环境，阻碍了模型的稳健性。为缓解这些问题，诸如协调的影像协议（如QIBA标准）和ctDNA分析的通用生物信息学流程等举措正在获得关注。尽管如此，实现真正可互操作的多机构数据集仍是一项进行中的工作。另一个关键问题是当前深度学习模型的泛化能力有限。与肺癌或乳腺癌等常见癌症相比，骨肿瘤较为罕见，导致用于训练复杂多模态模型的数据集相对较小。这常常导致过拟合，即模型在训练集上表现良好，但在未见数据上表现不佳。此外，骨肿瘤特异性的组学数据，特别是来自液体活检来源的，在公共存储库中很稀疏。许多现有研究依赖于从更广泛的肉瘤数据集或其他实体瘤进行外推，这可能无法捕捉骨肉瘤或尤文肉瘤等骨癌的独特分子谱。为克服此问题，已出现几种策略。迁移学习，即在大型数据集（例如来自其他癌症）上预训练的模型在较小的骨肿瘤队列上进行微调。影像的数据增强技术包括通过生成对抗网络（GAN）进行合成图像生成。联邦学习允许模型在多个机构上进行训练而数据无需离开本地服务器，这同时解决了隐私问题和数据集大小问题。现有的合作倡议，如国际软组织肉瘤联盟（INSTRuCT）儿童肉瘤网络，阐明了多国数据共享框架如何加速罕见肿瘤的研究。尽管并非专门为多模态人工智能开发设计，但此类联盟为联邦学习方法提供了一个结构性模型，能够在保护患者隐私和遵守法规的同时，实现多机构模型训练。尽管有这些进展，开发针对骨肿瘤的大型、经过整理和标注的多模态数据集，对于稳健的模型训练和外部验证仍然至关重要。深度学习模型，尤其是那些涉及复杂数据融合架构的，常常被批评为“黑箱”。可解释人工智能（XAI）领域正在通过开发诸如用于影像的显著图（saliency maps）和Grad-CAM等工具来解决这一问题，这些工具可以突出显示影响模型决策的MRI区域。用于组学数据的特征归因方法（如SHAP、LIME）用于识别哪些突变或甲基化模式最具预测性。尽管XAI工具有助于阐明模型“思考”的过程，但将影像特征与特定分子事件明确关联起来仍然复杂，并且需要生物学验证。最终，可解释且可信的模型对于临床采用至关重要。

订阅生物通快讯

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯