《Translational Oncology》:Genetic architecture of multiple myeloma: From somatic alterations to germline susceptibility and clinical implications
多发性骨髓瘤(MM)最好被理解为一个动态演化的基因组生态系统,其受遗传性易感性、早期致癌事件和持续选择压力共同塑造。研究人员提出了一个进化基因组学框架,将胚系风险、疾病起始、克隆多样化和治疗适应整合到一个统一的MM生物学模型中。多基因风险负荷、罕见易感变异以及DNA修复和端粒通路的改变创造了一个允许性背景,影响前体状态和免疫相互作用。原发性细胞遗传学事件,特别是免疫球蛋白重链(IgH)易位和非整倍体,建立了生物学上不同的创始克隆并限制了随后的进化轨迹。疾病进展由继发性染色体改变、拷贝数变化、MYC激活、TP53缺失和结构重排驱动,促进了基因组不稳定性和转录可塑性。纵向研究揭示了由治疗驱动选择塑造的分支克隆结构。在具有进化意识的精准框架内整合胚系和体细胞景观,可能改善风险分层,预测高风险轨迹,并支持实现更持久疾病控制的适应性策略。虽然多基因风险评分(PRS)提供了对遗传性易感性的洞察,但它们尚未用于MM的风险分层或筛查的临床实践,目前仍属于研究工具。该框架为应用基因组生物标志物进行风险分层、治疗选择和纵向监测提供了面向临床的基础。
引言:多发性骨髓瘤定义
多发性骨髓瘤(MM)是一种克隆性浆细胞恶性肿瘤,其特征为单克隆免疫球蛋白(M蛋白)的过度产生。这种扩增伴随着正常免疫球蛋白合成的抑制和进行性骨髓浸润,构成了疾病的病理生理学基础。MM是第二大常见血液系统恶性肿瘤,占新诊断血液系统癌症的15%及近20%的相关死亡率。西方人群发病率为每年每10万人中5-7例,中位诊断年龄接近70岁,突显了其强烈的年龄相关性。临床上,MM由骨髓浸润和终末器官损伤定义,关键特征包括克隆性浆细胞增殖、单克隆蛋白产生以及器官功能障碍,最常累及骨骼、造血功能和肾功能。典型表现包括溶骨性病变、贫血、高钙血症和肾功能不全。诊断标准要求骨髓中≥10%的克隆性浆细胞或活检证实的浆细胞瘤,并伴有单克隆蛋白和骨髓瘤定义事件。
该病的病因基础尚未完全明确,但越来越多的证据表明存在显著的遗传成分。流行病学研究显示,MM患者的一级亲属患病风险增加2至4倍,这支持了遗传性易感性,并推动了对体细胞和胚系遗传决定因素的研究。在过去二十年中,治疗进展改变了MM的管理,蛋白酶体抑制剂(PIs)和免疫调节药物(IMiDs)改善了连续治疗时代的总生存期(OS)。尽管取得了这些进展,MM在很大程度上仍然无法治愈,这主要是由于内在和获得性耐药。临床和分子研究表明,复发几乎不可避免,治疗难治性驱动了疾病进展和死亡。在生物学层面,耐药性源于多种机制,包括基因组不稳定性、表观遗传改变、缺陷凋亡信号传导、免疫系统失调以及恶性浆细胞与骨髓微环境之间的保护性相互作用。高通量分子谱分析加强了对耐药机制的特征描述和风险分层,支持基于生物学的合理治疗选择及机制导向的治疗策略发展。总之,这些进展支持基于生物标志物的风险适应性治疗策略。
风险因素与遗传易感性
MM被认为是一种多因素疾病,源于衰老、环境暴露、前体疾病状态和遗传性易感性的综合作用。这些因素相互作用,塑造了疾病起始、克隆进化和临床异质性。流行病学和分子研究已确定了几个调节个体疾病起始、进展和临床表现风险的决定因素,这些信息为风险分层和筛查策略提供了依据。
环境与临床风险因素
人口统计学与群体水平决定因素
年龄是MM最强的独立风险因素,发病率在50岁后急剧上升,65岁左右达到峰值,这与累积突变负荷和免疫衰老一致。预测模型预计在未来几十年内新发病例将显著增加。值得注意的是,虽然年龄与疾病发病率密切相关,但关于其与特定基因组亚型关系的数据存在冲突。性别差异方面,男性发病率略高于女性,男女比例约为1.2:1至1.5:1。种族差异显著,非裔美国人的发病率约为白人的两倍,这主要归因于单克隆丙种球蛋白病(MGUS)患病率较高而非恶性进展加速。亚洲人群的数据则显示患者确诊年龄较早(约59岁)且疾病负担较重,基因组分析提示与西方队列相比存在部分独特的突变景观。
前体疾病
几乎所有的MM病例之前都存在无症状的前体疾病,主要是MGUS或冒烟型MM(SMM)。流行病学证据表明,MGUS影响超过50岁人群的约3.2%,平均每年进展为MM的风险约为1%。SMM则与极高的进展风险相关,尤其是在诊断后的前五年内。孤立性浆细胞瘤也有进展为系统性疾病的显著风险。
环境、职业、生活方式和临床调节因子
环境和职业暴露与MM易感性相关。荟萃分析报告消防员和理发师的风险分别增加了近50%和约40%。农业人群,特别是在接触杀虫剂的背景下,也显示出较高的发病率。在暴露水平上,杀虫剂、除草剂、有机溶剂和石油衍生产品与MM风险增加有关。生活方式因素中,肥胖是最一致的修饰因子,与MGUS和MM风险增加相关,比值比(OR)在1.7-2.0范围内,这反映了慢性炎症状态和代谢失调。大型前瞻性队列分析显示BMI与MM发病率之间存在明显的剂量依赖性关系。相比之下,吸烟与MM发病率无一致关联,但重度吸烟与MGUS风险增加相关。体力活动表现出适度的保护作用,而植物性饮食模式与较低的MM风险相关。
临床和免疫相关合并症作为修饰风险因素
慢性病毒感染,特别是丙型肝炎病毒(HCV),与MM风险增加有关。新兴证据表明肠道微生物群组成是MM易感性和进展的生物学调节因子,孟德尔随机化分析确定了分类群特异性的因果关系。自身免疫性疾病与MGUS和MM易感性增加相关,其中恶性贫血和强直性脊柱炎显示出最一致的关联。
家族聚集与遗传性易感性
除了环境和临床决定因素外,遗传性易感性对MM风险也有显著贡献。家族聚集研究、罕见胚系变异分析和大规模全基因组关联研究(GWAS)的数据表明,高影响力致病性变异和多基因风险结构共同导致了疾病易感性。一级亲属中观察到的2至4倍风险增加支持了这一观点。DNA修复和基因组维持通路中的胚系改变,包括TP53和BRCA1/2等基因,以及免疫调节和端粒相关基因(如DIS3, TNFRSF13B, TREX1, POT1和TERT),均与家族性病例有关。大型队列研究进一步证明,DNA修复通路中的致病性胚系变异存在于约9.1%的散发性MM病例和高达18%的家族性病例中。
罕见致病性胚系变异
罕见致病性胚系变异(PGVs)在约5-30%的MM患者中被检测到,在家族性和早发性病例中更为普遍,主要影响DNA损伤应答(DDR)、端粒维持和免疫调节基因。高危和中危外显率DDR基因(如TP53、PALB2、ATM、CHEK2和BRCA1/2)在非选择性队列中的检出率为4-7%,它们促进同源重组缺陷和p53介导的凋亡受损。端粒相关基因(如POT1和TERT)的复发性改变在约2-5%的家族性MM病例中被观察到,促进染色体脆性和克隆进化。免疫和B细胞调节基因(如TNFRSF13B/TACI和DIS3)的变异发生在约3-15%的患者中,破坏浆细胞成熟和免疫监视。
多基因易感性与GWAS结构
大规模GWAS荟萃分析已确定超过20个易感位点,暗示了免疫反应、浆细胞分化、自噬、凋亡和细胞周期控制中的调节网络。遗传风险主要是多基因的,由累积的低外显率变异驱动。端粒酶相关基因(特别是TERT)的多态性进一步将端粒生物学与易感性联系起来。跨血统研究确定了在非洲和欧洲血统人群中共享的易感位点,同时也发现了仅在欧洲血统队列中显著相关的特异性位点。多基因风险评分(PRS)模型显示,最高风险五分位数个体的MM风险是最低五分位数的3.44倍。然而,由于缺乏前瞻性验证、在不同祖先人群中的预测准确性降低以及缺乏标准化的临床风险阈值,PRS目前在MM中尚未成为可用于筛查高风险个体或亲属的临床工具,仍被视为研究工具。
遗传-环境相互作用
遗传与环境相互作用构成了MM病因的另一层,其中遗传性易感性放大了环境暴露的生物学影响。影响DNA损伤应答、端粒维持和免疫通路的罕见胚系变异可能增加细胞对遗传毒性应激源的脆弱性。职业性接触杀虫剂和溶剂与MM风险增加有关,并且在携带DNA修复通路胚系改变的个体中可能产生更强的生物学效应。肥胖可能通过慢性炎症和骨髓微环境的代谢重编程与多基因风险产生协同作用。
多发性骨髓瘤的体细胞基因组景观
原发性细胞遗传学异常代表了MM中最早可检测到的基因组事件,并定义了主要的生物学亚型。这些病变在前恶性阶段出现,贯穿克隆进化,并塑造了下游的突变轨迹、临床行为和治疗脆弱性。两大类主要解释了大多数病例:复发性免疫球蛋白重链(IgH)染色体易位和非整倍体。
原发性细胞遗传学类别
IgH驱动的易位
涉及IgH基因座(14q32)的重排是MM中最频繁和最重要的原发性基因组事件之一。这些改变在疾病进展早期出现,在MGUS中即可检测到,通常持续到克隆进化过程中,而MYC激活和TP53缺失等二次改变则在后期积累。功能上,IgH易位将癌基因置于高活性的IgH增强子区域附近,导致参与细胞周期控制、表观遗传调控、转录程序和生存的基因的失调表达。四种主要的染色体伙伴占原发性IgH易位的大部分:CCND1(11q13)、CCND3(6p21)、FGFR3/WHSC1(MMSET)(4p16)和MAF(16q23)。
具体而言,t(11;14)(q13;q32)存在于约15-20%的患者中,导致CCND1过表达,并与淋巴浆细胞表型和相对惰性的生物学行为相关,通常被归类为标准风险。t(4;14)(p16.3;q32)见于约10-15%的病例,导致FGFR3和WHSC1(MMSET)同时激活,定义了一个以侵袭性临床行为、频繁肾脏受累和不良生存为特征的高风险实体。t(14;16)(q32;q23)存在于约2-3%的患者中,诱导MAF过表达,并与不良生存相关,其通过促进APOBEC3A和APOBEC3B表达产生超突变表型。较少见的原发性事件包括t(6;14)(与CCND3激活相关,预后中性)和t(14;20)(与MAFB激活相关,在显性MM中预后不良)。
非整倍体
与IgH驱动的疾病平行,非整倍体代表了MM中第二个主要的原发性细胞遗传学类别,约占西方人群新诊断MM(NDMM)病例的45-50%。其定义为奇数染色体的非随机增加,最常见涉及染色体3、5、7、9、11、15、19和21。这些增加是以结构化的进化序列获得的,而非通过随机非整倍体,定义了独特的早期致癌途径。从临床角度看,具有异常中期核型的患者的生存结局比具有正常核型的患者差。在具有细胞遗传学异常核型的患者中,非整倍体是最常见的数值模式。超二倍体MM的预后优于亚二倍体疾病(定义为染色体数少于45条)。然而,预后影响是异质性的,伴有高风险细胞遗传学异常(包括del(17p13)、t(4;14)和1q21增益)的超二倍体患者比单纯超二倍体患者经历显著更差的生存结局。在特定染色体三体的背景下,只有3号和5号染色体三体与改善的OS相关,而21号染色体三体与不良临床结果相关。
继发性基因组事件和进展相关事件
继发性基因组事件塑造了MM的进展生物学,包括染色体臂非整倍体、局灶性拷贝数变异(CNVs)和积累在原发性细胞遗传学背景上的继发性结构改变。
随着高分辨率分子细胞遗传学技术的出现,研究表明95-100%的MM患者存在异常核型。早期比较基因组杂交和FISH研究证实这些改变是非随机且经生物学选择的。复发性染色体臂增加涉及19p、9q、11q、12q、15q、17q和22q,同时伴有涉及6q和16q的缺失。随后的一项间期FISH分析证实,高达86%的NDMM患者存在染色体畸变。
1q增益
在染色体臂水平上,1q增益是最频繁且具有临床相关性的数值事件,发生在约35-40%的NDMM患者中,并在复发时频率增加,此时它与治疗耐药和不良生存密切相关。预后影响似乎取决于拷贝数,≥4个拷贝通常与较差的结果相关。
1p缺失
1号染色体短臂(1p)缺失在约27-30%的患者中被检测到,是另一项主要的不良病变,与不良预后独立相关。特别具有生物学相关性的是涉及1p12和1p32.3的缺失,这些区域蕴藏着关键的候选抑癌基因。
del(13q)
13q染色体缺失发生在约50-60%的患者中,其不良预后信号主要反映了与其他高风险病变的共同发生。
del(17p)
涉及TP53基因的17p染色体缺失代表了最具临床影响力的臂级异常,在约8-10%的NDMM患者中被检测到,并与较差的PFS和OS一致相关。其患病率在疾病进展期间急剧增加,在晚期和复发阶段达到非常高的频率。
其他臂级增益/缺失
其他复发性臂级增益包括8q、9q和11q,其中8q增益因含有位于8q24的MYC基因座而特别相关。复发性臂级缺失包括1p、6q、8p、9q、13q、16q和17p,导致抑癌基因耗竭和基因组失衡。
MYC继发性事件
MYC失调是MM进展中的核心继发性基因组事件。与原发性IgH易位不同,MYC重排在MGUS中很少见(3-4%),但在NDMM中频率增加(约15-20%),并在复发时进一步富集,此时它们与增殖性转录程序和不良临床结果相关。复发性MYC重排、局灶性增益和涉及8q24的扩增构成了汇聚于MYC激活的多种结构机制。这些改变在与原发性IgH易位共同发生时尤为丰富,支持骨髓瘤进展的多步骤进化模型。
聚焦于驱动基因的拷贝数重塑
建立在上述臂级结构之上,局灶性CNV在不定义新的细胞遗传学类别的情况下调节致癌剂量和功能异质性。复发性扩增和缺失靶向调节关键致癌通路的基因密集区域,代表性事件包括CKS1B(1q21)和MYC(8q24)的局灶性扩增,以及涉及TP53(17p13)、CDKN2C和FAF1(1p32)、RB1(13q14)、CYLD(16q12)和BIRC2/BIRC3(11q22)的缺失,这些事件汇聚于细胞周期调控、DNA损伤应答和NF-κB信号传导。纵向研究显示,在治疗压力下会发生CNV重塑,促进分支克隆进化和耐药性。CNV重塑经常与复杂的结构变异共存,加剧了基因组不稳定性和层级进化。
基因组检测策略:从FISH到NGS和光学基因组图谱(OGM)
准确识别骨髓瘤基因组异常对于风险分层和治疗决策至关重要。常规诊断流程依赖于荧光原位杂交(FISH)、SNP芯片、靶向测序和OGM,通常需要浆细胞富集以获得最佳灵敏度。
常规细胞遗传学和FISH
常规中期细胞遗传学和间期FISH仍然是MM诊断和风险分层的基石,构成了当前临床指南的主干。FISH在浆细胞富集样本上进行,克服了限制中期分析的低增殖指数问题,并能可靠地检测高风险病变,如t(4;14)、t(14;16)、del(17p)、1q增益和1p缺失。FISH的检测率始终超过常规细胞遗传学。此外,FISH允许估计病变负荷和亚克隆分布,指导风险适应性治疗。常规细胞遗传学虽然敏感性较低,但通过提供倍性和染色体复杂性的全局视图,保留了互补价值。
基于NGS的结构变异检测
二代测序(NGS)扩展了结构变异检测的范围,超越了预定义的探针面板。全基因组测序(WGS)和靶向测序方法可以识别隐匿性重排、解析复杂的断点并发现新的融合伴侣。除了结构重排,NGS还能同时检测单核苷酸变异(SNVs)和小插入/缺失(indels),这对于TP53尤为重要,因为局灶性缺失常与失活突变共存。NGS的灵敏度取决于测序深度和变异等位基因分数。整合的WES/RNA-seq显示与FISH在CNAs上具有完全一致性的同时,还能解析易位断点和突变。
光学基因组图谱(OGM)
光学基因组图谱(OGM)能够在单次实验中检测结构变异、CNV和非整倍体,克服了靶向FISH面板的位点限制。在临床队列中,OGM不仅能识别FISH可检测的典型异常,还能揭示额外的结构变异。通过将平衡重排和数值变化捕获到单一工作流程中,OGM充当了高分辨率的数字核型分析,可能整合多种细胞遗传学检测。然而,OGM对低水平亚克隆(15-20%)的灵敏度下降,且不能可靠地解析着丝粒或端粒重排。此外,OGM需要超高分子量DNA,这在骨髓样本中很难获得,并且它不检测SNVs或小插入/缺失,因此需要与测序平台整合以实现全面分析。
预后意义与治疗调节
细胞遗传学异常是临床结果的最强预测因子。17p缺失、t(4;14)和1q21增益是PFS的独立不良预后因素,而del(17p13)也能预测较差的OS。细胞遗传学复杂性进一步恶化了预后。大剂量治疗联合自体干细胞移植改善了缓解深度,但并不能完全抵消高风险细胞遗传学特征的影响。相比之下,蛋白酶体抑制剂(PI)的纳入对t(4;14)和1q21增益疾病显示出特别的益处,支持基于分子的适应性治疗策略。
突变谱与克隆进化
高通量染色质构象研究表明,CNV断点经常发生在拓扑关联结构域(TADs)的边界,这表明优先破坏了调控区域。TADs将基因组组织成绝缘的邻域,限制增强子-启动子相互作用并形成基因表达程序。TAD破坏改变了增强子-启动子的相互作用,并导致致癌失调。与正常B细胞相比,MM显示出TAD数量增加、平均TAD大小减小,以及在约20%的基因组区域中A/B区室转换,这与高阶基因组重组一致。
比较基因组研究表明,MGUS在遗传学上与MM相关,但表现出较低的基因组异常负荷。染色体增加和缺失的频率,包括非整倍体、1q增益和del(13q),在MGUS中均有所降低,这支持了基因组不稳定性在进展过程中的逐步积累。MGUS还显示出与染色体和突变负荷相关的较简单的体细胞突变谱。MYC易位和TP53病变通常在MGUS中不存在,支持其作为转化相关事件的角色。
大型测序队列表明,进展伴随着影响编码和非编码区域的突变过程的多样化。对CoMMpass全外显子和全基因组数据集的综合分析确定了复发性SNVs、结构重排和与内源性酶活性及治疗相关诱变相关的特征性突变特征。结合测序、CNV分析和细胞遗传学的整合基因组分析描述了线性、分支和平行的进化轨迹,突出了动态的克隆结构。
在MM中,可以使用基于贝叶斯聚类的概率框架,从批量NGS数据中重建亚克隆结构。这些方法对变异等位基因频率和拷贝数校正的癌细胞分数进行建模,并将变异分组为反映不同克隆群体的簇。这使得能够区分主干突变和分支突变,并为重建肿瘤进化史提供基础。这些方法已被应用于纵向和进展环境中,以追踪治疗压力下的克隆动力学,揭示亚克隆多样性通常先于临床转化,且复发可能源于预先存在的微小克隆。
另一个复杂层面源于体细胞变异的等位基因特异性表达。转录组分析显示,突变等位基因呈可变表达,具有选择性激活或沉默,这超出了DNA序列本身的功能影响。在通路水平上,体细胞突变富集于受体酪氨酸激酶信号传导和细胞粘附网络。
胚系易感性变异可能进一步调节浆细胞恶液质的风险和分子进展。罕见的遗传性EP300变异被提议通过IRF4通路失调、BCL6活性增加和p53信号传导减少而导致疾病。其他候选变异包括影响免疫球蛋白重组和转录调节因子的PDPK1剪接位点改变。几个候选风险变异聚集在22q13附近的APOBEC家族基因座,并且与MM进化中的APOBEC相关诱变一致。
在复发时,基因组复杂性增加。整合分析显示,复发时的染色体失衡比诊断时更多,主要由额外的缺失驱动,复发性复发相关增益位于8q,缺失位于10q。大于100 Mb的大型CNV比较小的改变具有更强的转录效应,并优先失调细胞因子相关和整合素信号通路。复发相关的表达变化包括PRAME(22q11)和BOP1(8q24)的激活。诊断与复发之间的全局DNA甲基化模式保持相对稳定,表明在晚期进展中染色体重塑的作用优于表观遗传重编程。