基于血液DNA甲基化的体重指数(BMI)预测结直肠癌患者生存结局的患者队列分析

《Genome Medicine》:Epigenetic indicators of body mass predict survival outcomes in colorectal cancer patients: patient cohort analysis

【字体: 时间:2026年05月29日 来源:Genome Medicine 11.2

编辑推荐:

  背景:体重指数(BMI)在结直肠癌(CRC)中的预后意义仍存争议,部分原因与疾病相关的体重变化有关。基于DNA甲基化(DNAm)的BMI分数可能比单次BMI测量更稳定,是更优的预后指标。本研究旨在评估血液来源的DNAm-BMI分数与CRC患者死亡率的关联,并与

背景:体重指数(BMI)在结直肠癌(CRC)中的预后意义仍存争议,部分原因与疾病相关的体重变化有关。基于DNA甲基化(DNAm)的BMI分数可能比单次BMI测量更稳定,是更优的预后指标。本研究旨在评估血液来源的DNAm-BMI分数与CRC患者死亡率的关联,并与自报BMI进行比较。方法:研究人员分析了德国DACHS研究中2,126名新确诊CRC患者(41.2%为女性,中位年龄69岁)的数据。记录了诊断时的自报BMI以及距诊断最多14年前的BMI和诊断前体重变化。基于血液DNAm计算了五种经外部开发和验证的DNAm-BMI分数。研究结局包括全因死亡率、CRC特异性死亡率和非CRC特异性死亡率。通过调整人口统计学、生活方式、临床和治疗因素的Cox比例风险模型评估关联。结果:所有DNAm-BMI分数均与CRC诊断时及诊断前长达14年的自报BMI显示出一致的相关性(Spearman r?=?0.15–0.41)。诊断时体重过轻与全因死亡率增加相关(调整后风险比[aHR]: 1.42, 95%置信区间[CI]: 1.07–1.88),而肥胖则与风险降低相关(0.83, 95%CI: 0.70–0.99)。相反,五种DNAm-BMI分数中的四种(mBMI-135, mBMI-379, mBMI-435, mBMI-1109)显示出与死亡率风险一致的、正向的线性关联。其中135-CpG分数预测性最强(aHR: 1.57, 95%CI: 1.23–1.99)。这些关联大多局限于血液样本在化疗/放疗前采集的亚组。结论:基于血液的DNAm-BMI分数反映了肥胖暴露的生物学效应,与CRC死亡率呈正相关,可能有助于在自报BMI之外改善风险分层。
体重过量,通常以体重指数(BMI)衡量,是结直肠癌(CRC)发生的既定风险因素。然而,关于BMI对CRC预后的影响的证据复杂且结果不一。荟萃分析表明,肥胖或体重过轻的CRC患者术后长期生存率较差,而超重患者的生存结局可能改善或不变。相反,一些研究报告,在CRC诊断时超重或肥胖的个体具有生存优势。诊断时自报的BMI可能受到疾病相关体重变化的影响,从而在评估肥胖与CRC预后真实关系时引入偏差。一项研究报告,诊断前一年BMI下降超过5个单位(kg/m2)与较差的结局密切相关。为缓解此问题,另一项研究回顾性地使用三个时间点的自报BMI和生长曲线模型估计了诊断前的累积BMI。该发现表明,在成年早期至中期长期暴露于升高的BMI与更差的CRC生存率相关。然而,这种方法仍容易受到回忆和测量偏差的影响。表观遗传修饰,尤其是CpG位点的DNA甲基化(DNAm),捕获了环境和生活方式暴露(包括肥胖)对基因组的累积影响。基于血液DNAm的BMI生物标志物已在与脂质代谢和血脂水平相关的基因中被识别,反映了身体脂肪积累和代谢健康。几种DNAm衍生的BMI分数已被开发作为慢性体重过量暴露的代理指标,为急性体重变化或自报不准确引入的偏差提供了潜在解决方案。其中一些分数与较差的身体健康状况和包括CRC在内的多种癌症风险增加有关。然而,它们在CRC中的预后价值尚未得到研究。在本研究中,研究人员比较了CRC预后与诊断时和诊断前的自报BMI、诊断前体重变化以及基于DNAm的BMI分数的关联。简而言之,他们使用了基于人群的DACHS队列数据,该队列包括2,126名具有基线血液DNAm数据和反复自报体重史的CRC患者。研究人员重建了五种先前发表并经外部验证的基于DNAm的BMI分数,并评估了它们与不同时间点自报BMI的相关性,以及它们与中位随访10.6年期间全因和特定原因死亡率的关联。

本研究基于德国DACHS(Darmkrebs: Chancen der Verhütung durch Screening,英文名:"Colorectal cancer: chances for prevention through screening")队列的数据,这是一项于2003年至2021年间在德国莱茵-内卡地区22家医院进行的关于CRC的基于人群的病例对照和患者队列研究。研究人员纳入了具有基线BMI和血液DNAm数据,以及至少一次随访评估的2,126名合格患者。大多数基线数据在CRC诊断后(中位:20天,IQR:10–213天)通过训练有素的访谈员进行的结构化访谈收集。访谈涵盖社会人口学特征、生活方式因素、医疗史和疾病症状。通过自报获得了从20–80岁每个十年期的体重以及诊断时的体重和身高信息。肿瘤特征从医疗记录中提取,疾病分期根据国际抗癌联盟肿瘤、淋巴结、转移(TNM)分期手册第6版进行分类。随访从诊断开始。在诊断后3年、5年和10年,从医生处收集关于治疗、合并症和复发的标准化数据。生命状态、死亡日期和死因从人口登记处和公共卫生机构获取。对于大多数患者(58%),血液样本在CRC诊断后三个月内采集。大部分样本(78%)在肿瘤切除手术后采集。在181名接受新辅助治疗的患者中,所有血液样本均在此治疗后采集。此外,500名患者(24%)的血液在辅助化疗后采集,80名患者(3.8%)在辅助放疗后采集。使用Infinium MethylationEPIC BeadChip试剂盒(Illumina, San Diego, CA, USA, EPIC v1阵列)对2003年至2010年确诊的2126名CRC患者的血液样本进行DNAm分析,该芯片覆盖超过850,000个CpG位点。来自iScan阵列扫描仪的原始DNAm数据文件通过'minfi' R软件包(版本1.52.1)处理,缺失的CpG值通过最近平均多重插补法进行填补。应用Illumina归一化以校正Illumina甲基化阵列特有的技术偏差和背景噪声。

研究人员通过PubMed文献检索,系统识别了先前开发的、可预测BMI的血液基DNAm分数。纳入的评分需满足:1)在至少一个外部队列中开发和验证;2)完整的CpG位点列表及其相应的回归系数公开可用,允许通过线性组合重建(Score?=?Intercept?+?Σ[CpG?×?coefficient])。五种分数符合纳入标准。所有分数均通过识别其甲基化水平与自报或测量BMI相关的CpG位点而开发,通常使用表观全基因组关联分析。然后,使用不同的统计方法将这些CpG组合成加权预测模型。两种分数使用最小绝对收缩和选择算子(LASSO)回归开发,两种使用弹性网络回归,一种使用来自三个队列的线性回归模型估计的CpG特异性系数进行元分析。每个分数中包含的CpG数量从135个(Mendelson等人)到3506个(Merzbacher等人)不等。大多数CpG是每个分数独有的,只有9个CpG是所有分数共有的。在多变量Cox回归模型中作为协变量调整的人口统计学和临床变量的缺失值通过链式方程多重插补(使用'mice' R软件包,版本3.17.0)处理,插补过程中包含了每个十年期的体重和死亡结局(即Nelson–Aalen估计的基线累积风险和结局指标)。所有分析均在20个插补数据集中并行进行,结果通过Rubin规则合并。通过Spearman相关系数评估了五种甲基化BMI分数与诊断时、诊断前1–4年和诊断前至少5年(范围5–14年)的自报BMI之间的关联。为评估这些相关性是否独立于BMI的时间稳定性,相关性分析还限于经历显著诊断前体重变化(定义为诊断时与5–14年前之间体重变化>5公斤)的患者亚组。为评估诊断前体重变化对预后的影响,研究人员计算了诊断与至少5年前之间的体重变化。使用Cox比例风险模型评估自报BMI(诊断时、诊断前1–4年、诊断前5–14年)、诊断前体重变化、五种血液甲基化BMI分数与全因死亡率的关联。为区分BMI与体重变化的独立影响,额外的Cox模型同时纳入了BMI(诊断时或5–14年前)和诊断前体重变化。使用延迟进入Cox模型以考虑CRC诊断与血液样本采集之间的时间间隔。采用原因特定Cox比例风险模型分析CRC特异性和非CRC相关死亡率,将其他原因导致的死亡视为竞争事件。Cox模型调整了年龄、性别、肿瘤分期、肿瘤位置、接受新辅助治疗、接受化疗或放疗、饮酒、体力活动、吸烟状况、定期使用他汀类药物、使用非甾体抗炎药、心血管疾病史、高脂血症、高血压和其他癌症。BMI既以连续变量建模(每5个单位增加),也以分类变量建模(BMI??30)。体重变化分类为>5公斤减少、2–5公斤减少或无体重减少。甲基化BMI分数被标准化,一个单位的增加对应一个标准差,并分为四分位数,以最低四分位数作为参考。通过在Cox模型中将四分位数中位数作为连续变量建模来检验四分位数间的线性趋势。为评估剂量-反应关系,使用了具有三个节点的限制性立方样条函数来检查自报BMI、体重变化或甲基化BMI分数与死亡率之间的关联。报告了整体线性P值和曲率P值以评估每个剂量-反应的形状。进行了按BMI类别、体重变化类别、中位年龄(≤69 vs. >69岁)、性别、TNM分期(I/II vs. III/IV)、肿瘤转移、肿瘤位置(远端结肠、近端结肠或直肠)的亚组分析。为评估血液采集时间的影响,根据CRC诊断到抽血的时间间隔(<3个月 vs. ≥3个月)以及相对于全身治疗的时间(化疗前或未接受 vs. 化疗后;化疗/放疗前或未接受 vs. 化疗/放疗后)进行了进一步分析。对每个亚组分析,计算交互作用P值以统计检验效应修饰。

鉴于五种DNAm-BMI分数在原始出版物中的功能注释有限,研究人员进行了基因本体(GO)富集分析以解释其生物学相关性。对于每种表观遗传分数,提取分数中包含的CpG位点列表,并使用UCSC参考基因注释(基于GRCh37/hg19基因组构建)从'IlluminaHumanMethylationEPICanno.ilm10b4.hg19'软件包(版本0.6.0)映射到其相应基因。对于每个基因列表,识别独特的蛋白质编码基因,将多个转录本合并为单个基因标识符。然后使用'org.Hs.eg.db' R软件包(版本3.20.0)将这些基因符号转换为Entrez基因ID。使用'clusterProfiler' R软件包(版本4.14.6)中的'enrichGO'功能进行生物过程的GO富集分析。分析在调整后P值<0.05(Benjamini–Hochberg方法)和q值截止0.2的显著性阈值下进行。统计学显著性设定为双侧P值<0.05。所有分析均通过R版本4.4.0进行。

在总体研究队列中(图2),诊断时体重过轻(BMI?
在亚组分析中,按诊断时BMI和体重变化分层,甲基化分数与死亡率的统计学显著正向关联在亚组间相似。按患者特征的进一步亚组分析表明,四种甲基化分数,特别是来自Mendelson等人和Do等人的两种分数,与不同患者亚组中的死亡率结局存在一致的正向关联。这些关联在年龄<70岁或≥70岁、男性和女性、I/II期或III/IV期CRC、转移性或非转移性肿瘤、近端结肠、远端结肠或直肠肿瘤部位的患者中仍然稳健。此外,无论血液样本是在CRC诊断后三个月内还是之后采集,这些关联均持续存在。大多数亚组变量与自报或基于DNAm的BMI分数均未显示出统计学显著的交互作用。较高的基于DNAm的BMI分数与增加的死亡风险之间的正向关联主要局限于在任何化疗或化疗/放疗前采集血液的患者,或从未接受过全身治疗的患者,但mBMI-397分数(Do等人)是一个例外,即使在化疗后(1.25, 1.09–1.43)或化疗/放疗后(1.24, 1.08–1.42)采集血液的患者中,它仍然与CRC特异性死亡率呈正相关。GO富集分析显示,Mendelson等人的135-CpG分数在参与营养和细胞外刺激反应、干扰素-γ产生和JAK-STAT信号传导的通路中富集。类似地,Do等人的397-CpG分数在细胞迁移、辅助T细胞2型免疫分化和糖酵解过程中显示富集。Hamilton等人的435-CpG分数在细胞粘附通路、血管发育(包括血管生成)和磷脂稳态方面富集。McCartney等人的1109-CpG分数在细胞粘附、认知和突触组织、营养和氧气反应(包括缺氧)、上皮管形态发生、胚胎器官发育和轴突发生方面显示富集。最后,包含最多CpG的Merzbacher等人分数显示出最广泛和最多样的功能景观,包括细胞粘附、神经发育、生长因子信号传导(TGF-β, FGF)、Wnt通路激活和广泛的形态发生过程,反映了复杂且多方面的生物学调控。

在讨论中,研究人员指出,在这项大型队列研究中,所有五种血液来源的基于DNAm的BMI分数都与自报的当前BMI以及诊断前几年的BMI持续相关。其适度的幅度表明这些分数捕获了与BMI相关的但不完全等同的生物学信息。诊断时体重过轻或经历超过5公斤体重减轻的患者预后较差,而肥胖与死亡风险适度降低相关。相比之下,五种基于甲基化的BMI分数中有四种与总体和CRC相关死亡率增加显著相关,其中三种还与非CRC相关死亡率相关。有趣的是,与诊断时BMI相关性最弱的mBMI-135分数,显示出与所有死亡率结局最强且最一致的关联。这些关联在主要临床亚组中保持稳健,并且在血液样本在化疗/放疗前采集的患者中最为明显。研究结果证实,这五种先前开发的血液甲基化BMI分数与自报BMI显著相关。其中一些分数在其他队列中显示出相似的结果。然而,本研究首次提供了证据表明,这些分数不仅与血液采集时的BMI相关,而且与诊断前长达14年的BMI也持续相关。重要的是,即使在经历显著诊断前体重变化的患者中,这些相关性仍然持续存在且高度显著,支持它们在反映快速体重波动条件下肥胖暴露的生物学效应方面的稳定性。这些发现表明,肥胖诱导的表观遗传修饰可能随时间累积。事实上,最近的一项研究表明,脂肪组织在人类和小鼠体重减轻后保留了细胞转录变化,提示存在一种与肥胖相关的表观遗传记忆。研究人员还发现,包含更多CpG位点的分数与不同时间点的BMI显示出稍强的关联,这是预期的,因为更大数量的CpG可能提供对BMI更全面的反映。先前的研究报告了“肥胖悖论”,即癌症诊断时较高的BMI与改善的生存率相关,而体重过轻的患者则经历显著较差的结局。本研究中观察到的自报BMI与死亡率风险的反向关系与这些发现一致。一种可能的解释是,较高的体重可能作为营养储备,在患者经历癌症治疗或疾病进展的生理压力时具有潜在益处。然而,本研究中诊断时肥胖的保护作用很小,并且在考虑诊断前体重变化后减弱。这表明适度的保护作用可能受到混杂因素的影响,即诊断前BMI较高的患者体重减轻的潜力更大,而体重减轻本身是预后不良的强有力指标。诊断前1–4年肥胖与非CRC相关死亡风险增加的发现,可能反映了过量体重对代谢和心血管健康的有害影响被掩盖,增加了死于非癌症原因的脆弱性。到诊断时这种风险关联的显著逆转,可能反映了急性、疾病驱动的体重减轻如何掩盖了慢性肥胖与生存率之间的真实关系。相比之下,即使在对体重变化进行调整后,诊断时体重过轻患者观察到的死亡风险增加在统计学上仍然显著。这表明诊断时体重过轻的有害影响并非完全由体重减轻驱动,支持反向因果关系的可能性,即低BMI可能是潜在疾病或与疾病相关的恶病质的结果,而不是死亡风险增加的直接原因。确实,在诊断前5–14年测量的BMI与死亡率风险之间未观察到显著关联,这与超过5公斤诊断前体重减轻的强烈不良影响形成对比。这一发现与基于DACHS队列早期数据、参与者较少的一项先前研究一致。这些发现表明,BMI与CRC预后之间的关系可能受到疾病相关体重变化的混杂,使得诊断时BMI无法完全反映累积的体重过量。此外,诊断时BMI无法反映身体成分的复杂性,因为并非所有脂肪组织在代谢上都是等效的。例如,内脏肥胖与全身性炎症、胰岛素抵抗和更具侵袭性的CRC生物学密切相关,而皮下脂肪在代谢上可能更良性,并可能在疾病期间作为营养储备。先前的研究强调,自报BMI可能高估体重过轻患者的死亡风险,进一步质疑其作为预后指标的可靠性。这强调了使用诊断时单次BMI测量来捕捉CRC患者身体成分、体重轨迹和健康结局之间复杂而微妙的相互作用的局限性。

研究结果揭示了五种被检验的DNAm-BMI分数中四种与CRC患者死亡率风险之间的显著关联,其中mBMI-135和mBMI-397分数显示出最强的关联。这些分数在不同患者亚组中一致的显著关联进一步证实了它们的预后价值。有趣的是,这两种分数,尤其是mBMI-135,与自报BMI的关联相对较弱。这表明它们的预后能力可能较少依赖于近似当前BMI,而更多地依赖于捕获与代谢失调相关的更广泛生物学状态。GO分析结果表明,这两种分数在与营养和炎症信号传导、免疫调节、脂质代谢和细胞应激反应相关的通路中富集。这些通路是肥胖相关代谢紊乱的核心,并且与CRC进展、治疗反应和生存有关。例如,在所有分数中共享的CpG位点cg06690548位于SLC7A11基因中,该基因在氧化应激抵抗中起作用,并与晚期肿瘤分期和较差的CRC预后相关。结果表明,这些分数可能作为与过量体脂相关的代谢健康状况更可靠的指标,捕获导致CRC预后的肥胖相关生物学后果。相比之下,来自Merzbacher等人的3506-CpG分数在总体队列中未显示出与死亡率结局的明确关联模式。但其预后相关性在转移患者中显现。该分数包含最多的CpG,并在五种分数中显示出与自报BMI最强的相关性,表明它捕获了广泛的肥胖相关甲基化模式。然而,其广泛的CpG覆盖可能稀释了直接参与癌症相关生物学通路的CpG位点的影响,降低了其在一般CRC人群中的预后敏感性。在转移患者中,代谢失调、炎症和治疗诱导的生物学压力更为显著,可能放大了这一综合分数捕获的甲基化信号。这些发现强调,DNAm-BMI分数的临床价值可能不在于其近似BMI的能力,而在于其捕获与CRC预后相关的生物学上有意义的肥胖相关过程的能力。亚组分析显示,大多数基于DNAm的BMI分数主要在血液样本在化疗/放疗前采集或从未接受全身治疗的患者中与死亡率呈正相关。这在生物学上是合理的,因为化疗和放疗诱导的表观遗传变化反映了与治疗相关的压力或加速衰老,而非肥胖,可能混淆了治疗后的甲基化谱。相比之下,mBMI-397分数(Do等人)即使在治疗后仍与CRC特异性死亡率相关。GO分析表明,这一例外可能由该分数的信号聚集解释,这些信号来自侵袭性疾病核心通路,如细胞迁移、促肿瘤免疫反应(例如辅助T细胞2型分化)和糖酵解代谢,这些可能对治疗诱导的混杂更具抵抗力。这些发现强调了在表观遗传预后研究中考虑治疗时间的必要性,并支持在全身治疗前测量DNAm-BMI分数以在CRC患者中进行更准确的风险分层。本研究有几个局限性。首先,BMI数据是自报的,因此容易受到回忆偏差的影响。其次,缺乏腰臀比数据,这是比BMI更能预测健康风险的更精确的腹内脂肪积累指标。第三,用于DNAm测量的血液样本并非在同一时间采集。第四,尽管调整了广泛的潜在混杂因素,但无法排除未测量的代谢因素的残余混杂。最后,研究人群仅限于来自德国的CRC患者,需要进一步研究来评估研究结果对其他人群的普遍性。

研究结果的临床意义值得注意。基于DNAm的BMI分数,特别是那些与死亡率有强且一致关联的分数,可能作为CRC患者风险分层的重要生物标志物。与反映单一体重时间点且易受测量误差和剧烈体重变化影响的自报BMI不同,基于甲基化的分数稳定地捕获与过量体脂和代谢功能障碍相关的生物学效应。这种对代谢健康的动态衡量可以通过识别因持续的肥胖相关生物学紊乱而面临死亡率升高风险的患者,来增强临床决策,即使在诊断时没有明显肥胖的情况下也是如此。这种综合的代谢健康衡量标准有助于识别即使在诊断时没有明显肥胖,也可能因持续的肥胖相关生物学紊乱而面临死亡率升高风险的患者,并可能为更密切的监测、个性化的治疗策略(例如,针对胰岛素抵抗的疗法)或有针对性的生活方式干预提供信息。然而,估算基于DNAm的分数需要额外的基于血液的检测和计算资源,这可能目前限制了其常规临床应用。未来的研究可以直接比较这些表观遗传分数与影像衍生指标(如内脏肥胖)的预后价值,以确定它们是否提供独立或协同的信息。在不同人群中验证这些分数并评估将其整合到多模态临床工作流程中将是必要的后续步骤。

总之,研究结果表明,血液来源的基于DNAm的BMI分数为评估肥胖相关死亡率风险提供了一种稳健的、基于生物学信息的替代传统BMI的方法。这些分数通过封装肥胖的持久代谢和表观遗传后果,规避了自报指标的局限性,从而为预后和个性化护理提供了更细致的工具。尽管需要进一步验证,但研究结果强调了表观遗传学在弥合肿瘤学中流行病学观察与临床实践之间差距的潜力。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号