《Methods and Protocols》:Examining Epigenetic Age in Women with Different Obesity Conditions Using DNA Methylation at the FHL2 Gene
Licínio Manco,
Helena Correia Dias and
Lara Palmeira
编辑推荐:
这项研究通过数字液滴PCR (ddPCR) 技术,分析了葡萄牙超重与肥胖女性血液中FHL2基因特定CpG位点 (cg06639320) 的DNA甲基化 (DNAm) 水平,探讨了肥胖对法医表观遗传年龄预测模型 (APM) 准确性的影响。研究发现,严重肥胖 (2级) 会显著降低年龄预测的准确度,但体重指数 (BMI) 与表观遗传年龄加速之间未发现显著关联,提示在应用“表观遗传时钟”时需考虑肥胖相关的偏差。
摘要
DNA甲基化 (DNAm) 年龄评估是法医科学领域的热点之一,但越来越多的证据表明,DNAm会受到多种临床状况的影响。本研究旨在探讨肥胖对年龄预测模型准确性的影响,并分析体重指数 (BMI) 与表观遗传衰老进程之间的关系。我们通过数字液滴PCR (ddPCR) 方法,分析了62名21至58岁葡萄牙超重和肥胖女性血液样本中FHL2基因CpG位点cg06639320的甲基化水平,并以此建立年龄预测模型。
1. 引言
肥胖被定义为异常或过度的脂肪堆积,是多种慢性疾病发展的风险因素。在过去的十年中,DNA甲基化被认为是肥胖病因学的可能贡献者。DNAm是指在胞嘧啶-鸟嘌呤二核苷酸 (CpG) 的胞嘧啶5'碳上酶促添加甲基基团的过程。随着DNA甲基化芯片技术的发展,已识别出数百万个与实足年龄 (chronological age) 相关的CpG位点,并由此衍生出多种“表观遗传时钟”,用于预测实足年龄。许多病理生理生物标志物、环境因素和年龄相关疾病都被报告会影响基于DNAm的年龄估计。表观遗传年龄加速 (epigenetic age acceleration) 的概念由此产生,指的是个体表观遗传年龄超过实足年龄的情况,反映了特定代谢条件对表观遗传年龄的影响。肥胖与表观遗传年龄加速的关联已在多种组织中有所报道,但在血液中的研究结果并不一致。
近年来,针对法医背景开发的、基于较少CpG位点的简化“表观遗传时钟”主要使用健康个体的血液样本建立。FHL2 (四个半LIM结构域2) 基因是与年龄高度相关的关键基因之一,其CpG位点cg06639320随年龄呈高甲基化,是进行准确年龄估计的关键位点。本研究旨在通过评估血液样本中FHL2基因该CpG位点的甲基化水平,来研究肥胖对年龄预测模型准确性的影响,并探索BMI与表观遗传衰老进程之间的关系。
2. 材料与方法
2.1. 研究人群
本研究共纳入62名21-58岁 (平均42.26岁) 无亲缘关系的葡萄牙女性,根据BMI分为三组:超重组 (25 kg/m2≤ BMI < 30 kg/m2,18人)、1级肥胖组 (30 kg/m2≤ BMI < 35 kg/m2,21人) 和2级肥胖组 (BMI ≥ 35 kg/m2,23人)。作为对照,我们使用了25名年龄匹配、BMI未知的葡萄牙健康女性的DNAm数据。
2.2. DNA提取与亚硫酸氢盐转化
从每个个体采集外周血,使用QIAamp DNA Mini Kit (Qiagen) 提取基因组DNA。使用EZ DNA Methylation Gold Kit (Zymo Research) 对20 μL基因组DNA进行亚硫酸氢盐转化。
2.3. 数字液滴PCR
转化后的DNA在QX100数字液滴PCR系统 (Bio-Rad) 中进行ddPCR分析。使用针对甲基化和非甲基化序列的TaqMan双标记探针,靶向FHL2基因的CpG位点cg06639320。反应体系包括ddPCR Supermix、引物、探针和转化后的DNA。经过液滴生成、PCR扩增后,使用QX100液滴阅读器和QuantaSoft软件分析荧光数据。仅当液滴数超过10,000个 (且FAM和HEX探针均有至少100个阳性液滴) 的样本被纳入后续分析。
2.4. 统计分析
通过公式M/(M + U) 计算每个样本在FHL2 CpG位点的甲基化水平,其中M代表甲基化百分比,U代表非甲基化百分比。使用简单线性回归系数,根据公式:预测年龄 (年) = a + bxi 计算预测年龄,其中a是截距,b是斜率,xi是每个样本的甲基化值。通过预测年龄与实足年龄之间的平均绝对偏差 (MAD) 来评估所开发模型的准确性。对于总样本,使用4折交叉验证。对于按BMI分类的组和对照样本,使用留出交叉验证。通过计算BMI变量与预测年龄和实足年龄之间的偏差值 (残差) 之间的相关系数 (Pearson's r) 来研究BMI的表观遗传年龄加速。使用Kruskal-Wallis检验确定组间连续变量的差异。使用IBM SPSS Statistics 27进行数据分析。
3. 结果
3.1. 总样本年龄预测模型的开发
FHL2基因CpG位点cg06639320的甲基化水平与实足年龄呈正线性相关。在整个样本中,DNAm水平与实足年龄的简单线性回归显示出强相关性 (r = 0.712; p = 8.596 × 10?13),解释了年龄约51%的方差。预测年龄与实足年龄之间的MAD值为4.72年,两者的Pearson相关系数为0.712。通过4折交叉验证得到的平均MAD值为4.96年,与总体的4.72年非常接近。当将该预测模型应用于不同表型组时,得到的MAD值分别为:超重组3.64年、1级肥胖组3.93年、2级肥胖组6.29年,三组间的MAD值存在显著差异 (p = 0.028)。
3.2. 按BMI分类的年龄预测模型开发
我们分别为超重、1级肥胖和2级肥胖组开发了特定的APM。在超重组,DNAm水平与实足年龄呈强相关 (r = 0.79; p = 0.000095),解释了年龄约62%的方差,MAD值为3.75年。1级肥胖组DNAm与年龄也呈强相关 (r = 0.764; p = 0.000056),解释了约58%的年龄方差,MAD值为3.69年。相比之下,2级肥胖组DNAm与年龄呈中度相关 (r = 0.597; p = 0.003),仅解释了约36%的年龄方差,MAD值升高至6.24年。通过留出交叉验证,各组的训练集和验证集MAD值也呈现相似趋势,其中2级肥胖组的MAD值最高。
3.3. DNAm年龄加速分析
我们将年龄加速定义为预测年龄与实足年龄之间的偏差值 (残差)。对于总样本,未观察到BMI与年龄加速之间的显著相关性 (Pearson相关系数 r = 0.104; p = 0.423)。在超重组、1级肥胖组和2级肥胖组中,也未发现显著相关性。值得注意的是,在所有年龄≤35岁的受试者 (n = 10; 16.1%) 中,估计的表观遗传年龄超过了实足年龄 (MAD = 7.93年),提示存在表观遗传年龄加速。相反,在所有年龄≥50岁的受试者 (n = 12; 19.4%) 中,表观遗传年龄低于实足年龄 (MAD = 5.54年),提示存在表观遗传年龄减速。
3.4. 女性参考样本中年龄预测模型的开发
我们基于25名BMI未知的健康年龄匹配女性的血液DNAm数据 (同一FHL2 CpG位点cg06639320) 开发了APM。得到的年龄相关值 (r) 为0.629 (p = 0.001),回归系数预测年龄的MAD值为5.84年。通过留出交叉验证,训练集MAD为6.29年,验证集MAD为5.81年。
4. 讨论
本研究通过ddPCR评估了62名21-56岁葡萄牙超重和肥胖女性血液中FHL2基因CpG位点cg06639320的DNAm水平,以开发APM。回归系数使得整个样本的预测年龄与实足年龄的MAD为4.72年。年龄匹配的普通健康女性对照组的MAD值为5.84年,表明BMI并未改变表观遗传时钟的准确率。然而,不同肥胖程度组的MAD值存在差异:超重组3.64年,1级肥胖组3.93年,2级肥胖组6.29年,三组间差异显著。专门针对BMI分类组开发的APM也呈现了相同的准确度趋势。我们的研究结果表明,预测准确性因个体的BMI而异,表明BMI影响了甲基化过程。事实上,2级肥胖女性APM准确性的降低与其实足年龄和DNAm之间较低的相关性 (r = 0.597) 相一致。而超重和1级肥胖女性的相关性值则更高 (r = 0.79 和 r = 0.764)。目前开发的法医表观遗传年龄估计器 (“表观遗传时钟”) 大多基于“健康或正常体重”个体的血液训练而成。我们的结果表明,严重肥胖状况会影响APM的准确性,这引发了对“偏差”的担忧——如果此类时钟用于临床或法医环境,或用于比较身体成分不同的个体而未针对肥胖相关变量进行调整时。我们在2级肥胖组观察到的较高MAD值表明,基于DNAm建立的APM可能低估或高估肥胖个体的生物年龄,特别是当采样组织或甲基化特征对BMI或相关代谢因素敏感时。
我们的研究结果未发现BMI与表观遗传年龄加速之间存在显著关联,这与那些在血液中未观察到BMI与表观遗传年龄加速呈正相关的研究结果一致。然而,除了组织类型外,其他因素也可能混淆BMI与年龄加速之间的关系,包括所选用的时钟、肥胖严重程度、年龄或性别等,这可以解释为何血液研究结果在各项研究中不尽一致。有趣的是,在本研究中,我们发现年龄≤35岁的年轻受试者中,估计的表观遗传年龄超过了实足年龄,提示存在表观遗传年龄加速。相反,在研究样本中年龄≥50岁的年长个体中,表观遗传年龄低于实足年龄,提示生物衰老速度较慢,这一现象被称为表观遗传年龄减速 (epigenetic age deceleration)。
本研究聚焦于单一生物标志物来评估表观遗传衰老。我们检测的FHL2 CpG位点 (cg06639320) 已被确定为与衰老相关的高甲基化标记之一,在包括血液、唾液和口腔拭子在内的多种组织中表现出一致的线性趋势。在先前一项使用相同甲基化检测技术检查健康个体血液样本中三个DNAm标记的研究中,我们发现FHL2 cg06639320 CpG位点与实足年龄呈强相关 (r = 0.948),与广泛认可的表观遗传生物标志物ELOVL2 (r = 0.926) 相当,且高于PDE4C (r = 0.819)。我们认为,本研究从单一FHL2 CpG位点获得的结果有效地代表了肥胖对基于DNA甲基化的年龄生物标志物的影响。然而,我们也承认,使用包含多个CpG位点的多变量年龄预测模型可以提高预测准确性,并更全面地理解这种影响。
本研究存在一些局限性,包括研究人群仅包含女性。另一个主要局限是对照组由BMI未知的女性组成,因此无法确保与正常体重表型组的APM准确性进行比较。此外,样本量较小,特别是按BMI分类的各组。另一个显著局限性是依赖于单一的DNAm标记。尽管如此,每个回归模型的验证性能显示,验证集获得的MAD值通常与整个训练集获得的MAD值非常接近,从而揭示了每个聚类中APM的准确性和可重复性。
5. 结论
由于肥胖人群患许多年龄相关疾病的风险增加,因此肥胖会增加某些组织和细胞类型的生物年龄是一个合理的假设。在本研究中,我们利用ddPCR技术量化甲基化,研究了超重和肥胖女性中由FHL2 CpG位点cg06639320预测的表观遗传年龄。结果表明,严重肥胖会影响基于DNAm的年龄估计器的准确性。我们未发现BMI与表观遗传年龄加速之间存在关联的证据。然而,我们在年轻受试者中发现了表观遗传年龄加速的信号,在年长参与者中发现了表观遗传年龄减速的信号。未来研究若能在更大的样本量中使用来自其他年龄相关基因的更多CpG标记,将有望加强这些发现。