《Biogerontology》:From the lab to lifestyle: epigenetic clocks in personalized aging and health
衰老是一个复杂的生物学过程,其特征是进行性功能衰退和慢性疾病风险增加。近年来,基于DNA甲基化的表观遗传时钟已成为估计生物学年龄最稳健的生物标志物之一。早期的研发时钟,如Horvath和Hannum开发的模型,提供了高度准确的时序年龄预测。随后的模型,包括PhenoAge、GrimAge和DunedinPACE,通过纳入健康相关变量和功能指标改进了早期模型,扩展了其在疾病风险和衰老速度方面的相关性。重要的是,这些多CpG时钟已证明具有很强的预测准确性,但其依赖于大量CpG位点和高通量技术,由于成本、复杂性和样本处理要求,限制了其临床可扩展性。本综述批判性地评估了当前基于研究的表观遗传时钟及其向直接面向消费者检测的过渡。研究人员讨论了其主要优势、局限性和转化潜力,特别强调了对简化、经济高效且分析可及的表观遗传时钟日益增长的需求,这些时钟应在保持预测准确性的同时,支持在临床和流行病学环境中的更广泛应用。特别关注了基于ELOVL2的时钟,它们体现了极简但稳健的模型,可促进大规模研究并普及生物衰老评估。最终,研究人员认为下一代表观遗传时钟应优先考虑分析简便性以及在多样化人群中的验证,以支持健康老龄化的个性化干预。
时序衰老与生物衰老
衰老的特征是生理功能的进行性衰退,导致疾病易感性增加。这一衰退过程涉及多种相互关联的分子、细胞和系统变化,表现为衰老的标志,包括基因组不稳定性、端粒磨损、表观遗传改变、线粒体功能障碍、蛋白质稳态丧失、细胞衰老、巨自噬功能受损、营养感应失调、干细胞耗竭、细胞间通讯改变、慢性炎症和生态失调。理解这些标志背后的机制有助于制定可能减缓或逆转衰老及其相关病理的治疗策略。
衰老本身是老年人患病流行的主因。“生物年龄”这一概念由H. Benjamin于1947年首次提出,随后由Baker和Sprott于1988年发展,旨在提供比“时序年龄”更精确的个体衰老过程测量。与时序年龄仅反映出生后的时间流逝不同,生物年龄考虑了个体的生理和功能状态,提供了对衰老及其健康影响的更准确评估。
为了理解和应对衰老的复杂性,关注生物衰老而非仅仅列举年龄相关的改变至关重要。生物年龄能更好地反映不同个体间衰老过程的多样性,因为它反映了个体实际的衰老方式,受多种内部和外部因素影响。生物年龄的研究并不取代对驱动年龄相关疾病潜在机制的调查,而是有助于提供对衰老表现的机制性理解。确定生物年龄,特别是通过标准化指标或生物钟,对于量化生物体功能衰退并将其与时序衰老区分开来至关重要。衰老并非疾病的直接原因,而是累积风险因素的总和。无论如何,生物年龄与时序年龄之间的差异为加速或延缓衰老的干预措施的有效性提供了关键见解。例如,生理评估(如能量消耗呼吸测定法)、功能测试(如感官、精神运动和认知评估)以及先进的“组学”技术(如基因组学、表观基因组学和代谢组学),通常在单细胞水平,都有助于评估生物衰老,并为衰老相关事件提供进一步见解。这些方法能够评估健康恶化模式,更好地预测年龄相关疾病(包括死亡率)以及抗衰老策略的疗效,为促进健康老龄化的靶向干预铺平道路。
近年来,通过多种生物标志物估算生物年龄取得了显著进展,包括端粒长度、DNA甲基化、蛋白质组学、代谢组学、糖组学、可穿戴传感器数据和血液临床生物标志物。首批开发的分子工具之一是测量端粒长度,即染色体末端的重复DNA结构,其随细胞分裂周期而缩短。这种缩短机制与细胞衰老和健康下降有关。目前已开发出不同的方法来测量端粒长度,然而,当前的测量方法存在一些变异性,可能影响结果。此外,流行病学研究显示了端粒缩短与年龄之间矛盾的结果。基于蛋白质的衰老时钟已显示出预测时序年龄的高度准确性(相关系数r = 0.92–0.94),并与多种慢性病的发病率相关。Zhang等人开发了一种血浆代谢组学衰老评分,对短期(1-5年)死亡率具有很高的预测能力。同样,一项独立研究确定了其中几个生物标志物作为一个独特评分的一部分,该评分与生物衰老呈正相关,突出了关键的重叠区域——特别是在功能类别中,如系统性炎症(糖蛋白乙酰基-GlycA)、能量代谢(葡萄糖、乳酸、血糖)、脂质谱(多不饱和和饱和脂肪酸)和氨基酸相关途径(包括犬尿氨酸和一般氨基酸代谢)。这种跨独立模型的趋同强调了这些代谢过程在衰老生物学中的核心作用。用于生物年龄估计的可穿戴传感器通常实时测量身体活动、生理信号甚至生化标志物(如汗液),得出可能与死亡率风险、健康寿命和干预措施(如营养或药物)疗效相关的生物年龄评分。甚至复合血液生物标志物已证明即使在年轻和健康的个体中,也能在疾病发作或可见的加速衰老迹象出现之前检测到生物年龄的差异。其他生物钟结合了多种生物标志物,包括来自血液分析的临床变量、血液学、人体测量学、器官功能测试测量、功能性衰老指数或衰弱指数。
尽管取得了这些进展,但基于DNA甲基化的生物标志物由于其卓越的精确度、跨组织和物种的更广泛适用性以及与健康和疾病的更强相关性,继续主导着衰老研究。这使其特别适用于人类和动物模型的纵向和比较研究。在此框架下,表观遗传改变通过介导环境因素与基因表达之间的相互作用,影响机体对环境压力源的反应,从而在细胞衰老中发挥基础性作用。
作为衰老主要标志之一的表观遗传改变
表观遗传改变被认为是衰老过程的关键促成因素,在不改变基础DNA序列的情况下影响基因表达模式和细胞功能。在研究的改变中,有四种因其对衰老的影响及评估生物年龄的效用而脱颖而出:DNA甲基化失调、组蛋白翻译后修饰(PTMs)、microRNA(miRNA)特征和染色质结构重塑。在这些表观遗传机制中,DNA甲基化已成为衰老过程中的一个关键要素,既是标志物也是调节因子。
DNA甲基化模式随年龄发生深刻变化,其特征为整体低甲基化和特定位点高甲基化,特别是在CpG岛。基于此证据,Steve Horvath于2013年引入了“表观遗传时钟”概念,将DNA甲基化与生物年龄联系起来,定义了最著名的表观遗传时钟——Horvath时钟。同时,它并非唯一利用基于表观遗传标记方法构建的时钟,其他专注于不同于DNA甲基化机制的表观遗传时钟,如基于组蛋白翻译后修饰(PTMs)的时钟也有描述。
具体而言,乙酰化、甲基化和磷酸化在衰老中至关重要,因为它们调节染色质可及性和转录活性。有趣的是,衰老与组蛋白乙酰化减少有关,导致基因表达降低和细胞衰老。大多数表征的去乙酰化机制是由Sirtuins(SIRT1–7)介导的,它们被视为III类NAD?-组蛋白去乙酰化酶(HDACs),参与与衰老相关的关键过程,包括代谢和DNA修复。因此,旨在激活这些酶的策略已被研究作为潜在的抗衰老干预措施。其中,各种分子如白藜芦醇已被提出;相反,热量限制是目前唯一被证明有效的干预措施。尽管sirtuin基因与长寿和细胞调节密切相关,但目前尚不能用于确定个体的生物年龄。
Benayoun等人研究了小鼠模型中组蛋白H3在赖氨酸4的三甲基化(H3K4me3,一种启动子相关标记)和组蛋白H3在赖氨酸27的乙酰化(H3K27ac,一种增强子相关标记)的水平。对这些标记的分析揭示了区分年轻和老年样本的独特表观基因组和转录组景观。机器学习方法进一步表明,特定的表观基因组状态可以预测与衰老相关的转录变化。这些发现强调了组蛋白修饰不仅影响染色质结构,还介导了与衰老相关的炎症反应和转录转变。
miRNAs是小非编码RNA,在转录后水平调节基因表达,并表现出随年龄变化的表达谱。Huan等人在一项针对5000多名成年人的外周血分析中,确定了127种具有差异年龄相关表达的miRNA。该研究表明,这些miRNA大多在老年人中表达不足,表明它们对转录程序和RNA加工的调节作用。此外,他们开发了一种基于miRNA预测生物年龄的模型(“microRNA age”),该模型与基于DNA甲基化和mRNA表达的表观遗传时钟有适度相关性,并且还与高血压和冠心病等年龄相关疾病相关。Roig-Genoves等人的另一项研究开发了一种基于miRNA表达谱的表观遗传时钟来预测皮肤的生物年龄,皮肤是人类衰老最暴露的组织之一。他们的模型能够以80%的准确率将皮肤样本分类为年龄段,并以平均绝对误差10.89年预测年龄,接近其他基于转录组的生物钟。这些进展强调了miRNA特征作为有用工具的潜力,既可用于预测加速衰老,也可应用于制药和皮肤化妆品行业。
最后,染色质结构的改变,包括异染色质丢失和染色质松弛增加,也会损害衰老过程中核组织和基因表达的保真度。Rechsteiner等人开发了一种新颖的基于染色质可及性的衰老时钟,使用来自157名人类捐赠者的外周血单核细胞的图谱。该时钟显示出显著的准确性,中位绝对误差为5.69年。通过比较染色质可及性数据与匹配的转录组图谱,该研究表明确实用于年龄预测的基因组位点在衰老过程中经历了转录变化。这种染色质可及性时钟弥合了表观遗传改变与其下游生物学效应之间的差距,为研究衰老的表观遗传状态如何影响细胞功能提供了强有力的工具。
这些表观遗传改变共同反映了驱动衰老的分子机制的复杂相互作用,为评估生物年龄提供了稳健的框架。因此,它们可用作预测发病率和死亡率的生物标志物。未来的研究应致力于将这些标志物整合到综合模型中,以改进衰老预测和治疗干预。
基于DNA甲基化的时钟
可以区分两代主要的甲基化时钟,代表了模型设计、预测能力和衰老及疾病结局临床相关性的逐步改进。
第一代时钟仅基于选定CpG位点的DNA甲基化模式开发,用于估计时序年龄。它们在预测实际年龄方面非常准确,但在捕捉除年龄本身以外的生物衰老或健康相关结局方面效果较差。Horvath时钟由Horvath于2013年开发,是一种广泛认可且精确的工具,利用分布在基因组中的353个CpG位点估计多种组织类型的表观遗传年龄,表观遗传年龄与时序年龄之间的相关系数为0.96,适用于多种组织,尽管在培养细胞中有限制。在针对人类衰老的研究中验证了该模型,证明其在检测唐氏综合征和神经退行性疾病等疾病中的表观遗传年龄加速方面有效。该模型的多组织适用性使其非常适合在多样化人群中进行大规模研究,可应用于血液、皮肤和大脑等组织。最近的研究使用DNAmFitAge变体将其与身体健康和生活质量联系起来。该时钟在某些组织、多样化人群和年龄极端情况下的准确性存在局限性,以及反映实际生物衰老的能力方面也存在限制。此外,其效用可能受到样本细胞组成和甲基化技术平台更新的影响。
Hannum时钟专门关注血液中的DNA甲基化,分析大约71个CpG位点以估计生物年龄。尽管该表观遗传时钟最初设计用于测量时序年龄,但它在涉及老年人的研究中被证明特别有效,显示出与死亡率相关风险因素的强相关性。然而,它的使用仅限于血液样本,减少了其在多组织研究中的效用,并且其在年轻人群或不同健康状况下的预测敏感性较不稳健。
第二代或下一代表观遗传时钟通过结合健康相关变量(例如临床血液生物标志物和生活方式因素如吸烟)与DNA甲基化数据进入训练框架,扩展了第一代年龄估计器,从而改善了与第一代时钟相比的死亡率、疾病风险和健康寿命的预测。这些模型显示出与身体功能、衰弱、残疾、认知表现、偶发性年龄相关疾病和痴呆症的更强关联。代表性的例子包括DNAm PhenoAge和GrimAge,它们针对复合发病率和死亡率结局进行训练,并显示与全因死亡率以及心血管和神经退行性疾病有很强的联系。最近的时钟如DunedinPACE量化了纵向多系统生物标志物的衰老速度,而CheekAge代表了一种基于颊粘膜的下一代时钟,旨在捕捉生物年龄中与健康和生活方式相关的变异。
DNAm PhenoAge时钟由Levine等人开发,整合DNA甲基化数据与临床生物标志物,以估计反映生理健康和整体生理状态的“表型年龄”。该时钟利用Elastic Net回归模型选择的513个CpG位点来预测表型年龄,其中包含来自NHANES III数据的炎症、免疫功能和代谢健康等指标。DNAm PhenoAge已显示出与全因死亡率、衰老相关疾病(如心血管疾病、糖尿病、慢性呼吸系统疾病)以及身体和认知功能的强关联。它通过捕捉同龄个体间的生物衰老偏差,在预测发病率和死亡率方面超越了第一代表观遗传时钟,如Horvath和Hannum的模型。DNAm PhenoAge的优势包括其跨组织的适用性、识别衰老相关风险的稳健性以及基于健康寿命区分个体的能力。
GrimAge结合了额外的生物标志物,如血浆蛋白和吸烟史,以预测长期健康风险、死亡率和预期寿命。它将表观遗传标记与健康风险因素相结合,在预测具有显著健康风险的群体的死亡率和疾病风险方面实现了高精度,特别是在心血管疾病方面。甚至,GrimAge代表了在识别年龄相关衰退方面相对于Horvath、Hannum、PhenoAge时钟的一步改进。尽管有这些优势,其实施需要详细的生活方式数据以及用于蛋白质和甲基化分析的高级平台。
DunedinPACE时钟由Belsky等人开发,是一种基于DNA甲基化的模型,专门设计用于测量生物衰老的速度。它建立在早期的DunedinPoAm模型之上,利用来自Dunedin队列的二十年间收集的19种生物标志物(包括心血管、代谢、肾脏和免疫系统)量化纵向多系统器官完整性的变化。该算法对173个CpG位点使用Elastic Net回归,这些位点因其高重测信度而被选中,以从单次血液样本中估计衰老速度。DunedinPACE时钟显示出与发病率、残疾和死亡率的强相关性,显示了其对功能衰退、认知衰老和早年逆境的预测价值。与其他时钟(如GrimAge或Horvath时钟)相比,DunedinPACE独特地捕捉了衰老的速度而非累积的年龄相关变化。其高精度、由于组内相关系数(ICC)为0.96带来的可靠性以及对吸烟相关偏倚的稳健性,使其成为探索针对衰老基本机制以预防或延迟年龄相关疾病和衰退发作的干预措施的试验和纵向研究的宝贵工具。这项开发基于新西兰队列,尽管已在欧洲、美国和中国的数千人中进行测试,但大多数研究是在欧洲和亚洲血统的人群中进行的,因此需要在更多样化的人群中进行额外验证。此外,其实施需要高密度甲基化阵列,这可能限制其在某些环境中的可及性。DunedinPACE是为了量化生物衰老的速度而非时序年龄本身而开发的;因此,原始出版物报告了与纵向衰老速度的相关性以及重测信度,但未报告以年为单位的均方根误差,因此在表中标记为不适用。
CheekAge时钟作为一种下一代表观遗传衰老时钟被开发出来,专门设计用于利用颊粘膜上皮细胞的DNA甲基化数据估计生物年龄。该时钟在一个超过8000名18-93岁个体的数据集上进行训练,利用从大约200,000个过滤后的CpG中得出的10,000个CpG簇来预测生物年龄,并检测与饮食、身体活动、睡眠和精神健康等生活方式和健康因素相关的年龄加速。该模型采用了一种新颖的模拟退火方法,这是一种随机全局优化策略,迭代探索解空间以找到最佳线性模型。这种方法与CpG过滤、CpG聚类和时钟集成相结合。具体来说,模拟退火过程优化了平衡模型准确性、delta年龄与生活方式/健康调查因素之间相关性的显著性以及模型复杂度的自定义目标函数。训练重复了1,098次,并使用前100名得分模型的加权平均值产生最终的CheekAge预测因子。这种集成方法旨在减少模型特定噪声,并提高从甲基化数据得出的生物年龄估计的可重复性。据报道R2为0.91,均方根误差(RMSE)为4.5年,平均绝对误差(MAE)为3.22年,CheekAge显示出估计生物年龄和衰老加速的强预测能力,以及与死亡风险的显著关联,但其预测特定合并症的能力有限,且与生活方式因素的相关性相对较弱。
从实验台到病床:表观遗传时钟的临床和人群应用
人们对表观遗传时钟潜在的临床和健康应用兴趣日益浓厚。这些时钟不仅可以准确估计生物年龄,还提供了一个独特的机会来识别衰老过程中的个体差异,这可能在个性化医疗中起到关键作用,更重要的是,提供可能改善患者健康状况的生活习惯和可操作信息。它们将生物年龄与慢性病风险、特定疗法疗效和某些病理进展等因素相关联的能力,使表观遗传时钟成为精准医疗中的一种变革性工具。
反映了这种日益增长的兴趣和临床潜力,出现了几种基于DNA甲基化表观遗传时钟的直接面向消费者的检测,如NOVOS、TruAge、myDNAge等。这些检测不仅测量生物年龄和衰老速度,而且在某些情况下还整合了额外的参数,如特定身体系统的分析和改善健康和衰老的个性化建议。
Novos Age Clock由NOVOS Labs开发,通过将DunedinPACE表观遗传生物标志物应用于指尖采血获得的毛细血管血样的DNA甲基化数据,估计生物年龄和衰老速度(生物衰老率)。DunedinPACE在Dunedin研究中作为20年生物衰老速度的衡量标准进行训练,并使用173个CpG位点,这些位点因高重测信度而被选中,显示出与发病率、残疾和死亡率的优秀技术重现性和强关联。测试报告将这些估计与饮食、运动和压力管理等生活方式因素联系起来,并强调可操作的建议。使用经过充分验证的衰老速度算法是一大优势,但对基于阵列的DNA甲基化谱分析的依赖导致了较高的实验和计算成本,并导致相对较高的价格和处理时间,且目前的可用性仅限于美国和加拿大。
Index Biological Age Test由Elysium Health与Morgan Levine博士合作开发,是一种基于唾液的表观遗传时钟,使用专有的Algorithmic Platform for Epigenetic Examination (APEX)和定制的Illumina芯片分析超过100,000个CpG位点的DNA甲基化。该技术能够准确测量生物年龄、累积衰老率以及九个特定系统(包括大脑、心脏、免疫系统和代谢系统)的生物年龄。APEX算法已经过同行评审,并显示出显着提高表观遗传年龄测量的技术可靠性,大多数重复样本在1.5年内一致,并且性能优于第一代时钟。即便如此,依赖基于阵列的甲基化分析、六周的处理时间和相对较高的价格可能会限制部分消费者的可及性。
myDNAge?测试由Epimorphy开发,基于Horvath博士的表观遗传时钟,这是一种专有的SWARM?下一代测序工作流程,可量化2000多个基因组位点的DNA甲基化。该检测可在血液或尿液中进行,报告估计的生物年龄(DNAge)以及相对于同龄人的年龄加速指数,并且在一些报告中还包括APOE和MTHFR基因型等遗传信息。在Horvath的原始出版物中,基础的DNAm年龄算法在多种组织中实现了约0.96的相关系数和约3.6年的平均绝对误差,该时钟已广泛用于将表观遗传年龄加速与发病率和死亡率联系起来的流行病学研究。myDNAge商业实施的具体性能指标尚未完全披露,且4-6周的检测成本和加工时间构成了实际限制。
DeepMAge Clock由Deep Longevity开发,是一种基于深度神经网络在基于阵列的血液甲基化数据上训练的DNA甲基化衰老时钟。在原始出版物中,DeepMAge在4,930个血液DNA甲基化图谱上进行训练,在训练数据集中实现了2.24年的交叉验证中位绝对误差,在1,293个样本的独立健康验证队列中实现了2.77年,在大多数验证研究中优于2013年的Horvath时钟。DeepMAge显示出对多种年龄相关病症(包括卵巢癌、炎症性肠病和多发性硬化症)的敏感性,使其成为健康相关衰老的信息标志物。其复杂性和对基于阵列的DNA甲基化检测的需求增加了计算和实验负担,并且需要在多样化人群中进行进一步的纵向验证。
Chronomics Epigenetic Biological Age Test通过甲基化唾液样本中的DNA来计算生物年龄,重点关注生活方式和环境因素如何影响衰老。它提供了衰老和相关健康风险的临床合理视图。该测试强调非侵入性、自我管理的采样,并通过在线仪表板展示结果,解释生物标志物读数并建议生活方式调整。然而,目前没有专门的同行评审出版物详细描述商业Chronomics测试的特定算法、CpG位点或准确性指标,大约8-12周的相对较长的处理时间进一步限制了对其性能的独立评估,并可能被认为是一个实际缺点。
TallyAge? Test是CheekAge颊粘膜表观遗传时钟的商业实现,旨在通过颊粘膜细胞样本中的DNA甲基化估计生物年龄。CheekAge使用来自超过8,000名18-93岁成人的MethylationEPIC数据进行开发,最终模型包含通过模拟退火方法结合CpG聚类和模型集成选择的193个CpG位点。在内部验证中,该时钟对时序年龄的R2达到0.91,平均绝对误差为3.87年(450K阵列版本),并且源自CheekAge的年龄加速指标与纵向队列中的一系列生活方式和健康变量以及死亡风险相关。颊拭子样本使检测具有非侵入性和用户友好性,已发表的分析表明CheekAge加速与多种因素和疾病相关,尽管个体生活方式变量的效应量适中,不能完全解释表观遗传年龄的个体间差异。需要进一步的研究来描述该时钟对干预措施的反应,并评估其用于长期健康监测的效用。
TruAge Complete Collection Clock由TruDiagnostic开发,是一种商业检测,使用DunedinPACE DNA甲基化模型评估衰老速度和多个系统特异性评分。该检测分析173个CpG位点的DNA甲基化,以估计生物年龄、衰老速度和11个关键器官系统(包括大脑、心脏和肝脏)的生物年龄。该检测使用指尖采血获得的毛细血管血作为生物标本,报告生物年龄、衰老速度以及端粒长度和免疫细胞比率等额外生物标志物。已发表的DunedinPACE验证表明与生物衰老和健康结果的纵向测量有很强的相关性,而不是与时序年龄本身相关,TruAge报告应用这些估计值提供以生活方式为导向的反馈。与其他基于指尖采血的检测一样,采样程序具有微创性,但对于某些用户来说可能仍然不舒服,并且需要处理和运输血液样本的常见限制,相对较高的成本可能会限制其广泛人群使用的可及性。
DoNotAge Biological Age Test是一种表观遗传时钟,与前几个测试一样,使用DNA甲基化水平。该测试使用非侵入性唾液样本来评估几个与衰老和健康结果相关的CpG位点。虽然关于基础时钟模型的具体细节尚未公开披露,但该测试提供了全面的信息,包括生物年龄、炎症评分和系统特异性指标,如记忆年龄和眼睛年龄。结果在一份报告中呈现,其中包括与免疫、肠道健康、心理健康和维生素缺乏等健康因素相关的数据。值得注意的是其非侵入性程序,以及包含各种