遗传因素在心肺健康与身体状况关联性中的评估

《Scandinavian Journal of Medicine & Science in Sports》:Evaluation of Genetics in the Association Between Cardiorespiratory Fitness and Health

【字体: 时间:2026年05月07日 来源:Scandinavian Journal of Medicine & Science in Sports 3.8

编辑推荐:

  **摘要** 我们评估了与心肺健康(CRF)相关的遗传因素在常见非传染性疾病(NCDs)风险和死亡率方面的贡献程度,以及具有不同CRF水平和遗传倾向的个体在健康特征上是否存在差异。我们使用了一个经过验证的基于SBayesR的全基因组多基因评分(PGS CRF),该评分结合了90

  **摘要**

我们评估了与心肺健康(CRF)相关的遗传因素在常见非传染性疾病(NCDs)风险和死亡率方面的贡献程度,以及具有不同CRF水平和遗传倾向的个体在健康特征上是否存在差异。我们使用了一个经过验证的基于SBayesR的全基因组多基因评分(PGS CRF),该评分结合了905,707个单核苷酸多态性的信息来衡量CRF的遗传因素。通过对FinnGen队列(N=262,137;基线时平均年龄53.5岁,52.0%为女性)和HUNT3队列(N=26,115;平均年龄59.0岁,52.4%为女性)的数据进行分析,探讨了CRF遗传因素与新发NCDs和死亡率之间的关联,并在HUNT3队列中进行了复制验证。在HUNT3队列中,我们还比较了具有高或低CRF(V?O2peak)以及高或低PGS CRF的个体的健康特征(N=1,316人)。结果显示,PGS CRF与各种心血管疾病(HR 0.99,95%置信区间0.98–1.00)、缺血性心脏病(HR 0.98,0.97–0.99)、高血压疾病(HR 0.99,0.97–1.00)、中风(HR 0.98,0.97–1.00)、肺癌(HR 0.95,0.92–0.97)、慢性下呼吸道疾病(HR 0.98,0.97–0.99)、2型糖尿病(T2D)(HR 0.96,0.95–0.97)和全因死亡率(HR 0.98,0.97–0.99)呈负相关。复制分析也支持了PGS CRF与T2D之间的关联。尽管按遗传倾向分组没有观察到健康特征的差异,但具有较高V?O2peak的个体显示出更健康的状况。尽管全基因组PGS只能解释部分CRF表型,但仍观察到了一些小规模的关联,尤其是在T2D发病率方面。

### 1 引言

身体健康是一系列个体所具备或能够达到的属性,这些属性与其进行体力活动的能力相关[1]。心肺健康(CRF)是指“将氧气从大气输送到线粒体以完成体力工作的综合能力”,它是身体健康研究中最重要的方面之一[2]。CRF与整个生命周期中的非传染性疾病(NCDs)密切相关[2-4]。全球主要的非传染性疾病包括心脏病、癌症、慢性呼吸道疾病和糖尿病[5]。一项涵盖2,090万个个体观察结果的综述表明,较高的CRF与较低的心血管疾病、心力衰竭、中风、房颤、2型糖尿病(T2D)风险以及心血管疾病、突发性心脏病、所有癌症和肺癌的死亡率显著相关[6]。定量估计显示,CRF每增加一个代谢当量(1-MET),心血管代谢疾病的风险降低(疾病特异性风险比[HR]范围为0.82至0.97),全因死亡率也降低(HR范围为0.83至0.89)[6]。然而,已知CRF受到遗传因素的强烈影响[7]。来自双胞胎研究和家庭研究的遗传度估计值在44%到68%之间变化[8]。遗传相关性研究表明,CRF与多种NCD风险因素之间存在共同的遗传物质[9]。此外,一些与CRF相关的基因变异是表达数量性状位点(eQTLs),可能会影响心脏、动脉、肺部和脂肪组织中的基因表达[9, 10]。因此,在CRF背景下有利的基因型可能有助于改善肺部、心脏、血管系统和细胞代谢的结构与功能,并影响全身炎症和免疫功能——这些都是CRF和常见NCDs高度相关的方面[4, 9]。然而,仍需要更多证据来评估遗传因素是否能够有效解释高CRF所带来的益处。目前尚不清楚具有相似基因型但CRF水平不同的个体在健康状况上是否存在差异。一些研究表明,CRF不一致的双胞胎在基线特征或后期心血管疾病(CVD)的发生率上没有差异[11];不过,曾经是精英耐力运动员的个体比他们的兄弟姐妹多活了2.4年[12]。全基因组多基因评分(PGSs)可以比以往更准确地评估个体的遗传构成[13]。最近的一项开创性研究使用全基因组PGS报告了CRF遗传因素、CVD和死亡率之间的小效应大小[14]。在本研究中,我们开发并应用了PGS来评估与CRF相关的遗传因素对所有主要NCDs和全因死亡率的贡献程度,并进一步评估了具有不同CRF水平和CRF遗传倾向的个体在健康特征上的差异。我们假设:(1)PGS CRF与新发CVD、癌症、慢性呼吸道疾病、T2D和全因死亡率的风险呈负相关,效应大小为中等到小;(2)无论遗传倾向如何,较高的CRF都与更好的健康状况相关。

### 2 方法

研究设计如图1所示。我们主要使用了FinnGen队列进行数据分析,并通过HUNT3队列进行验证、复制和组间比较(图1)。我们还在FinnGen队列中进行了额外的敏感性分析,并在HUNT3队列中进行了探索性分析。本研究的报告符合STROBE声明[15]。

#### 2.1 研究队列

FinnGen是一个正在进行的芬兰公共-私人合作伙伴研究项目,它通过个人识别号码将基因型数据与数字健康登记数据链接起来[16]。招募主要通过医疗保健渠道进行。FinnGen数据发布12包含了520,210名参与者的基因型数据(约占芬兰人口的9.4%)(https://www.finngen.fi/en)。最终病例样本(N=262,137)的构成如下:490,729人有终点数据,477,744人年龄至少为18岁,343,850人有BMI数据,262,137人还有吸烟数据。值得注意的是,BMI和吸烟数据有相当大的缺失比例,分别为28%和41%。我们在分析中使用了特定的结果子样本(样本量从n=95,238到n=262,048不等),这些样本仅包括基线时没有被研究终点诊断的参与者。HUNT(Tr?ndelag健康研究)是一项在挪威Tr?ndelag地区进行的大规模人群队列研究,整合了健康调查数据、生物样本和国家健康登记信息[17, 18]。该研究包含了迄今为止最大的通过间接热量测定法测量CRF的数据集之一。自1984年成立以来,已经分多个阶段(HUNT1–HUNT4,https://www.ntnu.edu/hunt)收集了表型和遗传数据[19]。2006–2008年间,共有50,800名20岁及以上的参与者参与了HUNT3研究。样本选择原则与FinnGen相似。

#### 2.2 结果

非传染性疾病(NCDs)的选择基于世界卫生组织对常见NCDs的定义[5]。我们还将全因死亡率作为结果指标。FinnGen的数据来源于医疗保健登记(自1968年起可用)、芬兰癌症登记(1953年)、死因登记(1969年)和芬兰社会保险机构药品购买登记(1995年)。作为结果指标的病症包括任何类型的心血管疾病(包括缺血性心脏病、高血压和中风等亚类)、任何类型的癌症(包括乳腺癌、前列腺癌、结直肠癌和肺癌等亚类)、慢性下呼吸道疾病(亚类包括哮喘和慢性阻塞性肺疾病[COPD])以及2型糖尿病(T2D)。亚类的选择基于FinnGen R12队列中最常见的终点。相关ICD-10代码和FinnGen标签可在表S1中找到。我们在HUNT的复制分析中也使用了相同的ICD代码。HUNT数据来自Nord-Tr?ndelag健康信托基金的出院登记(自1987年起可用)。

#### 2.3 暴露因素

在选择用于PGS CRF的基础数据时,我们谨慎评估了当时可用的最大规模的全基因组关联研究(GWAS),该研究专注于CRF[9]。具体来说,PGS是基于次最大强度运动测试的,而不是测量得到的V?O2max。公开可用的汇总统计数据显示了每个单核苷酸多态性(SNP)对CRF的影响大小。这些效应大小基于70,783名接受了次最大强度自行车测试的UK Biobank参与者的数据。在GWAS中,根据体重估算的最大工作负荷(以千瓦/公斤为单位)代表了CRF。工作负荷和心率数据是在6分钟的运动期间收集的,其中被判定为“最低”或“中等”风险类别的参与者的工作负荷会增加,而“中等”风险类别的参与者在整个测试过程中保持工作负荷不变。风险类别在GWAS分析中被视为协变量[9]。完整的测试协议在其他地方有详细描述[20]。GWAS鉴定出12个具有统计学意义的SNP和多个功能相关的基因[9]。SNP的遗传度为10.5%,基于Complex-Traits Genetics Virtual Lab的估计[21],这表明其适合作为构建PGS的基础数据[13]。我们使用SBayesR方法为每个参与者构建了PGS CRF[22]。首先,我们检索了8,918,920个SNP的报告权重。然后,我们将这些遗传信息限制在1,074,896个HapMap3 SNP上,以确保计算效率的同时保持全基因组的代表性,同时关注常见变异(次要等位基因频率MAF > 5%)和良好的校准覆盖率[23]。为了纠正由连锁不平衡(LD)引起的权重膨胀,我们随后应用了一个由50,000名随机选择的UK Biobank参与者组成的LD参考组。这些程序最终得到了916,113个SNP及其相关权重,这些数据用于计算FinnGen和HUNT3中每个参与者的PGS CRF。完整的分析流程在其他地方有描述[24]。FinnGen中处理的变异总数为905,707个,HUNT3中为915,971个。我们在分析中使用了标准化的PGS分数(平均值0,标准差[SD]为1)。构建的PGS CRF与通过间接热量测定法在最大负荷跑步机测试中测得的CRF金标准测量结果显示出小但具有统计意义的关联(使用的方法是评估在增加工作负荷的情况下氧气消耗是否达到平台期,以及呼吸交换率是否大于1.05)[25]。PGS CRF解释了V?O2peak mL/kg/min变异的0.20%和V?O2peak mL/kg0.75/min变异的0.21%。观察到的关联强度与之前验证的与新发NCDs相关的运动相关多基因评分相当[26-29]。我们还测试了两种替代的PGS方法:(1)基于按无脂质量调整后的V?O2max的GWAS的SNP权重(PGS CRF FFM),并按照之前的方法进行评分(SBayesR方法);(2)基于有利SNP及其总结的效应大小(GRS CRF)。然而,这些替代评分并未改善测量CRF的解释能力,因此被排除在进一步分析之外(详见表S2中的验证队列描述、表S3中的详细结果、图S1中的密度图以及图S2中的遗传评分与CRF标志物之间的相关性热图)。

#### 2.3.1 基因分型、质量控制和校正

FinnGen样本使用Illumina和Affymetrix芯片阵列进行基因分型(Illumina Inc., 圣地亚哥;Thermo Fisher Scientific, 圣克拉拉, CA, 美国)。详细的基因分型、质量控制和校正信息可在以下链接获取:https://finngen.gitbook.io/documentation/。在HUNT3研究中,使用了Illumina的标准和定制HumanCoreExome芯片阵列。基因分型、校正和质量控制的完整细节可以在其他来源找到[19]。

#### 2.4 协变量

协变量的选择基于先前的文献,以考虑基因分型过程和个体特征可能带来的偏差。前10个主成分用于校正遗传分层[31]。包括基因分型批次(批次编号)以纠正基因分型过程可能引入的系统性偏差。身体质量指数(BMI, kg/m2)、吸烟状态(从未吸烟、曾经吸烟、目前吸烟)和性别(男性、女性)的数据来自芬兰生物银行和HUNT研究,同时包含了自我报告的数据和测量数据[16, 19]。

#### 2.5 统计分析

#### 2.5.1 生存分析

我们使用Cox比例风险模型和R包生存分析[32]来估计FinnGen队列中PGS CRF与新发NCDs和死亡率之间的风险比(HRs)及其95%置信区间(CI)。通过对Schoenfeld残差和log-minus-log图的实际检查,确认了完全调整后的模型满足比例风险假设[33]。先前的研究发现,与健康相关的PGSs与健康结局之间存在性别交互作用[34]。虽然测试了PGS × SEX的交互作用,但没有观察到可重复的性别差异(所有pinteraction > 0.370);因此,分析将男性和女性合并在一起进行,除了乳腺癌和前列腺癌,这两者是按性别分开分析的。分析仅限于具有完整病例数据的参与者。我们以年龄作为时间轴。随访的开始时间设定为每个参与者的基线年龄(血液采样时的年龄),以确保研究设计与以往关于CRF的队列研究一致。为了捕捉新发事件,我们排除了基线前已被诊断出感兴趣结局的个体。随访结束时间取决于以下最早发生的情况:感兴趣的结局的首次记录、死亡或2021年12月31日的随访结束。为了保持FinnGen和HUNT队列之间的一致性,排除了未成年个体(<18岁)。模型1包括了性别(乳腺癌和前列腺癌除外)、祖先的前10个主要成分以及基因分型批次。模型2是在模型1的基础上增加了BMI;模型3增加了吸烟因素;模型4则在模型1的基础上同时增加了BMI和吸烟因素。我们报告了模型1的结果作为主要结果,因为我们观察到较高的PGS CRF与较低的吸烟倾向和较低的BMI相关(目前吸烟者相对于从未吸烟者的比值比:0.95,p<0.001;以及BMI每增加一个标准差,PGS CRF增加β -0.22,p<0.001),因此吸烟和BMI可能不是简单的协变量。我们还报告了在调整了BMI和吸烟因素后PGS CRF与健康结果的关联。此外,我们还使用了将PGS CRF分为五分位的分类方法进行了额外的分析。在相关情况下,计算了基于欧洲标准人口的年龄标准化发病率。统计显著性水平设定为<0.05。由于进行了多次检验,我们对p值应用了假发现率(FDR)校正。

2.5.2 敏感性分析
作为敏感性分析,我们将FinnGen研究中的Cox比例风险模型限制在从未吸烟的参与者范围内。该模型的其他规格与主要生存分析中使用的相同。

2.5.3 复制分析
HUNT3中的复制分析与FinnGen中的主要分析类似,不同之处在于在缺乏死亡数据的情况下,随访定义为感兴趣 endpoints的首次记录或直到2024年底的最后一次医疗保健接触。为了确保足够的样本量,结果仅限于主要疾病类别:心血管疾病(CVDs)、癌症、肺部疾病和2型糖尿病(T2D)。

2.5.4 组间比较
我们使用先验功效计算来确定足够的样本量和组间分界点(预期效应量小,功效为0.80,N > 400)。根据年龄和性别特定的V?O2peak及PGS CRF的≥70百分位数和≤30百分位数将参与者分为不同的组。年龄以5年为单位进行分组。V?O2peak和高PGS CRF(均≥70百分位数)的参与者被归为第1组(表S4)。V?O2peak高但PGS CRF低的参与者(≤30百分位数)被归为第2组。V?O2peak低和PGS CRF高的参与者被归为第3组,而V?O2peak和PGS CRF都低的参与者(均≤30百分位数)被归为第4组。使用ANOVA评估了各组在健康相关特征上的差异。通过目视检查或Shapiro-Wilk检验来检验正态性假设,使用Levene检验来检验同质性,使用Tukey's HSD检验来检验统计差异;如果Levene检验不成立,则使用Welch-ANOVA和Games-Howall事后检验。对于分类变量,使用卡方检验来检验差异。对于显著偏离正态分布的变量(如MET h/week和甘油三酯),分别进行了平方根变换和对数变换。由于观察到的统计关联在原始值和变换后的值之间没有差异,因此仅显示原始值。我们还仅将Cox比例风险模型用于探索性分析,以研究组间的疾病发病率。

3 结果
FinnGen中的完整病例样本(N=262,137)的描述性数据如表1所示。发病率和随访时间因疾病而异。例如,17.4%的参与者被诊断出患有任何类型的CVD(45,504例),年龄标准化发病率为每10,000人年354.86例(图2)。任何CVD的平均随访时间为9.23年,总随访时间为419,935人年。表1显示了FinnGen中完整病例样本的基线特征。

3.1 PGS CRF与发病率和死亡率之间的关联
PGS CRF每增加1个标准差,所有评估的心血管疾病(CVDs)的风险都会降低:任何CVD(风险比HR 0.99,0.98–1.00,FDR p值=0.014;图2)、缺血性心脏病(HR 0.98,0.97–0.99,p=0.014)、高血压疾病(HR 0.99,0.97–0.90,p=0.018)和中风(HR 0.98,0.97–0.90,p=0.039)。在癌症中,PGS CRF仅与肺癌风险降低有关(HR 0.95,0.92–0.97,p=0.001)。在肺部疾病中,PGS CRF与慢性 lower respiratory disease(HR 0.98,0.97–0.99,p=0.018)和COPD(HR 0.97,0.95–0.99,p=0.006)的风险降低有关,但与哮喘无关(HR 0.98,0.96–1.00,p=0.074)。PGS CRF还与2型糖尿病(HR 0.96,0.95–0.97,p<0.001)和全因死亡率(HR 0.98,0.97–0.99,p=0.001)有关。不同调整集的关联在补充材料(图S3-S5)中提供。在调整BMI后,这些关联减弱,而其他观察到的关联仍然具有统计学意义(图S3)。在同时调整BMI和吸烟因素后,这些关联仅有轻微变化(图S4)。在同时调整了BMI和吸烟因素的模型中,我们仅观察到肺癌(HR 0.95,0.93–0.98,p=0.003)、2型糖尿病(HR 0.98,0.96–0.99,p=0.003)和全因死亡率(HR 0.98,0.98–0.99,p=0.005;图S5)的统计显著关联。我们还检查了在高PGS CRF(>90百分位数)和低PGS CRF(<10百分位数)个体中,调整BMI和吸烟因素后的关联,并通过累积发病率图进行展示。数据显示,高PGS CRF与全因死亡率降低相关,而2型糖尿病和肺癌的关联在中年或老年后更为明显(图S6)。在从未吸烟者的敏感性分析中未发现统计显著关联,表明吸烟可能在观察到的关联中起重要作用(图S7)。进一步使用PGS五分位数的分析表明,乳腺癌、结直肠癌和哮喘的关联存在显著变化,这可能反映了非线性关联或病例数量有限(图S8)。在复制分析中(见表S5的样本特征),2型糖尿病的关联在HUNT3中得到了复制,尽管在调整BMI后有所减弱(模型1:HR 0.95,0.92–0.99;模型2:HR 0.99,0.95–1.03;模型3:HR 0.96,0.92–0.99;模型4:HR 0.99,0.95–1.03;表S6)。在HUNT3中,PGS CRF与任何CVD、任何癌症和肺部疾病之间的关联均无统计学意义(HR分别为1.01,0.99–1.03;HR分别为1.02,0.99–1.07;HR分别为1.07,0.94–1.00;表S6)。

3.2 V?O2peak和PGS CRF组之间的健康差异
具有不同CRF水平和遗传易感性的组在健康特征上表现出系统性模式(表2)。我们观察到,无论PGS CRF如何,V?O2peak较高的组与V?O2peak较低的组在健康状况上存在差异;V?O2peak较高的组有较低的心率、BMI,当前吸烟的可能性较低,身体活动更多,自我评估的健康状况更好,收缩压较低,HDL胆固醇较高,LDL胆固醇和FINDRISC糖尿病评分也较低。唯一的例外是舒张压和总胆固醇,其中并非所有V?O2peak较低的组在统计上都与V?O2peak较高的组有所不同(表2)。

表2. 具有高或低心肺健康状况和高或低PGS CRF的个体的特征

| 特征 | N | (1) 高V?O2peak高PGS CRF | (2) 高V?O2peak低PGS CRF | (3) 低V?O2peak高PGS CRF | (4) 低V?O2peak低PGS CRF |
|------------------|------------|------------------|------------------|------------------|------------------|
| PGS CRF (Z-score) | 375 | 1.16 (0.5) | 279 | -1.16 (0.5) | 299 | |
| V?O2peak (mL/kg/min) | 375 | 48.5 (8.6) | 279 | 48.9 (8.6) | 299 | |
| | 330 (6.7) | 363 | 32.3 (6.5) | | |
| | 375 | 141.0 (27.1) | 279 | 142.0 (27.3) | | |
| | 375 | 374 | 65.0 (11.2) | 279 | 63.5 (9.9) | |
| | 375 | 48.7 (12.4) | 279 | 47.7 (13.3) | 49.2 (13.9) | |
| | 375 | 208 (55.5%) | 279 | 145 (52.0%) | 157 (52.5%) | |
| | 375 | 191 (50.9%) | 153 | 54.8% | 121 | 40.5% | |
| | 375 | 168 | 44.8% | 115 | 41.2% | 162 | 54.2% | |
| | 375 | 16 | 4.3% | 11 | 3.9% | 16 | 5.4% | |
| | 375 | 24.2 (2.7) | 279 | 24.0 (2.45) | 277 (3.8) | | |
| | 375 | 222 | 59.2% | 163 | 58.3% | 126 | 42.1% | |
| | 375 | 113 | 30.1% | 75 | 26.9% | 110 | 36.8% | |
| | 375 | 40 | 10.7% | 41 | 14.7% | 63 | 21.1% | |
| | 375 | 15.9 (8.6) | 279 | 16.5 (9.3) | 294 | 12.0 (8.8) | |
| | 375 | 126 | 126 (14.9) | 267 | 130 (16.2) | | |
| | 375 | 130 (16.2) | 294 | 130 (16.0) | | |
| | 375 | 72.0 (10.7) | 267 | 72.0 (10.2) | 294 | | |
| | 375 | 5.4 (1.0) | 267 | 1.5 (0.4) | 294 | 1.4 (0.3) | |
| | 375 | 3.6 (0.9) | 267 | 3.5 (0.9) | 294 | 3.9 (1.0) | |
| | 375 | 1.2 (0.6) | 267 | 1.2 (0.6) | 294 | 1.6 (0.9) | |
| | 375 | 3.5 (0.9) | 267 | 3.5 (0.9) | 355 | 3.8 (1.0) | |
| | 375 | 1.7 (1.0) | 267 | 3.5 (0.9) | 355 | 3.8 (1.0) | |

注:连续变量的值为平均值(标准差),分类/二进制变量的值为n(%)。缩写:BMI,身体质量指数。图2在图形查看器中打开。

在最小调整模型中,多基因评分(PGS CRF)与常见非传染性疾病和全因死亡率的关联。该模型调整了性别(乳腺癌和前列腺癌除外)、祖先的前10个主要成分以及基因分型批次。对于每个终点,分析样本仅包括基线时有疾病风险的参与者(即排除了现有病例),从而得出了包含的对照组和病例的特定终点数量。

3.1 PGS CRF与发病率和死亡率之间的关联
PGS CRF每增加1个标准差,所有评估的心血管疾病(CVDs)的风险都会降低:任何CVD(HR 0.99,0.98–1.00,FDR p值=0.014;图2)、缺血性心脏病(HR 0.98,0.97–0.99,p=0.014)、高血压疾病(HR 0.99,0.97–0.90,p=0.018)和中风(HR 0.98,0.97–0.90,p=0.039)。在癌症中,PGS CRF仅与肺癌风险降低有关(HR 0.95,0.92–0.97,p=0.001)。在肺部疾病中,PGS CRF与慢性 lower respiratory disease(HR 0.98,0.97–0.99,p=0.018)和COPD(HR 0.97,0.95–0.99,p=0.006)的风险降低有关,但与哮喘无关(HR 0.98,0.96–1.00,p=0.074)。PGS CRF还与2型糖尿病(HR 0.96,0.95–0.97,p<0.001)和全因死亡率(HR 0.98,0.97–0.99,p=0.001)有关。不同调整集的关联在补充材料中提供(图S3-S5)。在调整BMI后,与CVDs的关联减弱,而其他观察到的关联仍具有统计学意义(图S3)。在调整吸烟因素后,这些关联仅略有改变(图S4)。在同时调整了BMI和吸烟因素的模型中,我们仅观察到肺癌(HR 0.95,0.93–0.98,p=0.003)、2型糖尿病(HR 0.98,0.96–0.99,p=0.003)和全因死亡率(HR 0.98,0.98–0.99,p=0.005;图S5)的统计显著关联。我们还检查了在高PGS CRF(>90百分位数)和低PGS CRF(<10百分位数)个体中,调整BMI和吸烟因素后的关联。数据显示,高PGS CRF与整个生命周期的全因死亡率降低有关,而2型糖尿病和肺癌的关联在中年或老年后更为明显(图S6)。在从未吸烟者的敏感性分析中未发现统计显著关联,表明吸烟可能在观察到的关联中起重要作用(图S7)。使用PGS五分位的进一步分析表明,乳腺癌、结直肠癌和哮喘的关联存在显著变化,可能反映了非线性关联或病例数量有限(图S8)。在复制分析中(见表S5的样本特征),2型糖尿病的关联在HUNT3中得到了复制,尽管在调整BMI后有所减弱(模型1:HR 0.95,0.92–0.99;模型2:HR 0.99,0.95–1.03;模型3:HR 0然而,这些分析受到统计功效的限制,因此在解释结果时需要谨慎。

4 讨论
我们观察到,全基因组多基因评分(PGS CRF)与实际测量的心肺功能(CRF)之间的关联有限,PGS CRF、常见慢性疾病(NCDs)和全因死亡率之间的关联总体上也有较小。同样,在组间比较中,这些关联主要由CRF表型而非CRF基因型解释。然而,我们观察到PGS CRF与某些NCDs之间存在一些有益的关联,尤其是在新发2型糖尿病(T2D)方面。这项研究是首次使用全基因组方法来估计CRF的遗传易感性的研究之一。我们发现,PGS CRF的多基因评分每增加一个标准差,V?O2peak(最大摄氧量)会增加0.4 mL/kg/min。相比之下,CRF提高1-MET(被认为是临床上最小的有效差异[2])与T2D风险降低约8%相关[6]。当使用1-MET的传统转换时,这意味着之前观察到的8%风险中约有1%可能是由于更优越的遗传倾向所导致的[6]。我们还观察到,PGS CRF每增加一个标准差,T2D的发病率大约会降低4%。这种关联在重复分析中最为一致,而心血管疾病、肺部疾病和死亡率的关联在不同调整条件下消失了。这种关联可能表明从PGS CRF到健康结果的路径较为复杂,但由于效应量有限,我们在本研究中无法对其进行验证。总体而言,利用全基因组遗传工具研究CRF的相关研究仍然较少。现有数据支持我们的发现方向和幅度,特别是在T2D[30]、寿命[36]、心血管疾病[14]以及部分癌症[37]方面。方法上的差异(例如,用于CRF的不同遗传工具)和分析方法上的差异使得研究之间的可比性受到挑战。CRF是一种复杂的、多基因特征。在多基因特征中,单个SNP仅能解释表型的一小部分[38]。尽管计算遗传学不断发展,但许多评分方法仍然依赖于全基因组关联研究(GWASs)。相关GWASs最好基于较大的样本量来捕捉足够的遗传变异,并包括与评分使用人群相似的表型特征。当前的CRF GWASs可能与更广泛的身体健康概念(即执行体力活动的能力)相吻合,但在CRF的定义(即身体输送和利用氧气的能力)方面协调不足[9, 10, 30]。当前的CRF GWASs涵盖了从表现型指标(瓦特/千克[9])到基于静息心率的指标[30],以及估计的[30]或直接测量的氧气消耗[10],采用了各种校正方法(按体重或去脂体重[9, 10, 30])。未来,建议在经过仔细的心理测量评估后开发新的GWAS;明确什么属于CRF,什么不属于CRF,以及哪些指标具有 strong 的结构和标准有效性。需要更多基于遗传信息的研究,并使用统一的CRF测试方法。然而,自2020年代初GWASs首次发布以来,它们为CRF的遗传基础带来了新的见解[7]。根据现有数据,CRF的遗传因素似乎包含既有正面也有负面的SNPs[9, 10, 30]。因此,CRF的遗传因素可能不仅反映了有利的身体结构和功能,也反映了没有疾病的状态。例如,在两个基于英国生物银行(UK Biobank)的研究CCDC141和KIAA1755中,这些基因分别与CRF呈正面和负面关联[9, 30]。值得注意的是,CCDC141参与调节心率和血压,而KIAA1755与心房颤动、心源性中风和代谢综合征的风险增加有关[39]。

4.1 强点和局限性
该研究有几个优点,例如使用了新的全基因组遗传评分,并对其进行了评估;有标准化的CRF测量方法;以及采用了两个独立人群的稳健复制设计。然而,该研究也存在局限性。目前的PGS CRF只能解释CRF变异的一小部分,而且当方法和可用数据得到改进后,需要重新验证这些结果。我们还只测量了常见变异(MAF > 5%[23])。这种选择是为了评估CRF遗传学的公共卫生相关性,即预期在人群中普遍观察到的关联。然而,这些发现并不降低潜在罕见遗传变异的重要性,这些变异可能具有更大的效应量[40]。虽然这些变异对个体和家庭来说可能非常重要,但它们在公共卫生背景下的相关性需要进一步研究。此外,PGS是基于次最大负荷运动测试结果构建的,尽管其他PGS在有效性上没有表现出明显优势,但它们可能具有不同的健康关联。FinnGen关于协变量的数据有限,特别是吸烟信息仅限于分类变量,而没有详细的吸烟强度数据。FinnGen主要基于与医疗服务有联系的个体,这可能导致队列偏向于不太健康的人群[16],从而限制了生存分析的普遍性。在组间比较中,以高V?O2peak为条件可能会引入混杂偏倚,从而掩盖CRF遗传易感性与健康结果之间的关联。我们还注意到,PGS CRF与大多数结局之间的关联是线性的,尽管并非所有结局都是如此,这可能会影响结果的解读。分析仅限于欧洲血统的个体,从而限制了结果的普遍性。最后,虽然竞争风险分析在方法上可能是合适的,但由于效应量有限,其在这种背景下的适用性可能较低。

5 结论
全基因组测量的心血管呼吸健康遗传易感性还需要进一步的发展,但目前显示出与某些发病率和死亡率(尤其是T2D发病率)的小关联。

6 观点
我们观察到PGS CRF的效应量较小,而先前的文献表明CRF的遗传性较高(范围为44%至68%[8]),这些估计基于家庭设计[41]或双胞胎设计[42]。这两种研究设计与我们的方法之间存在重要区别。我们的研究使用基于DNA的全基因组多基因评分来量化个体层面的遗传易感性[22],而家庭和双胞胎研究则推断遗传性[43]。然而,PGS CRF的解释能力仍然远远低于最佳的多基因评分,这阻碍了稳健的流行病学研究设计的实施。PGS CRF的改进受到有限且表型定义明确的CRF遗传数据的限制。一个未实现的例子是肥胖相关多基因评分的进展。在最近的一项研究中,一个新的多基因评分使预测能力提高了两倍以上,解释了UK Biobank参与者中体重指数变化的17.6%[44]。该研究使用了超过500万人的遗传数据来确定遗传易感性。随着样本量的增加和测序技术的进步,全基因组研究被认为是新发现的主要驱动力。需要开展合作努力,收集超出UKB和HUNT规模的大规模数据,以推动该领域的发展。

作者贡献
L.J.和E.S.构思了研究问题,L.J.制定了统计分析计划,所有作者都参与了该计划的制定。L.J.预处理了公开可用的遗传数据。V.L.在P.H.的帮助下计算了FinnGen的多基因评分,L.J.在N.P.T.的帮助下计算了HUNT的多基因评分。V.L.在L.J.、P.H.、M.O.和E.S.的监督下进行了FinnGen的统计建模。L.J.在与N.P.T.、A.N.N.、M.K.、K.?.和A.B.的协商下进行了HUNT的分析。E.S.获得了FinnGen数据的访问权限。FinnGen的作者及其在数据管理和收集中的角色在补充材料中有说明。此外,U.K.也参与了FinnGen的数据收集。A.N.N.、M.K.、K.?.、A.B.和U.W.参与了HUNT的数据收集和管理。L.J.、V.L.和P.H.起草了初稿,所有作者都对文本的撰写、结果的批判性解读和稿件的修订做出了重要贡献。E.S.为这项研究获得了资金支持。L.J.作为保证人,确保所有列出的作者都符合作者资格标准,并且没有遗漏任何符合条件的作者。

致谢
开放获取出版由Jyvaskylan yliopisto通过Wiley - FinELib协议促成。

资助
资助方没有以任何方式影响这项研究。这项工作得到了芬兰研究委员会(资助编号341750、346509和361981)、Juho Vainio基金会;P?ivikki和Sakari Sohlberg基金会的支持,资金全部提供给ES。V.L.由赫尔辛基大学提供的博士研究职位资助,属于iCANDOC精准癌症医学博士教育计划。FinnGen项目得到了Business Finland和13家国际制药公司的支持:AbbVie、AstraZeneca、Biogen、Boehringer Ingelheim、Celgene/Bristol-Myers Scibb、Genentech(Roche集团成员)、GSK、Janssen、Maze Therapeutics、MSD/Merck、Novartis和Sanofi。HUNT研究是HUNT研究中心(挪威科技大学医学与健康科学学院)、特伦德拉格郡议会、挪威中部地区卫生局和挪威公共卫生研究所的合作项目。HUNT的基因分型由美国国立卫生研究院;密歇根大学;挪威研究委员会;挪威中部教育和研究创新联络委员会;以及St Olavs医院与挪威科技大学医学与健康科学学院之间的联合研究委员会资助。HUNT研究的遗传分析是K.G. Jebsen遗传流行病学中心(NTNU)和密歇根大学医学院的研究人员与密歇根大学公共卫生学院的合作成果。K.G. Jebsen遗传流行病学中心由Stiftelsen Kristian Gerhard Jebsen;挪威科技大学医学与健康科学学院资助。

披露
透明度声明:L.J.确认手稿是对所报告研究的诚实、准确和透明的描述;没有遗漏研究的任何重要方面;并且任何与原始计划不符的情况(如果相关的话)都得到了解释。

伦理声明
所有参与者都取得了书面知情同意,研究也得到了伦理委员会的批准。FinnGen队列的参与者根据芬兰生物银行法案或特定队列研究的同意提供了生物库研究的知情同意。FinnGen研究方案(编号HUS/990/2017)得到了赫尔辛基和乌西马地区医院协调伦理委员会的批准。FinnGen研究得到了芬兰健康与福利研究所(批准编号THL/2031/6.02.00/2017)、数字和人口数据服务机构、社会保险机构和芬兰统计局的批准。HUNT研究得到了地区医学和健康研究伦理委员会(REC;2019/29771)、特伦德拉格健康研究、挪威数据监察局和挪威国家卫生局的批准。LJ作为保证人,对方案的准确性、数据的完整性、报告的真实性以及符合赫尔辛基宣言、国家法律和芬兰研究诚信咨询委员会指南负责。

利益冲突
作者声明没有利益冲突。

数据可用性声明
可以通过Fingenious门户(https://site.fingenious.fi/en/)申请访问FinnGen参与者的个体基因型和注册数据,该门户由芬兰生物银行合作组织FinBB(https://finbb.fi/en/)提供。隶属于挪威研究机构的研究人员可以在获得地区医学和健康研究伦理委员会(REC)的项目批准后,通过HUNT研究中心(www.ntnu.edu/hunt)申请访问HUNT数据。不属于挪威研究机构的研究人员应与挪威首席研究员合作并通过他们申请数据访问。关于数据访问的应用和条件信息可以在网上找到(www.ntnu.edu/hunt/data)。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号