利用多基因风险评分推断基因-环境交互中的因果方向：GCIM模型在复杂性状分析中的应用与评估

《Human Genetics》：Leveraging polygenic risk scores to infer causal directions in genotype-by-environment interactions between complex traits

【字体：大中小】 时间：2026年02月25日 来源：Human Genetics 3.6

编辑推荐：

　　本文针对传统G×E方法通常需要预设已知因果方向，这一假设往往不成立并可能导致估计偏差与伪发现的问题，提出了名为“遗传因果推断模型（Genetic Causality Inference Model, GCIM）”的新方法。该研究整合暴露和结果的多基因风险评分（PRS），旨在增强因果推断并减少伪交互信号。通过对模拟数据和英国生物银行（UK Biobank）真实数据的分析，研究发现GCIM能够更准确地识别G×E变异的存在与否，尤其是在存在残差异质性和因果方向不确定的挑战性条件下，其表现优于现有方法。该框架为基因-环境交互研究提供了更可靠的因果方向推断工具，对理解复杂疾病的病因学具有重要意义。

想象一下，我们试图理解为什么有些人即使有相似的遗传风险，患上糖尿病或心血管疾病等复杂疾病的几率却大相径庭。一个关键线索在于基因与环境的“对话”，即基因-环境交互作用（G×E）。例如，一个人的吸烟习惯（环境）可能会改变其抑郁症（结果）相关基因的影响。然而，这种对话是谁在主导？是环境影响基因对结果的作用，还是我们的身体状态（结果）反过来影响基因对环境因子的反应？遗憾的是，传统的G×E研究方法往往需要预先假设一个已知的因果方向。如果这个假设错了，就像试图用错误的钥匙开锁，得出的结论很可能存在偏差甚至是虚假的，这不仅误导了我们对疾病机制的认知，也可能会影响个性化医疗策略的开发。因此，迫切需要一种能够从数据中推断因果方向，从而揭示真实交互机制的方法。

为此，研究团队在《Human Genetics》上发表论文，提出了一种新颖的“遗传因果推断模型（Genetic Causality Inference Model, GCIM）”。该模型巧妙地整合了暴露性状和结果性状各自的多基因风险评分（PRS）来增强因果推断，旨在减少由模型误设和残差异质性带来的伪信号。研究发现，GCIM在模拟数据和真实世界数据分析中，尤其是在处理具有挑战性的残差异质性和因果方向不明的情况下，均能可靠地控制假阳性，其表现优于现有的PRS×E模型。该研究为更准确地揭示基因与环境如何共同塑造复杂性状提供了新的分析框架。

研究人员开展此项研究主要应用了以下几种关键方法：首先，利用英国生物银行（UK Biobank）的大规模基因型和表型数据，通过严格的质量控制筛选出约28.8万名欧洲白人血统个体。其次，采用样本分割策略，将总样本分为发现数据集（80%）和目标数据集（20%），前者用于生成全基因组关联研究（GWAS）和全基因组环境交互研究（GWEIS）的汇总统计量，以计算多基因风险评分（PRS），后者用于模型评估。核心统计建模方面，研究比较了四种PRS×E模型（Model 1至Model 4），其中Model 4（即GCIM）的创新之处在于，它在交互项中使用暴露性状的PRS而非其观测值，以此削弱在检验反向因果方向时可能引入的偏差。最后，研究通过广泛的模拟分析来评估各模型在不同遗传相关性、残差相关性和表型异方差性条件下的表现。

模拟结果（针对定量性状）

在无真实G×E且无残差与环境交互（即无异方差性）的零模型下，所有模型（Model 1-4）均能正确控制第一类错误（即假阳性率）。(gy,gc)= 0, 0.4, 0.8. For each genetic correlation, the three bars correspond to residual correlations of cor(\varvecεy,\varvecεc)= 0, 0.4, and 0.8. This structure illustrates how correlation and heteroscedasticity jointly affect method performance. Model 4 represents the proposed model (GCIM), whereas Models 1–3 correspond to existing methods">但当引入残差与环境交互（异方差性）时，Model 1-3会产生虚假的关联信号，而GCIM（Model 4）则能准确识别不存在G×E方差的情况，避免了伪发现。在存在真实G×E的模型中，除Model 1外，其他方法均有足够的检验功效，但Model 1功效较低。在反向因果方向检验中，当存在异方差性时，Model 1-3在零模型和备择模型下均会产生虚假的G×E关联，而GCIM则能保持稳健，准确区分真假信号。(gy,gc)= 0, 0.4, 0.8. For each genetic correlation, the three bars correspond to residual correlations of cor(\varvecεy,\varvecεc)= 0, 0.4, and 0.8. This structure illustrates how correlation and heteroscedasticity jointly affect method performance. Model 4 represents the proposed model (GCIM), whereas Models 1–3 correspond to existing methods">

模拟结果（针对二分类结果与定量暴露）

在二分类结果与定量暴露的模拟中，零模型下，当存在异方差性时，Model 1和2会产生假阳性关联，而Model 3和GCIM则表现稳健。在存在真实G×E的备择模型下，GCIM的检验功效有限。然而，在反向因果检验中，无论是否存在异方差性，Model 1-3均会产生虚假信号，而GCIM能始终准确控制假阳性，展现出优异的特异性。(gy,gc)= 0, 0.4, 0.8. For each genetic correlation, the three bars correspond to residual correlations of cor(\varvecεy,\varvecεc)= 0, 0.4, and 0.8. This structure illustrates how correlation and heteroscedasticity jointly affect method performance. Model 4 represents the proposed model (GCIM), whereas Models 1–3 correspond to existing methods">(gy,gc)= 0, 0.4, 0.8. For each genetic correlation, the three bars correspond to residual correlations of cor(\varvecεy,\varvecεc)= 0, 0.4, and 0.8. This structure illustrates how correlation and heteroscedasticity jointly affect method performance. Model 4 represents the proposed model (GCIM), whereas Models 1–3 correspond to existing methods">

模拟结果（针对二分类结果与二分类暴露）

在二分类对二分类的模拟中，零模型下，Model 1和2会产生虚假关联，而Model 3和GCIM能有效控制第一类错误。在备择模型下，多数方法（包括GCIM）的检验功效较低，而Model 2表现出更好的功效。但在反向因果检验中，Model 1-3普遍产生虚假关联，而GCIM能稳健地避免伪发现，再次证明了其在控制假阳性方面的优势。

真实数据分析

研究将GCIM应用于英国生物银行数据，分析了三大人体测量学性状（身体质量指数（BMI）、体脂百分比（BF）、腰臀比（WHR））与十一种循环生物标志物（如肝脏酶、血脂、炎症标志物）之间的G×E交互。为了推断因果方向，每个性状-生物标志物对均在两种假设下进行检验：假设生物标志物作为环境调节因子影响性状的遗传效应（正向因果），以及反向假设。

BMI

传统模型（Model 1-3）发现了BMI与多种生物标志物（如AST、总胆红素、CRP、甘油三酯）之间显著的双向交互，无法区分因果方向。而GCIM则仅在生物标志物（如胆红素）作为BMI的遗传效应调节因子时检测到显著交互，清晰地指出了从生物标志物到BMI的因果方向。对于载脂蛋白A（ApoA）和高密度脂蛋白胆固醇（HDL-c），传统模型同样显示双向显著交互，而GCIM则揭示BMI是调节这些生物标志物遗传效应的因素，即因果方向是从BMI到ApoA和HDL-c。经多重检验校正后，仅胆红素对BMI的因果效应保持显著。

体脂百分比（BF）

与BMI类似，传统方法在BF与多种生物标志物的交互中检测到广泛的双向显著信号。而GCIM分析发现，对于AST和甘油三酯，只有生物标志物调节BF遗传效应的方向是显著的。对于C反应蛋白（CRP）和胆红素，GCIM检测到了双向的显著G×E效应，表明可能存在相互调制关系。经多重检验校正后，只有BF对CRP的因果效应保持显著。

腰臀比（WHR）

传统方法在WHR与多种生物标志物间发现了大量双向显著交互，但GCIM仅支持胆红素调节WHR遗传效应这一方向，与Model 2和3的结果一致，表明大部分传统方法检测到的信号可能并非真正的因果效应。

结论与讨论

本研究提出的GCIM框架为检测G×E并推断环境暴露与表型结果之间的因果方向提供了一个稳健的方法。它有效解决了现有模型（尤其是Model 1-3）对残差与环境交互（即异方差性）敏感的局限，该局限是混淆真实G×E效应的重要来源。模拟研究表明，在存在异方差性的复杂条件下，GCIM能有效控制第一类错误率，而传统方法则会产生大量虚假关联。这一特性对于大规模生物银行研究中同时检验成百上千个性状-环境组合、避免误导性发现至关重要。

在统计功效方面，GCIM的表现总体与已有研究一致：Model 2和Model 3在检测真实交互方面具有合理的灵敏度，而Model 1功效较低。然而，当因果方向被错误指定时，Model 2和3容易出现假阳性膨胀。相比之下，GCIM通过用暴露性状的PRS替代其观测值，减轻了伪协方差，从而有效缓解了这一问题。不过，这种增强稳健性的保守策略也带来了局限，即GCIM的统计功效有所降低，特别是在处理二分类结果时。这主要是因为PRS捕捉的表型方差少于观测值本身。虽然GCIM提供了一个与因果解释一致的定向不对称性经验检验，但它并非在所有数据生成机制下都构成一个完全识别的因果效应估计定理。

在真实数据分析中，GCIM揭示了传统方法无法清晰指明的因果方向。例如，它明确了胆红素调节BMI和WHR遗传效应的方向，而非反向。这一发现与已知生物学知识（如胆红素通过结合过氧化物酶体增殖物激活受体α（PPARα）抑制脂质积累，从而对抗肥胖）相吻合。同样，GCIM支持体脂百分比（BF）调节C反应蛋白（CRP）遗传效应的方向，这与脂肪组织作为炎症因子的重要来源以及肥胖相关炎症的病理生理学相符。这些结果为理解复杂性状的病因提供了更可靠的机制性见解。

总之，GCIM代表了G×E方法学上的一次重要进步，特别是在控制虚假关联和正确推断因果方向至关重要的研究中。其对混杂、模型误设和异方差性的稳健性，增强了对所检测信号的信心。尽管其在二分类结果情境下的功效有待提升，但其卓越的特异性和稳健性使其成为假设驱动研究或因果推断应用中的一个有价值的工具。未来工作需要在不损害其显著特异性和稳健性的前提下，着力提升GCIM的灵敏度。该模型已实现为一个开源R软件包，可供研究社区使用。

热点排行

新闻专题