《Frontiers in Cell and Developmental Biology》:Integrating multi-omics and reverse network toxicology to identify pollutant risks and potential intervention targets in pulmonary arterial hypertension
编辑推荐:
该研究旨在整合肺动脉高压(pulmonary arterial hypertension, PAH)患者肺组织转录组数据、全基因组关联研究(genome-wide association study, GWAS)汇总统计量,以及脱氧核糖核酸(DNA)甲基化、基
该研究旨在整合肺动脉高压(pulmonary arterial hypertension, PAH)患者肺组织转录组数据、全基因组关联研究(genome-wide association study, GWAS)汇总统计量,以及脱氧核糖核酸(DNA)甲基化、基因表达和血浆蛋白的定量性状位点(quantitative trait locus, QTL)数据,通过差异表达分析及蛋白质-蛋白质相互作用(protein-protein interaction, PPI)网络分析识别核心差异调控基因。研究人员进一步采用基于汇总数据的孟德尔随机化(summary-data-based Mendelian randomization, SMR)方法,系统评估候选基因甲基化水平、表达水平或蛋白丰度与PAH风险之间的潜在遗传关联,并通过异质性依赖工具(heterogeneity in dependent instruments, HEIDI)检验区分因果关联与多效性。关键发现通过两个独立队列的基因表达趋势验证予以确认。最后,该研究应用逆向网络毒理学方法:利用比较毒理学数据库(Comparative Toxicogenomics Database, CTD)筛选靶向识别基因的环境污染物,通过分子对接评估其结合潜力,并在人肺动脉平滑肌细胞(human pulmonary artery smooth muscle cells, HPASMCs)中验证候选污染物对基因表达及细胞增殖的影响。
该研究发表于《Frontiers in Cell and Developmental Biology》(《细胞与发育生物学前沿》)。研究背景方面,特发性肺动脉高压(idiopathic pulmonary arterial hypertension, PAH)是一种慢性进行性心血管疾患,以肺动脉压力持续升高为临床特征,常伴发右心室肥厚,美国成人患病率约为每百万人10.6例。尽管靶向一氧化氮、前列环素和内皮素通路的疗法可在一定程度上延缓疾病进展,但除肺移植外尚无根治手段,总体预后仍较差。PAH发病机制复杂,涉及遗传易感性、表观遗传调控、代谢异常及免疫炎症反应等多因素交互作用,共同驱动病理性肺血管重塑,关键病理环节包括肺血管收缩、HPASMCs异常增殖及凋亡抵抗表型转化。现有证据提示早期环境暴露可能加剧遗传易感个体疾病进展,但既往研究多聚焦单一暴露因素,而现实中个体暴露于复杂化学混合物,其潜在相加或协同效应给毒理学评估和病因阐明带来重大挑战。因此,识别关键环境暴露组合及其分子靶点,对于深化PAH发病机制认识和指导循证公共卫生政策制定至关重要。
为应对上述研究空白,该研究构建了整合多组学数据、孟德尔随机化与逆向网络毒理学的"基因-环境"分析框架。研究人员首先整合DNA甲基化、基因表达和蛋白丰度等多组学数据构建工具变量,运用SMR分析识别通过遗传调控可能与PAH风险相关的基因;继而应用逆向网络毒理学对识别基因进行分子靶点预测和分子对接分析,以锁定可能促进PAH发生的关键环境污染物。
在技术方法层面,研究数据来源包括:GEO数据库获取的两个PAH相关微阵列数据集GSE117261(58例PAH患者,25例对照)和GSE24988(94例PAH患者,22例对照);eQTL数据来自eQTLGen联盟(37项研究,31,684例样本);mQTL数据来自McRae等研究的两欧洲队列(1,980例样本);pQTL数据来自冰岛队列(35,559例参与者,4,907种蛋白);PAH结局数据来自FinnGen项目的GWAS数据(301例PAH病例,345,634例对照)。分析方法涵盖:limma包进行差异表达分析;STRING数据库(置信度≥0.4)与Cytoscape构建PPI网络;CentiScaPe 2.0计算拓扑参数;clusterProfiler进行基因本体(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析;SMR软件(版本1.3.1)进行SMR分析并结合HEIDI检验;CTD查询环境污染物;ADMETlab 3.0和ProTox-III预测毒理特性;AutoDockTools进行分子对接;HPASMCs进行体外实验验证;qRT-PCR和EdU增殖实验进行功能验证;R软件进行统计分析。
研究结果部分呈现如下:
**PAH差异表达基因的识别与富集分析**:对GSE117261队列进行差异表达分析,共识别254个差异表达基因(differentially expressed genes, DEGs),其中137个上调、117个下调。GO富集iplinary将给修改的内容标注在此分析显示这些基因主要参与炎症通路调控、Wnt信号通路及氧化应激反应;KEGG通路分析进一步提示其与炎症、氧化应激、细胞增殖和迁移等通路显著相关。
**PAH差异表达基因的蛋白质-蛋白质相互作用网络构建**:将254个PAH相关DEGs导入STRING数据库构建PPI网络,去除孤立节点后获得包含247个靶蛋白的网络。拓扑分析识别出连接度最高的五个核心节点:ITGAM、CD163、CCL5、SELL和TLR8。
**PAH差异表达基因血液蛋白丰度与PAH遗传易感性的关联**:筛选后91个PAH差异表达基因在pQTL数据中具有有效工具变量。经SMR分析(p < 0.05)和HEIDI检验(p > 0.05)验证,五种基因血液蛋白丰度与PAH遗传易感性显著相关:TAGLN2(HR = 9.00, 95% CI: 1.52–53.16)、GZMK(HR = 3.78, 95% CI: 1.22–11.72)、PSMD9(HR = 4.07, 95% CI: 1.02–16.27)、KLC1(HR = 9.85, 95% CI: 1.62–60.06)和BPIFB1(HR = 1.64, 95% CI: 1.05–2.56),蛋白丰度增加均与PAH风险升高相关。
**PAH差异表达基因血液基因表达水平与PAH遗传易感性的关联**:筛选后56个PAH差异表达基因在eQTL数据中具有有效工具变量。SMR分析结合HEIDI检验显示,五种基因血液表达水平与PAH遗传易感性显著相关:MNDA和CD14表达增加与风险降低相关;TAGLN2(HR = 9.00, 95% CI: 1.52–53.16)、PSMD9(HR = 4.07, 95% CI: 1.02–16.27)和KLC1(HR = 9.85, 95% CI: 1.62–60.06)表达增加与风险升高相关。
**PAH差异表达基因血液甲基化位点与PAH遗传易感性的关联**:针对173个PAH差异表达基因的786个甲基化位点,SMR分析联合HEIDI检验识别39个CpG位点(涉及17个基因)与PAH遗传易感性显著相关,其中23个CpG位点与PAH风险增加相关,16个与风险降低相关。特别地,TAGLN2的五个CpG位点(cg22339338、cg15641364、cg13892570、cg16107628、cg21571466)和PSMD9的一个CpG位点(cg10378667)与PAH风险降低相关;KLC1的四个关联CpG位点中,cg23090046和cg12112151与风险降低相关,而cg17925084和cg11828104与风险增加相关。基于mQTL、pQTL和eQTL数据的多维证据,TAGLN2、PSMD9和KLC1被确定为与PAH风险显著相关并优先深入分析的关键靶点。
**关键差异表达基因在PAH中的表达验证**:在GSE117261队列中,TAGLN2和PSMD9表达趋势与SMR结果一致,在PAH患者中显著上调,但KLC1呈相反表达趋势;在GSE24988验证队列中,仅TAGLN2在PAH患者中显著上调,与SMR结果一致,而PSMD9和KLC1未显示显著差异表达。据此,TAGLN2被选定为后续深入分析的主要焦点。
**环境化合物初筛及与TAGLN2的分子对接**:基于CTD记录,初筛识别137种可调控TAGLN2表达的已知化合物,经预定义筛选标准(单向调控效应与SMR分析趋势一致)和毒性预测分析,最终选定八种环境污染物:全氟辛烷磺酸(perfluorooctane sulfonate, PFOS)、尼古丁、邻苯二甲酸二丁酯、双酚B、双酚S、双酚F、苯并[a]芘和黄曲霉毒素B1。分子对接结果显示所有八种化合物均能与TAGLN2蛋白稳定结合(结合自由能< ?5.0 kcal/mol),其中PFOS结合亲和力最强(?8.9 kcal/mol)。
**PFOS对肺动脉平滑肌细胞的影响**:为验证逆向网络毒理学和分子对接预测,选择结合最稳定的PFOS进行体外实验。qPCR结果显示,PFOS处理(50和100 μM,24 h)与HPASMCs中TAGLN2 mRNA水平升高相关;EdU增殖实验表明PFOS暴露与HPASMCs增殖增加呈剂量依赖性相关。
讨论部分首先概述了研究的创新性整合策略及主要发现。TAGLN2(Transgelin-2)是一种肌动蛋白结合蛋白,定位于人类染色体1q21-q25,通过结合肌动蛋白丝参与调控细胞骨架动态重组,在血管平滑肌细胞收缩和迁移中发挥关键作用。该研究SMR分析揭示TAGLN2在DNA甲基化、基因表达和血浆蛋白三个层面均与PAH风险显著相关,提示其作为PAH多维度调控枢纽的作用。机制层面,TAGLN2基因和蛋白丰度增加与PAH风险升高相关,暗示其致病作用;而其多个关联CpG位点则与风险降低相关,但这些甲基化位点是否直接下调TAGLN2表达尚待证实。
通过CTD查询,研究筛选并识别八种可调控TAGLN2表达的环境污染物。虽然这些化合物与PAH的直接流行病学证据有限,但现有研究表明其可通过氧化应激、炎症反应和细胞骨架重塑等机制诱导血管平滑肌细胞异常增殖和表型转化。值得注意的是,该研究首次提出TAGLN2作为这些环境污染物在肺血管中的潜在分子靶点。分子对接证实PFOS与TAGLN2结合亲和力最强(?8.9 kcal/mol),提示其可能直接干扰平滑肌细胞细胞骨架的动态平衡和功能完整性。体外实验显示PFOS显著上调TAGLN2表达并促进肺动脉平滑肌细胞增殖,为"环境暴露-TAGLN2-肺血管重塑"轴的机制研究提供了关键线索。
该研究的主要优势在于其多维度整合策略:汇聚多组学数据、体外功能实验和独立微阵列队列验证,建立多重证据线支持SMR分析的可靠性;SMR方法本身有效缓解混杂并帮助排除反向因果,HEIDI检验进一步消除连锁不平衡导致的假阳性;逆向网络毒理学和分子对接技术为理解混合环境污染物如何通过靶向TAGLN2影响肺血管重塑提供线索。临床转化方面,TAGLN2具有作为PAH早期诊断生物标志物和干预靶点的潜力,血液中的TAGLN2蛋白和基因表达水平与PAH风险显著关联,提示液体活检可辅助识别高危个体;DNA甲基化差异(如cg13892570等CpG位点)为基于表观遗传学的早期筛查提供新靶点。八种识别的环境污染物,尤其PFOS,为PAH风险干预提供明确目标。
该研究也 acknowledged 若干局限性:SMR结合HEIDI检验虽可优先排序与疾病风险相关的基因调控信号,但无法确立真正因果性,残余多效性或连锁不平衡仍可能偏倚结果;体外PFOS实验仅证明TAGLN2 mRNA上调与细胞增殖增加的相关性,但未证明TAGLN2在增殖效应中的机制必需性;eQTL、mQTL和pQTL数据源自血液/血浆队列,而PAH主要病理位于肺血管,血液来源的QTL可能无法完全捕捉病变肺组织中的调控架构;多个CpG位点虽与PAH风险显著相关,但该研究未直接证明这些甲基化位点调控TAGLN2的mRNA或蛋白水平;环境污染物识别和验证基本为间接性和假设生成性的,CTD初筛可能遗漏相关污染物,分子对接为计算预测而非直接实验验证;体外实验仅验证一种污染物(PFOS)和单一细胞类型。
结论部分指出,该研究整合多组学数据、SMR分析和逆向网络毒理学,将TAGLN2优先排序为PAH的遗传关联候选基因。SMR分析揭示TAGLN2在DNA甲基化、基因表达和蛋白丰度三个层面与PAH风险的提示性关联:TAGLN2表达和蛋白水平增加与更高疾病风险相关,而特定甲基化位点(如cg13892570、cg16107628)呈统计学反向关联,但甲基化对TAGLN2表达的直接调控效应尚未证实。八种环境污染物被计算预测为TAGLN2的潜在调控因子。体外实验表明PFOS处理与TAGLN2表达上调及HPASMCs增殖增加相关,但这些发现为相关性而非因果机制。由于缺乏功能扰动实验,这些结果应被视为假设生成性发现。该研究为探索PAH中的潜在基因-环境交互作用提供了初步框架,为未来机制研究和环境风险研究奠定理论基础。