《Biochemistry Research International》:Candidate Biomarkers for Crohn’s Disease: Hub Genes and Regulatory miRNAs Identified by Bioinformatics Analysis
编辑推荐:
本研究通过整合分析多个GEO数据集,识别出与克罗恩病(CD)密切相关的60个差异表达基因,并筛选出三个枢纽基因(CXCL1、CXCL2、CXCR2)及两个关键miRNA(hsa-miR-1-3p、hsa-miR-335-5p)。文章认为这些分子在CD的发病和进展中扮演重要角色,尤其CXCL1/CXCL2/CXCR2轴通过介导趋化因子信号和细胞因子-受体相互作用,调控中性粒细胞募集和炎症级联反应,有望成为CD的新型诊断生物标志物和治疗靶点,为理解其分子机制和开发精准医疗策略提供了新视角。
引言
克罗恩病(Crohn’s disease, CD)是一种慢性的复杂炎症性疾病,可累及整个消化道,最常见于末端回肠。其确切病因尚不明确,目前普遍认为与遗传易感性、环境因素和免疫失衡密切相关。CD的临床表现多样,常见症状包括腹痛、腹泻、发热和体重减轻,并可伴有肠外表现,严重影响患者身心健康并增加社会医疗负担。尽管生物制剂的应用显著改善了临床预后,但部分患者仍会出现治疗不应答。因此,深入探索CD的分子机制,识别新的诊断标志物和治疗靶点至关重要。
材料与方法
本研究从Gene Expression Omnibus(GEO)数据库下载了三个数据集(GSE179285、GSE186582、GSE112366),分别包含33个CD样本与8个健康对照、196个CD样本与25个健康对照,以及141个CD样本与26个健康对照。利用GEO2R在线工具(整合GEOquery和Limma包)鉴定CD患者炎症回肠黏膜样本与健康对照回肠样本之间的差异表达基因(Differentially Expressed Genes, DEGs),筛选标准为|Log2FC| > 1且校正后p值 < 0.05。通过R包ClusterProfiler对DEGs进行基因本体(Gene Ontology, GO)功能注释和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析。使用STRING数据库构建蛋白质-蛋白质相互作用(Protein-Protein Interaction, PPI)网络,并导入Cytoscape软件进行可视化,利用其插件cytoHubba通过十种算法(如MCC、Degree等)识别枢纽基因(Hub Genes)。基于miRTarBase数据库预测与枢纽基因相关的microRNA(miRNA),并利用Cytoscape构建miRNA-枢纽基因调控网络。最后,使用R软件的“pROC”包绘制受试者工作特征(Receiver Operating Characteristic, ROC)曲线并计算曲线下面积(Area Under the Curve, AUC)来评估枢纽基因的诊断性能,同时利用“glmnet”包构建最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归模型以降低过拟合风险。
结果
差异表达基因鉴定
对三个数据集的综合分析共鉴定出60个在CD样本中表达显著改变的DEGs,其中44个为上调基因,16个为下调基因。韦恩图展示了三个数据集中上调与下调基因的交集情况。
GO与KEGG富集分析
GO分析显示,上调基因主要富集在胶原蛋白细胞外基质、白细胞迁移、内质网腔、细胞外基质结构成分等条目;下调基因则显著富集于细胞顶端部分、顶端质膜、刷状缘、烯烃化合物代谢过程等。KEGG通路分析表明,DEGs在细胞因子-细胞因子受体相互作用、病毒蛋白与细胞因子及细胞因子受体的相互作用、蛋白质消化与吸收等通路中显著富集。
PPI网络构建与枢纽基因识别
对DEGs进行PPI网络分析,并利用Cytoscape的MCODE插件筛选出两个重要的基因簇模块。通过cytoHubba插件的十种算法进行评分和交集分析,最终鉴定出三个枢纽基因:CXCL1、CXCL2和CXCR2,它们在CD患者中均呈上调表达。
枢纽基因分析
这三个枢纽基因均属于CXC趋化因子家族。CXCL1(C-X-C motif chemokine ligand 1)具有吸引中性粒细胞的趋化特性,在炎症中起关键作用。CXCL2(C-X-C motif chemokine ligand 2)由活化的单核细胞和中性粒细胞产生,在炎症部位表达。CXCR2(C-X-C Chemokine Receptor Type 2)是白细胞介素-8(IL-8)等的受体,其中和作用可激活中性粒细胞。功能富集分析显示,这三个基因主要参与趋化因子介导的信号通路、对趋化因子的反应、细胞对趋化因子的反应等生物过程;KEGG通路则富集于细胞因子-细胞因子受体相互作用、趋化因子信号通路、病毒蛋白与细胞因子及细胞因子受体的相互作用,以及幽门螺杆菌感染中的上皮细胞信号传导。
miRNA-枢纽基因调控网络的建立
利用miRTarBase和Cytoscape构建了包含28个节点(25个miRNA,3个mRNA)和27条边的miRNA-mRNA调控网络。其中,hsa-miR-1-3p和hsa-miR-335-5p各与两个靶基因(CXCL2和CXCL1;CXCL2和CXCR2)相关联,被识别为潜在的关键调控miRNA。
枢纽基因验证与LASSO模型构建
通过ROC曲线分析评估了三个枢纽基因在三个独立数据集中的诊断性能。在所有数据集中,每个枢纽基因的AUC值均大于0.7,显示出良好的预测性能。特别是在GSE179285数据集中,CXCL1和CXCL2的AUC值分别达到0.970和0.936。联合ROC曲线分析进一步证实了这三个基因组合具有良好的诊断价值。LASSO回归模型的结果也表明,CXCL1、CXCL2和CXCR2的表达与CD的发生发展相关。
讨论
本研究鉴定的60个DEGs及其富集通路与CD的病理特征高度一致,如细胞外基质重塑、白细胞浸润、肠上皮细胞极性破坏和吸收功能障碍等。三个枢纽基因CXCL1、CXCL2和CXCR2构成了一个协同的调控轴。CXCL1和CXCL2作为配体,通过共同作用于受体CXCR2,形成“趋化因子-受体”信号复合体,强力招募中性粒细胞至肠道炎症部位,加剧黏膜屏障的炎症浸润和损伤。这种协同效应可能是CD难治性炎症的基础。CXCR2的广泛表达还提示其可能参与CD的肠外并发症(如血管病变和关节炎症)的调节。研究还识别出两个关键miRNA:hsa-miR-1-3p和hsa-miR-335-5p。hsa-miR-1-3p可能通过调节Smad通路影响肠上皮屏障功能和炎症反应;而hsa-miR-335-5p的表达下调可能与CD患者肠道炎症相关的癌变风险增加有关,因为它对细胞周期相关基因如MAPK10的抑制解除,可能促进上皮-间质转化(EMT)和细胞异常增殖。
局限性与未来方向
本研究的局限性包括部分数据集样本量较小且分布不平衡,可能引入异质性。此外,所鉴定的关键生物标志物的功能相关性和具体分子机制(如CXCL1/CXCL2/CXCR2轴的调控级联以及miRNA与枢纽基因间的靶向关系)仍需通过体外和体内功能实验进一步验证。未来的研究需要在大型、平衡的独立临床队列中进行验证,并深入探索这些分子在调控肠道炎症、上皮屏障功能以及CD炎症-癌变转化中的作用,以期将其转化为可靠的CD诊断生物标志物或治疗靶点。
结论
本研究通过生物信息学整合分析,鉴定出60个DEGs、三个枢纽基因(CXCL1、CXCL2、CXCR2)和两个关键miRNA(hsa-miR-1-3p、hsa-miR-335-5p)。这些枢纽基因主要通过细胞因子-细胞因子受体相互作用和趋化因子信号通路介导CD的肠道炎症进展,形成协同调控轴。相关miRNA则可能参与肠上皮屏障功能和CD相关癌变风险的调控。这些发现深化了对CD发病分子机制的理解,并为CD的早期诊断、疾病活动度评估和预后预测提供了有潜力的候选生物标志物。