《Scientific Reports》:HLA-DPA1 as a diagnostic biomarker differentiating early- and late-onset preeclampsia
编辑推荐:
本研究针对早发型子痫前期(EOPE)诊断难题,通过机器学习筛选GEO数据库及免疫基因集,结合LASSO、mSVM-RFE算法发现HLA-DPA1等7个关键免疫相关基因。验证显示HLA-DPA1下调与EOPE密切相关(AUC=0.758),其通过调节T细胞、树突状细胞等免疫浸润参与母胎免疫耐受,为EOPE发病机制提供新视角。
在产科领域,子痫前期(Preeclampsia, PE)是一种严重的妊娠期并发症,是导致孕产妇和围产儿死亡的主要原因之一。根据发病时间,子痫前期被划分为早发型(Early-Onset Preeclampsia, EOPE)和晚发型(Late-Onset Preeclampsia, LOPE)。EOPE通常指在妊娠34周前发病,其病情更重,对母儿预后影响更大,是临床管理的重点和难点。尽管其危害巨大,但EOPE的病因和发病机制尚未完全阐明,且缺乏有效的早期诊断和预测手段。目前普遍认为,免疫调节失衡,特别是母胎界面免疫耐受的破坏,在EOPE的发生发展中扮演着关键角色。因此,从免疫学角度深入挖掘EOPE的特异性生物标志物,对于理解其病理生理过程、开发新的诊疗策略具有至关重要的意义。
为了攻克这一难题,一项发表在《Scientific Reports》上的研究开展了一项深入的生物信息学与实验验证相结合的研究。研究人员旨在利用先进的机器学习算法,从海量的基因表达数据中筛选出能够区分EOPE与LOPE的关键免疫相关生物标志物,并深入探讨其在免疫微环境中的作用,从而为EOPE的精准诊断和机制研究提供新的线索。
为开展此项研究,研究人员整合了多个关键技术方法。首先,从基因表达综合数据库(Gene Expression Omnibus, GEO)中获取了包含EOPE和LOPE样本的mRNA表达谱数据集(GSE60438和GSE75010),并从ImmPort数据库下载了免疫相关基因(Immune-Related Genes)列表。通过差异表达分析、基因富集分析以及蛋白质相互作用(Protein-Protein Interaction, PPI)网络构建,初步筛选出与EOPE相关的候选基因。进而,应用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归和多重支持向量机递归特征消除(Multiple Support Vector Machine-Recursive Feature Elimination, mSVM-RFE)两种机器学习算法,对候选基因进行精确定位,筛选出核心生物标志物。随后,利用受试者工作特征(Receiver Operating Characteristic, ROC)曲线评估其诊断效能,并构建列线图(Nomogram)预测模型。为验证发现,研究还分析了额外的GEO数据集(GSE22526, GSE74341, GSE190639),并通过对胎盘组织进行免疫组织化学(Immunohistochemistry, IHC)和定量实时聚合酶链式反应(Quantitative Real-Time PCR, qRT-PCR)实验,在临床样本水平确认关键基因的表达和诊断价值。最后,采用CIBERSORT算法分析了EOPE胎盘组织中22种免疫细胞类型的浸润模式。
差异表达基因与免疫相关基因的筛选
通过比较EOPE与LOPE的基因表达谱,研究人员共鉴定出17个差异表达基因(Differentially Expressed Genes, DEGs)。进一步与免疫相关基因集交叉,最终筛选出7个差异表达的免疫相关基因(Differentially Expressed Immune-Related Genes, DIRGs),包括HLA-DPA1、FPR1、CGB5、LYZ、LEP、PROK2和SERPINA3。这一发现提示这些免疫基因在EOPE和LOPE的病理过程中可能存在不同的调控作用。
基因功能与通路富集分析
为了解这7个关键DIRGs的生物学功能,研究进行了基因本体论(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析。GO分析结果显示,这些DIRGs显著富集于T细胞、淋巴细胞和单核细胞增殖的正向调控等生物学过程,突出了免疫细胞活化与增殖在EOPE中的重要性。KEGG通路分析则表明,这些基因主要与免疫性疾病、内分泌与代谢性疾病以及心血管疾病相关,这与子痫前期常伴随全身性炎症反应、代谢紊乱和心血管功能损害的多系统受累临床特征相吻合。
核心诊断生物标志物的识别与验证
研究团队运用LASSO和mSVM-RFE两种机器学习算法对上述7个DIRGs进行进一步筛选,最终将目光聚焦于HLA-DPA1。HLA-DPA1是主要组织相容性复合体(Major Histocompatibility Complex, MHC) II类基因的一员,其主要功能是参与抗原呈递,激活T细胞免疫应答。ROC曲线分析显示,HLA-DPA1在区分EOPE方面表现出良好的诊断能力,其曲线下面积(Area Under the Curve, AUC)达到0.758。随后构建的列线图模型也证实了其预测价值。为了确证这一生物信息学发现,研究人员对临床胎盘样本进行了qRT-PCR和IHC验证。结果一致表明,与正常妊娠或LOPE相比,EOPE患者胎盘组织中HLA-DPA1的mRNA和蛋白表达水平均显著下调。这一结果强有力地支持了HLA-DPA1作为EOPE潜在诊断标志物的可靠性。
免疫微环境分析
利用CIBERSORT算法对EOPE样本的免疫细胞浸润构成进行分析后发现,HLA-DPA1的表达与多种免疫细胞的比例存在显著相关性。具体而言,HLA-DPA1的表达水平与调节性T细胞(Regulatory T Cells, Tregs)和活化树突状细胞(Dendritic Cells Activated)的浸润比例呈负相关,而与M1型巨噬细胞(Macrophages M1)和静息肥大细胞(Mast Cells Resting)的浸润比例呈正相关。这些相关性提示,HLA-DPA1的下调可能通过影响胎盘局部免疫细胞亚群的平衡,特别是可能削弱了Tregs介导的免疫抑制功能和抗原呈递细胞的调节,从而参与了母胎免疫耐受失衡的进程,最终促发EOPE。
综上所述,本研究通过整合生物信息学、机器学习算法和实验验证,系统性地揭示了免疫系统,特别是抗原呈递通路,在EOPE发病机制中的核心地位。研究成功鉴定出MHC II类分子HLA-DPA1作为区分EOPE与LOPE的关键免疫生物标志物。其表达下调不仅具有诊断价值,更可能与EOPE胎盘局部独特的免疫抑制功能减弱和炎症状态相关的免疫微环境重塑密切相关。这些发现深化了对EOPE免疫病因学的理解,为开发基于免疫指标的EOPE早期诊断新方法和靶向免疫调节的干预策略提供了重要的理论依据和候选靶点。未来,需要更大样本的前瞻性研究来进一步验证HLA-DPA1的临床实用性,并深入探索其调控免疫细胞功能的具体分子机制。