基于整合生物信息学方法的口腔鳞状细胞癌潜在关键基因与分子机制探索

《Journal of Genetic Engineering and Biotechnology》:Identification of potential key genes and molecular mechanisms of oral squamous cell carcinoma based on integrated bioinformatics approach

【字体: 时间:2026年03月13日 来源:Journal of Genetic Engineering and Biotechnology 2.8

编辑推荐:

  为探究口腔鳞状细胞癌(OSCC)的分子机制并寻找潜在生物标志物,研究人员对GSE23558和GSE146483两个基因表达数据集进行了整合生物信息学分析。他们筛选出265个差异表达基因(DEGs),构建了蛋白质-蛋白质相互作用(PPI)网络,并识别出KIF23、AURKA等9个枢纽基因。结果表明,这些枢纽基因在OSCC的细胞增殖、分裂和凋亡调控中扮演关键角色,有望成为OSCC诊断与治疗的潜在新靶点,为改善患者预后提供了新的研究方向。

  
在全球范围内,口腔癌是常见的头颈部恶性肿瘤之一,其中口腔鳞状细胞癌(Oral Squamous Cell Carcinoma, OSCC)占据了绝大多数病例。每年,全球有超过37万人被诊断为OSCC,并导致超过17万人死亡。尽管现代医学在手术和放化疗方面取得了显著进步,但OSCC患者的五年生存率在过去几十年里并未得到显著提升,仍然徘徊在50%-60%之间,特别是当疾病在晚期才被发现时,预后往往很差。吸烟、饮酒、人乳头瘤病毒(HPV)感染等都是已知的风险因素,但驱动OSCC发生发展的具体分子机制仍然迷雾重重。这就好比我们面对一座复杂的城市,知道它(肿瘤)在失控地扩张,却并不完全清楚指挥交通、建造楼宇(驱动癌症的基因和信号通路)的核心枢纽在哪里。为了更精准地“导航”并“定点清除”肿瘤,科学家们急需找到那些关键的“控制中心”——即驱动OSCC进展的生物标志物和潜在治疗靶点。正是在这样的背景下,生物信息学(一门将生物学与计算机科学结合的新兴交叉学科)提供了强大的工具。它能够帮助研究人员从海量的基因数据中,像侦探一样筛选出关键的线索,从而揭示癌症背后的分子蓝图。Mohammad Khursheed Alam等人发表在《Journal of Genetic Engineering and Biotechnology》上的研究,正是运用了整合生物信息学的方法,试图在OSCC的基因迷宫中,定位出那些最关键的“路标”和“枢纽”。
研究人员主要运用了生物信息学的分析方法,其关键技术方法包括:从基因表达综合(GEO)数据库收集GSE23558和GSE146483两个人类OSCC基因表达谱数据集(共43个样本,含35个OSCC和8个正常样本);使用GEO2R工具和统计学标准筛选差异表达基因(DEGs);利用DAVID在线工具进行基因本体论(GO)功能注释和Reactome通路富集分析;通过STRING数据库构建蛋白质-蛋白质相互作用(PPI)网络,并运用Cytoscape软件及其CytoHubba、MCODE插件识别枢纽基因和功能簇;最后,基于RegNetwork数据库构建了转录因子-微小RNA(TF-miRNA)调控网络。
3.1. 差异表达基因筛选
研究人员对两个基因表达数据集进行分析,在应用筛选标准(|logFC| > 2, 调整后p值 < 0.05)后,分别从GSE23558和GSE146483中识别出1453个和1870个DEGs。通过比较,最终确定了265个共有的DEGs,其中包括69个上调基因和196个下调基因。韦恩图直观地展示了这一筛选结果。
3.2. DEGs的富集分析
对上下调DEGs分别进行的GO分析显示,上调DEGs显著富集于“前/后模式特化”、“有丝分裂细胞周期”、“染色体分离”等生物过程,以及“染色质”、“核质”、“微管结合”等细胞组分和分子功能。下调DEGs则与“角质化”、“外源性物质代谢过程”、“RNA聚合酶II核心启动子近端区域序列特异性DNA结合”等功能密切相关。通路分析进一步揭示,上调基因与“细胞周期”、“M期”等通路强烈相关,而下调基因则与“角质化”、“通用转录通路”等通路相连。
3.3. 蛋白质-蛋白质网络构建与枢纽基因选择
基于265个共有DEGs,研究人员构建了一个包含92个节点和242条相互作用的PPI网络。为了确保结果的稳健性,他们使用了三种不同的拓扑分析方法来识别网络中的枢纽基因。最终,有9个基因在三种方法的结果中共同出现,被确定为顶级枢纽基因,它们分别是:驱动蛋白家族成员23 (KIF23)、极光激酶A (AURKA)、着丝粒蛋白F (CENPF)、细胞分裂周期20 (CDC20)、Discs大同源相关蛋白5 (DLGAP5)、中心体蛋白55 (CEP55)、肌动蛋白结合蛋白Anillin (ANLN)、非SMC凝缩蛋白I复合物亚基G (NCAPG)和驱动蛋白家族成员14 (KIF14)。PPI网络图展示了这些基因的相互作用关系。此外,从网络中识别出的三个重要功能簇分别与“细胞周期”、“干扰素α/β信号”和“外源性物质代谢”通路相关。
3.4. TF-miRNA网络分析
为了更深入地理解DEGs的调控机制,研究人员构建了一个包含226个节点和994条边的TF-miRNA网络,其中包含74个微小RNA(miRNA)和152个转录因子(TF)。基于连接度,筛选出了排名前5的miRNA(如hsa-miR-19b, hsa-miR-218)和TF(如FOXP2, TRPS1)。
研究的讨论与结论部分对上述发现进行了深入阐释,并强调了其重要意义。研究发现,上调的DEGs主要与细胞周期进程密切相关,而下调的DEGs则显著富集于角质化等通路。这提示OSCC的发展可能伴随着细胞增殖的失控和正常上皮分化(如角质化)程序的失调。在识别出的9个枢纽基因中,KIF23和AURKA被特别指出具有成为OSCC生物标志物的巨大潜力。尽管尚无研究直接阐明KIF23在OSCC中的作用,但已有证据表明它在肝癌等多种癌症中通过促进细胞增殖和化疗耐药发挥作用。AURKA作为有丝分裂的关键调控因子,在多种癌症组织中过度表达,包括OSCC。先前的研究已发现AURKA的过表达与OSCC的组织学分化、淋巴结转移及预后不良相关,并能通过调节上皮-间质转化(EMT)和活性氧(ROS)来影响OSCC进展。其他枢纽基因如CENPF、CDC20、CEP55等也均在头颈癌或其他癌症中被报道与不良预后和肿瘤进展相关。这些发现将这些基因与OSCC的恶性表型(如高增殖、侵袭和转移)紧密联系在一起。
总之,这项通过整合生物信息学方法进行的研究,系统性地筛选并分析了OSCC中的关键差异表达基因和信号通路。研究不仅提供了对OSCC潜在分子机制的见解,更重要的是,它成功定位了KIF23、AURKA、CDC20等一组核心枢纽基因。这些基因在OSCC的发生发展中可能扮演着“引擎”和“开关”般的核心角色。尽管该研究存在未进行湿实验验证、数据集样本类别不平衡等局限性,但其结果为后续的生物学功能实验和临床转化研究提供了明确的方向和强有力的候选靶点。如果未来能够通过细胞、动物实验乃至临床样本进一步验证这些基因的功能,将有望开发出针对OSCC的新的早期诊断方法、预后判断指标乃至靶向治疗策略,从而为改善这一致命性疾病的诊疗现状带来新的希望。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号