RaMBat:基于基因表达排序的跨批次髓母细胞瘤分子分型新方法

《Molecular Oncology》:RaMBat: Accurate identification of medulloblastoma subtypes from diverse data sources with severe batch effects

【字体: 时间:2026年01月24日 来源:Molecular Oncology 4.5

编辑推荐:

  本研究提出RaMBat新方法,通过基因表达排序(GER)策略解决多源转录组数据的批次效应难题,在13个独立数据集上实现99%的准确率,显著优于现有分型工具。该方法利用基因对相对表达模式(如NEUROG1/ATOH1等标志基因对),结合反向表达模式分析与弹性网络筛选,为髓母细胞瘤(MB)的精准风险分层与个体化治疗提供新范式。

  
研究背景与挑战
髓母细胞瘤(Medulloblastoma, MB)作为最常见的儿童恶性脑肿瘤,其四种分子亚型(SHH、WNT、Group 3、Group 4)具有显著异质性的临床预后。传统分型方法依赖绝对基因表达值,在整合多源数据时受批次效应严重影响,导致分型准确性受限。
RaMBat方法创新
研究团队开发了RaMBat算法,其核心是通过基因表达排序替代绝对表达值,以基因表达比值(Gene Expression Ratio, GER)作为分型依据。该方法包含四个关键步骤:
  1. 1.
    基因排序分析:将样本内基因按表达量升序排列转化为秩次;
  2. 2.
    反向表达模式筛选:通过Fisher精确检验识别亚型间具有稳定逆转模式的GER(如SHH亚型中NEUROG1与ATOH1的秩次关系);
  3. 3.
    弹性网络特征选择:从数十万GER中筛选出1035个关键基因对(涉及738个独特基因),如WNT亚型相关基因对FZD10/SP5;
  4. 4.
    亚型评分判定:根据GER在样本中的平均得分确定最终亚型。
性能验证与比较
在13个独立数据集(共508个样本)的测试中,RaMBat的中位准确率达99.02%,显著优于medulloPackage(91.1%)、MM2S(87.2%)及7种传统机器学习模型。尤其在Group 3与Group 4的区分上,仅5个样本误判,凸显其处理高相似亚型的能力。对RNA-seq数据(OpenPBTA数据集)的测试进一步验证了跨平台适用性(准确率95%)。
生物学意义挖掘
RaMBat筛选的GER涵盖已知亚型标志基因(如SHH亚型的GLI1、WNT亚型的WIF1),并与差异表达基因分析高度一致(如PDLIM3在SHH亚型特异性高表达)。t-SNE可视化显示,RaMBat有效消除批次效应,使不同数据集样本按亚型清晰聚集(图4C-D)。
局限与展望
当前方法在计算大规模GER矩阵时耗时较长,未来可通过优化算法提升效率。研究证实基于基因排序的策略能够突破批次效应限制,为多癌种整合分析提供新思路。
结论
RaMBat首次将基因表达排序与多步骤GER筛选结合,实现了跨平台髓母细胞瘤分型的近完美准确率,为儿童及青少年癌症的精准医疗提供了可推广的计算框架。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号