
-
生物通官微
陪你抓住生命科技
跳动的脉搏
hStouffer:一种改进的元分析方法,用于大规模RNA-seq数据的全面分析
《BMC Bioinformatics》:hStouffer: the enhanced meta-analysis method for the comprehensive analysis of large-scale RNA-seq data
【字体: 大 中 小 】 时间:2026年02月24日 来源:BMC Bioinformatics 3.3
编辑推荐:
传统RNA-seq元分析方法因大规模整合时假阳性率激增而存在缺陷,本研究提出混合Stouffer方法,通过p值截断、阈值设定和自助法优化整合流程,有效控制假阳性并保持高灵敏度,验证显示其能准确反映生物学本质。
随着公共RNA-seq数据集的指数级增长,元分析已成为整合研究以增强统计功效和识别一致生物学模式的关键工具。然而,传统的p值组合方法并非为大规模整合而设计,存在一个关键缺陷:随着更多数据集的加入,假阳性的比率急剧增加。这一问题源于少数个别研究中极低p值的不成比例影响,这些极低p值可能会产生误导性的整体显著性信号,从而削弱研究结果的可靠性。
在这里,我们提出了一个稳健的元分析框架,该框架结合了p值上限控制、阈值截断和bagging技术来缓解这一问题。我们使用Stouffer方法实现了这一框架,称为混合Stouffer(hStouffer)方法。所提出的方法在保持高灵敏度的同时显著降低了假阳性率。此外,验证表明,hStouffer方法识别的差异表达基因(DEGs)准确地反映了潜在的生物学现象,使其成为充分利用扩展的基因组数据库来理解复杂生物学过程的重要工具。
hStouffer方法为大规模RNA-seq元分析提供了一种统计上稳健且生物学上连贯的解决方案。通过有效控制技术伪影和错误发现,它使研究人员能够从复杂的、汇总的转录组数据中提取出更可靠和有意义的见解。
随着公共RNA-seq数据集的指数级增长,元分析已成为整合研究以增强统计功效和识别一致生物学模式的关键工具。然而,传统的p值组合方法并非为大规模整合而设计,存在一个关键缺陷:随着更多数据集的加入,假阳性的比率急剧增加。这一问题源于少数个别研究中极低p值的不成比例影响,这些极低p值可能会产生误导性的整体显著性信号,从而削弱研究结果的可靠性。
在这里,我们提出了一个稳健的元分析框架,该框架结合了p值上限控制、阈值截断和bagging技术来缓解这一问题。我们使用Stouffer方法实现了这一框架,称为混合Stouffer(hStouffer)方法。所提出的方法在保持高灵敏度的同时显著降低了假阳性率。此外,验证表明,hStouffer方法识别的差异表达基因(DEGs)准确地反映了潜在的生物学现象,使其成为充分利用扩展的基因组数据库来理解复杂生物学过程的重要工具。
hStouffer方法为大规模RNA-seq元分析提供了统计上稳健且生物学上连贯的解决方案。通过有效控制技术伪影和错误发现,它使研究人员能够从复杂的、汇总的转录组数据中提取出更可靠和有意义的见解。
生物通微信公众号
知名企业招聘