多样化测序数据的统一处理:《癌症基因组图谱》与中国队列中结肠癌基因组景观的跨人群比较 可供购买

《Cancer Epidemiology, Biomarkers & Prevention》:Uniform Processing of Diverse Sequencing Data: A Cross-Population Comparison of Colon Cancer Genomic Landscapes from The Cancer Genome Atlas and a Chinese Cohort Available to Purchase

【字体: 时间:2026年05月03日 来源:Cancer Epidemiology, Biomarkers & Prevention 3.4

编辑推荐:

   打开图形查看器 摘要

  
背景:

结肠癌在基因上具有异质性,因此需要进行标准化的基因组分析以进行跨队列比较。尽管癌症基因组图谱-结肠腺癌(TCGA-COAD)是一个广泛使用的数据集,但其与其他种族群体的可比性仍不明确。本研究使用相同的数据处理流程系统地比较了TCGA-COAD和中国结肠癌队列ChangKang的基因组特征,以尽量减少方法学偏差。

方法:

两个队列的全外显子测序数据经过统一处理,以分析五个关键的基因组特征:肿瘤突变负担(TMB)、微卫星不稳定(MSI)、显著突变基因、突变特征和拷贝数变异(CNV)。样本被分为高突变亚组和低突变亚组以便进一步比较。

结果:

TCGA-COAD队列的整体TMB较高,这主要是由于高突变样本的比例较高。然而,ChangKang队列中的高突变亚组包含更多具有聚合酶ε(POLE)外切酶结构域突变的超突变病例,导致该亚组的TMB更高。MSI在TCGA-COAD中更为普遍,而显著突变基因的频率有所不同,ChangKang队列中APCACVR2A的突变率较低。CNV模式大体相似,尽管TCGA-COAD中的CNV频率较高。

结论:

尽管亚组分布和突变频率存在差异,但这些不同种族群体的结肠癌的总体基因组特征仍然一致。这表明,在应用标准化处理方法的情况下,进行跨人群分析是可行的。

影响:

本研究对TCGA-COAD和中国ChangKang队列进行了系统的、无偏的比较,证明基因组特征在不同种族群体中大体上是一致的。

TCGA-COAD队列的原始数据作为受控数据可在GDC数据门户中获取。ChangKang队列的原始数据可从CNCB-NGDC获取(访问编号HRA000873),但这些数据的可用性受到限制,因为它们是按照许可协议用于本研究的,因此不向公众公开。不过,经CNCB-NGDC许可并合理请求后,可以从作者处获取这些数据。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号