整合的单细胞全基因组测序和空间转录组学技术揭示了卵巢癌中的肿瘤内异质性
开放获取(Open Access)
《Cancer Research Communications》:Integrated Single-Cell Whole-Genome Sequencing and Spatial Transcriptomics Reveal Intratumoral Heterogeneity in Ovarian Cancer
Open Access
【字体:
大
中
小
】
时间:2026年05月07日
来源:Cancer Research Communications
编辑推荐:
开放式图谱查看器
摘要
卵巢癌的死亡率与其发病率相比仍然异常高。这部分是由于肿瘤内部的异质性水平较高,这种异质性由基因组不稳定驱动,促进了疾病的复发和治疗失败。在这项研究中,我们利用单细胞全基因组测序和空间转录组学(ST)技术,描述了五种晚期、未经治疗的原发性上皮性卵巢癌的异
开放式图谱查看器
摘要
卵巢癌的死亡率与其发病率相比仍然异常高。这部分是由于肿瘤内部的异质性水平较高,这种异质性由基因组不稳定驱动,促进了疾病的复发和治疗失败。在这项研究中,我们利用单细胞全基因组测序和空间转录组学(ST)技术,描述了五种晚期、未经治疗的原发性上皮性卵巢癌的异质性程度,包括高级别浆液性和透明细胞亚型。所有样本都表现出广泛的拷贝数(CN)异常,其中拷贝数增加区域的异质性最为显著。这种异质性也与所有样本的全基因组加倍现象相关。在两个样本中,我们发现了具有癌前表型的持续性克隆性伪二倍体细胞的演化。在多克隆样本中,我们将克隆演化与单细胞拷贝数变化、杂合性丢失分析以及体细胞突变联系起来,并将其与组织形态学和基因表达谱进行关联。在一种高级别浆液性癌中,我们发现了一些功能性显著的拷贝数改变,这些改变有助于分子多样性、细胞增殖和炎症,在一个较小的克隆中持续存在,而另一个主要克隆则更为复杂。在另一种透明细胞癌中,我们描述了一个复杂的演化历史,包括一个次要克隆中CTNNB1驱动突变的自发功能逆转,这与致癌表达谱的改变相关。这些例子突显了基因组不稳定对卵巢癌克隆异质性和可塑性的多种影响。
重要性:我们利用单细胞DNA测序和ST技术,展示了晚期卵巢肿瘤内部异质性的广泛程度。我们描述了染色体不稳定性的几个后果,包括多克隆肿瘤中的生物学差异、癌前细胞群的持续性,以及致癌驱动突变的功能逆转。
引言
卵巢癌是美国最致命的妇科恶性肿瘤,超过一半的患者在诊断时已经处于晚期(1)。大多数卵巢癌来源于上皮组织,可以分为四种主要组织学亚型:浆液性、子宫内膜样、透明细胞性和黏液性(2)。其中,高级别浆液性卵巢癌(HGSOC)是最主要的组织学亚型。它也是最具侵袭性的亚型,总体预后最差,大多数患者在最初对化疗有良好反应后仍会经历疾病复发(3)。据估计,高达90%的HGSOC患者在确诊时已经出现转移性疾病,并会发展出对治疗的完全耐药性(4)。与HGSOC相比,透明细胞癌(CCOC)较为罕见,且通常在较年轻的患者中早期出现,此时的预后比HGSOC更好(5, 6)。然而,晚期CCOC患者对基于铂类的化疗反应较差,无进展生存率也较低(6, 7)。因此,HGSOC和CCOC都是提高卵巢癌治疗效果的研究重点。除了独特的组织学和临床特征外,HGSOC和CCOC在生物学上也存在差异,这一点已通过多项研究得到证实(8–13)。尽管几乎所有HGSOC都存在TP53突变,但与其他组织来源的癌症相比,HGSOC的体细胞突变较少(14, 15)。相反,HGSOC的特点是高度的非整倍体和反复出现的拷贝数(CN)改变(CNA),而这些改变往往不具备直接的治疗意义(15)。CCOC则表现出更多的体细胞驱动突变多样性,主要表现为ARID1A和PIK3CA的突变,但TERT启动子、KRAS、TP53、ATM和PTEN的突变也以相当高的频率出现(12, 16)。CCOC中也存在反复的CNA,尽管其紊乱程度低于HGSOC(13)。上皮性卵巢癌(EOC),特别是HGSOC,以其肿瘤内部的异质性而闻名,这一点从多区域和纵向肿瘤采样获得的CNA和突变谱中可以得到反映(17–19)。空间转录组学(ST)已被用来推断HGSOC中的克隆组成及其相关生物学特性(20)。然而,从基因表达数据推断出的CN无法在高分辨率下得到可靠评估。单细胞全基因组测序(scWGS)提供了评估CNA异质性和解析潜在克隆结构的最直接方法(21–24),但仅靠scWGS无法描述肿瘤的生物学特征。在这项研究中,我们将scWGS与五个卵巢癌样本的ST分析相结合,以评估克隆多样性的生物学表现。通过scWGS,我们在单细胞和簇水平上评估了CN和体细胞突变,以识别克隆性CNA、全基因组加倍(WGD)事件和伪二倍体细胞。在多克隆样本中,我们结合CNAs、驱动突变和杂合性丢失(LOH)来推断肿瘤演化。通过匹配的ST数据,我们证明了控制代谢、细胞增殖和炎症的基因表达谱与scWGS中识别的克隆特异性CNAs相对应。我们还首次报告了一个次要克隆中致癌CTNNB1驱动突变的自发逆转及其相关的补偿性基因表达谱的变化。这些案例突显了染色体不稳定对卵巢癌克隆异质性和可塑性的多种影响。
材料与方法
样本
组织样本是从南加州大学凯克医学院妇科组织和液体存储库获得的,采用了机构审查委员会批准的标准(#HS-18-00948)。该存储库还提供了可用的匹配外周血白细胞层。患者提供了书面的知情同意书以同意样本收集。所有样本均为女性患者的EOC,具有不同的组织学亚型:三个HGSOC、一个CCOC和一个主要为CCOC但混有子宫内膜样的样本。亚型信息来自病理报告,并通过同期复核得到确认。所有样本均为晚期(≥IIIC)和高级别肿瘤。所有样本都经过评估,确保样本中肿瘤占比超过60%。样本信息总结在补充文件S1中。
DNA提取和全外显子测序
基因组DNA使用DNeasy Blood & Tissue Kit(QIAGEN)根据制造商的协议进行提取。肿瘤DNA使用AllPrep Mini Kit(QIAGEN)从10微米的冷冻肿瘤组织切片中提取。通过SureSelect Low Input Target Enrichment System和SureSelect XT Human All Exon V6目标富集探针(均为Agilent Technologies产品),按照制造商的协议进行提取。使用NovaSeq 6000仪器(Illumina)对混合库进行2 × 150的测序。原始测序数据使用bcltofastq(版本2.20.0.422)进行解复用,并将FASTQs与人类参考基因组GRCh38对齐,生成二进制对齐图(BAM)文件。只有样本OV440进行了全外显子测序(WES),因为该样本有足够的组织材料,用于后续的scWGS基准测试。
批量CN分析
使用sequenza R包(版本3.0.0,RRID:SCR_016662)处理配对的肿瘤/正常BAMs,对照参考基因组轨道(GRCh38)生成等位基因特异性CN(25)。首先使用50 bp的窗口创建参考基因组的wiggle轨道文件。然后sequenza通过统计每个基因组bin的读数来处理肿瘤/正常对,接着进行分割以识别基因组中CN值异常的区域。
单细胞DNA测序
根据10x Genomics的推荐方法(文档CG000167,修订版A),从冷冻组织切片中分离出单个细胞核。简要来说,组织切片在冰上解冻,裂解,并用研杵物理均质化。经过两步离心后,用含有0.04% BSA的PBS清洗回收的细胞核,并通过40微米滤网去除团聚体。细胞核用Ethidium Homodimer-1染色,并用Countess II FL细胞计数仪(Invitrogen)计数。
scWGS
单细胞核使用Chromium Single Cell DNA Reagent Kits(10x Genomics)根据制造商的协议(文档CG000153,修订版B-C)进行处理。简要来说,单个细胞核被分配到含有凝胶基质的小滴中,在其中裂解。含有变性基因组DNA的小滴随后与含有六聚体引物和唯一16核苷酸条形码的凝胶珠共同封装,以实现单个细胞的扩增和唯一索引。随后溶解封装,将条形码化的DNA汇集起来,用于生成Illumina兼容的测序库。经过质量评估后,这些库在NovaSeq 6000仪器(Illumina)上进行2 × 100的测序。
单细胞CN调用和指标
测序数据使用Cell Ranger DNA pipelines(版本1.0.0,10x Genomics,RRID:SCR_023221)进行处理。使用cellranger-dna mkfastq进行解复用,随后使用cellranger-dna cnv进行人类参考基因组GRCh38的对齐、细胞识别和CN估计。样本中检测到的细胞数量从532到1,437不等。每个样本平均处理了约1.6B个映射且去重的细胞相关读数,平均每个细胞约1.75M个读数,足以检测到约1 MB大小的CN事件。每个MB的有效读数中位数从420到786不等。单细胞CN调用的详细指标在补充文件S1中可以找到。
后处理单细胞CN调用
为了生成高质量的数据集,我们分多步过滤CN调用和细胞。首先,从数据集中移除了噪声细胞和低质量的调用(“单细胞CN调用的过滤”)。剩余细胞经过聚类分析以揭示主要的CN谱型(“CN谱型的聚类和亚聚类”)。然后识别并移除了可能代表凋亡细胞的降解DNA组成的簇(“去除重复细胞和伪影”)。剩余细胞再经过一轮聚类和亚聚类。
细胞分类为噪声细胞并从数据中移除,如果它们满足以下两个条件之一:(i)细胞的倍性置信度低,或者(ii)细胞的成对差异的深度独立中位数绝对偏差(DIMAPD)得分高于阈值,当高斯分布适合数据时,这个阈值相当于P值为0.1。这种DIMAPD过滤比Cell Ranger默认执行的过滤更为严格,以确保我们移除的是处于活跃DNA复制过程中的细胞,这些细胞可能会干扰进一步分析。在剩余细胞中,评估每个20 KB bin内的单个CN调用质量,移除质量得分低于15的调用。最后,移除了可映射性低于90%的基因组区域。经过这一过程后,干净的数据被组织成每个细胞条形码下每20 KB bin的CN调用矩阵。
聚类和CN谱型的亚聚类
我们采用了Velazquez-Villarreal及其同事描述的聚类策略(26)。使用GenomicRanges R包(版本1.50.2,RRID:SCR_000025;参考文献27),将500个连续bin的CN调用聚合起来,以10 MB的分辨率生成每个细胞的平均倍性值。然后使用R包adegenet(版本2.1.10,RRID:SCR_000825;参考文献28)对细胞进行最大似然遗传聚类。数据在所有k值(最高k = 20)上进行聚类,并评估了贝叶斯信息准则(BIC)和赤池信息准则(AIC)。基于BIC选择的聚类解决方案反映了过度聚类,而AIC更好地捕获了异质性群体(补充图S1)。因此,使用AIC来选择聚类的k值。然后使用相同方法对每个簇中的细胞进行第二轮聚类以确定亚簇。每个样本中保留的条形码及其簇分配可以在补充文件S2中找到。使用adegenet包进行主成分分析(DAPC),以评估确定簇和亚簇之间的关系。使用map R包(版本0.8-19)计算簇内细胞对的欧几里得距离。
去除重复细胞和伪影
在第一轮聚类之后,识别出代表WGD前的肿瘤簇,并用它们生成基线CN谱型。OV511和OV594包含两个代表不同克隆的基线谱型。然后通过将两个基线肿瘤谱型相加,生成了一个代表二倍体-肿瘤重复体的谱型。在OV511和OV594中,通过将两个基线谱型相加也生成了一个肿瘤-肿瘤双重谱型。与双重谱型匹配的细胞被从数据集中移除。然后,我们移除了可能代表CN过拟合伪影的细胞,确保这些细胞包含一个具有奇数CN的10 Mb区域,遵循McPherson及其同事的策略(24)。每个样本中每个条形码的最终分配和指标可以在补充文件S2中找到。单细胞CN的基因型特异性确定
从scWGS中,每个样本都识别出了二倍体细胞簇,并作为配对正常值用于生殖系变异的调用。使用Velazquez-Villarreal及其同事提供的脚本(26)修改后,使用样本的BAM文件创建了一个仅包含二倍体细胞的mini-BAM。然后使用GATK HaplotypeCaller(版本4.1.8.0,RRID:SCR_001876;参考文献29)生成生殖系变异调用格式文件。接着使用Eagle2(版本2.4.1,RRID:SCR_015991;参考文献30)估计基因型相位,并使用bcftools(版本1.17,RRID:SCR_005227;参考文献31)识别常染色体杂合单核苷酸多态性(SNP)。然后使用Copy-number Haplotype Inference in Single-cell by Evolutionary Links(CHISEL)算法(RRID:SCR_023220;参考文献32)计算相位化的单细胞CN。计算了每个样本在10 Mb区间内的单细胞读取深度比(RDR),并在50 Kb区间内计算了B-等位基因频率(BAF)。之前被分类为噪声或双重谱型的细胞被手动从RDR和BAF数据集中移除,随后对剩余细胞进行CHISEL调用以获取等位基因和基因型特异性的CN。从相位化的基因型推断出LOH。我们将缺乏一种等位基因表示的区域视为LOH,这可能表现为半合子、拷贝中性LOH或剩余等位基因的高水平增加。为了在簇水平上评估BAF,将识别的SNP位置的平均BAF划分为100 Kb的块,以平滑单细胞数据固有的噪声。还利用等位基因特异性CN来确定WGD,遵循Bielski及其同事建立的指南(33)。具体来说,每细胞中主要等位基因CN大于或等于2的比例被确定;如果该比例大于0.5,则表示存在WGD。
体细胞变异的调用
使用Strelka2(版本2.9.2,RRID:SCR_005109)在肿瘤-正常模式(34)下从scWGS中识别出体细胞单核苷酸变异、插入和缺失。使用mini-BAMs(见“单细胞CN的基因型特异性确定”),将肿瘤簇与匹配的二倍体簇进行比较。体细胞变异调用使用默认参数针对GRCh38参考基因组进行。使用bcftools(版本1.14)并根据Single Nucleotide Polymorphism Database build 154数据库对变异进行注释。使用vcf2maf(版本1.6.22)和Variant Effect Predictor数据库(RRID:SCR_007931;参考文献35, 36)将变异效应进行注释并转换为Mutation Annotation Format。使用Integrative Genomics Viewer(版本2.14.1,RRID:SCR_011793;参考文献37)对预测为致病的变异进行视觉检查。
单细胞CN的可视化
使用ComplexHeatmap R包(版本2.14.0,RRID:SCR_017270;参考文献38)将单细胞CN可视化,其中每一行对应一个细胞条形码,每一列对应一个10 Mb的区间。CHISEL确定的LOH的存在或缺失也以类似的方式进行了可视化。热图按照簇和子簇信息进行组织和注释。使用R包ggplot2(版本3.4.2,RRID:SCR_014601;参考文献39)创建了伪大体积CN线图,反映了每个10 Mb区间的平均倍性值,适当情况下用阴影区域表示标准差(SD)。CN线图与染色体条形图配对显示,分辨率为一Mb,使用R包karyoploteR(版本1.24.0,RRID:SCR_021824;参考文献40)创建。
系统发育分析
系统发育分析基于Minussi及其同事采用的策略(21)进行。使用amp R包计算每个细胞(在1 Mb区间内)或每个子簇(在20 Kb区间内的平均值)的CN值的成对曼哈顿距离。然后使用R包ape(版本5.7-1,RRID:SCR_017343;参考文献41)中的平衡最小进化算法进行系统发育分析。通过指定一个二倍体细胞或(子)簇作为外群来 rooting 树,然后使用R包ggtree(版本3.6.2,RRID:SCR_018560;参考文献42)进行可视化。出于可视化目的,二倍体簇在负距离空间中显示。
为了使用Visium CytAssist Spatial Gene Expression测试(10x Genomics)分析存档的、经过甲醛固定和石蜡包埋的的组织样本(这些组织已经过切片和苏木精-伊红染色)。首先按照10x Genomics Demonstrated Protocol CG000518(Rev C)中的描述移除了硬质盖玻片。然后按照制造商的协议进行Visium测试,使用11 mm × 11 mm的捕获切片。质量评估后,使用Illumina NextSeq 2000仪器对文库进行测序(2 × 100),每个样本点至少生成25,000个读取对。完整的指标可以在补充文件S1中找到。由于样本稀缺,样本OV773未进行Visium分析。原始测序数据使用spaceranger mkfastq和spaceranger count管道(版本3.0.1,10x Genomics,RRID:SCR_025848)进行预处理,如先前所述(43)。使用人类参考基因组GRCh38进行比对。原始计数数据导入R包Seurat(版本4.3.0.1,RRID:SCR_016341)中,并使用R包sctransform(版本0.3.5,RRID:SCR_022146,参考文献44, 45)中的SCTransform方法进行归一化。
使用R包infercnv(RRID:SCR_021140;版本1.18.1;参考文献46)进行CN谱型的推断。首先使用R包estimate(版本1.0.13;参考文献47)对归一化后的计数数据进行ESTIMATE分析,以确定每个样本点的肿瘤纯度分数。通过将肿瘤纯度分数与组织学注释进行比较,我们确定肿瘤纯度分数为0.7是一个区分肿瘤点的合理阈值。因此,肿瘤纯度分数<0.7的点被视为参考点,而肿瘤纯度分数>0.7的点被视为肿瘤点,并用于inferCNV作为观察结果。然后使用inferCNV在子簇模式下分析原始计数数据,结合Hidden Markov Model(HMM)确定的CN预测,以识别观察点相对于参考点的CN事件。使用Leiden算法确定肿瘤亚组。
基因集富集分析
使用GenePattern软件(RRID:SCR_003201;参考文献48)进行基因集富集分析(GSEA)和单样本GSEA,如先前所述(43)。分析针对Hallmark基因集(49)和自定义位置基因集进行。使用Seurat的CellCycleScoring功能预测细胞周期阶段。
临床样本的特征
我们从五个EOC病例中获得了冷冻肿瘤组织。样本OV440、OV594和OV773是HGSOC;样本OV150具有混合的CCOC和子宫内膜样组织学;样本OV511是CCOC。我们选择了具有相似阶段和级别的样本,反映了临床上具有挑战性的晚期疾病。我们选取的病例具有不同的患者自我报告的种族:三名患者是西班牙裔/拉丁裔(OV440、OV511和OV773),一名是亚洲人(OV150),一名是非西班牙裔白人(OV594)。所有患者的年龄都小于63岁,这是卵巢癌诊断的中位年龄(1)。虽然我们没有根据BRCA状态进行选择,但我们事先知道样本OV440中存在生殖系BRCA2 E49X突变。所有样本均未经治疗,并来自原发性活检或手术。
为了评估亚克隆CN的异质性,我们按照“材料与方法”中描述的步骤对每个样本中的单独核进行了DNA条形编码和浅层WGS(scWGS)。大约每个细胞测序了170万个去重读数,平均每个兆碱基541个读数,平均每个细胞的深度为0.07×到0.14×(补充文件S1)。使用Cell Ranger DNA管道产生的CN数据和指标来过滤掉低质量细胞和调用结果。每个样本中通过所有过滤步骤的最终细胞比例在30%到60%之间。然后对干净的数据进行最大似然遗传聚类分析,以解析簇和子簇。在样本OV440(HGSOC)中,我们解析出了四个簇(图1A)。簇1主要由二倍体细胞组成,而簇2、3和4由恶性细胞组成。簇2内的子簇具有相同的基线倍性,但可以通过染色体1、2、8、13和X的轻微CN差异区分开来(图1A)。利用CHISEL算法(32),我们确定了相应的单细胞基因型特异性CN,揭示了广泛的LOH,包括整个染色体17的拷贝中性LOH,包含TP53,以及染色体13q12的BRCA2(图1B)。从CHISEL结果中,我们还确定簇2经历了WGD事件,因为超过一半的基因组中的主要等位基因大于或等于2(图1C)。因此,簇3和4可能代表了WGD之后的多样化和额外的WGD,这是HGSOC的常见特征(24)。
跨模态的CN确定基准测试。A,通过scWGS确定的样本OV440的CN,以10 Mb的分辨率进行分箱。每一行显示来自单个细胞的数据。热图颜色代表绝对CN,而灰色区域代表从分析中移除的不可映射区域或低质量调用。染色体在x轴上标出并进行了注释。细胞按照簇和子簇的分配在y轴上排序,这是通过连续的最大似然遗传聚类确定的。B,通过CHISEL确定的OV440簇2的单细胞等位基因特异性CN。热图颜色与A中的颜色相匹配;*表示杂合二倍细胞中预期的基线等位基因特异性CN为1。LOH是根据“材料与方法”中描述的A-和B-等位基因谱型推断出来的,并用黑色阴影表示。C,确定每个细胞中主要CN(MCN)≥2的比例,并以簇的密度图形式显示。假设其基因组中超过一半具有MCN≥2的细胞经历了WGD。
D,(顶部)通过WES确定的OV440的CN。(中间)通过scWGS确定的簇2的平均CN,以10 Mb的分辨率进行分箱。线条周围的阴影区域代表标准差(SD)。(底部)通过WES确定的等位基因特异性CN。E,从WES和scWGS确定的OV440中选定的生殖系和体细胞突变的VAFs。气泡的大小代表每个样本中跨越突变位点的读数数量。
F,样本OV440的苏木精-伊红染色组织。方块代表ST采样的11 mm × 11 mm区域。G,使用inferCNV从ST推断出的CNAs。子簇通过Leiden聚类确定,并在左侧进行了注释。然后在子簇级别进行了基于HMM的CN预测。确定了三个恶性亚组;较小的组在图下方进行了扩展以便于清晰显示。
H,(G)中映射的亚组。标有“Interface”的点被认为是恶性细胞和二倍细胞的混合物(补充图S3)。scDNA,单细胞DNA。
图1. 跨模态的CN确定基准测试。A,通过scWGS确定的样本OV440的CN,以10 Mb的分辨率进行分箱。每一行显示来自单个细胞的数据。热图颜色代表绝对CN,而灰色区域代表从分析中移除的不可映射区域或低质量调用。染色体在x轴上标出并进行了注释。细胞按照簇和子簇的分配在y轴上排序,这是通过连续的最大似然遗传聚类确定的。B,通过CHISEL确定的OV440簇2的单细胞等位基因特异性CN。热图颜色与A中的颜色相匹配;*表示杂合二倍细胞中预期的基线等位基因特异性CN为1。LOH是根据“材料与方法”中描述的A-和B-等位基因谱型推断出来的,并用黑色阴影表示。C,确定每个细胞中主要CN(MCN)≥2的比例,并以簇的密度图形式显示。假设其基因组中超过一半具有MCN≥2的细胞经历了WGD。D,(顶部)通过WES确定的OV440的CN。(中间)通过scWGS确定的簇2的平均CN,以10 Mb的分辨率进行分箱。线条周围的阴影区域代表标准差(SD)。(底部)通过WES确定的等位基因特异性CN。E,从WES和scWGS确定的OV440中选定的生殖系和体细胞突变的VAFs。气泡的大小代表了每个样本中跨越突变位点的读取次数。F图显示了用苏木精和伊红染色的OV440样本组织。方块表示由ST采样的11毫米×11毫米区域。G图显示了使用inferCNV从ST推断出的CNAs。亚群是通过Leiden聚类方法确定的,并在左侧进行了注释。随后在亚群级别进行了基于HMM的CN预测。识别出三个恶性亚群;较小的亚群在图表下方进行了展开以便于理解。H图显示了(G)中的亚群的空间分布。标记为“Interface”的点被确定为恶性细胞和二倍体细胞的混合(见补充图S3)。scDNA指的是单细胞DNA。
我们将我们的scWGS数据与从批量WES中获得的CN进行了基准测试。WES得出的总CN和等位基因特异CN与簇2的特征相匹配,这证实了簇3和簇4是该肿瘤中的次要群体(见图1D)。我们还使用与正常组织对应的肿瘤簇2——二倍体亚群1.1,从scWGS中识别出了体细胞变异。这些变异包括预期的TP53突变,以及几个其他基因中的截断和非同义突变(见图1E)。从scWGS中确定的变异在WES中得到了验证,变异等位基因频率(VAF)表明WES采样了恶性细胞和非恶性细胞的混合物(见图1E)。从scWGS确定的生殖系BRCA2截断突变和体细胞TP53 Y220C突变的VAF均为1,这与这些位点的LOH现象一致。由于这两个位点的绝对CN均为2,我们也推断LOH事件发生在全基因组测序(WGD)之前(见补充图S2)。接下来,我们评估了从OV440的ST推断出的CN与scWGS的实际数据之间的准确性(见图1F-H)。通过应用inferCNV算法,发现了三个具有不同CN特征的亚群。其中最大的亚群与scWGS的簇2特征相匹配,尽管inferCNV无法区分CN为2和3的情况,也无法检测到额外的WGD事件。其他两个亚群对应于空间上受限、组织学上独特且在转录上有所差异的细胞群体,这些细胞很可能代表在scWGS中未被采样的真实亚克隆(见补充图S3)。因此,从ST推断出的CN通常可以与scWGS的数据相匹配,但需要注意采样偏差和算法灵敏度的影响。
我们还评估了另外四个EOC样本的单细胞CN特征(见图2)。样本OV773和OV594(均为HGSOC)表现出高度不规则的基因组,并携带了染色体17的LOH和体细胞克隆TP53突变(见补充图S4)。OV511(主要为CCOC)表现为臂级别和片段性的CNAs,而OV150(主要为CCOC)则表现为非整倍性且缺乏局灶性事件,这可能反映了有丝分裂过程中的分离。OV150还携带了一个克隆KRAS G12V突变(见补充图S5)。OV773和OV150各自包含一个克隆特征(簇2),而OV594和OV511则包含两个不同的主要特征,并进一步具有亚克隆多样性(簇2和簇3)。我们将在本报告的后续部分更详细地描述这两个样本。图2显示了其他EOC样本的肿瘤内CN变异情况。CN是通过单细胞DNA测序确定的,分辨率为10 Mb。左侧标注了簇和亚群的分配情况。所有热图使用相同的颜色尺度。
我们使用DAPCs(图3A)来评估识别出的簇之间的关系。基线倍性是样本内异质性的主要因素,而在大多数样本中,WGD是最重要的区分特征(见补充图S6)。为了研究簇内的多样性,我们计算了每个簇分配中单个细胞之间的所有唯一配对距离(见图3B)。与近期研究结果一致(24),高倍性簇表现出最大的簇内多样性。有趣的是,无论基线倍性如何,基因组中CN增加的区域都表现出最大的簇内变异(见图3C)。图3显示了簇多样性评估的结果。A图利用DAPCs描述了每个样本中簇之间的关系。图表展示了判别函数(DF)1和2,点代表单个细胞。每个DF的加载情况可以在补充图S6中找到。B图展示了每个簇和样本内所有可能的成对(细胞-细胞)欧几里得距离。C图显示了肿瘤簇中每10 Mb基因组区间内的平均CN与标准差(SD)之间的关系。为了清晰起见,OV594的簇2被单独显示,在图中用阴影表示置信区间。
在所有分析的样本中,二倍体簇都包含少数具有稀疏和低水平CNA的细胞。在OV440(HGSOC)中,这些细胞数量足够多,形成了自己的亚群1.2(见图1A)。这类“伪二倍体”细胞之前已有不同的解释。早期的scWGS实验发现了与相应恶性细胞的CN特征不匹配的伪二倍体细胞,因此似乎无关(50, 51)。然而,后来的研究表明,这些伪二倍体细胞具有非随机且逐渐进展的CN模式,最终与恶性细胞的CN特征一致(52)。在我们的两个样本中,发现了后一种情况的证据。在OV440中,亚群1.2在非随机位点具有CN增加,这些位点在肿瘤簇2中也得到了进一步扩增(见图4A)。DAPC和系统发育分析确认亚群1.2与真正的二倍体亚群1.1不同,但仍然与簇2相距较远(见图4B-D)。亚群1.2似乎也不携带任何LOH,包括在TP53位点(见补充图S7),表明它代表了一种非常早期的恶性转化形式。由于测序深度较低,我们无法确定这些细胞是否携带克隆TP53 Y220C突变。然而,在亚群1.2中发现了含有VWA7截断移码突变的细胞(见图4D和E),我们之前已经确定该变异是此样本中的高VAF体细胞变异(见图1E)。重要的是,VWA7位于染色体6p的一个区域内,在肿瘤簇2中该区域表现出克隆拷贝中性LOH。因此,这种突变的存在表明突变发生在LOH事件之前。这与先有突变(包括TP53中的突变)然后在HGSOC中产生等位基因不平衡的普遍观点一致(53)。
在OV440和OV150中评估了伪二倍体细胞的情况。A图显示了样本OV440中亚群1.2和簇2的基因组平均CN,分辨率为10 Mb。阴影区域代表标准差(SD)。B图对OV440的亚群进行了DAPC分析。C图基于共识CN特征展示了OV440的亚群级系统发育树。D图基于曼哈顿距离,并以一个真实的二倍体细胞为根节点,展示了OV440的单细胞系统发育树。E图标注了两个携带VWA7移码突变的单细胞。细胞606属于伪二倍体亚群1.2,细胞95是代表簇2的恶性细胞。F图显示了OV150的簇1和簇2的平均CN特征。G图展示了OV150的单细胞系统发育树。H图标注了单细胞中的CN特征。细胞570是一种带有KRAS G12V突变的伪二倍体细胞,而细胞139和584的KRAS状态无法确定。DF图表示判别函数。C,从OV594肿瘤簇的等位基因特异性拷贝数(CN)推断出的单细胞乙烯基化(LOH)。LOH用黑色阴影表示。D,OV594肿瘤簇在1 Mb分辨率下的10号和18号染色体上的CN谱型。E,OV594的假设进化轨迹。F,OV594样本的苏木精和伊红染色组织切片。实心方块表示通过ST(单细胞基因分型)评估的11毫米×11毫米区域。G,通过inferCNV从ST数据推断出的CN。为了清晰起见,iST 4在图表下方放大显示。彩色标记与A中的标记相对应,有助于将iST 4与簇2匹配。H,通过inferCNV确定的亚簇的空间图和UMAP图,如图G所示。二倍体点被用作参考,没有显示出CNA(拷贝数异常)的证据。标记为“N/A”的点没有足够的转录本密度,被inferCNV过滤掉。I,与(F和H)中的虚线矩形对应的放大区域,用inferCNV分配标记。刻度尺对应200微米。J,HGSOC(高度恶性卵巢癌)相关基因的空间映射表达。刻度尺表示表达的皮尔逊残差值。虚线矩形从前一个面板延续而来。
为了理解这些独特细胞的生物学背景,我们评估了OV594的组织学和ST数据(图5F)。将inferCNV应用于ST数据预测了四种不同的CN谱型,我们将其称为iST(从ST推断;图5G)。iST 1、2和3具有相似的CN谱型,对应于簇3的谱型,而iST 4是独特的,与簇2的谱型相匹配。当在空间上和维度简化空间中绘制时,iST 4占据了一个与其他肿瘤组相邻但不混合的离散位置(图5H)。iST 4还表现出实心生长模式,而与iST 1到3对应的区域具有明显的乳头状生长模式(图5I)。我们检查了iST组中已知卵巢癌生物标志物的表达(图5J)。所有肿瘤区域都表达了WFDC2和MUC1。然而,只有iST 1到3表达了SCGB2A2和PIGR。有趣的是,只有iST 4表达了MUC16,也称为CA125,这是最广泛用于卵巢癌临床诊断的血清标志物(54)。iST 4还特异性表达了SPON1、KLK10和S100A2——这些都被提出作为EOC(上皮性卵巢癌)的预后标志物(55-57)。
接下来,我们检查OV594中的独特CN改变是否可能驱动功能后果。除了PTEN和SMAD4的深度缺失外,我们还在簇2和3中识别出几个与ST数据中的基因表达差异相关的CNA区域(图6A和B)。簇3包含了13号染色体上基因密集区域的增加,包括与细胞周期调节(TPP2、RAB20;参考文献58、59)、细胞存活(GAS6、STK24;参考文献60、61)和细胞运动性(FARP1;参考文献62)相关的基因。簇2特有的增加包括6q25.1的扩增,其中包含ESR1——这在卵巢癌中是不常见的事件,与强烈的蛋白质阳性反应和对抗激素治疗的潜在反应相关(63)。GSEA还揭示了iST 4中早期雌激素反应基因的显著富集(图6C)。
为了理解这些独特细胞的生物学背景,我们评估了OV594的组织学和ST数据(图5F)。将inferCNV应用于ST数据预测了四种不同的CN谱型,我们将其称为iST(从ST推断;图5G)。iST 1、2和3具有相似的CN谱型,对应于簇3的谱型,而iST 4是独特的,与簇2的谱型相匹配。当在空间上和维度简化的空间中绘制时,iST 4占据了一个离散的位置,与其他肿瘤组相邻但不混合(图5H)。iST 4还表现出实心生长模式,而与iST 1到3对应的区域具有明显的乳头状生长模式(图5I)。我们检查了iST组中已知卵巢癌生物标志物的表达(图5J)。所有肿瘤区域都表达了WFDC2和MUC1。然而,只有iST 1到3表达了SCGB2A2和PIGR。有趣的是,只有iST 4表达了MUC16,也称为CA125,这是最广泛用于卵巢癌临床诊断的血清标志物(54)。iST 4还特异性表达了SPON1、KLK10和S100A2——这些都被提出作为EOC的预后标志物(55-57)。
接下来,我们研究了OV594中的独特CN改变是否可能驱动功能后果。除了PTEN和SMAD4的深度缺失外,我们还在簇2和3中识别出几个与ST数据中的基因表达差异相关的CNA区域(图6A和B)。簇3包含了13号染色体上一个基因密集区域的增加,包括与细胞周期调节(TPP2、RAB20;参考文献58、59)、细胞存活(GAS6、STK24;参考文献60、61)和细胞运动性(FARP1;参考文献62)相关的基因。簇2特有的增加还包括6q25.1的扩增,其中包含ESR1——这在卵巢癌中是不常见的事件,与强烈的蛋白质阳性反应和对抗激素治疗的潜在反应相关(63)。GSEA还揭示了iST 4中早期雌激素响应基因的支持性显著富集(图6C)。
簇2中的其他增加区域包含了与细胞增殖和侵袭(METAP2、ACTN1、ITGA3、COL1A1、NUP37;参考文献64-68)、药物抗性(AKAP12、COL1A1;参考文献69、70)和炎症(ITGA3、LTA4H;参考文献71、72)相关的基因。这些基因和相关基因集合在iST 4中显著富集,包括炎症反应和上皮-间充质转化(EMT)的程序(图6C)。iST 4还包含了更多的G2-M期细胞(图6D)。细胞周期在G1或G2-M期的停滞与癌症和其他病理学中的EMT相关(73-75)。GSEA还揭示了iST 4中氧化磷酸化的缺失(图6C和E)。对单个电子传输链成分的基因表达评估显示iST 4中存在显著的缺陷(图6F),表明存在调节缺陷。核编码的氧化磷酸化基因的表达受到转录因子NRF-1和NRF-2以及共激活因子PGC-1α的协同调控(76-78)。NRF1和NFE2L2分别在整个组织中以低水平表达(补充图S9)。然而,编码PGC-1α的PPARGC1A在iST 4中不存在(图6F)。重新评估scWGS显示,在簇2的4p染色体上的PPARGC1A位点存在LOH(图6G)。因此,我们可以假设一个特定于克隆的PPARGC1A失活事件,如高甲基化或未检测到的有害突变,促进了这些细胞中的氧化磷酸化缺陷。
肿瘤OV511(CCOC)包含两种不同的主要CN谱型,即簇2和3,它们有几个共同特征,包括WGD以及5号、7p和Xq染色体的进一步CNA(图7A;补充图S10)。然而,簇2展现了2q、4q和13q区域的独特增加以及在7q内的丢失。簇3增加了1q区域,在2q内有独特的扩增,并增加了14号染色体。亚簇内进一步存在异质性,大多数亚簇至少有两个不同的特征。亚簇3.3值得注意的是与簇2有几个共同特征,包括在2q区域的增加、7q内的丢失以及14号染色体的两个拷贝(图2)。DAPC确认了亚簇3.3的中间性,系统发育推断也是如此(图7B和C)。
图7展示了OV511簇2和3的平均CN谱型。阴影表示标准差(SD)。B,应用于OV511亚簇的DAPC分析。C,OV511亚簇的系统发育。簇1被指定为外群,并在负向进化空间中显示以方便可视化。D,OV511簇2和3共有的选择体突变的VAF(变异频率)。E,OV511簇2和3在3号染色体上100 Kb块内的BAF(倍性不平衡)。F,通过单样本GSEA确定的每个肿瘤亚组中每个位点的富集分数总结。G,代表性核编码氧化磷酸化基因的对数转换表达。PPARGC1A编码转录共激活因子PGC-1α。G,OV511簇1-4在4号染色体上100 Kb块内的BAF。BAF为0.5反映了等位基因平衡和杂合性,而接近0和1的BAF反映了LOH。PPARGC1A的基因组位置被标注。
图7展示了OV511簇2和3的平均CN谱型。阴影表示标准差(SD)。B,应用于OV511亚簇的DAPC分析。C,OV511亚簇的系统发育。簇1被指定为外群,并在负向进化空间中显示以方便可视化。D,OV511簇2和3共有的选择体突变的VAF。E,OV511簇2和3在3号染色体上100 Kb块内的BAF。F,OV511样本的单细胞等位基因特异性CN和推断出的LOH。LOH用黑色阴影表示。箭头标记了10号染色体上的一个镜像收敛进化事件的位置。在这个区域,簇2有两个B等位基因的拷贝和一个A等位基因的拷贝,而簇3有一个B等位基因的拷贝和两个A等位基因的拷贝。因此,两个簇的绝对CN都是3。虚线框突出显示了导致CTNNB1野生型(WT)恢复的3号染色体上的LOH。G,OV511的苏木精和伊红染色组织切片。方块表示Visium检测捕获的11毫米×11毫米区域。H,通过位置基因集富集确定的ST位点的空间图和UMAP图,以代表簇2和3。I,通过单样本GSEA针对Hallmark基因集确定的H中ST注释的累积富集分数。所有显示的图形的Bonferroni校正P值<0.0001。J,OV511样本的假设进化轨迹。体细胞CTNNB1突变是致癌驱动因素,随后是WGD事件。两个主要分支由于独特的CNA而区分开来,包括10号染色体上的镜像等位基因不平衡。一个平行的进化事件在簇2之前驱动了类似的亚克隆改变,随后簇2出现了一组独特的CNA,包括CTNNB1突变的丢失。
肿瘤OV511(CCOC)包含两种不同的主要CN谱型,即簇2和3,它们有几个共同特征,包括WGD以及5号、7p和Xq染色体的进一步CNA(图7A;补充图S10)。然而,簇2展现了2q、4q和13q区域的独特增加以及在7q内的丢失。簇3增加了1q区域,在2q内有独特的扩增,并增加了14号染色体。亚簇内进一步存在异质性,大多数亚簇至少有两个不同的特征。亚簇3.3值得注意的是与簇2有几个共同特征,包括在2q区域的增加、7q内的丢失以及14号染色体的两个拷贝(图2)。DAPC确认了亚簇3.3的中间性,系统发育推断也是如此(图7B和C)。在该区域,簇2拥有两个B等位基因拷贝和一个A等位基因拷贝,而簇3拥有一个B等位基因拷贝和两个A等位基因拷贝。因此,这两个簇的绝对拷数(CN)均为3。虚线框突出显示了3号染色体上的丢失usions(LOH)现象,这导致了CTNNB1基因恢复为野生型(WT)。图G展示了用hematoxylin和eosin染色的OV511组织切片。方块标出了Visium检测所捕获的11毫米×11毫米的区域。图H显示了通过位置基因集富集确定的代表簇2和簇3的STspots的空间图和UMAP。图I显示了根据Hallmark基因集通过单样本GSEA方法确定的ST注释的总体富集得分,每组的均值用水平线标注。所有图表的Bonferroni校正后的P值均小于0.0001。图J展示了样本OV511的假设进化轨迹:体细胞CTNNB1突变是致癌驱动因素,随后发生WGD事件。两个主要分支通过独特的拷数异常(CNA)区分开来,包括10号染色体上的等位基因不平衡。在簇2分化之前,一个平行的进化事件导致了类似的亚克隆改变,随后簇2出现了独特的CNA,包括CTNNB1突变的丢失。图DF显示了判别函数。
变异分析显示,在两个簇中存在多个具有相似VAF值(变异频率)的共享体细胞变异(图7D;补充图S11),反映了它们共同的起源。在簇3中也发现了一个杂合的CTNNB1 S37C热点突变(图7D),但在任一克隆中都没有发现其他驱动突变候选基因。由于簇3在进化上先于簇2出现,而CTNNB1突变几乎总是亚克隆事件(79, 80),我们推断这是该肿瘤的潜在驱动突变。我们在补充文件S3中进一步评估了亚克隆与克隆CTNNB1突变的可能性。有趣的是,簇2中并未携带该突变。对3号染色体上BAF(基因表达偏移)的检测表明簇2中CTNNB1区域存在LOH现象,而簇3则表现出杂合性(图7E)。全基因组分阶段的拷数分析确认了该位置上B等位基因的簇特异性丢失(图7F),对CTNNB1内含子中杂合生殖系SNP的手动检查也证实了这一点(补充图S12)。因此,这似乎是通过LOH在次级克隆中自发丢失的驱动突变,同时保留了野生型等位基因。在OV511的ST数据中,由于转录本计数较低,inferCNV技术无法解析拷数分布。因此,我们通过位置基因集富集识别出属于簇2和簇3的上皮细胞主要区域(补充图S13)。与其他样本一样,这些不同的簇占据着离散的空间位置和低维空间,并具有不同的组织学特征(补充图S14)。对致癌通路的表达分析显示,簇3中WNT/β-连环蛋白信号通路和EMT(上皮间质转化)的表达增强,这与CTNNB1突变激活一致(图7I)。该簇还表现出雌激素信号通路的增强,这也是与β-连环蛋白活性相关的(81)。簇2中TNFα和KRAS信号通路的表达增强,以及缺氧标志物的表达增强,表明这些表达程序可能补偿了CTNNB1的恢复。因此,我们构建了OV511独特的进化历史(图7J)。
尽管簇3在进化上明显先于簇2,但由于簇3.3与簇2的相似性,其分组存在一定的混淆。从等位基因特定的拷数变化来看,簇3.3在LOH模式和10号染色体上的镜像共进化事件方面与簇3一致(图7F)。因此,尽管基于绝对拷数的系统发育分析表明簇3.3和簇2有最近的共同祖先(图7C),但这在生物学上是不太可能的。我们认为簇3.3在进化上与簇3属于同一组,但环境压力选择了簇3.3和新兴簇2中的类似CNA。当簇2获得进一步的体细胞改变,包括CTNNB1恢复为野生型时,这种暂时的平行进化发生了分歧。
卵巢癌以其高度的基因组紊乱和肿瘤内异质性而著称。通过结合单细胞转录组(ST)和深度全基因组 sequencing(scWGS)技术,我们描述了仅凭单一技术无法区分的细胞水平和亚克隆特征。我们发现了所有五个样本的一些共同特征:所有样本都包含多种倍性的细胞,支持McPherson及其同事(24)提出的观点,即一个高度异质性卵巢癌(HGSOC)肿瘤中可能存在混合的拷数增加(WGD)现象,并将这一发现扩展到了乳头状癌(CCOC)。我们还一致发现,拷数增加区域在肿瘤发展过程中会在优先位置积累这种变异。我们的发现进一步证实了这一点:即使在WGD之后,伪二倍体细胞中的拷数增加也会被优先扩增。两个样本——OV440和OV150——包含携带与恶性细胞中相同的体细胞突变的明显克隆伪二倍体细胞,包括KRAS G12V驱动突变。伪二倍体细胞在其他类型的癌症中也有报道,包括结肠癌、乳腺癌、胃癌和前列腺癌(52, 82)。然而,这是首次在卵巢癌中观察到携带KRAS突变的伪二倍体细胞。在卵巢癌的背景下,伪二倍体细胞可能反映了透明管上皮癌(STIC)的残留存在,这些是输卵管中的早期病变,最终发展成HGSOC(83)。不过,我们也在一个透明细胞组织的样本中发现了伪二倍体细胞,而这与STIC前体无关。通常情况下,晚期肿瘤中伪二倍体细胞的持续存在可能代表了促使疾病复发和治疗抵抗的癌前细胞库。两个多克隆肿瘤使我们能够推断出亚克隆进化和相关的体细胞事件。样本OV594是一个HGSOC,包含一个主要克隆和一个细胞数量明显较少的小克隆。在获得了最初的共同TP53突变后,这两个克隆发生了显著的分化:簇2失去了SMAD4基因,簇3失去了PTEN基因,随后各自发生了独立的WGD事件。在每个克隆中,基因剂量变化反映在基因表达差异上。在小克隆中,与EMT、炎症和代谢能力相关的转录程序表达增强,这与CNA事件相符。基于scWGS和ST数据,我们得出结论,尽管小克隆没有经历大规模扩展或进一步的亚克隆发展,但它仍然存在于肿瘤中。MUC16或CA125在仅限于小克隆中的表达也有助于理解肿瘤异质性对临床诊断测试的影响。第二个多克隆样本OV511是一个CCOC,由二倍体细胞和两个不同的恶性群体组成。我们根据以下证据确定这两个恶性群体有共同的祖先:它们在多个染色体上具有相同的拷数分布,它们在几个位点上具有相同的拷数中性LOH(表明发生了整体WGD事件),并且它们共享数百个体细胞乘客突变。基于共同祖先克隆的假设,我们根据系统发育分析的数学证据和LOH模式的逻辑证据推断出克隆出现的顺序。早期克隆携带了一个杂合的CTNNB1 S37C突变,这是一个强烈的β-连环蛋白信号激活因子和广泛的致癌驱动基因(84–86)。令人惊讶的是,次要克隆中没有携带该突变,但在3号染色体上存在覆盖CTNNB1位点的LOH现象。虽然我们没有直接证据表明该突变发生了逆转,但我们可以推断它是一个潜在的驱动突变,原因有几点:功能性驱动突变几乎总是亚克隆的,因为它们在肿瘤发生过程中促进克隆扩增(87)。具体来说,在96%携带CTNNB1驱动突变的卵巢腺癌中,这些突变是亚克隆的,而且这种癌症类型中每个肿瘤的平均驱动突变数目为一个(80)。由于在OV511中没有发现其他驱动突变候选基因,我们强烈支持该样本中存在具有亚克隆逆转的CTNNB1突变。尽管突变逆转通常涉及肿瘤抑制基因的功能恢复,但也有报道指出致癌突变会发生逆转(88)。例如,在一种针对EGFR突变的肽类疫苗治疗后的肝转移性肺腺癌中,驱动突变EGFR的丢失也被认为是由染色体不稳定性引起的LOH造成的。OV511中的CTNNB1逆转的独特之处在于它发生在未经治疗的原发肿瘤中,因此不是外部选择压力的结果。尽管普遍认为肿瘤进化过程中功能驱动基因突变高度保守(87),但我们注意到亚克隆逆转在批量或多区域测序中可能不易被发现。这样的逆转可能由于染色体不稳定性的存在而更频繁地发生。尽管逆转的细胞可能会被更适应的克隆迅速取代,但在允许细胞忍受初始驱动基因丢失的细胞环境中,逆转可能是可行的。在OV511中,这可能得益于像TNFα和KRAS信号通路这样的强致癌表达程序。由于肿瘤内异质性对疾病临床进程的重要性已被广泛认可(89),我们可以推断出OV594和OV511样本中亚克隆多样性的临床后果。晚期EOC的一线化疗通常是铂类和紫杉烷类药物,但在表现出EMT表型的肿瘤中这些药物的疗效较低(90)。我们发现OV549簇2和OV511簇3中EMT过程的表达增强,分别与SMAD4缺失和β-连环蛋白激活相关。这些细胞可能会促进治疗抵抗,因此需要替代的靶向治疗。例如,OV594簇2可能从TGFβ抑制中受益,因为已证明当SMAD4丢失时TGFβ抑制有效(91),或者从针对簇特异性ESR1扩增的抗体疗法中受益。同样,OV511簇3可能对β-连环蛋白拮抗剂或TTK抑制剂敏感(92, 93)。重要的是,我们在解释这些结果时需要考虑研究的局限性。尽管拷数和突变谱提供了关于肿瘤发生的丰富见解,但表观遗传修饰也很重要,且常常导致卵巢癌中的基因组不稳定性(94)。由于样本材料不足,我们无法研究样本中的表观遗传沉默事件。我们还将突变分析限制在样本和克隆级别,因为聚合覆盖深度为结果提供了更大的可信度。因此,我们没有识别出亚克隆突变,尽管这些突变在与拷数定义的亚簇结合时可以提供有关肿瘤进化的信息。我们的研究支持基因组变异和异质性在卵巢癌肿瘤进展模型中的内在作用。虽然HGSOC是最常与染色体异常相关的EOC亚型,但我们发现CCOC也可能携带复杂的基因组事件。因此,在由染色体不稳定性驱动的癌症中,如EOC,单细胞基因组的检查尤为重要,因为在这些癌症中,生物意义上重要的CNA可能发生在少数细胞群体中。
处理后的单细胞拷数(CN)和ST数据存档在Zenodo上,可免费访问:https://doi.org/10.5281/zenodo.17418856。用于分析单细胞CN数据的代码也可以在该Zenodo记录中获取。原始的Visium ST数据(以BAM文件形式)可通过欧洲核苷酸档案(European Nucleotide Archive)免费获取,访问地址为https://www.ebi.ac.uk/ena/browser/view/PRJEB102074。原始的scWGS数据(以BAM文件形式)存档在欧洲基因组-表型档案(European Genome-phenome Archive)中,访问受控,访问地址为https://ega-archive.org/datasets/EGAD50000002102,访问受Data Access Committee EGAC5000000083的监管,遵循政策EGAP50000000783。
L. Roman报告了来自Global Coalition for Adaptive Research的个人费用。J.D. Carpten报告了David Sands提供的慈善赠款以支持这项研究。其他作者没有报告任何利益冲突。
R. Bassiouni负责概念化、数据管理、软件开发、正式分析、验证、研究、可视化、方法论、初稿撰写、审阅和编辑。Y. Jin负责数据管理、软件开发、正式分析、可视化、审阅和编辑。L.D. Gibbs负责概念化、资源准备、研究设计、方法论。J.钱(Qian):资源、数据整理、调研、方法论
S.O.罗蒂米(S.O. Rotimi):资源、调研、方法论
H.米勒(H. Miller):概念化、资源、数据整理
M.G.韦伯(M.G. Webb):资源、软件、写作与审稿
S.拉杰帕拉(S. Rajpara):形式分析
J.阿里亚斯-斯特拉三世(J. Arias-Stella III):数据整理、写作与审稿
D.W.克雷格(D.W. Craig):概念化、指导
L.罗曼(L. Roman):概念化、资源、数据整理、指导
J.D.卡普滕(J.D. Carpten):概念化、数据整理、指导、资金筹集、写作与审稿
致谢
我们感谢患者的捐赠。本研究项目的资金由大卫·桑兹(David Sands)、南加州大学转化基因组学系以及希望之城贝克曼研究所转化科学综合系提供的慷慨资助。南加州大学妇科组织与液体样本库为该项目提供了技术支持,该库的运营得到了苏珊·佩奇(Susan Page)、托比·佩奇(Toby Page)和珍·理查森博士(Dr. Jean Richardson)的慷慨捐助。项目中的测序工作部分由南加州大学的Keck基因组学平台完成。请注意,本文的补充数据可在《Cancer Research Communications Online》网站上查阅(网址:https://aacrjournals.org/cancerrescommun/)。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号