非小细胞肺癌(NSCLC)中52基因临床测序面板鉴定的具有潜在意义的同义变异:来自加拿大新不伦瑞克省的队列研究

《Genes, Chromosomes and Cancer》:Synonymous Variants of Potential Significance Identified by a 52-Gene Clinical Sequencing Panel in Non-Small Cell Lung Cancer

【字体: 时间:2026年02月20日 来源:Genes, Chromosomes and Cancer 2.8

编辑推荐:

  这篇来自加拿大新不伦瑞克省的队列研究,利用52基因二代测序(NGS)面板,不仅揭示了当地非小细胞肺癌(NSCLC)患者中KRAS基因突变的高流行率,更发现了一系列在ALK、EGFR、FGFR2/3等关键基因中具有潜在临床意义的全新同义突变。这些变异可能通过影响mRNA剪切、翻译效率等机制,干扰MAPK/ERK和PI3K/AKT等经典致癌信号通路的功能,为理解肺癌的区域基因组学差异及同义变异的致癌潜力提供了新视角,并指出了未来研究方向。

  
引言
在全球范围内,肺癌是癌症相关死亡的主要原因,每年估计造成176万人死亡。在加拿大大西洋省份(新不伦瑞克省、新斯科舍省、爱德华王子岛省),肺癌的发病率和死亡率通常高于加拿大其他地区。这种负担的增加是由多种因素驱动的,包括人口老龄化、吸烟率较高,以及环境中氡和砷等职业性肺致癌物的暴露增加。非小细胞肺癌(NSCLC)占所有肺癌的85%,是最普遍的亚型。加拿大的护理标准是筛查所有非鳞状NSCLC,以寻找可操作的突变,从而指导个体化治疗。大多数对NSCLC遗传驱动因素的研究都集中在非同义突变上,即导致编码蛋白序列改变的突变。然而,近期证据表明,同义突变——存在于蛋白质编码DNA区域但不导致编码蛋白序列改变——也可能像已知的非同义驱动突变一样具有致癌影响。这些新兴证据拓宽了我们对肿瘤发生的理解,强调有必要重新评估同义突变在癌症生物学中的功能意义。尽管蛋白质形式没有发生变化,但同义突变可通过影响mRNA翻译的速度和准确性、折叠及剪接来影响基因产物的可用性和效率。目前,对肺癌乃至更广泛癌症中同义突变的流行程度及其可能的临床意义研究不足。先前研究肺癌靶向测序面板的研究主要集中于已确立的驱动和临床可操作的突变,而没有检验这些面板生成的丰富额外测序数据。同时,关于大西洋加拿大地区出现的NSCLC病例基因组特征的数据也很缺乏。
材料与方法
本研究回顾性分析了2019年1月至2023年1月期间在加拿大新不伦瑞克省圣约翰地区医院使用Oncomine Focus 52基因NGS面板进行测序的非小细胞肺癌(NSCLC)患者(n=353)的基因组数据和临床结局。该研究获得了伦理委员会批准,并因研究的回顾性性质以及仅发布汇总和匿名数据而放弃了患者同意。研究纳入了所有非鳞状NSCLC标本。从患者电子病历中收集了临床变量,包括性别、护理地点、癌症诊断和分期、基因面板检测到的变异、接受的治疗、诊断年龄、吸烟史、总生存期(OS)长度和无进展生存期(PFS)长度。测序由圣约翰地区医院病理科分子诊断和细胞遗传学部进行,使用IonTorrent Oncomine Focus Assay(ThermoFisher Scientific)这一NGS平台进行分析。分析采用了仅肿瘤测序方法。使用的分析工具包括Ion Reporter 5.6及其工作流程,后续升级为5.18版本。该测序覆盖了52个与癌症相关的基因,用于单核苷酸变异(SNV)和拷贝数变异(CNV)检测。生成了原始测序文件、二进制比对图(BAM)文件和变异调用格式(VCF)文件。分析从临床服务器收集的VCF文件开始。所有基因组数据均通过为每位患者分配随机生成的6位标识符进行去标识化处理。使用CrossMap(v0.6.6)将VCF文件从参考基因组GRCh37转换为GRCh38组装。使用bcftools(v1.8)对VCF进行分解和标准化。使用Ensembl的VEP(发布版111)为每个变异转录本添加额外注释,并使用了四个插件:dbNSFP(v4.6)、dbscSNV(v1.1)、SpliceRegion(v2.0)和SpliceAI(v1.3)。对于致病性预测,使用了CScape和TRaP(v3.0)的网络接口。选择NCBI和EMBL-EBI的匹配注释(MANE)转录本进行注释和预测变异效应。为了去除人群相关变异,去除了基因组聚合数据库(gnomAD)中等位基因频率大于0.5%的常见单核苷酸多态性(SNP)。考虑到研究的探索性质,通过去除变异等位基因频率(VAF)为50%或95%–100%的变异(除非该变异在COSMIC中有注释)来保守地过滤掉胚系变异。对在队列中出现率>20%或被发现对生存有显著影响的任何变异,使用Broad Institute的集成基因组学浏览器(IGV)进行审查,以识别可能表明变异是人为产物或多态性的任何特征。
结果
共有353名患者被纳入研究。9名图表信息不完整的患者被排除在人口统计学分析之外,但被纳入基因组分析。诊断时年龄范围为28至89岁,平均年龄为68±8.5岁(标准差)。女性在队列中略占优势(52.90%)。队列中NSCLC患者最常见的三种亚型是腺癌(72.97%)、鳞状细胞癌(17.73%)和低分化NSCLC(6.69%)。大多数患者在TNM I期(38.1%)或IV期(36.3%)被诊断。最常见的治疗方式是放疗、手术切除和化疗。大多数患者为既往吸烟者(49.56%)或当前吸烟者(37.90%)。截至数据收集时,63.7%(n=219)的患者已达到无进展生存期(PFS)终点。其中,43.9%(n=155)的患者出现疾病进展,48.7%(n=168)的患者死亡。在纳入基因组分析的353名患者中,62.3%的患者至少有一个临床报告的非同义变异,受影响患者平均每人约有一个变异(1.26±0.64)。这与先前研究一致,先前研究表明约60%的腺癌中发现了驱动突变。通过DNA测序检测到的最常见的临床报告变异发生在KRAS、PIK3CA和BRAF基因中。通过RNA测序检测到的变异中,MET外显子14跳跃、AR扩增和EGFR扩增最为普遍。与现有文献相比,本队列中KRAS G12V亚型的流行率高出约10%。截至提交时,共识别出311个新的——定义为在文献、COSMIC或ClinVar中未确立与NSCLC相关的——变异;这些变异在队列中共发生了366次,每名患者至少拥有一个。在这311个变异中,53个是同义变异,这些变异在45名患者中共发生了67次。其中两个同义变异——一个在BRAF中,一个在NRAS中——属于队列中最普遍的10个独特变异,发生在12名患者中。在353名患者中,148名(41.9%)至少有一个新变异。在所有新变异调用(n=364)中,VAF范围从0.025到0.8905(平均0.1980±0.2037)。对于在多个患者中观察到的反复出现的新变异,VAF在个体之间存在差异。队列表现出相当大的多样性,大多数患者携带单一变异。三名患者拥有非常多的变异,分别识别出99、31和25个新变异。
接下来,使用SpliceAI来探究这些新变异对剪接位点的潜在影响,并识别出25个同义变异。FGFR3中的G到A替换(chr4:1804418 G>A, n=1)最有可能影响剪接,其受体丢失分数为0.44,这表明该替换可能阻止剪接过程中受体位点的正常识别和使用。下一个最有可能影响剪接的同义变异是MYC中的C到T替换(chr8:127738274 C>T),其供体丢失分数为0.19,略低于推荐阈值。与受体类似,供体丢失表明该变异可能阻止剪接过程中供体位点的正常功能。FGFR3突变和MYC突变均未与各自基因中已确立的临床报告变异同时发生。接下来使用CScape来识别潜在的致癌突变。CScape为每个SNV分配一个概率分数,表示该变异与癌症相关且具有致病性的可能性。CScape分数范围从0到1,分数越高表示模型估计该变异作为致癌驱动因素的可能性越大。识别出五个同义变异具有潜在的致癌性,每个都有较低的置信度分数,表明这一结果需要进一步验证和研究。被CScape识别为潜在致病性的NRAS变异是队列中最普遍的10个变异之一。使用的第二个算法是转录本推断致病性(TRaP)分数。与CScape类似,TRaP分数范围从0到1,分数越高表示变异破坏转录本结构或功能的可能性越大,因此具有更高的致病潜力。识别出11个变异具有大于0.100的TRaP分数。两个变异——一个在SMO中,另一个在FGFR3中——具有非常高的分数(约0.400),表明极有可能是致病的。所有其他变异的TRaP分数都在较低的0.100范围内。使用的最终预测分数是组合注释依赖缺失(CADD)分数。分数越高表示变异具有功能意义且可能有害的可能性越大。CADD分数可以以对数尺度表示,通常称为CADD Phred-like分数。作者推荐使用排名系统而非硬性阈值。CADD Phred-like分数为10或更高,表示分析的变异被预测为人类基因组中最有害的10%替代之一。识别出20个同义变异的CADD Phred-like分数为10或更高;这包括使用CScape识别为潜在致癌的四个变异。CADD Phred-like分数最高的变异是FGFR3中的G到A替换。
然后,将CScape、TRaP和CADD识别为潜在致病性的变异,根据识别它们为潜在致病性的预测工具的数量和类型分为四类。这一分类策略旨在整合上述算法和数据库的信息,允许多点决策方法,而非依赖单一预测工具。没有变异在队列中的流行率高到足以在统计学上评估其对生存的影响。将1-3类中的变异根据受影响的信号通路进行分组。富含新变异最多的通路是MAPK/ERK和PI3K/AKT,每个通路总共有四个变异,每个变异在队列中出现一次。
讨论
我们的队列在某些方面与西方世界非鳞状NSCLC患者的总体人群相似,这些患者的肿瘤被建议作为其护理的一部分进行测序。该队列的人口统计学特征在亚型、诊断平均年龄和治疗方式方面与国家和国际统计数据一致。该队列也有一些显著的独特特征。与观察到的全国NSCLC发病率相比,该队列女性比例略高于预期,这可能反映了腺癌比例的增加,无论是在女性NSCLC患者中,还是在接受临床护理测序的病例中。由于我们的机构是胸外科转诊中心,该队列也过度代表了早期NSCLC患者。接受肿瘤切除的患者可用于测序的组织量更高;因此,有些晚期疾病患者因为没有足够的组织而未接受NGS,这进一步丰富了该队列中早期疾病患者的比例。最后,在研究期间的部分时间里,我们机构正在对鳞状NSCLC进行常规测序,而这在当时并非护理标准;这为我们评估鳞状肿瘤中的同义突变提供了机会。
本研究采用仅肿瘤测序方法进行,这反映了当前许多临床诊断环境中的常规实践,在这些环境中,匹配的正常组织并不总是可用的。虽然仅肿瘤测序能够实现高效且具有临床可行性的基因组分析,但它不允许明确区分体细胞变异和胚系变异。因此,检测到的一些变异可能代表胚系改变,而非真正的肿瘤获得事件。为了缓解这一局限性,使用人群和等位基因频率对变异进行了评估,如方法中所述。我们的队列在常见基因组变异的发病率方面也与已发表的数据存在一些差异。队列中最常见的DNA突变是KRAS(35.12%)、EGFR(9.07%)、PIK3CA(4.82%)和BRAF(4.53%)。我们队列中KRAS突变的流行率在数值上高于其他已发表的队列。这凸显了研究癌症基因组学区域差异的价值,并可能反映了我们地区较高的吸烟率,因为KRAS突变与吸烟密切相关。队列中PIK3CA突变和BRAF突变的低流行率与文献一致。
我们在同义变异方面的一些发现值得注意。一个同义变异,即BRAF基因中的A到G转换(chr7:140801453),被观察到了八次。该变异在现有数据库或已发表文献中均未找到。这个特定的变异发生在编码BRAF蛋白锌指结构的区域,位于保守区域1(CR1)内。在非活性状态下,CR1抑制B-Raf的激酶结构域。激活后,Ras与B-Raf的Ras结合结构域结合,释放这种抑制。然后,锌指促进B-Raf与膜的结合,在那里它们与脂质结合,帮助B-Raf定位到特定的膜区域。这种定位对于B-Raf在信号通路中的激活和功能至关重要。同义突变可能影响mRNA稳定性或翻译效率,导致蛋白质表达水平的变化。在BRAF的案例中,蛋白质表达的改变可能会失调MAPK/ERK信号通路,导致细胞增殖失控;需要临床前功能研究来探索这一假设。
对具有预测剪接影响的同义变异进行分析,识别出一个变异:FGFR3基因内的G到A转换(chr4:1804418)。尽管该变异未出现在ClinVar中,但它从SpliceAI获得了显著的受体丢失分数,表明可能破坏剪接受体位点。FGFR3编码成纤维细胞生长因子受体3,这是一种跨膜受体酪氨酸蛋白激酶,对调节细胞增殖、分化和凋亡至关重要。FGFR3参与MAPK/ERK和PI3K/AKT通路,在这些通路中它招募蛋白质以分别激活RAS和PI3K。该变异位于编码免疫球蛋白样结构域的外显子和编码蛋白激酶结构域的外显子之间。剪接受体位点的丢失可能导致异常的剪接模式,从而产生替代的mRNA亚型。这些亚型可能缺乏编码激酶结构域的序列,或者包含破坏其正常结构或功能的插入/缺失。影响该区域剪接的变异可能导致FGFR3功能异常,理论上会导致异常的细胞增殖和凋亡,这是癌症的关键特征。
一个可能的预测致病性变异也是最普遍的10个变异之一。该变异是NRAS中的T到C转换(chr1:114713886),在队列中出现了四次。该变异发生在蛋白质效应区域之外的螺旋结构中。该变异位于效应区域附近,表明它可能影响mRNA二级结构或对翻译或蛋白质折叠重要的调控元件。理论上,该区域mRNA的结构改变可以基于mRNA的二级结构来稳定或去稳定mRNA。如果mRNA被稳定,这通常会增加mRNA的细胞浓度,因为它减慢了降解速率。增加的细胞浓度可能导致蛋白质表达增加,这可能引起下游信号通路(如MAPK/ERK通路)的过度激活,促进不受控制的细胞增殖、存活和转移。
在MAPK/ERK和PI3K/AKT通路中涉及的基因中发现了几个新变异,即ALK、FGFR2、FGFR3和EGFR。PI3K/AKT通路调节细胞存活并抑制凋亡,而MAPK/ERK通路调节与增殖、分化和存活相关的基因表达。
与FGFR3类似,FGFR2基因编码一种跨膜受体酪氨酸蛋白激酶,但在各种组织中表达更广泛。识别出的同义FGFR2变异(chr10:121515246)是G到A转换替换。与FGFR3变异类似,该变异发生在编码与细胞外区域蛋白质直接相互作用的免疫球蛋白样区域的区域和蛋白激酶结构域之间。该变异预计不会改变剪接。这种变异可能产生影响的方式之一是通过密码子使用偏好。如果该变异将一个密码子更改为细胞中较少使用的密码子,可能会减慢翻译速度或导致提前终止,可能影响蛋白质折叠和功能。或者,它可能导致一个细胞中更常用的密码子。无论哪种情况,mRNA的下调或上调最终都可能直接或通过代偿性上调导致表达增加。与FGFR3类似,FGFR2中可能导致蛋白质功能异常的变异理论上会导致异常的细胞增殖和凋亡,这同样是癌症的关键标志。
另一个由三个致病性预测分数支持但没有显著剪接影响分数的同义变异是ALK基因中的G到A转换(chr2:29213992)。ALK基因编码一种跨膜受体酪氨酸激酶,与FGFR家族类似,启动MAPK/ERK和PI3K/AKT通路中的信号级联。该变异发生在编码蛋白激酶结构域的基因区域。与FGFR家族中的变异类似,该区域的变异可能通过密码子使用偏好(例如导致蛋白质截短)改变mRNA二级结构,可能影响ALK蛋白激酶结构域的翻译效率。
四个变异中的最后一个在EGFR基因中,该基因编码表皮生长因子受体,一种跨膜受体酪氨酸激酶。与许多酪氨酸激酶一样,EGFR在配体结合后发生二聚化并自磷酸化,导致衔接蛋白的募集和MAPK/ERK及PI3K/AKT信号级联的启动。该变异——G到A转换——发生在编码蛋白激酶结构域的区域。与ALK中的变异类似,该变异也没有预测的剪接影响。该变异的可能影响与上述ALK相似。
尽管队列规模有限有其缺点,但也存在显著优势。作为一个较小的省份,仅有两个胸外科和放射肿瘤学转诊中心,本研究能够捕捉到新不伦瑞克省相当大一部分人口,而不仅仅是居住在圣约翰市的患者。这包括可能与城市居民环境暴露不同的农村患者。氡和其他环境暴露在肺癌发展中的作用在加拿大尤其令人关注。与瑞典——一个吸烟率和生活条件相似的国家——相比,加拿大的年龄调整后肺癌年发病率更高。氡和砷等环境致癌物尤其令人关注,特别是在大西洋加拿大地区,那里超过40%的人口生活在农村,远高于全国平均17.8%的水平。农村居民的平均住宅氡水平可能比城市居民高出31.2%,部分原因是水井作为氡暴露的通道。砷在大西洋加拿大地区也异常丰富。氡和石棉等环境致癌物是遗传毒性的——它们直接损伤DNA或引起遗传改变,通过与烟草烟雾相关的机制不同的机制促进癌症发展。我们推测,这可能导致我们地区NSCLC的突变谱与其他地区不同,这说明了研究世界各地肺癌生物学差异的价值。
我们提供了一份同义变异列表及其相关的预测剪接影响和可能的致病性。尽管靶向治疗是一个重大突破,但仍存在需要改进的领域。由于疾病的异质性,许多患者没有可用的靶向疗法。我们建议进一步的工作应集中在I、II和III类中的九个变异上;特别是那些涉及MAPK/ERK和PI3K/AKT通路的变异。MAPK/ERK和PI3K/AKT通路尤其值得注意,因为它们在细胞生长和存活中起关键作用,而这些是癌症进展中的关键功能。通过探索同义突变的作用,有可能增强我们对癌症生物学的理解,并可能导致治疗和患者管理的新策略。
结论
KRAS是来自加拿大新不伦瑞克省圣约翰的该队列中最常见的突变,其流行率高于其他人群的报道。鉴定出几个新的同义变异,包括ALK、EGFR、FGFR2、FGFR3、MYC、NF1、NRAS和PIK3CA中的变异,这些变异可能对MAPK/ERK和PI3K/AKT信号传导产生影响。这些发现表明NSCLC基因组学存在区域差异,并支持进一步研究同义变异在疾病进展中的作用。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号