《Acta Neuropathologica》:CnQuant: high-resolution chromosomal copy number profiling for precision oncology in the clinics
编辑推荐:
过去十年间,肿瘤DNA甲基化与染色体拷贝数谱的联合分析彻底改变了精准肿瘤学。尽管基于微阵列的标准甲基化组谱分析方法促进了多种机器学习工具的开发,但微阵列衍生的拷贝数(CN)数据的全部临床潜力仍未得到充分挖掘。CnQuant的主要附加价值在于:(1)超越标准的静
过去十年间,肿瘤DNA甲基化与染色体拷贝数谱的联合分析彻底改变了精准肿瘤学。尽管基于微阵列的标准甲基化组谱分析方法促进了多种机器学习工具的开发,但微阵列衍生的拷贝数(CN)数据的全部临床潜力仍未得到充分挖掘。CnQuant的主要附加价值在于:(1)超越标准的静态拷贝数变异(CNV)谱输出,增强了对局灶性CNV的交互式注释;(2)队列水平的CNV频率分析,这对于临床诊断中的合理性检查以及研究应用均具有重要意义。此外,该研究工具提供了交互式用户界面和广泛的参考数据,解决了数据格式不兼容问题,具有低计算需求和高可扩展性。研究人员通过开发CnQuant来解决这些局限性,这是一个交互式Python套件(补充材料图1),用于从DNA甲基化阵列文件中计算CNV并进行基于Web的可视化,显著扩展了公共“EpiDiP”平台。CnQuant是免费软件(开源代码,可在Docker/WSL中本地安装),计算需求低且可扩展性高,有助于在医院环境中进行广泛的临床实施。CnQuant在所有常规甲基化阵列类型和版本中提供了协调的、面向临床的基因组注释,并包含每个覆盖阵列平台所需的所有CN中性参考数据。即时生成的特定病例CN图谱和复发性染色体异常汇总具有统一的图形用户界面(GUI)(补充材料图2、3)。带有保留基因注释的可匿名共享链接能够可视化和讨论潜在的可操作靶点,例如在多学科肿瘤委员会的背景下。可单独检查的基因有助于解释平行测序的变异等位基因频率和模棱两可的拷贝数判读。CnQuant利用了Mepylome;它包括后台服务(CQmanager、CQcalc、CQall_plotter;有关这些组件的详细信息请参阅补充材料)和前台GUI(CQall、CQcase)。CQmanager通过本地REST API协调从甲基化阵列文件开始的数据分析,便于集成到预先存在的数据工作流程中,特别适用于实施本地部署工具以生成以肿瘤学为中心的报告。CQcalc基于性别平衡、阵列类型特异性的参考数据计算CNV,并准备每例CNV图谱。为了最小化负载,数据以压缩、校验和验证的方式存储。CQall_plotter叠加并总结了每个样本队列内各种阵列类型的相交基因组位点上的CN坐标。CQall和CQcase共享一个直观、统一的图形Web界面,用于交互式数据可视化和检查,消除了对生物信息学用户知识的需求。CQall(图1A-D)充当图谱,允许临床医生在参考病例队列中识别复发性CNV。对于合理性检查,其用途扩展到非微阵列领域,特别是(靶向)第二代并行和第三代纳米孔测序结果的解释。为了消除与罕见肿瘤实体相关的缺陷(对于这些实体,通常只有小型参考队列可用,且通常使用多种阵列类型获得),CQall将分析限制在包含所有阵列类型的重叠探针上。这防止了单病例数据与由不同阵列类型编译的参考队列进行无效的、具有诊断误导性的比较。CQcase(图1E-H)允许临床医生即时检查每个个体病例的CNV。可以以高分辨率显示和注释特定的基因座。此类标记基因可能突出显示是否存在可靶向/诊断性基因扩增和缺失(ERBB2、MDM2、PDGFRA;CDKN2A等)。注释图谱可通过Web链接即时交换,例如在跨学科肿瘤委员会期间,并可下载到电子健康记录中。在一项包含4种类型30例脑肿瘤(乳腺癌转移;弥漫性中线胶质瘤,H3K27改变;胶质母细胞瘤,IDH野生型,RTK II;后颅窝毛细胞型星形细胞瘤)的内部验证研究中,表现出肿瘤学相关的CN变化。在155个基因组位点进行了一致性视觉判定。观察到153个位点(98.71%)与通过第二代并行DNA/RNA测序(Oncomine Comprehensive Assay V2, Thermo Fisher 和 Archer? FUSIONPlex? Core Solid Tumor panel; IDTDNA,或Her2荧光原位杂交/免疫组织化学获得的经认证的常规诊断数据相匹配(补充表1)。据研究人员所知,目前没有其他可用的用于甲基化阵列的开源高分辨率CNV探索软件。现有工具(包括Conumee 2.0和SeSAMe)均未提供交互式GUI、即时基因注释、高速和低资源分配(参见补充材料,基准测试章节)。此外,CnQuant无缝集成到泛癌表观遗传谱分析中。因此,研究人员预计CnQuant将通过指导个性化肿瘤护理决策,为精准医学做出重大贡献。
论文《CnQuant: high-resolution chromosomal copy number profiling for precision oncology in the clinics》发表于《Acta Neuropathologica》,介绍了一种名为CnQuant的新型生物信息学工具,旨在解决临床肿瘤学中DNA甲基化阵列衍生拷贝数变异数据分析的瓶颈。
研究背景与问题
近年来,结合肿瘤DNA甲基化和染色体拷贝数谱的分析已成为精准肿瘤学的核心驱动力,基于微阵列的甲基化组分析推动了众多机器学习分类器的诞生。然而,尽管甲基化阵列数据蕴含丰富的拷贝数信息,但其全部临床潜力在临床诊断中仍未得到充分挖掘。现有技术在处理拷贝数数据时面临诸多挑战,包括缺乏交互式注释、难以进行队列水平的频率分析、数据格式不兼容以及现有工具缺乏友好的图形用户界面,导致临床医生难以直接利用这些数据进行诊断和决策。
研究方法与技术
研究人员开发了一个名为CnQuant的交互式Python套件,该工具集成了后台服务(CQmanager、CQcalc、CQall_plotter)和前台图形用户界面(CQall、CQcase)。研究采用了基于性别平衡和阵列类型特异性的参考数据集进行计算,并通过本地REST API实现与现有工作流的集成。关键技术包括使用Mepylome作为底层支持,利用Docker/WSL实现本地化部署以降低计算门槛,并通过统一的GUI设计实现了跨平台数据的协调注释。此外,研究还构建了一个包含多种肿瘤类型(如后颅窝毛细胞型星形细胞瘤、弥漫性中线胶质瘤、胶质母细胞瘤及乳腺癌)的内部验证队列,通过与二代测序及荧光原位杂交等金标准方法进行对比来验证工具的准确性。
研究结果
- 1.
工具开发与功能实现:CnQuant成功实现了从DNA甲基化阵列文件中高效计算拷贝数变异,并提供了CQall和CQcase两个主要界面。CQall作为图谱工具,允许临床医生在参考队列中识别复发性拷贝数变异,支持跨不同阵列类型(如HM450K、EPIC v1/v2)的重叠探针分析,避免了因平台差异导致的误诊。CQcase则专注于单病例的即时检查,支持高分辨率的特定基因座注释,并能生成可匿名共享的Web链接,便于多学科肿瘤委员会讨论。
- 2.
内部验证研究:在对30例脑肿瘤(涵盖4种类型)的155个基因组位点进行的内部验证中,CnQuant与经认证的常规诊断数据(包括二代并行DNA/RNA测序、Archer? FUSIONPlex? panel及Her2 FISH/IHC)相比,显示出98.71%(153/155)的一致性,证明了其高度的可靠性。
- 3.
性能优势:与其他现有工具(如Conumee 2.0和SeSAMe)相比,CnQuant在提供交互式GUI、即时基因注释、处理速度及资源消耗方面表现出显著优势,是目前唯一开源且专为甲基化阵列设计的高分辨率拷贝数变异探索软件。
结论与讨论
研究人员得出结论,CnQuant通过其增强的交互式注释能力和队列水平的分析功能,有效填补了当前甲基化阵列拷贝数分析在临床应用中的空白。该工具不仅解决了数据格式不兼容和计算资源限制的问题,还通过直观的可视化界面消除了临床医生使用生物信息学工具的障碍。CnQuant与现有的“EpiDiP”平台无缝集成,支持泛癌表观遗传谱分析,预期将在指导个性化肿瘤护理决策、辅助分子分型及发现潜在治疗靶点方面对精准医学产生重要贡献。