基于Hi-C接触矩阵与神经网络的结构变异检测新方法VarHiCNet

《Scientific Reports》:A method for structural variant detection using Hi-C contact matrix and neural networks

【字体: 时间:2026年02月06日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对结构变异(SV)检测中Hi-C数据应用存在的准确率低、适用性有限及多类型SV同步识别困难等问题,开发了结合图像化预处理与改进RT-DETR网络的VarHiCNet方法。实验表明其在六种癌细胞系中显著提升SV检测精度,为基因组研究提供高效工具。

  
结构变异(Structural Variations, SVs)作为基因组结构改变的重要类型,在恶性肿瘤等人类疾病的发生发展中扮演关键角色。传统基于测序的SV检测方法虽广泛应用,但在复杂变异类型识别与精确定位方面存在局限。高通量染色质构象捕获(Hi-C)技术通过捕获基因组片段的空间互作信息,为SV研究提供了新视角。然而,现有Hi-C数据分析方法仍面临准确率低、适用性窄及多类型SV同步检测困难等挑战。
为突破上述瓶颈,研究人员在《Scientific Reports》发表论文,提出VarHiCNet——一种基于Hi-C接触矩阵与神经网络的结构变异检测新方法。该方法通过将Hi-C数据转换为图像化表征,结合改进的RT-DETR(Real-Time Detection Transformer)网络实现候选SV区域筛选,再经分类网络完成精准断点定位。在六种癌细胞系的验证中,VarHiCNet展现出优于现有工具的稳定性与准确性。
关键技术方法
研究首先对Hi-C接触矩阵进行标准化与图像化预处理,使其适用于深度学习模型。随后构建双阶段网络:第一阶段采用改进的RT-DETR网络快速识别候选SV区域,第二阶段通过过滤与分类网络精确定位断点。实验使用六种公共癌症细胞系(如MCF-7、K562等)的Hi-C数据作为验证队列,无需额外测序数据辅助。
研究结果
1. 图像化表征提升特征提取效率
将Hi-C接触矩阵转换为灰度图像,有效保留基因组互作的空间分布特征,使卷积神经网络能够捕捉细微的SV信号模式。
2. RT-DETR网络优化候选区域检测
通过引入多尺度特征融合与自注意力机制,改进的RT-DETR网络在保持实时检测速度的同时,对缺失、重复、倒位等复杂SV类型的召回率提升约18%。
3. 过滤-分类网络实现精准断点定位
针对候选区域设计的二级网络进一步降低假阳性,断点检测误差较传统方法平均减少3.2kb,尤其在高噪声数据中表现稳定。
4. 多癌细胞系验证泛化能力
在六种癌细胞系的测试中,VarHiCNet对缺失(Deletion)、重复(Duplication)、倒位(Inversion)等SV的F1分数均超过0.89,显著优于HiCUP、HiC-Pro等工具。
结论与讨论
VarHiCNet通过融合Hi-C空间互作信息与深度学习优势,解决了多类型SV同步检测的技术难题。其图像化处理策略为基因组数据与计算机视觉技术的结合提供了新思路,而模块化网络设计兼顾检测效率与精度。该工具有望应用于临床基因组异常筛查,尤其为癌症基因组结构变异研究提供可靠支持。未来可进一步拓展至单细胞Hi-C数据或跨物种比较基因组学分析领域。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号