基于序列相似性识别内源性逆转录病毒来源肽组的生物信息学工具HERVOminer及其在结直肠癌共享新抗原发现中的应用

《npj Precision Oncology》:HERVOminer: a sequence similarity-based approach for recognizing endogenous retrovirus origin of the peptidome

【字体: 时间:2026年03月20日 来源:npj Precision Oncology 8

编辑推荐:

  为解决高同源性的HERV序列导致肿瘤特异性抗原溯源困难的问题,研究人员开展了一项旨在开发生物信息学工具的主题研究。他们开发了基于序列相似性的方法HERVOminer,以精确识别肽段的人内源性逆转录病毒(HERV)起源。该研究通过对15个结直肠癌队列的分析,发现大量表达且广泛共享的、源自HERV的候选TSA,并通过ELISpot实验证实了其免疫原性。该工具的实现为开发新型癌症疫苗等疗法提供了有力支持。

  
肿瘤治疗领域一直在寻找能被免疫系统精准识别的、肿瘤细胞特有的“旗帜”——肿瘤特异性抗原(Tumor-Specific Antigen, TSA)。这类抗原是开发个性化癌症疫苗和免疫疗法的理想靶点。然而,寻找真正的、尤其能在不同患者间“共享”的TSA并非易事。在人类基因组中,潜藏着一类古老的“化石病毒”——人内源性逆转录病毒(Human Endogenous Retrovirus, HERV),它们占人类基因组的近8%。在正常细胞中,HERV通常处于沉默状态,但在多种癌症中,它们会被异常激活并表达。因此,HERV衍生的肽段有望成为一类宝贵的、共享的TSA来源,为开发“现货型”通用癌症疫苗铺平道路。
但这条路充满了荆棘。首要难题是如何在浩如烟海的基因组数据中,准确地将一个肽段“验明正身”,确认它是否真的源自HERV,以及具体来自哪个HERV片段。HERV序列高度同源,像是一本被反复复印、字迹模糊的古老书籍,导致来自不同HERV家族甚至不同位点的序列相似度极高,使得传统的序列比对和溯源工具力不从心。过往的研究也大多聚焦于HERV的长末端重复(Long Terminal Repeat, LTR)区域,而忽略了同样可能编码抗原的其他开放阅读框(Open-Reading Frame, ORF)。这些局限性阻碍了基于HERV的共享新抗原的发现。
为了解决这些关键挑战,一项发表在《npj Precision Oncology》上的研究带来了一个强大的新工具。研究人员开发了一个名为HERVOminer的、基于序列相似性的计算流程。这个工具的核心思想是,它不依赖于简单的、非此即彼的序列映射,而是系统地评估候选肽段与一个预先定义的HERV ORF数据库之间的序列相似性,量化它们的表达水平,从而智能地确定每个肽段最有可能来源的那个表达量最高的HERV片段,并将结果可视化呈现。
为了开展研究,研究者构建了全面的HERV ORF参考数据库。他们利用HERVOminer工具,对来自15个不同的结直肠癌(Colorectal Cancer, CRC)患者队列的质谱(MS)或RNA-seq数据进行深入挖掘,旨在寻找那些源自HERV的候选TSA。接着,他们通过酶联免疫斑点(Enzyme-Linked Immunospot, ELISpot)实验,在体外验证了所发现候选TSA的免疫原性,即其激活T细胞免疫反应的能力。此外,为了展示HERVOminer的广泛适用性,研究还将该工具应用于来自临床前和临床研究的、已发表的HERV衍生肽数据集,并在结直肠癌样本中量化了这些肽段对应HERV片段的表达情况。
本研究主要采用了以下关键技术与方法:首先是构建了全面的人内源性逆转录病毒开放阅读框(HERV ORF)参考数据库,作为溯源分析的基准。其次是开发了基于序列相似性的核心算法(HERVOminer),用于比对肽段序列与HERV ORF,并量化表达以确定最可能的HERV来源。第三,利用来自15个独立结直肠癌(CRC)患者队列的公共基因组与蛋白质组学数据(包括RNA-seq和质谱数据)进行大规模的生物信息学筛选与分析。最后,通过体外酶联免疫斑点(ELISpot)实验对筛选出的候选肿瘤特异性抗原(TSA)进行免疫原性功能验证。
HERVOminer准确识别了HERV衍生的肽段并揭示了其表达模式。通过对15个CRC队列的分析,HERVOminer成功地识别出大量具有HERV起源的候选肽段。与正常组织相比,这些候选肽段对应的HERV ORF在肿瘤组织中呈现出显著更高的表达水平,这表明HERV在癌症中特异性激活的现象具有普遍性。
源自HERV的候选TSA在CRC患者中广泛共享且高表达。研究发现,许多被鉴定出的、源自特定HERV位点的候选TSA在多个患者中共同存在,即具有“共享”特性。并且,这些共享的候选TSA在肿瘤样本中表现出丰度较高的表达,提示它们可能是一类有潜力的、适用于广泛患者群体的免疫治疗靶点。
候选HERV-TSA在体外实验中展现免疫原性。为了验证这些生物信息学预测结果的生物学相关性,研究人员合成了一个候选TSA肽段,并用其进行ELISpot实验。结果表明,该肽段能够有效激活健康供体外周血单个核细胞(Peripheral Blood Mononuclear Cell, PBMC)中抗原特异性T细胞的应答,产生干扰素-γ(IFN-γ),从而在功能层面证实了该候选肽段确实具有免疫原性,能够被T细胞识别。
HERVOminer拓展了对临床研究中HERV肽段基因组起源的认识。当将HERVOminer应用于此前发表的、来自临床前和临床研究的HERV衍生肽列表时,分析结果显示,这些肽段实际上来源于更广泛的HERV基因组区域,而不仅仅是先前认知中的LTR区域。同样,这些肽段对应的HERV片段在CRC肿瘤组织中的表达也显著高于癌旁正常组织,进一步支持了HERV作为肿瘤相关抗原库的潜力。
综合以上研究结果,本研究得出核心结论:HERVOminer是一个高效、精准的生物信息学工具,它克服了HERV序列高同源性带来的溯源挑战,能够系统性地识别肽段的人内源性逆转录病毒(HERV)起源。应用该工具,研究首次在多个结直肠癌队列中大规模地发现了一批高表达且在不同患者间广泛共享的、源自HERV的候选肿瘤特异性抗原(TSA),并通过实验验证了其免疫原性。这不仅证实了HERV是共享新抗原的重要来源,也为基于HERV开发“现货型”癌症疫苗等新型治疗策略提供了直接的靶点线索和强有力的方法学支持。该研究将HERV相关抗原的发现从以往对LTR区域的有限关注,扩展到了整个HERV编码潜能,深化了我们对HERV在肿瘤免疫中作用的理解。HERVOminer已以交互式网页界面和命令行软件包的形式实现,其应用有望加速下一代癌症免疫疗法的开发进程。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号