
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ViralQuest:一款用户友好的交互式工具,用于病毒序列的分析与整理
《BMC Bioinformatics》:ViralQuest: a user-friendly interactive pipeline for viral-sequences analysis and curation
【字体: 大 中 小 】 时间:2026年02月24日 来源:BMC Bioinformatics 3.3
编辑推荐:
病毒高通量测序数据分析存在技术挑战,需标准化流程和自动化工具。ViralQuest通过整合Diamond BLASTx、pyHMMER等多数据库比对,结合ICTV命名规则和Pfam功能注释,实现病毒序列自动化分类与可视化分析,并利用AI生成报告,提升研究效率。
高通量测序(HTS)已成为病毒学中识别已知和新型病毒的重要且无偏的工具。然而,分析HTS生成的大型复杂数据集面临重大的生物信息学挑战。从组装好的contigs中准确识别和表征病毒序列的过程仍然是一个瓶颈,通常需要专门的知识,并涉及非标准化的参数。因此,迫切需要开发出稳健、用户友好且可复制的流程来简化这一组装后的分析工作。
为了解决这些挑战,我们开发了ViralQuest,这是一个生物信息学工具,它可以自动化地对预组装contigs中的病毒序列进行深入表征。该工具整合了多种证据来源以实现稳健的识别:使用Diamond BLASTx与Viral RefSeq数据库进行比对,以及使用pyHMMER在RVDB、Vfam和eggNOGprofile HMM数据库中进行搜索。对于详细的表征,ViralQuest基于ICTV命名法进行分类,并通过Pfam结构域分析进行功能注释。ViralQuest的新特性包括一个由AI驱动的总结模块,该模块利用大型语言模型(LLM)为关键病毒发现生成上下文叙述;同时还有一个综合的置信度评分来对潜在的病毒contigs进行排序。所有结果都被整合到一个交互式的HTML报告中,其中包含contigs、开放阅读框(ORFs)和蛋白质结构域的动态可视化展示,以及可导出为TSV和SVG格式的详细数据表。
ViralQuest为病毒宏基因组数据的组装后分析提供了一个易于使用且全面的解决方案。通过结合严谨的生物信息学方法、新颖的AI驱动功能以及直观的报告界面,它简化了复杂的病毒识别和表征过程。该工具提高了结果的可解释性和可靠性,使更广泛的科研社区能够更容易地进行深入的病毒组分析。ViralQuest可在GitHub上获取,地址为:https://github.com/gabrielvpina/viralquest/。