铜绿假单胞菌黄金标准必需基因数据集的建立及其在Tn-Seq分析中的优化应用

《PLOS Computational Biology》:Introducing gold-standard essential gene datasets for Pseudomonas aeruginosa to enhance Tn-Seq analyses

【字体: 时间:2026年02月10日 来源:PLOS Computational Biology 3.6

编辑推荐:

  本文针对Tn-Seq(转座子测序)分析中缺乏标准化评估体系的问题,首次构建了铜绿假单胞菌的黄金标准必需基因数据集(GOLD_84/GOLD_115),系统评估了TRANSIT2和FiTnEss等主流分析工具的性能。研究发现FiTnEss(FDR模式)对黄金标准基因的识别率达100%,显著优于传统方法。该研究为病原体必需基因鉴定提供了标准化参考框架,将显著提升抗菌靶点发现的可靠性。

  
引言
转座子测序(Tn-Seq)是一种利用转座子突变文库评估特定条件下基因适应性或必需性的高通量技术。该技术通过mariner转座子在胸腺嘧啶-腺嘌呤(TA)位点的随机插入,可构建包含大量突变体的文库。然而,统计方法、生物信息学工具和参数的多样性使得研究人员难以选择最优的分析流程。现有研究的重大局限在于缺乏用于评估分析过程的黄金标准必需基因(EGs)数据集。
结果
数据描述
研究对PA14野生型(WT)和OprD缺陷型(ΔoprD)菌株在LB培养基中培养的6个样本进行测序。通过相关性分析发现样本S6为异常值,最终采用S1-S5样本进行后续分析。
黄金标准必需基因数据集的定义
通过整合10项独立研究的EGs数据,构建了两个黄金标准数据集:包含115个基因的LB培养基特异性数据集(GOLD_115),以及涵盖84个核心基因的跨菌株通用数据集(GOLD_84)。功能注释显示这些基因主要参与大分子合成代谢(47.93%-51.19%)、细胞结构分裂(21.74%-22.62%)等关键生物学过程。
测序比对工具的影响评估
比较bowtie和BWA两种比对工具发现,bowtie在文库质量指标(密度>50%,NZ-mean>50)和黄金标准基因识别率方面显著优于BWA。使用bowtie时,Gumbel、HMM和TTN-fitness方法对GOLD_115的识别率分别为37%、54%和82%,而BWA的识别率均低于10%。
统计方法的性能比较
TRANSIT2的HMM方法(考虑必需基因和生长缺陷基因)对黄金标准基因的识别率达90%,而FiTnEss工具在错误发现率(FDR)模式下实现100%的识别率。FiTnEss_FDR生成的EGs数量(PA14 WT:609个)更符合细菌必需基因的理论比例(10%-15%)。
条件必需基因鉴定方法
通过比较ZINB统计方法和FiTnEss_FDR的交叉分析,发现shaF基因(PA14_RS20600)在PA14 ΔoprD中特异性必需。实验验证证实该基因在OprD缺陷背景下无法敲除,揭示了钠/质子(Na+/H+)逆向转运系统在细菌适应性中的关键作用。
讨论与结论
本研究首次建立了铜绿假单胞菌Tn-Seq分析的标准化评估体系。推荐的优化流程包括:使用bowtie进行序列比对,采用FiTnEss(FDR模式)进行必需基因鉴定,结合ZINB方法分析条件必需性。GOLD_84数据集为不同菌株和研究提供了统一基准,将显著提升抗菌靶点发现的可靠性和跨研究可比性。
材料与方法
实验采用PA14 UCBPP菌株及其OprD缺失突变体,通过接合转移构建转座子文库。测序数据经cutadapt去接头后,分别使用bowtie(v1.1.2)和BWA(v0.7.12)进行比对。必需基因分析采用TRANSIT2(v1.1.7)的Gumbel、HMM方法和FiTnEss工具,显著性阈值设定为p<0.05。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号