《PLOS Computational Biology》:Fast hospital discharge rates blur within-hospital ‘transmission footprint’ in bacterial genomes, as showcased with Staphylococcus aureus
编辑推荐:
这篇模拟研究探讨了在快速出院的背景下,如何利用全基因组测序(WGS)和系统发育动力学(phylodynamics)方法,精准追踪和分析金黄色葡萄球菌(S. aureus)等细菌病原体在医院与社区之间的传播动态。研究通过建立两隔室(医院H/社区C)随机模型,使用MASTER工具模拟疫情传播树,并基于BEAST2平台的bdmm和bdsky模型进行贝叶斯推理。核心发现是,当医院内传播率与出院率相近时,院内和社区传播率都能被准确估计;而当院内传播率显著低于出院率,或采样仅限于医院时,对院内传播动态的量化会变得困难且易产生偏差。因此,研究强调,为了获得可靠的院内传播率估计,必须在分析中纳入来自社区的基因组数据,以避免对医院内传播(βH)的严重低估或误判。
引言
在病原体爆发分析中,特别是医院环境下的分析,基因组数据具有巨大潜力。全基因组测序已成为医院感染(nosocomial)爆发管理的重要工具,并有助于选择合适治疗方案以避免耐药病原体的选择。此外,WGS数据使得对病原体爆发的系统发育动力学分析成为可能。该领域利用病原体进化与宿主间流行病学事件发生在同一时间尺度的事实。尽管系统发育动力学在揭示病毒传播性、流行病学和空间扩散方面提供了深刻见解,但这种方法在细菌病原体上的应用较少。细菌不同的疾病动力学(如大量无症状定植者)和相对较慢的替换率,被认为是细菌系统发育动力学面临的挑战。然而,研究表明,当获得全基因组序列时,细菌爆发也可以使用系统发育动力学进行研究。
区分医院内传播与周围社区传播,是阐明细菌病原体种群结构的系统发育动力学推断重要性和困难性的一个典型案例。一方面,确定病原体是在医院获得还是外部输入至关重要。另一方面,由于从医院到社区的快速出院率,以及许多感染是由致病共生菌引起的(意味着只有一小部分定植者会出现症状并被症状引导的筛查程序检测到),量化每种环境中传播的相对重要性具有挑战性。
本研究以金黄色葡萄球菌为例评估这些挑战。金黄色葡萄球菌既是常见的共生菌,也是主要的人类病原体,在健康个体和免疫功能低下个体中均可引起感染。本研究是一项模拟研究,假设我们追踪一个在醫院和社区交界处传播的单金黄色葡萄球菌谱系,并在一系列场景中研究,从医院和社区或仅从医院采样的全基因组数据,是否允许我们正确估计相应的传播率。
方法
- •
细菌感染动力学
模拟研究的基础是一个简单的随机感染模型,涉及两个种群:医院(H)及其周围社区(C),它们通过患者入院和出院相连。新感染以医院内传播率(βH)和社区内传播率(βC)发生。两个种群之间的迁移率基于苏黎世大学医院已知的入院率(ω)和出院率(γ)。模拟考虑了三个主要场景:(1) 医院驱动传播率,(2) 相等传播率,以及 (3) 社区驱动传播率。对于所有场景,假设医院采样率对应20%的采样比例(sH)。对于社区,假设了三种不同的采样率,对应社区采样比例(sC)为0.0001、0.001和0.01。使用MASTER为每个场景模拟了100个医院感染爆发基因组。此外,还考虑了一个特殊案例,即基因组数据仅来自医院。随后,为所有场景模拟了长度为2.6 Mb的核苷酸序列,模拟金黄色葡萄球菌核心基因的累计长度。使用HKY替换模型(转换/颠换比κ=4.04)和严格分子钟模型模拟系统发育树分支上的基因组进化。
- •
传播率的贝叶斯推断
为了测试是否能从模拟的爆发中恢复真实的传播率,将生成的模拟基因组序列在贝叶斯MCMC框架BEAST2 v2.6.2中进行分析。BEAST2软件包bdmm允许在上述两隔室模型下进行推断。传播动态通过社区内传播率(βC)和医院内传播率(βH)以及变得不具有传染性的速率(δ)一起与系统发育树联合重建。此外,还通过使用社区和入院再生数(RC和 RA)的参数化来推断传播动态。对于仅对医院病例进行采样的场景,使用了bdsky模型。在两种模型中,都假定基因组树是传播树的良好近似。
结果
本研究旨在利用模拟的医院环境中金黄色葡萄球菌爆发,调查医院感染爆发的细菌基因组是否可用于推断医疗环境中细菌病原体的传播动态。在三个主要场景下模拟了随机传播动态,假设了医院驱动、相等或社区驱动的传播率。使用模拟数据集,研究了两种群(医院和社区)或单一种群(仅医院)的出生-死亡模型在恢复流行病学数量方面的表现。通过评估准确性和精确度来评估模型性能。
在医院驱动场景中,医院内的真实传播率与出院率相同(即HDT(b))或相对接近(HDT(a)和HDT(c)),因此远高于社区内的传播率。在这些情况下,医院传播率可以从模拟序列中很好地恢复。此外,社区传播率推断良好,特别是当医院传播率略低于出院率时(场景HDT(a),其中βH< γ)。在相等传播场景中,社区传播率估计良好,但医院的传播率估计不佳。尽管推断的医院传播率估计准确,但95%最高后验密度区间很大,并且估计值严重偏向更高的传播率。实际上,估计的中位医院传播率高于估计的中位社区传播率。然而,当考虑到入院再生数RA远低于1时,定性机制被正确推断。
在社区驱动场景中,社区传播率估计良好,但较低的医院传播率的估计存在高度偏差。同样,在所有采样方案中,中位医院传播率高于中位社区传播率。
当仅从医院内采样时,对于医院驱动和相等传播场景,医院传播率被显著低估。此外,对于社区驱动场景,如果医院内的采样比例已知,则βH的中位估计值有些低估。然而,如果sH未知,推断出的医院传播率反映了社区内的传播动态,即βH被高估。
除了传播率,还评估了推断的社区和入院再生数RC和RA的准确性。当社区和入院再生数几乎相等时,这两个量都相对较好地估计。然而,当RA显著高于RC时,只有RA被准确推断。相反,对于社区再生数远大于入院再生数的场景,RC被精确估计,而RA的中位估计往往被高估。
原则上,社区中被采样感染人群的比例似乎对传播率估计只有边际影响,只要样本中包含来自社区的细菌基因组。对于大多数场景,不同采样方案之间没有发现显著差异。虽然结果在社区采样比例方面似乎相当稳健,但应注意这仅适用于至少有部分感染个体在医院环境外被采样的情况。仅从医院采样会导致医院传播率的严重偏差,因此医院的样本应始终与来自周围社区的基因组数据一起分析。
讨论
医院细菌菌株的全基因组测序对于菌株鉴定和爆发调查尤为重要,并且正在成为许多医院常规疾病监测的一部分。系统发育动力学领域在过去二十年发展迅速,产生了可以阐明各种背景下多种病原体传播动态的方法。医院感染爆发需要迅速控制或完全避免,因为住院患者通常免疫功能低下,因此特别容易感染传染病。一旦流行率很高且感染已牢固确立,疫情控制和遏制通常更加困难。因此,确定在医院观察到的感染在多大程度上是由医院内或社区内的传播引起的至关重要。在这项研究中,我们模拟了一系列场景下的合成细菌序列,以研究系统发育动力学分析对医院细菌爆发的潜力。假设医院入院和出院率与瑞士苏黎世大学医院观察到的相同,我们的结果表明,在相对简单的、具有非常高的医院内传播的金黄色葡萄球菌类场景中,医院和社区内传播动态的系统发育动力学推断效果良好。
然而,在医院内传播率较低或中等的情况下,很难将医院内的传播动态与社区内的传播动态区分开来。如果医院内传播率与社区传播率一样低或更低,则对前者的估计会导致严重偏差。在这种情况下,这种偏差伴随着较大的95% HPD区间,表明由此产生的少量合成医院序列不足以高精度地估计医院传播率。尽管我们预计如果测序的医院基因组比例接近100%,这种偏差会消失,但在大多数现实世界中实现这一目标成本非常高且不现实。此外,对于入院和社区再生数高度不同的场景,可以观察到类似的趋势,并且再生数估计值高于真实值,特别是对于再生数较低的种群。然而,应该注意的是,尽管绝对值被高估,但高RC和低RA(即社区中自我维持的传播,但医院中没有)的定性机制在每个场景中都得到了正确推断。尽管如此,试图对真实数据进行等效分析的研究人员需要仔细评估估计参数的后验分布和相应的95% HPD区间。当仅获得点估计时,存在错误地得出医院内传播驱动爆发的结论的危险,例如,在假设相等传播率的场景中。如果仅评估传播率的中位估计,则动态似乎主要由医院内传播主导,而实际上,βC和βH的后验分布在很大程度上重叠,这应被解释为缺乏证据表明两种环境之间存在不同的动态。
当将采样过程仅限于医院病例时,对于医院驱动和相等传播场景,医院传播率被显著低估。此外,对于社区驱动场景,如果医院内的采样比例已知,则βH的中位估计值有些低估。然而,如果sH未知,推断出的医院传播率反映了社区内的传播动态。总的来说,这表明医院动态的模式被传播树中所包含的社区传播的强烈信号所取代。在非结构化的系统发育动力学模型中考虑患者进入医院的速率,对于当前可用的方法来说并不明确。对于仅医院的系统发育动力学分析,更好的方法仍然是未来工作的一个挑战。
这项工作有几个局限性。一个关键限制是我们只关注单一病原体金黄色葡萄球菌,模拟旨在反映其特定的传播动态。虽然类似的方法可以扩展到其他临床相关细菌,但这需要针对特定病原体的模拟框架,以考虑进化流行病学特性的差异。此外,我们只模拟“核心基因组”,尽管对质粒等可移动遗传元件的分析可以进一步深入了解医院感染传播动态。我们使用指数分布,这可能导致非常短的世代时间。最后,医院中的人群动态在我们的模型中得到了简化,因为我们既没有考虑医院内的人群结构,也没有考虑出院时间的变化性。此外,尽管医护人员和访客可能促进医院和社区之间的传播,但这些途径并未包含在我们当前的模拟框架中。通过不包括易感人群隔室,隐含地假设了无限大的易感人群,这对于社区层面的传播动态是合理的,但对于医院环境则不然,因为易感个体的数量受到患者和工作人员总数的限制,这可能会影响传播动态和潜在的爆发规模。
另一个有前景的研究方向可能涉及使用系统发育动力学来评估外部因素对疾病传播的影响。这种方法可能有助于深入了解环境因素(例如在检测到初始细菌感染后在医疗机构实施严格的控制策略)如何影响周围社区内的疾病传播。然而,具有额外复杂性的稳健系统发育动力学分析(例如测试干预措施的影响)将需要比目前可用的更大的经验数据集。
随着未来几年细菌基因组数量的增加,我们的研究为其解释提供了一些指导方针。我们的结果表明,基于全基因组测序的系统发育动力学方法可以提供医院及其周围社区细菌病原体传播动态的准确估计。对医院内患者动态以及社区内传播动态的良好理解,对于医院内细菌爆发的系统发育动力学分析至关重要,因为许多与医院感染爆发相关的感染由于快速出院率而不会在医院内被观察到。因此,在系统发育动力学分析中纳入来自周围社区的细菌基因组至关重要,即使其主要目标是量化医院内传播。这可以通过入口筛查和纳入废水监测的基因组数据相结合来促进。