《Microbiology Spectrum》:Bioinformatic identification of lentivirus transfer plasmid contamination causing false-positive HIV NAT results in a high-throughput molecular screening laboratory
ABSTRACT
血液筛查项目需要超灵敏的高通量聚合酶链反应(PCR)来确保血液制品中不含病原体,以保障受血者的安全。本文详述了一项调查:一个使用高通量多病原体核酸检测(NAT)进行筛查的实验室,其样本开始出现异常高的HIV假反应率。NHS血液与移植中心(NHSBT)通常每年最多出现10例HIV反应性样本,但此次在短短几天内激增至超过100例。对原因的调查势在必行,以防再次发生。分析仪和试剂问题被排除,环境拭子采样显示实验室存在广泛污染,392个拭子中有356个检测呈阳性。我们展示了如何利用扩增子新一代测序(NGS)和定制生物信息学方法,从提取的假阳性样本中区分预期扩增子、PCR产物及污染物序列。我们的调查能够将污染源追踪到一个意想不到的来源——一种含有HIV-1长末端重复(LTR)区域的慢病毒转移质粒,来自邻近的实验室。这一事件揭示了源自HIV的慢病毒载体导致假反应性的风险,在接受慢病毒载体作为基因或嵌合抗原受体T细胞(CAR-T)疗法一部分的患者中也观察到了类似情况。污染物的性质意味着它对献血者、受血者或工作人员没有风险。然而,它也证明了质粒生产厂房的设施设计和操作对于防止此类污染物的扩散和避免意外下游后果(如筛查实验室遇到的这种情况)的极端重要性。
IMPORTANCE
本文描述了发生在一个至关重要的高通量筛查实验室的大规模污染事件,导致HIV筛查结果阳性数大幅激增。我们描述了使用NGS和定制生物信息学方法,使我们能够识别出意想不到的污染源——一种含有HIV-1长末端重复(LTR)区域的慢病毒转移质粒,正在邻近的实验室生产。这一事件凸显了源自HIV的慢病毒载体导致假反应性的风险,在接受慢病毒载体作为基因或嵌合抗原受体T细胞(CAR-T)疗法一部分的患者中也观察到类似情况。污染物的性质意味着它对献血者、受血者或工作人员没有风险。然而,它也强调了质粒生产设施的设计和操作对于防止此类污染物扩散和避免意外下游后果的极端重要性。
INTRODUCTION
高通量筛查在传染病诊断、确保血液安全和监测公共卫生方面发挥着越来越重要的作用。在献血中,献血者筛选和检测被用作风险降低策略的一部分。高通量核酸检测(NAT)和血清学筛查都用于识别病原体和预防经输血传播的感染。在英格兰,NHS血液与移植中心每年筛查超过一百万份献血。这包括对HIV-1和HIV-2核糖核酸(RNA)、丙型肝炎病毒(HCV)核糖核酸和乙型肝炎病毒(HBV)脱氧核糖核酸(DNA)的核酸检测,目前使用罗氏Cobas 6800/8800平台上的罗氏Cobas MPX检测进行。在NHSBT的典型年份中,平均有10个样本在该检测中呈HIV核糖核酸反应性。其中,5-10个随后通过额外测试确认为献血者的真实HIV感染。其余未确认为真阳性的反应性样本被视为假反应性。假反应性的原因未知且未进一步调查,因为所有HIV反应性献血,无论是否确认,都会从血液供应中剔除。
高通量核酸检测的大规模性质带来了挑战,包括假阳性和交叉污染。污染可能具有高度持久性,并容易通过空气气溶胶和接触点传播,一旦发生,就难以管理和消除。有效的控制通常需要经过深思熟虑的工作流程,包括分隔的空间和工作人员、使用强力漂白剂溶液和紫外线进行广泛去污,以及增强工程控制以防止再次发生。确定污染源对于防止再次发生很重要,但可能具有挑战性,并且通常极难确定,尤其是在复杂的研究或诊断环境中,周围有多个实验室生产和分析扩增子。
NHSBT的这种高通量筛查的脆弱性在2023年6月和2024年1月得到了证明,当时在很短的时间内出现了大幅度的疑似假反应性峰值。这严重干扰了测试工作流程,导致筛查积压;部分测试不得不停止并转移到另一个实验室,同时进行清洁和调查。
在此,我们描述了对此事件的调查,以及2019年至2024年间NHSBT进行献血HIV筛查的背景数据。我们描述了用于识别污染源的新型新一代测序和生物信息学分析工具的使用。
MATERIALS AND METHODS
Blood donation screening for HIV
英格兰所有献血的血浆样本均使用罗氏Cobas MPX检测以24名献血者为一组进行筛查。这是一种用于HIV核糖核酸(包括HIV-1 M组和O组、HIV-2)、HCV核糖核酸和HBV脱氧核糖核酸的实时多重PCR。它靶向HIV-1基因组的两个不同区域。血浆样本也同时筛查HIV抗原/抗体,任何检测到HIV核糖核酸或抗体的样本都会被送往NHSBT微生物服务实验室进行替代核酸检测和血清学检测的进一步确证测试。如果确认HIV感染,会联系献血者并转介至专科护理。在筛查中仅检测到HIV核糖核酸但在参比实验室未检测到、且所有血清学检测仍为阴性的情况下,将从献血者处获取任何潜在的HIV感染风险因素,并要求重复样本进行进一步测试,包括HIV前病毒脱氧核糖核酸。在重复样本中所有分子和血清学检测均为阴性的情况下,该初始样本中的HIV核糖核酸阳性将被视为假阳性。关于初始HIV核糖核酸反应性和确诊HIV感染的献血数据由NHSBT微生物监测团队收集和监控。我们报告了2019年1月至2024年1月的相关数据。
Further testing of initial HIV RNA-positive samples shown to be false reactives
来自Cobas MPX检测的PCR产物,包括三个假反应性样本和三个运行对照中的每一个,都进行了琼脂糖凝胶电泳分析,以可视化PCR产物的数量和大小。三个运行对照包括PCR产物MPX对照(HIV-1 M组对照、HBV和HCV)、HIV-1 O组对照和HIV-2对照。然后对PCR产物进行测序。
Extraction of environmental swabs
总共从受影响实验室的全范围区域采集了392份环境拭子,包括实验台、实验服、门把手、测试设备、清洁和维护设备以及消耗品。这些拭子连同66个清洁拭子由瑞士罗氏公司进行测试。向拭子中加入1.6毫升罗氏样本稀释剂,并在室温下孵育过夜。然后用Cobas MPX检测一毫升。随后将PCR板送至牛津大学进行直接测序,而任何剩余材料则使用Zymo快速病毒脱氧核糖核酸/核糖核酸提取试剂盒进行提取,并在20微升无核酸酶水中洗脱。提取物在-70°C保存直至使用。
Sequencing and bioinformatic analysis
选择了七个通过Cobas MPX检测发现HIV核糖核酸假反应性的献血者样本的PCR产物,以及四个在Cobas MPX中同样发现呈反应性的环境样本的PCR产物进行测序。PCR产物选自不同的检测板,循环阈值在33.9至39.8之间变化。此外,还包括了多病原体核酸检测的所有三个对照(针对HIV-1 M组、HBV、HCV的多病原体对照;HIV-1 O组;HIV-2)和两个阴性对照。使用Qubit对PCR产物进行定量,并稀释至20纳克/微升。然后将其送至Azenta Life Sciences公司的GENEWIZ,在Illumina MiSeq平台上使用PE250策略进行Amplicon-EZ新一代测序,每个样本最大读取深度为5×104。
使用Castanet 8.3版及修改后的扩增子流程分析测序数据。未使用预过滤器,修剪设置基于测序设施提供的质量控制结果通过片段大小估算来设定。提供的映射参考包括一系列代表性参考病毒基因组,包括HIV-1、HIV-2、HBV和HCV的流行基因型。通过排除读取片段的未对齐部分(软剪辑)、排除软剪辑的映射片段以及与参考序列碱基同一性不超过60个碱基的映射片段来清理映射的读取;选择此值是因为它超过了预期引物序列长度的两倍。丢弃非病毒来源序列。
通过迭代减少映射片段长度并观察流程的对齐图来选择识别长末端重复读取的最佳生物信息学参数。这个优化过程显示,污染物长末端重复读取经常与样本中其他更长的扩增子(主要是PCR产物)形成嵌合体,因此在使用默认参数的结果中被过滤掉。除了以下设置外,Castanet扩增子流程设置均为默认值:片段最小长度 = 36,Q值截断 = <20,接头错配 = 2碱基,回文对齐错配 = 10碱基,非配对读取对齐错配 = 7碱基,过滤软剪辑 = True。除了允许用户通过映射长度过滤扩增子外,Castanet扩增子流程还允许用户通过解析每个映射读取的紧凑异质缺口对齐报告来过滤软剪辑读取片段。由于软件底层映射软件(BWA-mem2)允许每个读取有多个主对齐,它与软剪辑去除结合使用,能够在为每个组件提供适当映射参考的情况下,精确表征嵌合读取中的不同片段。
Plasmid-specific PCR of environmental swabs
设计了一种实时PCR,针对疑似污染物的质粒的两个不同区域(出于商业原因未显示引物序列和PCR循环详情)。然后使用质粒特异性PCR测试环境拭子的提取物。使用SYBR Green PCR Master Mix,总体积为20微升,包括2微升模板和终浓度为0.5微摩尔的引物。在Quantstudio 1上对11个环境拭子进行实时PCR。然后将阳性PCR扩增子进行Sanger测序,以与疑似污染物进行比较。
RESULTS
The contamination incident with background data
2019年1月至2024年1月期间,NHSBT共确认了35名HIV阳性献血者(2019年9名,2020年9名,2021年9名,2022年8名,2023年5名,2024年1月0名)。同期,识别出369例假反应性(2019年5例,2020年3例,2021年4例,2022年8例,2023年126例,2024年1月223例)。其中,124例假反应性出现在2023年夏季的8天期间,另一次223例假反应性高峰出现在2024年1月的一个月内。这些事件导致347份献血被废弃。
Gel electrophoresis analysis of assay products
分析了来自三个假反应性、三个MPX对照(包括HIV-1 M组对照)、三个HIV-1 O组对照和三个HIV-2对照的扩增子,以确定是否存在扩增子脱氧核糖核酸及其数量。凝胶图像显示每个样本中显然存在大量的扩增脱氧核糖核酸。Cobas MPX对照应包含三个或更多扩增子,这与观察到的100-200个碱基对范围内的多个条带一致。然而,在三个假反应性样本中也观察到了多个条带,这与如果它们对HIV-1或HIV-2呈阳性所预期的一到两个条带不一致。通过凝胶电泳对假反应性样本和PCR阴性样本的进一步分析尚无定论,在PCR阴性样本中经常发现扩增子条带,这表明观察到的低大小脱氧核糖核酸大部分是非特异性产物。
Environmental swabbing shows the extent of contamination
392个环境拭子中有356个在Cobas MPX检测的HIV组分中呈反应性。所有采集的拭子均未对HBV或HCV呈反应性。此外,66个未使用的拭子对所有靶标均为阴性。
Short read NGS sequencing of products
通过Illumina(短读长)新一代测序在MiSeq平台上使用2×250双端测序分析了一组样本,包括四个环境拭子、七个假反应性样本、两个阴性对照和三个阳性对照。与总测序深度相比,映射到HIV-1的读取计数较低。尽管如此,读取深度足以支持分析。此外,读取数与循环阈值相关。
正如预期的那样,在HIV-1 M组多重阳性对照样本中观察到了大量的HIV、HCV和HBV读取。从HIV O组对照的长末端重复区域也获得了类似数量的HIV-1 O组读取。然而,在HIV-2阳性对照返回的读取中,没有观察到可识别为HIV-2长末端重复或基因组其他区域的读取。可以轻松组装读取,从多重对照的扩增子中创建HIV-1基因组两个区域的统一长度共有序列,以及HCV的5‘非翻译区和HBV的聚合酶基因。类似地,可以从相应的阳性对照组装HIV-1 O组长末端重复序列。推断的扩增子长度以及与GenBank上可获得的最接近的已发表序列的相似性。虽然从罗氏Cobas MPX阳性对照的扩增子中扩增并检测到了Gag和长末端重复序列,但从假反应性样本和除一个环境样本外的所有环境样本中仅扩增到了长末端重复序列。这表明假反应性和环境样本中的长末端重复序列源于含有HIV-1长末端重复的克隆或特定长末端重复扩增子的污染,而非来自HIV-1病毒污染源。
然后调查了邻近实验室大量生产的三种慢病毒转移质粒中的任何一种是否是污染源。将假反应性和环境样本中的长末端重复和Gag序列与这三种慢病毒转移质粒的序列进行比较。比较发现,质粒1的长末端重复序列与HIV-1参考毒株以及从假反应性样本推导出的六个共有序列相同,而其他质粒在长末端重复序列中都显示出一个碱基的差异。质粒3含有HIV-1 Gag编码序列(但没有长末端重复);然而,Gag扩增子区域的序列不同于HTLV-IIIB克隆序列、罗氏Cobas MPX阳性对照和环境样本3。
PCR confirmation of presence of lentivirus transfer plasmid in environmental swabs
所有测试的11个环境拭子在至少一个测试区域的质粒特异性PCR中呈阳性。这些扩增子全部进行了测序,结果与该慢病毒转移质粒中的相应区域完全相同。
DISCUSSION
使用罗氏Cobas MPX检测的疑似假反应性样本的反复出现,导致了2023年6月和2024年1月的测试工作流程严重问题。对Cobas 6800/8800平台进行了彻底检查,发现其工作正常,表明假反应性可能源于样本或外部污染,而不是机器或检测问题。进行了标准调查以识别当时被怀疑的HIV-1污染源。
对污染源提出了几种假设。它们包括阳性对照、外部质量保证样品、高滴度HIV阳性献血样本、先前运行的扩增子或恶意干扰。在事件发生前的一段时间内,实验室中既未遇到高滴度阳性样本,也未遇到阳性外部质量保证样本。扩增子残留也被认为不太可能,因为罗氏Cobas MPX检测在扩增过程中使用脱氧尿苷三磷酸代替脱氧胸苷三磷酸,允许尿嘧啶-脱氧核糖核酸糖基化酶在扩增前消化任何污染的扩增子。通过此过程,扩增子残留被认为在很大程度上被消除了,但消除程度尚不清楚。
通过扩增子序列与其疑似来源的基因比较,提供了关于外部污染源的线索。一个主要问题是缺乏关于Cobas MPX检测中扩增HIV-1和其他多重靶标的引物和基因组区域的信息。然而,已知该检测靶向HIV基因组的不同组中的两个区域,但对所有靶标使用相同的荧光基团。因此,事先未知假反应性样本中的污染物是HIV-1 M组或O组,甚至可能是HIV-2;此外,也不清楚HIV假阳性是否源于一个或两个靶标区域PCR的污染。
在不知道扩增子性质的情况下,我们决定采用新一代测序方法,通过Illumina使用宏基因组学方法对扩增子进行测序。在这种方法中,可以在事先不知道靶标序列的情况下对PCR产物进行扩增和测序。因此,可以通过生物信息学流程分析返回的双端读取,针对人类和病毒数据库进行识别,并对其进行分类以供进一步分析。通过这种方法,我们证明了从七个假反应性和四个环境样本获得的扩增子长末端重复序列与HIV-1毒株IIIB参考序列完全相同,并且与罗氏Cobas MPX对照扩增子不同。该序列源于HIV-1首次被Montagnier及其同事表征时报告的原始HTLV-III分离株。考虑到HIV-1在过去40年中的快速进化和大量累积的序列漂移,一个与HTLV-III完全相同的序列不可能在英国和其他地方流行。此外,虽然从罗氏Cobas MPX阳性对照的扩增子中扩增并检测到了Gag和长末端重复序列,但从假反应性样本和除一个环境样本外的所有环境样本中仅扩增到了长末端重复序列。Gag PCR在阳性对照中产生的读取数多于长末端重复,这表明这不是两个区域之间的差异灵敏度问题。
这些发现与实验室污染源一致,而非外源性污染源,例如来自HIV核糖核酸阳性样本的样本或扩增子残留。怀疑是质粒污染,因为含有逆转录病毒长末端重复的慢病毒载体通常来源于原型HTLV-IIIB克隆序列,这一点通过慢病毒转移质粒与假反应性样本之间的序列比较得到了证实。此外,在所有使用质粒特异性PCR测试的环境拭子中都检测到了相同的污染。
迄今为止,我们不知道有任何其他关于含有HIV-1序列的慢病毒转移质粒导致检测设施污染的报告。然而,有几份已发表的病例报告描述了接受基于慢病毒载体的基因和嵌合抗原受体T细胞疗法的患者出现假阳性HIV反应性。HIV核酸检测通常靶向长末端重复和Gag区域中的保守区域,这些区域也存在于慢病毒载体中,导致多家制造商的核酸检测出现假阳性。由于HIV核酸检测和商业化生产质粒的专有性质,通常无法获得序列来预测交叉反应性。正是由于核酸检测和质粒制造商的出色合作,我们才得以解决这一事件。
鉴于该事件的性质,进行了快速临床风险评估。在整个事件期间,对血液成分受血者没有风险,因为所有被识别为疑似假反应性的献血都被废弃了。为了避免在此期间遗漏真正的HIV阳性献血,进行了常规的确证测试。所有假反应性样本在筛查和进一步测试中HIV血清学均为阴性,包括一项替代核酸检测和两项血清学检测,证明在此期间没有发生真正的HIV阳性献血。在所有结果报告之前,献血者被延期。环境拭子结果显示污染广泛且普遍,这也引发了对在受污染实验室工作的员工或访客任何风险的担忧。然而,被确定为此次污染事件可能来源的转移质粒内的HIV-1长末端重复元件是无害的,并且不能通过任何可能的途径导致接触者感染。向员工提供了保证,并实施了使用0.5%漂白剂(已知可破坏质粒)的加强清洁。
对慢病毒转移质粒污染如何进入测试实验室的调查未能确定具体的单一原因。然而,必须承认质粒是在邻近筛查实验室的设施中大规模生产的。尽管这些设施之间没有共享任何实验室或其他工作人员,但实验室由一条走廊相连,这条走廊也被发现受到了污染。此外,从制造设施到共享餐厅的路线也邻近微生物筛查实验室,这凸显了污染很可能由可以进出两个实验室的实验室工作人员传播的可能性。筛查实验室、实验服和储物柜都被发现受到严重污染,这进一步证明了这一点。慢病毒转移质粒也很可能通过空气传播,因为在头顶天桥、空调单元和整个地板区域都检测到了污染——这些区域不太可能被触摸。对此事的调查仍在进行中,并且可能比最初设想的更复杂,需注意这些设施拥有不同的空气处理系统。自此次事件以来,已实施了一些改变以防止再次发生。这些措施包括加强实验室清洁和引入每日更换实验服,以及工作流程的改变,即生产质粒的工作人员不再被允许进入筛查实验室。慢病毒转移质粒的生产也已暂停,同时继续调查减轻和预防未来污染的方法。
这次调查表明了对非传统生物信息学方法的需求。扩增子短读长测序提供了一种快速有效的方法来调查污染源,而无需了解PCR中用于靶标扩增的引物序列。然而,在生物信息学流程中包含至少一个清理步骤以去除“不需要的”序列片段是很常见的,这可能涉及接头修剪,例如Trimomatic、读取标记Kraken2,或特定背景减少,如Decontam。尽管大多数此类工具使用远不止映射片段大小的参数进行过滤,但通常建议从下游分析中移除长度<70个核苷酸的片段,因为这个大小范围对应于诸如引物二聚体和污染物空气传播扩增子等产物。我们的污染物长末端重复序列因此被标准Castanet流程参数自动移除,这突显了当使用新一代测序作为故障排除工具时,需要非常规的生物信息学方法和理解。
总之,我们确定了NHSBT一个高通量关键筛查设施中一个高度意外的污染问题。调查强调了分子实验室极易受到质粒污染的事实,以及精心设计和物理隔离质粒生产设施的必要性。这也凸显了实验室参考设施测试专业知识的作用,以及需要先进的分子和生物信息学技能来解决潜在的污染问题。
ACKNOWLEDGMENTS
我们感谢我们的分子筛查管理服务承包商(罗氏)在协助这些调查时提供的超出常规服务的额外支持和专业知识。也感谢NHSBT事件管理团队的所有成员,他们在确保日常服务按要求继续运行的同时,以专注的态度解决了这个问题。