《International Journal for Parasitology》:The development and validation of long-read ITS-1/5.8S/ITS-2 nemabiome metabarcoding for ovine gastrointestinal nematodes using Oxford Nanopore Technologies (ONT) sequencing
编辑推荐:
为了解决当前短读长ITS-2线虫组宏条形码在物种鉴别分辨率、应用灵活性以及对粪便DNA直接测序方面的局限,研究人员开发了基于牛津纳米孔技术(ONT)的ITS-1/5.8S/ITS-2长读长宏条形码方法,并设计了可最大限度减少粪便真菌序列脱靶扩增的新引物对EC1/EC2。该研究在来自英国和加拿大的羊场样本中验证了该方法,结果显示与ITS-2方法高度一致,且新引物显著提升了从粪便DNA直接检测的可行性。该进展使线虫组宏条形码技术变得更易获取、更具分辨力、更灵活,适用于研究和诊断。
绵羊等放牧家畜的胃肠道中,常常混合寄生着多种胃肠道线虫(GIN)物种。这些小虫子虽不起眼,但不同种类的致病性、临床症状、固有药物敏感性及获得性耐药状况差异巨大。因此,摸清粪便样本中每种线虫的相对“家底”,对于精准防控至关重要。传统方法,比如在显微镜下数虫卵(FECs),不仅耗时费力,还常常“脸盲”——无法区分不同种类的圆线虫。想看清“真面目”,还得先把虫卵培养成第三期幼虫(L3)再借助形态学鉴别,但这过程既可能引入物种偏差,又极度依赖专家经验。分子检测技术,如实时定量PCR,虽然更准更快,但通常一次只能针对一个特定物种,难以应对自然界复杂的混合感染局面。
于是,科学家们开发了称为“线虫组宏条形码”的技术,它像给环境中的所有线虫DNA进行一次“群体点名”。目前主流方法是利用Illumina短读长测序平台,靶向核糖体RNA基因簇中的内转录间隔区2(ITS-2)。这个方法已广泛应用,但它也有自己的“烦恼”:ITS-2区域本身较短,对某些亲缘关系极近的“兄弟物种”分辨力有限;Illumina平台读长短,限制了靶向其他更长、更具鉴别力遗传标记的可能;而且该平台通常需要凑齐大批样本一起测序才划算,对于小规模研究或想快速用于临床诊断来说,显得不够灵活、便捷。此外,现有方法需要先从粪便中纯化出寄生虫(虫卵或幼虫)才能提取DNA,步骤繁琐。如果能直接对粪便DNA进行宏条形码分析,无疑将大大提速,助力常态化诊断。
那么,有没有一种方法,既能获得更长的、信息更丰富的DNA序列来提高鉴别力,又能让测序变得更灵活、快速,甚至能兼容“脏兮兮”的粪便样本呢?由Eléonore Charrier、Rebecca Chen、Elizabeth Redman、Sawsan Ammar、Camila Meira、Camila Queiroz和John.S. Gilleard组成的研究团队,将目光投向了牛津纳米孔技术(ONT)。这项技术以其长读长、灵活、快速和相对低的启动成本著称。他们的研究成果以“The development and validation of long-read ITS-1/5.8S/ITS-2 nemabiome metabarcoding for ovine gastrointestinal nematodes using Oxford Nanopore Technologies (ONT) sequencing”为题,发表在了《International Journal for Parasitology》上。他们雄心勃勃地想要开发并验证一套基于ONT长读长测序的线虫组宏条形码新方法,靶向更长的ITS-1/5.8S/ITS-2 rRNA区域,并让它能更好地“耐受”粪便样本的复杂环境。
为了回答上述问题,研究人员主要运用了以下几项关键技术:首先,他们利用来自英国(43个农场)和加拿大西部(34个农场)的、已通过ITS-2 Illumina宏条形码表征过的绵羊胃肠道线虫L1期幼虫池的基因组DNA作为模板。其次,他们采用PCR扩增,使用带ONT测序接头的NC5/NC2引物对,靶向ITS-1/5.8S/ITS-2区域。接着,使用ONT MinION设备进行长读长测序,并开发了一套定制生物信息学分析流程(包括Guppy碱基识别、Cutadapt去接头、Filtlong质量过滤,以及使用Minimap2软件将序列比对到专用的ITS-1/5.8S/ITS-2参考序列数据库)来处理数据。最后,为了实现对粪便DNA的直接分析,他们利用PrimerTC工具专门设计了新的引物对EC1/EC2,以最大化线虫序列覆盖度,同时最小化粪便中真菌DNA的脱靶扩增。
研究结果
3.1. 通过ONT ITS-1/5.8S/ITS-2 rRNA长读长线虫组宏条形码确定绵羊胃肠道线虫群落的相对物种丰度
3.1.1. ITS-1/5.8S/ITS-2 rRNA参考序列的种内和种间变异评估
研究人员分析了其此前构建的ITS-1/5.8S/ITS-2参考序列数据库。结果表明,该标记在不同线虫物种间长度变异大(702-1700 bp),但对重要的反刍动物寄生线虫物种(如Cooperia oncophora与C. punctata, Trichostrongylus axei与T. colubriformis)显示出足够的序列差异(数十至上百个核苷酸差异),预示着比短片段ITS-2具有更高的物种鉴别潜力。
3.1.2. ITS-1/5.8S/ITS-2 rRNA长读长ONT线虫组宏条形码评估
将ONT ITS-1/5.8S/ITS-2宏条形码应用于77个农场样本(英、加各43和34个)的L1幼虫DNA,进行了三次独立重复实验。经生物信息学流程分析和人工筛选(剔除总读数<1000的样本和总读数<200的物种)后,最终从三个重复文库中分别获得约302万、273万和140万条高质量读段,鉴定出10种主要的绵羊寄生线虫。数据分析揭示了地理差异:例如,H. contortus在加拿大羊群中的相对丰度(43.2%)显著高于英国羊群(21.5%),而T. vitrinus则相反。统计检验证实了这些主要物种在两地间的丰度差异具有显著性。
3.1.3. ITS-1/5.8S/ITS-2长读长牛津纳米管线虫组宏条形码的重现性
三次独立的PCR扩增和测序重复实验显示出极高的重现性。物种相对丰度在重复间的平均差异仅为0.2%,林氏一致性相关系数(Lin's Concordance Correlation Coefficient)高达0.99,表明该方法稳定可靠。
3.2. ITS-1/5.8S/ITS-2 rRNA ONT长读长宏条形码与ITS-2 rRNA Illumina短读长宏条形码的比较
将ONT长读长数据与相同样本的Illumina ITS-2短读长数据(使用更新流程重新分析)进行比较。总体来看,两种方法对最主要的五种线虫物种(H. contortus, T. circumcincta, T. colubriformis, T. vitrinus, O. venulosum)的相对丰度估计高度一致,林氏一致性系数在0.92-0.98之间。这表明ONT长读长方法在主体结果上与成熟的短读长方法等效。然而,在一些低丰度或参考序列不全的物种上存在差异,例如,ITS-2方法检测到C. curticei,而ONT方法因数据库中缺少该物种的ITS-1/5.8S/ITS-2参考序列,将其错误匹配到了亲缘关系最近的C. oncophora。这凸显了参考数据库完整性的关键作用。
3.3. 将ITS-1/5.8S/ITS-2 rRNA ONT线虫组宏条形码应用于粪便DNA时最小化脱靶读段
3.3.1. 使用NC5和NC2引物对绵羊粪便DNA直接进行ITS-1/5.8S/ITS-2 rRNA ONT线虫组宏条形码会产生大量脱靶读段
当使用常规NC5/NC2引物对直接从绵羊粪便提取的DNA进行扩增和ONT测序时,产生了大量脱靶读段,其中主要是真菌序列,导致线虫序列占比仅为47.4%,严重影响了检测灵敏度,尤其对虫卵计数低的样本。
3.3.2. 开发新引物EC1和EC2,以最小化对绵羊粪便DNA进行ONT ITS-1/5.8S/ITS-2 rRNA宏条形码时的脱靶扩增
为解决上述问题,研究人员利用PrimerTC工具设计了新引物对EC1和EC2。生物信息学分析显示,EC1/EC2在线虫(尤其是Clade IV和V)的18S和28S rRNA保守区域具有高结合度,同时与真菌rDNA序列的相似性极低。实验验证表明,使用EC1/EC2引物对8个不同感染水平的绵羊粪便DNA进行ONT测序,线虫读段占比大幅提升至91.8%,有效抑制了真菌序列的扩增,证明新引物能显著提高对粪便DNA或受粪便污染的寄生虫样本进行直接宏条形码分析的耐受性。
研究结论与意义
本研究成功开发并验证了基于牛津纳米孔长读长测序的ITS-1/5.8S/ITS-2 rRNA线虫组宏条形码方法,用于分析绵羊胃肠道线虫群落。核心结论如下:
- 1.
方法有效且可靠:新开发的ONT长读长方法在检测主要胃肠道线虫物种时,与已确立的ITS-2 Illumina短读长宏条形码结果高度一致,且三次独立实验重复性极佳,证明了其准确性和稳定性。
- 2.
鉴别潜力更高:ITS-1/5.8S/ITS-2区域比ITS-2更长,在密切相关的物种间(如Cooperia oncophora与C. punctata)提供了更多的核苷酸差异位点,理论上具备更高的物种分辨潜力。
- 3.
应用灵活性提升:ONT平台(如MinION)具有长读长、运行时间灵活、启动成本相对较低等优势,使得该方法更适合小规模研究项目、现场监测和常规诊断应用,突破了Illumina平台对大批量样本批处理的依赖。
- 4.
突破样本前处理瓶颈:针对现有方法需纯化寄生虫的局限,研究团队设计的EC1/EC2新引物对,能最大限度减少粪便中真菌DNA的脱靶扩增,使ONT宏条形码技术对受粪便污染的样本甚至直接对粪便DNA进行分析成为可能,这为简化工作流程、实现快速诊断铺平了道路。
研究也指出了当前局限与未来方向。参考数据库的完整性是确保准确物种鉴定的基石,当前ITS-1/5.8S/ITS-2数据库的覆盖度虽在提升,但仍不及ITS-2数据库全面,导致对个别稀有物种(如C. curticei)的鉴定出现偏差。因此,持续扩充高质量的长读长参考序列至关重要。此外,尽管ONT测序准确率已大幅提升(>99%),但研究人员仍通过设定合理的过滤阈值(如样本总读段数<1000、物种总读段数<200)来剔除可能的低质量或错误匹配读段,确保了数据的可靠性。
总而言之,这项研究标志着线虫组宏条形码技术的一个重要进展。它将长读长测序的优势引入寄生虫群落分析领域,不仅提升了物种鉴别的潜在分辨率,更重要的是通过提高技术的灵活性、可及性和对复杂样本的耐受性,使得这项强大的工具能够更广泛地应用于从大型生态研究到基层诊断监测的各个场景。随着参考数据库的完善和测序化学的持续改进,基于ONT的长读长线虫组宏条形码有望成为寄生虫学研究、畜牧业寄生虫防控和公共卫生监测中一项不可或缺的利器。