编辑推荐:
为了克服eDNA宏条形码技术的PCR扩增偏好性和鸟枪法测序(shotgun sequencing)中真核DNA被原核DNA掩盖的问题,研究人员通过比较不同孔径(0.2–8.0 μm)滤膜对海水eDNA样本的捕获效果,发现增大孔径可显著提高真核生物(尤其是后生动物)的读取比例,为优化eDNA采样策略和提升生物监测效率提供了关键依据。
随着环境保护和生物多样性监测的需求日益增长,科学家们找到了一种“基因侦探”般的方法——环境DNA(eDNA)技术。简单来说,生物在环境中生活时,会通过脱落细胞、排泄物等方式留下含有自身遗传物质的痕迹。从水、土壤或空气中收集这些痕迹并进行DNA分析,就能知道哪些生物曾经或正在那里出没,而无需直接看到或捕捉到它们。这种方法尤其适用于广阔而难以全面调查的水域,比如海洋。目前,最常用的eDNA分析方法是“宏条形码”(metabarcoding)。它有点像给所有生物“点名”:先通过聚合酶链式反应(PCR)大量扩增某个特定的基因片段(如同一个通用“条形码”),然后进行测序和比对,从而识别出存在哪些物种。这种方法非常灵敏,尤其擅长检测特定的目标类群。
然而,宏条形码技术有一个“先天不足”——PCR扩增过程。不同的DNA片段在PCR中的扩增效率并不均等,这会导致最终结果无法真实反映环境中各种生物DNA的原始比例,产生所谓的“扩增偏好性”。为了解决这个问题,另一种被称为“鸟枪法测序”(shotgun sequencing)的技术进入了研究者的视野。这种方法不经过特异性PCR扩增,而是将环境样本中所有的DNA随机打断成小片段进行测序,理论上能更全面地反映样本的原始遗传组成。但理想很丰满,现实却很骨感。在以往的研究中,鸟枪法测序得到的海量数据里,绝大部分序列都来自数量庞大的细菌等原核生物,而研究者更关心的鱼类、无脊椎动物等真核生物(尤其是后生动物)的序列则被淹没其中,检测效率远不如宏条形码。
那么,有没有办法让鸟枪法测序更“偏爱”真核生物一些呢?研究团队将目光投向了eDNA研究的第一步——水样过滤。eDNA在环境中以多种形态存在,从完整的细胞、组织碎片到游离的DNA,大小不一。而过滤使用的滤膜,其孔径大小就像一个“筛子”,决定了能留住哪些大小的颗粒。他们猜想:既然细菌等原核生物的细胞通常较小(约0.1–5.0 μm),而真核生物的细胞或细胞器通常较大(约1–100 μm),那么使用更大孔径的滤膜,是不是就能相对多地留住真核生物的eDNA,同时让更多的小尺寸原核生物DNA“溜走”,从而在后续的鸟枪法测序中提高真核生物序列的比例呢?为了验证这个大胆的假设,一项精巧的实验在丹麦哥本哈根的Skovshoved港展开。
研究人员的主要技术方法包括:在同一个地点采集海水样本,使用五种不同的滤膜(四种不同孔径(0.2、1.2、5.0、8.0 μm)的非封闭式滤膜和一种0.2 μm孔径的封闭式Sterivex滤膜)分别过滤1升海水,每种滤膜设置三个生物学重复。随后,对同一样本平行进行两种分析:一是高通量鸟枪法测序,以全面分析所有遗传物质;二是针对真核生物18S核糖体RNA(rRNA)基因的宏条形码测序,作为传统方法的对照。数据通过BLASTn比对NCBI数据库进行物种分类,并运用一系列生物信息学和统计学方法(如非度量多维尺度分析(nMDS)、优势比(OR)计算、Wilcoxon检验等)比较不同孔径滤膜对物种组成的影响。
研究结果
鸟枪法测序输出
研究获得了海量的测序数据,但最终能比对到数据库并达到严格质量控制标准的序列,仅占总序列的很小一部分(约0.78%)。尽管如此,结果清晰地揭示了滤膜孔径的强烈效应。如图1所示,小孔径滤膜(0.2和1.2 μm)捕获的序列中以细菌为主(平均占63%),真核生物比例较低(平均28%);而大孔径滤膜(5.0和8.0 μm)则显著提高了真核生物序列的比例(平均49%),同时降低了细菌的比例(平均31%)。统计检验表明,小孔径滤膜能获得更多的古菌和细菌读长,而大孔径滤膜能获得更多的真核生物和病毒读长。在检测到的19个后生动物门中,除一个门外,其余所有门在大孔径滤膜中的丰度都更高。
宏条形码测序输出
作为对比,18S rDNA宏条形码分析,如其预期,只检测到真核生物。虽然其测序深度足够,且在门水平上检测到的真核生物多样性也很高,但其结果并未像鸟枪法数据那样,显示出滤膜孔径对群落组成的清晰、一致的影响模式。
鸟枪法与宏条形码数据的比较
在真核生物门水平的多样性上,两种方法表现出了高度的相似性。总共54个真核生物门中,有39个是两种方法共同检测到的。鸟枪法测序独检测到9个门,宏条形码独检测到6个门。这种差异可能源于PCR扩增偏好性、数据库覆盖度不同或真实的生物学原因。此外,非度量多维尺度分析(nMDS)图清晰地显示,基于鸟枪法数据,不同孔径的样本在群落组成上能明显区分开,而宏条形码数据中的这种区分模式则较弱。这突显了鸟枪法测序在揭示采样方法(如滤膜孔径)对eDNA捕获影响方面的优势。
丹麦本地与外来源属级评估
为了评估鸟枪法测序用于生物监测的潜力,研究人员选取了四个研究较为充分的海洋后生动物类群(鱼类(Actinopterygii)、双壳类(Bivalvia)、多毛纲环节动物(Polychaeta)、软甲纲甲壳动物(Malacostraca)),在属水平上比较了两种方法检测到的已知存在于丹麦的“本地属”与“外来源属”(后者很可能源于数据库不全导致的错误比对)的比例。结果显示,对于多毛纲、软甲纲和双壳类,鸟枪法检测到的属中本地属比例较高;但对于鱼类,本地属比例较低(23/59)。相比之下,宏条形码数据在所有类群中显示出更高的本地属比例。值得注意的是,在鸟枪法数据中,分配给外来源属的读长数量远低于本地属,尤其是在有利于后生动物捕获的大孔径滤膜样本中。这提示,通过设置合理的读长数量阈值,或许能在鸟枪法数据中有效区分可信的本地物种检测与可能的错误识别。
研究结论与讨论
本研究的核心结论是:增大水样过滤时使用的滤膜孔径,可以显著提高鸟枪法测序数据中真核生物(尤其是后生动物)eDNA序列的比例,有效缓解原核DNA的掩盖问题。 这为优化旨在进行鸟枪法测序的eDNA采样方案提供了直接且实用的指导——当研究目标主要是真核生物时,考虑使用更大孔径(如5.0或8.0 μm)的滤膜。
研究同时表明,在门级分类水平上,鸟枪法测序所揭示的真核生物多样性与传统的18S宏条形码方法高度吻合,甚至略有超越(检测到更多独特的门),证明了其在广度上的可靠性。然而,研究也坦诚指出了当前鸟枪法测序应用于eDNA监测的两大主要瓶颈:一是公共参考基因组数据库的不完善,导致大量序列无法被准确分类到种、属甚至科级水平;二是生物信息学分析流程复杂且计算量大。
尽管如此,这项研究为未来指明了方向。随着诸如“地球生物基因组计划”(Earth Biogenome Project)等大规模测序项目的推进,参考数据库将飞速扩展。同时,更高效的比对算法(如k-mer based方法)也在不断发展。结合本研究提出的优化采样策略(使用大孔径滤膜),鸟枪法测序有望克服当前局限。相较于宏条形码,它具有无PCR扩增偏好性、能反映更真实的相对丰度信息、以及全基因组范围覆盖的潜力。因此,研究人员认为,鸟枪法测序值得被进一步开发和评估,以期在未来为水生生物多样性监测提供更准确、更全面的工具。 论文最终发表在《Metabarcoding and Metagenomics》期刊上,为eDNA技术领域提供了重要的方法论见解。