《Evolutionary Applications》:Development of Metagenomic Methods for Health Monitoring of Endangered Species Using Fecal Samples
ABSTRACT
粪便样本的宏基因组分析正成为监测濒危物种的强大工具,尤其在评估可能威胁种群生存的病原体和寄生虫负荷方面。然而,由于缺乏宿主特异性病原体参考基因组,非模式物种的准确鉴定仍具挑战。本研究开发了一个稳健的计算框架,通过将宏基因组序列比对至数据库中的可用参考基因组,检测潜在致病细菌。研究分析了影响分析的多个关键参数(包括比对算法、数据库配置和鉴定参数),以优化检测灵敏度和特异性。将该方法应用于极危半水生哺乳动物伊比利亚沟齿鼩(Galemys pyrenaicus)的新鲜粪便样本,鉴定出26种潜在致病细菌物种,流行率从个别案例到近半数个体不等。此外,分析显示部分沟齿鼩具有非典型的潜在病原体组成,表明环境暴露或宿主遗传因素存在差异。本研究展示了粪便宏基因组学在疾病相关微生物物种水平检测中的新颖应用,为理解濒危物种的健康和流行病学提供了强大方法,支持制定更有效的保护策略。
1 Introduction
病原体和寄生虫物种对野生物种的生存和繁殖具有显著影响。对于濒危物种,准确评估这些病原体的负荷和多样性对制定有效保护策略至关重要。研究传染病的传统方法常需侵入性采样技术,这对濒危物种尤其成问题。在此背景下,粪便样本分析为收集关键健康信息提供了强大替代方案,无需传统采样,对保护关注物种尤为宝贵。
宏基因组学革命性地改变了我们分析复杂样本(包括粪便)物种组成的能力。这一进展使得仅利用粪便即可研究饮食、微生物组甚至宿主基因组等领域。然而,尽管宏基因组学有潜力利用粪便样本提供寄生虫和病原体存在与多样性的详细见解,但其在准确检测这些物种及评估濒危物种健康方面的应用自首次提出以来仍 largely unexplored。
多种宏基因组方法可用于从环境样本(如粪便)中检测致病细菌。所用算法在计算效率和序列物种鉴定细节水平上各不相同。快速物种分类方法(如k-mer-based工具Kraken和快速蛋白比对工具Diamond)采用最低共同祖先策略,为尽可能多的测序reads提供物种分类。该类别的重大近期进展是sylph程序,其利用k-mer统计估计参考基因组相对于宏基因组的平均核苷酸同一性,比同类方法实现更准确的物种水平鉴定。这些快速方法对关注较高分类水平广泛群落组成的微生物组和大规模生态学研究高度有效。相比之下,比对方法更适合需要物种水平鉴定最高置信度的应用,如临床诊断和病原体监测。此类方法实例包括PathoScope、SURPI、inStrain和Metapresence。这些流程使用比对程序(如SNAP或Bowtie2)将单个reads比对至参考基因组。与提供物种鉴定摘要统计的快速分类方法不同,比对方法可利用源自基因组比对的多种证据线索,包括映射质量(MAPQ)分数(反映read比对至参考基因组正确位置的概率,作为read真正源自所用物种基因组的置信度代理)。此外,该方法允许更彻底检查比对模式,特别是使用完整基因组作为参考时。inStrain和Metapresence等方法已从简单计数映射reads发展到纳入覆盖广度和reads分布均匀性等参数。这种多重验证使这些方法能区分真实存在与由保守域、重复区域或污染引起的假象,为物种鉴定提供了更稳健框架。检测这些假象的能力在精确参考基因组不可用时至关重要(非模式物种常见情况)。由于其更大计算需求,基于比对的方法常应用于目标类群的精选数据库以确保可处理分析时间。最后,基于组装的方法也可产生高置信结果,但需要高覆盖度以组装基因组,且可能仅检测样本中部分物种(因所需测序深度),使其对复杂微生物群落中低丰度物种(正是具有临床相关性的机会性病原体)效果较差。
尽管人类健康应用中病原体和寄生虫准确鉴定方法取得显著进展,但这些技术在非模式物种中的应用仍存在显著差距,主要因数据库缺乏确切或密切相关物种的完整病原体参考基因组。然而,日益增多的完整病原体基因组现支持其用于特定应用。开发利用可用基因组信息从粪便中获得准确病原体鉴定的方法,对加强濒危物种疾病监测至关重要。
伊比利亚沟齿鼩(Galemys pyrenaicus)是 endemic to 伊比利亚半岛的极危半水生哺乳动物。该物种面临众多威胁,包括栖息地破坏、水污染以及水库和水电站等屏障 disrupting 其河流栖息地。这些屏障不仅碎片化沟齿鼩栖息地,还隔离其种群,导致显著近交问题进一步危及物种生存。尽管其濒危状态,缺乏对影响伊比利亚沟齿鼩病原体的全面研究,仅有用PCR-based方法检测该物种病原体的研究。然而,过去二十年该物种种群快速衰退或消失的原因 largely unknown。理解病原体和寄生虫的影响对就地管理恢复伊比利亚沟齿鼩种群及规划未来保护策略(如圈养繁殖和易地保护)至关重要,因这些策略若未彻底了解所涉种群健康状况,有无意传播疾病的风险。因此,详细研究影响伊比利亚沟齿鼩的病原体和寄生虫对确保保护努力成功和防止进一步种群灭绝至关重要。
本研究旨在开发并测试一个稳健的生物信息学流程,基于比对方法,利用宏基因组测序鉴定粪便样本中具有临床或兽医相关性的细菌物种。使用伊比利亚沟齿鼩新鲜样本验证该方法。我们的方法 specifically addresses 应用先前方法于非模式物种的局限性(常缺乏其病原体的全面参考基因组)。通过聚焦细菌(基因组较小且在基因组数据库中代表性较好),我们旨在建立一个高效可靠的方法,可用于濒危物种疾病相关微生物的长期健康监测。
2 Materials and Methods
2.1 粪便样本收集与DNA提取
2018年和2019年从位于伊比利亚半岛中心的中央系统伊比利亚沟齿鼩种群收集新鲜粪便样本。共获得23个样本(表S1),来自四个不同水文单元或亚种群:Becedillas、Aravalle、Endrinal和Adaja。粪便样本在个体捕获后立即采集置于乙醇管中。该方法保存DNA完整性并最小化野外调查期间河流中收集的粪便样本可能发生的环境污染风险。捕获个体工作属独立于本研究的保护项目,由西班牙环境部通过生物多样性基金会、杜罗河流域管理局和卡斯蒂利亚-莱昂自治区政府通过自然遗产基金会推动。
使用QIAamp DNA Mini Kit(QIAGEN)按制造商说明提取DNA,并使用Qubit荧光计与Qubit dsDNA High Sensitivity Assay Kit(Thermo Fisher Scientific)定量。
2.2 鸟枪法宏基因组文库构建与测序
使用NEBNext Ultra II FS DNA Library Prep Kit(New England Biolabs)构建鸟枪法宏基因组文库。提取的DNA(每样本26μL)在37°C酶切 fragmentation 15分钟。连接特异性Illumina接头,使用NEBNext Sample Purification Beads(New England Biolabs)选择150–250bp插入片段大小的片段。每样本 then indexed 并通过12轮PCR扩增,清洗并使用Qubit荧光计定量。通过E-gel EX 2%琼脂糖凝胶电泳(Invitrogen)评估片段大小分布(270–370bp)。最后,将每个文库等量混合,在Macrogen Inc.(韩国)Illumina平台上测序生成150bp paired-end reads。
2.3 质量控制和内源序列过滤
使用FASTP version 0.23.2过滤低质量、短于100bp或重复的reads以及接头序列,同时使用BBDUK 39.01过滤具有重复基序的序列。剩余reads使用Bowtie2 version 2.5.0比对至参考G. pyrenaicus基因组。记录比对至宿主核基因组的reads数以量化每样本内源DNA产量。此步骤未比对的序列用于后续检测致病细菌步骤,并在Dryad可用(见数据可用性声明)。
2.4 参考细菌基因组
我们从宏基因组序列鉴定细菌方法的分析分两阶段进行:初始使用耶尔森菌属(Yersinia)参考基因组评估方法和参数,随后将优化工作流程应用于更全面的参考细菌基因组集。
选择耶尔森菌属作为案例研究评估鉴定方法原因如下:首先,该属包含NCBI分类中列出的26个密切相关物种,为准确鉴定提供了挑战性测试。此外,其中四个物种是致病性的(表S2),包括众所周知的引起瘟疫的细菌Y. pestis。因此,该属物种凸显了对物种水平准确鉴定稳健方法的关键需求。耶尔森菌属物种的参考基因组从NCBI基因组数据库获取。
在设定耶尔森菌属主要流程步骤和鉴定标准后,使用具有致病潜力的细菌物种精选列表进行更广泛分析。为编译此列表,我们于2024年2月从NCBI病原体检测项目下载了发现的物种参考基因组,作为我们的主要来源。我们补充了毒力因子数据库(VFDB)中发现的额外细菌物种、有关野生动物健康的相关文献以及有关欧洲(尤其是西班牙)野生动物病原体的在线资源。此汇编产生137个物种,包括上述四种致病性耶尔森菌属物种(表S3)。此列表旨在用广泛细菌类群测试我们的流程,但非 exhaustive list of all bacterial pathogenic species。还需注意,列表包括病原体,也包括哺乳动物肠道中常见共生的机会性物种。然而,这些物种在宿主应激或免疫抑制条件下可变为致病性,使其检测对健康监测相关。初始分析中包括了Cutibacterium acnes并在大多数样本中发现,但据报道该物种可能是试剂盒和试剂污染物,故从最终分析中排除,最终分析基于136个物种。
2.5 序列比对至耶尔森菌属物种参考基因组
26个耶尔森菌属物种集用于测试流程中不同方法和参数的性能。首先,使用Bowtie2在端到端比对模式和“--sensitive”选项下,将外源reads集分别比对至各自参考基因组。端到端模式确保每个read的所有位置都参与比对,无修剪或剪切。此外,使用选项“--no-discordant”和“--no-mixed”以仅捕获两个reads均比对且具有预期方向和距离的read pairs。随后,使用SAMtools v1.9将比对转换为BAM格式,去除PCR duplicates,并过滤MAPQ值低于20的reads。MAPQ反映比对相似性和唯一性,能够去除模糊映射的reads。来自单物种数据库的比对常在保守和重复区域包含具有极端覆盖深度值的位置。异常位置定义为覆盖深度大于比对均值加三倍标准差(在对数空间中计算,排除零覆盖位置)的位置。使用SAMtools去除重叠这些位置的reads。使用相同程序,计算每样本和细菌物种的基因组比对统计,包括映射reads数、比对平均MAPQ、参考基因组中至少被一个read测序的位置数、覆盖广度(%;参考基因组被至少一个read覆盖的百分比)和覆盖深度(X;每个基因组位置映射reads的平均数)。通过使用Qualimap 2.2.2构建的基因组覆盖图评估整体比对质量,该图表示基因组4000个窗口中的平均覆盖深度。
Bowtie2可使用单物种或多物种数据库。对于我们主要的物种鉴定流程,为每个物种构建了一个Bowtie2数据库。此外,构建了一个包含所有物种集的组合数据库以评估数据库配置对分析性能的影响。由于组合数据库中深度异常位置很少,此数据库配置中未应用去除它们的步骤。使用单物种数据库时,对同一属内或密切相关物种间具有多个阳性鉴定的样本,通过使用维恩图比较每个阳性物种的唯一和共享reads数进行进一步分析。
外源reads集也使用其他比对方法和条件比对至耶尔森菌属参考基因组。因此,我们使用了Bowtie2局部比对模式,以及另一个广泛使用的DNA比对程序BWA 0.7.17。对于后者,评估了BWA-mem和BWA-aln算法在其默认配置下的性能。Bowtie2和BWA的MAPQ尺度不同,Bowtie2最大为42,BWA最大为60。如前所述,Bowtie2使用MAPQ截断值20。两种方法在相同样本集中的MAPQ值分布显示,BWA的等效阈值约为30,故使用此值过滤该程序的映射reads。
2.6 物种鉴定
为鉴定粪便样本中潜在细菌物种,我们最初应用基于覆盖广度的过滤器,保留参考基因组覆盖度≥0.25%的基因组,这大约对应于平均细菌基因组映射60个reads(取决于基因组大小,范围14至140个reads)。
为提高物种鉴定准确性,我们应用了Metapresence程序,其计算两个关键参数:覆盖广度-预期覆盖广度比率(BER)和意外间隙分数(FUG),以评估比对中reads分布的均匀性。BER度量定义为观察到的覆盖广度与预期覆盖广度的比率,其中后者源自映射reads数,假设泊松映射过程。BER值为1表明reads源自用于比对的参考基因组的相同物种,而较低值表明映射至密切相关物种,导致覆盖均匀性降低。基于不同分歧度参考基因组的先验分析,BER值约0.8对应于与真实物种约98%同一性的参考基因组,而值约0.5对应于96%同一性。在人类样本分析等具有良好代表性细菌参考基因组的研究中,建议鉴定使用BER阈值0.8。然而,鉴于伊比利亚沟齿鼩样本中实际存在的细菌与细菌参考基因组之间预期存在更大分歧,我们采用了更宽松的BER阈值0.65,对应于约97%同一性。
为评估低覆盖度比对(<0.1X)中的比对均匀性(BER效果较差),我们使用FUG参数,其基于连续非配对reads之间的距离评估映射均匀性。在泊松映射模型下,预期FUG值约0.632,较低值表明不规则映射模式。在人类研究中,已使用FUG阈值0.5(正向和反向reads)进行物种鉴定。由于该参数对基因组分歧较不敏感,研究中使用相同的0.5阈值定义阳性鉴定。
2.7 比对至致病细菌物种参考基因组
遵循先前优化,使用Bowtie2端到端模式将每样本外源reads比对至136个细菌物种集,使用单物种和组合数据库,鉴定基于覆盖广度以及BER和FUG参数如上所述。
基于所有物种的覆盖广度值进行主成分分析(PCA),以使用单物种数据库比较伊比利亚沟齿鼩的整体健康状况。使用组合数据库获得了类似PCA。作为额外测试,我们执行了仅包括在所有样本中具有非零覆盖度的细菌物种的PCA,再次产生类似结果。
3 Results
3.1 耶尔森菌属物种水平鉴定
从23个粪便样本中,我们获得约5万至4000万内源reads,以及每样本约30至8000万外源reads(表S1)。为评估用于鉴定细菌物种的比对方法,我们首先使用Bowtie2比对器(端到端模式)将每样本外源reads映射至26个耶尔森菌属物种基因组(表S4),每个基因组构建一个Bowtie2数据库。初始分析显示,使用Bowtie2准确鉴定物种需要广泛过滤reads以最小化错误鉴定。首先,去除低MAPQ值的reads以确保保留的reads自信地比对至参考基因组。此外,我们观察到某些基因组位置倾向于积累过多reads,或因它们在样本中不同物种间高度保守,或因它们是重复的;重叠这些异常位置的reads也被去除。图1说明了应用这些过滤步骤如何改进示例基因组比对。
应用基于覆盖广度的过滤器以及BER和FUG Metapresence过滤器至基因组比对后,我们在23个样本中鉴定出25例耶尔森菌属物种(图2a)。Y. intermedia流行率最高,在16个样本中检测到。这些鉴定的覆盖广度范围从基因组的0.27%至45.28%(表S4)。阳性鉴定比对的平均MAPQ值接近最大值(范围41.67至41.97),表明大多数reads比对至所用参考基因组的正确位置。几个样本对多个耶尔森菌属物种呈阳性。在样本BC3876中(鉴定出三种耶尔森菌属物种且覆盖度高),我们使用维恩图比较映射reads以评估是否所有三种物种实际存在于样本中(图2b)。我们发现每个物种有大量唯一reads,它们之间共享reads极少,表明所有三种物种可能存在于样本中。使用包含所有耶尔森菌属物种的组合Bowtie2数据库观察到类似的鉴定模式(图S1a)。
3.2 物种鉴定比对工具比较
为验证默认Bowtie2端到端算法获得的映射,我们将其与Bowtie2局部模式、BWA-mem和BWA-aln生成的映射进行比较。对所有样本,BWA-mem达到高映射率(例如,平均247,151个reads比对至Y. intermedia,而Bowtie2端到端、Bowtie2局部和BWA-aln分别为6062、5867和6449个reads)以及更高覆盖广度值(80%对比其他方法平均10%)。这主要通过减少read长度和插入大小实现,表明该映射算法在其默认配置下表现出较不严格行为且物种水平无辨别力。至于其他三种算法,它们在每样本映射reads数、覆盖广度和BER值方面产生可比结果(图3显示Y. intermedia结果)。因此,三种严格映射方法对耶尔森菌属物种的确定相似(图S1b,c)。
3.3 应用于潜在致病细菌物种检测
由于其先前分析中的一致性能,Bowtie2端到端算法与单物种数据库用于鉴定我们的目标细菌物种。使用上述鉴定过滤器,我们确定了138个阳性检测,属于26个不同物种(图4)。最常检测到的物种是Fusobacterium necrophorum和Morganella morganii,各在13个样本中发现。值得注意的是,除一个样本外,所有样本至少包含我们列表中的一个物种。覆盖百分比起始于0.26%,高达一个样本中Shigella sonnei的91.73%。阳性鉴定的平均MAPQ值接近最大值(范围39.66至42)。志贺菌属(Shigella)三种物种和Escherichia coli(四个非常密切相关物种)在几个样本中共同检测到。五个具有最高覆盖深度的样本的维恩图显示这些物种共享大多数reads(图S2),表明样本中仅存在其中一个物种。使用组合Bowtie2数据库分析细菌基因组时,大多数物种观察到类似的鉴定模式(图S3)。然而,在此配置中,仅两个样本被鉴定为志贺菌-埃希菌物种组阳性,且每样本仅该组一或两个物种。
表1提供了在淡水生态系统中具有 documented relevance 的一组已鉴定细菌物种的详细信息,包括其相关病理学以及发现这些微生物引起疾病的野生动物物种实例。
3.4 伊比利亚沟齿鼩种群整体健康评估
基于覆盖广度的PCA显示大多数伊比利亚沟齿鼩样本聚集在一起,但分析揭示了五个异常值,其中两个特别明确(图5)。这些异常值通常具有我们目标细菌列表中的大量物种和高覆盖广度。四个具有非典型模式的沟齿鼩来自Endrinal,而一个属于Adaja水文单元(表S1)。
4 Discussion
4.1 从粪便样本检测潜在病原体的比对方法验证
本工作中,我们开发并验证了一种基于宏基因组测序获得的未组装reads映射至参考基因组的方法,以鉴定粪便样本中具有临床和兽医相关性的细菌物种。该方法与旨在分析微生物组一般组成的方法(如Kraken、Diamond或sylph)根本不同。相反,它更类似于人类疾病研究中使用的病原体检测方法,其主要目标是目标病原体的物种水平鉴定,如PathoScope、SURPI或Metapresence。据我们所知,尚无研究系统地将这些物种水平病原体检测方法应用于濒危野生动物物种。我们流程对野生动物健康监测的有效性通过其能够鉴定伊比利亚沟齿鼩粪便样本中潜在致病细菌物种而得到证明。系统分析了影响鉴定的几个因素以更好理解其影响、优化方法并指导其在不同计算条件下的应用。
我们显示不同严格比对算法如Bowtie2(两种不同模式:局部和端到端)和BWA-aln一致产生相似映射结果, thus similar species identifications 尽管算法差异,增强了它们提供准确物种分类能力的信心。
对于初始物种鉴定,我们使用基因组覆盖广度,如近期研究推荐,而非更传统依赖映射reads比例。该方法有助于避免由高度保守区域、重复序列或参考基因组污染引起的假阳性。然而,虽然覆盖广度优于基于深度的度量,但其本身不足以可靠鉴定,因它不区分随机分布在整个基因组的reads与聚集在少数特定区域的reads。最近引入Metapresence程序的BER和FUG参数评估参考基因组内reads分布的均匀性是一重大改进,因它们允许物种鉴定即使当少量reads被映射时。此外,对比对应用质量过滤器(如基于MAPQ和去除深度异常值)有助于最小化虚假reads对BER和FUG参数的影响,否则可能导致假阴性,特别是在精确参考基因组不可用时(图1)。尽管Metapresence程序作者的建议是考虑映射超过80个reads的比对,但我们使用覆盖广度阈值 instead,因它能更好适应不同大小的基因组甚至基因组片段。我们0.25%覆盖广度阈值对应于平均大小细菌基因组约60个映射reads,与Sanguineti等人使用的80个映射reads阈值相当。对我们的参考基因组集(表S3),此最小覆盖广度对应于约14至140个reads的范围,确保应用一致阈值至所有物种,无论其基因组大小。这些过滤器的组合使用能够去除非均匀比对,促进鉴定物种或其最近亲属存在于样本中。无BER和FUG,确保可靠物种鉴定将需要更高覆盖广度阈值(2%–3%),这会显著降低灵敏度。然而,最合适阈值可能因个体研究特定条件而异。例如,当分析高致病性或其他相关物种时,应考虑具有较低覆盖广度或映射reads数的样本进行进一步调查以确保全面监测。
与映射算法一起使用的参考数据库类型是另一关键因素,特别是对非常密切相关物种。我们在志贺菌和埃希菌物种组的结果(图4,图S2和S3)显示,当使用每个分析基因组的单数据库时,与数据库中密切相关物种的非特异性映射可能更高,导致它们之间更多共享reads。相反,使用所有基因组的组合数据库可能由于与低映射质量值的模糊映射而导致潜在阳性丢失。本质上,单物种数据库通常在密切相关物种中提供更高灵敏度,因它们专注于检测特定细菌而无与其他物种序列竞争,而组合数据库通过提供更广泛参考以区分相似物种提高特异性,尽管可能因模糊或低置信映射至多个物种而降低灵敏度。因此,应进行案例特异性验证以确定最适合所研究物种的数据库和检测标准,确保方法提供稳健鉴定。
4.2 对伊比利亚沟齿鼩保护的影响
理解濒危物种病原体负荷和多样性对告知管理策略至关重要,特别是在保护努力(如圈养繁殖和易地保护项目)背景下。在我们的研究中,我们在23个伊比利亚沟齿鼩粪便样本中鉴定出26种潜在致病细菌物种,具有 varying levels of genome coverage and prevalence。样本量非常有限,阻止任何结果概括。无疑,更大样本量,覆盖更广地理区域和不同时间点,将提供更全面理解该哺乳动物病原体流行率和多样性。尽管工作主要焦点是方法学,旨在开发可用于健康监测的策略,此试点分析也提供了关于伊比利亚沟齿鼩病原体存在和多样性的 essential baseline data。
一些检测到的细菌 certainly part of the normal intestinal microbiome,通常仅在动物某种免疫弱点时引起疾病。然而,发现的其他物种更 specific to the unique semi-aquatic niche of the desman。如表1所示,许多已鉴定物种已知在鱼类中引起感染,以及其他水生或半水生哺乳动物,包括欧洲水貂、美洲水貂、欧亚水獭、河狸、麝鼠、锦龟和池龟,以及水禽。在某些情况下,这些感染与这些动物疾病或死亡相关, underscore the potential severity of some of these pathogens。水生物种间病原体共享可能由水生环境可促进感染传播解释,传播病原体至广泛区域并潜在增加暴露于多种微生物威胁。因此,这些结果突出了伊比利亚沟齿鼩暴露的复杂且潜在致病微生物景观。
PCA(图5)揭示了伊比利亚沟齿鼩间细菌模式的 substantial variability,表明致病性或机会性细菌组成存在差异,这可能与评估分析个体健康状况高度相关。特别地,五个沟齿鼩作为PCA图中的明显异常值出现,表明非典型微生物特征。无特定细菌,而是它们的组合,似乎驱动这些沟齿鼩异常值的存在。仍不清楚这些沟齿鼩是偶然表现这些特征, due to a compromised immune system potentially related to inbreeding,或作为特定环境条件结果。异常值沟齿鼩的地理分布可能提供线索,因其中四个属于同一水文单元Endrinal,以致该亚种群中40%的沟齿鼩将具有 elevated or altered composition of potential pathogens。Endrinal河支持 significant livestock density(作者个人观察),这可能是该河流沟齿鼩独特潜在病原体模式背后的原因。然而,需要额外采样和该及其他水文单元的详细环境分析以更好理解这些病原体和机会性细菌的起源,以及驱动它们在一些个体和种群中改变存在的因素。
未来伊比利亚沟齿鼩病原体研究应包括该物种分布范围内不同种群和全年不同时间点,以理解种群健康趋势并优先保护最脆弱种群的努力。整合这些研究中遗传因素(如近交和突变负荷)分析,对理解它们对病原体负荷和易感性的影响至关重要。我们的结果表明此宏基因组工作流程可同时回收外源和宿主DNA,且一些样本中内源产量足以进行此类种群基因组分析(表S1)。此外,流行病学研究应作为优先事项以理解这些病原体如何传播,例如通过水或通过与其他野生动物物种接触,以识别潜在传播热点,如山区过度 livestock densities 或人类住区附近废水排放点,并评估它们对伊比利亚沟齿鼩种群健康和生存力的潜在影响。
4.3 方法挑战与前景
本研究通过提供监测微生物疾病的新颖有效方法,代表了濒危物种病原体检测方法的重大进展。尽管本研究基于捕获标本获得的粪便样本,该方法可应用于河流中获得的非侵入性样本,只要它们足够新鲜。为证明方法有效性,我们使用了136个细菌参考基因组数据集进行映射。我们聚焦细菌因其在数据库中相对良好的完整基因组代表性,以及其减少的基因组大小,这允许我们以合理计算努力测试各种参数和分析条件。病毒和真核病原体另一方面 presents different challenges for metagenomic detection,这超出了本研究范围。未来研究应应对这些挑战并优化生物信息学工具以检测此类病原体,因它们也能对野生动物物种整体健康和生存力产生显著影响。
对参考基因组数据库的依赖是映射方法的主要限制,特别是对较少研究物种如伊比利亚沟齿鼩。我们的结果表明,使用当前可用数据库可在伊比利亚沟齿鼩中发现大量具有致病潜力的细菌物种(136个分析物种中的26个)。许多这些细菌已知存在于人类和其他哺乳动物中,表明这些病原体是具有广泛宿主范围的通用细菌。由于伊比利亚沟齿鼩的特定细菌病原体尚未测序,无法使用此生物信息学方法检测;然而,给定所用方法的充分参数化,可检测数据库中存在的密切相关物种。然而,真核寄生虫物种往往更具宿主特异性,因此尚不清楚当前基因组数据库中存在的基因组(通常从人类或模式物种分离)是否将有助于检测伊比利亚沟齿