《Journal of Virology》:Limited effect of short- to mid-term storage conditions on an Australian farmland soil RNA virome
编辑推荐:
本文系统评估了土壤RNA病毒组在不同储存条件下的稳定性,发现直接冷冻保存(-80°C)3个月或冷藏(2°C–8°C)2周即可有效保持RNA完整性及病毒多样性,无需商用保存剂。研究从32个测序文库中鉴定出1,475种新型RNA病毒,多数属于微生物相关的Lenarviricota门,揭示了土壤作为RNA病毒多样性宝库的巨大潜力,为偏远地区环境病毒组研究提供了实用标准。
ABSTRACT
土壤是地球上最大且最多样化的微生物生命库之一,但其相关的RNA病毒研究远少于动物和水生系统。土壤中病毒的发现受到技术障碍的进一步限制,特别是难以获得足够高质量RNA用于测序。为解决这一问题,我们评估了一系列储存和保存策略,包括使用商用保存溶液和超低温快速冷冻,随后进行标准化RNA提取、测序和病毒发现流程。这项工作旨在建立最低样本储存要求,以保持RNA完整性、生成足够RNA测序数据,并随后实现可靠的土壤病毒组表征。虽然没有任何保存溶液被证明有效,但“原始”土壤样本在2°C–8°C和-30°C下至少稳定2周,在-80°C下至少稳定3个月,RNA质量、测序数据或病毒丰度和多样性没有可测量的降低。从32个生成的文库中,我们鉴定出1,475种推定的新型RNA病毒,其中大多数属于微生物相关的Lenarviricota门。几种新型病毒与其他环境来源的序列形成 divergent 簇,与传统的动物相关科(如Astroviridae和Picornaviridae)远缘相关。此外,Picobirnaviridae、Alsuviricetes、Ghabrivirales和Amabiliviricetes内的独特簇仅包含澳大利亚病毒,表明存在区域特异性进化。这些发现共同凸显了土壤作为RNA病毒多样性的丰富库,并为储存提供了实用的最低标准,扩大了研究RNA病毒在陆地系统中生态和进化作用的机会。
IMPORTANCE
RNA病毒是地球上最丰富和最多样的生物实体,可能存在于所有其他生物和生态系统中,包括土壤中的无脊椎动物、微生物和植物。尽管如此,它们在土壤系统中的多样性和作用仍然很大程度上未知。保存和从土壤中提取足够数量RNA的方法学挑战阻碍了这些群落的研究。在这里,我们在系统测试不同保存策略的同时,从澳大利亚土壤中鉴定出1,475种先前未描述的RNA病毒。我们研究的意义在于证明快速冷冻土壤是一种可行且 robust 的储存策略,至少可保存3个月,同时也凸显了陆地环境中存在的非凡规模的病毒多样性。这项工作为可靠探索陆地RNA病毒奠定了基础,提高了更偏远环境病毒组的可及性,并使未来努力将其整合到更广泛的微生物生态学和生态系统功能模型中成为可能。
INTRODUCTION
陆地环境展现出丰富的生物多样性,包括植物、无脊椎动物、真菌、细菌和原生生物的复杂网络。这些生物以复杂的方式相互作用,调节分解、养分循环和植物健康,微生物群落组成与周围土壤的物理化学性质紧密相关。RNA病毒在这些土壤栖居宿主中广泛存在,也感染通过饮食、废物、腐烂和有机碎屑与土壤相互作用的动物。虽然病毒在水生环境中的作用已得到充分研究,涉及养分释放、微生物种群控制以及对宿主生存和多样性的贡献,但土壤病毒组的比较研究相对不足。
基于宏转录组测序的方法通过提供样本中所有复制生物(包括RNA病毒)的快照,使陆地RNA病毒生态学领域迅速发展。这些研究揭示了病毒组组成取决于土壤样本中的局部生物群系、地理位置、pH、有机碳含量和养分可用性等因素,以及土地利用、土壤类型和深度。这进而表明RNA病毒可能通过与土壤栖居宿主的相互作用,在维持土壤健康和调节生物地球化学循环中发挥自身作用。虽然DNA病毒已被提出具有此作用,但迄今为止,RNA病毒直接参与这些过程的证据有限。
先前的研究揭示了土壤中大量病毒的存在,NCBI/GenBank的非冗余蛋白质数据库中提供了来自环境宏基因组的超过16,000个Riboviria序列。微生物相关的RNA病毒群,如Leviviricetes、Narnaviridae、Mitoviridae和Botourmiaviridae,通常在土壤中发现,还有传统上认为与动物相关的病毒群,包括Astroviridae、Picornavirales和Nodamuvirales,尽管这些通常属于与其动物感染亲属远缘的谱系。此外,对公开可用环境数据集的分析,特别是序列读取档案中的数据,为病毒多样性的全球模式提供了见解,帮助解决了复杂的进化关系,并揭示了病毒-宿主动态。重要的是,环境数据集中的一些病毒可能代表对作物或牲畜具有致病风险的物种。事实上,RNA病毒,如烟草花叶病毒、马铃薯X病毒和甜菜坏死黄脉病毒,可引起作物广泛疾病,对农业产业造成毁灭性经济后果。作物销毁是控制病毒爆发的主要手段,因此,早期检测对于减轻病毒进一步传播和最小化作物损失至关重要。最近,在澳大利亚野生动物肠道内容物的宏转录组测序数据中检测到植物病原体 ribgrass mosaic virus。因此,宏转录组测序为监测环境样本中潜在植物病原体的存在提供了一种可行方法。随着土地利用集约化和气候变异性加剧,了解土壤中的病毒库对于预测新出现的植物疾病风险至关重要。
尽管宏转录组测序具有实用性,但其应用可能受到从土壤样本中提取足够高质量RNA的困难的阻碍。土壤RNA容易受到微生物RNase活性的快速降解,以及土壤固有特性(如温度、pH、金属离子和湿度驱动的水解或氧化)的影响。此外,病毒序列很容易被测序数据集中的宿主转录本淹没,限制了检测和表征机会。因此,在返回实验室设施之前提取和仔细储存土壤样本至关重要,特别是在偏远地区,长时间冷冻储存不可行。这些限制可能使全球病毒组数据偏向易于访问、资源丰富的地区,使大多数陆地生态系统未被开发。改进RNA保存和提取方案将能够在不同生物群系中进行更具包容性的采样,扩展已知的RNA病毒圈,并有助于揭示病毒组组成与土壤特性之间的精确关系。此外,访问偏远环境病毒组将改善全球病毒监测,从而监测农业风险。
在这里,我们比较了从悉尼两个地点收集的土壤样本在不同温度下储存长达3个月的RNA提取成功率,以及随后测序结果中的病毒丰度和多样性水平。测试了三种商用保存溶液,以及未添加保存剂的“原始”土壤。我们模拟了环境宏转录组研究中常见的样本收集与长期储存在实验室设施之间的延迟,以及冷冻与提取之间的延迟,随后采用已建立适用于多种样本类型(包括土壤)的一致提取和数据处理方案。我们假设RNA产量和质量会随时间降解,并且 warmer 温度将提供比在较冷温度下快速冷冻的样本更低的病毒丰度和多样性。通过模拟 realistic 延迟和储存条件,我们旨在为实地工作规划提供信息并提高土壤病毒组研究的可重复性,提供经过验证的保存和储存方案,使从土壤中提取高质量RNA成为可能。
RESULTS
RNA extraction success rates and sequencing data generation
储存在RNA PowerProtect或RNAlater中的土壤样本(即2022年9月和2023年2月从Marrickville, NSW收集的第一批采样时间点的所有样本)未产生可量化数量的RNA,因此未准备进行测序。虽然DNA/RNA Shield似乎产生了适当浓度的RNA,但进一步的质量控制措施表明RNA降解严重,无法成功生成测序文库。在Camden, NSW(2023年4月),同时收集了无保存剂的土壤和保存在DNA/RNA Shield中的样本。使用DNA/RNA Shield再次导致降解的RNA无法生成测序文库。相比之下,无保存剂的土壤确实产生了足够的RNA并产生了高质量的测序数据,表明在采样后尽早快速冷冻土壤至-80°C比使用保存溶液在使用方法中概述的提取、文库制备和测序方案下更可靠地保存RNA。随后对储存在2°C–8°C、-30°C和-80°C的原始土壤进行的较短试验(2023年9月,也在Camden)同样成功,表明土壤在较暖温度下至少可以储存2周,并且仍然可以产生可行的RNA用于测序和下游分析。
总共构建了32个测序文库,这些文库来自Camden(位于悉尼西南部,NSW)的土壤样本中提取的RNA。前8个文库(以“L”开头的文库)代表了2023年4月收集并在-80°C下储存长达12周的土壤的较长试验。这些文库构成表1中所示的“数据集1”。其余24个文库来自2023年9月收集并在2°C–8°C、-30°C和-80°C下储存长达2周的土壤(分别以“C”、“T”和“E”开头的文库)。为清晰起见,这些文库将统称为“数据集2”(表1)。提取的RNA浓度、RNA完整性和测序数据产量详见图S1。重要的是,未发现这些因素与储存条件之间存在统计学显著关系。
这32个文库产生了大约23.8亿条序列读取,其中1040万条与领域Riboviria、界Orthornavirae(即RNA病毒)内的参考序列具有序列相似性。这些读取随后被组装成超过700万个重叠群,初步blast结果表明12,568个重叠群与已建立的RNA病毒具有序列相似性。随后的系统发育分析显示,其中一部分与参考序列错位或差异太大,无法 confidently 归属于RNA病毒分类群,从而将用于统计分析的工作数据集减少到7,307个重叠群。病毒读取丰度计算为比对到RNA病毒序列的读取数除以测序文库中的总读取数乘以100。在数据集1中,病毒读取丰度范围从L8B(在-80°C下储存8周)的0.07%到L2A(储存2周)的0.26%(图1A)。构成数据集2的样本的丰度相对较高,范围从T10B(在-30°C下储存10天后提取)的0.28%到E15A(在-80°C下储存15天)的1.56%(图1A)。有趣的是,尽管E15A具有相对较高的病毒读取丰度,但其Shannon多样性指数也最低,为0.46。因此,高病毒丰度与高多样性不相关。映射到Leviviricetes的读取占文库E15A中病毒读取的90%,导致病毒读取丰度 remarkably 高,但Shannon多样性指数相对较低。反过来,最高的Shannon多样性指数1.74出现在C15B(在2°C–8°C下储存15天后提取)中,其在数据集2中的病毒读取丰度也第二低,为0.33%(图1B)。
Effect of storage temperature and time on RNA virome composition
比较了不同储存温度和收集与提取之间时间长度的病毒读取丰度和alpha多样性指数,以确定它们对病毒组组成的影响。虽然在-80°C下储存2至12周的样本(数据集1)具有显著较低的病毒读取丰度(图2A)和丰富度(图2B),但这些样本是在不同时间收集的,因此无法与储存长达2周的样本(数据集2)直接比较。此外,这些样本储存12周期间,病毒读取丰度或alpha多样性没有下降(图2)。因此,数据集1和2之间病毒组组成的任何差异都归因于收集时原始样本组成的差异。数据集2中的病毒读取丰度(图2A)或丰富度(图2B)也没有观察到差异,并且任何文库之间的Shannon多样性指数没有显著差异(图2C和D)。这些结果表明,土壤样本在-80°C下储存至少2个月后保持完整,并且在冷藏温度(2°C–8°C)或更冷温度下至少稳定2周,无需添加保存溶液。
总体而言,RNA病毒门Lenarviricota的成员占病毒读取的绝大多数(85%)。具体而言,Lenarviricota内的噬菌体类Leviviricetes在生成的土壤病毒组中占主导地位,占病毒读取的57%,而主要与微生物相关的科Narnaviridae、Mitoviridae、Botourmiaviridae、Partitiviridae和Picobirnaviridae也存在于每个文库中,尽管通常比例较低(图3A)。
数据集1和2之间的病毒组组成存在显著差异,这可能是由于这些样本是在两个不同时间点(2023年4月和9月)收集的,并且来自Camden内略微不同的位置。数据集2的土壤中Nodaviridae和Partitiviridae的比例较高,前者在数据集1中检测不到。数据集2中还有更多与未分类病毒序列的匹配。相反,数据集1中Mitoviridae、Ghabrivirales和Durnavirales-like序列(即那些不属于任何已建立的Durnavirales科的序列)的比例较高。特别是,映射到Durnavirales-like和Ghabrivirales序列的读取在数据集2的所有文库中缺失,除了一个和两个文库(分别为T5A和T5B/T15A)(图3A)。为了进一步研究这些病毒组组成的差异,我们构建了一个Bray-Curtis相异矩阵,并使用非度量多维尺度(NMDS)进行可视化(图3B)。这揭示了数据集1和2之间的 clear 区别,PERMANOVA检验支持(P = 0.001)。对方差同质性的进一步检验显示每组内的变异性没有显著差异(P = 0.34),证实病毒组组成受到两个不同收集时间的显著影响。
Identification and phylogenetic analysis of novel viruses
尽管成功的土壤病毒组测序仅在一个地点进行了两次,但本研究共鉴定出1,475种新型病毒序列(图4)。这些病毒跨越五个最大的RNA病毒门,包括具有正链、负链和双链基因组的病毒。虽然环境样本的病毒组通常包含大量微生物相关的Lenarviricota门,但本研究中鉴定的新型病毒中 remarkably 有90%(1,334个序列)属于该组。
本研究中鉴定的新型病毒的潜在宿主基于相关参考序列的已知宿主进行了 broad 预测。系统发育聚类模式表明,具有细菌和真菌宿主的病毒分别占新型序列的52.4%和41.9%,1.8%和1.1%可能具有植物和无脊椎动物宿主。其余2.8%的序列与具有已知宿主的参考序列差异太大,无法 confidently 分配宿主生物。未鉴定出脊椎动物相关病毒。尽管植物相关病毒的比例相对较低,但这26个序列涵盖了具有正链(Tombusviridae)、负链(Qinviridae、Yueviridae)和双链基因组(Durnavirales)的群。相比之下,772种新型细菌相关病毒仅包含两个谱系——类Leviviricetes和最近提出的噬菌体科Picobirnaviridae。预测具有无脊椎动物宿主的病毒(有16种)在Nodamuvirales、Permutotetraviridae和Birnaviridae中被鉴定出来,而618种可能真菌相关的序列跨越了Lenarviricota、Negarnaviricota和Ghabrivirales内的科。值得注意的是,42个无法分配宿主生物的群中的35个与传统的脊椎动物相关科(包括Astroviridae、Picornaviridae和Sedoreoviridae)远缘相关。其余七个与Alsuviricetes的植物和真菌相关成员有一些序列相似性,但也差异太大,无法 confidently 分配宿主。
Positive-stranded RNA virus families
此处鉴定的大多数病毒多样性落在三个主要为正链的RNA病毒门内——Lenarviricota、Pisuviricota和Kitrinoviricota。我们在这些门中的每一个以及尚未分配更高分类学分类的科Permutotetraviridae内鉴定了新型病毒。我们现在依次描述这些群组。
Lenarviricota
正如在环境样本中经常观察到的那样,在Camden, NSW的采样点观察到的大多数病毒多样性属于微生物相关的门Lenarviricota。在该门鉴定的1,334种新型病毒中,751种属于噬菌体类Leviviricetes(图S2),49、91和380种分别属于科Narnaviridae、Botourmiaviridae和Mitoviridae(图S3至S5)。后三个科主要与真菌相关,但也包含感染植物的物种,并已在从脊椎动物和无脊椎动物样本生成的几个宏转录组数据集中检测到。其余63种病毒落入一个尚未正式分类但非正式称为Narliviridae的“narna-like”病毒进化枝(图S6)。该门中的几种新型病毒在数据集1和2中都被鉴定出来。具体而言,在2023年4月和9月收集的样本中检测到29种leviviruses、四种narnaviruses、六种botourmiaviruses、14种mitoviruses和五种“narliviruses”(图S2至S6)。
在两个主要Mitoviridae谱系之间,系统发育新颖性水平存在 noticeable 差异。在第一个进化枝中,大约三分之一的序列是新型的(1,116个中的371个)。第二个进化枝较小,有318个序列,只有九种新型mitoviruses(约3%)属于该进化枝(图S5)。在Narnaviridae中观察到类似的差异,只有五种新型narnaviruses存在于一个包含163个序列的谱系中(该谱系也包含两个正式批准的Narnaviridae物种),其余44个分布在总共包含121个序列的两个谱系中(图S3)。这表明一些病毒谱系感染在Camden土壤中丰富的宿主,而其他谱系则依赖于并非每个样本中都存在的特定生态条件。相比之下,科Botourmiaviridae的每个属中都存在新型病毒(图S4),表明该科要么与有限范围的微生物宿主相关,要么与在采样环境中同等活跃的宿主相关。
Astroviridae
虽然astroviruses通常被认为是动物的肠道病原体,但最近对环境样本的宏转录组研究 substantially 扩展了该科的多样性。我们在所有四种储存温度下鉴定出15种新型astrovirus-like序列,每个时间点都有代表。这些序列属于一个高度多样化的环境astroviruses进化枝,先前在澳大利亚种植和牧场农田以及澳大利亚河流沉积物和新西兰河水中被鉴定出(图5A;图S7)。
Picornavirales
与Astroviridae类似,本研究中鉴定的所有新型picorna-like病毒都属于一个 divergent 进化枝,该进化枝与与脊椎动物宿主相关的Picornaviridae成员没有稳健比对。相反,这14种新型序列(在所有四种储存温度下都有代表)与来自澳大利亚和中国农田和沉积物样本以及中国海洋无脊椎动物宏基因组的 divergent picorna-like病毒聚类(图5B;图S8)。该进化枝可能代表Picornavirales内一个新的、独特的科。
Alsuviricetes
Alsuviricetes是一个具有 broad 宿主范围的病毒大类,涵盖脊椎动物、无脊椎动物、植物和真菌。该类别中的 notable 物种包括alphaviruses,如基孔肯雅病毒和罗斯河病毒,以及几种作物植物病原体,包括烟草花叶病毒、马铃薯X病毒和甜菜坏死黄脉病毒。尽管它们的宿主范围很广,但此处收集的数据中Alsuviricetes内的新颖性有限,仅在科Alphaflexiviridae中鉴定出一个 divergent 序列(图S9A),临时命名为Camofronuj病毒(E10B_k141_32818)。基于中点根植系统发育,该病毒形成了与植物和真菌相关属Allexvirus、Botrexvirus和Platypuvirus的姐妹谱系。在数据集2中鉴定出另外六种新型序列,它们属于一个澳大利亚河岸和牧场农田样本的进化枝,该进化枝差异太大,无法与Alsuviricetes中已建立的科进行稳健比对(图S9B)。由于构成该组的所有21个序列,包括15个参考序列,均来自澳大利亚样本,这代表了一个地理上独特的病毒进化枝。
Nodaviridae
在2°C–8°C下冷藏并在-80°C下冷冻长达2周的样本中,总共检测到九种新型noda-like病毒(图S10)。其中两种属于Alphanodavirus属的亲属,与海南森林noda-like病毒具有70.5%和80.2%的氨基酸同一性。还鉴定出一种高度 divergent 的betanoda-like病毒。其余六个序列在一个主要由环境noda-like病毒组成的第三个进化枝内聚类,但该进化枝也包含alphanodavirus Pariacoto病毒。虽然该进化枝作为betanodaviruses的姐妹进化枝,但该节点的支持度相对较低(图S10)。因此,该进化枝的位置无法可靠确定;然而,这种拓扑结构先前已被观察到,表明Nodaviridae内存在第三个属。
Tombusviridae
基于先前的土壤病毒组研究,鉴定出的新型tombusviruses少于预期,在两个不同的群组中仅鉴定出11个序列。首先,两个 divergent 序列落在已建立的Regressovirinae亚科成员之外(图S11A)。与Camocoruz病毒(C0B_k141_18012)相同的序列也在数据集1中检测到(序列L2B_k141_345471)。另外两个新型序列落在一个完全由环境样本中鉴定的tombus-like病毒组成的