综述:从许可到样本:解决欧洲高质量参考基因组生成的关键挑战

《Molecular Ecology Resources》:From Permits to Samples: Addressing Key Challenges for High-Quality Reference Genome Generation in Europe

【字体: 时间:2026年01月22日 来源:Molecular Ecology Resources 5.5

编辑推荐:

  这篇综述基于欧洲参考基因组图谱(ERGA)的经验,系统阐述了高质量参考基因组生成过程中,从伦理许可、样本采集、物种鉴定到核酸提取和生物样本库管理等关键环节的挑战与解决方案。文章强调了跨学科合作、标准化流程(如Darwin Core、MIxS)以及适应不同生物类群(如洞穴生物、脊椎动物细胞培养、单细胞真核生物)的特异性策略的重要性,为大规模物种水平参考基因组测序项目提供了实用指南。

  
2 伦理与许可
参考基因组测序通常涉及生物材料的收集和处理,有时甚至包括受保护或危险物种。因此,在进行任何采样之前,必须仔细考虑伦理、法律和行政问题。当标本或提取的材料需要跨越国际边界运输到实验室或测序中心时,挑战更大。在这种情况下,提前做好规划并与当地利益相关者保持开放、诚实的沟通至关重要。
《生物多样性公约》(CBD)建立了一个公平获取和利益分享的框架,确保各国对其遗传资源保有控制权。这催生了获取和利益分享(ABS)框架,规范了遗传资源的获取和使用方式,以及由此产生的利益如何在提供国和使用国之间共享。在许多司法管辖区,这些ABS义务通过《关于获取遗传资源和公正和公平分享其利用所产生惠益的名古屋议定书》及其国家执行措施来实施,在收集或出口标本进行基因组工作之前,可能需要正式的名古屋相关获取许可,包括事先知情同意(PIC)和共同商定条件(MAT)。本质上,这些协议的建立是为了防止过去滥用生物多样性的情况重演,并促进负责任、公平的研究。此外,地区性措施如《伯尔尼公约》、欧盟《野生动植物贸易条例》(EC 338/97)、《粮食和农业植物遗传资源国际条约》(ITPGRFA)、《联合国海洋法公约》(UNCLOS)以及《国家管辖范围以外区域海洋生物多样性的养护和可持续利用协定》(BBNJ)也在指导欧洲的参考基因组项目方面发挥着重要作用。
全球协议通常需要国内立法将其条款转化为可执行的行动。因此,地区性指令,如欧盟鸟类和栖息地指令,禁止捕获、饲养、出售、运输或杀害受保护物种,同样禁止干扰它们或破坏其栖息地。研究人员可能需要获得对受保护类群进行采样的许可,以及进入限制区域(如国家或地区公园)的许可。此外,当生物材料跨越国家或次国家边界时,通常需要进出口认证(例如,植物检疫或兽医许可),这些由不同的机构监管。这些过程通常涉及特定国家和地区的法规,因此提前规划并尽早联系相关机构可以减轻延误。
确定哪些法律或法规适用于特定物种或栖息地、识别所需的许可以及了解如何获得这些许可可能具有挑战性,特别是在研究人员在本国以外工作时。语言障碍、国际条约的不同执行情况以及地区法律复杂性增加了难度。为了解决这些问题,研究人员可以依赖专门的平台,例如CBD秘书处下的获取和利益分享信息交换所(ABSCH),该平台整合了国家的ABS措施、许可和联系点,并提供关于国家特定要求的指导;《濒危野生动植物种国际贸易公约》数据库,是CITES管制物种的权威参考,包括贸易限制和所需文件;国家或地区网站,详细说明具体规则;以及具有实践经验的非政府组织、科学收藏、专业学会或研究网络。
在许多地区,当地社区和原住民与本地物种和生态系统有着长期的关系。根据当地习惯法或更广泛的伦理准则,可能需要与这些群体进行协商或建立伙伴关系。建立伙伴关系也是良好实践,以确保采样、数据解释和发布尊重社区权利、文化实践和传统知识。实际的起点包括识别相关的社区机构(例如,部落或地方议会、原住民组织或社区保护团体),向国内合作伙伴征求关于合适联系人的建议,并为采样开始前的会议以及测序和分析完成后分享见解的会议分配时间和预算。早期的对话应澄清研究目标、潜在风险和收益、关于认可的期望、数据访问和使用,以及如何回馈结果和非货币性利益。在可能的情况下,研究人员应遵循既定的原住民研究伦理和数据治理框架,例如集体利益、控制权、责任和伦理(CARE)原则,以及与原住民社区进行基因组研究的学科特定指南。即使法律没有强制要求正式程序,建立基于透明和互惠的关系也应成为标准,从而形成更公平的伙伴关系和更稳健的科学。
3 样本与元数据收集
一旦确定了采样地点并获得或即将获得相关许可,采样活动本身需要仔细规划,以避免对目标物种或其环境造成不必要的伤害,或因样本不符合最低要求而增加重复出差的成本。关键步骤包括野外采集、标本和组织凭证保存、文件记录(包括元数据收集)、分类学鉴定和样本保存。不同的情况可能需要不同的方法:在偏远或难以到达的地区用液氮快速冷冻保存组织或血液,需要额外的规划和其他设备,而将整个活体生物带回实验室进行进一步处理则另当别论。从自然历史收藏或其他基因组资源收藏中已收集的材料中取样可以大大减少这些挑战,前提是材料的保存方式与下游基因组测序兼容。这种特殊情况将在下文单独讨论,而本节适用于从野外或活体收藏(例如,动物园、植物园)中取样。本节的建议与作为清单总结的“野外工作前、期间和之后”阶段相一致。
作为一般规则,确保将高质量、记录良好的遗传物质带入实验室的主要原则是:(1)尽可能长时间保持组织或细胞的活力;(2)为保存的样本维持连续的冷链;(3)尽可能早地验证物种身份(最好在处死/冷冻之前);(4)使用标准化格式(例如,ERGA清单、Darwin Core、关于任何[x]序列的最小信息[MIxS])收集尽可能多种类型的凭证(标本、组织、DNA、图片)和元数据(时间、坐标、地点描述、环境条件和其他背景信息)。通过使用这种方法,不仅保留了生物材料的完整性,还为未来的研究提供了丰富的背景框架,实现了可重复性并促进了数据重用。这同样适用于“易于采样和易于处理”的目标物种,以及对于体型小、稀有、隐秘或后勤上难以获取的更具挑战性的类群。
在许多参考基因组项目中,许可限制了可以采样的个体数量,将采样限制在非致命性方法(例如,仅从濒危鸟类或哺乳动物身上取血),或者限制了可以移除的组织量。在这种情况下,必须在野外工作之前确定实验设计和样本使用优先级。一个实用的方法是提前定义样本和组织分配计划,指定哪些检测是必需的(例如,HMW DNA、3C、用于注释的RNA、条形码、凭证组织、照片),以及它们将如何从每个标本/样本中衍生。只要可能,应收集样本,以便单个捕获事件支持多个下游工作流程,例如,将全血分离成既能提供HMW DNA又能提供活细胞的部分,或者将小的非致命活检与高质量的整个生物体照片和环境元数据配对。当样本数量严格受限时,项目应进行协调以避免对相同材料的竞争性使用,并且实验室应在使用稀有样本之前,在非关键材料上试点提取和文库构建方案。在规划期间与博物馆和生物样本库密切协调有助于确保有限数量的许可标本在基因组分析、长期保存和形态学凭证保存之间得到最优分配。
3.1 收集、处理时间和保存
核酸,包括高质量组装所需的HMW DNA和功能注释所需的RNA,在生物体死亡后会迅速降解,因此快速有效的保存是首要任务。通常,样本保存前的处理时间必须最小化,并且温度应维持在超低温(ULT)条件(-70°C或以下),这对于大多数生物样本的长期储存是足够的,并且比在-80°C下运行更节能。对于无法活着带回实验室或体型过大无法整体收集的物种,野外保存至关重要:理想情况下,组织应在液氮(-196°C)中快速冷冻或置于干冰(-78.5°C)上。例外情况包括例如血液样本,可能受益于收集在充满乙二胺四乙酸(EDTA)的试管或其他专门的储存缓冲液中,以在进一步处理前保持样本质量。然而,基于EDTA的保存会影响组蛋白完整性,并且与所有3C方案不兼容。某些工作流程对EDTA的耐受性比其他工作流程更强,而某些商业Hi-C试剂盒明确建议不要使用EDTA保存的材料。因此,在选择保存缓冲液之前,指定预期的下游应用(例如,仅标准DNA测序 versus 还包括Hi-C或其他3C方法)并遵循所选试剂盒或方案的建议非常重要。液氮(通常在吸收材料衬里的“干式运输罐”中运输)和干冰(在绝缘容器中)需要特殊的护理和处理技能。根据容器设计、外部温度和处理情况,这些系统可以维持ULT数天至数周,并且如果符合航空公司规定(如国际航空运输协会的特别规定A152),通常可以作为行李运输。然而,它们仍然带有后勤和监管限制,其有效性取决于在整个运输过程中保持低温;如果在长时间运输过程中不补充干冰或液氮,温度可能迅速升高并损害样本完整性。
在无法实现如此低温条件的情况下,替代方法可能会延迟核酸降解。对于许多动物类群(脊椎动物和无脊椎动物),将组织立即浸入96%乙醇中(组织与乙醇的最小比例为1:10 [v/v]),随后在冷藏条件下保存最多7天,仍然可以产生高完整性的DNA。在可能的情况下,在最初的1-3天后更换乙醇有助于抵消组织衍生水的稀释并保持高有效酒精浓度。将活组织活检保存在细胞生长培养基和抗生素中,置于4°C,用于后续细胞培养,或者运输活体生物(例如,种子和鳞茎)对于某些类群可能是可行的。对于RNA保存,广泛使用RNAlater或TRIzol等试剂,但TRIzol有毒且易挥发,因此其在野外的使用和运输需要适当的人员防护设备(包括护目镜,在通风不良的情况下还需要呼吸防护)、仔细的标签和处置,并遵守有关危险化学品的当地法规。对于没有广泛分子实验室经验或专用化学安全基础设施的野外团队,我们因此推荐优先使用非危险的保存溶液,如RNAlater或类似缓冲液,并将基于TRIzol的工作流程保留在受控的实验室环境中。较新的N,N-二甲基乙酰胺基产品(例如,AllProtect, DNA-Guard)提供部分DNA保护,但可能影响下游应用,如3C。
尽管活体材料通常是提取高质量DNA/RNA的理想选择,但至少部分标本仍应作为组织凭证保存,这使得样本保存在基因组生成项目中不可避免。如果不可能(例如,非常小的生物体完全用于提取),则应保存来自同一物种、种群和采样事件的一个或多个额外个体作为代理凭证,即代表被测序个体的一个或多个额外个体。在实验室中,标准方法是在清洁、冷却的表面上(例如,放在(干)冰或液氮上的玻璃或金属板)解剖清洁并可靠鉴定的生物体(如有必要),然后将组织收集在预标记和预冷的试管中,使用长镊子在液氮中快速冷冻,同时佩戴隔热手套、长袖和护目镜。对于植物、藻类和真菌,在快速冷冻之前冷却解剖表面可能会适得其反,如果它导致萎蔫。相反,优先考虑是尽可能长时间保持组织膨胀。应注意避免混淆样本:在冷冻前对每个试管标签和内容物进行精确记录或拍照,同时记录样本在储存盒中的坐标,可以防止标签在冰箱中变得难以辨认时的混淆。此外,使用专为低温条件设计的试管和标签很重要,因为并非所有材料都耐极端温度,可能会降解或剥落。一旦快速冷冻,样本必须在干冰上携带,并在ULT下储存直至进一步处理。在野外,此程序必须适应后勤限制,这通常又排除了使用复杂的实验室设备或可靠的冷链存储。
3.2 物种鉴定
准确鉴定收集的物种对其基因组序列的效用至关重要。理想情况下,由合格专家进行鉴定,尽可能在野外进行,尽管通常需要在实验室进行形态学检查以区分微小的形态特征。对于来自植物园的材料的性繁殖后代,由于杂交风险高,通常应排除在参考基因组测序之外。同样的谨慎适用于杂交可能成为问题的其他类群,例如来自水族贸易的许多鱼类物种,以及来源不明的圈养个体。
除了“连接”单独的标本(一些用于基因组测序,另一些作为形态学凭证存入收藏)之外,DNA条形码可以作为分类学鉴定的额外证据线,特别是对于隐秘类群,尽管DNA条形码在密切相关的类群中可能无法鉴定到物种水平。在DToL项目内,DNA条形码已被形式化为一个用于物种鉴定和样本分流的标准化框架,为将条形码整合到参考基因组工作流程中提供了一个实用的模板,ERGA和其他地区节点可以适应其自身背景。然而,必须谨慎解释条形码结果,因为细胞器标记分辨率低,通常无法区分年龄小于一百万的物种,和/或可能在甚至属于不同属的更古老的物种之间发生渐渗。合适的标记因类群而异,分类学专家可能有助于此选择。然而,对于某些分类群,可能没有专家可用,这凸显了参考基因组时代对训练有素的分类学家的持续需求,以及将凭证标本存入公认收藏以供未来验证和研究的重要性。只要可行,我们建议将专家形态学鉴定与标准化DNA条形码工作流程相结合,使用适合类群的标记、照片和组织类型,并将条形码序列存入公共存储库(例如,生命条形码数据系统BOLD,或国际核苷酸序列数据库合作组织INSDC)。这些项目级别的条形码SOP提供了逐步指导,各个实验室可以适应其自身的类群和基础设施。
3.3 凭证保存、生物样本库和元数据收集
为了最大化高质量基因组序列的价值并将其建立为长期参考,应辅以适当的元数据和凭证。这一原则在最近关于凭证在基因组学和开放科学中的作用的综述中得到了强调,我们的建议在这些工作的基础上,在参考基因组取样的特定背景下提出。凭证的外观可能因采样的类群而异,但应始终包括物理标本,并在可行的情况下,包括整个生物体的摄影图像,最好在活着时拍摄以捕捉自然颜色和形态。理想情况下,在组织采样用于基因组测序后,仍有足够的材料剩余,以便仍然可以存入整个生物体的形态学凭证。然而,一些类群由于体型极大或极小,或者具有柔软或无定形的组织,而给凭证保存带来挑战。例如,大型脊椎动物在收藏中可能仅由部分(如骨骼或头骨)代表,而非常大的植物则由带有叶子和生殖结构的枝条代表。相反,如果标本太小或损坏,来自同一物种和采集事件的额外样本,或至少来自同一地点、由同一位分类学家鉴定、并且理想情况下有遗传关联(例如,来自同一克隆家族或紧密相邻的真菌/地衣菌体)的样本,可以作为代理凭证。
用于未来遗传学研究的组织样本也应与形态学凭证和基因组相关联保存。理想情况下,这些是快速冷冻的活细胞,与测序材料一起保存,但质量较低的样本,例如,在96%乙醇中或植物硅胶干燥的样本,可以作为替代品。为了使凭证永久可查找和公开访问,必须将它们存入具有稳定标识符(通常包括机构缩写、收藏缩写和收藏号)的科学收藏中,并在出版物和未来研究中引用。然而,单个标本的多种制备物(例如,解剖或分开储存的部分、图像和相关的序列数据)通常会获得单独的标签和标识符。记录和交叉引用这些标识符对于准确的文件记录和可追溯性至关重要,特别是随着数字化工作越来越多地产生“数字标本”,即补充物理凭证的在线表示。
在许可申请过程中,也就是在野外工作之前,建议咨询博物馆馆长、收藏经理以及类群和野外专家,以确定所讨论类群最合适的凭证材料。虽然某些类型的博物馆收藏有公共列表,例如植物标本馆,但其他可能只能通过通用数据库找到,例如GenBank生物收藏或全球科学收藏注册库。由于只有少数(如果有的话)机构有专门研究大多数分类群的员工,因此聘请外部分类学家或有经验的野外研究人员可以填补这一空白。早期沟通确保从开始就解决凭证保存要求。这有助于标本在到达博物馆或其他科学收藏时得到适当的保存、储存和文件记录,并对分类学研究产生实际价值。
经典的形态学凭证包括:无脊椎动物的针插或乙醇/福尔马林保存标本;鱼类和两栖动物的福尔马林固定、乙醇保存的整体标本;鸟类和哺乳动物的研究皮张、骨骼或剥制标本;植物的植物标本册或胶囊;宏观真菌的子实体;以及微观真菌的干燥琼脂培养物。可培养的微观真菌的培养物或孢子悬浮液,以及单细胞真核生物的培养物或长期冷冻保存的稳定培养物,应存入可通过欧洲培养物收藏组织找到的专业培养物收藏。单细胞生物的固定标本,例如在显微镜载玻片上或作为电子显微镜制备物,也可以作为有价值的形态学凭证,尽管到目前为止,还没有通用的存储库系统地存档这些材料。细胞、组织或血液样本,以及用于未来分子工作的DNA/RNA提取物,应在专业生物样本库中管理,最好隶属于全球基因组生物多样性网络。
只要可能,凭证最好存放在其收集地附近。生物体在其栖息地的照片,特别是如果它太大而无法完整收集或其颜色在保存过程中丢失,在采样或保存前拍摄,或突出显示鉴定关键的微观特征,进一步增强了凭证的实用性。在后勤和伦理约束允许的情况下,收集重复标本或子样本使得既可以在原产国的本地机构存放材料,也可以在国际或专家收藏中存放材料,从而增加基因组资源使用的长期安全性、可访问性和公平性。同时,每个额外的凭证或组织样本都会给接收收藏带来实际的管理和财务成本。许多自然历史博物馆和生物样本库在空间、策展人员时间和运营资金方面长期受限,即使对凭证保存和数字化的期望在增加。因此,我们建议参考基因组项目将收藏经理视为全面合作伙伴。提前与策展人规划凭证保存策略,在资助申请中明确预算用于入库、长期储存和数字化,并在可能的情况下支持当地基础设施和培训。这有助于确保对更全面基因组凭证保存的呼吁与对其实现机构的可持续支持齐头并进。
虽然一般来说,任何可用的元数据都应被记录和保留,但同样重要的是以标准化数据格式存储它们以确保互操作性。偏好可能因收藏而异,但通用标准包括Darwin Core格式,用于形态学数据的ABCD标准,以及用于分子样本的GGBN数据标准。DToL项目已经展示了如何通过标本和样本元数据框架及相关样本清单将这些标准用于生物多样性基因组学。在此基础上,ERGA网络开发了一个开源元数据清单,将关键收藏元数据、样本ID、凭证稳定标识符和许可文档对齐为机器可读格式。该清单可以通过协作开放组学平台代理到INSDC,从而确保元数据质量并将每个参考基因组与其相应的元数据和凭证不可磨灭地链接起来。
3.4 样本运输
理想情况下,DNA/RNA提取和文库制备都应在同一实验室进行,以尽量减少样本或提取的核酸的运输,从而降低降解风险并简化管理流程。然而,不同的设施可能负责这些步骤。当运输变得必要时,无论是运往测序设施还是专业生物样本库,保持连续的冷链都很重要。这带来了与将保存的标本从野外运到实验室类似的挑战,因为可能又需要危险品,如干冰。如果干式运输罐运输不可行或成本效益不高,当前的最佳实践是在坚固的泡沫箱(壁厚至少4厘米)中用干冰运输样本,箱盖松散密封(例如,将泡沫容器放在稍大的纸板箱内),以便气态二氧化碳释放。可以从大约1.2米高处进行跌落测试,以验证包裹即使在粗暴处理下也能保持密封。对于大型运输,通常至少10公斤干冰(对应于箱内至少6.5升的体积)将在至少48小时内将内容物维持在大约-80°C。然而,最多几百个2毫升试管的小批量运输,如果绝缘适当,可能需要的干冰要少得多(例如,4公斤)。干冰运输,特别是跨境运输,必须包含UN1845/危险品第9类标签,标明干冰的初始净重、“易碎”标签和方向箭头。说明预期的交付时间范围也是可取的;避免在周末或公共假日运输。并非所有快递公司都提供干冰运输服务,因为处理这些包裹需要特殊培训,并且包裹中的干冰必须始终申报。一些快递公司提供干冰补充服务,如果包裹在运输途中延误(例如,由于海关控制),这非常宝贵。因此,建议提前与快递公司联系并特别要求此项服务,因为可能需要填写额外的文书工作。
除了冷却剂,样本本身需要足够的文件以便清关无误或解冻。必须包含所有必要的进出口许可(例如,针对CITES所列物种),受保护物种应附有相关的采集许可。虽然一些国家可能需要商业发票或明细表以确认货物具有最小的商业价值,但其他国家可能允许简单的价值声明,可能只需要反映运输和保险成本。在欧盟部分地区,对包装材料(例如,塑料使用或废物税)可能适用额外的声明或费用,应提前与当地海关办公室澄清。对于欧盟境内的运输,通常不需要海关申报,但应始终在包裹和随附文件上提供发件人和收件人的完整联系方式(包括电话号码)。对于进入或离开欧盟关税区的运输,通常需要CN 23海关申报表,以及(如果可用)机构税号或经济运营商注册和识别(EORI)号,以符合国家海关和邮政规定。用于科学收藏材料的协调商品描述和编码系统代码通常属于HS第97章(例如,HS 9705 2900)。除非特定法规另有说明,内容描述应明确说明样本是非危险生物材料,仅用于研究,不具有传染性或危险性。由于法规差异很大,特别是在非欧盟国家之间,可能需要额外的信息或文件。除了通常从事国际科学样本借阅和运输的博物馆馆长外,地方当局(例如,海关办公室、许可签发机构)或专业运输服务也可能提供指导。只要可能,提前与相关监管机构核实所有文件是谨慎的,以最大限度地减少在边境延误或合规问题的风险。
4 核酸提取
尽管测序技术不断进步,但制备高质量参考基因组所需的DNA或细胞核仍然是一项艰巨的任务,特别是对于非模式生物和体型小的生物体。与短读长或基于聚合酶链式反应(PCR)的方法不同,长读长技术目前的方案要求≥20 kb长的完整DNA分子,而3C方法需要整个细胞核保持完整。一般的注意事项,如使用宽口吸头、避免剧烈匀浆以及尽量减少高速离心,有助于保持分子完整性。商业试剂盒也可以促进HMW DNA或细胞核的提取,但这些通常针对具有丰富组织的模式物种进行优化。在许多非模式类群中,即使是标准的“PCR级”方法,例如基于CTAB的方法,也可以产生足够长的DNA,尽管应预期需要额外的时间和方法优化成本。研究人员还必须准备好接受样本之间不一致的结果,即使对同一物种使用相同的方案。
HMW DNA提取的典型挑战包括机械破坏真菌、地衣、珊瑚和各种原生生物中坚韧的细胞壁,或解决类群特异性污染物,如油脂、酚类、树脂、次生代谢物、色素和多糖。防止热量积聚——例如,通过预冷研磨块并用液氮重新冷冻——可以进一步减少剪切。具体来说,使用富含DNA且抑制剂较少的组织也可能有所帮助:睾丸或脾脏在脊椎动物中通常效果良好,而鳃在软体动物中优于足或套膜,尽管后者可能含有寄生生物。分生组织丰富的幼叶、嫩枝或芽通常比老的植物组织产生更多的DNA,并且被其他生物群污染的风险要低得多。从相关物种转移方案通常是一个好的起点,然而密切的亲缘关系并不总是转化为相似的提取性能,因此通常需要试点提取来确定合适的条件。
在测序之前,通常通过分光光度法(例如,Nanodrop)、荧光测定法(例如,Qubit或SYBR Green)和脉冲场凝胶电泳(PFGE)评估DNA质量。虽然Nanodrop或其他基于分光光度法的仪器提供了关于样品化学纯度的良好信息,但在评估DNA浓度方面不如荧光测定法(Qubit或SYBR Green),后者特异性测量双链DNA的量。根据ERGA内测序设施的经验证据,分光光度法和荧光测定法之间浓度测量值超过50%的差异是污染物残留的指标,这可能对文库制备效率有害并损害PacBio和ONT测序结果。
提取分子的完整性或片段长度最好通过脉冲场凝胶电泳(PFGE)评估,通常寻求≈20 kb的最小阈值用于长读长文库制备。使用Agilent FemtoPulse或FragmentAnalyzer是传统PFGE的良好替代方案,因为它有助于可视化高达165 kb大小的片段,并评估样品中降解DNA的比例。应注意不要使用Agilent TapeStation来估算HMW DNA片段长度,因为该仪器倾向于高估超过10 kb大小的分子长度。即使片段长度分布指标看起来有希望,传统方法无法检测到的污染物、单链断裂以及DNA脱氨基或脱嘌呤作用可能破坏测序输出,或引入测序伪影,例如错误的单核苷酸多态性(SNP)。当怀疑存在不需要的化合物时,扩增或文库清理可能提供临时解决方案,但严重受损的样本通常需要重新提取和重新测序。对于许多参考基因组项目,完善核酸提取是一个反复试验、验证和改进的过程。
为了简化这种优化,现在可以在开放存储库中获取针对特定类群和组织的HMW DNA标准操作程序(SOP)。例如,protocols.io上的Sanger Tree of Life湿实验室方案集合为主要真核生物类群提供了经过验证的提取和细胞核制备工作流程。在BGE/ERGA内,我们正在协调一套互补的采样和提取SOP,这些SOP通过Biodiversity Genomics Europe/ERGA空间在WorkFlowHub和protocols.io上发布,涵盖参考基因组和条形码使用案例。这些资源为从业者提供了具体的起点,直至试管类型、组织量和缓冲液组成,可以适应当地设施和目标类群。
4.1 高分子量DNA
尽管测序技术不断进步,但制备高质量参考基因组所需的DNA或细胞核仍然是一项艰巨的任务,特别是对于非模式生物和体型小的生物体。与短读长或基于聚合酶链式反应(PCR)的方法不同,长读长技术目前的方案要求≥20 kb长的完整DNA分子,而3C方法需要整个细胞核保持完整。一般的注意事项,如使用宽口吸头、避免剧烈匀浆以及尽量减少高速离心,有助于保持分子完整性。商业试剂盒也可以促进HMW DNA或细胞核的提取,但这些通常针对具有丰富组织的模式物种进行优化。在许多非模式类群中,即使是标准的“PCR级”方法,例如基于CTAB的方法,也可以产生足够长的DNA,尽管应预期需要额外的时间和方法优化成本。研究人员还必须准备好接受样本之间不一致的结果,即使对同一物种使用相同的方案。
HMW DNA提取的典型挑战包括机械破坏真菌、地衣、珊瑚和各种原生生物中坚韧的细胞壁,或解决类群特异性污染物,如油脂、酚类、树脂、次生代谢物、色素和多糖。防止热量积聚——例如,通过预冷研磨块并用液氮重新冷冻——可以进一步减少剪切。具体来说,使用富含DNA且抑制剂较少的组织也可能有所帮助:睾丸或脾脏在脊椎动物中通常效果良好,而鳃在软体动物中优于足或套膜,尽管后者可能含有寄生生物。分生组织丰富的幼叶、嫩枝或芽通常比老的植物组织产生更多的DNA,并且被其他生物群污染的风险要低得多。从相关物种转移方案通常是一个好的起点,然而密切的亲缘关系并不总是转化为相似的提取性能,因此通常需要试点提取来确定合适的条件。
在测序之前,通常通过分光光度法(例如,Nanodrop)、荧光测定法(例如,Qubit或SYBR Green)和脉冲场凝胶电泳(PFGE)评估DNA质量。虽然Nanodrop或其他基于分光光度法的仪器提供了关于样品化学纯度的良好信息,但在评估DNA浓度方面不如荧光测定法(Qubit或SYBR Green),后者特异性测量双链DNA的量。根据ERGA内测序设施的经验证据,分光光度法和荧光测定法之间浓度测量值超过50%的差异是污染物残留的指标,这可能对文库制备效率有害并损害PacBio和ONT测序结果。提取分子的完整性或片段长度最好通过脉冲场凝胶电泳(PFGE)评估,通常寻求≈20 kb的最小阈值用于长读长文库制备。使用Agilent FemtoPulse或FragmentAnalyzer是传统PFGE的良好替代方案,因为它有助于可视化高达165 kb大小的片段,并评估样品中降解DNA的比例。应注意不要使用Agilent TapeStation来估算HMW DNA片段长度,因为该仪器倾向于高估超过10 kb大小的分子长度。即使片段长度分布指标看起来有希望,传统方法无法检测到的污染物、单链断裂以及DNA脱氨基或脱嘌呤作用可能破坏测序输出,或引入测序伪影,例如错误的单核苷酸多态性(SNP)。当怀疑存在不需要的化合物时,扩增或文库清理可能提供临时解决方案,但严重受损的样本通常需要重新提取和重新测序。对于许多参考基因组项目,完善核酸提取是一个反复试验、验证和改进的过程。
为了简化这种优化,现在可以在开放存储库中获取针对特定类群和组织的HMW DNA标准操作程序(SOP)。例如,protocols.io上的Sanger Tree of Life湿实验室方案集合为主要真核生物类群提供了经过验证的提取和细胞核制备工作流程。在BGE/ERGA内,我们正在协调一套互补的采样和提取SOP,这些SOP通过Biodiversity Genomics Europe/ERGA空间在WorkFlowHub和protocols.io上发布,涵盖参考基因组和条形码使用案例。这些资源为从业者提供了具体的起点,直至试管类型、组织量和缓冲液组成,可以适应当地设施和目标类群。
4.2 用于染色体构象捕获的细胞核提取
与标准的长读长测序不同,3C工作流程需要完整的细胞核来捕获三维基因组结构,通过交联、片段化、连接和物理上在细胞核中彼此接近的DNA片段的成对短读长测序来实现。虽然HMW DNA分离的许多基本原理仍然适用,例如避免机械应力和防止污染,但重点转移到保持核膜完整性。新鲜或新鲜快速冷冻的组织(储存在ULT)通常比旧的或部分降解的标本提供更好的产量和质量。研究人员通常依赖商业试剂盒的方案,例如由Arima Genomics或Dovetail提供的那些,这些试剂盒从细胞悬浮液(例如,血液)或冷冻保存的组织开始,并包括用于交联、细胞裂解和DNA消化/连接步骤的专门试剂。因此,对于血液和其他液体样本,收集缓冲液的选择至关重要:高EDTA浓度的保存剂会损害交联并降低某些3C试剂盒中的Hi-C信号,因此应根据预期工作流程的特定要求选择收集方法。
与HMW DNA提取一样,在投入大量珍贵材料之前测试少量样本有助于识别潜在问题和最佳条件。显微镜或流式细胞术可能有助于验证细胞核是否完整,防止测序运行浪费。部分裂解或广泛的机械破坏,特别是在交联步骤之前,可能损害细胞核完整性,从而降低3C“邻近”Hi-C信号并使基因组组装复杂化。甲醛交联反应的持续时间必须仔细计时以确保充分但不过度的连接,然后交联的材料在文库制备前进行清洁和定量。即使在给定的商业试剂盒内,限制性消化和剪切效率也可能因组织类型、细胞组成和染色质状态而异。因此,通常需要不同裂解和 fragmentation 条件的小型 pilot 测试。虽然试剂盒简化了许多步骤,但研究人员仍应调整参
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号