《Plants》:From Gene Knockouts to Genome Remodeling: Large DNA Fragment Deletion Technologies in Plants
Jiayi Hou,
Hui Li,
Fengfeng Zhang,
Dan Yang,
Yan Xiong,
Xiaoyue Zhu and
Mingzhang Wen
编辑推荐:
这篇综述系统梳理了植物基因组工程领域的大DNA片段删除(LDFD)技术。文章比较了ZFNs、TALENs、CRISPR/Cas(Cas9、Cas12a、Cas3)、位点特异性重组酶、转座子系统及先导编辑衍生策略等多种技术的机制、效率与优劣势,并指出当前在作物中实现高效、精准、可预测大规模删除的瓶颈。最后,作者展望了未来发展方向,包括AI辅助的核酸酶/重组酶设计、蛋白质定向进化及优化的递送系统,旨在将LDFD从专业工具转化为广泛应用于植物功能基因组学、性状工程和合成基因组设计的通用平台。
引言
大DNA片段删除(LDFD)被定义为一种精确移除基因组中连续、大片段(通常≥1 kb)的结构变异。它在植物研究中具有核心价值,包括阐明非编码区(如增强子、沉默子)的调控逻辑、解析基因剂量失衡如何影响表型、探索高级染色体结构重塑的生物学后果,以及为合成生物学提供基因组精简和优化的工具。通过模拟自然发生的结构变异,LDFD技术有助于构建性状模型和设计更高效的合成生物学系统。
基于双链断裂(DSB)的LDFD
基因编辑技术,如锌指核酸酶(ZFNs)、转录激活因子样效应物核酸酶(TALENs)和CRISPR衍生系统,通过在特定位点引入DSBs来实现LDFD。ZFNs和TALENs将可定制的DNA结合域与非特异性FokI核酸酶结构域融合,其二聚化可在靶位点产生切割。其中,TALENs通常表现出比ZFNs更高的活性和高通量组装便利性。
CRISPR/Cas系统是一种适应性免疫机制。II型CRISPR/Cas9系统在原型间隔区相邻基序(PAM,如5′-NGG-3′)上游三个碱基对处产生DSB。Cas12a(Cpf1)识别T富集的PAM序列(如TTTN),并以交错切割方式产生粘性末端。I型CRISPR/Cas3系统则通过Cascade复合物识别目标DNA并招募Cas3,Cas3具有解旋酶和HD核酸酶活性,可对DNA进行单向、持续性的降解,因而在产生大规模缺失方面显示出独特优势。例如,源自Cas3平台的Dvu I-C系统在玉米和水稻中可实现超过80%的长片段(>1 kb)删除效率,通过配对crRNA甚至可操控至少20 kb的删除。
在同一基因或染色体上同时诱导两个靶位点的DSB,可通过非同源末端连接(NHEJ)、同源重组(HR)或微同源介导的末端连接(MMEJ)等修复途径实现靶向片段删除。NHEJ通路活跃于整个细胞周期,但易产生错误连接;HR具有高保真性,但受限于复杂的载体构建和细胞周期依赖性;MMEJ则依赖于短微同源序列(MHs)。在植物中,基于DSB技术的LDFD效率通常在1%至5%之间,但存在编辑效率低和连接处产生非预期副产物等问题。
基于位点特异性重组酶(SSR)的LDFD
位点特异性重组酶(如来自噬菌体P1的Cre重组酶和来自酿酒酵母的Flp重组酶)通过识别短DNA基序并催化高度精确的DNA重组(整合、切除、倒位)来实现LDFD。它们主要分为酪氨酸重组酶和丝氨酸重组酶家族。其中,酪氨酸重组酶能够实现植物基因组大片段的精确、无疤痕删除。
新开发的编程染色体工程(PCE)系统通过双pegRNA策略在目标删除片段两端插入LoxAR2和Lox71重组位点,然后由AI工程化的超活性Cre重组酶(如cm24,其重组效率比野生型高3.5倍)催化重组,可在水稻中切除800 kb至4 Mb的DNA片段,最大删除效率达1.0%。重组酶表达可由诱导系统(如蓝光、半乳糖/雌二醇、地塞米松)驱动,以实现LDFD的精确时空调控。
重组酶的一个主要应用是切除选择标记基因,产生无标记的转基因株系。分裂重组酶系统和可视化监测无DNA多基因编辑系统(VMDFGE)等策略进一步提高了生物安全性和操作灵活性。然而,重组酶在植物细胞中的活性通常低于微生物,且其切除效率与目标片段大小呈负相关,高序列特异性也限制了天然靶位点的数量。通过计算挖掘和深度学习(如RecGen)对重组酶进行理性设计和工程化,是克服这些瓶颈的互补策略。
基于先导编辑(PE)的LDFD
先导编辑(PE)系统由RNA编程的切口酶(nCas9)与逆转录酶(RT)的融合蛋白以及先导编辑向导RNA(pegRNA)组成。pegRNA包含指定基因组靶点的gRNA、引物结合位点(PBS)和编码所需编辑的逆转录酶模板(RTT)。该系统可直接重写DNA序列,实现精确编辑。
PE系统经过多代优化(PE1-PE7),通过蛋白质和RNA工程提高了效率和功能。基于PE衍生的方法,如DualPE系统,将植物优化的编辑器ePPEplus与双工程化epegRNAs结合,已在小麦中实现了约365.9 kb的可遗传LDFD,且其删除效率与片段长度无关。其他如PRIME-Del、twinPE、GRAND、PEDAR和PETI等方法,也利用双pegRNA策略促进了kb级甚至Mb级的DNA删除、替换或倒位。总体而言,基于PE的LDFD平台比传统的DSB方法具有更高的精度和效率。
基于转座子的LDFD
转座子占植物基因组的15-85%,根据转座机制分为I类逆转录转座子和II类DNA转座子。II类DNA转座子通过“剪切-粘贴”机制转座,广泛应用于植物中选择标记的切除。例如,源自粉纹夜蛾的piggyBac转座子已与CRISPR/Cas9整合,用于精确基因编辑后对转座子载体进行“清洁”切除,仅留下预期的基因组修饰。基于内源Ac/Ds转座子系统开发的TRUST系统,可在玉米中生成仅含目标表达框的超清洁转基因植株。
虽然转座子系统在靶向插入和LDFD中具有应用潜力,但该方法需要预先存在的转座子插入,并存在片段再整合的风险。此外,DNA甲基化等表观遗传调控网络会强烈抑制转座子活性。
LDFD技术系统的比较与选择
在植物LDFD中,不同技术各有特点和应用生态位:
- •
小片段删除(1–30 bp)和基因敲除:成熟的CRISPR/Cas9和CRISPR/Cas12a是首选,它们兼容多重gRNA设计。
- •
中到大片段删除(5–100 kb):具有持续核酸酶活性的CRISPR/Cas3通常在删除能力和效率上领先。
- •
无转基因编辑:重组酶能够无疤痕地切除转基因和选择标记,在非模式或无性繁殖作物中尤其有价值。病毒载体、农杆菌介导的瞬时表达和基因枪RNP递送也可实现无转基因编辑。
- •
超大片段删除(>100 kb):PE衍生策略可为程序性删除提供更高精度,通过在靶区域两侧设计微同源序列引导MMEJ修复,是提高DSB依赖性LDFD准确性的潜在途径。
定向进化、深度学习与AI辅助的LDFD蛋白质设计
蛋白质工程,特别是定向进化,是推进LDFD技术的核心。策略包括随机诱变、理性诱变和基于重组的策略(如基因洗牌)。错误倾向PCR(epPCR)可产生大型突变体文库,而正交复制系统、噬菌体辅助连续进化(PACE)和IntePACE等连续体内定向进化平台,能够实现靶向基因的高效诱变和有益变体的快速富集。例如,通过PACE进化出的新型逆转录酶变体被用于开发PE6a–d系列先导编辑器,其中PE6c在水稻中显示出显著更高的编辑效率。近期在植物系统高通量筛选方面的突破,如双生病毒复制子辅助的植物体内定向进化(GRAPE),使得在短短四天内即可在单个本氏烟草叶片上筛选约105个突变体。
与此同时,深度学习已成为蛋白质工程的一种变革性方法。基于深度神经网络和大规模序列/结构数据集,现代深度学习模型可以学习蛋白质序列的高维表征,预测稳定性、活性等性质,并生成具有所需属性的新序列。例如,深度学习驱动的生成算法RecGen可高效预测能够靶向新DNA识别位点的功能性重组酶。AI引导的连续进化管道可以迭代地提出有益突变,进行计算机评估,并将优先变体送入高通量实验筛选。例如,通过AiCErec方法进化出的Cre重组酶突变体cm24,其重组效率比野生型高3.5倍,并已成功应用于植物的LDFD。AI工具如RFdiffusion和AlphaFold3能够从头生成和进行结构引导的蛋白质及蛋白质复合物精修。
结论与展望
在植物系统中,基于ZFNs、TALENs、CRISPR/Cas、位点特异性重组酶、先导编辑和转座子的LDFD平台各具优势和局限性。展望未来,基因组编辑技术将持续精进,以解决当前LDFD的瓶颈。未来的努力将集中于开发在kb-Mb尺度上具有更高删除效率、对删除边界有更好控制、在复杂植物基因组中具有更广泛靶向范围,以及针对不同作物物种具有更灵活递送策略的系统。同时,在复杂的真核基因组中优化编辑的精确性和安全性,对于实现LDFD在功能基因组学和性状工程中的常规应用至关重要。随着这些进展的汇聚,LDFD技术有望从专业工具演变为广泛可用的平台,加速基础植物生物学研究和改良作物品种的理性设计。