《Synthetic and Systems Biotechnology》:Transposon-based genome editing of industrial microorganisms: advances, challenges, and prospects
编辑推荐:
作为可移动遗传元件,转座子在工业微生物的适应性进化与基因组工程中发挥关键作用。其应用涵盖高通量功能基因组学(通过转座子测序实现系统的基因型-表型映射)、随机整合文库构建(用于底盘开发及定向进化)等方向。尽管CRISPR-Cas等精准编辑工具已快速发展,但转座子
作为可移动遗传元件,转座子在工业微生物的适应性进化与基因组工程中发挥关键作用。其应用涵盖高通量功能基因组学(通过转座子测序实现系统的基因型-表型映射)、随机整合文库构建(用于底盘开发及定向进化)等方向。尽管CRISPR-Cas等精准编辑工具已快速发展,但转座子技术凭借操作简便、效率高等优势,在非模式工业菌株中仍具有不可替代性。近年来新型转座子系统的发现与功能优化进一步拓展了其应用场景。展望未来,将转座子技术与人工智能辅助设计、CRISPR-Cas系统相结合,将显著提升研究人员解码与工程化改造工业微生物细胞工厂的能力。本综述系统总结了转座子相关技术在工业微生物中的原理、挑战与机遇,为该技术在工业生物技术领域的应用提供了新的视角。
1. 引言
绿色生物制造的快速发展使工业微生物成为可持续生产的核心驱动力。大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus subtilis)及酿酒酵母(Saccharomyces cerevisiae)等模式菌株已被成功开发为高效细胞工厂,可生产多种高附加值产物;同时,食气梭菌属(Clostridiumspp.)可利用CO2、CO等一碳气体,毕赤酵母(Pichia pastoris)与盐单胞菌(Vibrio natriegens)可同化甲醇、甲酸等有机一碳化合物,这些非模式工业微生物的独特性状展现出巨大的应用潜力。为充分挖掘其工业价值,针对性的遗传改造与优化至关重要,但传统同源重组技术在多数工业菌株中存在效率低、周期长、操作复杂等局限;Cre-loxP、FLP/FRT等位点特异性重组系统依赖宿主预存识别位点,适用范围受限;CRISPR-Cas系统虽实现了精准编辑,但在非模式微生物中仍面临递送困难、细胞毒性、编辑效率不稳定等问题,且大规模功能基因组筛选成本较高。在此背景下,不依赖同源重组机制的转座子技术因其独特优势重新受到关注:其核心转座酶可识别特定末端反向重复序列,独立催化DNA片段移动,具备宿主普适性强、可实现高效随机插入、支持大片段稳定整合,以及与CRISPR系统融合实现可编程靶向等优势,结合高通量测序与微流控平台,已在功能基因组学、合成生物学及菌株开发中展现出广阔应用前景。
2. 工业微生物中转座子的分类与作用机制
转座子按移动机制分为两类:I类逆转录转座子采用“复制-粘贴”策略,以RNA为中间体实现基因组整合与扩增;II类DNA转座子多采用“剪切-粘贴”机制,由编码转座酶直接完成DNA片段的切割与重连,近年还发现了涉及双链环状DNA中间体的“复制-输出-粘贴”路径。目前已测序的工业微生物中广泛存在转座子:原核工业微生物以DNA转座子为主,包括简单插入序列(IS)、复合转座子及接合型转座子(如Tn5、Tn10、Tn916、Tn1545);真核工业微生物则主要携带逆转录转座子(如Ty1、Ty3)。非复制型转座子因单拷贝插入特性,适用于构建随机突变文库,高效筛选与关键表型相关的功能基因;复制型转座子可通过增加染色体拷贝数实现基因的多拷贝整合,用于研究基因剂量效应,但也可能引发基因组重排,影响工业菌株的遗传稳定性。转座子对工业微生物的影响通过三种机制实现:一是作为水平基因转移载体,虽存在抗生素抗性基因扩散的风险,但也可介导底物降解、胁迫耐受等相关基因簇的传播,为解析微生物适应性进化提供依据;二是通过插入突变调控基因表达,可作为可控随机诱变工具用于高产菌株的高通量筛选;三是介导染色体重排,在创造新基因组合与调控网络的同时,也可能导致必需代谢通路破坏。为提升转座子应用效率,研究人员通过定向进化或理性设计优化转座酶活性,并通过调控宿主微环境(如过表达DNA-PK复合物亚基)增强转座效率,相关策略在真核工业微生物中具有潜在应用价值。
3. 转座子在工业微生物中的应用
3.1 特定表型相关功能基因的快速挖掘
3.1.1 基于转座子的随机基因组诱变
转座子介导的全基因组随机诱变结合高通量测序技术(如Tn-seq、HITS、INSeq、TraDIS),已成为工业微生物功能基因大规模筛选的核心工具,可系统鉴定必需基因、条件必需基因、宿主适应因子、调控元件,并构建全局遗传互作网络。Tn5与mariner转座子因效率高、随机性强、宿主范围广,是工业原核生物基因组突变文库构建的主要工具:在阿维链霉菌(Streptomyces avermitilis)中,Tn5诱变鉴定到ABC转运蛋白及其调控因子,共过表达使阿维菌素B1a效价提升50%以上;在龟裂链霉菌(Streptomyces rimosus)中鉴定到rimocidin生物合成的正调控因子RRT与负调控因子HYP;在干酪乳杆菌(Lactobacillus casei)中解析了营养合成、噬菌体敏感性等关键性状的遗传基础。mariner转座子靶向“TA”二核苷酸,在枯草芽孢杆菌中筛选出优于经典amyE位点的yjbH整合位点,使异源蛋白表达量提升约50%;在丙酮丁醇梭菌(Clostridium acetobutylicum)中通过木糖诱导mariner系统成功鉴定到孢子缺陷突变体spo0A。通过工程化改造,转座子系统可实现超越简单插入的功能:携带无启动子GFP盒的修饰Tn5可通过插入位点上游启动子活性实现突变体筛选与报告分析;酵母中工程化的Tn3/Tn7转poson携带URA3选择标记、lox重组位点及血凝素(HA)表位标签,助力近4000个酵母基因功能的解析;大肠杆菌中构建的Tn5转录激活系统可诱导基因组基因表达,鉴定到提升甘氨酸抗性的潜在转运蛋白。此外,内源性细菌转座子(如谷氨酸棒杆菌Corynebacterium glutamicum的ISCg1、IS6100)也被开发为遗传工具,用于解析组氨酸合成、代谢网络功能依赖关系等。
3.1.2 转座子关联的高通量测序技术
随机转座子插入突变文库的构建为功能基因组研究提供了基础,而插入位点的全基因组快速定位依赖高通量测序。传统方法(如DLA-454、Mu-Taq、Tn-seq等)存在无法区分同一位点多重插入、PCR扩增偏好性、稀有突变检测灵敏度不足等局限。随机条形码转座子测序(RB-TnSeq)通过向转座子中引入随机20 bp条形码,将条形码与基因组整合位点关联,建立了标准化的全基因组适应性分析平台,较传统方法通量更高、成本更低。该技术已在130种细菌的387项全基因组适应性实验中鉴定到5196个显著表型相关基因,并在32种细菌的11779个注释缺失基因中实现了功能预测。针对其仅能分析非必需基因的局限,研究人员将RB-TnSeq与Dub-seq、CRISPRi等技术联用,实现了噬菌体-宿主互作、必需基因功能的系统解析;近期开发的诱导型自传播转座子系统结合RB-TnSeq,还可用于大肠杆菌碳源利用、抗生素抗性等基因网络的动态重构。针对转座子插入热点影响文库覆盖率与筛选准确性的问题,可通过联合不同靶向偏好的转座子、构建可控转座酶表达系统、采用长读长转座子插入位点测序(LoRTIS)跨越重复区域、结合机器学习校正插入偏好等策略进行优化。
3.2 转座子介导的DNA片段染色体整合
外源基因或生物合成途径的染色体整合是构建高性能生产菌株的关键策略,可避免质粒系统的遗传不稳定性,且能获得无抗性标记、无残留疤痕序列的“洁净”工程菌株,提升生物安全性与工业适用性。
3.2.1 随机染色体整合
转座子介导的随机整合可在基因组不同位点生成多样化的底盘菌株文库,便于筛选最优整合位点——因为整合位点对基因表达效率具有关键影响,而同源重组与位点特异性重组依赖预设位点,难以实现系统评估。mariner转座子系统已成功将异源途径整合至自养C. ljungdahlii中,通过连续气体发酵获得3-羟基丁酸酯产量达10.3 g/L的菌株,并可整合11.1 kb丙酮/异丙醇合成途径、17.9 kb合成气制醇途径,结合CRISPR/Cas9介导的标记切除与额外7.8 kb基因簇整合,使己醇产量提升至251 mg/L。Hermes转座子被用于解脂耶氏酵母(Yarrowia lipolytica)中随机整合2-吡喃酮合酶(2-PS)表达盒,获得的菌株三乙酸内酯(TAL)分批发酵效价达2.6 g/L,支撑了后续抗生素pogostone的一锅法合成(产率96%);利用该菌株天然Ty逆转录转座子LTR序列开发的YaliCMulti与YaliHMulti工具包,结合Cre-loxP介导的标记回收,可实现无选择标记约束的迭代基因整合。迷你转poson作为简化工程化构件,保留了整合能力且宿主基因组负担更低,提升了长期培养的稳定性,可通过不同选择标记实现同一宿主内的迭代应用:迷你Tn5系统已成功将聚羟基丁酸酯(PHB)合成基因整合至大肠杆菌基因组,产量优于质粒表达系统,新型双质粒迷你Tn5系统进一步提升了PHB产量。
3.2.2 CRISPR关联转座子(CAST)系统
CAST系统将CRISPR-Cas系统的RNA引导DNA识别能力与Tn7样转poson的“剪切-粘贴”整合机制耦合,无需产生双链断裂(DSB)即可实现大片段DNA的可编程定向整合,显著降低非预期基因组重排与细胞毒性,尤其适用于需要高保真插入的应用场景。目前已鉴定或预测的CAST亚型包括I-F、I-B、I-C、I-E、I-D、IV-A、V-K七类,其中ShCAST、INTEGRATE、MUCICAT已在工业微生物遗传工程中展现出应用潜力。ShCAST源自Scytonema hofmanni,由TniQ、TnsBC及单效应蛋白Cas12k组成,经优化后的SHOT版本提升了大片段整合效率与靶点可及性,通过代谢干预减少酸性副产物,显著提高了目标蛋白产量。INTEGRATE源自霍乱弧菌(Vibrio cholerae)Tn6677转座子,由TnsABC、TniQ及多亚基Cas678复合物组成,宿主兼容性广,在乳酸乳球菌(Lactococcus lactis)中整合10 kb片段的效率仅比1 kb片段低5倍,在谷氨酸棒杆菌中可实现9 kb cargo约13.4%的整合效率。MUCICAT是基于INTEGRATE工程化的多拷贝染色体整合系统,通过crRNA同时靶向多拷贝基因组位点或多重位点,在大肠杆菌N-乙酰葡糖胺(GlcNAc)合成途径改造中,获得了携带5个拷贝表达盒的最优菌株,产量达11.59 g/L,是质粒对照的6倍以上,实现了从单位点编辑向可扩展组合式基因组写入的范式转变。
3.3 染色体转座子整合的稳定策略
工业微生物中由转座子回复或二次转座导致的遗传不稳定性是菌株退化、产量波动甚至发酵失败的关键因素,研究人员已开发多种稳定策略:一是选择基因组高稳定区域的整合位点,如在解脂耶氏酵母中鉴定的“安全港”位点,外源基因整合后遗传稳定性显著优于传统位点;二是使用低拷贝转座子(如Tn5/Tn10)或自杀载体实现外源基因的单拷贝整合,避免多拷贝插入引发的遗传不稳定;三是利用诱导型启动子精确控制转座酶的表达时序与强度,降低回复或二次转座风险;四是构建末端串联重复的转座子载体,整合后通过转座酶诱导删除一个末端序列,永久失活剩余载体的转座活性,或引入重组酶识别位点,整合后通过重组酶切除载体骨架。针对非模式工业微生物(如高GC含量细菌、非常规酵母)中基因组二级结构复杂、DNA修复系统活跃、染色质结构致密等问题,未来开发转座子工具时需考虑抑制Ku70、LigD等关键宿主修复因子,营造更利于稳定整合的胞内环境。
4. 结论与展望
本综述系统阐述了转座子分子遗传工具在解码与重构工业微生物中的原理与价值,其不仅是现有工具箱的重要补充,更是探索工业微生物“暗物质”的首选工具。当前转座子技术仍面临挑战:革兰氏阳性工业微生物因厚细胞壁屏障与限制性修饰系统,外源质粒导入效率低;多数转座子系统存在宿主特异性,应用于非模型工业微生物时效率显著下降;CAST系统虽实现了靶向整合,但仍存在明显的脱靶效应,需进一步优化。未来研究应聚焦三个方向:一是拓展应用边界,开发宿主普适性更强的转座子系统,尤其是针对非模型工业微生物,通过工程化改造CAST等人工系统的蛋白组分,构建跨物种通用的遗传工具;二是结合人工智能深化技术应用,通过机器学习整合DNA序列理化性质、染色质可及性、基因转录活性等多维特征,精准预测不同微生物基因组的转座子插入偏好,基于大规模Tn-Seq数据集训练模型提取调控插入效率的关键序列特征,支撑高覆盖突变文库构建与高效靶向整合,同时利用深度学习蛋白语言模型解析转座酶家族的进化轨迹与结构约束,理性设计高活性、高稳定性的工程转座酶,并预测CAST系统中向导RNA引导的转座事件效率,提升编辑与整合的精准性与可控性;三是挖掘新生物学机制赋能工具创新,持续解析转座子生物学,发现与阐明新型转座子系统的作用机制,拓展转座子技术的应用边界。总体而言,转座子技术已从经典随机诱变工具发展为现代工业微生物学中多功能的基础平台,正朝着更精准、智能、普适的方向发展。其与CRISPR-Cas技术、系统生物学及数据科学的持续融合,将实现对微生物细胞工厂更系统高效的解析、设计与重编程。同时,确保遗传稳定性与生物安全是工程菌株工业应用的根本前提,开发无残留可移动元件、遗传背景清晰的标记-free底盘菌株,是降低生物安全风险、推动合成生物学可持续发展的必然路径。