综述:用于微生物细胞工厂工程的大型DNA片段组装技术的进展
《Quantitative Biology》:Advances in large DNA fragment assembly for microbial cell factory engineering
【字体:
大
中
小
】
时间:2026年05月07日
来源:Quantitative Biology 1.4
编辑推荐:
摘要
高效、快速且可靠的DNA片段组装对于推动代谢工程和合成生物学的发展至关重要。随着DNA合成和组装技术的迅速进步,DNA组装的规模已经从单个基因扩展到代谢途径甚至整个基因组。特别是大型DNA片段的组装,已成为微生物细胞工厂工程的关键工具,极大地促进了人们对生物系统的理解和构
摘要
高效、快速且可靠的DNA片段组装对于推动代谢工程和合成生物学的发展至关重要。随着DNA合成和组装技术的迅速进步,DNA组装的规模已经从单个基因扩展到代谢途径甚至整个基因组。特别是大型DNA片段的组装,已成为微生物细胞工厂工程的关键工具,极大地促进了人们对生物系统的理解和构建。本文综述了大型DNA片段组装方法的最新进展,包括体外和体内多基因组装方法,以及基因组规模的技术,如合成基因组和新染色体的构建。我们系统地比较了这些方法在组装原理、能力和效率方面的关键特征。特别强调了它们在微生物细胞工厂工程中的应用,包括异源途径的构建、宿主代谢的重编程以及复杂生物合成网络的扩展。最后,我们讨论了将大型DNA片段组装应用于推进细胞工厂的挑战和前景。总之,本文为构建高性能微生物细胞工厂提供了理论和技术框架,有助于工业生物制造的发展。
1 引言
微生物细胞工厂的构建彻底改变了工业生物制造,使得包括药品、生物燃料和精细化学品在内的高价值化合物的可持续生产成为可能[1]。建立高效的微生物细胞工厂通常涉及:(1)引入长度超过10千碱基(kb)的异源代谢途径(例如,结合数十个植物、细菌和真菌来源的基因来生产生物碱、紫杉醇和其他天然产物[2-4]);(2)在基因组水平(兆碱基[Mb]级别)上重编程宿主代谢;(3)扩展复杂的生物合成网络(通常需要数百kb到Mb的DNA构建[5-7])。这些需求凸显了对先进DNA组装技术的迫切需求,尤其是大型DNA片段(长度从几十kb到Mb)的组装。这种技术能力为上述方面的微生物细胞工厂工程奠定了基础。大型DNA片段通过使用合成短寡核苷酸(oligos)的分层拼接策略进行组装,这严重依赖于低成本和大规模的寡核苷酸合成[8]。近期DNA合成技术的进步显著提高了DNA合成的质量、通量和效率,并降低了成本。例如,高密度集成芯片基础的DNA合成技术极大地降低了成本并提高了通量[8-10]。寡核苷酸组装技术使得短寡核苷酸能够组装成基因长度的双链DNA(dsDNA)(kb级别)[11]。工程化的末端脱氧核苷酸转移酶进一步实现了更长、高保真度的单链DNA(ssDNA)的合成[12, 13]。这些改进为大型DNA片段的组装提供了更高质量和更具成本效益的材料,从而大大推动了DNA组装方法的发展。在过去的二十年里,大型DNA片段的组装在长度、准确性和速度等方面都有所提高,出现了许多新的方法——包括体外和体内组装、合成基因组和新染色体(NeoChr)的组装——为微生物细胞工厂的工程提供了坚实的技术支持(图1A,B)。如表1所示,传统的和新兴的体外方法在结合标准化和模块化的生物部件、转录单元(TU)以及多基因途径方面越来越出色[67]。然而,由于大型DNA片段的体外操作不稳定,尤其是长度在10 kb到Mb之间的天然产物生物合成途径或生物合成基因簇(BGCs)的稳定组装仍主要依赖于体外组装方法[68, 69]。最近的进展,如大肠杆菌(E. coli)基因组的重编码和酿酒酵母(S. cerevisiae)的合成酵母基因组项目(Sc2.0),将组装能力扩展到了基因组规模[46, 48],促进了全基因组范围内的菌株工程。进一步的创新,如新染色体的从头合成,进一步推动了组装边界的扩展,并能够扩展代谢网络[6]。尽管在大型DNA片段组装技术方面取得了这些突破,但关于其在微生物细胞工厂开发中应用的全面综述仍然有限。
图1 显示了微生物细胞工厂中大型DNA片段组装技术的概览。(A)大型DNA片段组装促进了微生物宿主的工程设计、代谢重编程和网络扩展,当前的发展趋势集中在一些关键因素上。(B)技术时间线突出了大型DNA片段组装的关键里程碑。
表1. DNA组装方法,重点关注应用于生物合成的方法。
| 类别 | 宿主 | 组装方法 | 大小/数量 | 关键特征 | 微生物细胞工厂工程的应用 |
|-----------------|-----------------|----------------------------------|---------------------------------|------------------------------------|
| 体外DNA组装 | 无限制 | BioBrick [14, 15] | 20 kb/2个片段 | 模块化组装,使用Type IIP限制酶 | |
| | | | | | |
| | | BglBrick [16] | 2个片段 | 可靠:Bgl II/BamH I切割酶,效率高 | | |
| | | | 能够在大肠杆菌中构建基因表达装置、嵌合蛋白融合和靶向基因组整合 | | |
| | | | 对dam/dcm甲基化不敏感;良性疤痕:6 bp甘氨酸-丝氨酸连接器 | | |
| | | | Golden Gate [17] | | |
| | | | 30 kb | 使用Type IIS限制酶模块化组装 | | |
| | | | 能够组装生物部件、转录单元和多基因途径 | | |
| | | Start-Stop组装 [18] | 15个片段 | 无疤痕翻译连接;允许从多达60个部件组装多达15个基因 | | | |
| | | MoClo [19, 20] | 33 kb/11个转录单元 | 逐步模块化构建多基因途径;仅需三个克隆步骤即可构建11个转录单元 | | |
| | | YeastFab [21, 22] | 6个片段 | 模块化DNA组装框架,用于在酵母中构建多基因途径;11个POT模块可构建6基因途径 | | |
| | | Golden Standard [23] | 20个转录单元 | 6个组成型+4个诱导型启动子;4个单顺反子RBS;7个N端+5个C端标签;2种CDS类型;6个终止子;15个连接器;3个转录因子 | | | |
| | | RoboMoClo [24] | 8个转录单元 | 机器人辅助的模块化克隆 | 在Corynebacterium glutamicum中实现番茄红素生物合成 | | |
| | | Gibson [25] | 900 kb | 一步法、等温方法,用于连接多个重叠的DNA片段 | | |
| | | Nimble Cloning [26] | 3个片段 | 使用Sfi I/T5进行线性化和尖端处理;标准化引物适配器;比Gibson更灵活、 cloning效率更高 | | |
| | | SLIC [27] | 10个片段 | 使用3'→5'外切酶创建单链尖端,以实现互补DNA片段的退火 | | |
| | | CPEC [28] | 8.4 kb | 利用聚合酶介导的延伸,在单个反应中生成环状、无缝的构建 | | |
| | | C-Brick [29] | 2个片段 | 使用Cas12a(Cpf1)生成的4–5 bp 5′尖端进行定向、模块化组装 | | |
| | | C CTL [30] | | 结合Cas12a(Cpf1)辅助切割和Taq DNA连接酶,实现大型DNA片段的高精度连接 | | |
| | | PlasmidMaker [31] | 27 kb/11个片段 | 最少人工干预下,跨越六个物种组装101个质粒(5–27 kb),处理GC含量高达77% | | |
| | | | 高通量组装包含多个片段和高质量GC内容的质粒 | | |
| 体内DNA组装 | 大肠杆菌 | LLHR [32, 33] | 52 kb | 全长度的RecET系统(LLHR)的效率比其截短版本和红色系统分别高出20倍和40倍 | | |
| | | ExoCET [34] | 106 kb | 直接克隆效率提高了32倍,能够一步克隆超过100 kb的BGCs | | |
| | | TAR [35] | 600 kb | TAR避免了体外克隆方法在长度方面的限制,并能从复杂背景中克隆BGCs | | |
| | | opTAR [36] | 454 kb | 通过添加酵母复制原点提高组装稳定性(最大大小从142 kb提高到454 kb) | | |
| | | opTAR [37] | 67 kb | 通过K1α选择提高BGC克隆的效率(从0.26%提高到13%) | | |
| | |克隆Amycolatopsis sulphurea和Streptomyces filamentosus中的35 kb chelocardin和67 kb daptomycin生物合成基因簇 | | |
| | | opTAR [38] | 76 kb | 通过钩子优化提高BGC克隆的效率(corbomycin BGC的捕获率提高了70%) | | |WAC01529
DNA组装器 [39-41]
45 kb
快速且高效(70%–100%)的多基因通路组装
能够组装三条不同的通路:一条9 kb(3个基因)的D-木糖利用通路,一条11 kb(5个基因)的玉米黄质生物合成通路,以及一条结合了这两种功能的19 kb(8个基因)的通路
链格孢菌 (Aspergillus nidulans)
TAR [42]
-
通过NHEJ缺陷机制,提高了组装效率(约70%的融合率,重叠长度为25 bp)和容量(一步组装6个片段)
简化了不含细菌序列的自复制质粒的构建过程
蜂房酵母 (Starmerella bombicola)
TAR [43]
-
利用CRISPR/Cas9进行一步体内组装
能够组装多个DNA片段(总长度10 kb),用于生产酸性索弗罗脂质 (acid-type sophorolipid)
里氏木霉 (Trichoderma reesei)
SATIMD [44]
32.7 kb
靶向整合效率接近100%,拼接效率超过80%
能够组装一个由32.7 kb组成的索尔比西林类化合物(sorbicillinoid)基因簇,涉及多达10个不同的DNA片段
大肠杆菌 (E. coli)、欧文氏氏菌 (Ralstonia eutropha)、假单胞菌 (Pseudomonas putida)、植物乳杆菌 (Lactobacillus plantarum) 和脂肪分解耶罗威菌 (Yarrowia lipolytica)
PEDA
6 kb
其组装效率是缺乏T4连接酶和T5外切酶的野生型大肠杆菌的两倍以上
能够在假单胞菌中构建RBS文庫,并将序列直接组装到生产菌株中
合成基因组组装
大肠杆菌 (E. coli)
MAGE和CAGE [7]
2.3 Mb
MAGE能够进行分散的基因组规模编辑,但会引入高频率的脱靶突变;CAGE依赖于迭代连接和选择,导致大片段组装耗时较长(数周到数月)
能够组装一个不含UAG终止密码子的大肠杆菌基因组,以便整合非天然氨基酸(ncAA)并赋予抗病毒特性
REXER和GENESIS [45]
0.5 Mb
长链合成DNA可以逐步替换整个基因组;通过迭代标记交换过程(利用CRISPR/Cas9和λ-Red重组),实现精确高效的组装;但由于依赖电穿孔引入片段,效率较低
uREXER [46]
0.1 Mb
经过优化的REXER变体使用通用的CRISPR/Cas9间隔序列,使得100 kb片段的替换更加高效
CGS和CONEXER [47]
0.5–1.1 Mb
将REXER与细菌 conjugation 结合使用,将单次整合时间从4天缩短至1天;RecA基因敲除减少了合成DNA与基因组之间的交叉反应,无需进行序列测序
酿酒酵母 (S. cerevisiae)
SwAP-In [48-54]
0.18–0.75 Mb
通过双重营养缺陷选择机制确保高保真度的组装;这种逐步的大型片段整合过程耗时较长(单次整合需要5天);随着循环次数的增加,组装效率会下降
能够组装合成酵母染色体 synI、synIII、synV、synVI、synIX 和 synXIV,以改善条件性耐受性和生产性能
I-Sce I介导的转化 [55-57]
0.77–1.03 Mb
通过并行进行两部分组装,速度比SwAP-In快约50%
能够组装合成酵母染色体 synII、synVII 和 synXIII,以提升生产性能
MRA [58-61]
0.51–1.45 Mb
在多个单倍体菌株中并行组装多个片段,显著缩短了组装时间;减数重组会增加与野生型序列的交叉风险
CRIMiRE [62, 63]
0.66–1.05 Mb
通过使用靶向的CRISPR/Cas9切割来避免随机混合,提高了组装的准确性
NeoChr组装
酿酒酵母 (S. cerevisiae)
TAR [64]
100 kb
成功实现了大规模(44个片段,总长度100 kb)的合成染色体组装,保真度高达36%
NeoChrs作为交换糖酵解途径的专用表达平台
TAR [5, 65]
100 kb
与线性染色体相比,环形染色体的组装效率更高(36% vs. 0%)
将糖酵解途径、戊糖磷酸途径、细菌香草酸途径和植物花青素合成途径整合到NeoChrs上,实现了花青素的新生物合成
PGNC/eSwAP-In [66]
211 kb
模块化组装(21个片段);环形染色体比线性染色体具有更快的生长速度和更高的稳定性
PGNC通过SCRaMbLE系统扩展了碳源利用,并增强了表型多样性
HAnDy [6]
1.024 Mb
高效(约60%)且遗传稳定性更强
NeoChrs增强了宿主的代谢能力和环境适应性
a
过去5年中开发出的代表性方法和新方法。
b
“-”表示“数据未显示”。
在这篇综述中,我们系统总结了近期在大DNA片段组装技术方面的进展,重点关注其在微生物细胞工厂工程中的应用,特别是像大肠杆菌和酿酒酵母这样的工业常用菌株。从体外组装到合成基因组组装,再到额外的设计型NeoChr构建,我们介绍了这些技术在组装原理、容量和效率方面的关键特点,并强调了它们在微生物细胞工厂工程中的优势。最后,我们讨论了当前的限制和未来大DNA片段组装技术应用的发展方向。
2 用于异源途径构建的体外DNA组装方法
体外DNA组装已成为在微生物系统中重建异源代谢途径的核心工具(图2A)。由于大型DNA构建的复杂性,高效的组装对于保持稳定性和提高构建通量至关重要[70]。基于限制性酶切的克隆方法建立了标准化的模块化途径构建框架,但其对特定识别位点的依赖限制了序列的灵活性。同源定向组装克服了序列限制,实现了无缝灵活的片段连接。可编程核酸酶引导系统和自动化平台的出现进一步提高了精确度和可扩展性,推动了复杂生物合成途径的构建。
2.1 基于限制性酶切的标准化和模块化途径构建方法
基于限制性酶切的DNA组装仍然是构建模块化遗传电路和代谢途径的基础方法。研究人员利用II型限制内切酶的序列特异性切割特性,可以系统地、可重复地连接遗传元件,从而为微生物细胞工厂设计出标准化的多基因构建[71]。早期的系统,如BioBrick组装(图2B),为模块化克隆建立了框架(MoClo),定义了DNA片段之间的固定接头序列,以确保互操作性和可重复性[14]。为了克服原始标准的疤痕序列和方向性限制,开发了BglBrick系统(图2B)。该系统使用Bgl II和BamH I限制酶,生成一个6个核苷酸的疤痕序列,编码一个甘氨酸-丝氨酸连接器,这种良性肽不会干扰大多数蛋白质融合[16]。这种设计确保了方向性组装,与现有的BioBrick组件兼容,并允许逐步连接多个片段而不引入不需要的序列。基于BioBrick的方法已被应用于聚酮合酶(PKS)途径的组装[15]以及氨基酸和辅因子的生物合成[72, 73],促进了微生物代谢途径的模块化工程。然而,对固定限制位点的依赖限制了多基因组装,因为只能进行逐步的两片段或三片段连接[16, 67],使得基于BioBrick的构建对于大型或复杂途径来说效率较低。相比之下,IIS型酶如Bsa I和BsmB I可以在其识别位点之外切割DNA,生成用户定义的突出末端对,实现单酶、定向和多片段组装。这克服了IIP型酶的固定位点限制,允许在微生物细胞工厂中高效构建多基因途径。如图2B所示,Golden Gate组装(GGA)能够一步组装多个DNA片段,据报道最多可成功组装11个片段[17, 74]。在实际应用中,GGA已用于在酵母中合成复杂的代谢物,例如古菌-真核杂交脂质[75]和超过200种二萜类化合物[76],展示了其在代谢工程中的广泛用途和潜力。最近的进展优化了突出末端序列,提高了效率。HamediRad等人筛选了200多种突出末端组合,并使用iBioCAD证明了3-5片段构建的近乎100%的组装效率,突显了突出末端优化带来的准确性和可靠性提升[77]。此外,Start-Stop组装依赖于Sap I生成3 bp的突出末端,编码起始和终止密码子,实现了编码序列的无缝组装,同时保持了mRNA二级结构和核糖体结合位点(RBS)活性,支持高效的多部分组装[18]。Expanded Golden Gate利用Bsa I生成的突出末端,与标准载体的多个克隆位点序列兼容,使得PCR产物能够以定义的方向进行连接,简化了克隆设计[78]。这些创新减少了组装错误,保持了途径基因的功能完整性,并简化了异源代谢模块的构建,直接支持了微生物细胞工厂中的高效设计和测试(图2B)。除了在接头层面的优化外,分层组装策略还使得构建越来越大和复杂的异源途径成为可能。MoClo采用了这种方法,使用Bsa I和Bpi I生成可定制的突出末端,允许同时精确、定向地组装多达八个DNA模块[19]。其分层设计允许从基本生物部件逐步构建到TU,再到多基因途径,仅需三个步骤即可构建长达33 kb的构建[20]。类似的分层策略也被应用于GoldenBraid(植物)和YeastFab(酵母)中,促进了更多宿主中的模块化途径构建。此外,Golden Standard采用了标准的欧洲载体架构,为α-、β-、γ-和δ-变形菌提供了高效、标准化的遗传工具[23]。这些平台允许系统地组装和组合测试代谢模块,支持在不同微生物背景中快速探索途径设计和优化酶表达。
2.2 基于同源重组的无缝灵活途径组装方法
与基于限制酶的方法不同,基于同源重组(HR-based)的方法不依赖于预定义的识别位点,无论片段内部序列如何,都能实现精确且无缝的多片段连接(图2C)。Gibson组装就是这种能力的典范,它在一个等温反应中同时使用T5外切酶、DNA聚合酶和DNA连接酶,能够在一步中组装多个片段,包括超过100 kb的构建物[25, 80]。无缝性保持了编码序列和调控元件,维持了开放阅读框的功能完整性,这对于构建异源代谢途径至关重要。Gibson组装已成功应用于大型人类IGHV基因片段的组装[81]和模块化遗传电路的构建[82]。T5外切酶依赖的组装仅使用T5外切酶生成短的单链突出末端,使同源DNA片段能够无缝退火。随后在体内修复这些间隙,实现简单高效的多片段组装,无需复杂的酶混合物[83]。其他基于HR的策略,如序列和连接无关的克隆(SLIC)[27]和环形聚合酶扩展克隆(28),利用类似的重叠驱动重组原理,提供了额外的选项来组装大型DNA构建物。同源定向组装的灵活性和序列独立性使其特别适合与其他DNA操作策略结合使用。通过在片段末端提供同源重叠,基于HR的方法可以无缝连接通过多种上游过程生成的DNA片段。这种灵活性通过混合策略得到了进一步增强(图2C)。例如,Nimble Cloning利用罕见切割酶Sfi I,实现了快速质粒线性化,无需大量片段修饰[26]。在第二种混合方法中,CRISPR-Gibson混合策略使用用户设计的单导向RNA(sgRNA)在载体上几乎任何所需位置生成目标双链断裂,然后通过Gibson组装进行无缝整合[84]。这些方法已被用于构建复杂的组装,包括雷帕霉素聚酮合酶模块[85]、超过5500个在人类中保守的果蝇基因的UAS-cDNA/ORF文庫[86],以及包括fengycin在内的整个生物合成簇[87]。这些组合结合了基于HR的组装的序列独立性和核酸酶系统的精确性,显著扩展了重构大型生物合成簇和生成高多样性途径文庫的设计空间。
2.3 基于可编程核酸酶的精确自动化途径设计方法
可编程核酸酶已成为体外DNA组装的强大工具,提供了前所未有的精确度和自动化能力(图2D)。精确性来源于可编程的目标识别和切割:Cas12a(Cpf1)在crRNA的引导下识别TTN型原间隔序列(PAM)位点,并生成定义明确的4–5 bp 5′突出末端,实现多个片段的方向性和可预测性组装,正如C-Brick系统中所实现的[29]。然而,传统的Cpf1根据目标序列和crRNA设计的不同而表现出不同的切割效果,经常在多个位点切割,产生不一致的末端,从而影响组装精度。如图2D所示,Cpf1辅助切割和Taq DNA连接酶辅助连接(CCTL)方法使用17个核苷酸长的crRNA将切割限制在特定位置,生成可预测的8个核苷酸长的粘性末端。结合Taq DNA连接酶的高温、高特异性连接能力,该方法显著提高了大型DNA构建体修饰的精确度和效率[30]。同时,Pyrococcus furiosus的argonaute(PfAgo)是一种不依赖于PAM序列的可编程核酸酶。dsDNA的热变性使得链分离成为可能,随后使用5′-磷酸化的DNA引导序列进行位点特异性切割,并重新 annealing 以产生定义明确的粘性末端双链断裂[88]。PfAgo已被整合到全自动PlasmidMaker平台中(图2D),从而实现了从引物设计到连接的全过程自动化操作,具有高通量和高准确性[31]。它能够高效地组装长达27 kb的质粒以及包含多个重复序列的复杂结构。这些可编程核酸酶策略使得多个基因模块的精确、可预测的组装成为可能,并直接促进了微生物细胞工厂中异源代谢途径的组合设计、快速迭代和优化。
**3 体内组装策略用于构建异源代谢途径**
体外组装方法在构建代谢途径方面提供了高度的灵活性和效率;然而,随着DNA片段数量和大小的增加,其效率显著下降[21, 89]。大型生物合成途径——例如通常跨越数十到数百kb的天然产物生成途径(BGCs)——主要通过宿主细胞内的同源重组(HR)进行体内组装[37, 69, 87]。总体而言,体内组装比体外重组方法具有更高的效率和更强的稳定性[90],从而加速了微生物细胞工厂的发展和合成途径的优化。革兰氏阴性细菌大肠杆菌(E. coli)(图3A)和革兰氏阳性细菌酿酒酵母(S. cerevisiae)(图3B)是体内组装BGCs和生化途径最常用的宿主[38, 69, 87]。这些组装的构建体可以实现两种生产方式:在原始宿主体内直接合成目标代谢物,或将质粒转移到专门的生产系统中(图3C)。此外,体内重组策略已被扩展到其他多种宿主,极大地推动了合成生物学和代谢工程领域的发展。
**3.1 大肠杆菌中的体内DNA组装用于BGCs的克隆和重构**
大肠杆菌是DNA克隆和维护的优选宿主,因为其内源性重组可以被比其他任何宿主更彻底地最小化,特别适合于组装通常包含高度重复DNA区域的次级代谢途径(如聚酮类BGCs)。然而,大肠杆菌中的内源性RecA介导的同源重组效率较低,且用于组装的外源线性dsDNA会被RecBCD复合体降解,导致体内组装效率较低[91]。为了克服这些限制,研究人员开发了来自λ噬菌体的Red重组系统(包含Exo、Beta和Gam蛋白)和来自Rac噬菌体的RecET系统(包含RecE和RecT蛋白),以显著提高大肠杆菌中的重组效率。尽管这两个系统都能提高重组效率,但Red系统在处理线性和环状DNA之间的重组方面更为有效。Fu等人[32]于2012年首次使用全长的RecE和RecT开发了线性-线性同源重组(LLHR)技术。利用LLHR技术,成功组装了多个BGCs,包括来自假单胞菌(Pseudomonas syringae)的syringolin生物合成基因簇(sylCDE,19 kb)、来自发光杆菌(Photorhabdus luminescens)的luminmycin生物合成途径(18 kb)、来自Paenibacillus larvae的sevadicin生物合成基因簇(11.6 kb)以及来自Colletotrichum higginsianum的聚酮类次级代谢产物BGCs[33]。BGCs通常通过基因组DNA的酶切获得,但限制性位点的存在可能会阻碍BGCs的释放。最新的改进(图3A)引入了CRISPR介导的靶向切割系统,如Cas9辅助的染色体片段靶向(CATCH)[93, 94]和CRISPR/Cas12a介导的快速直接生物合成基因簇克隆平台(CAT-FASHING)[95],这些系统能够快速高效地捕获较大的BGCs。除了途径组装之外,结合RecET与Red重组或CRISPR/Cas系统还能通过启动子工程和RBS优化有效地重构目标BGCs,显著提高了天然产物的产率[96, 97]。He等人[97]利用最近开发的CRISETR(CRISPR/Cas9和RecET介导的重构)策略,通过引入不同强度的启动子组合,成功重构了74 kb的daptomycin BGC,使daptomycin的产率提高了20.4倍。直接克隆的效率受限于线性克隆载体和目标BGC在电穿孔过程中同时进入大肠杆菌细胞的概率。2018年,研究人员开发了Exonuclease Combined with RecET重组(ExoCET)方法,该方法首先在体外利用T4聚合酶的3'→5'外切酶活性使线性载体与基因组片段预annealing,从而成功组装了以前难以用RecET重组手段克隆的大规模BGCs。值得注意的是,以前需要分三个步骤克隆的106 kb大片段,现在可以通过ExoCET一步完成,大大提高了BGCs的组装效率。
**3.2 酿酒酵母中的体内DNA组装用于多基因代谢途径的构建**
酿酒酵母表现出较高的同源重组率,具有40 bp重叠序列的DNA片段组装效率可超过90%[39, 98, 99]。Larionov等人[35]利用其在转化过程中重组小范围同源及不同DNA序列的能力,于1996年开发了转化相关重组(TAR)方法,该方法能够从复杂基因组中选择性和精确地克隆染色体区域(图3B)。他们的研究表明,使用不含自主复制序列(ARS)元件的载体时,可以获得最高的酵母人工染色体(YACs)产率。然而,对于总大小超过200 kb的高G+C DNA构建体,如果缺少ARS序列,则无法实现稳定维持[36]。改进后的TAR载体包含了酵母选择标记ARS和着丝粒序列,以确保在酿酒酵母中的正确传播、分离和选择。但由于非同源末端连接(NHEJ)的存在,TAR的效率仍然较低(0.1%–2%),这常常导致错误组装[100]。为了提高TAR效率,研究人员开发了多种策略:(1)分离必需元件(酵母附属体和选择标记)[101];(2)引入URA3基因作为反向选择标记[102];(3)使用K毒素的α亚单位作为反向选择标记[37];(4)利用CRISPR/Cas9预处理基因组DNA,使阳性区域的克隆效率提高了35倍[103]。最近,Xu等人[38]通过优化反向选择标记URA3的表达、合理设计钩状序列以及引入拷贝数控制复制子(oriV-ori2-repE-sopABC),开发了一个优化系统,使得76 kb的corbomycin BGC的捕获效率达到了70%,远优于传统的TAR效率(低于10%)。值得注意的是,捕获到的BGCs在其他宿主体内表现出稳定的整合和高效表达,导致在GPAHex平台上的最终产率提高了19倍。TAR方法消除了体外操作的需要,实现了极长DNA片段的组装,开创了酵母细胞中的HR介导组装先例。这种方法已被广泛应用于单个或整个基因组的组装[104-107],从复杂基因组中组装BGCs[37, 108, 109],以及为合成生物学应用重构基因簇[110-112]。最近,TAR还被整合到自动化生物制造平台中,显著提高了大规模DNA组装的可扩展性和精确度[113]。该平台可用于构建表达可调的多基因文库,例如β-胡萝卜素代谢途径。Shao等人[39]于2009年在酿酒酵母中开发了DNA组装方法,实现了通过体内同源重组一步组装多个基因表达盒到生物合成途径中。功能性的生物合成途径(长度从9到19 kb不等,包括三基因D-木糖利用途径、五基因zeaxanthin生物合成途径以及八基因组合的D-木糖利用和zeaxanthin生物合成途径)可以在质粒或染色体上快速组装[39, 40]。除了途径组装之外,DNA组装器还用于通过组合转录工程(COMPACTER)定制代谢途径的优化,从而快速调整木糖和纤维素利用途径中的基因表达[114]。目前,由DNA组装器组装的质粒被应用于靶向基因组编辑[115]、代谢产物合成[116]和非传统碳源利用[117]。
**3.3 其他微生物中的体内DNA组装**
测序和同源重组(HR)技术的进步促进了体内DNA组装在多种微生物中的应用。枯草芽孢杆菌(B. subtilis)是最广泛使用的DNA组装宿主之一。由于其天然的高细胞外DNA转化能力,细胞外的单链DNA可以容易地进入枯草芽孢杆菌的细胞质并通过RecA介导的HR整合到基因组中。在枯草芽孢杆菌中开发了几种体内组装方法,包括inchworm elongation(IWe)、domino组装和诱导性RecA表达BGM载体(iREX)[118-120]。Li等人[121]提供了关于枯草芽孢杆菌中DNA组装技术的综合综述。除了大肠杆菌、酿酒酵母和枯草芽孢杆菌之外,体内DNA组装方法也在其他多种微生物中被建立[42-44, 122]。在NHEJ缺陷的暗色曲霉菌(Aspergillus nidulans)中,只需25 bp的序列重叠即可实现高效的DNA片段融合,从而便于构建和优化代谢途径[42]。Shi等人[43]在Starmerella bombicola中开发了一种基于CRISPR/Cas9的基因组编辑和一步DNA组装系统,实现了多种DNA片段的高效组装,用于生产单类型皂苷脂质,具有高产率和低成本。最近,在Trichoderma reesei中开发了一种称为同时体内组装和多DNA片段靶向基因组整合(SATIMD)的方法(T. reesei)。SATIMD利用CRISPR/Cas9在基因组中引入特定的DSB,从而提高HR效率,并通过一步整合10个DNA片段在特定位点实现了32.7 kb sorbicillinoid BGC的组装[44]。这表明SATIMD是异源基因簇组装的强大工具,从而加快了细胞工厂的建设。值得注意的是,在HR能力有限的宿主中,片段数量或侧翼同源区的长度对组装效率没有影响,这一发现值得进一步研究。在这些宿主体内提高HR效率是解决这一限制的最直接有效方法。尽管最初在大肠杆菌中开发的Red和RecET等重组系统已被广泛用于提高许多革兰氏阴性细菌的重组效率,但它们的应用通常受到特定物种的限制[123]。为了克服这一限制,Huang等人[122]从Xenorhabdus bovienii中鉴定出一个操作子(XBJ1_operon 0213),该操作子编码类似RecET的重组酶。这个操作子在大肠杆菌和X. stockiae中的表达显著提高了重组效率,促进了X. stockiae中强大重组系统的开发。这项技术在天然产物中BGCs的识别和修饰方面具有重要的应用价值。在另一项研究中,研究人员开发了一种噬菌体酶辅助的体内DNA组装(PEDA)方法[124],通过组合表达T5外切酶和T4 DNA连接酶[图3]。在该系统中,T5外切酶从线性DNA末端生成单链突出端,而T4 DNA连接酶在同源序列 Annealing 后修复切口。值得注意的是,PEDA方法能够在大肠杆菌中组装同源重叠长度低至5 bp的片段,并适用于广泛的物种,包括Ralstonia eutropha、Pseudomonas putida(P. putida)、Lactobacillus plantarum和Yarrowia lipolytica。利用这种方法,在P. putida KT2440中通过直接体内DNA组装构建了一个包含不同RBS变体的质粒文库,证明了PEDA在代谢通量调节中的适用性。
**4 合成基因组组装使宿主代谢实现基因组级别的重构**
合成基因组组装的主要意义在于其能够在基因组水平上对宿主代谢进行重编程(图4)。作为体内组装的延伸,该方法以野生型基因组为参考,采用分层策略构建合成片段并逐步替换天然基因组序列,推动了大规模DNA片段组装的关键创新[48, 55, 58]。如今,合成基因组组装技术已经从病毒基因组发展到原核生物基因组,再到真核生物的多条染色体[125-127]。从头开始的基因组合成技术使得全基因组工程成为可能,赋予合成菌株扩展或增强的工业能力,例如全局密码子重编码以整合非典型氨基酸(ncAA)[128, 129]、抗病毒免疫力[130, 131]以及插入全局柔性元件以加速进化[132]。图4(在图查看器中打开)PowerPoint
合成基因组组装技术推动了基因组重编码的大肠杆菌和合成酵母的应用。代表性的合成基因组组装方法包括:(A) 大肠杆菌和 (B) 酵母;(C) 大肠杆菌中的全基因组密码子删除,便于整合非典型氨基酸和获得抗病毒免疫力;(D) 在合成酵母染色体中插入loxPsym,加速进化。合成染色体片段用绿色表示,野生型染色体片段用灰色表示。
4.1 创从头开始的合成基因组组装技术的发展
合成基因组组装技术已经从病毒基因组发展到原核生物基因组,再到真核生物基因组,显著提升了基因组组装的长度、准确性、速度和稳定性。对于较小的病毒基因组,如脊髓灰质炎病毒(约7 kb)[125] 和 ΦX174噬菌体(6 kb)[133],可以使用基于聚合酶循环组装(PCA)的方法在体外进行合成。对于10 kb到Mb範围的大型基因组构建,由于DNA片段的不稳定性,采用了基于酵母的TAR方法。这种方法可以将小DNA片段与YAC载体结合,在酵母细胞中形成基因组-YAC杂交体,从而能够组装像SARS-CoV-2这样的病毒基因组[134]以及像生殖支原体(583 kb)[126]和支原体(1.08 Mb)[135]这样的支原体基因组。对于Mb级别的细菌基因组合成,主要策略是逐步组装大型合成片段(>100 kb)。合成基因组组装使得可以全基因组地去除目标密码子,并重新分配这些密码子以生产新型材料。Isaacs等人[7]使用多重自动化基因组工程(MAGE)修改了基因组中的314个含有TAG的基因,并创建了用于密码子突变片段转移和组装的接合装配基因组工程(图4A)。然而,MAGE会引入脱靶突变,不适合去除更为常见的正义密码子[7, 136]。为了进一步压缩基因组,采用了复制子切除增强重组(REXER)技术,这是一种双选择标记基因组整合技术[45]。REXER利用CRISPR/Cas9和λ-Red重组系统来实现野生型基因组片段的高效精确替换(图4A)。通过迭代标记交换过程(称为基因组逐步交换合成(GENESIS)并结合接合,最终构建了Syn61合成菌株[137]。为了深度压缩遗传密码,George Church团队致力于构建一个完全重编码为57个密码子的合成菌株(rE.coli-57或Ec_Syn57)。他们的策略使用酵母TAR方法组装约50 kb的重编码片段,以逐步替换基因组[138],并结合多组学分析(SynOMICS)方法来识别和解决合成基因组组装中的问题[139]。相比之下,Jason Chin团队基于REXER开发了uREXER方法,该方法使用通用的CRISPR/Cas9间隔子来简化流程(图4A)。通过迭代的uREXER(GENESIS组装)和接合组装,这些重编码片段被整合成一个单一的合成菌株Syn57[46]。此外,该团队还升级了连续基因组合成方法——结合接合和程序化切除的增强重组(CONEXER)。与REXER相比,CONEXER集成了细菌接合并省略了中间测序步骤(图4A),将组装时间从4天缩短到1天[47]。在真核生物基因组合成方面,Sc2.0是一个旨在完全合成酵母染色体的里程碑项目。其核心原则是在全基因组范围内引入可诱导的遗传柔性元件,以实现酵母菌株的表型进化[48]。为了实现这些完全合成的酵母染色体,开发了标准化的逐步替换营养缺陷型(SwAP-In)方法[127](图4B)。该方法通过交替选择营养缺陷型标记(URA3和LEU2),逐步用合成大片段(30–50 kb)替换天然染色体区域,成功生成了多个合成染色体,包括synI[49]、synIII[127]、synV[50]、synVI[51]、synIX[52]和synX[53]。尽管SwAP-In方法通过利用酵母HR最小化了脱靶效应,但多次替换使得组装过程耗时较长,且效率会随着替换次数的增加而降低。为了加速这一过程,I-Sce I介导的转化使得能够在单倍体中同时从两条染色体末端进行替换,随后通过二倍体杂交和I-Sce I切割成功组装了synII[55]、synVII[56]和synXIII[57]染色体(图4B)。这种方法将总组装时间减少了近50%,显著提高了合成染色体的组装效率。减数重组介导的组装方法通过结合不同单倍体来源的片段,进一步简化并加速了组装过程(图4B),最终组装了synIV[59]、synVIII[60]、synXII[58]和synXVI[61]染色体。然而,组装过程中的重组是随机的,与野生型序列的混合成为一个主要瓶颈,尤其是对于长合成染色体。CRISPR/Cas9介导的有丝分裂重组(CRIMiRE)利用CRISPR/Cas9的独特切割位点,确保染色体在精确位置重组,并生成纯合二倍体配置,防止与野生型序列的混合,从而高效组装了synXI[62]和synXV[63](图4B)。在单个合成染色体组装完成后,诸如“endoreduplication intercross”和“KAR1突变”等多染色体整合策略成功地将多达6.5个合成染色体整合到单一菌株中,使得完全合成的酵母基因组的目标即将实现[140, 141]。
4.2 合成基因组工程化的大肠杆菌在非典型氨基酸整合和抗病毒 immunity方面的应用
大肠杆菌合成基因组的组装创造了基因组重编码的生物体,例如将TAG终止密码子替换为TAA的合成大肠杆菌Syn61、rE.coli-57(或Ec_Syn57)和Syn57,这些菌株释放了1-7个密码子。这些菌株通过使用正交翻译系统(氨酰-tRNA合成酶/tRNA对)加速了遗传代码扩展(GCE)技术的发展。利用这一系统,可以将空闲密码子重新分配以整合非典型氨基酸(ncAAs)到目标蛋白质中,生产新型肽药物、生物聚合物和工业酶(图4C)。例如,C321.ΔA大肠杆菌菌株进行了全基因组UAG到UAA的密码子替换,并敲除了RF1基因,将UAG转换为功能性正义密码子以插入ncAAs。Lajoie等人[142]利用这一系统实现了高效和特异性的pAcF插入,且没有检测到读穿现象。Cheng等人[143]在UAG密码子实现了有效的Sec氨基酸整合,生产出纯度和产量均无与伦比的哺乳动物硒蛋白硫氧还蛋白还原酶。为了提高含ncAA蛋白质的产量,Yi等人[144]将T7 RNA聚合酶系统整合到C321.ΔA中,使目标蛋白质的产量提高了2.5倍。此外,Grome等人[145]将终止密码子压缩为一个密码子,生成了C321.ΔA ΔTGA变体。UAG和UGA密码子都被重新分配,使得能够在蛋白质中同时整合两种ncAAs,准确率超过99%。在Syn61菌株中,解码空闲密码子的基因被删除(Syn61Δ3),并且引入了三种相互正交的ncAA整合系统。通过重新分配TCG、TCA和TAG密码子,Robertson等人实现了三种ncAAs的同时整合,生成了多种非典型的杂聚体和巨环化合物[128]。Spinck等人利用Syn61Δ3平台在巨环编码基因的TCG和TAG密码子上编码了五种不同的ncAAs(AllocK、AlkynK、pIF、CBzK和pAzF),生成了25种巨环肽,每种肽都含有两种不同的ncAAs[129]。通过靶向羟基酸整合,他们还合成了12种不同的非天然Depsi肽巨环化合物。Syn57菌株的合成实现了对最多七种不同ncAAs的遗传编码,以及包含多达七种新单体的非典型巨环和聚合物的合成[46]。这些成就展示了合成基因组组装菌株在功能性蛋白质生物制造方面的巨大潜力。另一方面,通过重新编码大肠杆菌基因组以替换UAG终止密码子,有效地创建了抗病毒宿主,为工业发酵提供了高生物安全性。如图4C所示,在缺乏UAG密码子和RF1的宿主C321.ΔA中,这破坏了T7噬菌体的正常终止(基因组中含有60个终止密码子中的6个UAG),阻止了病毒的扩增和传播[142]。Ma等人还发现,C321.ΔA菌株对多种病毒(λ、M13、P1和MS2)具有高达10^11 PFU/mL的抵抗力,并对F和RK2接合质粒的抵抗力提高了10^5倍[146]。Syn61Δ3菌株由于删除了更多密码子和翻译成分,表现出广泛的抗病毒能力,对噬菌体混合(λ、P1vir、T4、T6和T7)的生长影响可以忽略不计[128]。此外,Syn61Δ3菌株由于其重构的遗传密码,不仅抵抗基于经典密码的病毒,还能阻止合成生物体向天然生物体泄露遗传信息[130]。这些合成基因组组装的菌株为制药和生物活性化合物提供了遗传防火墙。
4.3 合成染色体酵母在加速进化方面的应用
在Sc2.0项目中,为了将可诱导的遗传灵活性引入合成染色体,在每个非必需基因的3′ UTR中插入了数千个对称的Cre-loxP重组(loxPsym)位点,实现了称为合成染色体重组和通过loxP介导的进化(SCRaMbLE)的Cre重组酶介导的合成染色体重组和修饰。这些修饰包括染色体区域的删除、倒位、重复和易位,生成了合成染色体的组合随机多样性[147]。这已被证明可以加速酵母的全基因组代谢调节和进化,促进了条件耐受菌株工程、天然化合物生产的改进以及底盘细胞的简化(图4D)。在提高菌株对环境压力的耐受性方面,Luo等人[148]使用SCRaMbLE和基于loxP介导的两个营养缺陷型标记(ReSCuES)的切换,在synXII菌株中生成了三种能够在39.5°C下生长的菌株,在0.6%醋酸条件下OD600值提高了21倍,并生成了能够在8%乙醇中生长的耐受菌株。Ma等人[149]在含有一个(synV)或两个(synV和synX)合成染色体的酵母菌株中使用了SCRaMbLE,获得了能够在pH 8.0下生长的耐碱菌株。全基因组测序分析证实,SPT2的删除是提高耐碱性的原因。此外,研究人员还通过SCRaMbLE筛选了对抗生素(如雷帕霉素[150]和潮霉素[151])以及生长影响因子(如咖啡因[152]和高盐[153])具有改进耐受性的菌株。在糖的利用方面,Blount等人[154]将木糖代谢途径引入了synV菌株。通过SCRaMbLE,他们在以木糖为唯一碳源的培养基上获得了生长能力提高5.85倍的菌株。结构变异分析表明,MXR1的删除对于木糖的利用至关重要,为酵母的环保应用提供了潜力。在提高天然化合物的生产方面,Zhang等人[155]在含有synII的二倍体菌株中应用SCRaMbLE,使番茄红素产量提高了15.8倍,部分归因于PEX32基因的删除。Jia等人[156]使用AND门控的组合方法,在携带synIII和synV的二倍体酵母中实现了对SCRaMbLE和多重SCRaMbLE迭代循环(MuSIC)的精确控制,使类胡萝卜素产量提高了38.8倍。此外,合成染色体酵母的SCRaMbLE还在增强更多化合物的生物合成方面展示了潜力,包括紫色素[157]、虾青素[158]、桦木酸[159]和香叶醇[160]以及苯乙基醋酸和苯乙胺[161]。此外,基于SCRaMbLE的系统还可以通过删除非必需的染色体基因来构建代谢简化的底盘细胞。这种战略性减少将为异源基因表达创造一个更清洁的环境,有助于改善代谢资源的分配并提高代谢途径的效率[162, 163]。
5. 合成新手性染色体以扩展复杂的生物合成网络
构建高效的小麦芽酿酒酵母细胞工厂通常需要将多个外源基因整合到天然染色体中。例如,实施完整的QS-21生物合成途径需要引入来自七个酶家族的38个外源基因[164]。然而,整合如此大的基因构建可能会破坏染色体结构,潜在地影响邻近基因的表达,并影响染色体复制。鉴于酿酒酵母(S. cerevisiae)对染色体数量的变化具有耐受性[165, 166],合成NeoChrs应运而生——这些模块化、多余的人工染色体为稳定、高容量的内源性或/和异源基因表达提供了一个正交平台,而不会破坏天然染色体功能[5, 64, 66]——它们已成为重新编程天然细胞过程和引入新功能的平台[5, 64, 66]。与Sc2.0中合成染色体的构建不同,后者依赖于现有的基因组框架[48, 55],NeoChrs没有天然的模板,因此需要从头开始设计,使用单个辅助基因和调控元件来构建。为了组装NeoChrs,将结构元件(着丝粒、ARS、端粒和营养缺陷标记)以及PCR扩增的关键基因序列共同转化到酿酒酵母中,以便进行体内组装。NeoChr的整体构建流程如图5A所示。
5.1 通过从头设计和组装构建NeoChrs
已经构建了几种合成NeoChrs,以扩展微生物细胞工厂的功能。2021年,Postma等人[64]利用酵母的同源重组(HR)技术,将多达44个DNA片段一步组装成模块化的圆形NeoChrs(图5B)。具体来说,他们首先通过Golden Gate克隆技术组装了每个包含启动子、基因和终止子的TU。随后,他们利用酿酒酵母高效的HR机制从头组装了这些带有60 bp非基因组突出端的片段。NeoChrs的稳定性及其对宿主生理的影响是其在合成生物学中应用的关键考虑因素。有趣的是,引入四种不同大小的空白NeoChrs导致特定生长率降低,并且大约20%的群体中失去了NeoChrs[64]。为了解决这个问题,作者假设模仿天然酵母染色体的线性配置可能会提高性能。他们使用短的端粒种子序列构建了一个100 kb的线性NeoChr(图5C)[5]。然而,结果表明,与圆形NeoChrs相比,线性NeoChrs的组装效率和保真度较低,尽管两种类型在生长率、稳定性和表型效应上相当。由于一步组装的局限性——即(1)随着片段数量的增加,体内组装效率降低;(2)所有转化片段成功进入细胞核的概率降低——大型NeoChrs通常通过多轮HR和少量片段的迭代基因组组装来构建。Mitchell等人开发了eSwAP-In策略(逐步整合的染色体外营养缺陷)[167]。该方法依赖于在DNA片段最末端附近嵌入两种不同的营养缺陷标记(URA3和LEU2),用于逐步组装。应用eSwAP-In策略,Kutyna等人[66]设计并构建了一个包含来自酿酒酵母泛基因组多样化元素的NeoChr,使Sc2.0亲本菌株获得了工业和环境分离株中的各种特性。具体来说,从200多个酿酒酵母菌株中鉴定出17个独特的基因组片段,并在计算机上整合成一个211 kb的DNA分子,称为泛基因组NeoChr(PGNC)。设计遵循Sc2.0原则,包括将所有TAA终止密码子替换为TAG,在36个开放阅读框(ORFs)中插入水印,并放置63个loxP位点。作者比较了圆形(PGNCcirc)和线性(PGNClin)染色体变体,观察到PGNCcirc的生长曲线与野生型菌株相当,而PGNClin显示出略微延长的滞后期和降低的细胞密度及最大特定生长率[66]。这些发现表明,调控NeoChr稳定性和功能的细胞内机制仍有待完全理解。未来的改进可能需要筛选更多的结构和调控元件组合。迭代过程包括从酵母中提取组装好的DNA,在体外或大肠杆菌(E. coli)中富集,然后重新转化回酵母进行后续的组装轮次。为了提高大DNA在宿主细胞间的导入和输出效率,从而提高整体组装效率,He等人开发了一种酵母生命周期介导的迭代组装方法(YLC-assembly)[168]。在这种方法中,单倍体酵母菌株之间的交配将两个DNA片段带入二倍体细胞中进行重组,随后减数分裂产生可用于下一次组装循环的孢子。尽管YLC-assembly在兆碱基级DNA组装方面取得了高成功率,但由于需要孢子形成过程,每轮大约需要11天[168]。为了克服这一限制,最近开发了一种基于单倍体化的酵母DNA组装和传递策略(HAnDy),能够从头组装出含有542个外源基因的1.024 Mb NeoChr[6]。构建NeoChr的三个关键设计原则是:(1)从1011个酿酒酵母分离株中鉴定出的功能相关基因的聚集,这些基因在群体中具有变异性但在S288C中不存在;(2)利用loxP和vox位点建立正交重组系统;(3)使用“GGCC”序列作为特定的gRNA靶点建立精确的基因组编辑系统。HAnDy方法将DNA组装过程嵌入CRISPR/Cas9介导的程序化单倍体化周期(图5D)中。简而言之,两组在相反交配类型的单倍体菌株中预先构建的表观遗传DNA通过交配结合在一起。然后通过HR将DNA组装成NeoChr,并通过CRISPR/Cas9进行靶向基因组消除完成单倍体化。得到的单倍体菌株可以进一步与另一个菌株交配,启动下一轮组装。
5.2 NeoChrs赋予宿主菌株表型可塑性
广泛使用的实验室菌株酿酒酵母S288C及其派生物通常缺乏许多在工业和环境分离株中观察到的表型多样性相关基因。从头合成的NeoChrs作为移动遗传模块,增强了宿主对各种环境压力的适应性,并能够利用多种碳源[6, 66]。例如,将PGNC引入Sc2.0衍生的菌株后,与亲本菌株相比显示出明显的表型差异。PGNC菌株在包括D-棉子糖、帕拉宁糖、丁酸、5%甲酸钠、4%乳酸钠、新霉素、羰基氰化物4-(三氟甲氧基)苯肼(FCCP)、脱氧-D-葡萄糖和布洛芬在内的九种不同条件下的相对生长率至少增加了两倍[66]。值得注意的是,只有含有PGNC的菌株能够代谢替代碳源,如帕拉宁糖(葡萄糖和果糖的二糖)、棉子糖(葡萄糖和半乳糖的二糖)和丁酸。通过分析逐步组装过程中获得的中间PGNC菌株,可以鉴定出负责这些表型的ORF;因此,直接将其引入底盘菌株可以增强对复杂发酵环境的耐受性并提高产品产量。同样,通过HAnDy组装的NeoChrs引入六个系统发育上不同的酵母菌株后,显著提高了宿主对各种环境压力的适应性,包括温度、渗透压和利用戊二酸作为唯一碳源的能力[6]。NeoChrs通过增强微生物细胞工厂对复杂发酵过程的适应性,以及利用新的碳源,进一步创造了经济优势,使得可以使用更便宜、可再生的原料(图5E)。
5.3 NeoChrs扩展了宿主菌株的代谢网络
NeoChrs不仅增强了全局代谢产物的产生,还使得酿酒酵母能够合成新的化合物。在引入HAnDy组装的NeoChrs后,对宿主菌株进行定量代谢物分析,确认了八种内源性代谢物的富集,包括泛酸、肉豆蔻酸和吡啶甲酸。此外,还检测到了九种潜在的新代谢物和芳香化合物甲基蒽兰酸[6]。增强关键内源性代谢物的产生为细胞工厂提供了丰富的前体,从而提高了它们的整体生物合成能力。此外,能够合成新的化合物还有助于开发新的微生物生产平台,并为识别先前未知的生物合成途径开辟了途径(图5E)。此外,NeoChrs在途径交换[5, 64]和微生物细胞工厂构建[5]方面具有显著优势。模块化途径交换的概念涉及从特定代谢途径中遗传上减少和聚集基因,允许轻松替换为其他配置。这种方法对于工业细胞工厂的代谢重编程特别有价值。例如,编码糖酵解的基因已被重新定位到单个染色体位点[169]或NeoChrs的预定位置[5, 64]。Postma等人[5]结合NeoChrs重新连接了内源性代谢网络,并在酿酒酵母中引入了新的异源途径。具体来说,20个参与糖酵解、乙醇发酵和戊糖磷酸途径的天然基因从天然染色体重新定位到NeoChrs上。此外,包括反馈抵抗等位基因(10个基因)在内的整个芳香氨基酸生物合成途径,以及从酪氨酸和苯丙氨酸合成天竺葵素3-O-葡萄糖苷(P3G)所需的11个植物基因,也被组装到一个NeoChrs上。从这个NeoChrs表达的人工花青素途径使得花青素的产生成为可能,而增加coAtCHS3的拷贝数并修复coAtANS进一步提高了生物合成效率。
6 总结与展望
这篇综述展示了大DNA片段组装如何彻底改变了微生物细胞工厂的构建、修改和进化。体外组装允许灵活地组装标准化部件或合成途径,而不受宿主限制,而体内组装则为较大的生物合成途径(>10 kb)提供了更高的效率和稳定性。两者共同显著加速了菌株的构建和优化。合成基因组组装将微生物工程从局部优化提升到构建理想的定制底盘。额外NeoChrs的组装进一步为细胞工厂提供了灵活和可扩展的平台,从而实现了网络的多功能性扩展。最终,这些大DNA片段组装技术为先进微生物细胞工厂在生物制造中的应用奠定了坚实的基础。然而,大DNA片段组装策略通常应用于模型生物,如大肠杆菌(E. coli)和酿酒酵母(S. cerevisiae),它们有限的宿主多样性限制了其在代谢工程中的广泛应用。一方面,未来的工作应集中在为更多宿主(例如T. reesei、Vibrio natriegens和Y. lipolytica)开发高效的体内组装系统,扩展这些物种在代谢工程和合成生物学中的应用[44, 170, 171]。另一方面,需要传递技术来在细胞间转移组装好的大DNA片段。目前的方法,包括细菌 conjugation[137]、酵母交配[6]和诱导细胞融合[172],已经实现了大肠杆菌菌株、酵母菌株之间的大DNA片段转移,甚至是大肠杆菌和酵母之间的转移。尽管如此,跨物种转移效率仍然较低。因此,未来的工作应优先优化转移条件并阐明潜在的融合机制以提高效率。此外,开发新的传递系统以扩大宿主范围,以及利用核分离-移植技术(如synNICE)进行精确的大DNA片段转移[173]至关重要。微生物细胞工厂的工程继续受到耗时且成本高昂的大DNA片段组装过程的限制。一些有前景的途径正在出现,以解决这些挑战。高通量DNA合成技术的进步,如基于微芯片的大规模并行合成,有望以显著降低的成本提供更高质量的起始材料[10]。自动化的高通量平台,与已建立的方法(如Biopart Assembly Standard for Idempotent Cloning(BASIC)[174]、Robot-assisted MoClo(RoboMoClo)[24]和Uracil-Specific Excision Reagent(USER)[175]结合使用,能够实现复杂遗传构建的稳健和并行组装。展望未来,将这些模块化的自动化DNA合成和测序技术与自动化组装平台相结合,将为全自动生物系统工程铺平道路。当进一步与AI驱动的设计结合时,大DNA片段组装将推动高效率、高精度的设计-构建-测试-学习(DBTL)循环。这些进步预计将大幅降低成本和时间,从而显著加快微生物细胞工厂的开发周期。此外,尽管NeoChr和基因组组装取得了进展,但它们在工程微生物细胞工厂中的应用仍然处于初期阶段。展望未来,NeoChr组装技术支持大规模功能性模块的“即插即用”集成。通过将异质性途径模块与相互连接的代谢模块(例如糖酵解、前体合成和辅因子再生)结合到NeoChr上,可以方便地对超大型代谢途径进行操作和测试。NeoChr或合成基因组的组装还使得构建泛基因组或混合基因组成为可能,从而整合数百甚至数千个菌株中的优良性状,以增强其在复杂工业条件下的适应性[6, 66]。此外,利用基因组重组的底盘(例如大肠杆菌中的GCE)能够安全高效地生产新型生化物质。这种技术现在正扩展到酵母领域,以实现更精确的菌株调控和生物安全控制[176, 177]。短期内,我们有望看到这些技术被用于系统化、精准地改造具有超强耐受性和生产力的工业菌株。
作者贡献:
张宇:概念构思;研究;项目管理;数据可视化;初稿撰写;审稿与编辑。
刘文倩:概念构思;研究;数据可视化;初稿撰写;审稿与编辑。
程东源:概念构思;研究;数据可视化;初稿撰写;审稿与编辑。
连家璋:项目监督;审稿与编辑。
傅贤:概念构思;资金筹集;项目监督;审稿与编辑。
沈越:概念构思;资金筹集;项目监督;审稿与编辑。
致谢:
本研究得到了中国国家重点研发计划(编号2024YFA0916500)、国家自然科学基金(编号32322047和32471490)以及江苏省科技厅(编号BM2023009)的支持。我们感谢张茜andi在DNA合成技术方面提供的建议,以及张张在图例改进方面给予的帮助。
利益冲突声明:
作者声明不存在任何利益冲突。
伦理声明:
本文未涉及任何作者参与的人类或动物实验研究。
数据共享声明:
本文不适用数据共享政策。