《Natural Products and Bioprospecting》:Revolutionizing microbial treasure troves: innovative strategies for natural products discovery
编辑推荐:
这篇综述系统阐述了微生物天然产物(MNP)发现领域的范式变革。文章重点介绍了三种革新性策略:通过调控培养条件激活沉默生物合成基因簇(BGC)的“一株多产”(OSMAC)策略;基于基因组数据挖掘隐性代谢潜力的基因组挖掘(Genome Mining)策略,特别是CRISPR等基因编辑技术的应用;以及利用人工智能(如机器学习ML)实现高效靶向发现的智能策略。综述通过大量案例(2019-2025年)表明,这些策略已成功发现300多种结构新颖、具有抗菌、抗癌、抗炎等活性的先导化合物,为应对抗生素耐药性等挑战提供了新思路,并展望了单细胞分析、多组学整合与合成生物学相结合的未来发展方向。
引言
微生物天然产物是由细菌、真菌和放线菌等微生物产生的一类化合物,以其独特的结构多样性和广泛的生物活性而闻名,长期以来一直是药物先导化合物的重要来源。据统计,约70%的临床使用抗生素源于微生物。除了抗生素,微生物代谢物在免疫抑制剂(如环孢素A)、降胆固醇药物(如洛伐他汀)以及抗癌药物(如通过微生物发酵商业化生产的紫杉醇)的开发中也扮演了关键角色。然而,该领域面临三大挑战:超过90%的环境微生物无法在标准实验室条件下培养;常用菌株的重复发现率高;以及大多数生物合成基因簇(BGC)在常规条件下处于“沉默”状态。这些挑战亟需超越传统方法的范式创新。
创新策略
OSMAC策略
“一株多产”(OSMAC)策略是一种通过系统调节培养条件来激活微生物中沉默BGCs的创新方法。其核心原则包括营养调控(碳源、氮源、微量元素)、物理参数调整(温度、pH、溶氧)、生物相互作用(共培养)以及表观遗传调控(使用组蛋白去乙酰化酶抑制剂HDAC抑制剂如SAHA或DNA甲基转移酶DNMT抑制剂如5-氮杂胞苷5-azacytidine)。
培养方法改良
- •
培养基变化:特定培养基成分能精确调控代谢物结构多样性。例如,在添加氨基酸的GPY培养基中,海洋真菌Pseudallescheria boydii F44-1产生新型螺环双吲哚生物碱。在含3% NaBr或KI的培养基中, mangrove真菌Phomopsis sp. QYM-13分别产生溴代和碘代细胞松弛素,其中一些对MDA-MB-435癌细胞显示显著细胞毒性。氮源类型(如NaNO3vs 谷氨酸钠)可诱导同一真菌产生结构完全不同的化合物。
- •
化学表观遗传修饰:添加表观遗传修饰剂能有效激活沉默代谢途径。例如,使用5-氮杂胞苷处理内生真菌Chaetomium globosporum,诱导产生了新型环戊烯酮和单萜吲哚生物碱,后者对水稻白叶枯病菌展示出优异的抗菌活性,具备开发生物农药的潜力。SAHA和5-氮杂胞苷联合处理深海真菌Eutypella sp.,则产生了17个新型倍半萜类化合物。
共培养
共培养通过模拟自然生态相互作用,有效激活沉默BGCs。
- •
真菌-真菌共培养:Penicillium属真菌共培养产生了具有抗菌、抗肿瘤活性的新型萜类衍生物和喹啉类化合物。Aspergillus属真菌共培养不仅能提高已知代谢物(如曲酸)产量,还能诱导产生结构新颖的化合物,如具有显著抗白血病HL-60细胞活性的monaspin B。大型真菌(如平菇Pleurotus ostreatus)共培养也能产生新的抗菌萜类化合物。
- •
真菌-细菌共培养:例如,将海绵来源真菌Aspergillus versicolor与枯草芽孢杆菌(Bacillus subtilis)共培养,产生了新的环五肽和蒽醌类化合物。真菌Trichocladium sp.与枯草芽孢杆菌共培养诱导产生了新化合物5-表-pestafolide A。
- •
细菌-细菌共培养:链霉菌(Streptomyces)与Pandoraea sp.共培养使芳香代谢物gwanakoside B的产量提高了100倍。Streptomyces hygroscopicus与Tsukamurella pulmonis共培养产生了具有platensimycin样抗菌活性和肠杆菌素样铁螯合能力的独特抗菌缀合物harundomycin A。
新兴培养技术与工具
为突破纯培养限制,出现了模拟自然生境的新技术,如原位培养和iChip等高通量培养装置。iChip利用半透膜允许环境中的营养物质和信号分子自由扩散,同时将微生物限制在微孔中,显著提高了不可培养微生物的分离率,为从微生物“暗物质”中发现新活性分子提供了途径。
基因组挖掘策略
基因组挖掘是基于微生物基因组数据发现天然产物的整合研究策略,其方法多样且不断发展。基因编辑技术如CRISPR和多重碱基编辑(Multiplex Base-Editing, MBE)的结合,显著增强了次级代谢物的发现和生产能力。
- •
基因敲除(Gene Knockout):用于精确消除特定基因功能。例如,在极地真菌Eutytella sp. D-1中敲除三萜环化酶关键基因,诱导代谢流重编程,激活了沉默的次级代谢基因簇,分离到8个新结构化合物,其中一种蒽型倍半萜在细胞和斑马鱼模型中通过调节MAPK和NLRP3/caspase-1信号通路显示出显著抗炎活性。
- •
同源重组(Homologous Recombination):实现无缝基因替换或插入。在真菌Calcarisporium arbuscula中,通过同源重组敲除aurocertins基因簇的DaurA基因,并鉴定强效启动子,成功激活了内源性聚酮合酶(PKS)基因簇,并实现了外源真菌PKS基因簇的高效异源表达,拓宽了aurovertin类聚酮的结构多样性。
- •
转录因子过表达(Transcription Factor Overexpression):放大限速转录激活因子以克服代谢瓶颈。例如,在Talaromyces sp.中过表达转录因子LutB,激活了一个隐性代谢途径,产生五个结构新颖的sclerotiorin型氮杂菲酮。在Calcarisporium arbuscula中过表达一个途径特异性转录因子,激活了沉默的mca17基因簇,产生了一个新型四酸类化合物MCA17-1,该化合物在TGF-β诱导的肝星状细胞活化模型中显示出显著抑制活性。
- •
结构特征导向的基因簇定位策略(Structure-Feature-based Gene Cluster Localization):以 strained cyclophane 为关键生物合成片段,开发新的天然产物发现方法。利用HqlABC这一“最小环芳烷形成盒”作为靶点,从保守基因簇中发现了具有复杂八环结构的octacycline A。
- •
核心生物合成酶的保守性挖掘(Conservativity Mining of Core Biosynthetic Enzymes):针对四种重要农业病原真菌,基于高度还原型聚酮合酶(HRPKSs)锚定的BGCs,发现了一个在病原菌和木霉(如生防菌T. afroharzianum t-22)中高度保守的BGC,并从中鉴定出具有萜类样反式稠合5,7-双环核心骨架的新化合物treconorin。
基因组挖掘与代谢分析整合
为弥合基因组预测与具体化学实体之间的差距,基因组挖掘需要与液相色谱-串联质谱(LC-MS/MS)、高分辨率核磁共振(NMR)等先进结构分析平台协同整合。这种多学科融合不仅加速了已知化合物的去重复,还能快速解析新骨架结构,显著缩短发现时间线,并通过最小化冗余代谢物的分离优化了药物开发中天然产物研发管线的成本效益。
- •
同源性基因组挖掘与HPLC-MS验证技术结合:基于关键生物合成酶C-糖基转移酶(AuCGT)的酶导向基因组挖掘策略,结合HPLC-MS验证,从多种真菌菌株中鉴定出多个BGCs,表征了20个新型芳香聚酮C/O-糖苷,并通异源表达进行了组合生物合成。这些糖苷显示出显著的抗病毒、抗菌和抗糖尿病活性。对海洋真菌Aspergillus sydowii的基因组挖掘和GNPS分子网络分析,导向了11个具有神经保护活性的呫吨酮生物碱的发现。
- •
NMR代谢组学与基因组挖掘耦合:对海洋来源链霉菌Streptomyces sp. S063的提取物进行NMR代谢组学分析,观察到罕见的特征信号,提示存在结构新颖的N-甲基化肽类代谢物。基因组挖掘进一步发现了一个独特的非核糖体肽合成酶(NRPS)基因簇,基于此通过HRESIMS/MS分析注释了lenziamides D1和B1,两者对多种人类癌细胞系显示出中等生长抑制活性。
机器学习驱动策略
- •
AI辅助酶定制平台(AI-facilitated Enzyme Tailoring Platform):开发了基因组挖掘工具包NPtagM,用于定制天然产物的多样化。该工具优化了算法架构,将P450酶的预测效率提升至现有工具antiSMASH的三倍。利用NPtagM系统分析真菌基因组,从一个去重复后的萜类P450酶家族中识别出可能参与艾里莫芬烷型(eremophilane-type)倍萜生物合成的P450酶,并通过异源表达成功获得两个新化合物。
- •
智能CRISPR引导的基因组工程(Intelligent CRISPR-guided Genome Engineering):结合CRISPR-Cas9系统与碱基编辑工具,开发了多重碱基编辑(MBE)平台,可在丝状真菌中实现高通量基因编辑,单次转化可同时编辑多达八个基因。利用该技术组合调控Aspergillus nidulans中的三个表观遗传调控因子(CclA, ClrD, HdaA),成功激活了八个沉默的BGCs,分离到四个结构新颖的化合物。此外,开发的CRISPR-Cas9基因编辑工具ACTIMOT,能够原位切除转移大型染色体DNA片段(如BGCs)至自主复制质粒,成功激活了链霉菌中的四个隐秘基因簇,发现了39个结构多样的新型天然产物。
- •
结构导向的智能筛选(Structure-Oriented Intelligent Screening):基于深度神经网络开发了抗菌活性预测模型,并创新性地应用于双轨筛选策略:一方面虚拟筛选ZINC15数据库中的超过1.07亿个分子,实验验证了8个新型抗菌化合物;另一方面结合靶向药物重定位技术,从“药物重定位中心”库中高效识别出结构创新的抗生素halicin,其对临床关键病原体具有广谱抗菌活性。此外,建立了结构导向馏分筛选平台(SFSP),整合机器学习算法与多维光谱数据,实现了从提取物库MS1质谱数据和1H-PSYCHE-NMR谱图中直接预测化合物节点的化学位移,从而不依赖数据库进行结构特征分析。利用该平台从深海热液口真菌Aspergillus sp. GE2-6中成功鉴定出两类新型天然产物:通过1H NMR烯烃信号指导发现的Flavipidin类化合物,以及通过1H NMR低场羟基信号指导发现的Phenalenones类化合物,部分化合物显示出显著的抗流感病毒或抑制HIV假病毒感染活性。
总结与展望
当前策略各有特点:OSMAC策略简单但产物不可控、产量低;结构定位策略目标性强但依赖已知数据库;核心生物合成酶保守性挖掘适合高通量筛选但可能漏掉非典型酶;组学整合策略中,HPLC-MS灵敏度高但依赖谱库,NMR结构解析精确但灵敏度有限;机器学习驱动策略中,NPtagM平台可加速结构衍生化但预测非经典修饰性能不佳,CRISPR碱基编辑可精确激活沉默基因簇,深度神经网络可进行虚拟筛选但需要大样本量训练。
当前研究的核心矛盾在于微生物基因组数据快速增长(已测序超过20万个基因组),但系统性研究比例极低。未来突破应聚焦三个维度:技术创新层面,需开发新的培养技术和单细胞分析方法以获取不可培养微生物资源;策略优化层面,需要更深度的多组学整合,特别是建立“基因组-转录组-代谢组”关联网络;方法创新关键在于跨学科融合,包括:(1) 生物信息学驱动的智能预测,(2) 合成生物学指导的理性设计,以及 (3) 微流控技术实现的高通量筛选。随着CRISPR等技术的突破,微生物次级代谢研究已进入黄金发展时期。构建“数据驱动实验、实验验证反馈、工程优化”的研究框架,有望在制药和农业应用方面带来变革性突破。