通过生成式人工智能设计,迈向以19种氨基酸为基础的生命体系

《SCIENCE》:Toward life with a 19–amino acid alphabet through generative artificial intelligence design

【字体: 时间:2026年05月03日 来源:SCIENCE 45.8

编辑推荐:

   编辑摘要 所有自然生物体都使用相同的20种氨基酸作为蛋白质的构建块,但是否可以使用稍微简化的氨基酸字母表来创建合成细胞呢?Liu等人利用计算蛋白质设计和合成生物学技术,从细菌的核糖体蛋白中去除了所有的异亮氨酸残基(详见Sanfiorenzo和Wang的文章)。基于人工智能的

  



编辑摘要


所有自然生物体都使用相同的20种氨基酸作为蛋白质的构建块,但是否可以使用稍微简化的氨基酸字母表来创建合成细胞呢?Liu等人利用计算蛋白质设计和合成生物学技术,从细菌的核糖体蛋白中去除了所有的异亮氨酸残基(详见Sanfiorenzo和Wang的文章)。基于人工智能的蛋白质模型对这一研究的成功至关重要,这凸显了生成设计的强大能力。这项工作为构建具有简化组件的基因重组细胞提供了途径,并揭示了可能影响早期进化的生化限制因素。——Di Jiang



结构化摘要



引言


细胞中的蛋白质由20种标准氨基酸构成,这一特性在当今地球上的所有生命形式中都是普遍存在的。尽管翻译后修饰和非标准氨基酸的扩展可以增加构建块的种类,但尚未发现任何自由生活的生物体使用少于20种氨基酸的字母表。这引发了一个基本问题:是否可以用更少的氨基酸字母表构建出可行的细胞?创建这样的细胞有助于阐明塑造早期进化的关键生化限制,并推动由更简单成分组成的合成生命的发展。



研究理由


多项证据表明,生命可以使用更简化的氨基酸集合来构建。几种标准氨基酸具有相似的生化特性,可能在功能上是冗余的。例如,全局进化序列分析表明,异亮氨酸(Ile)是最不保守的氨基酸之一,经常被类似的缬氨酸残基取代。计算蛋白质建模也表明,原则上只需9到12种氨基酸就可以编码所有蛋白质的结构。此外,生成蛋白质设计的最新进展已经产生了与天然序列有显著差异的功能性蛋白质。这些观察结果表明,在生成式人工智能(AI)的帮助下,可以使用更少的氨基酸字母表重新设计蛋白质,而像异亮氨酸这样的冗余分支链氨基酸可能是适合被消除的候选者。



结果


为了验证我们的假设,我们首先在39种大肠杆菌(Escherichia coli)中的必需或高表达蛋白质中将所有异亮氨酸残基替换为缬氨酸或亮氨酸,结果发现只有约43%的变体在体内仍然具有功能性,这表明简单的全球性氨基酸替换方案是不够的。随后,我们使用了最先进的结构预测和蛋白质设计模型来提出替代的异亮氨酸替换方案。基于序列的语言模型(ESM2和MSA Transformer)和基于结构的模型(ProteinMPNN和AlphaFold2)被用来生成保留结构和功能的新异亮氨酸缺失变体。我们专注于重新设计构成细胞中最重要的保守蛋白质复合体之一的所有52种大肠杆菌核糖体蛋白。通过迭代的设计-构建-测试(DBT)框架,我们成功地在每种核糖体蛋白中替换了所有异亮氨酸(并进行了必要的补偿性突变),同时保持了相对的细胞适应性,其水平超过野生型的90%。21个无异亮氨酸的核糖体亚基被整合到大肠杆菌的一个单基因组位点(Ec19)中,该菌株在实验室中连续传代超过450代后仍然保持基因组稳定性,且通过全基因组测序未发现异亮氨酸的回复突变。



结论


这项工作为构建自最后一个共同祖先以来的首个使用19种氨基酸字母表的自由生活细胞建立了基础路线图。通过将生成模型与精确的基因组工程相结合,我们成功地去除了大肠杆菌核糖体中的所有异亮氨酸残基,标志着朝着这一目标迈出了重要一步。基因组规模建模和DNA合成的进步将进一步促进具有新细胞特性的合成基因组的高通量探索,并推动工程生命的边界。






利用生成式AI简化标准氨基酸字母表。


该图展示了通过DBT框架(右侧)去除异亮氨酸(Ile)来构建含有19种氨基酸(AA)的大肠杆菌(Ec19)的过程。基于序列的语言模型和基于结构的模型被用来生成Ec19的设计(左下角)。核糖体复合体被重新设计以替换所有382个异亮氨酸残基,并生成了一个含有21个无异亮氨酸核糖体亚基的可行Ec19细胞(右中)。I代表异亮氨酸,V代表缬氨酸;PDB代表蛋白质数据库。






摘要


由于所有已知的生物体都由至少20种标准氨基酸组成,因此使用更简化的氨基酸字母表来构建生命体的可行性仍不明确。在这项研究中,我们利用计算设计和合成生物学技术探索了使用19种氨基酸字母表构建细胞的可能性。初步分析表明异亮氨酸可能是可省略的,我们通过直接替换大肠杆菌中必需蛋白质中的异亮氨酸残基来验证了这一点。在大多数情况下,蛋白质语言模型和基于结构的模型对于重新设计无异亮氨酸的功能性蛋白质是必要的。我们系统地从核糖体中替换了所有382个异亮氨酸残基,并将21个重新设计的亚基整合到一个天然的基因组位点中,从而产生了一个可行且进化稳定的细胞。这项工作为创建自早期进化以来的首个19种氨基酸生物体提供了路线图。






相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号