数据驱动的热稳定胶原模拟类肽三重螺旋工程

《Macromolecular Rapid Communications》:Data-Driven Engineering of Thermostable Collagen-Mimetic Peptoid Triple Helices

【字体: 时间:2026年02月26日 来源:Macromolecular Rapid Communications 4.3

编辑推荐:

  本文介绍了一种结合分子动力学模拟、高斯过程回归与贝叶斯优化的计算主动学习循环,用于设计稳定的类肽基胶原模拟物,并通过实验验证其可形成类胶原的三重螺旋结构,为基于类肽的生物仿生材料设计开辟了新途径。

  
1 引言
胶原是结缔组织中的主要结构蛋白,因其独特的三重螺旋三级结构及在组织修复、药物递送等领域的广泛应用而备受关注。胶原及其模拟肽的关键序列基序是重复的x-y-Gly(甘氨酸)三氨基酸序列,其中甘氨酸对于三重螺旋的紧密堆积至关重要,而x和y位置的氨基酸替换可用于调节胶原模拟肽的结构和性质。近年来的研究重点之一是引入非天然氨基酸以增强胶原模拟肽(CMP)的性质,特别是其四级结构(即三重螺旋)的稳定性。其中,类肽残基(N-取代的甘氨酸衍生物)因其热稳定性、抗蛋白水解性、生物相容性及多样化的非天然侧链库而展现出吸引力,但其固有的骨架高度柔性也可能削弱三重螺旋的稳定性。因此,本文旨在利用计算工具发现能够形成稳定三重螺旋的类肽基胶原模拟物,并建立通用的设计策略。
2 方法
本研究开发并应用了一个用于发现能够形成热稳定胶原三重螺旋的类肽基胶原模拟物的主动学习框架。
2.1 类肽设计空间
设计空间定义为由三个重复的六聚体亚基(x1-y1-Gly-x2-y2-Gly)3构成的18残基类肽,两端分别以乙酰基N帽和氨基C帽封端。其中,x1和x2位置被设计为带电荷的残基,以促进单链聚脯氨酸-II型螺旋样结构的稳定及链间静电相互作用;y1和y2位置可从20种类肽残基中选择,这些残基被确定为不会损害三重螺旋的稳定性(相对于脯氨酸)。由此形成的组合空间包含10000个候选序列。
2.2 类肽序列特征化
为了在主动学习循环中向高斯过程回归代理模型表示候选分子,本研究采用了原子对指纹对10000个候选分子进行特征化,并应用主成分分析将高维特征降至10维,用于训练模型。
2.3 三重螺旋稳定性的非平衡熔解温度估计
采用升温分子动力学模拟来估算三重螺旋解链(熔解)的温度(Tm),以此作为稳定性指标。模拟从预先组装的三重螺旋构象开始,温度以1 K/ns的速率从320 K线性上升,通过监测三重螺旋的回转半径或链间距离来判定熔解事件。
2.4 高斯过程回归代理模型
在每一轮主动学习循环中,训练一个高斯过程回归模型,用于预测候选类肽序列的Tm。模型采用径向基函数核,并在每次循环中通过边缘对数似然最大化来优化超参数。
2.5 贝叶斯优化
使用贝叶斯优化来查询已训练的代理模型的预测,并根据获取函数(本研究采用q-预期改进)优先选择下一轮进行分子动力学模拟的候选序列,以高效探索序列空间。
2.6 三重螺旋稳定性的增强采样自由能估计
对主动学习筛选出的顶级候选序列,采用更严格的平衡自由能计算方法(如伞形采样)来评估三重螺旋与解链状态之间的自由能差(ΔG),以提供更可靠的稳定性度量。
2.7 实验类肽合成与表征
对计算预测的顶级候选序列之一进行固相合成、纯化,并通过扫描电子显微镜成像来观察其是否能形成与胶原样三重螺旋一致的纤维状束。
3 结果
3.1 热稳定胶原模拟物的主动学习筛选
主动学习筛选共进行了24轮,每轮选择8个新候选序列,共评估了218个候选序列(占设计空间的2.18%)。筛选出的前16个候选序列及其估算的Tm值列表显示,排名第一的序列(EKGEKG)3在第八轮中被发现,其Tm为(432 ± 8) K。
3.2 热稳定胶原模拟物的组成分析
对218个候选序列的分析表明,Tm与六聚体重复单元中带电残基的数量呈中度正相关,而与疏水残基的数量呈弱负相关。具体残基频率分析显示,长链带电残基(如NLys、NGlu)与Tm正相关,而短链带正电荷残基(如Nae)则呈负相关。线性回归模型表明,仅基于残基计数的简单模型就能较好地预测Tm
3.3 顶级胶原模拟物的自由能验证
对前五个候选序列及一个天然胶原对照序列(PPGPPG)3进行增强采样自由能计算,发现基于非平衡Tm的排名与基于平衡自由能差ΔG的排名高度一致,验证了主动学习循环中所用Tm估算方法的可靠性。顶级类肽序列(EKGEKG)3的ΔG为-39.9 ± 5.3 kJ/mol,其稳定性超过了对照组中的一些序列。
3.4 实验表征
对(EKGEKG)3的实验合成与扫描电子显微镜成像显示,该分子能够自组装形成高度有序的纤维状束,其形态与胶原样三重螺旋结构一致,为计算预测提供了实验支持。
4 结论与展望
本研究成功应用了一个集分子动力学模拟、高斯过程回归和贝叶斯优化于一体的计算主动学习循环,从10000个可能的类肽序列中高效地筛选出了能够形成热稳定三重螺旋的胶原模拟类肽。该工作不仅预测了多个具有潜力的类肽序列,而且揭示了一些合理的设计原则,例如带电残基和轻质疏水残基对稳定性的贡献。研究还通过实验验证了顶级候选序列的自组装能力,证明了该计算设计策略的有效性。这为设计具有定制结构和功能的基于类肽的生物仿生超分子组装体提供了一种通用方法。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号