面向统一3D分子表征学习的等变预训练Transformer模型研究

《Nature Communications》:An equivariant pretrained transformer for unified 3D molecular representation learning

【字体: 时间:2026年02月11日 来源:Nature Communications 15.7

编辑推荐:

  本文针对当前3D分子预训练模型局限于单一领域的问题,提出了一种基于E(3)-等变Transformer的全原子基础模型(EPT)。该模型通过多领域3D分子预训练,可同时学习原子级相互作用和图级结构特征(如蛋白质残基),在配体结合亲和力预测、蛋白质/小分子性质预测方面表现优异,并应用于COVID-19病毒主蛋白酶抗病毒化合物筛选,为跨领域分子表征学习提供新范式。

  
在当今药物研发和生命科学领域,三维分子结构信息的挖掘正成为关键突破口。虽然预训练技术在二维分子表征中已取得显著成效,但面向3D分子的预训练模型往往受限于单一领域——或专注于小分子,或聚焦于蛋白质,这种"各自为战"的模式导致跨领域知识难以共享。更关键的是,传统方法大多忽略3D空间中的几何对称性(即E(3)等变性),而这一性质对于准确描述分子构象变化和相互作用至关重要。
为突破这些瓶颈,研究团队在《Nature Communications》发表题为"An equivariant pretrained transformer for unified 3D molecular representation learning"的研究,提出了一种革命性的等变预训练Transformer(EPT)模型。该模型首次实现跨小分子、蛋白质等多领域的统一3D表征学习,在保留E(3)等变性的同时,既能捕捉原子间的局部相互作用,又能解析残基级别的结构特征。实验证明,该模型在配体结合亲和力预测任务中实现显著提升,对蛋白质和小分子性质预测也达到竞争性水平。尤为重要的是,研究团队成功将其应用于COVID-19病毒主蛋白酶(Mpro)的抗病毒化合物筛选,并通过计算与实验验证了候选化合物的有效性,为应对突发传染病提供了新的AI驱动解决方案。
关键技术方法包括:构建E(3)-等变Transformer架构实现旋转平移不变的3D表征;设计多任务预训练策略融合原子级与图级特征;采用几何消息传递机制建模分子相互作用;使用多领域数据集(包括蛋白质数据库PDB和小分子数据库ChEMBL)进行预训练;结合自由能微扰(FEE)计算和体外实验验证模型预测效果。
研究结果方面,通过系统的实验设计验证了模型的优越性:在"跨领域表征迁移能力评估"中,模型在未见过的蛋白质-配体复合物上仍保持高精度;"等变性与表征质量分析"显示E(3)等变设计显著提升了对分子空间变换的鲁棒性;"抗病毒化合物筛选应用"部分证实模型能从百万级化合物库中高效识别Mpro抑制剂,其中两个先导化合物经表面等离子共振(SPR)验证具有纳摩尔级亲和力。
结论部分强调该研究首次建立了面向多领域3D分子的统一表征学习框架,其等变特性克服了传统方法对坐标系选择的敏感性。模型展现出的跨任务泛化能力为AI辅助药物研发提供了新范式,特别是在突发传染病威胁下可实现快速响应。讨论中指出,未来可扩展至RNA-配体相互作用等更复杂体系,但当前模型对构象动态变化的捕捉仍有提升空间。这项研究标志着几何深度学习与计算生物学融合的重要进展,为精准医疗和绿色药物研发注入新动能。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号