通过高保真微调和以应用为导向的筛选,加强基于Transformer的聚合物电解质发现

《Materials Today Energy》:Reinforcing Transformer-Based Polymer Electrolyte Discovery through High-Fidelity Fine-Tuning and Application-Oriented Screening

【字体: 时间:2026年02月15日 来源:Materials Today Energy 8.6

编辑推荐:

  AI驱动多阶段验证框架成功设计出高离子电导率(>?3.30 log10 S cm?1)和优异氧化稳定性(4.50-4.86 V)的新型聚合物电解质,突破传统试错法限制。

  
李子辉|谭申东|纪朝阳|廖俊宏|谢耀书|姜璐|侯廷正
深圳全固态锂离子电池电解质工程研究中心,清华大学深圳国际研究生院材料研究所(iMR),中国深圳518055

摘要

高性能聚合物电解质的发现一直受到低效试错方法的阻碍。在此,我们提出了一个集成的人工智能驱动框架,该框架结合了GPT-2用于从头生成聚合物,RoBERTa用于高精度性能预测,以及一个多阶段流程进行严格验证。通过200纳秒分子动力学(MD)模拟获得的高保真度离子导电率数据集,确保了我们框架内的可靠微调和后续筛选。结果,我们发现了性能超越已知基准的聚合物电解质。值得注意的是,三种聚合物表现出高离子导电率(?3.11、?3.32和?3.30 log10 S cm?1),均超过了训练集中表现最好的材料。进一步对最佳候选材料的氧化稳定性分析重新发现了聚己内酯(PCL),其电化学稳定性窗口为4.86 V。此外,两种新型结构——支化PEO-PPO共聚物和氟化聚醚,分别表现出4.58 V和4.50 V的氧化稳定性,这与分支和氟化等已建立的改性策略一致。这些结果突显了该模型编码结构-性能关系并生成具有化学信息的新分子变体的能力。总体而言,这项工作提供了一系列高性能聚合物,可用于实验评估,并为推进人工智能驱动的功能性能源材料发现提供了可靠且可行的路线图。

引言

固态锂金属电池被广泛认为是下一代储能的有希望的平台[1]。在正在开发的多种电解质系统中,固态聚合物电解质(SPEs)因其界面兼容性和加工性而特别具有吸引力[2]、[3]。然而,现有SPEs的性能仍然阻碍了其实际应用。聚环氧乙烷(PEO)[4]是最广泛研究的SPE,其室温下的离子导电率本质上较低,通常只有10?8至10?4 S cm?1,远低于商业上相关的10?3 S cm?1的基准[5]。这一限制主要源于PEO的固有结晶性及其对聚合物链移动性的限制[6]。 机器学习(ML)的出现,特别是基于Transformer架构的大型语言模型(LLMs),为材料发现提供了变革性的机会。虽然像图卷积网络(GCNs)这样的方法主要从局部原子环境学习[7],但Transformer架构将聚合物视为一种化学语言。通过利用自注意力机制处理序列数据,LLMs[8]可以将聚合物编码为简化的分子输入线系统(SMILES)字符串[9],从而捕捉到影响大分子性能的复杂长程依赖性和全局结构模式。 这种范式的关键优势在于能够在庞大的通用结构数据集上进行大规模预训练。这使模型在针对具有属性标签的专门高质量数据进行微调之前,具备了丰富的聚合物化学基础理解。这种方法使得直接性能预测和生成分子设计等任务成为可能[10]、[11]、[12]、[13]。例如,预训练模型如GPT及其变体已成功应用于从头药物设计[14]、催化剂发现[15]和聚合物工程[16]、[17]、[18],显著加速了具有目标性能的材料的识别。当与第一性原理计算和原子级模拟[19]结合使用时,这些模型创建了一种结合高效数据驱动预测和原子级验证的混合方法。然而,尽管取得了这些成功,但目前仍缺乏大规模、高质量且经过验证的带有属性标签的聚合物电解质数据集。现有数据集往往稀疏、不一致[20],或仅限于采样不足的统计数据[19],这使得它们不足以训练LLMs生成不仅在化学上有效,而且在实际应用中也具有功能相关性的聚合物序列。这种数据稀缺性从根本上限制了模型的泛化能力,并继续阻碍了当前LLM框架提出真正有用的聚合物电解质设计架构的能力。 在这里,我们介绍了一个计算框架(图1),该框架将多尺度建模与基于Transformer的LLMs协同整合,以显著增强具有高离子导电率和电化学稳定性的聚合物电解质的设计。在该框架中,RoBERTa-large[21]用于快速性能预测,GPT-2[22]用于聚合物结构生成,这两个模型都在基于200纳秒MD模拟的高质量离子导电率数据集上进行了微调,这些模拟使用了1.5 mol/kg LiTFSI盐。我们MD模拟的长时间运行被证明对于实现充分采样至关重要,从而建立了对可靠模型微调至关重要的高保真度数据集(补充材料S1.1,图S1–S2)。为了最大化实际应用性,我们实施了一个多步骤验证流程,其中算法生成的聚合物序列首先根据使用微调后的RoBERTa模型预测的离子导电率进行筛选,只有最有前景的候选者才会进行计算验证。这种集成策略不仅实现了具有优异离子导电率和所需氧化还原稳定性的聚合物电解质的化学信息设计,还为强化AI驱动的SPE设计提供了一个通用框架。

结果与讨论

我们的人工智能驱动发现引擎的基础在于对预测模型(RoBERTa-large)和生成模型(GPT-2变体)的关键预训练阶段。为了建立对聚合物化学的深刻理解,这两个模型最初都在大规模的PI1M[23]聚合物数据集上进行了预训练,以学习通用的化学表示。这种预训练非常有效。模型经过固定数量的训练周期和步骤训练,从而得到了训练和验证结果

结论

总之,这项工作成功实现了一个人工智能驱动的框架,用于加速高性能材料的发现。通过协同整合生成模型(GPT-2)的探索能力、经过微调的语言模型(RoBERTa)的预测准确性以及严格的基于物理的验证工作流程,我们的方法有效地遍历了广阔的化学空间,并最终发现了超越现有基准的新聚合物电解质。

CRediT作者贡献声明

李子辉:撰写——原始草稿、验证、软件、方法论、研究、形式分析、概念化。谭申东:软件、方法论、数据管理。纪朝阳:软件、数据管理。廖俊宏:数据管理。谢耀书:概念化。姜璐:项目管理、概念化。侯廷正:撰写——审阅与编辑、监督、项目管理、资金获取、概念化

利益冲突声明

? 作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本工作得到了国家自然科学基金(22409121)、广东省自然科学基金(2025A1515012161)、深圳全固态锂离子电池电解质工程研究中心升级项目(XMHT20240108008)、深圳技术计划项目(JCYJ20240813112111015)以及深圳高等教育机构稳定支持计划(WDZC20231126215806001)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号