《JMIR Bioinformatics and Biotechnology》:Systematic Mining of Bioactive Compounds for Wound Healing From
Cayratia Japonica Exosome-Like Nanovesicles: A Workflow Combining LC-MS and DeepSeek Models
编辑推荐:
本研究创新性地构建了LC-MS与DeepSeek模型联用的多模态框架,针对传统LC-MS分析大型数据集能力有限的问题,开发了四步过滤工作流程,从乌蔹莓外泌体样纳米囊泡(CJ-ELNs)中成功筛选出46种具有伤口愈合功能的天然活性化合物,为中药活性成分挖掘提供了AI驱动的新范式。
在传统中药研究领域,如何从复杂植物基质中快速精准地识别具有特定治疗功能的活性成分一直是个重大挑战。乌蔹莓(Cayratia japonica)作为一种常用于治疗创伤的传统中药,其外泌体样纳米囊泡(CJ-ELNs)因其高生物相容性和低免疫原性而显示出巨大的药物递送潜力。然而,传统液相色谱-质谱联用(LC-MS)技术在处理海量数据时受限于传统分析方法,难以实现高效的功能性成分挖掘。
针对这一瓶颈,研究团队开创性地将DeepSeek大语言模型与LC-MS技术相结合,构建了一套智能化的多模态分析框架。该研究首先通过LC-MS对乌蔹莓原植物及其外泌体样纳米囊泡进行非靶向代谢组学分析,鉴定出CJ-ELNs中特有的1881种化合物。值得注意的是,词云分析显示"酸"类化合物在CJ-ELNs中高度富集,这为理解其药理作用机制提供了重要线索。
研究团队设计的四步过滤工作流程包括:匹配置信度过滤、CJ-ELNs特有化合物筛选、生物学相关性过滤以及语义识别与提示工程。该框架的核心架构整合了化合物的结构特征(摩根指纹)、定量特征(z-score标准化)和文献衍生特征(PubMedBERT嵌入),通过多任务学习同时预测伤口愈合活性和作用机制类别。
在技术方法层面,研究主要运用了以下关键技术:1)超高效液相色谱-质谱联用(UHPLC-MS)进行化合物鉴定;2)四步过滤工作流程筛选目标化合物;3)DeepSeek模型的自动语义识别(ASR)和提示工程技术进行功能注释;4)多模态框架整合结构、定量和文献特征进行活性预测。
酸性化合物在CJ-ELNs中富集
经过LC-MS数据预处理和归一化后,从CJ和CJ-ELNs中分别鉴定出829和2212种化合物,维恩图显示CJ-ELNs中含有1881种特有化合物。词云分析发现"酸"是代谢物名称中出现频率最高的术语,表明酸性化合物在CJ-ELNs中高度富集。
快速准确挖掘CJ-ELNs中功能性化合物
利用自主设计的多模态框架,对1881种CJ-ELNs富集化合物进行功能注释和分类,将其划分为20个不同类别,其中有机化合物是主要类别。功能分析显示43.33%的化合物具有抗氧化特性,通过DeepSeek辅助筛选出具有抗氧化、抗炎、抗细胞损伤、抗凋亡、伤口愈合与组织再生及细胞增殖等靶向功能的化合物。
CJ-ELNs中负责伤口愈合和组织再生的生物活性化合物
通过雷达图可视化六种靶向功能化合物的整体表达水平,发现具有抗氧化功能的化合物表达水平最高,证实了CJ-ELNs在伤口修复中的抗氧化机制。经过二次过滤排除非植物源性化合物和低表达量化合物后,最终鉴定出46种来自CJ-ELNs的具有靶向功能的天然活性化合物,其中柠檬酸是含量最丰富的功能性化合物。
研究结论表明,该多模态框架能够快速准确地从CJ-ELNs中识别天然活性化合物,创新性地将传统分析技术与现代大语言模型相结合。讨论部分指出,酸性化合物在中药中具有清热解毒功效,其抗氧化、抗菌和抗炎作用通过清除自由基、缓解氧化应激、调节炎症因子等机制促进伤口愈合。例如,研究显示黄芩苷通过下调促炎细胞因子(IL-6和IL-1β)和上调抗炎因子IL-10,并促进多种生长因子(VEGF、FGF-2、PDGF-β和CTGF)分泌来加速伤口愈合过程。
该研究的重要意义在于为中药活性成分挖掘提供了可扩展的多模态生物数据分析解决方案,通过AI驱动的计算方法加速了天然产物发现进程,为开发基于中药的新型伤口愈合治疗策略奠定了坚实基础。尽管研究存在仅使用单一LLM和缺乏实验验证等局限性,但所建立的工作流程为后续研究提供了重要技术支撑,展现了人工智能在传统医药现代化研究中的巨大应用潜力。