《Frontiers in Immunology》:Machine learning reveals targets of Gnaphalium hypoleucum DC. flavonoids against rheumatoid arthritis through gut microbiota and anti-inflammation
编辑推荐:
本研究采用机器学习(ML)、分子对接、分子动力学模拟与湿实验验证相结合的综合策略,系统阐明了秋鼠麴草总黄酮(GHTFs)治疗类风湿关节炎(RA)的活性成分、关键靶点与作用机制。研究不仅揭示了阿曼托黄酮(AF)与核心靶点(如MMP9、MMP13)的稳定结合,还证实GHTFs可有效调节肠道菌群、抑制炎症通路(IL-17、TNF-α、NF-κB),并在胶原诱导性关节炎(CIA)小鼠模型中展现了优于单一成分及甲氨蝶呤(MTX)的总体疗效,为开发RA多靶点治疗新药提供了科学依据。
1 引言
类风湿关节炎(RA)是一种以慢性滑膜炎、关节破坏为特征的自身免疫性疾病,全球患病率约为0.5-1%。现有治疗药物如糖皮质激素、非甾体抗炎药(NSAIDs)及生物制剂常伴有副作用,因此从传统草药中发掘低毒高效的生物活性化合物成为重要研究方向。黄酮类化合物广泛存在于药用植物中,具有抗炎、抗菌、调节免疫及肠道菌群等多种药理活性。秋鼠麴草(Gnaphalium hypoleucum DC.)是一种分布于中国云南的菊科植物,其总黄酮(GHTFs)具有显著的抗氧化、抗炎等作用,但其通过调节肠道菌群治疗RA的机制尚不明确。RA的发病涉及多靶点、多通路,传统药物研发耗时长、成本高。机器学习(ML)作为一种强大的生物信息学工具,在预测化合物生物活性、分析构效关系及发现新药先导物方面展现出巨大潜力。本研究提出了一种整合计算与实验的策略,旨在系统筛选GHTFs中的活性成分,预测其作用机制,并通过体内外实验进行验证,重点关注GHTFs调节肠道菌群组成及宿主免疫应答的能力。
2 材料与方法
2.1 秋鼠麴草总黄酮的制备
秋鼠麴草采自中国云南昆明。采用70%乙醇提取,经AB-8大孔吸附树脂纯化,冻干后得GHTFs。采用芦丁标准曲线法测定总黄酮含量,并通过超高效液相色谱-静电场轨道阱高分辨质谱(UPLC-Orbitrap-MS)系统鉴定出37种主要成分。
2.2 机器学习与计算分子模拟
2.2.1 RA相关靶点的识别
从NCBI GEO数据库获取7个RA相关数据集,其中5个作为训练集,2个作为验证集。采用代理变量分析(SVA)和ComBat协调方法进行批次效应校正和数据归一化。通过差异表达分析,共鉴定出2,753个在RA与正常组织间差异表达的基因。
2.2.2 GHTFs的靶点预测
将鉴定出的黄酮类化合物名称输入PubChem数据库下载其三维结构。利用瑞士ADME数据库基于胃肠道吸收和类药性进行筛选,共得到15个先导化合物。将筛选后的化合物输入SwissTargetPrediction数据库进行靶点预测,并在UniProt数据库中进行标准化,得到GHTFs的非冗余靶点集。
2.2.3 GHTFs治疗RA核心靶点的识别
使用包含Lasso、Ridge、随机森林(RF)、XGBoost等12种算法的127个预测模型,通过5折交叉验证进行超参数优化。采用受试者工作特征曲线下面积(AUC)、准确率和F1分数评估模型性能。通过模型堆叠和SHapley加性解释(SHAP)分析,最终识别出核心治疗靶点。性能最佳的glmBoost + LDA模型在训练集中AUC达到0.959,在验证集中AUC分别达到0.883和0.837。
2.2.4 分子对接
从AlphaFold蛋白质结构数据库获取核心靶点的三维结构,利用ProteinsPlus平台预测分子对接口袋。使用AutoDock分析化合物与核心靶点的相互作用,结合能低于-6.5 kcal/mol表明结合稳定。对接结果通过PyMOL可视化。
2.2.5 分子动力学模拟
使用GROMACS v2020.6对蛋白质-配体复合物进行100 ns的分子动力学模拟。分析均方根偏差(RMSD)、均方根涨落(RMSF)、氢键数量、回转半径(Rg)和溶剂可及表面积(SASA),以评估复合物结合稳定性。
2.3 细胞实验
使用LPS刺激的小鼠单核巨噬细胞RAW264.7,通过CCK-8法检测细胞活力,Griess法检测一氧化氮(NO)释放,划痕实验和Transwell实验评估细胞迁移,流式细胞术检测细胞凋亡。
2.4 RA动物模型
使用8周龄雌性BALB/c小鼠,建立胶原诱导性关节炎(CIA)模型。小鼠随机分为对照组、模型组、甲氨蝶呤(MTX)组、GHTFs组和阿曼托黄酮(AF)组。连续灌胃给药20天。于第40天收集血液、关节组织和肠道内容物。
2.5 组织病理学与评分
踝关节组织经固定、脱钙、石蜡包埋后切片,进行苏木精-伊红(H&E)染色和Masson三色染色,评估滑膜增生、炎症细胞浸润和胶原纤维含量。
2.6 肠道菌群16S rRNA测序分析
收集小鼠粪便样本,送至上海派森诺生物科技有限公司,在Illumina NovaSeq 6000平台上进行扩增子测序。分析微生物群落组成、多样性与功能。
2.7 统计分析与生物信息学分析
使用SPSS 27.0和Origin Pro 2024b进行统计分析。采用基因本体论(GO)和京都基因与基因组百科全书(KEGG)进行通路富集分析。
3 结果
3.1 机器学习与计算分子模拟分析
3.1.1 GHTFs筛选结果
通过ADME筛选,从GHTFs中确定了15个先导化合物,包括阿曼托黄酮(AF)、木犀草素、芹菜素等。
3.1.2 RA相关靶点识别
批次校正后,主成分分析(PCA)显示RA组与对照组聚类分离更清晰。差异表达分析共鉴定出2,753个差异表达基因。
3.1.3 GHTFs与RA相关治疗靶点的识别
将预测的GHTFs靶点与RA差异表达基因取交集,得到77个潜在治疗靶点。GO和KEGG富集分析表明,这些靶点显著富集于“炎症反应调节”、“血管内皮生长因子信号通路”、“IL-17信号通路”、“RA通路”、“MAPK信号通路”和“PI3K-Akt信号通路”等,提示GHTFs可能通过调节免疫炎症反应、抑制滑膜血管增生和骨侵蚀来缓解RA。
3.1.4 GHTFs治疗RA核心靶点的识别
glmBoost + LDA模型性能最优。SHAP分析确定POLB、EGFR、MMP13、VEGFA和KMT2D为五个关键基因,其表达水平在疾病样本中显著上调,单基因AUC均超过0.80,具有较高的诊断价值。
3.1.5 分子对接与分子动力学模拟
分子对接显示,AF与核心靶点MMP9、MMP13、TOP2A和ALOX5结合能最低,结合最稳定。可视化显示AF与MMP9的HIS-401、LEU-188等残基,与MMP13的ARG-44、ARG-69等残基形成稳定相互作用。选取AF-MMP9、AF-TOP2A和AF-ALOX5复合物进行100 ns分子动力学模拟。RMSD分析表明三个复合物均在模拟后期达到平衡并保持稳定(波动范围分别约1.8 ?、2.8 ?和2 ?)。RMSF值普遍较低,Rg和SASA保持稳定,氢键分析显示存在稳定的氢键相互作用,证明AF与这些靶点形成了稳定、高亲和力的结合。
3.2 GHTFs和AF抑制LPS诱导的RAW264.7巨噬细胞增殖、凋亡和迁移
GHTFs和AF在浓度低于125 μg/mL时无细胞毒性,但能浓度依赖性地抑制LPS诱导的细胞增殖。两者均能显著抑制LPS刺激引起的NO释放、细胞迁移(划痕愈合和Transwell实验)和细胞凋亡(早期和晚期)。在所有体外实验中,AF均表现出比GHTFs更强的抑制效果。转录组分析显示,与LPS组相比,AF和GHTFs处理均能差异调节大量基因。KEGG通路分析表明,LPS刺激主要激活了TNF、IL-17等信号通路,而AF处理显著影响PD-1/PD-L1检查点等通路,GHTFs则主要调控铁死亡和矿物质吸收通路。
3.3 GHTFs减轻CIA小鼠的病理状况
在CIA小鼠模型中,GHTFs治疗能显著降低足爪肿胀和关节炎临床评分,疗效优于AF和MTX组,临床评分降低超过40%。H&E染色显示,GHTFs、AF和MTX治疗均能减轻滑膜增生、炎症细胞浸润和血管翳形成。Masson染色显示,模型组胶原体积分数(CVF)显著降低,各治疗组CVF均有回升,其中AF组对关节胶原组织的恢复效果最佳。
3.4 GHTFs调节CIA小鼠的肠道菌群
16S rRNA测序分析显示,GHTFs能显著重塑CIA小鼠紊乱的肠道菌群。主坐标分析(PCoA)表明各组间β多样性存在差异。层次聚类分析显示,GHTFs治疗组小鼠的肠道菌群组成与对照组更为相似,均富含乳杆菌属(Lactobacillus)和粘液乳杆菌属(Limosilactobacillus)的有益菌,如L. johnsonii和L. intestinalis。而模型组和AF治疗组则以Ligilactobacillus属为主。模型组中富含未分类的促炎菌株如UBA3282 sp。相关性分析显示,L. johnsonii和L. intestinalis与促炎因子TNF-α和IL-1β呈负相关,而与模型组中富集的促炎菌株呈负相关。PICRUST功能预测表明,GHTFs能恢复CIA小鼠中受损的糖、脂、蛋白质代谢通路功能。
3.5 GHTFs通过免疫调节缓解CIA
免疫组化显示,GHTFs、AF和MTX治疗均能显著降低滑膜组织中MMP3和MMP9蛋白的表达,且GHTFs组的抑制效果更强。酶联免疫吸附试验(ELISA)显示,各治疗组血清中促炎因子TNF-α和IL-1β水平均显著降低,GHTFs组的降低幅度最大。蛋白质印迹(WB)分析显示,各治疗组滑膜组织中ERK2、NF-κB和NLRP3的蛋白表达均被抑制,GHTFs组对NLRP3的抑制尤为显著。
4 讨论
本研究表明,GHTFs通过直接抗炎、免疫调节和重塑肠道菌群的多重机制发挥治疗RA的作用。AF作为关键成分,通过强力抑制MMP9、MMP13等靶点,在体外表现出卓越的抗炎活性。然而,在整体动物水平,GHTFs的复方效果优于单一成分AF,这可能归因于其多靶点协同作用:同时抑制ERK/NF-κB/NLRP3炎症信号轴,降低TNF-α和IL-1β水平,并富集有益乳杆菌(如L. johnsonii, L. intestinalis),抑制促炎菌群,恢复肠道微生态平衡和代谢功能。KEGG通路分析支持GHTFs通过调控IL-17、TNF、T细胞受体等信号通路发挥作用。该研究整合ML计算预测与湿实验验证,为阐释中药复方多成分-多靶点-多通路作用机制提供了范例,亦为开发基于肠道菌群调节的RA治疗新策略提供了候选药物。
5 结论
本研究系统揭示了秋鼠麴草总黄酮(GHTFs)治疗类风湿关节炎(RA)的多重机制。其关键成分阿曼托黄酮(AF)能有效靶向MMP9、MMP13等核心蛋白,抑制炎症反应。而GHTFs复方不仅能发挥强效抗炎作用,还能通过调节IL-17、TNF-α、NF-κB等信号通路,并重塑肠道菌群(富集有益乳杆菌,恢复菌群代谢功能),在胶原诱导性关节炎(CIA)小鼠模型上展现出优于单一成分及阳性药甲氨蝶呤(MTX)的综合疗效。该研究为开发基于天然产物的RA多靶点治疗策略提供了重要的理论与实验依据。