《Pharmaceuticals》:From a Multi-Omics Signature to a Therapeutic Candidate: Computational Prediction and Experimental Validation in Liver Fibrosis
Yingying Qin,
Shuoshuo Ma,
Haoyuan Hong,
Deyuan Zhong,
Yuxin Liang,
Yuhao Su,
Yahui Chen,
Xing Chen,
Yizhun Zhu and
Xiaolun Huang
编辑推荐:
肝纤维化(F3–F4)诊断缺乏病因普适性标志物,有效抗纤维化疗法有限。为应对此临床需求,本研究通过多算法共识机器学习,从一个非酒精性脂肪性肝病队列中发现了一个由CLEC4M、COL25A1、ITGBL1、NALCN、PAPPA和PEG3组成的六基因标志物,并在四个独立队列中验证了其卓越的跨病因预测性能。利用单细胞RNA测序技术解析了其细胞来源,并通过连接图平台预测并经体内外实验验证,证实天然产物醉茄素A具有良好的抗纤维化活性,为肝纤维化的诊断和靶向治疗提供了新思路。
肝脏是人体的“化工厂”,但长期的慢性损伤,如病毒性肝炎、非酒精性脂肪性肝病,会引发肝脏内部过度的疤痕修复反应,即肝纤维化。当纤维化进展到晚期,会显著增加肝硬化、肝癌乃至死亡的风险,构成了沉重的全球健康负担。然而,临床上精准诊断肝纤维化,特别是区分早期和晚期,仍面临巨大挑战。现有的生物标志物往往只针对单一病因,在混杂病因的真实世界中表现不佳。更令人揪心的是,能够直接逆转或阻止纤维化进程的有效药物寥寥无几。那么,能否找到一组不受病因限制、能精准预测晚期肝纤维化的分子“指纹”?能否利用这组指纹反向寻找到潜在的治疗药物?这正是Yingying Qin, Shuoshuo Ma, Haoyuan Hong, Deyuan Zhong, Yuxin Liang, Yuhao Su, Yahui Chen, Xing Chen, Yizhun Zhu and Xiaolun Huang团队在发表于《Pharmaceuticals》上的研究试图回答的核心问题。
为了攻克这些难题,研究人员整合了计算预测与实验验证两大模块。关键技术方法包括:1) 利用来自基因表达综合数据库的多个公共转录组数据集,以一个大型非酒精性脂肪性肝病队列为训练集,应用Boruta、LASSO、随机森林和XGBoost四种机器学习算法进行共识特征筛选。2) 在多个独立的外部验证队列中评估标志物的泛化性能。3) 使用人源和小鼠源的单细胞RNA测序数据集解析标志物基因的细胞来源。4) 运用连接图平台,基于筛选出的高共识基因表达谱进行药物重定位预测。5) 利用四氯化碳诱导的小鼠肝纤维化模型和转化生长因子-β1刺激的人肝星状细胞系LX-2,对候选化合物进行体内外药效学验证。6) 对小鼠肝脏组织进行批量RNA测序,以探究药物作用的分子机制。
2.1. 通过多算法共识机器学习识别肝纤维化进展的分子特征
研究人员在训练队列GSE213621中并行应用四种机器学习算法,筛选与晚期肝纤维化相关的基因特征。通过定义至少被两种算法选中的基因为高共识基因,最终获得50个基因的集合。该集合在训练队列中展现出阶段依赖性的表达模式,能清晰区分轻度和晚期纤维化样本。功能富集分析显示,这些基因显著富集于细胞外基质-受体相互作用、黏着斑、PI3K–Akt信号通路等经典的纤维化相关通路,以及胶原蛋白包含的细胞外基质等细胞组分,证实了其生物学相关性。
2.2. 六基因标志物在不同病因中展现出稳健的预测能力及一致的表达模式
通过多算法共识,研究最终锁定了一个由CLEC4M、COL25A1、ITGBL1、NALCN、PAPPA和PEG3组成的六基因核心标志物。在训练队列中,这六个基因的表达呈现显著的阶段依赖性差异。利用该六基因特征训练的十种预测模型在内部交叉验证中表现出色,在四个独立的、涵盖不同病因的外部验证队列中,其预测性能依然稳健,平均曲线下面积达到0.864。更重要的是,这六个基因在外部队列中表达的上调和下调趋势与训练队列完全一致,证明了其跨病因、跨平台的可靠性。在一个涵盖从健康对照到慢加急性肝衰竭的广泛疾病谱的独立队列中,这六个基因的表达呈现出与疾病严重程度协调一致的渐进式变化,表明其不仅能区分晚期纤维化,还能追踪进行性肝脏疾病的生物学进程。
2.3. 单细胞转录组学解析细胞异质性并定位六基因标志物的细胞来源
为了在单细胞分辨率下解析纤维化肝脏微环境的异质性并定位六基因标志物,研究人员分析了人源单细胞RNA测序数据集GSE136103。细胞组成分析揭示了纤维化过程中显著的微环境重塑。对六个标志物基因的表达景观分析显示,它们具有独特的细胞来源:ITGBL1、NALCN和PAPPA主要富集于成纤维细胞,这与成纤维细胞系作为细胞外基质重塑主要效应细胞的角色一致;而CLEC4M在健康状态的内皮细胞中高表达,在纤维化样本中显著下调,伴随着内皮细胞区室的扩张,提示了纤维化过程中的内皮状态转变。细胞类型解析的定量分析进一步揭示了这些基因在纤维化过程中细胞来源分布的动态变化。此外,在小鼠肝星状细胞的时序模型中,五个同源基因的表达呈现出与刺激时间相关的协调性调控,支持了这些基因在主要致纤维化效应细胞中的活性调控及其在纤维化进展中的保守性。
2.4. 通过连接图进行药物重定位预测,确定肝纤维化的潜在治疗化合物
为了寻找能够逆转六基因标志物所代表纤维化转录程序的潜在疗法,研究人员利用连接图平台进行了反向特征匹配。他们筛选出了与纤维化特征呈显著负相关性的小分子化合物,并按标准化连通性评分进行排序。在考虑了药物可获得性、已知安全性信息以及与纤维化相关的抗炎/抗氧化活性证据后,研究选择了天然产物醉茄素A进行后续实验验证。进一步的分子对接模拟预测醉茄素A与六基因编码的蛋白可能存在结合,其中与NALCN的预测结合亲和力最佳,为后续靶点验证提供了假设。
2.5. 醉茄素A显著改善四氯化碳诱导的小鼠肝纤维化,并与纤维化程序的广泛转录组逆转相关
在四氯化碳诱导的小鼠肝纤维化模型中,醉茄素A治疗显著改善了组织学损伤,减少了胶原沉积和纤维化分期评分,并降低了血清ALT和AST水平,在结构和功能层面均证实了其抗纤维化效应。对肝脏组织的批量RNA测序分析发现,醉茄素A处理逆转了1314个纤维化相关的差异表达基因。这些“逆转基因”在基因本体生物过程分析中富集于细胞外基质组织和胶原形成,在京都基因与基因组百科全书通路分析中富集于细胞外基质-受体相互作用、过氧化物酶体增殖物激活受体信号通路等,表明醉茄素A可能通过多轴重塑来减轻肝纤维化,涉及细胞外基质动力学、代谢重编程和炎症-免疫反应。
2.6. 醉茄素A在体外抑制转化生长因子-β1诱导的人肝星状细胞系活化并减少细胞外基质产生
在转化生长因子-β1刺激的人肝星状细胞系LX-2体外激活模型中,醉茄素A共处理显著减弱了转化生长因子-β1诱导的α-平滑肌肌动蛋白和纤维连接蛋白表达的增加。这表明醉茄素A能直接对抗肝星状细胞的激活和细胞外基质的产生,为体内观察到的抗纤维化效应提供了机制支持。
总结与讨论部分指出,肝纤维化是慢性肝损伤后失调的愈合反应,但目前缺乏有效的病因普适性抗纤维化疗法。面对肝纤维化这一高度异质性的过程,传统依赖单一算法或队列的研究策略往往泛化性有限。本研究通过整合多病因数据和多算法共识,成功鉴定出一个稳健的、跨病因的六基因标志物,为晚期肝纤维化的诊断提供了新的潜在工具。单细胞转录组学分析不仅揭示了纤维化肝脏的微环境重塑,还将标志物基因锚定到特定的细胞群体,为理解其生物学意义提供了细胞上下文。更具转化意义的是,研究将高共识基因特征视为疾病的“分子表型”,利用连接图平台进行反向药物匹配,将生物标志物发现延伸至治疗假说生成。最终,通过体内外实验系统验证了候选化合物醉茄素A的抗纤维化功效,并初步探索了其作用的分子足迹,涉及脂质代谢程序、细胞外基质重塑和肝星状细胞激活的减弱。
这项工作的重要意义在于,它构建了一个从计算预测到实验验证的完整转化研究范式。研究不仅报告了一个具有潜在临床应用前景的诊断标志物,还通过药物重定位策略成功“牵引”出一个有潜力的治疗候选物,并提供了初步的疗效和机制证据。这为未来开发精准的抗纤维化策略奠定了基础,展示了整合多组学数据、先进生物信息学与经典实验药理学在攻克复杂疾病中的强大合力。