
-
生物通官微
陪你抓住生命科技
跳动的脉搏
迈向肿瘤代谢的单细胞建模
《Biocatalysis and Biotransformation》:Towards single-cell modelling of tumour metabolism
【字体: 大 中 小 】 时间:2026年03月24日 来源:Biocatalysis and Biotransformation 1.9
编辑推荐:
单细胞数据揭示了肿瘤代谢异质性,但存在噪声高和计算成本大等问题。现有建模方法包括统计机器学习、约束建模和混合方法,但存在机制解释不足、忽略微环境交互和计算效率低等局限。未来需优化算法并行计算能力,整合时空代谢模型和多组学数据,提升肿瘤异质性研究深度。
单细胞数据能够捕捉肿瘤的异质性,极大地推动了我们对癌细胞代谢机制的理解。与批量测量方法不同,单细胞技术能够揭示代谢多样性及罕见的细胞状态,但同时也存在较高的数据丢失率(即信号丢失的问题)。在本研究中,我们总结了目前已发表的建模方法,这些方法旨在从单细胞数据中揭示代谢通量的机制本质并对其进行预测。我们讨论了每种方法的局限性、模型假设以及可扩展性,并提出了降低计算成本的改进措施,以促进这些方法在癌症研究中的广泛应用。
肿瘤是一个异质性系统,由多种克隆细胞组成,每种克隆细胞携带不同的突变、不同的复制率、独特的代谢特征以及不同的脆弱性(Kinker等人,2020年;Gavish等人,2023年)。这些克隆细胞对癌症治疗的反应各不相同,常常导致耐药性细胞的产生(Morad等人,2021年)。此外,癌细胞嵌入在肿瘤微环境(TME)中,而TME由免疫细胞、基质细胞和细胞外基质构成(Anderson和Simon,2020年;Fang等人,2023年)。在这种动态环境中,细胞之间竞争营养物质和氧气,并通过代谢物进行交换,从而导致TME在局部和时间上的变化(Demicco等人,2024年)。营养匮乏、酸化及缺氧会改变所有细胞类型的代谢途径:癌细胞转向糖酵解途径,而免疫细胞的功能则受到抑制(Du等人,2024年;Liang等人,2024年)。
批量测量方法是对肿瘤中所有细胞的信号进行平均处理,只能显示出明显的代谢变化,例如氧化磷酸化(OXPHOS)与糖酵解之间的转换、谷氨酰胺的依赖性,或是关键驱动基因和代谢转运蛋白的表达情况,从而掩盖了理解疾病进展或药物耐药性所需的关键细微差异(Fan等人,2020年)。
单细胞技术,尤其是单细胞转录组数据(scRNA-seq),能够以高通量的方式获取每个细胞的表达谱(Zhang等人,2021年)。该技术能够发现批量测量方法遗漏的罕见细胞状态,但缺乏空间和时间信息,且只能间接描述细胞间的相互作用(Chen J等人,2024年;Chen Y等人,2024年)。
然而,scRNA-seq数据具有稀疏性、噪声较大且数据丢失率较高,这些技术问题会导致大量细胞信号丢失。基因表达仅能反映代谢活性,无法捕捉酶动力学、翻译后修饰、代谢物的可用性或蛋白质复合物的形成(Seth Nanda等人,2020年)。
为了解决单细胞数据的局限性,人们采用了多种建模方法(Hrovatin等人,2022年;Ng等人,2022年;Chen等人,2024年;Mardinoglu和Palsson,2025年)。统计和机器学习模型能够在噪声存在的情况下识别表达模式,但无法提供机制层面的解释。基于约束的模型具有定量优势,且比基于动力学或常微分方程(ODE)的模型更具可扩展性(Machado等人,2012年;Bordbar等人,2014年)。当肿瘤微环境(TME)的代谢组成信息可用时,可以利用这些信息来约束每个细胞模型的输入参数,从而预测反应通量或相对代谢活性(Vande Voorde等人,2019年;Volkova等人,2020年)。一些混合方法结合了深度学习、机器学习的可扩展性与基于约束的建模或通量平衡分析( Flux Balance Analysis)提供的机制信息,例如scFEA/FLUXestimator(Alghamdi等人,2021年)和COMPASS(Wagner等人,2021年)。scFEA利用模块因子图和神经网络预测每个细胞的相对代谢通量谱,并通过损失函数确保质量守恒;COMPASS则在化学计量和质量守恒的约束下确定反应的最大通量,然后将单细胞RNA-seq数据映射到网络中的各个反应上,生成与表达水平成反比的惩罚矩阵,从而找到最小化总惩罚的通量分布。这些方法无法重建特定环境的代谢模型,也无法模拟细胞与TME之间的代谢交换。在此背景下,基因组规模模型仅作为映射单细胞数据和推断通量分布的框架使用。
早期尝试重建单细胞模型的方法(如scFBA和popFBA)由于计算需求较高(通常仅适用于几百个细胞),因此受到限制。这些模型仅能涵盖大约300个反应的核心代谢过程。目前,从包含数十万甚至数百万细胞的单细胞数据集中重建整个代谢系统的单细胞模型在实践上几乎不可行。
为降低计算需求,scFASTCORMICS(Pacheco等人,2022年)和METAFlux(Huang等人,2023年)采用了多簇或多群体代谢模型,并通过TME隔室实现簇间代谢物的交换。ftINIT(Gustafsson等人,2023年)等方法则先将单细胞数据整合为伪批量样本或多个簇样本,再重建特定环境的模型,但这会降低分辨率。这些方法未构建TME隔室,从而影响了代谢交换的研究。
为应对高噪声问题,scFASTCORMICS引入了一种针对单细胞数据定制的离散化步骤,该步骤同时考虑了每个细胞中基因的表达水平及表达该基因的细胞比例。通过帕累托优化(Pareto optimization)可以确定最优参数设置,从而生成紧凑且具体的模型,最大化常见表达基因的数量并最小化不活跃基因的数量(这些信息来自批量RNA-seq数据)。METAFlux和ftINIT并未针对批量RNA-seq数据调整离散化方法,而是采用自助法(bootstrapping approach)来减少数据丢失的影响。scFASTCORMICS是一种确定性方法,可在整个数据集或部分数据集上运行;而METAFlux和ftINIT则通过构建多个细胞子集来获得基于统计的结果。对于大型数据集,计算时间较长,可能需要数天。
随着数据量的不断增加,我们需要高效、可扩展且具有高分辨率能力的算法(Miao等人,2021年)。几十年前开发的这些算法代码需要优化、并行化,并部署在云计算平台上,以缩短计算时间。随着技术的进步,簇模型的分辨率将提高,从而能够捕捉到更小的细胞群体(如干细胞),尽管无法达到单细胞级别的分辨率。然而,由于单细胞数据存在的持续技术挑战(尤其是数据丢失和噪声问题),试图从单个细胞中提取有意义的信息可能并不现实(Baysoy等人,2023年;Gondal等人,2024年)。肿瘤内的代谢变化(如耐药性或药物敏感性)更可能依赖于细胞群体而非单个细胞的代谢特性(Sibai等人,2025年)。虽然单细胞或多群体代谢模型可以预测代谢交换,但基于空间和时间信息的代谢建模技术的发展将真正实现细胞群体间相互作用的模拟。最终,将空间和时间代谢建模与多组学数据相结合,将有助于更全面地理解肿瘤的异质性,并为有效治疗策略的制定提供指导。