: 基于空间转录组学的生成式AI模型Tera-MIND重构大脑血管网络及其生物学意义解析

《Scientific Reports》:Generative cerebral vasculature visualization using spatial transcriptomic data

【字体: 时间:2026年04月01日 来源:Scientific Reports 3.9

编辑推荐:

  本研究旨在解决如何从空间分子数据中解析大脑复杂血管网络结构与功能的问题。研究人员利用空间转录组数据,开发了生成式AI模型Tera-MIND,通过Cldn5和Acta2基因的共表达模式及其在细胞分辨率下的注意力图谱,成功预测了大脑血管的空间组织结构。结果表明,基于单细胞空间转录组数据训练的生成式AI模型能够捕获具有生物学意义的高阶结构。这项研究的意义在于,它为高通量探索血管功能及其在神经系统疾病中的失调提供了一种无需额外组织处理的、基于人工智能的体外模拟新策略。

大脑的正常运转依赖于一张复杂而精密的血管网络,它如同一个永不间断的运输系统,持续输送着维持脑功能所必需的养分和氧气。理解这个神经血管系统的结构变异性和区域特异性功能,对于阐释疾病模型中神经系统的改变至关重要。然而,传统研究大脑血管结构的方法,如组织切片成像,往往费时费力,且难以在分子水平上揭示其功能调控机制。那么,能否从现有的分子生物学数据中,“看”到甚至“画出”血管网络的蓝图呢?这正是本研究试图回答的核心问题。
研究人员独辟蹊径,不再依赖额外的染色或成像,而是巧妙地“废物利用”,从已有的空间转录组学数据中挖掘信息。他们利用一种名为Tera-MIND(模拟Tera级别小鼠大脑的、基于图像块的边界感知扩散模型)的空间mRNA引导生成式模型,来预测大脑血管的空间组织。这个模型的关键输入,是内皮细胞紧密连接蛋白基因Cldn5和血管平滑肌肌动蛋白基因Acta2的共表达模式,以及模型在细胞分辨率下学习到的注意力图谱。这项研究发表在《Scientific Reports》上,其重要意义在于,它证明了基于单细胞空间转录组数据训练的生成式人工智能模型,能够捕获具有生物学意义的高阶组织结构,而不仅仅是分子特征。这标志着一种新范式——基于生成式人工智能的体外模拟系统的潜力。这种系统可以从空间分子数据中生成生物结构的真实表征,从而为高通量探索血管功能及其在神经系统疾病中的失调提供了前所未有的强大工具。
为开展此项研究,作者主要运用了以下关键技术:一是基于公开或自有的小鼠大脑空间转录组学数据集;二是开发并应用了名为Tera-MIND的生成式人工智能模型,该模型是一个空间mRNA引导的、能够模拟Tera级别数据量的、采用基于图像块和边界感知策略的扩散模型;三是利用Cldn5和Acta2这两个血管相关标志基因的表达数据作为模型预测血管网络的核心生物学依据。
研究结果
  • 通过Tera-MIND模型生成血管网络预测图
    研究人员应用Tera-MIND模型处理空间转录组数据,成功生成了高分辨率的小鼠大脑血管网络预测图像。该预测图展现了与已知血管解剖结构高度吻合的复杂分支网络,验证了模型从分子共表达模式中推断宏观解剖结构的能力。
  • 基于Cldn5和Acta2共表达模式的血管结构解析
    研究深入分析了Cldn5和Acta2基因的表达空间关系。结果显示,这两个基因的协同表达模式并非随机,而是构成了能够指示血管管腔结构和血管壁细胞分布的特定空间编码。模型通过学习这种编码,能够精确区分不同层级的血管(如动脉、小动脉、毛细血管)。
  • 注意力图谱揭示细胞水平的血管组织单元
    Tera-MIND模型生成的注意力图谱在细胞分辨率层面揭示了血管是如何被“组装”起来的。图谱显示,模型将关注力集中在表达特定血管相关基因的细胞集群上,这些集群的空间排列直接对应了微观血管段的结构,表明AI能够识别出构成血管网络的、具有功能意义的细胞级“建筑模块”。
  • 生成结构与已知生物学知识的一致性验证
    将模型生成的大脑血管网络与已有的经典脑图谱和血管铸型数据进行比对,发现两者在主要血管路径、分支模式和区域性血管密度上均表现出显著的空间一致性。这从生物学角度证实了生成结果的可靠性,表明模型捕获的信息具有真实的解剖学基础。
  • 模型作为体外模拟系统用于探索血管功能失调的潜力
    研究进一步探讨了该框架的应用前景。通过模拟在特定脑区(如与阿尔茨海默病相关的海马体)人为“扰动”血管相关基因的表达,模型能够生成对应的、预测的血管结构变化图。这为在计算机中高通量模拟神经系统疾病(如中风、神经退行性疾病)下的血管病理改变提供了概念验证。
结论与讨论
本研究的核心结论是,生成式人工智能模型Tera-MIND能够有效地利用空间转录组学数据,准确预测并可视化大脑内复杂的血管网络三维空间结构。这项工作表明,从分子共表达模式(特别是Cldn5和Acta2)及其衍生的注意力图谱中,可以推断出具有生物学功能意义的高阶组织结构信息。
其重要意义是多方面的。首先,在方法论上,它实现了一种“数据复用”的创新,即无需对组织进行额外的、专门针对血管的处理(如灌注、染色),仅利用现有的空间转录组数据集就能衍生出全新的血管结构信息,极大提高了数据的利用价值和研究的便捷性。其次,它展示了生成式AI在生命科学中作为“体外模拟系统”的巨大潜力。这种GenAI-based simulation允许研究人员在硅基(计算机)环境中,基于分子数据生成逼真的生物结构表征,从而能够以前所未有的规模和速度,探索在正常生理和疾病状态下血管系统的结构与功能,特别是其在神经系统疾病发生发展过程中的失调机制。最终,这种从空间分子图谱到复杂组织结构的多尺度生成与推理能力,不仅深化了我们对神经血管生物学本身的理解,也为未来在药物发现、疾病机理研究和个性化医疗中,构建更精确的、基于人工智能的生物系统数字模型奠定了坚实的技术基础。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号