《Nature Communications》:Predicting trajectories of illness using RNA velocity of whole blood
编辑推荐:
转录组学分析揭示了细胞、组织或生物体在健康和疾病状态下的状态。RNA速率(RNA velocity)为单细胞分析增加了时间维度,基于每个细胞当前的剪接(spliced)和未剪接(unspliced)mRNA预测未来的转录组和表型状态。研究人员假设,利用全血转录
转录组学分析揭示了细胞、组织或生物体在健康和疾病状态下的状态。RNA速率(RNA velocity)为单细胞分析增加了时间维度,基于每个细胞当前的剪接(spliced)和未剪接(unspliced)mRNA预测未来的转录组和表型状态。研究人员假设,利用全血转录组,RNA速率可被调整用于预测急性和慢性疾病个体的未来临床状态。为此,研究人员开发了VeloCD(Quantitative prediction of transitions in clinical state from a single time-point RNA sample),这是一种从单时间点RNA样本定量预测临床状态转变的方法。该方法在流感A和SARS-CoV-2(SARS-CoV-2)受控人类感染研究(Controlled Human Infection Studies, CHIMs)中预测了转录组轨迹和未来感染状态,这些预测与自然获得性感染的轨迹一致。在HIV-TB共感染者中,VeloCD预测了免疫重建炎性综合征(Immune Reconstitution Inflammatory Syndrome, TB-IRIS)的发作。在接受炎症性肠病(Inflammatory Bowel Disease, IBD)生物制剂治疗的患者中,首次给药后的全血RNA速率指示了治疗疗程结束时是否能实现缓解。在一项针对急性发热儿童的多国观察性研究中,VeloCD预测了那些需要最多医疗护理的个体。这些结果证明了利用RNA速率预测人类疾病轨迹的概念验证(proof-of-concept)。
该论文题为“Predicting trajectories of illness using RNA velocity of whole blood”,发表于《Nature Communications》。研究旨在解决临床诊断中预后预测的空白,即如何利用宿主基因表达预测急性疾病的进展轨迹。现有研究多集中于利用成熟(剪接)mRNA进行诊断,而对包含未剪接转录本的动态信息挖掘不足。研究人员受到单细胞RNA速率(RNA velocity)能够推断细胞未来状态的启发,提出了将其应用于全血 bulk RNA测序数据以预测个体未来临床状态的假设,并据此开发了分析工具VeloCD(RNA velocity-based transition predictions of future disease states of subjects in clinical datasets)。
为验证这一假设,研究人员整合了多项独立研究的数据队列,涵盖了从受控感染模型到自然发病的临床队列。关键技术方法包括:利用受控人类感染模型(CHIMs)获取标准化的时间序列数据;开发DISCO(Discordance-concordance)基因筛选框架结合LASSO回归识别预测性基因集;应用VeloCD算法计算RNA速率及转换概率(Transition Probabilities, TPs);结合主成分分析(PCA)、均匀流形逼近与投影(UMAP)等低维嵌入技术可视化疾病轨迹;并通过受试者工作特征曲线下面积(AUROC)评估预测效能。
RNA velocity of blood in controlled human infections
研究人员利用流感A病毒和SARS-CoV-2的CHIM数据验证了VeloCD的核心假设。通过对感染后不同时间点血液样本的分析,发现剪接转录组能够代表当前的感染状态(PCR阳性或阴性)。进一步分析显示,关键基因(如 IFI44L和 LY6E)的未剪接转录本动态变化先于或与剪接本变化同步,且基于day 2数据预测的day 3剪接转录表达与实际测量值高度相关(Pearson相关系数均值分别为0.96和0.94)。这表明全血bulk RNA速率能够准确捕捉并预测未来的转录组状态及相应的疾病表型。
Outcome prediction in controlled human infection
研究人员展示了VeloCD在临床上的定量预测潜力。在流感研究中,通过LASSO回归筛选出由 BAK1、APOL3和 SLC9A3-AS1组成的3基因特征,利用day 1样本预测未来感染状态的AUROC达到0.89。在SARS-CoV-2研究中,确定的232基因特征在day 1样本的AUROC为0.72。值得注意的是,流感预测基因在独立的SARS-CoV-2数据集中也表现出中等预测效能(AUROC 0.76),证实了跨病毒平台的泛化潜力。
Generalizability of RNA velocity to natural SARS-CoV-2 infection
为了验证CHIM结论在自然感染中的适用性,研究人员分析了INSTINCT(Integrated Network for Surveillance, Trials and Investigations into COVID-19 Transmission)研究的纵向数据。尽管无法测试预测性能(因入组时已PCR阳性),但RNA速率轨迹图显示,感染者的初始样本与未感染者分离,且其速度矢量指向未感染者的转录组空间,随后逐渐回归,这与自然感染过程中病毒清除和康复的轨迹一致。
RNA velocity predicts onset of TB-IRIS in a clinical trial
在HIV-TB共感染患者的临床试验数据分析中,研究人员利用单时间点的治疗前样本预测了免疫重建炎性综合征(TB-IRIS)。通过筛选出的1980基因特征,VeloCD成功预测了在ART(抗逆转录病毒治疗)开始后两周仍未发病但在后续发展为TB-IRIS的患者,其中87.5%(7/8)的患者被正确归类。UMAP轨迹图显示,尚未发病的患者位于非TB-IRIS和已发病患者的中间状态,其RNA速率矢量主要指向TB-IRIS集群。
RNA velocity predicts response after treatment for IBD
在针对炎症性肠病(IBD)患者的研究中,研究人员利用抗TNF治疗(英夫利昔单抗)后2周的血液样本预测14周时的缓解状态。通过分析筛选出18个基因,VeloCD在week 2的样本中实现了AUROC为0.83的预测效能。这证明RNA速率不仅能预测感染性疾病进程,还能在早期评估慢性病药物治疗的有效性。
RNA velocity predicts severity of acute febrile illness
在PERFORM(Personalized Risk assessment in Febrile illness to Optimize Real-life Management across the European Union)多国观察性研究中,研究人员纳入了399名疑似感染的发热儿童。通过结合细菌性和病毒性轻度与重度患者的差异表达基因,筛选出59个基因的签名。VeloCD预测结果显示,轻度组患者向重症监护室(PICU)转化的概率(TPs)极低(中位数0.0035),而急诊转入PICU的重度组患者TPs极高(中位数1.0)。相比之下,住院病房(中度)患者的TPs分布较广,其中后来转入PICU的患者其TPs显著高于未转入者,且该预测效能与CRP(C反应蛋白)相当或更具特异性,优于仅基于静态基因表达或NICE(英国国家健康与护理卓越研究所)临床标准的分类。
讨论与结论
研究人员讨论了利用RNA速率预测疾病轨迹的临床转化意义。VeloCD的核心逻辑在于全血转录组反映了采样时的疾病状态,而RNA速率揭示了未来的转录组变化,进而映射为未来的临床状态。该方法在多种疾病模型和临床应用场景(如暴露后隔离决策、预防性治疗指征、药物疗效早期评估及急诊分流)中展现了概念验证。尽管存在参考数据集规模和组成可能影响预测稳定性等局限性,且目前基于bulk RNA-Seq,但未来可转化为基于qPCR(定量PCR)的检测平台。总之,该研究确立了利用全血RNA速率预测未来疾病状态的可行性,为开发新型预后检测工具和精准医疗决策提供了理论基础和技术路径。