肠道菌群诊断标记物的多队列验证及假小链双歧杆菌功能机制探索

《Advanced Science》:Multicohort Validation of Gut Microbiome Signatures for Cholangiocarcinoma Diagnosis and Functional Characterization of Bifidobacterium Pseudocatenulatum

【字体: 时间:2026年03月14日 来源:Advanced Science 14.1

编辑推荐:

  本文是一项关于胆管癌(CCA)肠道微生物组诊断价值的突破性研究。研究者通过对中国多地区785例粪便样本的宏基因组测序,首次构建了基于22个物种标志物的高精度诊断模型(AUC > 0.99),并在跨区域队列中成功验证(AUC ~0.80)。该模型能有效区分CCA与肝细胞癌(HCC)、肝纤维等疾病,并通过分析6847例公开数据评估了其疾病特异性。机制研究揭示,在CCA中耗竭的假小链双歧杆菌(Bifidobacterium pseudocatenulatum)能通过抑制PI3K-AKT-mTOR通路显著抑制CCA进展,为其作为潜在保护性微生物提供了功能证据。这项工作为开发非侵入性的CCA辅助诊断工具和探索菌群靶向治疗新策略奠定了坚实基础。

  
引言:胆管癌的诊断困境与肠道菌群的新机遇
胆管癌(Cholangiocarcinoma, CCA)是第二大常见的原发性肝癌,约占肝癌的20%。其发病率和死亡率近年来持续上升。CCA的诊断极具挑战性,这主要源于其解剖位置隐蔽、生长模式多样且缺乏明确的早期诊断标准。肝活检虽是诊断金标准,但其有创性限制了应用。尽管不断有新的生物标志物被发现,但目前仍缺乏经过多中心验证的高质量非侵入性诊断工具。此外,由于缺乏有效的早期诊断方法和特异性临床症状,大多数CCA患者确诊时已处于晚期,手术切除(唯一可能的根治性治疗)仅适用于20%–30%的患者,且术后复发率高,预后极差。因此,寻找新的潜在治疗靶点和建立非侵入性诊断工具,对于改善CCA患者预后具有重要意义。
近年来,肠道微生物组在肝胆疾病发生发展中的作用日益受到关注。“胆道-肠道循环”和“肝-肠轴”将肝胆功能与肠道紧密相连。肝脏通过胆道将胆汁盐和抗菌分子输送至肠道,以控制细菌过度生长并维持肠道菌群平衡;而肠道产物(如宿主或微生物代谢物、微生物相关分子模式)则可经门静脉易位至肝脏,影响肝功能。研究表明,肠道菌群失调是CCA多种独立危险因素(如原发性硬化性胆管炎、肝吸虫感染、胆结石等)的共同特征。因此,揭示肠道微生物组在CCA发生发展中的作用,对于CCA的精准防治具有重要临床意义。此前已有小样本研究利用16S rRNA测序探索CCA患者的肠道菌群改变,但这些研究受限于样本量小、单中心设计、分类学分辨率低(属水平)以及缺乏独立的跨区域验证。基于大规模、多区域宏基因组数据构建稳健的诊断模型,并进行严格的内部和外部验证,同时系统评估其疾病特异性,并对其关键微生物物种进行功能验证,是将微生物组研究推向临床转化的必要步骤,而这正是当前CCA研究领域亟待填补的空白。
研究队列与临床特征
本研究样本来源于中国三个不同地理区域:杭州(发现队列)、郑州(独立验证队列)和新疆(独立验证队列)。研究者将杭州的样本按7:3的比例随机分为训练集(97例CCA和105例对照)和测试集(42例CCA和45例对照)。训练集用于初步了解CCA患者的肠道微生物谱全貌,识别差异微生物类群、MetaCyc代谢通路与临床表型之间的关联,并筛选关键物种和通路生物标志物以分别建立CCA诊断模型。随后,在测试集和两个独立的跨区域验证队列中分别评估模型的诊断效能。此外,研究还进一步评估了模型区分肝细胞癌(HCC)与CCA、以及良性肝胆疾病与CCA的潜力。最后,利用公开数据集中涵盖31项研究、11种疾病状态、共6847个样本的宏基因组数据,进一步验证了模型的疾病特异性。
对各队列临床特征的分析显示,在每个队列中,CCA组和对照组在性别和年龄上均匹配。在训练集中,两组在身高、体重、体重指数(BMI)、总胆红素(TB)、直接胆红素(DB)和球蛋白(GLO)上无显著差异。但与对照组相比,CCA组的肝功能更差,表现为白蛋白(ALB)、间接胆红素(IB)、总蛋白(TP)和血小板(PLT)更低,而丙氨酸氨基转移酶(ALT)、天冬氨酸氨基转移酶(AST)、Child-Turcotte-Pugh(CTP)评分和谷氨酰转肽酶(GGT)更高。此外,碳水化合物抗原19-9(CA19-9)在CCA组中显著富集。对参与者合并症的进一步分析显示,高血压(23.7%)、慢性乙型肝炎(CHB, 18.6%)和2型糖尿病(T2DM, 11.3%)是CCA患者最常见的合并症。其他队列也得到了相似的统计结果。
结果1:CCA中存在可检测的肠道微生物失调
为了研究CCA患者的肠道微生物组,研究者对鸟枪法宏基因组测序数据进行了分析。α多样性分析(使用香农指数、辛普森指数和逆辛普森指数)表明,在物种水平上,CCA组的香农指数低于对照组,这一结果与之前小样本量的研究相反。β多样性分析(基于布雷-柯蒂斯距离)显示,CCA组的β多样性显著高于对照组。主坐标分析(PCoA)和调整后的主坐标分析(aPCoA)均显示CCA组和对照组的样本明显分离,表明两组间的整体肠道微生物组成存在差异。
在微生物组成方面,在属水平上,拟杆菌属(Bacteroides)、普雷沃菌属(Prevotella)、罗斯氏菌属(Roseburia)、真杆菌属(Eubacterium)、粪杆菌属(Faecalibacterium)、另枝菌属(Alistipes)和埃希氏菌属(Escherichia)在两组中均占所有属的50%以上。物种水平也有类似结果,表明CCA疾病状态对肠道微生物群落中的优势物种影响不大。
通过多种统计方法在物种水平上鉴定出95个差异物种。其中,46个物种在CCA组中富集,包括普通拟杆菌(Parabacteroides distasonis)、粪拟杆菌(Bacteroides stercoris)、粪便普雷沃菌(Prevotella stercorea)、多形拟杆菌(Bacteroides thetaiotaomicron)、阿克曼氏菌(Akkermansia muciniphila)等。相反,49个物种在对照组中富集,包括青春双歧杆菌(Bifidobacterium adolescentis)、假小链双歧杆菌(Bifidobacterium pseudocatenulatum)、长双歧杆菌(Bifidobacterium longum)等。在属水平上,研究者发现放线菌属(Actinomyces)和乳杆菌属(Lactobacillus)在CCA组中减少,这与之前的小样本研究结果相反。
共丰度网络分析揭示了CCA组和对照组之间不同的微生物特征。对照组中富集的物种主要包括产短链脂肪酸(SCFAs)的类群,如普拉梭菌(Faecalibacterium prausnitzii)、粪罗斯氏菌(Roseburia faecis)和霍氏真杆菌(Eubacterium hallii),它们在其生态簇内表现出密集的正相关。相反,CCA组中富集的物种则包括潜在的致病菌,如博尔特梭菌(Clostridium bolteae)、殊异韦荣球菌(Veillonella dispar)和产气克雷伯菌(Klebsiella aerogenes),它们也显示出强烈的组内正相关性。值得注意的是,在两个簇之间观察到了反相关关系,特别是在青春双歧杆菌(对照组富集)和共生梭菌(Clostridium symbiosum, CCA组富集)之间。
结果2:CCA中存在可检测的肠道微生物MetaCyc通路改变且与临床表型相关
基于MetaCyc数据库,研究者进一步分析了CCA患者肠道微生物MetaCyc通路的功能特征。与对照组相比,CCA组的通路α多样性和β多样性均显著降低。PCoA结果显示,两组通路在PCoA1轴(解释85.02%的变异)上显著分离。差异通路分析表明,尿素循环和糖酵解(从6-磷酸果糖开始)在CCA组中显著上调,而磷酸戊糖途径则显著下调。此外,L-天冬氨酸、L-天冬酰胺和L-瓜氨酸等氨基酸的生物合成途径上调,而芳香族氨基酸、L-精氨酸和L-谷氨酰胺的生物合成则在CCA组中减少。同时,腺苷核苷酸、鸟苷核苷酸、脱氧腺苷核苷酸和脱氧鸟苷核苷酸等核苷酸的生物合成显著增加。而棕榈酸盐的生物合成在CCA组中显著下调。这些结果表明CCA患者具有独特的微生物代谢过程。
为了探索CCA患者肠道微生物组与临床表型之间的相关性,研究者对训练集的临床表型特征进行了调查。典范对应分析(CCA)显示,样本主要沿着CCA状态向量分离,前两个轴分别解释了总方差的32.8%和13.5%。冗余分析(RDA)进一步证实了这一发现,CCA状态在RDA1轴上解释了90.1%的约束方差。这些结果证实,CCA的存在是塑造肠道微生物组组成的主导因素,而非人口统计学变量或合并症。除了CCA状态外,对物种影响最大的四个表型是病变位置、ALB、CTP评分和TP。值得注意的是,年龄、性别、BMI以及常见合并症(高血压、糖尿病、冠心病、脑血管疾病)的影响微乎其微,这支持了微生物组特征的疾病特异性。在功能通路水平(MetaCyc通路)的分析也得出了高度一致的结果。物种、属和MetaCyc通路与临床表型之间的斯皮尔曼等级相关分析进一步揭示了特定关联。重要的是,肿瘤大小与几种先前与致癌作用相关的物种呈显著正相关。普拉托氏黄杆菌(Flavonifractor plautii)和博尔特梭菌是与较大肿瘤关联最强的物种。相反,肿瘤大小与有益共生菌(包括普拉梭菌和阿克曼氏菌)呈负相关。这些发现表明,特定的肠道微生物组特征可能与CCA肿瘤进展有关,可能是通过产生促肿瘤代谢物和损失抑肿瘤代谢物实现的。
结果3:基于肠道微生物组的CCA无创诊断
为了阐明肠道微生物组对CCA的无创诊断价值,研究者构建了能够特异性识别CCA的随机森林分类器。通过比较17种机器学习算法,发现随机森林(RF)算法在测试集上取得了最高的平均AUC,因此被选为后续模型开发的基础算法。
研究者首先构建了“无约束模型”(model-1),即使用包括CCA富集和对照富集在内的所有差异物种。筛选出的22个最优物种用于建立“RF-物种-模型-1”。该模型在发现队列的训练集和测试集中分别获得了98.31%和99.52%的AUC值,显示出对CCA的高诊断效能。为了验证模型的跨区域适用性,研究者使用了来自郑州和新疆的两个独立跨区域验证集。重要的是,郑州验证集的AUC值为80.22%,新疆验证集的AUC值为80.34%。
考虑到本研究中对照组的样本量大于病例组,可能存在队列不平衡问题,研究者还分别使用加权随机森林(WRF)算法和平衡随机森林(BRF)算法构建了模型。结果显示,“WRF-物种-模型-1”的预测性能优于“RF-物种-模型-1”和“BRF-物种-模型-1”。该模型在训练集和三个测试集中的AUC分别为98.63%、99.42%、80.89%和80.43%。模型包含的22个物种中,霍氏真杆菌可能是该诊断模型中最重要的标志物。
研究者随后探索了代谢通路作为CCA诊断标志物的潜力。筛选出的18个通路标志物用于构建“RF-通路-模型-1”。在发现队列中,该模型仍获得了较高的诊断效能(训练集96.3%,测试集96.67%),但在两个独立跨区域验证集中仅获得69.12%和68.52%的AUC,表现逊于物种模型。
考虑到某些在疾病组中减少的物种(如一些益生菌)可能与肠道炎症相关而非疾病特异,研究者还构建了“富集约束模型”(model-2),即仅使用在CCA组中富集(正相关)的微生物特征。特征筛选得到了8个物种的最优子集用于建立“RF-物种-模型-2”。总体而言,“WRF-物种-模型-1”是最佳的无约束模型,而“RF-物种-模型-2”是最佳的富集约束模型。基于WRF算法和物种标志物的无约束模型不仅在华东地区有效,在中部和西北地区仍然适用。
研究者进一步分析了模型在不同CCA亚型(肝内CCA、肝门周围CCA、远端CCA)中的性能,结果显示“WRF-物种-模型-1”在三种亚型中均表现稳健且一致。此外,基于CA19-9水平将CCA患者分为阳性和阴性组后,发现“WRF-物种-模型-1”在CA19-9阳性组中实现了81.5%的区分效能,更重要的是,76.8%的CA19-9阴性CCA患者也能被该微生物模型识别。本研究中CA19-9阳性率为69.2%,而“WRF-物种-模型-1”取得了比CA19-9更高的识别效能,表明该模型可以识别出一些单独CA19-9检测会漏诊的CCA病例。
结果4:探索诊断模型区分CCA与HCC的潜力
在临床实践中,胆管癌和肝细胞癌的鉴别诊断是诊疗中的一个难题。研究者尝试使用上述肠道微生物诊断模型来区分CCA和HCC。基于“WRF-物种-模型-1”,获得了97.86%的诊断效能(特异性:88.71%,敏感性:95.24%),且CCA组的疾病概率指数显著高于HCC组。而“RF-物种-模型-2”仅获得82.33%的诊断效能,其各项性能指标均低于模型-1。结果表明,基于WRF算法和物种标志物的无约束模型不仅能高效地从对照中诊断CCA,还能特异地区分CCA和HCC。
结果5:探索诊断模型区分CCA与良性肝胆疾病的潜力
为了评估模型在区分CCA与良性肝胆疾病方面的临床适用性,研究者构建了四个验证队列,包括来自郑州大学第一附属医院的肝纤维化患者,以及来自公共数据库的三个地理分布不同的非酒精性脂肪性肝病队列。“WRF-物种-模型-1”在所有良性疾病队列中均表现出稳健的性能。在区分CCA与肝纤维化时,模型AUC达到98.73%。在三个NAFLD队列中,模型也始终保持高性能。值得注意的是,瑞典的NAFLD队列表现出最高的特异性(100%),同时保持了95.24%的敏感性。比较分析显示,“WRF-物种-模型-1”在所有良性肝病验证队列中的表现均优于“RF-物种-模型-2”,具有更高的平均AUC和更低的假阳性率。结果表明,基于WRF算法和物种标志物的无约束模型不仅能有效区分CCA与对照组,还能特异地区分CCA与常见良性肝胆疾病,这支持了其在复杂诊断场景中潜在的临床应用价值。
结果6:利用公开数据集对诊断模型进行其他疾病的外部验证
为了进一步评估基于物种标志物的诊断模型的疾病特异性,研究者从已发表的病例对照或队列研究中筛选了公开的粪便宏基因组数据集,最终获得了涵盖31项研究、11种疾病状态、共6847个样本的数据。使用“WRF-物种-模型-1”对公开数据集进行验证的结果显示,本研究中对照组的假阳性率为0.15。总体而言,外部验证队列中健康对照的平均假阳性率为19.89%。除乳腺癌、克罗恩病、动脉粥样硬化性冠心病、肝脏疾病和胰腺癌外,其他疾病的平均假阳性率均低于0.3。研究者观察到某些患者队列的假阳性率较高。来自印度的健康对照队列假阳性率高于0.5,这可能与当地经济状况、健康状况、饮食等因素有关。此外,有两个克罗恩病队列和一个来自中国的肝脏疾病队列也显示出较高的假阳性率。
随后,研究者评估了“RF-物种-模型-2”的性能。与之前的研究一致,富集约束模型可以降低外部验证队列中对照样本的假阳性率。与“WRF-物种-模型-1”相比,“RF-物种-模型-2”在大多数队列中的假阳性率更高。总而言之,基于两个模型在CCA跨区域验证队列、HCC外部验证队列、良性肝胆疾病队列和公共数据库外部验证队列中的表现,研究者认为基于WRF算法和物种标志物的无约束模型是CCA的最佳诊断模型。
尽管“WRF-物种-模型-1”在公开数据集的外部验证中表现出中等性能,但当前诊断模型在疾病特异性方面存在局限,假阳性率升高,这主要归因于某些疾病之间存在重叠的生物标志物。研究者尝试分析了这一现象的原因。疾病间的共享标志物可能是一个重要原因。在假阳性率大于0.3的队列中,有8个队列显示出与CCA明显的共享标志物特征(共享标志物数量>3),这可以在很大程度上解释这些队列的高假阳性率。令人惊讶的是,有三个队列与CCA共享的标志物少于三个,解释这一现象是下一步研究的方向。最近的文献报道,人类肠道菌群主要由两个核心菌群组成,即以发酵纤维和产生丁酸盐为特征的健康基本功能群,以及以毒力/致病性和抗生素耐药性为特征的有害功能群。在糖尿病、心血管疾病、强直性脊柱炎、结直肠癌、炎症性肠病、肝硬化和精神分裂症患者中,有害肠道菌群的特征高度相似。这些发现也有助于解释本研究中模型在外部疾病验证队列中的高假阳性率。总体而言,在证明其在公开数据集外部验证中具有中等性能的同时,当前的诊断模型在疾病特异性方面表现出局限性,假阳性率升高,这主要归因于某些疾病间存在重叠的生物标志物。
结果7:假小链双歧杆菌通过抑制PI3K-AKT-mTOR通路抑制CCA进展
为了探究已鉴定的微生物改变是否具有超越关联关系的功能后果,研究者调查了CCA中耗竭物种的潜在抗肿瘤作用。在对照组富集的物种中,多种双歧杆菌属物种排名靠前,包括假小链双歧杆菌、青春双歧杆菌和长双歧杆菌,提示该属细菌对CCA发展具有保护作用。值得注意的是,这三种细菌的丰度在多个区域队列中存在显著差异。为了评估它们的抗肿瘤功能,研究者用这三种双歧杆菌的条件培养基处理人CCA细胞系RBE。青春双歧杆菌和长双歧杆菌的条件培养基显示出最小的抑制效果,然而,假小链双歧杆菌条件培养基以剂量依赖的方式抑制了RBE细胞的活力,这一抑制作用在另一个人CCA细胞系HCCC-9810中也得到了证实。鉴于10%的假小链双歧杆菌条件培养基能有效抑制两种CCA细胞系的活力,且20%的条件培养基抑制作用更强,研究者选择假小链双歧杆菌进行进一步研究。
随后,研究者评估了假小链双歧杆菌条件培养基对CCA细胞恶性表型的影响。克隆形成实验显示,假小链双歧杆菌条件培养基显著减少了HCCC-9810和RBE细胞的克隆数量。划痕实验表明,假小链双歧杆菌条件培养基显著抑制了HCCC-9810和RBE细胞的迁移能力。Transwell实验进一步证实,假小链双歧杆菌条件培养基显著抑制了两种细胞系的侵袭能力。此外,TUNEL染色显示,假小链双歧杆菌条件培养基诱导了HCCC-9810和RBE细胞的显著凋亡。
为了在体内验证这些发现,研究者通过尾静脉水动力注射NICD和AKT癌基因建立了CCA小鼠模型。小鼠被随机分为PBS组和假小链双歧杆菌治疗组。宏观检查显示,PBS组小鼠肝脏组织被肿瘤广泛替代,形成大的融合性肿瘤块。相比之下,假小链双歧杆菌治疗的小鼠保留了更多的正常肝脏结构,肿瘤结节更小、更分散。分析表明,与PBS组相比,假小链双歧杆菌治疗显著降低了肝脏重量和肝/体比。Ki67免疫组化显示,假小链双歧杆菌治疗的肿瘤中增殖指数显著降低。此外,结肠组织的免疫荧光染色显示,假小链双歧杆菌治疗显著增强了肠道屏障蛋白的表达,包括Claudin 1、Occludin和ZO-1。总之,这些数据表明假小链双歧杆菌在体外和体内均能抑制CCA进展,同时改善肠道屏障完整性。
为了阐明假小链双歧杆菌介导的CCA抑制机制,研究者对假小链双歧杆菌或PBS处理的CCA小鼠模型的肝组织进行了RNA测序。基因集富集分析(GSEA)显示,PI3K-AKT信号通路是富集最显著的途径,拥有最高的基因计数。与PBS对照组相比,假小链双歧杆菌治疗组中PI3K-AKT信号通路显示出显著的负富集,这表明假小链双歧杆菌抑制了这一致癌信号通路。为了验证这些发现,研究者在实验模型中检测了该通路的激活状态。对假小链双歧杆菌或PBS处理的NICD/AKT诱导的CCA小鼠肝组织进行的蛋白质印迹分析显示,与对照组相比,假小链双歧杆菌治疗显著降低了肝组织中AKT、PI3K和mTOR的磷酸化水平。有趣的是,AKT的总蛋白表达也显著降低。总之,这些验证结果表明假小链双歧杆菌抑制了CCA进展,这与抑制PI3K-AKT-mTOR通路有关。
讨论
CCA的早期诊断仍
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号