《Frontiers in Immunology》:Systemic sclerosis-associated pulmonary arterial hypertension and pulmonary fibrosis: exploring biomarker discriminators with advanced omics in a Caucasian cohort
引言
系统性硬化症(Scleroderma;SSc)是一种慢性自身免疫性疾病,以血管损伤和免疫系统激活为特征,导致细胞外基质(ECM)蛋白过度沉积。该疾病进程由加剧的炎症、自身免疫和小血管病变驱动,引发异常的结缔组织重塑和瘢痕形成。这些变化导致进行性纤维化,影响皮肤及心、肾、肺等内脏器官。目前,SSc患者中死亡率最高的是那些伴有心肺表现的患者,约占SSc相关死亡的50%。主要的肺部并发症包括系统性硬化症相关肺动脉高压(SSc-PAH)和系统性硬化症相关肺纤维化(SSc-PF)。SSc-PAH和SSc-PF是不同的疾病内型,涉及共同和独特的病理机制,这些机制尚未被完全理解,导致了不同的临床关联、预测因素和治疗方案。
SSc-PAH源于小型肺动脉的广泛重塑,导致管腔狭窄和肺血管阻力增加。其发病机制归因于血管活性介质失衡、促炎细胞因子、血栓形成失调以及包括转化生长因子-β(TGF-β)信号通路在内的多种通路 disruption。这导致肺小动脉内的内皮细胞和平滑肌细胞增殖改变。也有迹象表明SSc-PAH患者表现出独特的、不利的代谢特征,这归因于氧化应激和线粒体功能障碍。
SSc-PF是一种间质性肺病,其特征是肺实质内的炎症、纤维化和ECM沉积,导致气体交换减少和肺活量下降。内皮细胞损伤伴随的血管损伤和肺泡上皮细胞损伤是纤维化之前的关键初始损伤。损伤后,释放促炎和促纤维化介质,激活间质成纤维细胞。随着时间的推移,成纤维细胞获得平滑肌细胞的特征并成为肌成纤维细胞,导致胶原和其他ECM成分的失调积累,最终引发纤维化。细胞因子和生长因子,如TGF-β、白细胞介素-6(IL-6)和结缔组织生长因子(CTGF),都被认为参与了该疾病的发病机制。靶向抗炎和抗纤维化疗法如托珠单抗、霉酚酸酯和尼达尼布已被证明可以改善患者预后,但这些药物缺乏疾病特异性。
在疾病早期,SSc-PAH和SSc-PF的发病机制似乎涉及共同机制,包括血管功能障碍和炎症过程,造成了介质和自身免疫之间的差异。这些可能反映了一些共享因素,其重叠作用尚未被完全理解,但随着疾病进展会导致 distinct 特征。SSc-PF也可能由于晚期间质性肺病中的慢性缺氧和纤维化引起的血管损伤而促成SSc中的肺动脉高压。这种疾病发病机制的复杂重叠使得风险分层、早期干预和管理具有挑战性。因此,预测SSc相关肺部并发症发生和性质的稳健方法将有助于指导早期诊断和干预。此外,SSc-PAH和SSc-PF之间的特异性 discriminatory 标志物可能有助于识别新的疾病机制和针对根本原因的治疗方法。
近年来,包括转录组学、蛋白质组学和代谢组学在内的组学方法在理解疾病发病机制以及检测新的生物标志物和治疗靶点方面取得了重大进展。一项对SSc-PF患者的转录组学研究检测到IL-6、胰岛素样生长因子结合蛋白-2(IGFBP-2)、胰岛素样生长因子样-2(IGFL-2)和Toll样受体-8(TLR-8)水平的异常。在SSc-PAH中,蛋白质组学已鉴定出IV型胶原、内皮抑素、IGFBP-2、IGFBP-7、基质金属蛋白酶-2(MMP-2)、神经纤毛蛋白-1、N末端脑钠肽前体和RAGE的变化。最近,使用生物活性代谢组学分析,据报道脂肪酸氧化、类二十烷代谢和性激素的代谢物可以区分SSc-PAH和IPAH。然而,迄今为止,尚未有研究使用多组学方法在SSc队列中识别SSc-PAH和SSc-PF的标志物。因此,本研究旨在利用蛋白质组学和代谢组学,揭示能够区分SSc-PAH和SSc-PF患者的系统性蛋白质组因子和代谢物。
材料与方法
伦理批准与研究设计
该研究获得了英国国家注册伦理委员会(REC ref. 6398)的批准,实验根据国家研究指南进行。
研究招募
参与者从皇家自由医院硬皮病中心招募,该中心是一个国家转诊中心,拥有超过2000名SSc患者和约1000名对照受试者的数据库。SSc队列包括120名高加索参与者,分为四个数量相等的组(每组n=30):SSc-PAH、SSc-PF、SSc-NLD(无肺部疾病)和健康对照(HC)。
参与者选择标准
所有招募的SSc患者均根据EULAR 2013分类标准进行诊断。采用严格的临床标准以确保四个研究组定义明确。选择的所有患者均为欧洲高加索人,以限制人群差异。患者的选择还取决于其自身抗体谱,因为95%的SSc患者可检测到自身抗体,这在大多数情况下对疾病具有特异性。
SSc-PAH参与者的选择基于2015年ESC/ERS PAH诊断和管理指南,平均肺动脉压(mPAP)>25毫米汞柱(mmHg)。还使用右心导管测量的肺动脉楔压(PAWP)≤15mmHg和肺血管阻力(PVR)>3.0 Wood单位(UW)来确认SSc-PAH的存在。仅招募抗着丝点抗体(ACA)阳性且无显著肺纤维化的受试者。
SSc-PF患者被分类为使用高分辨率计算机断层扫描(HRCT)测量肺纤维化>30%,或肺纤维化10-30%且用力肺活量(FVC)<70%的患者。对于该组,选择抗拓扑异构酶(ATA)阳性且无显著肺动脉高压(通过超声心动图使用三尖瓣反流速度(TR vel)测量,截止值为峰值TR vel<2.8 m/s)的患者。
SSc-NLD组患者没有上述定义的肺纤维化或肺动脉高压证据,并且疾病持续时间至少五年,反映了肺部并发症发生的典型时间范围。SSc-NLD患者可以是ATA或ACA阳性。HC参与者没有SSc或任何其他已知疾病的诊断,并且不是SSc个体的血亲。对于SSc-PAH和SSc-PF组,分析了肺部并发症诊断后最早可用的样本。
血液采样与处理
从参与者的全血样本中提取血浆和血清。使用20号针头从同意参与的参与者抽取血液(25ml),通过室温下3000 rpm(17000 x g)离心10分钟分离血清和血浆(EDTA),并储存于-20°C直至分析。血浆用于蛋白质组学和代谢组学分析,而血清样本用于ELISA验证以及IL-6反式信号和CTGF水平的研究。
Olink蛋白质组学分析
使用Olink邻近延伸平台测量血浆蛋白水平。使用了心血管II和免疫肿瘤学96重免疫分析panel,因为它们包含了与心血管、炎症、代谢疾病和肿瘤学相关的最佳细胞因子选择。每个panel包含92种蛋白质(共184种)。在分析之前,从免疫肿瘤学panel中移除重复的panel分析物(n=17),留下总共167种分析物。蛋白质水平报告为Olink标准化蛋白表达(NPX)。NPX值根据循环阈值(Ct)值计算,并对数据进行预处理以最小化 assay 间和 assay 内的变异。高NPX值与高蛋白质浓度相关。
酶联免疫吸附试验
使用商业ELISA试剂盒测定120个样本(每组n=30)中IL-6、IL-33、MCP-1、CTGF、sIL-6R和sgp130的血清浓度。测定程序根据推荐方案进行。测定稀释度为:IL-6/1:5;IL-33/不稀释;MCP-1/1:2;sIL-6R、sgp130和CTGF/1:100。
蛋白质-蛋白质相互作用
使用STRING数据库进行网络分析,以识别每组中改变的细胞因子之间的蛋白质-蛋白质相互作用。STRING平台评估来自五个来源的直接物理相互作用和间接功能关联:主要 curated 数据库、文本挖掘、实验相互作用、共表达相互作用分析或在具有高度同源性的生物体中观察到的相互作用。通过网络节点度(蛋白质在网络中具有的平均相互作用数)和聚类系数(衡量网络中节点连接程度的指标。高聚类系数代表高度连接的网络)来评估网络。针对这些细胞因子的生物制剂,无论是FDA批准的还是正在进行临床试验的,都被纳入网络。使用Enrichr工具中的基因本体(GO)数据库进行通路分析,以识别每组改变的细胞因子的生物学和分子通路。
代谢组学分析
通过非靶向代谢组学分析了总共120个血浆样本(每组n=30)。样品制备、处理和QC生成在卡塔尔反兴奋剂实验室(ADLQ)完成,而最终的QC审查和 curate 由Metabolon公司完成。使用既定方案通过超高效液相色谱-串联质谱(UPLC-MS/MS)进行代谢组学分析。使用Metabolon的硬件和软件提取原始数据、进行峰识别和质量控制处理。将化合物与>3300种纯化标准化合物库进行比较。未知化合物也被记录,并可能在未来通过获取匹配的纯化标准或通过经典结构分析进行鉴定。
统计学与生物信息学
使用R编程软件,采用单因素方差分析(ANOVA)与Tukey多重比较检验以及Pearson相关性分析Olink蛋白质组学数据。ELISA数据使用独立样本Kruskal-Wallis检验与Dunn多重比较检验,以及Spearman's Rho相关性进行分析。每组中所有显著不同的蛋白质,以及通过ELISA研究的细胞因子,都进行了网络和通路分析。网络分析使用STRING数据库进行。通路分析使用Enrichr基因本体(GO)数据库进行。统计显著性使用Fisher精确检验确定。应用Benjamini-Hochberg校正,整个研究中p值<0.05被认为具有显著性。
在分析之前,未命名的代谢物被排除在数据集之外。进行了主成分分析(PCA)。随后进行非配对t检验,将每组与其余三组进行比较。为考虑多重比较,应用了Benjamini-Hochberg校正,调整后p值<0.01被认为显著。仅保留在目标组中与所有其他组相比表现出显著失调,且在任何其他组中未显示显著方向性失调(上调或下调)的代谢物。最后,通过训练随机森林模型来验证保留的代谢物的预测能力。所有代谢组学分析均使用Python和scikit-learn库进行。
代谢物网络分析和通路富集使用MetaboAnalyst 6.0软件进行。蛋白质-代谢物相关性使用Pearson相关性检验。p值<0.05用于确定通路分析和相关性的显著性。所有图表均使用R软件或GraphPad Prism创建。
结果
队列人口统计学和临床特征的关键信息如表1所示。
SSc血液蛋白质组谱分析
血浆样本分析显示,检测到了所检查样本中的167种Olink蛋白分析物。使用单因素方差分析,发现12种细胞因子在四组中存在显著改变。这些细胞因子是IL-10、IL-12、IL-16、MCP-1、MCP-3、MCP-4、IL-1RL2、IL-33、IL-6、IL-8、IL-1RA和TNFRSF4。在多于一组中显著升高的细胞因子被排除在进一步分析之外,因为它们不具有特异性,剩下8种细胞因子。IL-10在SSc-NLD中与HC相比显著升高,但与SSc-PAH或SSc-PF相比则不显著。IL-12在SSc-PAH中与SSc-NLD和HC相比显著升高,但与SSc-PF相比则不显著。IL-16在SSc-PAH中与HC相比显著升高,但与SSc-NLD或SSc-PF相比则不显著。MCP-1、MCP-3和MCP-4在SSc-PF中与所有其他组相比均显著且特异性升高,而IL1RL2和IL-33仅在SSc-PF中与HC相比显著升高。
选定生物标志物的验证及其在SSc亚组中的相互关系
通过ELISA测量了四组中IL-6、sIL-6R、sgp130、MCP-1、IL-33和CTGF的血清水平。MCP-1在SSc-PF中与所有其他组相比显著升高。IL-33在SSc-PAH中与HC相比显著降低。IL-6在所有SSc组中与HC相比均显著上调,在SSc-PF中与SSc-NLD相比也显著上调,但SSc-PAH和SSc-PF之间的IL-6浓度无显著差异。对于IL-6反式信号分子,sIL-6R在SSc-PAH和SSc-PF中与HC相比均显著升高,但与SSc-NLD相比则不显著。sgp130和CTGF的水平在各组之间没有显著差异。使用Spearman相关性分析分析了这些细胞因子之间的相互作用。当所有参与者合并在一起时,IL-6和sIL-6R之间以及IL-6和MCP-1之间存在显著正相关。在SSc-NLD组中,发现sgp130与IL-6呈显著正相关。在SSc-PF组中,MCP-1与CTGF呈显著正相关。
蛋白质-蛋白质相互作用及蛋白质通路分析
网络分析确定SSc-NLD是具有最低相互作用数量(节点度=3.67)但蛋白质之间连接度较高(聚类系数=0.839)的组。SSc-PAH组的节点度为4.0,具有最低的聚类系数(0.713)。SSc-PF组具有最高的节点度(6.67)和0.794的聚类系数。对当前FDA批准的生物制剂的分析显示,只有托珠单抗在SSc中常规治疗使用。其他几种生物制剂,如司妥昔单抗、司柏索利单抗和阿那白滞素,可能被重新用于治疗SSc,无论是否存在肺部并发症。
通路分析确定T细胞增殖和肿瘤坏死因子受体(TNFR)活性是SSc-NLD中最显著富集的生物学和分子通路。对于SSc-PAH和SSc-PF组,最显著富集的通路是Janus激酶(JAK)活性的激活和IL-6R结合。
非靶向代谢组学
共检测到1189种代谢物,包括1001种已知身份的化合物(命名代谢物)和188种未知结构身份的化合物(未命名代谢物)。未知代谢物未包含在任何进一步分析中。此外,由于不符合测定QC标准,移除了36种已知代谢物。最终分析包括965种已知代谢物。
SSc中代谢物及代谢物谱的鉴定
PCA显示SSc-PAH组与其他队列有适度的分离,而SSc-PF、SSc-NLD和HC组则表现出显著重叠。初步的单变量测试在SSc-PAH、SSc-PF和SSc-NLD组中分别鉴定出122、37和27种差异表达的代谢物。然而,在应用严格的纳入标准以分离组特异性特征后,仅保留了SSc-PAH组的10种代谢物,而SSC-PF或SSC-NLD组没有代谢物符合标准。SSc-PAH组与其他队列表现出适度的空间分离,而SSc-PF、SSc-NLD和HC组则显示出相当大的重叠。
这10种保留的代谢物随后被用于训练随机森林分类器以评估其预测能力。该模型在识别SSc-PAH组方面表现出稳健的性能,精确度为0.70,召回率为0.78,F1分数为0.74。相比之下,该模型对其余组的预测能力较差,F1分数范围在0.00到0.27之间。
SSc中的代谢物通路分析
使用SSc-PAH中所有改变的代谢物进行通路富集分析,以更深入地了解该组内失调的代谢通路。通过计算 hits/expected 来计算富集比,其中hits = 观察到的命中数;expected = 预期命中数。SSc-PAH中最富集的通路是那些调节烟酸和烟酰胺代谢以及色氨酸代谢的通路。参与这些通路的代谢物是喹啉酸(QUIN)、1-甲基烟酰胺、nudifloramide、黄尿酸和犬尿氨酸(KYN)。
细胞因子-代谢物相互作用
关联矩阵模式揭示了 distinct 的蛋白质-代谢物谱,这些谱在四个组之间大致可比。然而,在SSc-PAH组中观察到IL-33相关关联的显著中断。在分析的10种代谢物中,有9种在HC和SSc-NLD中与IL-33呈负相关。这些关联在SSc-PF中减弱(4种负相关代谢物),并在SSc-PAH中 largely 消失,IL-33表现出更多的正相关。此外,在肺部组中出现了IL-33和IL-12之间的负相关,而这在SSc-NLD和HC中均不存在。
讨论
与SSc相关的肺部并发症(SSc-PAH和SSc-PF)是疾病相关死亡的主要原因。这两种情况都具有复杂的病因,尚未被完全理解。可用的治疗方法旨在缓解症状,但不能解决潜在的炎症和代谢功能障碍。识别 discriminatory 生物标志物和新的治疗靶点将改善患者预后和结局。这是首次产生 combined 细胞因子-代谢物 panel 的研究,该组合可能区分SSc-PAH和SSc-PF。
MCP-1、MCP-3和MCP-4被确定为SSc-PF的 discriminatory 标志物,因为它们的水平在该组中与其他组相比显著升高。这些趋化因子是单核细胞趋化蛋白家族的成员,是强大的趋化因子,将免疫细胞募集到感染、炎症和应激部位。MCP-1与SSc中炎症的 initiation 有关。在博来霉素处理的小鼠的纤维化肺内,在其CD4+T细胞上检测到其受体CCR2的高水平。升高的血清MCP-1也被证明与SSc患者肺纤维化的发展相关。类似地,SSc患者的血清MCP-3水平与更严重的皮肤纤维化和降低的FVC相关,表明其在纤维发生中的核心作用。MCP-4虽然不像MCP家族其他成员那样被广泛研究,但据报道在支气管肺泡灌洗液细胞中表达,并可能 contribute to 纤维化疾病过程。然而,MCP家族成员也被报道在其他炎症性肺部疾病中升高,如特发性肺纤维化(IPF)。迄今为止,IPF中的蛋白质组学研究尚未一致地将MCPs确定为 established 生物标志物。因此,需要进行IPF和SSc相关肺纤维化之间的直接比较,以确定MCPs是否代表稳健且疾病特异性的生物标志物。
本研究通过ELISA验证了MCP-1在区分SSc-PAH和SSc-PF方面的 discriminatory 价值。还研究了IL-33、IL-6、sIL-6R、sgp130和CTGF,尽管它们未被发现能区分肺部组。发现IL-33水平在SSc-PAH中与HC相比降低。在反式信号中,IL-6与其可溶性受体sIL-6R结合,并与信号转导子gp130结合以促进炎症,而可溶性gp130阻断这种相互作用并抑制反应。本研究发现IL-6和sIL-6R在SSc-PAH和SSc-PF中均升高。然而,这可能是通过疾病亚组中不同的致病途径发生的,正如抗IL-6R疗法托珠单抗在SSc-PF中有效但在SSc-PAH中无效所表明的那样。有趣的是,在SSc-NLD组中,IL-6和sgp130之间存在显著正相关。这 potentially 是一种保护机制,阻止肺部并发症的进展和发展。CTGF也被认为参与了SSc的发病机制。代表性差异分析(RDA)证明从SSc患者分离的成纤维细胞中CTGF基因转录增加。此外,在PAH和PF小鼠模型中选择性删除CTGF显著减少了肺间质瘢痕形成和血管重塑。虽然本研究中各患者组之间的CTGF水平没有显著差异,但在SSc-PF组中CTGF和MCP-1之间存在强正相关,表明CTGF信号传导可能 contribute to 该疾病通路。
网络分析确定SSc-PF是具有最高节点度的组,表明该亚组内的细胞因子彼此之间表现出更多的相互作用。这一发现与先前的研究一致,表明SSc-PF代表了一种更炎症驱动的表型。总的来说,所涉及的细胞因子及其相互关联性指向该组内炎症失调的状态。在这些网络中针对细胞因子的七种FDA批准药物中,四种(托珠单抗、萨瑞鲁单抗、司妥昔单抗和萨特利珠单抗)靶向IL-6信号通路,并已在SSc中进行试验,取得了不同程度的成功。阿那白滞素是一种抗IL-1抑制剂。虽然越来越多的证据表明IL-1介导的炎症可能在SSc相关心力衰竭中起作用,但迄今为止,尚无其在SSc相关疾病中使用的报道。乌司奴单抗靶向IL-12和IL-23共享的p40亚基,并在银屑病等免疫介导的疾病中显示出疗效。然而,目前没有证据支持其在SSc中使用。司柏索利单抗是一种靶向IL-36受体的单克隆抗体,在治疗泛发性脓疱型银屑病中显示出临床益处;然而,其在SSc中的作用尚未被研究。重新利用这些药物可能 potentially 为患者提供更广泛的治疗选择。
发现了SSc-PAH的10种代谢物特征。二甲基精氨酸(SDMA + ADMA together)、羟基天冬酰胺、QUIN、AYA、T6A、VLA、DMTPA、N-乙酰丝氨酸、N-异丁酰亚胺和乳清苷在该组中与所有其他组相比显著升高。这些代谢物对能量代谢、线粒体氧化、氨基酸分解代谢和炎症很重要。二甲基精氨酸(ADMA)已知调节血管张力、对损伤的反应,并且是已知的一氧化氮(NO)合酶抑制剂。NO水平降低是慢性炎症和细胞 disruption 的关键驱动因素,因为它导致内皮功能障碍。已显示ADMA水平在IPAH和慢性血栓栓塞性肺动脉高压(CETPH)患者的血浆中与健康对照相比升高,并且这与低内皮NOS表达相关。临床上,血清ADMA已被证明与mPAP和肺血管阻力呈正相关,因此可以作为监测治疗有效性的生物标志物。然而,本研究未单独测量ADMA。
羟基天冬酰胺在钙结合表皮生长因子(cbEGF)样结构域的翻译后修饰中很重要。这些结构域存在于多种细胞外蛋白中,如原纤维蛋白。已显示原纤维蛋白诱导常驻成纤维细胞向肌成纤维细胞的转分化,后者产生ECM蛋白和促炎细胞因子,加剧炎症。这是调节炎症细胞趋化性的关键炎症通路,可导致血管内的炎症级联反应。
高水平的QUIN,一种通过色氨酸代谢的犬尿氨酸途径(KP)形成的代谢物,与未经治疗的PA