《Autoimmunity》:Identification of the immune-related diagnostic biomarkers between Graves' disease and thyroid carcinoma based on comprehensive bioinformatics analysis and machine learning
编辑推荐:
本文通过综合生物信息学分析与机器学习,鉴定出Graves病与甲状腺癌共有的免疫相关诊断标志物,构建了包含TREM1、S100A11、MRPS16、MET、ACTN1等五个核心基因的稳健诊断模型。研究揭示了核心基因与肿瘤免疫浸润(CIBERSORT算法分析)的显著关联,并确定TREM1为调控枢纽与免疫治疗反应预测指标。体内外实验证实TREM1调控肿瘤生长,并筛选出潜在治疗化合物VER-155008,解析了HOTTIP/hsa-miR-204-3p/TREM1 ceRNA调控轴,为GD相关THCA的早期诊断和治疗提供了新靶点。
引言:免疫交叉视角下的甲状腺疾病
甲状腺疾病是最常见的内分泌疾病之一,其发病率逐年上升,构成重大公共卫生负担。其中,Graves病是碘充足地区甲状腺功能亢进的主要原因,占病例的70%–80%。Graves病是一种累及包括甲状腺在内的多器官系统的自身免疫性疾病,常伴有复发、加剧以及甲状腺癌、眼病等并发症。甲状腺癌是全球最常见的内分泌恶性肿瘤,尽管其总体死亡率相对较低,但一旦肿瘤进展或转移,生存率会急剧下降。目前,病理学评估仍是THCA诊断的金标准,而超声和细针穿刺活检存在误诊风险,手术切除虽然能够确诊,但具有侵入性和组织损伤的可能性。因此,迫切需要开发用于THCA早期诊断和预防的新方法。
自身免疫性疾病被认为是肿瘤发生转化的易感因素,会增加罹患肿瘤性疾病的风险。临床研究报告显示,GD患者中甲状腺癌的发病率高于一般人群,表明对THCA的易感性增加。近年来,生物标志物在改善恶性肿瘤诊断方面显示出相当大的潜力。然而,尽管GD被认为是早期THCA的风险因素,目前尚未建立能够共同诊断GD相关THCA的生物标志物。因此,识别用于甲状腺癌早期检测的GD相关生物标志物仍然是当务之急。
材料与方法:多维度数据整合与分析策略
本研究整合了多种生物信息学方法并进行实验验证。从30名甲状腺癌患者中收集肿瘤及癌旁正常组织,并从健康对照、GD患者以及GD合并THCA患者中获取血清样本。研究获得医院伦理委员会批准。从GEO和TCGA数据库获取THCA和GD相关数据,使用了GSE29265、GSE5364和GSE71956等多个数据集。
研究采用了加权基因共表达网络分析来构建无标度共表达网络并识别疾病特异性基因模块。通过差异表达分析,从GSE29265和GSE71956数据集中分别获得了2170个和1238个差异表达基因。随后,对共享基因进行了基因本体论和京都基因与基因组百科全书通路富集分析,强调了免疫相关通路。采用LASSO回归算法,从21个共享基因中筛选出五个核心候选基因来构建诊断模型,并使用随机森林算法进一步精炼生物标志物的选择。利用CIBERSORT算法评估THCA中的免疫细胞浸润。通过STRING数据库构建蛋白质-蛋白质相互作用网络,并利用TIDE算法预测免疫治疗反应。此外,还通过Connectivity Map和GSCA数据库进行小分子化合物筛选,并利用TargetScan、miRTarBase、DIANA Tools、LncBook和RNAInter等工具构建了以TREM1为中心的ceRNA调控网络。研究还进行了定量逆转录聚合酶链反应、蛋白质印迹、细胞计数试剂盒-8、异种移植肿瘤模型、RNA结合蛋白免疫沉淀测定和双荧光素酶报告基因系统等一系列体外和体内实验验证关键发现。
结果:从基因筛选到机制探索
3.1 构建THCA和GD的加权共表达网络
为了识别与THCA和GD均相关的关键基因,研究首先分析了差异表达基因,并分别在两种疾病相关数据集中进行了WGCNA。通过设置软阈值,实现了无标度拓扑,并通过平均连锁层次聚类识别出模块。模块-性状相关性热图表明,蓝色和黄色模块与THCA和GD的关联性最强,为后续研究提供了有前景的焦点。
3.2 识别共享诊断基因
为了探索THCA和GD的发病机制,研究交叉了来自WGCNA模块的差异表达基因,识别出21个共享基因。随后的GO和KEGG富集分析揭示了几个显著的免疫相关通路,包括吞噬作用、白细胞介导的免疫和自然杀伤细胞介导的细胞毒性。为了进一步精炼候选诊断基因,对这21个共享基因应用了LASSO回归算法,得出了五个潜在的标志物——TREM1、S100A11、MRPS16、MET和ACTN1,它们可能在诊断GD相关的THCA中发挥关键作用。
3.3 构建和评估THCA诊断模型
研究基于五个候选基因构建了诊断模型,其风险评分计算公式为:风险评分 = 0.364 × TREM1表达 + 0.256 × S100A11表达 + 1.594 × MRPS16表达 + 0.749 × MET表达 + 0.427 × ACTN1表达。受试者工作特征曲线分析显示,所有五个基因的曲线下面积值均>0.8,而模型的AUC达到了0.948,显示出优异的敏感性和特异性。精确率-召回率曲线分析进一步证实该模型优于任何单个基因。研究还生成了列线图来可视化预测能力,校准曲线表明预测结果与观察结果之间具有很强的一致性。此外,决策曲线分析支持了该模型在THCA诊断中的临床实用性。最后,在两个独立数据集中的ROC曲线验证证实了模型的可靠性。
3.4 与GD相关的THCA中的免疫细胞浸润
基于上述发现,功能富集分析表明21个共享基因与免疫过程密切相关。为了进一步表征THCA的免疫景观,研究首先比较了GSE29265数据集中22种免疫细胞类型的分布,发现M2巨噬细胞、M0巨噬细胞、滤泡辅助性T细胞和浆细胞的比例较高。计算THCA与正常组织中这些免疫细胞的富集评分,显示THCA中M0巨噬细胞、树突状细胞和中性粒细胞水平升高。此外,浸润免疫细胞的图谱分析表明,免疫群体与五个核心基因之间存在多重相关性。热图分析一致地证实,这五个基因的表达与免疫细胞,特别是M0巨噬细胞显著相关。这些结果共同表明,五个GD相关的THCA基因与免疫浸润密切相关。
3.5 诊断模型的免疫景观
研究假设高风险和低风险组会表现出不同的免疫特征,因为炎症和免疫细胞是GD相关THCA进展的关键驱动因素,因此评估了模型的免疫景观。初步分析显示,风险评分与免疫评分和ESTIMATE评分呈正相关,而与基质评分无显著关联。随后,检查了风险评分与THCA中22种免疫细胞类型的关系,发现十种免疫群体受风险评分影响,最显著的是活化的树突状细胞和中性粒细胞。此外,组间比较显示,与低风险组相比,高风险组中M0巨噬细胞、静息树突状细胞和中性粒细胞显著富集。这些发现共同证明了模型衍生的风险评分与免疫活性之间存在强烈关联,为了解GD相关THCA的免疫调节机制提供了见解。
3.6 筛查两种疾病中的核心基因
为了进一步识别GD相关THCA的中心基因,研究整合了多种分析方法。首先,将随机森林算法应用于21个共享基因,筛选出十个候选基因:SCO2、TREM1、ANPEP、ERGIC1、COL8A2、MRPS16、LYN、MET、ACTN1和LCN2。随后,GSE29265数据集的PPI分析揭示了五个连接度最高的枢纽基因:TREM1、LYN、TYROBP、FGGR3B和ICAM1,突出了它们参与THCA进展的潜力。整合LASSO选择的五个基因、随机森林衍生的候选基因和PPI枢纽基因的结果,确定TREM1为最有希望的中心基因。定量逆转录聚合酶链反应分析进一步验证了这一结果,显示与正常对照组相比,TREM1在THCA和GD中的表达均升高,并且在合并GD和THCA的患者中上调最为显著。
与生物信息学预测和观察到的TREM1上调一致,其他四个核心基因的表达水平在GD患者以及GD合并THCA患者的PBMCs中也显著升高。这种集体上调进一步支持了这五个基因参与GD和THCA共享的免疫失调。
为了进一步评估TREM1在肿瘤进展中的功能作用,在裸鼠中进行了皮下致瘤实验。注射了shTREM1或阴性对照载体的细胞被注射到小鼠的侧腹,并定期监测肿瘤生长。与对照组相比,shTREM1组的肿瘤重量和体积显著减少。这些发现共同确立了TREM1作为GD和THCA的中心基因。
3.7 TREM1表达可能作为免疫治疗反应的生物标志物
免疫治疗已成为癌症研究的主要焦点。本研究全面评估了TREM1的免疫治疗相关性。首先,评估了TREM1表达与九个免疫检查点基因之间的相关性,弦图和热图均显示存在强关联。此外,蛋白质-蛋白质相互作用网络分析表明TREM1与关键检查点分子CD86和CTLA4直接相互作用,提示其可能在更广泛的免疫检查点网络中作为上游调节因子发挥作用。然后,功能评估显示,低TREM1表达的样本表现出较低的TIDE评分,这意味着当TREM1在THCA中高表达时,免疫检查点阻断可能效果较差。此外,功能障碍分析表明,高TREM1表达与肿瘤微环境中T细胞失活增加相关,而低TREM1表达则与较高的MSI和Merck18评分相关,表明免疫治疗反应更有利。一致地,TREM1高表达组的免疫应答率显著降低。综上所述,这些发现表明TREM1可能作为THCA患者免疫治疗反应的预测性生物标志物,较低的表达水平预示着更大的治疗效果。
3.8 筛选在GD相关THCA中具有潜力的小分子化合物
为了识别靶向GD相关THCA患者中TREM1的小分子化合物,采用了一系列筛选策略。首先,将GSE29265数据集中与TREM1正负相关的前150个基因上传到cMAP数据库,预测了6416种潜在化合物。同时,查询CTRP数据库,获得了20种与TREM1表达相关的化合物。两个数据集的交集确定了七种THCA候选化合物,包括异甘草素、替尼泊苷、Merck60、卡奈替尼、维A酸、MST-312和VER-155008。cMAP在10个细胞系中预测的热图显示,VER-155008表现出最高的绝对负富集分数,表明其具有逆转TREM1过表达的潜力。CTRP数据库分析一致地证实,具有高TREM1表达的THCA患者对VER-155008特别敏感。在GSE71956数据集中的验证进一步支持了这一结果,显示VER-155008保持了最强的负富集分数。总之,VER-155008作为一种有前景的靶向TREM1的小分子化合物出现,对THCA和GD都具有潜在的治疗意义。为了实验评估其效果,进行了多项检测。CCK8检测表明VER-155008显著抑制癌细胞活力。随后,蛋白质印迹分析显示VER-155008抑制了TREM1蛋白表达。最后,IC50测定表明,敲低TREM1增加了细胞对VER-155008的敏感性。
3.9 关于TREM1的ceRNA调控网络
先前的研究表明ceRNA网络在甲状腺癌中起着关键作用。因此,我们在THCA中构建并分析了与TREM1相关的ceRNA调控网络。通过整合TargetScan、DIANA TOOLS和miRTarBase数据库,识别出21个可能靶向TREM1的miRNA。基于mRNA和miRNA之间负调控的原则,相关性分析将候选miRNA精炼为hsa-miR-421、hsa-miR-676-5p、hsa-miR-204-3p和hsa-miR-3652。鉴于其最强的负相关性,选择hsa-miR-204-3p进行进一步研究。TargetScan预测证实了TREM1 mRNA和hsa-miR-204-3p之间的结合位点,并引入了定点突变。RIP检测验证了TREM1和hsa-miR-204-3p之间的直接相互作用。一致地,双荧光素酶报告基因检测显示,hsa-miR-204-3p模拟物显著降低了野生型TREM1载体的荧光素酶活性,而对突变体载体没有影响。此外,hsa-miR-204-3p模拟物抑制了B-CPAP细胞中TREM1的表达,而抑制剂增强了其表达。
随后,利用LncBook和RNAinter数据库筛选可能靶向hsa-miR-204-3p的lncRNA。在五个候选lncRNA中,只有HOTTIP与hsa-miR-204-3p表达呈负相关。hsa-miR-204-3p与HOTTIP的预测结合位点通过突变进一步验证。双荧光素酶测定证实,hsa-miR-204-3p降低了野生型HOTTIP载体的荧光素酶活性,但对突变体没有影响。此外,HOTTIP的过表达对hsa-miR-204-3p的表达具有抑制作用。拯救实验进一步证明,HOTTIP过表达可以抵消由hsa-miR-204-3p水平升高引起的对TREM1的抑制。
这些结果共同在THCA中建立了一个潜在的涉及HOTTIP/hsa-miR-204-3p/TREM1的ceRNA调控轴,为TREM1表达的转录后调控提供了新的见解。
讨论与结论
作为一种自身免疫性疾病,Graves病被认为是甲状腺功能亢进的主要潜在因素。长期以来,GD一直被认为会增加甲状腺癌的风险和侵袭性。在此背景下,据我们所知,我们的研究首次整合了两种疾病的生物信息学分析和机器学习算法,从而识别出21个共享基因,并精炼出五个核心候选基因——TREM1、S100A11、ACTN1、MET和MRPS16。值得注意的是,本研究在上述五个核心基因的基础上构建了一个更全面的诊断模型,其结果显示对THCA的诊断准确性显著优于单个生物标志物。这五个基因特征的诊断潜力得到了我们在GD和GD+THCA患者临床样本中实验证实其协同上调的支持,将计算发现与转化证据联系起来。
免疫系统的功能完整性与癌症的发生和发展密切相关,甲状腺作为与免疫调节密切相关的关键内分泌器官。与此一致,并得到21个共享基因的GO/KEGG结果的支持,应用CIBERSORT分析评估免疫细胞浸润,揭示GSE29265中M2巨噬细胞比例最高,其次是M0巨噬细胞、滤泡辅助性T细胞等。THCA和正常组织在特定免疫亚群的浸润方面也存在显著差异,特别是M0巨噬细胞。作为肿瘤微环境中的主要免疫成分,肿瘤相关巨噬细胞已知能促进THCA的侵袭和转移。在刺激下,M0巨噬细胞可根据其激活状态、功能和分泌因子极化为M1或M2表型,从而通过细胞因子释放驱动肿瘤进展。这一观察结果与我们发现的巨噬细胞在THCA样本中占主导地位一致。此外,鉴于所有已识别的五个核心基因先前都与免疫相关,我们检查了它们与免疫细胞浸润的关系,并发现与多个免疫亚群存在强关联。值得注意的是,由我们的模型定义的高风险和低风险组在巨噬细胞浸润,特别是M0巨噬细胞方面显示出显著差异,表明这些生物标志物不仅可能有助于区分THCA,还可能通过调节免疫细胞动态来影响癌症进展。
机器学习最近已成为生物信息学中的强大工具,为揭示疾病相关机制提供了巨大潜力。在我们的研究中,应用了机器学习方法,特别是随机森林算法,并确定TREM1为中心基因。TREM1是免疫球蛋白超家族的细胞表面受体,通过诱导多种促炎介质放大炎症反应。先前的研究强调TREM1既是THCA的生物标志物也是治疗靶点,其过表达通过增强调节性T细胞的浸润促进了免疫抑制微环境。然而,其在GD中的作用尚不清楚。我们的结果表明,TREM1在Graves病患者中表达显著升高,并且在合并GD和THCA的患者中进一步升高,表明TREM1在自身免疫背景下的肿瘤促进中可能发挥作用。小鼠模型中的功能验证表明,敲低TREM1显著抑制了肿瘤生长,支持了其促肿瘤作用。这些发现暗示TREM1可能是自身免疫炎症和甲状腺癌发生之间的关键连接点。此外,在THCA中,高TREM1表达与免疫检查点表达呈正相关,并可预测免疫治疗的疗效。
药物治疗仍然是甲亢和THCA管理的基石,这凸显了对更有效治疗剂的迫切需求。在本研究中,我们观察到沉默TREM1表达有效降低了VER-155008的IC50,缓解了THCA患者对VER-155008的耐药性。VER-155008是一种有效的HSP70抑制剂,通过结合HSP70 ATPase结构域并模拟其结合位点来发挥作用,从而抑制HSP70活性。先前的研究已证实其能够抑制甲状腺未分化癌细胞的类凋亡。
ceRNA假说引入了一个关键的调控模型,其中ceRNA通过竞争性结合miRNA来影响基因表达。积累的证据已证实ceRNA参与多种癌症的发生和进展。基于这一概念,我们研究了THCA中以TREM1为中心的ceRNA网络。通过整合三个数据库,hsa-miR-204-3p被确定为关键miRNA,随后对另外两个数据库的分析强调了HOTTIP作为一个相关的lncRNA。值得注意的是,HOTTIP已被证明通过调节特定的miRNA来促进甲状腺癌细胞的增殖、侵袭和迁移。在我们的研究中,HOTTIP/hsa-miR-204-3p/TREM1轴被实验验证为TREM1表达的调节因子。
尽管进行了严格的生物信息学分析和实验验证,但本研究存在一些局限性。首先,甲状腺功能减退症相关研究的稀缺限制了我们的分析只能使用一个合格的数据集,并且样本类型的异质性可能引入偏差。其次,本研究中使用的GD和THCA相关GEO数据集在人口统计学特征上存在差异。第三,虽然我们使用体外和体内模型提供了TREM1功能验证,但缺乏自身免疫背景限制了研究结果的生理相关性。此外,虽然提出的HOTTIP/miR-204-3p/TREM1 ceRNA轴得到了体外实验的支持,但整个调控网络的全面体内验证超出了本研究范围。
总之,我们成功筛选并分离出五个与免疫密切相关的GD和THCA共享核心基因。通过利用这五个基因,我们构建了一个THCA诊断模型。更重要的是,我们进一步挖掘了涉及的中心基因,并深入探讨了TREM1所扮演的角色,增进了目前对GD和THCA发病机制的理解。