通过批量RNA测序和动物模型，识别并验证在用温阳华柳汤治疗肺癌小鼠的过程中，与腺苷酸尿苷酸富集元件（ARE）相关的生物标志物

《Electronic Journal of Biotechnology》：Identification and validation of adenylate uridylate- (AU-) rich element (ARE)-related biomarkers in the process of treating lung cancer mice with Wenyang Hualiu Tang through bulk RNA sequencing and animal model

【字体：大中小】 时间：2026年05月10日 来源：Electronic Journal of Biotechnology 2.5

编辑推荐：

　　李文新 | 王腾宇 | 吴慧婷 | 熊明峰中国江西省南昌市南昌大学第一附属医院中医预防中心 **摘要** 背景肺癌（LC）仍然是癌症相关死亡的主要原因。虽然传统方剂温阳化瘤汤（WYHLT）对肺癌显示出疗效，但富含腺苷酸尿苷酸（AU）的元素（AREs）相关基因

　　李文新 | 王腾宇 | 吴慧婷 | 熊明峰
中国江西省南昌市南昌大学第一附属医院中医预防中心

**摘要**
背景
肺癌（LC）仍然是癌症相关死亡的主要原因。虽然传统方剂温阳化瘤汤（WYHLT）对肺癌显示出疗效，但富含腺苷酸尿苷酸（AU）的元素（AREs）相关基因（AREGs）在该疾病及其治疗中的作用尚未被探索。本研究旨在阐明AREGs在WYHLT治疗肺癌中的作用机制。

**结果**
对接受WYHLT干预（低剂量、中剂量、高剂量）的小鼠肺癌模型进行转录组测序，发现了四个关键生物标志物：GREB1、MUC2、NPTX2和PPIP5K1。富集分析将MUC2、NPTX2和PPIP5K1与翻译过程联系起来。构建的调控网络揭示了这三个生物标志物（PPIP5K1、GREB1、NPTX2）、16种长链非编码RNA（lncRNAs）和10种环状RNA（circRNAs）之间的相互作用，其中lncRNA Malat1靶向四种微RNA（miRNAs）。药物预测分析确定了七种针对MUC2的药物和一种针对NPTX2的药物，其中PD-98059对MUC2的结合亲和力最高。逆转录定量聚合酶链反应（RT-qPCR）验证证实，与肺癌模型相比，WYHLT干预增加了PPIP5K1和MUC2的表达，并降低了GREB1和NPTX2的表达。

**结论**
本研究确定GREB1、MUC2、NPTX2和PPIP5K1是参与WYHLT治疗肺癌的潜在生物标志物。这些发现为WYHLT的分子机制提供了新的见解，并为肺癌治疗研究提供了新的方向。

**1. 引言**
肺癌（LC）是全球癌症相关死亡的主要原因之一[1]。据估计，每年有200万新病例和176万死亡病例[2]。根据组织病理学分析，肺癌被分为四种主要组织类型：小细胞肺癌、鳞状细胞癌、腺癌和大细胞癌。后三种统称为非小细胞肺癌（NSCLC），占所有肺癌病例的80%[3]。根据国际癌症研究机构（IARC）发布的最新统计数据，肺癌的新病例和死亡人数每年都在持续增加[4]。尽管包括手术、免疫疗法、化疗和放疗在内的传统治疗方法可以在一定程度上延长患者的生存期，但它们存在一些局限性。例如，传统疗法中的药物耐药性是胃癌治疗失败的原因之一[5]，并且副作用有限[6]。由于中药的毒性低且副作用小，其在肿瘤治疗中的应用日益增多[7][8]。温阳化瘤汤（WYHLT）是一种基于阳和汤的经典中药方剂，由黄芪（Astragalus membranaceus）、王不留行（Vaccaria segetalis）、当归（Angelica sinensis）、生姜（Zingiber officinale）、白术（Atractylodes macrocephala）、茯苓（Poria cocos）、木香（Aucklandia lappa）和川芎（Ligusticum chuanxiong）组成[9]。研究表明，它具有多种生物功能，可通过抑制肿瘤细胞增殖和促进细胞凋亡来发挥抗肿瘤作用[10]，同时还能调节炎症信号通路以实现抗炎效果[11]。传统上，它被用于治疗非小细胞肺癌、乳腺癌和肝癌等恶性肿瘤[12][13]，以及各种表现为阳虚伴寒凝、痰瘀互结和毒素滞留的慢性脓肿[14]。
WYHLT基于中医基本理论，符合肺癌的治疗原则[15]。临床实践证明，该方剂能够抑制高风险肺结节，并对肺癌显示出显著的疗效[16]。方剂中以附子煎剂和黄芪为主药，生姜和白芥子能够温肺、健脾、补气化痰[17]。白术和茯苓组合能够燥湿健脾；蜂蜜炙甘草可以调和各种药物的功效并补气化痰。王不留行与当归和川芎联合使用，能够促进血液循环、通经络、调气散结，有效缓解血瘀凝结的症状。这些草药的综合使用实现了补肺、健脾、活血化瘀和化痰散结的作用。现代研究还表明，许多温阳中药通过调节RNA发挥抗肺癌作用[18]，例如阿夫拉特醇苷I（attractylenolide I）可以抑制PDK1蛋白和lncRNA HOTAIR，从而降低下游效应因子EZH2的表达。其与EGFR-TKI厄洛替尼（erlotinib）的联合使用显示出协同效应，为肺癌治疗提供了新的策略[19]。通过siRNA敲低IRE1α，可以抑制A549细胞中IRE1α、TRAF2、p-ASK1和p-JNK的激活[20]。尽管WYHLT在肺癌治疗研究中取得了显著成果，但其如何调控关键基因表达的精确机制及其与肿瘤细胞生物学行为变化的深刻联系仍需进一步探索。识别分子生物标志物对于早期诊断和预后预测至关重要。表观遗传学标志物已被证明能有效预测疾病风险，突显了转录组生物标志物在癌症研究中的潜力[20]。
尽管WYHLT的抗肿瘤效应已被记录，但其潜在的分子机制，尤其是关于基因表达网络的全面调控机制仍大部分未阐明。除了转录控制外，mRNA稳定性和翻译的转录后调控是决定细胞蛋白质丰度和功能的关键环节，尤其是在癌症中。在这种情况下，富含腺苷酸尿苷酸（AREs）的元素（AREs）作为关键的顺式调节因子发挥作用[21][22][23][24]。AREs存在于8%–10%的人类转录本的3′-非翻译区，由一类称为ARE结合蛋白（AUBPs）的RNA结合蛋白识别[21][22][23][24]。这种相互作用显著影响编码肿瘤发生关键因子（如细胞因子、炎症介质和癌蛋白）的mRNA的稳定性、降解和翻译效率[22][23][24]。ARE依赖的转录后调控的失调与多种癌症（包括结直肠癌（CRC）和肝细胞癌（HCC）的发病和进展有关，因为它调节致癌基因和肿瘤抑制基因的表达[25]。因此，研究ARE相关基因（AREGs）在肺癌中的作用及其可能受WYHLT的调控，是一种揭示该方剂治疗效果的更上游和网络级调控机制的有前景的方法[26]。这种方法将中医的多靶点特性与基于RNA的现代分子肿瘤学相结合。

在本研究的初步阶段，建立了接受WYHLT治疗的肺癌动物模型，并进行了转录组测序以获取自测序数据。从公共数据库中检索AREGs。利用自测序数据，采用生物信息学方法（差异分析）来获取与WYHLT治疗肺癌相关的生物标志物。此外，通过功能富集分析、分子调控网络构建、药物预测等手段，进一步深入探讨了肺癌、WYHLT和富含AU的元素之间的潜在关系。这些研究为肺癌的有效诊断和治疗提供了坚实的理论基础。

**2. 材料与方法**
2.1. 细胞培养
小鼠肺癌细胞系Lewis lung carcinoma (LLC, [LL/2; LLC1]) 由中国武汉Pricella公司购买。细胞在37°C、5% CO2的培养箱中用DMEM培养基培养，补充10% FBS和1%青霉素/链霉素。最后，收集对数生长期的LLC细胞用于构建肺癌模型。
2.2. 建立肺癌皮下肿瘤小鼠模型及WYHLT干预
共获得20只5周龄的C57BL/6J雄性小鼠，来自北京四倍福生物技术有限公司（生产许可证编号：SCXK (Beijing) 2019-0010；使用许可证编号：SYXK (Dian) K2022-0006）。首先将20只小鼠适应喂养1周，然后随机分成4组：模型组（LC）和干预组（LC + WYHLT-低剂量、LC + WYHLT-中剂量、LC + WYHLT-高剂量），每组5只小鼠。将120 μL浓度为1 × 10^6 cells/mL的LLC细胞接种到每只C57小鼠的右腋下以构建肺癌模型。肿瘤形成后，LC组小鼠每天口服生理盐水200 μl，持续14天；LC + WYHLT-低剂量组小鼠每天口服WYHLT 7.0625 g/kg，持续14天；LC + WYHLT-中剂量组小鼠每天口服WYHLT 14.1250 g/kg，持续14天；LC + WYHLT-高剂量组小鼠每天口服WYHLT 28.2500 g/kg，持续14天。在整个实验过程中监测并记录4组小鼠的体重。
14天干预后，对4组小鼠（每组5只，共计20只）实施安乐死，取出每组的肺癌肿瘤组织，记录并比较各组肿瘤组织的重量和体积。部分肺癌肿瘤组织样本储存在-80°C；另一部分样本用4%甲醛固定用于组织学检查。
2.3. 苏木精和伊红（H&E）染色
为了比较4组肺癌肿瘤组织的组织病理形态，进行了H&E染色，具体步骤如下：首先将4组的肺癌肿瘤组织样本用4%甲醛固定24至48小时。固定后的样本用酒精脱水，用二甲苯透明处理，浸入石蜡并包埋。然后将其切成5 μm厚的切片。进行H&E染色时，切片在64°C下孵育1小时，用二甲苯脱蜡并重新用水稀释。用苏木精染色5分钟，接着用伊红染色5-10秒。最后脱水、透明处理并装片，进行全片扫描分析。
2.4. 免疫组化（IHC）分析
肺癌常伴有巨噬细胞的浸润。为了明确WYHLT对治疗后CD68和Ly6G的调节作用，进行了IHC分析，具体步骤如下：首先对4组的肺癌肿瘤组织进行脱钙处理，然后用4%甲醛固定24至48小时。固定后的样本用酒精脱水，用二甲苯透明处理，浸入石蜡并包埋。将组织切成5 μm厚的切片。
IHC检测中，切片在64°C下孵育1小时，用二甲苯脱蜡并重新用水稀释，然后进行抗原修复。使用3% H2O2阻断内源性过氧化物酶活性。样品在37°C下用5%牛血清白蛋白（BSA）封闭，然后加入稀释在2% BSA中的一抗（表S1）。接着加入100 μL反应增强剂，再用抗鼠IgG聚合物处理。用二氨基联苯胺（DAB）染色，最后用苏木精复染5分钟。
2.5. RNA测序和数据预处理
本研究从4组中获取了20个肺癌肿瘤组织样本进行RNA测序。使用Trizol（Invitrogen, CA, USA）从20个肺癌肿瘤组织样本中提取总RNA。评估总RNA的量和完整性。浓度> 50 ng/μL、RIN值> 7.0、OD 260/280> 1.8且总RNA> 1 μg的样本适合后续实验。接下来使用Dynabeads Oligo (dT) 25-61005（Thermo Fisher, CA, USA）对1 μg总RNA进行两轮纯化，以分离Poly(A) RNA。随后，使用镁RNA片段化模块（NEB，目录号e6150，美国）在94°C下处理5-7分钟以 fragments poly(A) RNA。随后使用SuperScript? II逆转录酶（Invitrogen，目录号1896649，美国）将切割的RNA片段逆转录成cDNA。接着，进行了聚合酶链反应（PCR）扩增。最终cDNA文库的插入片段平均长度为300 ± 50 bp。使用Illumina NovaSeq 6000平台进行测序，采用150 bp（PE150）的配对末端测序模式。测序后，使用Fastp软件（https://github.com/OpenGene/fastp）过滤掉了低质量的读取数据。通过Phred软件（http://www.phrap.org/phredphrapconsed.html）评估了AT/GC分离的存在。重要的是，我们使用了HISAT2（https://ccb.jhu.edu/software/hisat2）将读取数据与Mus musculus GRCm38参考基因组进行比对。最后，使用StringTie（https://ccb.jhu.edu/software/stringtie）以默认设置将每个样本的映射读取数据合并在一起。然后，通过gffcompare（https://github.com/gpertea/gffcompare/）将每个样本的所有转录组合并，以建立更全面的转录组。在生成最终转录组后，使用StringTie通过计算FPKM（FPKM = [总外显子片段数 / 映射读取数（百万）× 外显子长度（kb）]来确定mRNAs的表达水平。随后对4组测序数据进行了主成分分析（PCA，使用FPKM.2.6）。

在差异表达分析中，我们使用了DESeq2 R包。为了控制由于将样本分为两组进行测序可能引入的技术变异，我们在DESeq2的设计公式中包括了测序批次作为协变量。具体来说，差异比较的模型设计为～ sequencing_batch + group，其中group代表不同的处理组（例如，LC模型组，WYHLT干预组）。使用“DESeq2”包（v 1.42.0）[26]进行了4次独立的差异表达分析，旨在识别|log2倍数变化（FC）| > 1且p < 0.05的3个DEGs。具体来说，通过比较低剂量组病例样本与LC组样本来确定DEGs-L，通过比较中等剂量组病例样本与LC组样本来确定DEGs-M，通过比较高剂量组病例样本与LC组样本来确定DEGs-H。同时，使用“ggplot2”包（v 3.4.1）[27]绘制火山图来展示每个DEGs的结果，并根据log2(fold change)FC对DEGs进行排序，火山图中标记了上调和下调的前10个基因。使用“pheatmap”包（v 1.0.12）[28]绘制热图，以显示DEGs中上调和下调的前10个基因。

接下来，使用“VennDiagram”包（v 1.7.3）[29]通过交集来识别上调候选基因，即DEGs-L中的上调基因、DEGs-M中的上调基因和DEGs-H中的上调基因。使用相同的方法，通过交集来获取下调候选基因，即DEGs-L中的下调基因、DEGs-M中的下调基因和DEGs-H中的下调基因。最后，将上调候选基因和下调候选基因合并以获得候选基因。

2.7. 候选基因的功能分析和蛋白质-蛋白质相互作用（PPI）网络构建
通过“clusterProfiler”（v 4.7.1.003）[30]使用基因本体论（GO）和京都基因组与基因百科全书（KEGG）分析来揭示候选基因的生物学过程（p < 0.05）。随后，对于GO，根据包含的基因数量将富集途径从高到低排序，并展示前3条途径。对于KEGG，选择了具有最显著富集结果的前5条途径。通过STRING在线网站（https://string-db.org）创建了一个PPI网络（相互作用分数 = 0.4），并通过“Cytoscape”（v 3.9.1）[31]展示。

2.8. 与AU富集元件相关的生物标志物筛查和相关性分析
从AREED（https://brp.kfshrc.edu.sa/ared）获取了总共4,883个与AU富集元件相关的基因（AREGs）（表S2）。为了识别同时对WYHLT处理有差异表达并且与AU富集元件介导的转录后调控功能相关的潜在生物标志物，我们将第2.6节获得的44个候选基因列表与4,883个AREGs的已整理列表进行交集。这项交集使用“VennDiagram”包（v 1.7.3）[29]完成。同时出现在两个列表中的基因被定义为ARE相关生物标志物，以便进一步分析。这种方法符合将差异表达数据与功能基因集整合以优先考虑候选生物标志物的既定生物信息学工作流程[32]。此外，为了阐明生物标志物之间的相关性，使用“psych”（v 2.1.6）[33]计算了所有样本中每个生物标志物之间的Spearman相关系数（r）（|r| > 0.3且p < 0.05）。

2.9. 功能富集分析
为了理解生物标志物在生物过程中的作用，对转录组测序数据集中的所有样本进行了基因集富集分析（GSEA）。首先，从MSigDB（https://www.gsea-msigdb.org/gsea/msigdb）获取“m2.cp.v2023.1.Mm.symbols.gmt”作为背景基因集。随后，使用“psych”（v 2.1.6）[33]计算转录组测序数据集中的生物标志物与基因之间的Spearman相关系数。然后对这些相关系数进行排序，并使用“clusterProfiler”包（v 4.7.1.003）[30]进行GSEA（p adj < 0.05）。根据p值从最小到最大对途径进行排序，并选择前10条途径进行展示。此外，为了研究生物标志物之间的潜在功能相似性，使用“OmicCircos”包（v 1.40.0）[34]进行了相关性分析。最后，使用GeneMANIA数据库（https://genemania.org/）预测与生物标志物相关的基因并探索其密切相关的功能。

2.10. 染色体定位和亚细胞分析
为了确定生物标志物在小鼠染色体上的位置，使用“RCircos”包（v 1.2.2）[35]来可视化生物标志物的染色体分布。此外，为了探索生物标志物在亚细胞内的分布，首先从Gene数据库（https://www.ncbi.nlm.nih.gov/gene/）下载生物标志物的FASTA文件。随后，使用mRNALocater数据库（http://www.csbio.sjtu.edu.cn/bioinf/mRNALocater/）进行亚细胞定位分析。

2.11. 分子调控网络的发展
为了研究调控生物标志物的分子机制，基于miRanda数据库（http://mirtoolsgallery.tech/mirtoolsgallery/node/1055）和miRDB数据库（https://mirdb.org/），在“multiMiR”包（v 0.98.0.2）[36]中获取了每个生物标志物对应的microRNAs（miRNAs）。然后，从两个数据库中选择了共享的miRNAs作为关键miRNAs。接着，基于这些关键miRNAs，分别使用StarBase数据库（https://rnasysu.com/encori/）预测了相关的lncRNAs和circRNAs，并生成了miRNA-lncRNA和miRNA-circRNA相互作用对。最后，基于上述生物标志物、miRNAs、lncRNAs和circRNAs，使用“Cytoscape”软件（v 3.9.1）[31]绘制了生物标志物-miRNA-lncRNA/circRNA调控网络。

2.12. 药物预测分析和分子对接
为了探索可能调控生物标志物的药物，使用DGIdb（http://dgidb.org/）搜索与生物标志物相关的药物。然后将这些预测的药物加载到“Cytoscape”软件中以可视化生物标志物-药物网络。此外，为了确定预测药物与生物标志物之间的相互作用，可以进行分子对接以确定最有前景的药物。首先，我们搜索了蛋白质数据库（PDB，http://www.rcsb.org）和PubChem数据库（https://pubchem.ncbi.nlm.nih.gov）以分别获取生物标志物的蛋白质结构和预测药物的结构数据。然后，使用CB-Dock2在线网站（https://cadd.labshare.cn/cb-dock2/php/index.php）为三维结构添加非极性氢原子并计算电荷，以进行分子对接模拟。对接分数低于-1.2 kcal/mol表示药物与目标的结合亲和力很高。最后，选择具有最高结合能量的分子对接结果，并使用Pymol软件进行可视化。

2.13. 生物标志物的表达水平分析和RT-qPCR
在我们的转录组测序数据集中，基于差异分析中的生物标志物表达情况，使用小提琴图（p < 0.05）展示了模型组（LC组）和干预组（低剂量组、中等剂量组和高剂量组）中生物标志物的表达结果。随后进行了RT-qPCR以确认生物标志物的表达。具体来说，使用了来自4组的20个LC肿瘤组织。使用Trozol（Ambion，美国）从20个样本中提取RNA。然后使用SureScript First-Strand cDNA合成试剂盒（Servicebio，武汉，中国）进行逆转录成cDNA。PCR的引物序列见表S3。RT-qPCR使用2xUniversal Blue SYBR Green qPCR Master Mix（Servicebio，武汉，中国）进行。M-GAPDH作为内部参考基因。使用2-ΔΔCT方法[37]确定了生物标志物的相对定量。最后，使用Graphpad Prism（v 5.0.0）[38]绘制图表并计算p值（p < 0.05）。

2.14. 统计分析
使用R（v 4.2.2）进行了统计分析。组间差异通过Wilcoxon检验（p < 0.05）进行分析。PCR实验类别之间的差异通过t检验得出。

3. 结果
3.1. LCD小鼠模型的开发与评估
使用独立的两个样本t检验（或在适当的情况下使用Wilcoxon秩和检验）分析了LC组与每个处理组之间的肿瘤体积和重量差异。使用单因素ANOVA或Kruskal-Wallis检验评估所有组之间的总体差异，随后进行事后成对比较。使用Cohen's d计算效应大小。p值< 0.05被认为是统计学上显著的。在LC动物模型中，与LC组相比，低剂量组、中等剂量组和高剂量组的小鼠体重显著下降（图1A）。更重要的是，观察到LC肿瘤组织的体积和重量都显著且剂量依赖性地下降（图1B-C，图S1A-C）。具体来说，与LC组（平均肿瘤体积：802.46 ± 60.73 mm3，平均值±标准误差）相比，高剂量组、中等剂量组和低剂量组的平均肿瘤体积分别为302.70 ± 69.83 mm3、397.98 ± 37.90 mm3和529.99 ± 45.10 mm3，分别减少了62.28%、50.41%和33.95%（图S1D）。使用独立t检验的统计分析显示，所有WYHLT处理组的肿瘤体积均显著小于LC组（高剂量组与LC组：p = 0.0013；中等剂量组与LC组：p = 0.0005；低剂量组与LC组：p = 0.0177）。效应大小通过Cohen's d量化，所有比较的效应大小都很显著（高剂量组：d = -3.045；中等剂量组：d = -3.511；低剂量组：d = -1.881；图S1E）。此外，单因素ANOVA后的事后检验确认了四个组之间的显著总体差异（Kruskal-Wallis χ2 = 17.331，p = 0.0006）。这些发现表明WYHLT以剂量依赖的方式有效抑制了LC模型中的肿瘤生长。

下载：下载高分辨率图片（2MB）
下载：下载全尺寸图片
图1. LC组、低剂量组、中等剂量组和高剂量组的体重、肿瘤体积和组织学特征的实验分析。（A）LC组、低剂量组、中等剂量组和高剂量组的体重变化。（B）LC组、低剂量组、中等剂量组和高剂量组的肿瘤体积变化。数据以平均值±标准误差表示。*p < 0.05，**p < 0.01，***p < 0.001与LC组相比（独立t检验）。（C）LC组、低剂量组、中等剂量组和高剂量组的肿瘤重量。（D）LC组、低剂量组、中等剂量组和高剂量组的肿瘤组织的苏木精和伊红（H&E）染色。（E）LC组、低剂量组、中等剂量组和高剂量组的肿瘤组织中CD68蛋白表达的免疫组化（IHC）分析。（F）LC组、低剂量组、中等剂量组和高剂量组的肿瘤组织中Ly6G蛋白表达的IHC分析。对于每个包含5个样本的组，需要实验室提供统计测试方法。所有实验数据以平均值±标准误差表示。两组之间的定量数据比较使用t检验进行，而多组之间的比较使用单因素ANOVA进行。p值< 0.05被认为是统计学上显著的；p < 0.01被认为是高度统计学上显著的；p < 0.001被认为是极度统计学上显著的。H&E染色显示LC组的癌细胞核显著增大，核质比例改变，细胞凹陷形状不规则。相比之下，低剂量组、中等剂量组和高剂量组的癌细胞数量减少，细胞形态更完整，分化程度较低（图1D）。这些发现表明WYHLT处理显著改善了LC模型中的组织发育。IHC显示，在LC组中，CD68和Ly6G蛋白均高度表达。然而，在中等剂量组和高剂量组的LC肿瘤组织中，CD68和Ly6G蛋白的水平显著降低（图1E-F）。这些结果表明，WYHLT治疗对肺癌的发展具有抑制作用。3.2. 识别出44个候选基因首先，经过过滤转录组数据后获得了高质量的读段。此外，检测数据中出色的碱基质量进一步证明了其准确性（表S4）。与参考数据集的比较显示，在所有样本的读段分布图中，外显子区域占比最高（图S2A）。同时，所有样本的基因表达水平总体分布相当一致，且样本组内的分散度相对小于组间分散度（图S2B-C）。这些发现表明转录组测序数据质量很高，适合进一步分析。差异表达分析共识别出6,484个表达差异基因（DEGs）-L（3,510个上调和2,974个下调）在低剂量组与LC组之间（图2A-B），2,735个DEGs-M（1,198个上调和1,537个下调）在中剂量组与LC组之间（图2C-D），以及1,202个DEGs-H（572个上调和630个下调）在高剂量组与LC组之间（图2E-F）。随后，3,510个DEGs-L-UP、1,198个DEGs-M-UP和572个DEGs-L-UP有重叠，同样2,974个DEGs-L-DOWN、1,537个DEGs-M-DOWN和630个DEGs-L-DOWN也有重叠（图2G-H）。这种重叠导致识别出44个候选基因，其中包含6个上调候选基因和38个下调候选基因。此外，富集分析显示，这44个候选基因与415个GO术语显著相关，包括333个生物学过程（BPs）、28个细胞组分（CCs）和54个分子功能（MFs）。显著的GO术语包括“心脏收缩”（BP）、“肌纤维”（CC）和“肌动蛋白结合”（MF）（图3A，表S5）。此外，候选基因在15个KEGG通路中显示出显著富集，包括“肌肉细胞中的细胞骨架”、“运动蛋白”等（图3B，表S6）。为了进一步了解这44个候选基因的蛋白质相互作用关系，在去除孤立蛋白后，建立了一个包含32种蛋白质之间71个互作关系的PPI网络，显示Scgb1a1与Bpifb1和Lamp3等蛋白质在网络中紧密相互作用（图3C）。下载：下载高分辨率图像（971KB）下载：下载全尺寸图像图2. 低剂量组、中剂量组、高剂量组和LC组之间差异表达基因（DEGs）的差异表达分析和重叠。（A）低剂量组与LC组之间DEGs的火山图（|log2foldchange(FC)|>1.0，p < 0.05）。（B）低剂量组与LC组之间上调和下调前10个DEGs的热图。（C）中剂量组与LC组之间DEGs的火山图（|log2FC|>1.0，p < 0.05）。（D）中剂量组与LC组之间上调和下调前10个DEGs的热图。（E）高剂量组与LC组之间DEGs的火山图（|log2FC|>1.0，p < 0.05）。（F）高剂量组与LC组之间上调和下调前10个DEGs的热图。（G）Venn图显示低剂量组、中剂量组和高剂量组与LC组之间上调DEGs的重叠。（H）Venn图显示低剂量组、中剂量组和高剂量组与LC组之间下调DEGs的重叠。火山图和热图的统计测试方法使用的是DESeq2中的Wald测试（基于负二项分布），而Venn图没有应用统计测试。每组包含五个样本。下载：下载高分辨率图像（871KB）下载：下载全尺寸图像图3. 候选基因的功能富集和蛋白质-蛋白质相互作用（PPI）网络分析。（A）候选基因的基因本体论（GO）富集分析的圆形图。该图显示了基于p值（p < 0.05）筛选出的三个最富集的术语（分别属于生物学过程-BP、细胞组分-CC和分子功能-MF）。每个扇区的半径长度对应于在该术语中富集的基因数量。每个术语的富集显著性由其p值表示，并在图中标注（或通过颜色强度表示）。（B）候选基因的京都基因组百科全书（KEGG）通路富集分析，突出显示了显著通路（p < 0.05）。（C）候选基因的PPI网络。PPI分析没有进行统计测试，仅提供了0.4的置信度评分。对于富集分析，使用的统计方法是clusterProfiler包中实现的超几何分布测试（也称为Fisher精确测试），并应用了FDR校正。分析使用了所有样本（n = 20）。3.3. 选取GREB1、MUC2、NPTX2和PPIP5K1作为生物标志物本研究最终从44个候选基因中识别出4个与AU-rich元素相关的生物标志物，即GREB1、MUC2、NPTX2和PPIP5K1（图4A）。此外，Spearman相关性分析显示MUC2和NPTX2之间存在强烈的负相关（r = ?0.57，p < 0.01），而GREB1和NPTX2之间存在显著的正面相关（r = 0.57，p < 0.01）（图4B）。为了确保研究结果的可靠性，我们通过将“sequencing_batch”作为固定效应纳入DESeq2模型（～ sequencing_batch + group）进行重新分析，以考虑样本分批测序可能引入的技术变异。补充分析确认了之前识别的四个关键生物标志物（GREB1、MUC2、NPTX2、PPIP5K1）在所有组间比较中表现出一致的表达差异方向（即与LC模型组相比，WYHLT处理后的上调/下调趋势），并仍然满足显著差异的标准（|log2FC| > 1，p < 0.05）。这表明本研究的核心发现不受测序批次的影响，结论是可靠的。下载：下载高分辨率图像（268KB）下载：下载全尺寸图像图4. 生物标志物的识别和相关性分析。（A）四个生物标志物（GREB1、MUC2、NPTX2和PPIP5K1）的识别。绿色圆圈代表与腺苷酸尿苷酸丰富元素相关的基因，共有4883个基因。紫色圆圈代表候选基因，包含44个基因。在交叉区域有4个重叠基因，占比0.1%。（B）生物标志物之间的Spearman相关性分析。相关性分析使用的统计方法是Spearman等级相关测试，包括所有样本（n=20）。3.4. 探索生物标志物可能影响肺癌进展的通路为了研究四个已识别生物标志物（GREB1、MUC2、NPTX2和PPIP5K1）涉及的潜在生物学功能和通路，正富集表示与生物标志物正相关的基因在通路中过度表达，而负富集表示与生物标志物负相关的基因过度表达。GSEA分析显示，GREB1在26个通路中显著富集，例如发育生物学（图5A，表S7），MUC2与265个生物通路密切相关，如翻译（图5B，表S8），NPTX2与55个生物通路密切相关，如细胞质核糖体蛋白（图5C，表S9），与PPIP5K1负相关的基因在mRNA剪接等通路中富集（图5D，表S10）。这些结果表明MUC2、NPTX2和PPIP5K1都与“翻译”过程密切相关，表明Wenyang Hualiu Tang可能通过调节肺癌细胞中的蛋白质合成代谢发挥其治疗效果。其中，3个生物标志物（MUC2、NPTX2和PPIP5K1）与翻译过程相关。随后，生物标志物之间的相关性分析显示，GREB1与其他生物标志物的功能相似性得分最高，表明它可能与其他基因具有功能相似性（图5E）。通过GeneMANIA分析，识别出20个与生物标志物功能相关的基因。这些基因通过7种不同的机制与生物标志物相互作用，包括补体结合、调理素结合等（图5F）。这些分析识别了生物标志物及其相关通路，揭示了它们在肺癌进展中的潜在作用。下载：下载高分辨率图像（1MB）下载：下载全尺寸图像图5. 基因集富集分析（GSEA）和生物标志物的相关通路。（A）GREB1的GSEA；（B）MUC2的GSEA；（C）NPTX2的GSEA；（D）PPIP5K1的GSEA；（E）生物标志物之间的功能相似性分析。（F）生物标志物的GeneMANIA分析。GSEA采用预排序的基因集富集分析（GSEA）方法，通过计算每个枢纽基因与基因组中所有其他基因之间的Spearman等级相关系数来进行排序。基于此，对基因进行排名，并使用排列测试来评估排名列表顶部或底部特定功能基因集的富集显著性，从而识别与枢纽基因表达模式显著相关的生物通路。相似性分析基于Wang算法使用的GO语义相似性度量。该方法通过比较GO有向无环图中基因对应的GO术语的拓扑结构和语义关系来量化功能相似性。它整合了三个本体论的全面相似性——生物学过程、细胞组分和分子功能——并通过这三个维度的得分的几何平均值得出基因对的整体功能相似性得分。GeneMANIA利用高斯场分类器进行预测，预测结果使用超几何分布测试进行评估。3.5. 识别生物标志物的染色质和亚细胞定位染色质定位分析显示GREB1位于染色体12上，MUC2位于染色体7上，NPTX2位于染色体5上，PPIP5K1位于染色体2上（图6A）。这些生物标志物的染色质定位（图6A）为未来的遗传调控或生物标志物关联分析提供了基因组背景。此外，亚细胞定位分析为这些生物标志物的功能研究提供了新的方向。GREB1和PPIP5K1主要位于细胞核中，而MUC2和NPTX2主要位于细胞质中（图6B）。下载：下载高分辨率图像（281KB）下载：下载全尺寸图像图6. 生物标志物的染色质和亚细胞定位。（A）GREB1、MUC2、NPTX2和PPIP5K1的染色质定位。（B）GREB1、MUC2、NPTX2和PPIP5K1的亚细胞定位。3.6. 探索生物标志物的调控机制随后，为了探索这些生物标志物的潜在调控机制，我们构建了一个生物标志物-miRNA-lncRNA/circRNA调控网络。该网络的核心组成部分如下（表S11，图7）：(1)生物标志物及其靶向的miRNA：预测了这三个生物标志物（PPIP5K1、GREB1、NPTX2）共7个关键miRNA。其中，5个miRNA靶向PPIP5K1（mmu-miR-743a-3p、mmu-miR-122-5p、mmu-miR-761、mmu-miR-450b-3p、mmu-miR-743b-3p），1个miRNA靶向GREB1（mmu-miR-345-3p），1个miRNA靶向NPTX2（mmu-miR-96-5p）。(2)竞争性内源性RNA（ceRNA）相互作用：基于上述miRNA，我们进一步预测了它们的上游调控lncRNA和circRNA。该网络包括总共16个lncRNA和10个circRNA。(3)关键枢纽分子：值得注意的是，一个lncRNA（Malat1）同时靶向4个miRNA（mmu-miR-345-3p、mmu-miR-743a-3p、mmu-miR-743b-3p、mmu-miR-96-5p），表明Malat1可能作为一个核心ceRNA，通过调节这些miRNA来调控下游生物标志物的表达。此外，一个circRNA（Etv3）与两个miRNA（mmu-miR-450b-3p和mmu-miR-761）相关。下载：下载高分辨率图像（473KB）下载：下载全尺寸图像图7. 生物标志物-miRNA-lncRNA/circRNA调控网络。这些发现揭示了一个涉及miRNA、lncRNA和circRNA的复杂调控网络，这些因子可能共同影响肺癌的进展。3.7. 针对生物标志物的多种药物用于LC治疗鉴于上述生物标志物在肺癌中的潜在关键作用，我们进一步利用药物数据库预测可能针对这些标志物的潜在治疗剂，旨在为转化研究提供候选化合物。随后，我们构建了一个生物标志物-药物网络，包括7种药物（氟尿嘧啶、GPI-0100、右旋糖酐硫酸钠、化学预防剂、PD-98059、重组干扰素和脱氧胞苷）针对MUC2，以及一种药物（zinpentraxin alfa）针对NPTX2（图8A）。分子对接显示PD-98059与MUC2蛋白的结合亲和力最高（-7.8 kcal/mol），表明其作为针对MUC2的先导化合物具有很高的理论可行性。如分子对接结果所示，MUC2与3种药物（脱氧胞苷、氟尿嘧啶和PD-98059）的对接得分均低于-1.2 kcal/mol，表明生物标志物与这些药物之间具有高亲和力，其中MUC2与PD-98059的结合能量最高（结合能量 = -7.8 kcal/mol）（表1，图8B）。下载：下载高分辨率图像（371KB）下载：下载全尺寸图像图8. 生物标志物-药物相互作用网络和分子对接。（A）生物标志物-药物网络。（B）MUC2与三种药物（脱氧胞苷、氟尿嘧啶、PD-98059）的分子对接结果。表1. 生物标志物与药物之间的结合亲和力。genedrugscore (kcal/mol)MUC2DECITABINE-6.6MUC2FLUOROURACIL-5.0MUC2PD-98059-7.83.8. 在LC动物模型中验证生物标志物的表达水平在我们的转录组测序数据集中，所有3个干预组（低剂量组、中剂量组和高剂量组）的PPIP5K1和MUC2表达水平均显著高于LC组（p < 0.05）。相比之下，GREB1和NPTX2在所有3个干预组中的表达水平显著降低（p < 0.05）（图9A）。此外，对动物模型中的LC组织样本进行RT-PCR分析证实了这些生物标志物的表达（p < 0.05）。大多数基因在不同组中的表达趋势与生物信息学预测一致。不幸的是，低剂量组表现出较高的MUC2表达和较低的NPTX2表达，但这种差异并不显著（图9B）。下载：下载高分辨率图像（806KB）下载：下载全尺寸图像图9. 药物治疗组中生物标志物的表达分析。（A）与LC组相比，低剂量、中等剂量和高剂量干预组中PPIP5K1、MUC2、GREB1和NPTX2的表达水平存在显著差异（p < 0.05）。（B）对动物模型中的LC组织样本进行RT-PCR验证生物标志物的表达。实验室被要求使用Prism GraphPad进行统计分析。所有实验数据均表示为平均值±标准差（Mean ± SD）。组间测量数据的比较使用t检验进行，而多组间测量数据的比较则使用单因素方差分析（ANOVA）进行。p值<0.05被认为是统计学上显著的，p值<0.01被认为是高度统计学上显著的，p值<0.001被认为是极高度统计学上显著的。4. 讨论本研究首次系统地研究了传统中药化合物（文阳淮柳汤）在肺癌干预模型系统中ARE相关基因的表达变化和调控网络。这标志着将现代分子生物学机制——ARE介导的转录后调控引入到传统中药化合物功效的解释中，建立了新的研究联系。在本研究的初步阶段，成功建立了用WYHLT干预的LC动物模型。低剂量、中等剂量和高剂量药物干预组与模型组进行了详细的差异分析，共发现了44个候选基因。这些候选基因随后与4883个AREGs进行了交叉分析，最终确定了四个生物标志物：GREB1、MUC2、NPTX2和PPIP5K1。通过RT-qPCR进行了定量检测，得到的表达趋势与先前的研究结果一致。此外，基于转录组数据全面分析了AREGs在LC中的调控机制。这些生物标志物的发现无疑为肺癌研究开辟了新的方向，并具有重要的潜在价值。我们的研究发现，通过确定四种特定的AREGs（GREB1、MUC2、NPTX2和PPIP5K1）作为WYHLT发挥作用的关键介质，我们加深了对肺癌发病机制和传统中药作用机制的理解。这扩展了AREGs已知的功能，将其相关性从CRC和肝细胞癌（HCC）等领域扩展到肺癌的药物可调节治疗。文献支持这些生物标志物在癌症中的重要性。例如，研究表明GREB1突变可能介导对顺铂治疗的初始耐药性，并影响LUAD患者的临床预后[39]。MUC2是一种编码黏蛋白的基因。黏蛋白是高分子量糖蛋白，由多糖和蛋白质组成，在人体各种黏膜表面大量存在。其中，黏蛋白（MUC1 - MUC24）是一类参与细胞信号传导和屏障保护的糖蛋白，与多种恶性肿瘤的进展有关，包括胃癌、胰腺癌、卵巢癌和肺癌[40]。MUC2在所有原发性肺癌中均为阴性，但在来自其他器官的黏液腺癌肺转移灶中不到一半为阳性[41]。NPTX2是一种编码pentraxin相关蛋白NPTX2的基因，属于pentraxin家族，它在神经突触的形成、功能和可塑性中起着关键作用[42]。越来越多的证据表明，NPTX2在不同类型的肿瘤中可能作为致癌基因或肿瘤抑制基因发挥作用。例如，与对照组织相比，NPTX2在CRC中显著上调，在胰腺癌中通常下调。较高的NPTX2表达水平会加速CRC的进展，并预示着CRC患者的不良预后[43][44]。PPIP5K1（肌醇五磷酸2-激酶1）是一种编码酶的基因，与肌醇磷脂代谢密切相关。许多研究表明，肿瘤细胞中肌醇磷酸代谢的异常往往与信号传导失调有关。值得注意的是，肌醇焦磷酸2激酶PPIP5K是一个潜在的癌症治疗靶点[45][46]。通过miRNA-lncRNA/circRNA调控网络分析，发现三个生物标志物（PPIP5K1、GREB1和NPTX2）预测了7个miRNAs、16个lncRNAs和10个circRNAs。具体来说，5个miRNAs（mmu-miR-122-5p、mmu-miR-450b-3p、mmu-miR-743a-3p、mmu-miR-743b-3p和mmu-miR-761）靶向PPIP5K1，1个miRNA（mmu-miR-345-3p）靶向GREB1，1个miRNA（mmu-miR-96-5p）靶向NPTX2。此外，1个lncRNA（Malat1）同时靶向4个miRNAs（mmu-miR-345-3p、mmu-miR-743a-3p、mmu-miR-743b-3p和mmu-miR-96-5p）。在肺癌细胞中，Malat1的高表达可以捕获更多的mmu-miR-743b-3p。由于大量mmu-miR-743b-3p被捕获，其对PPIP5K1的抑制作用减弱，导致PPIP5K1蛋白的表达上调。这种相关信号通路的激活促进了肺癌细胞的增殖，抑制了细胞凋亡，增强了肺癌细胞的迁移和侵袭能力，进一步加剧了肺癌的发生、发展和转移[47][48]。这一调控网络的预测表明，文阳淮柳汤可能通过缓解MALAT1对mmu-miR-743b-3p的“海绵”吸附效应来破坏ceRNA竞争机制，从而恢复这种miRNA对原癌基因PPIP5K1的抑制作用。最终抑制肺癌细胞的增殖和转移。这为理解传统中药化合物的多靶点和基于网络的调控特性提供了新的分子视角。后续研究表明，在生物标志物MUC2与药物PD-98059的分子对接结果中，MUC2具有最高的结合能量。研究表明PD-98059是一种MEK1/2抑制剂。Ras-Raf-MEK-ERK信号通路在肺癌细胞中常常异常激活。PD-98059结合到MEK1/2的活性位点，抑制其磷酸化，阻断下游ERK的激活，从而抑制肺癌细胞的增殖，将其停在特定的细胞周期阶段，降低肺癌细胞的迁移和侵袭能力，减少转移风险[49][50][51]。我们的预测将MUC2与MEK抑制剂PD-98059联系起来，表明MUC2可能参与调节这一关键的促存活信号通路。这为将传统中药的功效机制研究与现代靶向药物开发结合起来提供了新的交叉点。除了阐明潜在的作用机制外，我们综合的分析流程——从生物标志物鉴定到调控网络构建和药物预测——展示了新型分子见解如何重塑诊断和治疗框架，正如系统肿瘤学评论中所强调的那样。Malat1-miR-743b-3p-PPIP5K1调控轴以及MUC2与PD-98059之间的高亲和力相互作用不仅为WYHLT的效果提供了可验证的假设，还为未来开发RNA靶向疗法（例如，靶向特定的miRNAs或PPIP5K1）或与现有酪氨酸激酶抑制剂的联合策略提供了候选靶点。这种转化视角强调了将传统中药研究与现代RNA生物学结合以发现复杂疾病网络中可操作靶点的重要价值。结合RT-qPCR的结果，尽管四个关键生物标志物的表达趋势与先前的研究一致，但由于实验中使用的动物样本量有限，定量结果不太令人满意。主要限制不容忽视，如潜在的数据噪声、由于算法复杂性导致的可解释性差以及假阳性和假阴性结果的发生。此外，鉴于生物系统的复杂性和多样性，结果必须通过临床试验来验证其真实性和可靠性。总体而言，本研究为更深入地理解LC的发病机制和诊断模型提供了坚实的理论基础和实验指导，并为未来的临床实践和基础研究提供了重要参考。在后续工作中，我们将继续关注这些生物标志物在LC中的作用机制，为临床药物的开发提供有力支持。5. 结论总之，本研究为更深入地理解肺癌的发病机制提供了新的理论基础。确定的四个生物标志物（GREB1、MUC2、NPTX2和PPIP5K1）为肺癌的精确诊断提供了潜在靶点。展望未来，我们计划验证这些标志物在人类肺癌 tissue样本中的表达和临床意义，并进一步阐明文阳淮柳汤通过调节这些ARE相关基因来发挥抗肿瘤作用的具体分子途径，从而促进这项研究的临床转化。伦理批准（动物）该研究获得了南昌大学第一附属医院医学伦理委员会的批准，并按照《赫尔辛基宣言》进行。伦理批准编号：NO. SYXK2021-0003。财务支持我们衷心感谢南昌大学第一附属医院未来疾病治疗中心的支持，以及全职人才引进研究启动基金（NO.RSC-0015）的资助。数据可用性。本研究生成的数据包含在本文的图中。如需获取本研究生成的数据，可联系相应作者。作者贡献声明Wen-xin Li：写作——审阅与编辑、写作——原始草案、可视化、验证、软件、方法学、调查、正式分析、数据管理、概念化。Teng-yu Wang：监督、项目管理、资金获取、正式分析、数据管理、概念化。Hui-ting Wu：写作——审阅与编辑、写作——原始草案、可视化、监督、软件、项目管理、资金获取。Ming-feng Xiong：可视化、验证、监督、软件、资源管理、项目管理、资金获取、概念化。

热点排行