鸡胰岛素受体基因的特性研究:基因组结构及可变启动子调控机制
《Poultry Science》:Characterization of the Chicken Insulin Receptor Gene: Genomic Organization and Alternative Promoter Regulation
【字体:
大
中
小
】
时间:2026年05月02日
来源:Poultry Science 4.2
编辑推荐:
明楼|贾欣黄|罗浩宇|樊高|方穆|宁王
中国农业农村部鸡遗传与育种重点实验室,哈尔滨150030
摘要
胰岛素受体(INSR)在胰岛素信号通路中起着核心调节作用,对细胞生长、代谢和稳态至关重要。尽管在哺乳动物中已对其进行了广泛研究,但鸟类INSR的基因组结构和转录调
明楼|贾欣黄|罗浩宇|樊高|方穆|宁王
中国农业农村部鸡遗传与育种重点实验室,哈尔滨150030
摘要
胰岛素受体(INSR)在胰岛素信号通路中起着核心调节作用,对细胞生长、代谢和稳态至关重要。尽管在哺乳动物中已对其进行了广泛研究,但鸟类INSR的基因组结构和转录调控机制仍大多未知。本研究利用5′/3′ cDNA末端快速扩增(RACE)和RT-PCR技术鉴定了鸡的INSR基因,发现了三个替代性第一外显子(外显子1A、1B和1C)及其相关启动子。双荧光素酶报告基因实验表明,每个启动子具有不同的活性,并对胰岛素和地塞米松的反应不同。定量RT-PCR分析进一步揭示了这些转录本异构体的组织特异性表达模式,瘦型与肥型肉鸡品系之间存在显著差异。MEME基序分析显示,不同物种及鸡INSR基因的三个替代性启动子具有不同的基序结构。我们的发现表明,鸡的INSR表达由三个替代性启动子调控,这与哺乳动物模型不同。这项工作为理解鸟类胰岛素信号通路的进化差异提供了基础,并为研究鸟类胰岛素抵抗机制建立了转录框架。
引言
胰岛素信号通路是调控生长、发育和代谢稳态的关键途径(Mayer等人,2007年)。该通路的核心是胰岛素受体(INSR),这是一种跨膜糖蛋白,当胰岛素与其结合时,会激活其细胞内酪氨酸激酶结构域,从而启动下游信号级联反应(Yip等人,1988年)。INSR功能失调是胰岛素抵抗的主要驱动因素(Barazzoni等人,2018年),而胰岛素抵抗是包括2型糖尿病和心血管疾病在内的多种代谢性疾病的核心病理特征(Samuel和Shulman,2016年)。研究表明,胰岛素信号通路在调节家禽的细胞增殖、凋亡、生长、发育和脂肪沉积中起关键作用(Dong等人,2015年;Ye等人,2023年;Liu等人,2025年;Weaver等人,2025年;Wang等人,2025年)。有趣的是,鸟类具有天然的生理性胰岛素抵抗(Satoh,2021年;Sweazea,2022年),尽管其循环胰岛素浓度与哺乳动物相当,但血浆葡萄糖水平却较高(1.7至2.5倍)(SIMON J,1989年;Akiba等人,1999年)。已提出多种机制来解释这一现象,包括基因丢失(Satoh,2021年)、关键信号分子(如INSR和IRS-1)表达减少(Dupont等人,2012年)以及胰岛素信号通路内的独特负反馈调节(Dupont等人,2004年)。然而,这种适应性胰岛素抵抗的精确分子机制仍不清楚。
大量证据表明INSR功能障碍与胰岛素抵抗的发展有关。在哺乳动物中,这种关系得到了多种机制的支持,包括受体前体异常切割(Zhang等人,2021年)、内吞作用失调(Hall等人,2020年)、降解受损(Lay等人,2017年),以及已鉴定出的100多种INSR基因功能丧失突变(Takahashi等人,2010年;Pankov,2013年;Ardon等人,2014年;Jin等人,2021年;Yuan等人,2025年)。这些发现提出了一个引人注目的假设:鸟类INSR基因的进化适应性可能是其生理性胰岛素抵抗的基础。
哺乳动物的INSR基因已被充分研究,由一个启动子驱动两种主要转录本(INSR-A和INSR-B)(Seino等人,1989年;Sibley等人,1989年;Belfiore等人,2017年)。相比之下,其鸟类对应物的基因组结构和转录调控机制仍大多未知。为填补这一知识空白,我们系统地研究了鸡的INSR基因。研究发现,与哺乳动物不同,鸡的INSR基因具有更复杂的基因组结构,使用三个替代性启动子,导致转录本和蛋白质异构体更加多样化。这些发现为理解鸟类胰岛素信号通路的进化适应性提供了重要见解。此外,深入研究鸡的胰岛素信号通路和胰岛素抵抗将为家禽生产性状的遗传改良奠定理论基础。
材料与方法
伦理声明
所有动物实验均严格遵循实验室动物护理和使用指南,并获得东北农业大学动物护理和使用委员会的批准(批准编号NEAUEC20240271)。
实验动物和组织收集
本研究使用了两种不同的鸡群:东北农业大学肉鸡品系(NEAUHLF,经过选择性选育以降低腹部脂肪含量)和商业Arbor Acres(AA)肉鸡。这些鸡在标准条件下饲养,可自由获取水和饲料。饮食符合美国国家研究委员会(NRC,1994年)的家禽营养要求和《中国鸡饲料标准》(NY/T33-2004)。
为了进行基因表达分析,NEAUHLF肉鸡(每品系4只)在7周龄时被宰杀。每只鸡采集13种组织:胸肌(PM)、腿肌(LM)、心脏(H)、肝脏(L)、大脑(Cr)、脾脏(Sp)、肾脏(K)、砂囊(G)、前胃(P)、胰腺(Pa)、皮下脂肪(SF)、腹部脂肪(AF)和睾丸(Te)。对于RACE分析,从4周龄的AA肉鸡(n=5只)中采集L、PM、LM、AF、Cr和Pa组织。对于鸡INSR基因编码序列(CDS)和外显子10–11的RT-PCR扩增,从7周龄的NEAUHLF肉鸡(n=4只)和7天大的AA肉鸡胚胎(n=4只)中采集PM、LM、H、L、Cr、Sp、K、G、P、Pa、SF、AF、Te、骨髓和脊髓样本。采集前,鸡禁食12小时,称重后屠宰。组织用冰冻磷酸盐缓冲液(PBS)冲洗,迅速冷冻于液氮中,并储存在-80°C。
RNA分离和逆转录
总RNA使用TaKaRa公司的RNAiso Plus试剂按制造商说明进行分离。RNA浓度和纯度通过分光光度法(NanoPhotometer,德国慕尼黑)测定,RNA完整性通过1.5%琼脂糖凝胶电泳验证。去除基因组DNA后,使用PrimeScriptTM RT试剂盒及gDNA Eraser从1 μg总RNA合成第一链cDNA(TaKaRa,中国大连)。合成的cDNA储存在-20°C。
鸡INSR基因的克隆和测序
使用TaKaRa公司的SMARTer RACE 5′/3′ Kit进行5′和3′ RACE。根据鸡INSR参考序列XM_001233398.7设计特异性引物,分别针对外显子3(用于5′ RACE)和外显子20(用于3′ RACE)。RACE模板由4周龄AA肉鸡(n=5只)的L、PM、LM、AF、Cr和Pa组织中提取的总RNA混合而成。为了扩增全长CDS,使用针对外显子2和3的正义引物及针对外显子21的通用反向引物进行RT-PCR。为了研究潜在的外显子11同源物,使用围绕外显子10和11设计的引物进行RT-PCR。PCR产物在1.5%琼脂糖凝胶上分离,纯化后克隆到pEASY?-Blunt克隆载体(TransGen,中国北京)中,并进行Sanger测序。相对引物位置见图1A,引物序列列于表S1中。
图1. 鸡INSR基因的特征。(A) 鸡INSR基因示意图(参考序列:XM_001233398.7)及用于5′ RACE、3′ RACE和中心编码区PCR扩增的引物位置。外显子和内含子分别用黑色框和直线表示;虚线表示压缩区域。(B) 鸡INSR基因5′ RACE PCR产物的琼脂糖凝胶电泳图。星号表示非特异性条带。(C) 5′基因组区域示意图,显示三个替代性第一外显子(1A、1B、1C)及其对应的转录本异构体。弯曲箭头标出用于定量INSRa、INSRc和INSRt转录本的qPCR引物位置。箭头指向翻译起始密码子(ATG)。(D) 鸡INSR基因3′ RACE PCR产物的琼脂糖凝胶电泳图。星号表示非特异性条带。(E) 3′基因组区域示意图,显示两个替代性3′ UTR异构体(INSRa和INSRb)。终止密码子和替代性多聚腺苷酸化位点分别用深色和灰色箭头标出。核苷酸位置相对于参考序列XM_001233398的终止密码子(+1)编号。(F) 鸡INSR转录本中外显子2-21(泳道1)和3-21(泳道2)的PCR产物琼脂糖凝胶分析结果。(G) 五种预测的INSR蛋白异构体的结构域。L1/L2:第一/第二亮氨酸富集重复区;CR:纤维连接蛋白样半胱氨酸富集区;FnIII 1–3:纤维连接蛋白III型结构域1–3;TK:酪氨酸激酶结构域。
报告基因质粒构建
使用Takara Ex Premier? DNA聚合酶从基因组DNA中扩增鸡INSR基因的三个潜在启动子区域(P1、P2和P3)。扩增片段定义为:P1(相对于外显子1的ATG起始位置-3805至+1),P2(相对于外显子2的ATG起始位置-3589至+1),P3(相对于外显子3的ATG起始位置-4312至+1)。通过PCR生成每个启动子的多个5′截短突变体。所有片段使用GeneJET Gel Extraction Kit(Thermo Scientific,美国马萨诸塞州沃尔瑟姆)进行凝胶纯化,并使用ClonExpress? II One Step Cloning Kit(Vazyme,中国南京)插入pGL3-Basic荧光素酶报告基因载体(Promega,美国威斯康星州麦迪逊)。所有构建物均通过Sanger测序验证。
细胞培养
ICP2和DF1细胞系分别用Dulbecco's Modified Eagle Medium/Nutrient Mixture F-12(Gibco,美国纽约州格兰德岛)和Dulbecco's Modified Essential Medium(Gibco,美国纽约州格兰德岛)培养,添加10%胎牛血清和1%青霉素/链霉素,培养条件为37°C和5% CO2。转染前一天,将细胞接种在48孔板中,每孔加入250 μL正常培养基。
转染和双荧光素酶报告基因实验
转染后16至20小时,细胞同时转染0.3 μg的启动子报告基因构建物(或空pGL3-Basic载体作为阴性对照)和3 ng的pRL-SV40 Renilla荧光素酶载体(内部对照),使用Lipofectamine? 2000(Invitrogen,美国加利福尼亚州卡尔斯巴德)。为了测量基础启动子活性,在转染后48小时测量荧光素酶活性。对于激素刺激,在转染后16小时,细胞禁食4小时,然后分别用胰岛素(100 nmol/L;Beyotime,中国上海)或地塞米松(100 nmol/L;Solarbio,中国北京)处理8小时。荧光素酶活性使用Dual-Luciferase? Report Gene Assay System(Promega,美国威斯康星州麦迪逊)测量。萤火虫荧光素酶活性相对于Renilla荧光素酶活性进行归一化。每个实验至少重复三次。
定量实时PCR(qPCR)
使用SYBR? Green Pro Taq HS qPCR System(Accurate Biology,中国长沙)在QuantStudio? 6 Flex系统(Applied Biosystems,美国加利福尼亚州卡尔斯巴德)上进行qPCR。由于5′ UTR异构体存在重叠,设计了三组特异性引物(表S1;图1C)来定量:i) INSRa(由P1驱动的转录本),ii) INSRc(由P1和P2驱动的转录本),以及iii) INSRt(由P1、P2和P3驱动的总转录本)。TATA-box结合蛋白(TBP)作为内源性参考。每个反应重复三次,每个生物学重复三次。相对转录本丰度使用2–ΔΔCT或2–ΔCT方法计算。
生物信息学分析
使用NCBI ORF finder工具(https://www.ncbi.nlm.nih.gov/orffinder/)预测开放阅读框。蛋白质结构域使用InterPro数据库(https://www.ebi.ac.uk/interpro/)进行分析。从ChickenGTEx数据库(http://chickengtex.ic4r.org/)检索INSR位点的公开表观遗传数据。使用JASPAR(2026)数据库(https://jaspar.elixir.no/analysis)预测INSR启动子序列内的潜在转录因子结合位点。
为了进行保守基序分析和潜在转录因子(TF)结合位点预测,从NCBI数据库下载了Homo sapiens(NC_000019.10)、Mus musculus(NC_000074.7)、Rattus norvegicus(NC_086030.1)、Bos taurus(NC_037334.1)、Ovis aries(NC_056058.1)、Anas platyrhynchos(NC_092615.1)、Sus scrofa(NC_010444.4)、Anser cygnoides(NC_089899.1)和Columba livia(NC_088628.1)的INSR基因转录起始位点上游2000 bp的序列。根据NCBI注释,A. cygnoides和C. livia的INSR基因包含两个替代性第一外显子。基于基因的5?→3?方向,将这两个2000 bp序列分别命名为P1和P2。这些下载的INSR启动子序列以及本研究鉴定的鸡INSR P1、P2和P3启动子(每个2000 bp)使用MEME Suite(版本5.5.9;https://meme-suite.org/meme/tools/meme)进行序列分析。在MEME工具中,设置参数为:经典模式(用于基序发现)、DNA字母表,每个序列出现零次或一次(用于位点分布),并设置要发现的基序数量为20个。MEME预测的保守基序随后被提交到Tomtom工具(MEME套件中的一个基序比较工具)中,并与JASPAR(非冗余)DNA核心(2026)脊椎动物数据库进行比较,以识别潜在的转录因子结合位点。统计分析至少来自三个独立实验的数据以平均值±标准差表示。两组之间的差异使用双尾学生t检验进行评估。P < 0.05被认为是统计学上显著的,P < 0.01被认为非常显著。所有分析均使用GraphPad Prism 6(GraphPad Software,圣地亚哥,CA)进行。
为了阐明鸡INSR基因的转录本和基因组结构,我们进行了5′/3′ RACE和RT-PCR分析。5′ RACE产生了八个不同的片段(长度从100到3000 bp不等;图1B),其中六个来源于外显子3,具有不同的5′末端。与基因组位点的比对确定了多个可变的转录起始位点,这些位点聚类为三个转录起始区域(TSRs)。相对于XM_001233398.7中的ATG起始密码子,这些TSRs分别位于–523/+23(外显子1上游)、+3289/+4295(外显子2上游)和+171449/+171487(外显子3上游)(图1C)。这些TSRs定义了三个替代的第一外显子:外显子1A(599 bp)、外显子1B(1197 bp)和外显子1C(315 bp),其转录起始位点是根据最长的5′ RACE产物确定的(图1C)。因此,我们将从外显子1A、1B和1C开始的转录本异构体分别命名为INSR-1A、INSR-1B和INSR-1C。
3′ RACE产生了三个片段(长度从1000到2000 bp不等;图1D)。测序确认其中两个片段包含外显子20和外显子21的5′部分,但具有不同的3′末端,而第三个片段是非特异性扩增产物。基因组比对表明鸡INSR基因有两个多聚腺苷化位点(pAs),并经历选择性多聚腺苷化,生成两个3′ UTR异构体:一个短异构体(INSRa,约900 bp)和一个长异构体(INSRb,约1.8 kb)(图1E)。这两个pAs位于末端外显子(外显子21)内。为了获得全长转录本,我们使用特定的引物对(INSR-2F/INSR-R和INSR-3F/INSR-R;图1A)进行了RT-PCR,以扩增两个重叠区域(外显子2到21和外显子3到21)。这产生了4302 bp和3713 bp的产物(图1F)。测序确认这些片段的5′和3′末端与RACE确定的序列一致,验证了转录本的完整性。
尽管哺乳动物中外显子11的可变剪接会产生两个主要的INSR异构体(INSR-A和INSR-B),但生物信息学分析未在鸡INSR基因中发现与人类外显子11同源的外显子。序列比对显示,鸡的外显子10与人类外显子10有81%的核苷酸同源性,而鸡的外显子11与人类外显子12有43%的同源性。为了确定鸡的外显子10和11之间是否存在类似于人类外显子11的隐秘外显子,我们使用该区域的引物(INSR-10F和INSR-11R)在多个成体和胚胎组织中进行了RT-PCR。始终扩增出一个129-bp的产物(这些数据未显示),并对超过100个独立克隆进行测序,确认了只有组成性剪接,从而排除了鸡中类似人类外显子11的可变剪接机制。通过组装5′ RACE、3′ RACE和中间区域PCR的产物,构建了鸡INSR的全长转录本序列。基因组比对显示,INSR基因大约覆盖36.5 kb,并产生三个主要的转录本异构体:INSR-1A(21个外显子)、INSR-1B(20个外显子)和INSR-1C(19个外显子)。所有转录本异构体都符合GT-AG剪接规则(Liu等人,2022年)。为了确定这些异构体编码的是典型的还是修饰后的受体蛋白,我们分析了它们的开放阅读框(ORF)。所有五个ORF都从位于外显子1A、1B和1C中的不同ATG开始,但共享一个共同的终止密码子(TAA)(图1E)。INSR-1A ORF编码典型的INSR蛋白,命名为INSR1(1353个氨基酸)。在外显子1B内的选择性转录起始产生了三个不同的ORF,编码三个N端截短的异构体INSR2-1(1324个氨基酸)、INSR2-2(1297个氨基酸)和INSR2-3(1225个氨基酸)。INSR-1C ORF编码一个更大幅度N端截短的异构体(1043个氨基酸),命名为INSR3(图1G)。INSR1与NCBI条目XP_001233399.3相匹配;其余四个是新的。
使用InterPro进行的结构域分析显示了不同的特征(图1G)。INSR1与哺乳动物的INSR相同,包含一个信号肽。INSR2-1和INSR2-2共享相同的蛋白质结构域,并且与INSR2-3相比,还具有一个额外的富含亮氨酸的重复域(L1)。INSR3缺乏信号肽、L1结构域和一个N端富含半胱氨酸的区域。这些差异表明可能存在异构体特异性的功能。
三个替代第一外显子的存在表明存在三个替代启动子,分别命名为P1(外显子1A上游)、P2(外显子1B上游)和P3(外显子1C上游)(图2A)。作为初步验证,我们分析了鸡肝、肌肉和脂肪组织中的公共表观遗传数据。分析显示,所有三个假定的启动子区域在所有检查的组织中都表现出DNase I高敏感性位点(图S1A、B和C)。P1区域在所有检查的组织中都显示活跃的启动子组蛋白标记(H3K27ac和H3K4me3)(Wang等人,2022年,2023年),P2和P3区域在鸡肝中也显示H3K27ac(图S1A)。此外,在所有组织中观察到所有三个启动子周围都有广泛的H3K4me1信号(Yu等人,2023年;Kubo等人,2024年)(图S1A、B和C)。这些表观遗传特征共同支持P1、P2和P3是真正的启动子。
为了验证启动子活性,我们将约4 kb的基因组片段(P1-1、P2-1和P3-1)克隆到pGL3-Basic载体中,这些片段位于外显子A、B和C的上游。对于每个启动子,通过PCR生成了一系列5′截短突变体(每步约1 kb),并克隆到pGL3-Basic载体中(图2A)。转染到ICP2和DF1细胞后,发现由P1-1、P2-1和P3-1驱动的萤光素酶活性显著高于空pGL3-Basic载体(P < 0.01;图2B、C),确认了启动子活性。P1-1表现出最强的活性,在两种细胞系中都比P2-1和P3-1高5到15倍(图2B、C)。逐步5′截短导致所有三个启动子的活性逐步增加(图2B、C)。最短的构建体(P1-4、P2-4和P3-4)表现出最高的活性,在ICP2细胞中的萤光素酶水平分别比空pGL3-Basic载体高35.1倍、7.5倍和5.6倍(图2B),在DF1细胞中分别高33.3倍、7.2倍和7.5倍(图2C)。这些结果表明,鸡INSR基因使用三个替代启动子,其中P1在测试的细胞系中最为活跃。
接下来,我们研究了胰岛素和地塞米松对这三个已识别启动子的调控作用。报告基因分析显示,胰岛素处理抑制了ICP2和DF1细胞中P1-1及其截短突变体(P1-2和P1-3)的萤光素酶活性,P1-4的活性显著降低(P < 0.05;图3A、B)。相比之下,胰岛素诱导了P2-1和P3-1活性的增加,并显著增强了P2-4和P3-4的活性(P < 0.05;图3A、B)。
与报告基因数据一致,RT-qPCR显示胰岛素显著降低了两种细胞系中INSRa(P1驱动的转录本)的内源性水平(ICP2中P < 0.05,DF1中P < 0.01;图3C和D)。尽管胰岛素刺激了P2和P3启动子的活性,但它仍然降低了INSRt(总转录本)和INSRc(P1和P2驱动的转录本)的内源性水平(ICP2中P < 0.05;图3C,DF1中P < 0.01;图3D)。所有三个转录本池都减少了大约50%(图3C和D),表明P2和P3的增强启动子活性不足以抵消P1的强烈抑制作用。DEX处理对全长启动子(P1-1、P2-1和P3-1)的萤光素酶活性没有显著影响,但显著增强了截短启动子P1-4和P2-4的活性(P < 0.05)。相比之下,P3-4的活性显示出非显著的下降趋势(P > 0.05;图4A、B)。相应地,RT-qPCR显示DEX显著增加了ICP2中INSRc的内源性水平(P < 0.01;图4C)。尽管不具有统计学意义,INSRa和INSRt的内源性水平也显示出上升趋势(P > 0.05;图4C)。在DF1细胞中,DEX没有显著改变任何转录本池的内源性水平(P > 0.05;图4D)。这些差异反应表明DEX对INSR的调控是细胞系特异性的。总之,这些发现表明P1、P2和P3受到胰岛素和DEX的不同调控。
由于三种鸡INSR转录本异构体(INSR-1A、INSR-1B和INSR-1C)的5′末端序列重叠,我们无法单独量化每个异构体。相反,我们使用三组特定的引物在7周龄NEAUHLF肉鸡的组织中量化了三个转录本池(表S1;图1C):INSRa(P1驱动的转录本,即INSR-1A)、INSRc(P1和P2驱动的转录本,即INSR-1A和INSR-1B)和INSRt(来自P1、P2和P3的总转录本,即INSR-1A、INSR-1B和INSR-1C)。比较了NEAUHLF肉鸡的瘦肉型和脂肪型品系之间的表达情况。所有三个转录本池(INSRa、INSRc和INSRt)在两种品系的所有分析组织中均可检测到。大脑(Cr)表现出最高的INSRa表达,而胰腺(Pa)表现出最高的INSRc和INSRt表达(图5)。肝脏(L)和肾脏(K)等组织也表现出所有三个转录本池的相对高水平,而脾脏(SP)表现出最低的水平(图5)。Pa:胰腺;K:肾脏;L:肝脏;H:心脏;Te:睾丸;Sp:脾脏;P:前胃;G:砂囊;Cr:大脑;PM:胸肌;LM:腿部肌肉;AF:腹部脂肪;SF:皮下脂肪。在瘦肉型和脂肪型肉鸡品系之间的差异表达分析显示,多个组织存在显著差异。INSRa在所检测的13个组织中有8个组织中表现出差异表达(K、L、H、Te、Sp、Cr、LM和SF;P < 0.05;图5A),INSRc仅在肝脏中表达(L;P < 0.05;图5B),而INSRt在5个组织中表达(K、L、P、PM和LM;P < 0.05;图5C)。鉴于INSRa、INSRc和INSRt分别由P1、P1+P2和P1+P2+P3驱动,这些结果表明这些异构体在组织间以及两种遗传品系之间存在显著差异,表明这三个不同的启动子在体内具有不同的组织特异性调控作用。
为了研究INSR基因在不同物种间的调控差异以及在家鸡中发现的三个启动子之间的差异,我们使用了MEME基序分析方法进行了跨物种基序分析。在所研究的10个物种的INSR启动子区域中,共鉴定出20个保守基序(图6)。与鸟类相比,哺乳动物的INSR启动子显示出更高的基序保守性。值得注意的是,Anser cygnoides的P1启动子和Anas platyrhynchos的启动子在基序上与哺乳动物有很高的相似性。相比之下,家鸡的三个启动子、Anser cygnoides的P2启动子以及Columbia livia的两个启动子在基序保守性方面与哺乳动物的差异较大。在家鸡的三个INSR启动子中,P1含有最多的保守基序,P3含有中等数量的保守基序,而P2含有的保守基序最少。这些基序结构的差异表明,INSR基因的转录调控在物种和启动子之间存在特异性差异。
为了进一步分析INSR启动子的调控机制,我们使用TOMTOM在线工具预测了可能的转录因子结合位点。MEME分析预测的保守基序在所有研究物种的INSR启动子区域中都存在,并且被预测能够被EVX1、EVX2和ZNF家族成员等转录因子识别。基序1在所有物种的INSR启动子区域中都存在,并被预测能够被这些转录因子结合。基序17仅存在于哺乳动物的INSR启动子和家鸡的P1启动子中,而在其他鸟类(包括家鸡的P2和P3启动子)中不存在。这种基序结构的差异表明,INSR基因的转录调控在不同物种和启动子之间存在特异性差异。
讨论:本研究首次全面描述了家鸡INSR基因的转录本和基因组结构。我们鉴定出三个不同的转录起始区域(TSRs)、三个替代性第一个外显子以及两个启动子(pAs),并发现与哺乳动物不同,家鸡INSR基因由三个不同的启动子调控。我们的分析表明,家鸡INSR基因长约36.5 kb,包含三个替代性第一个外显子(1A、1B和1C),从而产生三种转录本异构体:INSR-1A(21个外显子)、INSR-1B(20个外显子)和INSR-1C(19个外显子)。这与人类和小鼠的INSR基因不同,后者包含22个外显子和21个内含子(Seino等人,1989年;Sibley等人,1989年)。在哺乳动物中,第11外显子的可变剪接会产生两种蛋白质异构体INSR-A(不包括第11外显子)和INSR-B(包括第11外显子)(Belfiore等人,2017年;Scalia等人,2020年),这两种异构体具有不同的胰岛素信号传导特性和生物学功能(Malaguarnera等人,2022年;Li和Huang,2024年)。INSR-A/INSR-B比例的不平衡与胰岛素抵抗有关(Besic等人,2015年)。与先前的研究结果一致(Martínez-Campos等人,2013年),我们的分析证实家鸡的INSR基因缺乏第11外显子的可变剪接,表明家鸡只表达INSR-A样异构体。
本研究的一个关键发现是家鸡INSR基因的启动子结构具有多样性。与人类和小鼠的INSR基因由单一启动子调控不同(Seino等人,1989年;Sibley等人,1989年;Payankaulam等人,2019年),家鸡INSR基因由三个不同的启动子(P1、P2和P3)调控,其中两个(P2和P3)位于内含子区域内。这种替代性启动子的使用代表了基因调控的时空机制(Bracey等人,2021年;Zhang等人,2024年;Xue等人,2025年)。MEME基序分析显示,这三个家鸡INSR替代性启动子具有不同的基序结构(图6),这与它们的不同活性、激素响应性和组织特异性表达相关。值得注意的是,P1启动子在ICP2和DF1细胞中表现出最高的活性,而P2和P3则作为次要启动子发挥作用(图2B、C)。在哺乳动物中,胰岛素会抑制INSR mRNA的表达,而DEX则会增强其表达(McDonald和Goldfine,1988年;Mamula等人,1990年;Thomas等人,1996年)。我们发现家鸡的INSR P1启动子的反应也与此一致,反映了这种保守的调控模式。生物信息学分析进一步支持了这一功能保守性:P1启动子与哺乳动物的INSR启动子具有更多的保守基序(图6)。此外,与哺乳动物同源物不同,P1启动子缺乏TATA盒,但含有Forkhead box class O蛋白和TCF7L2等关键转录因子的结合位点(Araki等人,1995年;Payankaulam等人,2019年)。
替代性启动子的使用使得一个基因能够编码具有不同甚至拮抗功能的蛋白质异构体(Vacik和Raska,2017年)。尽管家鸡INSR基因不通过第11外显子的剪接产生INSR-B异构体,但我们的研究发现它通过替代性启动子和转录起始位点的选择产生了五种不同的INSR蛋白质异构体(INSR1、INSR2-1、INSR2-2、INSR2-3和INSR3)。其中,INSR1与哺乳动物的INSR具有相同的结构域,表明它们在功能上具有保守性。相比之下,其他四种异构体缺少一个或多个N端结构域,可能对INSR1具有拮抗作用,并可能导致鸟类胰岛素抵抗。鉴于胰岛素信号通路在生长、发育和代谢稳态中的核心作用,家鸡和哺乳动物在转录本和蛋白质异构体以及启动子使用上的显著差异表明,INSR基因在形成鸟类特有的特征(如高代谢率、飞行能力和胰岛素抵抗)中起着重要作用。要全面理解家鸡的胰岛素信号通路及其与胰岛素抵抗的关联,需要进一步研究这三个替代性启动子的转录调控以及这五种INSR异构体之间的功能差异。有趣的是,最新证据表明INSR可以转移到细胞核并直接调控参与胰岛素信号传导的基因的转录(Hancock等人,2019年)。因此,未来的研究应探索这些家鸡INSR异构体的潜在核内作用。
此外,我们还发现家鸡INSR基因经历了替代性多聚腺苷酸化,产生了两种3′ UTR异构体(INSRa和INSRb;图1E),这与当前数据库中注释的单一3′ UTR不同。人类INSR基因也产生两种3′ UTR异构体(Payankaulam等人,2019年),而小鼠似乎只有一种。替代性多聚腺苷酸化影响mRNA的稳定性(Komini等人,2021年;Huang等人,2025年)、翻译效率(Chen等人,2024a)、蛋白质定位和功能(Komini等人,2021年;Chen等人,2024a;b;Huang等人,2025年;Lin等人,2025年)。未来的工作需要阐明这两种3′ UTR异构体在鸟类中的功能意义。
总之,本研究阐明了家鸡INSR基因复杂的转录和基因组结构。我们发现,与哺乳动物不同,家鸡INSR基因由三个不同的启动子调控,这些启动子具有不同的活性、激素调节作用,并表现出不同的组织表达模式。这些发现首次证明了鸟类INSR基因中存在替代性启动子的使用和转录本/蛋白质异构体的多样性,为未来研究其在胰岛素信号通路和生理胰岛素抵抗中的作用提供了分子基础。这项工作还为通过胰岛素信号通路研究家禽生产性状(如生长率和腹部脂肪沉积)奠定了基础。
作者贡献声明:
Ming Lou:撰写 – 审阅与编辑、撰写 – 原始草稿、验证、数据整理。
Jiaxin Huang:正式分析。
Haoyu Luo:研究。
Fan Gao:研究。
Fang Mu:研究。
Ning Wang:撰写 – 审阅与编辑、监督、资源管理、项目管理、正式分析、概念化。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号