《Frontiers in Bioinformatics》:Identification and bioinformatics analysis of a novel member of the lumbrokinase gene family in earthworms
编辑推荐:
本研究首次从赤子爱胜蚓中克隆出纤溶酶基因家族新成员LUKA,通过二代测序获得其全长cDNA序列,并综合运用多种生物信息学软件解析该基因及其编码蛋白的特性。系统发育分析表明LUKA属于罕见的纤溶酶类型,其独特的氨基酸位点、信号肽结构、糖基化/磷酸化修饰位点为开发新型抗血栓药物提供了新的遗传材料。
引言
作为"生态系统工程师"的蚯蚓在传统中药中被称为"地龙",其活性成分蚯蚓纤溶酶(Lumbrokinase, LK)是一种具有纤溶活性的蛋白酶群。LK能直接降解纤维蛋白原和纤维蛋白,激活纤溶酶原,同时增强组织型纤溶酶原激活剂(t-PA)活性,在心血管疾病治疗中展现重要价值。然而目前对LK基因家族尚未进行系统分类研究。
方法
研究团队从甘肃民乐县沙漠边缘的废弃农田采集赤子爱胜蚓标本,分别取带环带体前段和不带环带体后段组织进行转录组测序。通过同源序列比对方法,利用BLASTn从本地构建的UniGene序列库中筛选获得新型LK基因家族成员LUKA的编码序列。采用MEGA X、PhyloSuite等软件构建系统发育树,并运用ExpASy、SignalP5.0、TMHMM等生物信息学工具全面分析基因和蛋白特性。
结果
获得的全长cDNA序列为1233 bp,开放阅读框852 bp,编码283个氨基酸。分子式C1347H2068N360O419S18,分子量30586.48,等电点4.82。氨基酸组成中缬氨酸(10.2%)和丝氨酸(9.2%)含量较高,不稳定系数30.00,表明其为稳定蛋白。
系统发育分析显示LUKA在进化树上形成独立新分支,与已知LK序列相比存在两个特异性氨基酸变异位点(第23位G→D,第232位G→Y)。信号肽预测发现N端16个氨基酸构成信号肽,切割位点位于第20位氨基酸附近。亚细胞定位预测显示LUKA主要分布于细胞外(55.6%),而缺乏信号肽的LK序列主要分布于细胞质。
翻译后修饰分析表明:LUKA在N端30位氨基酸附近存在1个糖基化位点,丝氨酸和酪氨酸磷酸化位点遍布全序列,苏氨酸磷酸化位点主要集中于C端。通过PROSITE数据库鉴定出44-281氨基酸区域具有胰蛋白酶活性域,包含组氨酸86、天冬氨酸134和丝氨酸233三个活性位点,以及71-87、199-216、229-258三对二硫键。同源建模显示N端15个氨基酸形成指状结构,与功能域预测结果一致。
讨论
LUKA作为新型LK基因,其独特的系统发育地位和分子特征为稀有类型纤溶酶研究提供了宝贵材料。信号肽和切割位点的存在提示其具有精确的亚细胞定位机制,胞外分泌特性表明可能具有较强的纤溶活性。C端密集的磷酸化位点可能参与酶活性调控,而单一糖基化位点则为后续人源化改造提供关键靶点。研究预测的5个MHC配体(含3个强结合肽)为探索LK通过MHC途径治疗疾病开辟了新方向。
结论
本研究成功鉴定出LK基因家族新成员LUKA,通过多维度生物信息学分析揭示其作为稀有类型纤溶酶的分子特征,为抗血栓药物研发和酶作用机制研究提供了新的遗传资源和理论依据。