《Advanced Science》:An Artificial Antibody-Based Toolbox Accelerates Validation of Hidden Microproteins Encoded by the Dark Genome
编辑推荐:
本研究开发的CLAIMID工具箱,以分子印迹聚合物(MIPs)为核心,模拟人工抗体功能,结合表面增强拉曼散射(SERS)检测,为小开放阅读框(sORFs)编码的微蛋白提供了高效、超灵敏、跨尺度(单活细胞、细胞群体、组织)的验证新范式。该工具成功验证了4个预测微蛋白,并识别出3个与肿瘤(胰腺癌、乳腺癌、肝癌)相关的潜在生物标志物,为探索“暗蛋白质组”及发现疾病新靶点提供了强大工具。
1 引言
由小开放阅读框(sORFs)编码、长度小于100个氨基酸的微蛋白,长期以来因基因组注释偏见而被忽视,构成了蛋白质组研究中的一个关键盲区——“暗蛋白质组”。现有的验证方法,如质谱(MS)、免疫分析和基因编辑,在检测灵敏度、操作通用性以及繁琐的预处理步骤(如抗体生产)方面面临诸多挑战。此外,生命系统的多尺度特性(从单细胞到组织)要求对生物分子的注释不能局限于单一层次。因此,该领域迫切需要一个兼具高灵敏度、流程简化及多尺度分析能力的验证工具。
为应对这些挑战,本研究开发了一个前所未有的微蛋白验证工具箱,命名为CLAIMID。其名称源于其多功能:捕获(Capture)、标记(Labeling)、分析(Assay)、成像(IMaging)和鉴定(IDentification)。CLAIMID的核心功能依赖于分子印迹聚合物(MIPs),它是一种在模板(人工抗原)存在下,通过多种功能单体共聚合成的人工抗体。MIPs能够提供与靶标微蛋白在尺寸、形状和功能基团上互补的结合位点,从而实现高特异性的识别。一旦发生特异性识别,CLAIMID通过与表面增强拉曼散射(SERS)检测相结合,可在多个尺度输出超灵敏的信号,确认靶标的存在。MIPs的工程化适应性使得CLAIMID的应用范围涵盖单活细胞、细胞群体乃至宏观组织,实现了基于SERS的分析/成像和质谱鉴定的多重方法验证。
2 结果与讨论
2.1 潜在微蛋白的合理筛选
根据基因组位置,sORFs可分为位于长非编码RNA(lncRNAs)内部和位于信使RNA(mRNA)非翻译区(UTRs)内部两类。为广泛探索新微蛋白的多尺度景观,本研究基于核糖体测序数据,从这两类中筛选了具有编码潜力的sORFs。最终,理性选择了7个潜在微蛋白进行验证,其中包括来自lncRNA LINC00961的已知微蛋白SPAR(作为阳性对照mP1)及其他三个预测产物(mP2, mP3, mP4),来自lncRNA EBLN3P的预测产物mP5,以及来自蛋白质编码基因ZDHHC4和RNF145的5‘ UTR上游ORF(uORF)预测产物mP6和mP7。这些基因均与多种癌症的疾病进展相关,暗示了所选微蛋白可能具有的生理功能。
2.2 针对微蛋白候选物的人工抗体的合成与表征
CLAIMID的多功能以分子识别为基础。作为性能可媲美天然抗体的人工抗体,MIPs处于CLAIMID工具箱的核心节点。通过一种先进的分子印迹方法——硼酸亲和定向表面印迹与包覆(BOSIC),针对所有7个预测微蛋白的末端表位合成了MIPs。通过优化聚合反应的单体比例,所得的MIPs对相应末端表位显示出高印迹因子(IF,一般>9),意味着高效的识别能力。同时,这些优化的MIPs具有较低的交叉反应性(除mP6外均<10%)和较低的平衡解离常数(Kd,约10-9M)。与传统抗体生产相比,该方法仅需1周即可获得所需的人工抗体,且仅需约12个氨基酸的末端表位即可完成,避免了完整抗原的需求以及动物免疫等复杂步骤。MIPs的通用性使其能够被理性地工程化到多尺度、多材料结构上,从而实现后续的捕获、标记、成像、鉴定等功能。
2.3 微蛋白候选物在单活细胞中的表达谱
细胞内部错综复杂的相互作用对生物分子的特性至关重要。因此,在保留其原生微环境的单活细胞中注释微蛋白具有重要意义。为实现这一目标,CLAIMID采用了第一项工具:分别用N端和C端表位特异性MIPs功能化的微探针和纳米标签,用于在单活细胞中发现预测微蛋白。基于先前发展的等离激元免疫夹心分析法(PISA),本研究设计了一个可定制的识别与等离激元检测平台。通过自建的3D微操纵系统,利用MIP-based PISA,用微探针在单活细胞内捕获未注释的微蛋白,并通过等离激元纳米标签标记和体外超灵敏检测进行验证。
该方法展现了出色的性能。仅在N端和C端MIPs与靶标微蛋白共存时,才能形成夹心结构并产生明显的信号读数。在这种双末端识别条件下的总交叉反应性小于4%。以mP2为代表模型的结合等温线显示,检测限低至0.34 pM,具备单分子水平的检测灵敏度。通过向单个空白细胞的细胞质内微量注射mP5并进行“加标-测试”实验,证实即使存在复杂的细胞微环境干扰,该方法仍能成功检测到注入的靶标,保持了高特异性。
凭借令人满意的方法学性能,研究随后探索了这7个微蛋白候选物在多种癌细胞系(HeLa, Du145, SKOV3, HepG2, MCF7, K562)单活细胞中的表达谱。结果确认了已知微蛋白mP1(SPAR)的表达。在新发现的微蛋白中,mP2在Du145和HepG2细胞系中被发现存在,而mP3和mP4在所有测试细胞系中几乎检测不到信号。来自EBLN3P的mP5、来自ZDHHC4的mP6和来自RNF145的mP7在HepG2、MCF7和K562细胞系中产生了明显的拉曼响应,证明了它们的内源性表达。单细胞水平的表达景观图清晰地展示了不同微蛋白在不同细胞系中的表达差异。此外,PISA方法还提供了亚细胞分辨率,能够洞察微蛋白在单个细胞内的定位,例如mP5仅存在于HepG2细胞的细胞质中,而不在细胞核内。这些结果表明,CLAIMID为在单活细胞中发现和定位sORF编码的微蛋白提供了一个高效工具,这一以往缺失的视角为后续鉴定和深入的功能探索提供了新见解。
2.4 细胞群体中微蛋白的亲和纯化与验证
细胞群体的平均结果对微蛋白验证同样关键。以mP5为代表,在细胞裂解液中进行的加标-测试实验进一步证实了方法在复杂基质中的高特异性。通过质粒转染过表达mP5,并通过起始密码子突变抑制其表达,生物学验证实验表明,MIP-based探针和纳米标签的特异性与常规FLAG标签方法相当,且不依赖于遗传标记,更具可扩展性。
随后,以mP2为模型微蛋白,利用MIP-based亲和纯化技术从细胞裂解液中富集和鉴定靶标微蛋白。使用表达mP2的Du145细胞和不表达的MCF7细胞分别作为模型和对照。结果表明,即使在细胞数量达到约108时,才能在细胞裂解液中检测到明显的拉曼信号,且波动较大,这可能反映了mP2较短的半衰期或快速降解。相比之下,单活细胞分析因其低体积限制和原生状态保存,在分析极低丰度微蛋白时更具优势。最终,从约2.5 × 108个Du145细胞中富集的微蛋白溶液经质谱鉴定,其谱图与化学合成的mP2标准品一致,为研究发现提供了进一步支持。这些结果表明,CLAIMID工具箱不仅能够在活细胞中快速发现微蛋白,还能在细胞群体中纯化和鉴定微蛋白。
2.5 选定微蛋白在临床组织中的靶向拉曼成像
理解蛋白质在组织中的表达谱对于定义生理或病理状态、阐明潜在肿瘤生物标志物具有重要作用。基于单细胞实验结果,本研究选取新发现的mP2、mP5和mP7作为代表性微蛋白,通过CLAIMID赋能的组织成像探索它们在癌症诊断中的潜在功能。这三位微蛋白是唯一在单细胞水平上,于对应的肿瘤细胞和正常细胞间显示出显著表达差异的候选物,提示它们可能分别作为胰腺癌、乳腺癌和肝癌的潜在生物标志物。
基于此,研究进一步利用聚乙二醇(PEG)修饰的MIPs-等离激元纳米标签进行了临床组织成像。结果显示,拉曼系统中的显微图像与苏木精-伊红(H&E)染色图像的形态高度匹配。经纳米标签标记后,只有肿瘤组织切片显示出明显的微蛋白SERS成像信号。对代表性感兴趣区域进行测试后,发现SERS成像中的差异信号与单细胞中的情况完全一致。因此,来自单细胞结果和组织拉曼成像的高度可信的诊断信息共同揭示了这3个经过测试的微蛋白是可能的肿瘤相关生物标志物,为未来的功能探索奠定了基础。值得注意的是,不同于常规方法中不可或缺的细胞来源或患者来源的肿瘤异种移植动物模型,本研究实现了在临床组织中进行直接的微蛋白靶向成像,显示了其在临床应用中的潜力。
3 结论
补充基因组和蛋白质组景观图,“认识未知”——验证sORF编码的微蛋白将是未来的关键挑战。本研究提出的人工抗体工具箱CLAIMID,在效率、灵敏度和多尺度研究方面均取得了前所未有的进展,应用于微蛋白验证。特别是单活细胞层面的表征,补全了这一缺失的环节,有望实现对“暗蛋白质组”更全面的解析。该方法卓越的特异性可媲美现有的抗体方法,确保了在各种生物基质中的适用性。借助CLAIMID快速而准确的注释,四个预测微蛋白在蛋白质水平上得到了验证,其中三个被证明与胰腺癌、乳腺癌和肝癌的肿瘤进展相关,扩大了有前景的生物标志物候选物的规模和类别。
与传统的微蛋白验证方法相比,CLAIMID显示出明显优势,包括可及的人工抗体制备、超高灵敏度、多尺度验证、快速验证和高通量操作。尽管近年来出现的单细胞蛋白质组学和纳米孔测序为多肽分析提供了广覆盖和高精度,但细胞裂解仍不可避免。从这些角度来看,CLAIMID工具箱提供了超高灵敏度(单分子水平)、高分辨率(单细胞乃至亚细胞)和蛋白质水平的直接证据,非常适合用于后续已验证微蛋白的功能探索。总之,新开发的微蛋白验证工具箱CLAIMID,作为一个推动效率、灵敏度和尺度阈值的有趣前沿,将为微蛋白生物学带来变革性的见解。