精确、快速且自动化的凝胶定量分析,基于YOLO11实例分割技术实现

《Analytica Chimica Acta》:Precise, Fast, and Automated Gel Quantification Powered by YOLO11 Instance Segmentation

【字体: 时间:2026年02月27日 来源:Analytica Chimica Acta 6

编辑推荐:

  基于YOLO11n的自动化凝胶电泳分析框架实现了像素级分割,解决了传统方法依赖几何假设和人工干预的局限性,在保持高精度的同时(R2=0.9964,CV=3.3%)将处理速度提升至秒级。

  
Youli Tian|Weichen Ji|Luobing Wang|Weiwen Liu|Qiang Zhang|Yuxing Wang|Chengxi Cao
上海交通大学自动化与智能感知学院,中国上海200240

摘要

背景

凝胶电泳是分析化学和蛋白质组学的核心技术,但下游的图像分析仍是一个瓶颈,受到人工劳动和主观性的限制。传统的基于轮廓的密度测量依赖于严格的泳道划分和几何假设,这使得它容易受到诸如泳道变形、微笑效应和复杂背景等常见伪影的影响。尽管深度学习提供了自动化的潜力,但现有的解决方案往往缺乏精确的量化能力或需要大量的预处理。为了解决这些限制,我们提出了一个基于轻量级YOLO11n架构的端到端、完全自动化的条带分割框架。

结果

该模型在150张内在荧光成像图像上进行了训练,并在一个小型异构数据集(n=50)上进行了微调,利用迁移学习策略确保了Coomassie Brilliant Blue、银染色和荧光染色的兼容性。通过处理高分辨率输入(1280像素)而无需预处理,YOLO11-Seg模型的分割mAP50达到了0.947,且延迟时间仅为3.1毫秒,显著优于U-Net和基于轮廓的方法在分辨微弱和变形条带方面的表现。关键的是,该方法使用像素级掩码而不是边界框进行量化,有效地排除了背景噪声。该方法显示了积分强度与蛋白质浓度之间的优异线性(R2=0.9964),并且变异性较低(CV低至3.3%)。将其集成到自定义的“Seg Lab”软件中后,每个凝胶的分析和可视化时间从4分钟(手动工作流程)缩短到了约1秒。

意义

本研究提出了一种稳健、客观且高通量的替代传统密度测量的方法。通过消除对泳道划分和人工干预的依赖,该框架解决了分析速度和量化精度之间的长期矛盾。其轻量级设计和经过验证的跨染色通用性使其成为常规大规模蛋白质组学和分析化学工作流程中的实用且易于使用的工具。

引言

凝胶电泳仍然是分析化学和蛋白质组学中用于分离、鉴定和纯化大分子的基石技术[1]。各种可视化化学方法——如Coomassie Brilliant Blue(CBB)、银染色和荧光染料——将分离结果转换为凝胶图像,从而为生物学解释和定量分析提供基础[2]、[3]、[4]、[5]。虽然湿实验室协议高度标准化,但从凝胶图像中提取定量信息仍然是主要瓶颈。实际上,条带检测和量化通常通过手动注释或半自动化软件进行,这引入了主观性,限制了通量,并成为现代大规模研究的关键限制。
为了减轻人工劳动,已经开发了几种自动化的条带检测方法[6]、[7]、[8]、[9]、[10]。大多数传统流程依赖于沿凝胶图像的x轴和/或y轴投影的强度轮廓,然后应用基于规则的启发式方法来定位泳道和条带。这种密度测量范式隐含地假设了直泳道和大致水平的条带,而这经常被真实的电泳伪影(例如微笑效应、泳道弯曲和局部变形)所打破。在这种非理想条件下,从投影轮廓派生的刚性矩形感兴趣区域(ROI)可能不符合真实的条带形态,导致信号截断或背景污染。尽管存在几何校正和泳道跟踪算法,但它们通常需要针对图像进行参数调整和用户干预,从而削弱了自动化并重新引入了主观性[11]、[12]、[13]。此外,低信噪比(SNR)数据和复杂背景通常需要预处理(背景减除、滤波等)来稳定轮廓分析。这些步骤可能会扭曲潜在的强度分布——特别是对于微弱、对比度低的条带——从而影响量化准确性并增加假阴性的风险[14]、[15]。最后,基于轮廓的方法缺乏语义选择性,可能会将气泡、裂纹、灰尘或染色斑点误分类为真正的蛋白质条带,进一步降低准确性。这些限制促使人们开发出无需泳道划分或强几何假设的像素级、形态感知的方法。
深度学习(DL),特别是卷积神经网络(CNN),最近成为分析化学中复杂图像任务(包括分割和量化)的基于轮廓、规则驱动的凝胶分析的有吸引力的替代方案[16]、[17]、[18]。与依赖于直泳道和水平条带的投影/密度测量流程不同,实例分割可以直接从像素中划分每个条带,并在伪影(例如微笑效应、扩散、弯曲)破坏几何假设的情况下保持其真实形态。与此优势一致,基于DL的分割在相关生物图像应用中表现出强大的鲁棒性,例如用于彗星试验分析的全卷积网络、用于dPCR图像处理的Mask R-CNN以及用于荧光显微镜核分割的混合检测-分割策略[19]、[20]、[21]。总体而言,这些研究表明DL模型可以直接从原始数据中学习出有区分性的表示,并且通常比手工制作的流程更能容忍噪声、不均匀背景和复杂结构——使它们非常适合处理具有挑战性的凝胶图像。
受到基于轮廓的密度测量局限性和DL分割优势的启发,我们提出了一个基于最先进的YOLO11实例分割架构的端到端条带分析框架[22]。我们对各种YOLO版本和模型规模进行了系统评估,并确定高分辨率输入(1280像素)对于分辨微量蛋白质条带至关重要。为了平衡灵敏度和速度,我们发现轻量级的YOLO11n(Nano)架构提供了最佳的折中方案。我们的基准测试表明,这种精简的架构在提取条带特征的同时,减少了大型模型在有限凝胶数据集上过拟合的风险。所得模型直接从原始凝胶中分割条带,无需泳道划分,并通过分割后的强度积分支持定量读数。我们进一步通过使用涵盖多种染色模式的小型额外数据集进行微调来证明其通用性。总体而言,这项工作旨在为蛋白质组学和分析化学中的凝胶图像分析提供更快、更客观和更稳健的解决方案。

实验和方法

化学试剂。30%的丙烯酰胺和双丙烯酰胺(Acr-Bis,29:1)溶液、甘氨酸(Gly)、牛血清白蛋白(BSA)、TrueColor?双色预染蛋白质标记物(10–180 kDa)和非预染蛋白质标记物(14.4–116.0 kDa),以及BeyoGel? Plus预制PAGE凝胶(Tris-Gly,4%–20%梯度,10孔)均来自上海比云天生物技术有限公司(中国上海)。过硫酸铵(APS)、四甲基乙烯二胺(TEMED)、1.5 mol/L Tris-HCl缓冲液(pH 8.8)等。

设备和实验

提出的工作流程和架构。本研究的整体框架如图1所示,包括两个不同的阶段:模型开发流程(图1A)和端到端推理工作流程(图1B)。如图1A所示,开发过程从图像采集开始,直接从IFI-PAGE设备捕获原始IFI凝胶图像。为了监督深度学习模型,我们建立了一个严格的标记过程:专家化学家手动注释了

模型选择和性能评估

我们选择了分割后的强度积分,以最小化与基于帧的量化相关的系统误差。如补充图S1所示,基于ROI的积分不可避免地会将背景噪声和非特异性染色计为信号,这可能会主导弱条带的测量强度。基于掩码的积分将测量限制在条带像素上,从而提高了准确性和鲁棒性,特别是对于低强度条带。
为了确定最佳

讨论

本研究表明,YOLO11-Seg通过用像素级条带掩码替代依赖于泳道/轮廓的程序,实现了更稳健的凝胶量化工作流程。与基于ROI/帧的积分相比,基于掩码的积分更好地抑制了背景污染——特别是对于弱条带——因为它将强度总和限制在条带像素上,而不是混合周围的噪声。从定量上看,自动化结果与基于ImageJ的测量结果高度一致

结论

本研究介绍了一个基于轻量级YOLO11n架构的稳健、端到端的凝胶分析框架,它用精确的像素级实例分割替代了传统的依赖于泳道的密度测量。通过严格排除背景伪影,该方法实现了出色的校准线性(R2=0.9964),显著优于手动工作流程。借助迁移学习策略实现跨染色的兼容性,并部署在用户友好的“Seg Lab”软件中,

CRediT作者贡献声明

Qiang Zhang:撰写——审阅与编辑、验证、监督、软件、资源。Yuxing Wang:撰写——审阅与编辑、可视化、验证、软件、形式分析、概念化。Weiwen Liu:验证、软件、方法学、调查、形式分析。Youli Tian:撰写——原始草稿、验证、项目管理、方法学、调查、资金获取、形式分析、数据管理、概念化。Weichen Ji:撰写——原始草稿,

注释

作者声明没有竞争性财务利益。

利益冲突声明

? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

我们感谢国家自然科学基金(批准编号:22574099、22104082和22074091)、中国国家生物制药技术创新中心的“开放竞争选拔最佳候选人”关键技术计划(授权编号:NCTIB2023XB03002)以及CPSF的博士后奖学金计划(批准编号:GZC20241027)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号