《Frontiers in Bioinformatics》:Label-free TIMING: an efficient, reliable and scalable AI workflow for automated profiling of cell-cell interaction behaviors in nanowell arrays
编辑推荐:
本文综述了无标记TIMING(LF-TIMING)工作流,它利用纳米孔阵列的细胞约束和时域一致性,基于相差显微镜图像实现了高精度的细胞分割、追踪、分类和凋亡检测。该工作流克服了依赖荧光标记的传统方法在光毒性、光漂白和成像时长上的限制,为免疫学、免疫治疗和传染病研究中的活细胞动态分析提供了高效可靠的解决方案,其准确性与基于荧光的方法相当。
在生命科学研究,尤其是在免疫学和免疫治疗领域,对活细胞间动态相互作用的解析至关重要。传统上,研究者依赖于纳米孔网格时序成像(TIMING)技术,该技术能够以单细胞分辨率对免疫细胞与靶细胞间的相互作用进行动态分析。然而,标准TIMING工作流依赖于荧光标记来实现自动化的细胞分类、分割和追踪,这不仅会引入染料伪影、增加光毒性并限制成像时长,还占用了宝贵的荧光通道,限制了可研究的分子特征范围。为了突破这些瓶颈,研究人员开发了一种名为“无标记TIMING”(LF-TIMING)的新型AI工作流。
LF-TIMING的核心挑战在于,仅使用相差显微镜图像完成一系列复杂的计算机视觉任务,其准确性需与基于荧光的金标准媲美。这些任务包括精确的细胞分割、可靠的细胞追踪、准确的细胞类型分类以及及时的凋亡检测。如图1所示,无标记分析面临诸多固有困难:在细胞接触或重叠区域边界模糊;细胞形态快速变化且缺乏稳定的外观线索,使得追踪容易发生身份交换错误;仅凭相差图像难以区分效应细胞与靶细胞;细胞死亡的形态学迹象也往往较为微妙。
2 材料与方法
2.1 细胞培养与成像
研究使用了CD19-CAR T细胞(效应细胞)和NALM6细胞(靶细胞),并分别用PKH 67和PKH 26进行荧光标记(用于生成训练和验证的真实数据)。细胞被顺序加载到含有数千个纳升级容量孔(纳米孔)的芯片阵列上,并在37°C、5% CO2条件下,使用配备20×/0.8 NA物镜的Carl Zeiss Axio Observer显微镜,以5分钟间隔成像6小时。每个视野包含大面积的纳米孔阵列,通过一个Faster R-CNN检测器定位单个孔,将其转换为以孔为中心的视频序列,以便进行下游分析。
2.2 无标记重叠细胞分割网络(LOCSNET)
为了应对无标记图像对比度低、光照不均、存在光晕伪影以及细胞频繁重叠的挑战,研究团队在Mask R-CNN的基础上进行了创新,提出了LOCSNET。传统的实例分割模型在细胞紧密接触时容易发生合并或分割错误。LOCSNET通过引入三个并行的掩码头来显式地建模细胞的重叠模式:互补掩码头预测细胞可见的非重叠部分;重叠掩码头专门预测两个细胞交叠的像素区域;而全掩码头则结合前两者的特征,输出每个细胞的完整边界。这种设计使得模型能够“理解”重叠区域的归属,从而在训练数据有限的情况下也能更准确地分离相互接触的细胞。其损失函数LLOCSNET在标准Mask R-CNN的回归损失Lreg、分类损失Lcls基础上,使用了由这三个新掩码头构成的复合掩模损失Lmask。网络架构示意图可参见图2。与通用模型如Cellpose 2.0、SAM2等相比,LOCSNET针对TIMING数据中细胞重叠的场景进行了专门优化,即使在小规模训练集上也展现了更高的数据效率和分割精度。
2.3 面向纳米孔视频的全局最优约束细胞追踪
可靠的细胞追踪对于量化细胞接触、迁移动态和凋亡事件至关重要。TIMING的低帧率(3-7分钟/帧)和大范围的细胞位移使得传统视频追踪方法失效。研究团队利用纳米孔物理限制所保证的细胞数量随时间基本恒定(除非发生分裂或凋亡)这一关键约束,设计了一个三步骤的追踪策略。
第一步,生成初始的帧间关联矩阵。通过匈牙利算法,在每对连续帧之间寻找最优的N个匹配(N为该孔的细胞数量),其关联成本综合了细胞质心位移、短时速度一致性、掩模交并比(IoU)以及针对接触后分离可能引发身份交换的惩罚项。
第二步,预测缺失的细胞分割。通过分析步骤一得到的初步轨迹,检测细胞数量少于N的帧,并基于细胞速度在时间上一致的假设,通过求解一个凸优化问题来插值预测缺失细胞的质心位置,填补短暂的检测间隙。
第三步,基于全局优化的追踪分配协调。通过一个序列级的凸优化,对初步轨迹进行精细化,该优化平衡了轨迹平滑性(最小化速度和加速度变化)与对步骤二所得插值质心的拟合程度,从而抑制抖动,并减少在短暂遮挡附近产生的身份切换错误。这种全局优化方法显著提升了在拥挤和接触频繁的纳米孔中追踪的准确性和鲁棒性。
2.4 时域一致的无标记细胞类型识别
仅从相差图像区分效应细胞(如CAR-T细胞)和靶细胞(如NALM6细胞)极具挑战性,因为形态学线索非常微弱。为此,研究团队采用了结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的混合模型。CNN骨干网络(如ResNet-50)负责从每一帧的细胞图像块中提取空间特征(包括纹理和形态),这些特征与从追踪质心衍生的运动描述符(如速度、方向)拼接。随后,整个时间序列的特征被送入LSTM,由其建模时序动态,并最终输出该细胞在整个轨迹上的类别标签(效应细胞或靶细胞)。这种序列级的分类框架,相比逐帧分类,能更好地利用细胞在迁移方式或稳定极化等方面的时序模式,从而提高分类的准确性。模型的训练数据通过将无标记图像序列与荧光通道标记信息对齐来获取。
2.5 时域一致的无标记凋亡检测
细胞凋亡的传统检测依赖于Annexin V等荧光标记。为了实现无标记检测,研究团队同样使用了CNN-LSTM架构,但针对凋亡过程的不可逆性进行了调整。模型被训练以识别与凋亡相关的、随时间演变的细微形态变化(如膜起泡)。训练标签来源于Annexin V荧光标记确定的凋亡起始时间。在损失函数中加入了正则化项,以惩罚预测凋亡概率随时间的向下波动,从而强制模型学习凋亡的单调性。该模型能够从相差图像序列中高精度地检测凋亡事件,并确定其发生时间。
3 实验结果
3.1 细胞分割与接触检测
在包含超过5万帧、约12万个细胞实例的测试集上评估了LOCSNET的性能。通用模型Cellpose和SAM2即使在微调后,在TIMING的相差图像上也表现不佳,平均交并比(mIoU)分别为0.5±0.3和0.8±0.1。标准的Mask R-CNN获得0.7±0.2的mIoU。而LOCSNET在仅使用240个视频训练时(v1),mIoU就达到了0.8±0.2,优于基线模型。随着训练数据增加至1000个视频(v3),LOCSNET的性能提升至0.9±0.1,如图3和表1所示。其优势在于对重叠区域的显式建模,使得在数据有限时也能获得良好性能,并能在拥挤的纳米孔(如2个效应细胞:2个靶细胞)中保持高分割精度(mIoU 0.90±0.03)。在接触检测方面,LF-TIMING工作流达到了0.9的整体准确率,与基于荧光的方法相当。
3.2 无标记纳米孔约束细胞追踪性能
在包含252个不同效应-靶细胞比例纳米孔的测试集上,使用多目标追踪准确度(MOTA)评估了追踪性能。在简单的1E:1T条件下,平均MOTA为1.00±0.00,近乎完美。在更拥挤的条件下,如2E:2T,平均MOTA仍保持在0.94±0.04的高水平,如图5所示。这证明了三步骤追踪策略的有效性。追踪失败主要发生在持续超过两帧的长时间遮挡期间,或当分割本身出现严重错误(如细胞合并)时。
3.3 无标记细胞类型识别
通过5折交叉验证评估了CNN-LSTM细胞分类器的性能。在三种ResNet骨干网络(18, 34, 50)中,较浅的ResNet-18表现最佳,平均验证曲线下面积(AUC)最高,且在交叉验证中展现了最稳定的性能(准确率86%±1%),如图6和表2所示。这表明,对于当前任务,适中的模型复杂度在有限的标注数据下能更好地平衡表征能力和泛化性,避免了更深网络的过拟合风险。
综上所述,这项研究提出的LF-TIMING工作流成功地将TIMING分析从对荧光标记的依赖中解放出来。通过集成LOCSNET、基于约束的全局优化追踪以及CNN-LSTM时空分类器等先进深度学习模型,并巧妙利用纳米孔的空间限制特性,实现了仅从相差显微图像中自动化、高通量、高精度地解析细胞间相互作用动态。该方法显著降低了光毒性,延长了活细胞成像时间,并释放了荧光通道用于研究其他功能报告分子,为免疫学、癌症免疫治疗和传染病研究提供了一个更强大、更灵活的工具。