综述：深度学习驱动的荧光成像去噪方法

《Interdisciplinary Medicine》：Deep learning-driven methods for fluorescence imaging denoising

【字体：大中小】 时间：2026年03月21日 来源：Interdisciplinary Medicine 13.6

编辑推荐：

　　这篇综述系统梳理了深度学习驱动荧光成像去噪的前沿进展。文章聚焦在光子受限条件下，如何通过有监督、无监督、零样本及混合学习等先进架构，有效提升信噪比(SNR)，从而增强活细胞成像可靠性及神经机制分析精度，为阐明动态生物过程、加速精准医学奠定基础。

在生命科学的前沿探索中，荧光成像技术如同照亮微观世界的探照灯，是观测活体组织与亚细胞结构动态过程的核心工具。然而，这道“光”面临着固有挑战：为获得清晰图像而增强激发光，会因光毒性与光漂白损伤样品；降低光强虽保护了样本，却引入了大量泊松-高斯混合噪声，导致图像信噪比(SNR)显著下降。传统去噪方法受限于僵化的先验假设，难以应对复杂动态的体内成像噪声。深度学习，凭借其强大的特征提取与非线性建模能力，正在成为破解现代成像系统“光子效率悖论”的核心方法论，推动计算显微术迈向新范式。

1 引言

深度学习在生物成像中展现出无可比拟的优势，其技术演进沿着从监督学习到无监督学习，最终迈向零样本学习策略的路径发展。监督学习方法通过从噪声到信号的复杂映射训练，在基准测试中表现稳健，但其瓶颈在于体内成像中难以获取高质量配对数据。无监督学习方法通过探究噪声图像本身的分布特性，摆脱了对高质量标签的依赖。而零样本学习方法通过对单张图像的自适应学习，增强了模型在未知噪声分布下的泛化能力。此外，混合范式多任务学习框架通过联合优化技术，将图像重建与去噪融合，或利用超分辨率成像提升去噪效果，推动荧光成像去噪向同时提升计算智能与生物可解释性的认知范式演进。

2 基于监督学习的荧光成像去噪

在监督学习框架下，模型需要在噪声输入图像与其对应的无噪声“真值”(GT)间建立精确的非线性映射函数，这依赖于大量高SNR图像进行训练。尽管公开数据集如FMD提供了一定基础，但最优去噪仍需要针对特定任务的实验数据。因此，监督方法在成像系统和协议稳定、能持续生成高质量参考数据的场景中应用最强，为质量敏感的诊断任务提供了“金标准”。

卷积神经网络(CNN)因其独特的卷积核架构，在图像特征提取上优势显著。例如，神经成像深度学习去噪(NIDDL)方法基于增强的U-Net和Hourglass架构，在荧光成像中系统验证，其图像对比度指标显著优于传统去卷积技术，在小鼠和线虫的钙成像应用中证明了监督去噪的有效性。卷积神经网络Transformer(CNNT)则融合了CNN与Transformer的架构优势，利用3D卷积核提取空间特征，并采用时间注意力机制精准建模帧间时间相关性，在宽场、双光子和共聚焦荧光显微镜等多种成像模态中均展现有效适用性。

不同于传统监督学习在活细胞长时程成像中的标注瓶颈，MUFFLE创新性地利用了时空冗余和跨通道冗余信息。它将双视角模块集成到单分子全内反射荧光(TIRF)显微镜中，并融合双向ConvLSTM、跨通道融合和CNN，建立了一个多帧双通道高效去噪系统。在极低光子预算条件下，该系统表现出卓越的去噪性能，调和了单分子F^rster共振能量转移(FRET)成像中观测时长与时间分辨率的矛盾，实现了在极低单分子荧光（每帧仅60-70个光子）条件下的长时间单分子FRET测量。

总体而言，在大规模高质量配对数据集上训练的监督学习方法，目前在噪声抑制和结构保真度上均表现优异，并在宽场、共聚焦、双光子等多种成像模态中得到广泛验证。它们为多模态成像和定量分析提供了重要支持，例如将低SNR图像重建为高保真结构数据，实现精确的形态学测量，并增强体内成像动态过程的可视化清晰度。然而，这些方法的有效性严重依赖于高质量配对数据集的获取，而这些数据在生物医学实验环境中往往成本高昂、难以系统获取。此外，模型对训练集分布之外的样本类型或噪声模式的泛化能力仍然受限。

3 基于无监督学习的荧光成像去噪

无监督学习方法的精髓在于仅需噪声图像即可完成模型训练。当前无监督去噪技术主要沿两个方向发展：在噪声数据集上训练的盲点网络（如Noise2Void）展现出强大的去噪效能；而为小样本场景设计的轻量级网络（如Self2Self）虽性能相对受限但实用性高。这种数据高效范式在无法或难以获得干净参考图像的探索性研究和临床场景中独具优势，为真实世界成像的变异性提供了灵活解决方案。

在显微成像去噪领域，无监督学习因其不依赖配对标注数据，已成为超越监督方法限制的重要进展。例如，研究者利用CNN为受激拉曼散射显微镜成像设计去噪模型，通过自适应特征提取机制实现了跨尺度生物特征重建，无需手动标注数据。DeepInterpolation则是为复杂时空数据分析而开发的非线性插值模型，在双光子钙成像、功能磁共振成像(fMRI)和体内电生理记录中表现出优异的去噪性能，但仍需大规模数据集优化模型效能。

尽管无监督方法省去了标注成本，但其特征学习常受噪声分布先验假设的制约。因此，研究者采用了自监督学习——无监督范式的增强变体，通过建立数据内部的内在联系产生监督信号，为荧光成像去噪中的特征学习开辟了更高效的路径。基于此，一系列独特算法被提出。

SN2N超越了传统的N2N准则，建立了基于空间冗余的自监督训练策略。该技术通过对角线重采样和傅里叶插值在保证通用性的同时增强了稳定性。SN2N算法在转盘共聚焦超分辨率显微镜系统SD-SIM中得到了应用，促进了高分辨率四色活细胞成像、五维(xyz-颜色-时间)长时程活细胞超分辨率成像以及延长活细胞受激发射损耗(STED)系统成像。其中，RL-SN2N可生成具有高分辨率和延长监测时间（超过3小时）的5D活细胞超分辨率成像，清晰呈现线粒体与内质网的动态相互作用，展示了自监督方法在长时程、多维度活细胞成像中的强大能力。

STRUCTN2V模型则通过实施与噪声结构一致的盲掩码机制，有效阻断了相邻像素间的信息传递，以应对噪声的空间自相关性。自监督空间冗余去噪模型SRDTrans将空间冗余采样策略引入Transformer架构，利用正交掩码从原始低SNR图像堆中提取空间相邻的子堆以创建三维训练对。该模型不受对比度机制、噪声模型、样本动力学或成像速度的限制，可轻松适应各种生物样本和不同的成像模态。DeepSeMi通过偏心盲点卷积滤波器学习图像中相邻噪声的相关性，无需干净数据参考或帧插值，从而促进了光漂白和光毒性最小化的快速、高分辨率成像。SUPPORT方法主要利用成像数据中像素值与其时空邻域间的相互依赖性，来消除电压成像数据中的泊松-高斯噪声，并在多种电压成像数据集及其他成像模态（如钙成像）中证实了其效能。

通过拆分奇偶帧，DeepCAD利用多帧时间序列图像训练网络，并采用3D U-Net架构提取时空特性。DeepCAD可将双光子钙成像中的散粒噪声降低，并将检测到的神经元数量增加52.6%，在兼顾低光毒性（低激发功率）和高质量信号（长时程观测）的同时，有效提升了神经元形态和尖峰推断的可靠性，在一定程度上突破了体内样本成像的瓶颈。研究人员进一步提出了基于DeepCAD的实时去噪深度学习网络，即DeepCAD-RT。通过构建轻量级网络，该模型在参数压缩（94%）、内存消耗降低（27倍）和推理速度提升（20倍）方面取得显著进步，在保持去噪性能的同时达到了实时去噪处理效率。该模型在多模态生物体上进行了测试，实验结果证明其可大幅提升图像质量，并显著改善荧光时间序列成像数据的SNR。

同样基于U-Net模型，自对比学习模型DEPAF集成了去噪和信号检测框架。它无需对干扰类型建模，仅需提供一个可调超参数和感兴趣的模式，即可在低SNR、强背景和高密度信号条件下的超分辨率、转录组学、钙成像等多种场景中实现高精度信号提取与去噪。该模型可在活细胞dSTORM成像中保持约30 nm的空间分辨率，并将时间分辨率从数秒压缩至76.8毫秒，实现对细胞内微管（细胞骨架波动）的追踪；同时在三维MERFISH人体胎肝组织切片中，面对强背景荧光和超高RNA密度，检测到的RNA分子数量从68,294个跃升至134,560个（增加97%），显著提升了空间转录组定量精度。

此外，由时间梯度引导的自监督去噪网络TeD，自适应地调整时间冗余强度，以准确提取每个空间位置上与结构相关的时间信息，防止运动区域被误分类为噪声。该方法使TeD能够保留细胞形态、轨迹和边缘等重要生物特征，在高度复杂和动态的场景（如神经元钙活动追踪、呼吸和心跳引起的组织微运动、血流成像）中实现高质量去噪。

无监督学习通过直接从噪声图像中学习高效表示，大大减少了对高质量标注数据的依赖，摒弃了将匹配的干净图像作为训练目标的要求。这些技术在多种先进成像模态中表现出良好的适用性。在生物医学应用中，通过克服图像噪声的固有局限，这些技术极大地提高了神经元空间定位的精度和动态信号轨迹提取的可靠性，为体内神经回路的深入检查和功能机制研究提供了关键技术支撑。然而，模型训练稳定性和收敛性仍是问题，其去噪性能在SNR要求下常常达不到监督学习的上限。无监督学习的主要价值在于其对复杂、真实的成像挑战的适应性和适用性，而这些场景中传统的“真值”难以获得。

4 基于零样本学习的荧光成像去噪

现代荧光成像去噪已从依赖配对训练数据的方法，转向采用零样本学习策略的神经网络。零样本学习技术，如Pixel2Pixel，通过对单张图像进行独立于训练数据集的适应性分析来实现去噪。其本质在于建立非局部像素库并实施像素级随机采样方法，该设计有效拆解了噪声的空间相关性，同时保持了图像非局部结构的完整性。这种方法显著减少了预处理时间，其“拍摄即处理”能力与临床和科研场景的需求高度契合，在医学图像去噪中前景广阔。这种内在的“捕获与处理”能力无需预先训练，使得零样本学习成为未来即时检验(POCT)和实时手术引导等需要对独特样本进行快速分析的关键场景的变革性工具。

零样本学习去噪技术在荧光成像领域的迅猛发展正逐步改变传统的图像处理范式。例如，研究者构建了一个基于U-Net模型的零样本去噪框架。该模型首先使用在大规模荧光强度图像上预训练的U-Net作为结构先验，然后将其嵌入到双编码器荧光寿命成像显微镜(FLIM)去噪网络中，以实现强度-寿命通道协同去噪。该框架可在包括体内斑马鱼、离体小鼠肾脏、固定NIH3T3细胞等五种真实生物样本上稳定运行，无需任何配对训练数据，其性能显著优于BM3D和预训练的DnCNN。

ZS-DeconvNet通过将3D RCAN网络设计与物理模型驱动的学习方法相结合，以无监督方式完成了同步去噪和图像锐化。该网络仅利用单个图像帧即可完成模型训练，完全独立于结构稀疏性假设，并展现出卓越的模态兼容性，可广泛应用于共聚焦、双光子和多模态结构光照明显微镜(SIM)等多种显微平台。以ZS-DeconvNet为例，零样本学习提供了独特的“即时处理”工作流程，使其非常适合资源有限的临床环境。ZS-DeconvNet有效可视化了网格蛋白有被小窝和密集的细胞骨架结构，阐明了常规技术难以检测的亚细胞中空结构，同时促进了各种亚细胞动力学的快速、长时程和超分辨率监测。该网络已在超过10种生物样本和6种成像系统中成功验证了其稳定性和可靠性，为体内超分辨率显微镜研究中因光毒性和光漂白导致的“数据获取难、训练扩展难”瓶颈提供了新的解决方案。

零样本学习通过利用图像自身的统计特性和噪声模型实现去噪，消除了对预训练数据集和先验知识的依赖，展现出优异的泛化能力和操作灵活性。该架构在双光子显微镜、共聚焦显微镜和三维宽场显微镜等成像模态中表现出稳定的性能，有效应对了临床样本的异质性和成像条件的不确定性。尽管在处理极低SNR数据的计算效率和稳定性方面仍有改进空间，但该技术为增强临床诊断应用中的泛化能力开辟了新途径。

5 基于混合范式的荧光成像去噪

荧光成像中的去噪活动经常与其他图像处理任务相互关联，包括超分辨率重建、图像分割和目标检测。近年来，研究采用多任务学习和联合优化来增强去噪过程中各项任务的性能，从而促进对低SNR显微图像的更有效处理。

例如，研究者通过用三维卷积层和跳跃连接增强U-Net，提出了ScatNet3M网络通过集成特征提取、非线性映射等深度架构实现荧光通道分类和图像高分辨率重建。">。该方法克服了传统方法对复杂光学设计和硬件修改的依赖，通过三维卷积操作实现了样本空间特征的分层提取，并通过集成跨层连接有效缓解了梯度消失问题。它在成像平台上展现出显著的多功能性，无需修改光学硬件即可计算提升现有3D荧光显微镜的成像深度。ScatNet技术与光片荧光显微镜结合，促进了果蝇胚胎深层细胞核的成像；该技术亦用于双光子显微镜，提升了小鼠大脑光子轨迹区之外神经元区域的SNR和分辨率。然而，它仍受限于显著的数据依赖性、极端散射恢复不足以及次优的计算效率。

针对特殊的成像需求，研究者提出了两种优化方法SR-REDSIM和RED-fairSIM，它们直接利用低SNR原始SIM数据，通过深度神经网络获得更优的超分辨率图像重建。残差编码解码卷积神经网络(RED-Net)架构被用于在计算重建后有效抑制SR-SIM图像中的噪声。利用像素重排的自监督去噪技术PRS-SIM，通过多模态结构光图像处理策略，实现了活细胞的长时程超分辨率成像。PRS-SIM与多种SIM成像模式兼容。通过深度学习，研究者提出DL-F³M作为一种无滤光片的光片显微镜策略，用于经济高效的简化荧光成像系统。该方法摒弃了传统的昂贵荧光滤光片组件，采用角度照明有效减轻背景噪声，并与基于MobileNetV2的荧光通道选择网络(NetFCS)及融合条件生成对抗网络等数字滤波技术协作，以获得荧光信号的精确预测和快速通道切换。实验表明，该模型在各种荧光染料浓度和样本类型中均具备卓越的信号恢复能力，其应用领域涵盖传统荧光成像，并扩展至流式细胞仪、玻片扫描仪和内窥镜等生物医学检测设备。

混合范式通过构建多任务学习框架，将图像去噪与超分辨率重建、目标分割等任务深度融合，实现了低SNR显微图像的协同增强。该架构利用联合优化策略，在去除噪声的同时显著提升了空间分辨率和结构分割精度，为复杂生物结构的定量分析提供了全面的解决方案。在未来临床应用中，这种集成方法将显著提升自动化病理玻片分析系统的性能，在肿瘤边界识别、血管网络重建等诊断任务中提供更完整的形态学信息，为精准医疗决策提供可靠的技术支持。

6 讨论与展望

当前，基于深度学习的去噪方法已显著提升了荧光成像的SNR，在复杂条件适应性和多模态数据处理能力上展现出独特优势。它在噪声建模层面优化了连续噪声抑制和扫描伪影去除，在低SNR条件下保持了稳定的特征提取，并在实时处理架构中平衡了计算效率与高重建精度。此外，深度神经网络独特的非线性映射能力不仅增强了目标定位的亚像素精度，还显著提升了对微弱痕迹分析的灵敏度。与常规方法相比，深度学习的主要优势在于其对多模态数据噪声的自适应处理能力、无监督学习范式的广泛应用以及其强大的特征空间表示能力。

尽管如此，当前方法学仍面临巨大障碍，包括沉重的计算资源需求严重限制了其在便携式设备和边缘计算节点上的部署、对标注数据的显著依赖，以及模型可解释性不足阻碍了其在关键的生物医学定量分析和临床决策中的可信应用。随着技术不断演进，未来研究可聚焦于：开发整合自监督与领域自适应的综合训练框架，以缓解因缺乏真实无噪声数据而导致的模型泛化局限；将可解释性技术系统融入模型设计、训练和评估各阶段；建立面向任务的多目标优化与轻量化工程；设计像素级协同优化架构，将去噪模块与下游任务紧密连接；促进先进多模态成像技术与深度学习去噪技术的深度协同；最终实现可解释且合规驱动的临床去噪转化。

深度学习驱动的智能去噪技术将通过算法创新与工程执行的结合，超越传统的“图像质量增强”工具。它有望发展成为关键引擎，不仅在荧光成像，更在多模态生物医学成像中开辟新的可能与范式。通过提高对复杂生物系统微观动态观测的广度、精度和定量可靠性，它将为探索精准医学的基本机制、新型疗法的转化以及个体化临床诊疗决策，提供前所未有的高质量数据洞察和强大的智能工具支持。

订阅生物通快讯

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯