人工智能与显微成像:深度学习在微藻及蓝藻物种鉴定中的系统综述

《Alcohol》:Artificial intelligence and microscopy: A systematic review of deep learning in microalgae and cyanobacteria species identification

【字体: 时间:2026年02月19日 来源:Alcohol 2.9

编辑推荐:

  为解决传统显微技术识别水华藻类速度慢、依赖专家、效率低下的问题,本研究系统梳理了62篇将深度学习应用于微藻/蓝藻显微图像的研究。分析揭示了从分类到检测模型的演变趋势,明确了单物种与多物种图像对应的不同模型框架,并指出了成像技术、数据集和模型开发方面的关键挑战与未来方向(如半监督学习、多模态融合)。这项工作为构建更稳健、通用的自动化藻类监测模型提供了清晰的路线图,对于应对日益频发的有害藻华、保障水质与公共健康具有重要意义。

  
在世界各地的江河湖泊和海洋中,生活着一群微小的“居民”——藻类和蓝藻。它们虽然个体微小,却是水体生态系统不可或缺的初级生产者,为无数水生生物提供着食物和氧气。然而,在适宜的条件下,某些藻类和蓝藻会疯狂繁殖,形成大面积的“藻华”。这些藻华现象正随着人类活动和全球气候变化而愈发频繁和剧烈。并非所有藻华都有害,但部分有害藻类,特别是某些蓝藻,却是不折不扣的“麻烦制造者”。它们能产生多种毒素,例如微囊藻毒素(microcystins)、节球藻毒素(nodularin)、柱孢藻毒素(cylindrospermopsin)等,直接威胁人类和水生动物的健康。另一些虽然不产毒,却会产生土臭素(geosmin)和2-甲基异莰醇(MIB)等异味物质,严重影响饮用水供应和水体景观娱乐价值。此外,藻华衰亡分解时会大量消耗水中的氧气,导致水体缺氧甚至无氧,引发大规模的鱼类死亡,破坏水生生态平衡。因此,对这些有害藻类的有效监测和管理,已成为保护水质、生态系统和公众健康的关键环节。
传统的显微分析尽管是公认的藻类种群监测“金标准”,但存在耗时长、需要训练有素的分类学家、易受主观误差影响等固有缺陷。近年来,尽管出现了像荧光探针、遥感等实时监测技术,但这些方法大多只能提供间接的色素活性信息(如微藻中的叶绿素a和蓝藻中的藻蓝蛋白),无法实现物种水平的精确鉴别。这意味着,高精度识别依然离不开显微镜。幸运的是,人工智能(AI),特别是深度学习(Deep Learning)技术的兴起,为显微镜分析带来了革命性的解决方案。通过赋予计算机“看懂”显微镜图像并自动识别物种的能力,深度学习有望让藻类监测过程变得更快、更高效,并且减少对专家经验的依赖。
为了全面审视这一快速发展的领域,一支来自莫纳什大学的国际研究团队,对将深度学习应用于微藻和蓝藻显微图像鉴定的研究进行了系统性的文献综述。他们共分析了62项相关研究,旨在回答几个核心问题:深度学习在微藻/蓝藻分类学鉴定中是如何应用的?这些研究使用了哪些显微成像技术和图像预处理方法?不同深度学习方法的优缺点和适用场景是什么?以及该领域当前存在哪些研究空白与未来发展方向?
研究人员采用系统文献综述的方法,遵循PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analysis)指南,在Scopus、Web of Science和PubMed三大数据库中进行检索,最终纳入了62项符合标准的研究进行深入分析。关键的技术方法包括:1. 系统检索与筛选:利用精确的布尔搜索词组合,从三大数据库中筛选出相关文献,并进行基于预定义纳入/排除标准的多步筛选。2. 图像类型划分与分析:根据图像内容将研究数据分为单物种图像和多物种图像,并深入分析了各自的成像技术(如光镜、数字全息显微镜、成像流式细胞术)和图像预处理方法(如调整大小、数据增强)。3. 深度学习模型分类与评估:将研究方法系统性地分为分类模型和检测模型两大类,并进一步细分子类(如预训练分类CNN、混合分类CNN、两阶段检测器、单阶段检测器等),对每种方法的原理、应用实例和性能表现进行了批判性评估。4. 定量综合与定性分析:通过图表对研究的时间分布、地域分布、模型性能范围等进行定量分析,并结合定性讨论,评估不同方法在不同成像场景、数据集复杂度下的表现和局限性。

显微图像用于深度学习

3.1. 单物种图像 vs. 多物种图像

根据图像内容,微藻/蓝藻显微图像可分为单物种图像和多物种图像。单物种图像通常包含单一物种(单细胞或群体),适用于分类模型,模型为整张图像预测一个标签。多物种图像包含多个物种共存,需要检测模型进行处理,模型需定位图像中每个细胞(通过边界框和/或掩码)并对其分类。这种区分至关重要,它决定了图像标注方式(图像级 vs. 目标级)和应选择的模型架构。

3.2. 图像采集技术

图像采集技术直接影响图像质量和类型。在纳入综述的研究中,绝大多数使用了光学显微镜。数字全息显微镜和成像流式细胞术(如FlowCAM、IFCB)也有应用,但电子显微镜使用极少,这可能与其成本高、通量低有关。

3.3. 图像预处理

相比传统机器学习需要复杂的特征工程,深度学习所需的预处理相对简单,主要包括:
  • 图像大小调整:为了使输入图像尺寸统一。研究指出,调整大小时保持原图的长宽比对于保留微藻/蓝藻物种的真实形态比例、避免因扭曲造成信息丢失至关重要,例如Yuan等人提出的“保持长宽比调整大小”方法。
  • 数据增强:由于高质量标注图像稀缺,数据增强被广泛用于扩充训练集。常见方法包括对原始图像进行翻转、旋转、裁剪、亮度对比度调整等几何或色彩变换。近年来,也开始利用生成对抗网络(GAN)来生成高质量的合成图像,以应对稀有物种数据不足或类不平衡问题。然而,并非所有数据增强都能提升性能,不当的增强可能产生不现实的图像,而过多的低质量合成图像甚至可能损害模型性能。

用于微藻和蓝藻鉴定的深度学习模型

卷积神经网络(CNN)是用于微藻/蓝藻图像识别的核心深度学习架构。研究主要分为两大类:
  • 分类模型:为整张图像预测一个分类标签,主要处理单物种图像。
  • 检测模型:在图像中定位(检测)并分类每个独立的细胞或目标,主要处理多物种图像。

4.2. 使用CNN进行分类

分类模型的研究可进一步细分为四个子类:
  • 定制设计的分类CNN:研究较少,性能表现不一,手动设计架构存在挑战。
  • 预训练的分类CNN:这是最主流的方法。研究人员利用在大型数据集(如ImageNet)上预训练好的模型(如AlexNet、VGGNet、ResNet、EfficientNet等),通过迁移学习(Transfer Learning)将其适配到微藻/蓝藻分类任务上。这种方法充分利用了预训练模型提取通用图像特征的能力,在数据量有限的情况下表现优异,能有效防止过拟合并减少计算需求。
  • 修改的预训练分类CNN:研究人员对现有预训练CNN架构进行修改以提升性能或适配特定需求。例如,简化DenseNet以适应边缘AI芯片,或在ResNet中嵌入自适应池化层以处理不同尺寸的输入图像。
  • 混合分类CNN:结合了多种技术。一种是将CNN用于特征提取,然后将提取的特征输入传统机器学习分类器(如支持向量机SVM)进行分类。另一种是融合多个不同CNN模型提取的特征,再进行分类。这些混合方法往往能获得比单一模型更高的准确率。

4.3. 使用CNN进行检测

检测模型的研究主要分为两类:
  • 两阶段检测器:如Faster R-CNN,首先生成可能包含目标的区域提议(Region Proposals),然后对这些提议区域进行分类和边界框回归。这类方法通常精度较高但速度相对较慢。
  • 单阶段检测器:如YOLO(You Only Look Once)系列和SSD(Single Shot MultiBox Detector),直接在图像网格上进行预测,一步完成目标的定位和分类,速度更快,更适合实时应用。在综述的研究中,单阶段检测器的应用更为普遍。
重要发现与趋势:定量综合分析显示,尽管总体上分类模型的研究数量更多(反映了该领域的早期发展阶段),但近年来,检测模型正变得越来越普遍,并成为处理真实世界中复杂的多物种图像的首选。模型性能受多种因素影响,包括成像模态、模型类别(如预训练模型通常优于定制模型)、以及目标类别数量(类别越多,识别难度通常越大,检测模型性能下降尤为明显)。
研究结论与讨论部分清晰地指出,本综述通过系统性地综合分析,明确了深度学习在微藻/蓝藻显微识别领域的当前状态与未来路径。其核心贡献在于提供了一个覆盖全工作流程的视角——从图像采集、预处理到模型架构与评估,并首次对分类检测这两类根本不同的计算机视觉任务进行了结构化区分和批判性评估,澄清了它们各自适用于单物种和多物种图像场景。
研究识别出该领域面临的主要挑战,包括:标注数据稀缺且获取成本高昂;成像技术和预处理方法在文献中经常被忽视或描述不清;许多研究关注的目标类群数量有限,限制了模型的通用性;以及对新兴成像技术(如高光谱成像)和先进模型架构(如视觉Transformer、实例分割网络)的探索不足
针对这些挑战,综述也勾勒出有前景的未来研究方向:半监督/自监督学习以减少对大量标注数据的依赖;多模态信息融合(如结合形态学图像与光谱或分子数据)以提升识别精度和稳健性;开发和整合更大规模、更多样化的公开可用图像数据集;以及探索更先进的检测与分割架构以应对复杂环境样本的分析。
总之,这项系统综述不仅为研究人员提供了该领域的清晰“地图”,指明了现有方法的优势与局限,更重要的是,它为后续研究如何构建更强大、更适用于真实世界藻类监测应用的深度学习模型提供了宝贵的路线图。随着深度学习与显微成像的深度融合,一个更自动化、高效且精准的藻华监控新时代正在加速到来,这对于全球应对水环境挑战、保障水资源安全具有深远的科学与实践意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号