拥挤显微视频中精子轨迹预测评估框架的建立及其在计算机辅助精液分析中的应用

《PLOS Computational Biology》:A framework for evaluating predicted sperm trajectories in crowded microscopy videos

【字体: 时间:2026年02月12日 来源:PLOS Computational Biology 3.6

编辑推荐:

  本文针对计算机辅助精液分析(CASA)中精子轨迹追踪的准确性难题,提出了一套独立于传统运动学参数的评价框架。作者通过引入多目标追踪(MOT)和细胞追踪挑战(CTC)的指标,并针对精子显微视频的特殊挑战(如路径交叉、鞭毛信号丢失)进行适配,建立了基于精子头部质心(centroid)的标准化评估流程。研究提供了包含340条手工标注轨迹的小型数据集,并证明优化追踪配置可使指标提升高达30%。该工作为开发下一代CASA系统、实现长时程高密度精子行为分析奠定了重要基础,对提升男性生育力评估的预测价值具有重要意义。

  
引言
自20世纪80年代以来,对相位对比显微镜视频进行半自动精子运动性分析已成为测量和分类精子运动模式的重要手段。运动类别的确定依赖于多种运动学参数,如曲线速度(VCL)和鞭打交叉频率(BCF)。这些测量的准确性最终取决于显微镜视频中每个精子追踪的质量。然而,传统的精子追踪方法通常需要对样本进行稀释并缩短观察时间窗口(少于1至2秒),以避免精子路径交叉时产生的追踪错误。在某些物种中,精子射精后的寿命可超过数小时甚至数天,运动模式的长期适应性变化可能是预测精子受精能力的重要区分因素。提高计算机辅助精液分析(CASA)的预测价值,需要在生理相关的时间尺度上以及精液典型的高细胞密度下,实现对精子轨迹的精确追踪。
材料与方法
  • 数据收集与伦理声明
    所有涉及人类受试者的程序均经东卡罗来纳大学布罗迪医学院机构审查委员会批准。精子样本在37°C、5% CO2条件下液化后,通过50%等渗Percoll差速离心从精浆中分离,并用改良的Biggers、Whitten和Whittingham培养基(含3.5%牛血清白蛋白)洗涤。细胞计数使用血细胞计数器进行。样本在成像前置于37°C、5% CO2培养箱中保存,所有成像在样本收集后90分钟内完成。相位对比显微镜视频使用配备热台的蔡司Axervert.A1复合光学显微镜在37°C下获取,细胞悬液稀释至约800万细胞/毫升,记录帧率为每秒9帧,持续两分钟。
  • 基线追踪器与标注
    本研究使用Python的Trackpy库作为基线追踪流程,包括其默认参数的locate(检测)和link(追踪)函数。为创建完全标注的精子轨迹数据,首先将精子显微视频通过基线Trackpy工作流处理,然后使用基于OpenCV开发的标注工具手动修正轨迹错误。最终提供了一个包含5个来自不同捐赠者的30秒视频的小型数据集,共计340条完全标注的精子轨迹。
  • 追踪算法分析
    分析分为两部分:一是基于标准运动学参数分布(如曲线速度VCL、直线速度VSL、平均路径速度VAP)的间接评估,使用推土机距离(EMD)量化预测分布与真实分布之间的差异;二是提出并实施了一套直接定量评估追踪质量的指标。这些指标借鉴了多目标追踪(如MOTA、IDF1、HOTA)和细胞追踪挑战(如DET、LNK、TRA、TF)的常用指标,并针对精子追踪的特殊性进行了调整,例如使用基于精子头部质心距离的匈牙利算法进行ID关联,并提出了过滤非运动物体和极短轨迹的版本以更关注运动精子的追踪质量。
结果与讨论
  • 追踪质量对标准精子分析输出的影响
    通过三个实验展示了追踪假设和配置对计算出的运动学参数的显著影响。
    • 实验1:配置不当的追踪器。 使用Trackpy默认的较小搜索范围(7像素)会严重限制算法追踪快速运动精子的能力,导致速度分布严重偏向低速,无法反映精子群体的真实运动行为。与手工标注数据相比,配置不当的追踪器在VAP、VSL和VCL上的EMD值(分别为8.20、5.43、7.97)远高于优化配置后的EMD值(分别为1.73、1.48、1.89)。
    • 实验2:短时程与长时程轨迹。 比较30秒视频与其内含的2秒子集发现,短时程分析无法捕捉精子更复杂的长期行为(如振荡模式),且由于时间平均效应,运动学参数分布趋于收敛,掩盖了视觉上明显的运动行为差异。
    • 实验3:边界框与质心。 对公开的VISEM-Tracking数据集(使用边界框标注)进行分析发现,直接使用边界框中心作为精子位置会引入显著噪声,导致VAP和VCL分布出现较大偏差(平均EMD分别为11.8和53.0),而使用Trackpy高斯斑点法校正后的精子头部质心则能获得更准确的运动行为测量。
  • 精子检测与追踪的评估
    针对精子视频显微技术的独特挑战(如精子形态细长、像素稀疏、亮度变化、路径交叉、部分出镜等),对通用追踪指标进行了适应性修改,核心是将精子表示为单个点(头部质心)而非分割区域或边界框,并基于质心距离进行关联。研究强调了有效追踪算法必须能够处理可变速度、长时程运动,并区分运动精子和非运动物体/碎片。
  • 数据集上的评估
    在手工标注数据集上报告了基线Trackpy方法的各项追踪指标(包括过滤非运动物体后的版本),为未来算法的比较提供了基线。同时,通过比较配置不当与优化配置的Trackpy在过滤后的指标表现(后者在所有指标上均显著优于前者),以及它们对应的运动学参数分布与真实分布的EMD差异,证实了所提出指标能够有效反映追踪质量,并与标准运动学输出的可靠性相关联。
对未来精子分析的意义
当前CASA在临床男科学实验室的应用仍有限,部分原因在于其预测价值尚未超越训练有素的实验室技术人员的手动分析。本报告指出的关键问题包括:追踪器默认配置的变异性、短观察时间窗口的局限性以及基于边界框检测方法的不精确性。克服这些障碍需要三大进展:1)建立标准化的基准和生物学相关指标来比较算法;2)创建高质量、精确标注的训练数据集;3)开发结合机器学习方法和精子运动物理约束的集成流程。通过采用开源、透明的代码库和促进可重复的方法,CASA有望像计算机视觉革新放射学诊断那样,最终实现精液分析的标准化和预测能力的提升。
结论
本研究为评估精子显微视频的追踪算法建立了一个框架,将通用的细胞追踪指标适配于精子视频显微的特殊背景。通过提供一个标注数据集和基线结果,旨在支持计算机视觉社区对此重要任务的持续改进。该框架强调将检测、追踪配置和分析时间尺度视为相互关联的问题,为开发具有高预测价值的下一代CASA系统指明了方向。相关代码和数据集已公开,以促进该领域的迭代发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号