《Frontiers in Bioengineering and Biotechnology》:Light-RepViTSR: ultra-lightweight super-resolution for real-time photoacoustic endoscopy in tumor biopsy
编辑推荐:
光声内镜(PAE)是肿瘤实时活检的关键技术,但其固有的分辨率-速度权衡导致运动伪影,严重影响了诊断的可靠性。本文提出了一种专为实时PAE优化的超轻量级超分辨率重建网络Light-RepViTSR。该网络基于RepViT架构构建,通过剔除非必要组件(如压缩-激励层)以最大化计算效率,并在包括小鼠脑血管和植物叶脉在内的多源数据集上证明了其优越性。Light-RepViTSR在各种放大倍数(×2, ×4, ×8)下均优于传统方法,在显著提升图像质量指标的同时,将模型大小减少了>99%,推理时间减少了>60%,为推进实时高分辨率PAE临床应用奠定了基础。
在临床肿瘤学的诊疗战场上,实现早期、精准的诊断一直是决胜的关键。传统的活检方式往往需要内镜检查发现可疑病灶后,再进行取样、送检、病理分析等一系列步骤,整个过程存在一定的诊断延迟。如果能将病理诊断的过程“搬到”检查现场,在操作过程中即刻对病灶的组织学特征进行分析,无疑将极大提升诊疗效率。这正是“实时原位活检”所描绘的美好愿景。在这一技术蓝图中,光声内镜(PAE)扮演着举足轻重的角色。它巧妙融合了光学对比度与超声分辨率的优势,无需注射外源性造影剂,便能独特地可视化肿瘤内部的微血管网络和缺氧区域,为判断肿瘤良恶性提供了关键的影像学依据。
然而,理想丰满,现实骨感。PAE技术面临着一个棘手的“先天不足”:分辨率与成像速度的权衡。为了获得高分辨率的精细图像,需要对组织进行密集的空间采样,但这不可避免地会延长扫描时间。在人体的动态内腔环境中,如胃肠道、呼吸道,生理性的蠕动、呼吸、心跳等运动会持续发生。当扫描速度跟不上组织运动速度时,严重的运动伪影便随之产生,导致图像模糊、结构扭曲,犹如一张快速移动中拍摄的模糊照片,关键细节荡然无存,诊断的可靠性被严重“拖了后腿”。因此,如何在不牺牲图像质量的前提下加速成像,成为PAE迈向临床实用必须攻克的堡垒。
一个潜在的解决方案是“走捷径”:减少采样点,加速扫描,然后通过算法“脑补”出缺失的细节。这就是超分辨率(SR)技术的用武之地。尽管基于深度学习的SR技术在医学图像增强领域已得到广泛研究,但大多数方法计算复杂度高、模型体量大,专为离线处理设计,无法满足实时PAE对低延迟和有限硬件资源的严苛要求。于是,一项旨在为实时PAE“量身定制”一款既轻便又高效“图像修复工具”的研究应运而生。这项研究提出了一种名为Light-RepViTSR的超轻量级超分辨率重建网络,相关成果发表在国际期刊《Frontiers in Bioengineering and Biotechnology》上。
为了开展这项研究,研究人员综合运用了多种关键技术方法。首先,他们构建了一个包含公开小鼠脑血管数据集和自采集植物叶脉数据集的多源数据集,以评估模型的泛化能力。其次,他们采用栅格欠采样的方式模拟PAE在加速扫描时产生的低分辨率输入图像。研究的核心是提出了Light-RepViTSR网络架构,它基于高效的RepViT架构进行优化,移除了对超分辨率任务增益有限但计算成本高的压缩-激励(SE)层,并采用了全局残差连接和高效的像素重排上采样模块。模型训练采用了AdamW优化器、余弦退火学习率调度器和稳定的均方误差损失函数。最后,研究通过峰值信噪比(PSNR)、结构相似性指数(SSIM)和均方根误差(RMSE)等定量指标,以及视觉定性对比,在多种放大因子(×2, ×4, ×8)下,将Light-RepViTSR与包括SRResNet、SRGAN、EDSR、DDBPN和MobileSR在内的多种先进SR方法进行了全面比较和统计分析。
研究结果揭示了Light-RepViTSR在多方面的卓越性能。
1. 定性重建性能
无论是对于结构复杂的小鼠脑血管网络,还是具有分形特征的植物叶脉,Light-RepViTSR在所有放大倍数下都展现出卓越的重建能力。视觉对比表明,相比其他SR方法,Light-RepViTSR重建的图像在血管边界锐度、结构连续性和细节保真度方面都更胜一筹。尤其是在信息丢失最严重的×8放大倍率下,它能够更好地维持毛细血管网络的连通性,减少断裂和碎片化,同时对噪声有更好的抑制能力,生成了更清晰、更真实的解剖结构图像。
2. 具有统计学显著性的定量评估
在包含19张小鼠脑血管图像的测试集上进行的定量分析证实了Light-RepViTSR的显著优势。在模型大小和推理时间大幅降低的前提下,其重建质量在多项指标上达到或超越了计算量更大的模型。具体而言,在×8超分辨率任务中,Light-RepViTSR的PSNR值比基线模型SRResNet最高提升了1.41 dB,SSIM在×2任务中最高提升了0.047。更为重要的是,Light-RepViTSR的模型大小仅为0.014 MB,比SRResNet(1.402 MB)减少了超过99%,同时平均单图推理时间也从0.0124秒减少至0.0046秒,降低了超过60%。统计检验表明,这些性能提升具有统计学显著性。
3. 跨领域泛化能力
研究团队还利用自建的18张植物叶脉光声图像对模型进行了测试。植物叶脉与肿瘤微血管在分支拓扑结构上具有相似性。结果表明,Light-RepViTSR能够准确重建出植物叶脉复杂的分级网络结构,保持了良好的连通性和自然的直径变化,证明了其强大的跨领域泛化能力和对未知生物结构的适应性。
4. 网络架构与效率设计
研究详细阐述了Light-RepViTSR的架构设计,其核心是由身份映射的RepViT块组成的特征提取模块。与原始RepViT不同,本研究基于消融实验的结果,有意去除了其中的SE层,因为在超分辨率任务中其带来的性能提升相对于增加的计算开销而言微乎其微。每个RepViT块在训练时采用结构重参数化技术,在推理时则融合为一个单一的3×3深度卷积,极大地提升了计算效率。网络还包含一个轻量级的干细胞卷积模块、一个全局残差连接和一个高效的上采样模块,共同在表征能力和计算开销之间实现了最优平衡。
结论与讨论部分对本研究的意义和未来方向进行了总结与展望。该研究成功地开发并验证了Light-RepViTSR,这是一个专门为实时光声内镜(PAE)设计的超轻量级超分辨率(SR)网络。其最突出的贡献在于,在几乎不损失重建质量的前提下,实现了模型大小和推理时间的数量级缩减。这使得在计算资源受限的嵌入式系统或移动设备上部署高质量的实时SR重建成为可能,为PAE从实验室走向临床床边扫除了一个关键的技术障碍。
研究的意义深远。首先,它为解决PAE中固有的分辨率-速度权衡这一核心矛盾提供了一种切实可行的深度学习方案,通过算法赋能硬件,有望显著减少因慢速扫描导致的运动伪影,从而提升图像的诊断可靠性。其次,该研究建立了一个高效的网络架构设计范式,即通过针对特定任务(如超分辨率)优化通用高效架构(如RepViT),剔除冗余组件,在保持性能的同时最大化效率,这一思路可推广至其他医学影像实时处理任务。最后,研究采用的多源数据集和严格的评估流程(包括对未见过的生物结构的测试),增强了结果的可信度和模型的泛化能力,为后续研究提供了 benchmark (基准)。
当然,研究也存在一些局限性和未来可探索的方向。例如,当前工作主要使用二维图像进行训练和测试,而真实的PAE数据可能是三维的;未来可探索适用于三维体积数据重建的轻量级网络。此外,本研究模拟了理想的栅格欠采样,实际临床中获取的低分辨率图像可能包含更复杂的噪声和伪影,需要在更接近真实场景的数据上进一步验证模型的鲁棒性。最后,将训练好的模型集成到实际的PAE系统硬件中,并实现真正的实时成像闭环,是迈向临床转化的最终步骤。
总而言之,Light-RepViTSR的研究为实时高分辨率光声内镜的临床应用铺平了道路。它不仅仅是一个高效的图像重建工具,更代表了通过算法-硬件协同设计来突破生物医学成像技术瓶颈的创新思路。随着这类技术的成熟与普及,实时、原位、精准的肿瘤活检将不再遥远,最终惠及广大患者。