基于物理信息级联U-Net的低扫描FTIR光谱去噪与基线校正：深度学习模型与传统信号处理的基准研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Bioengineering》：Denoising and Baseline Correction of Low-Scan FTIR Spectra: A Benchmark of Deep Learning Models Against Traditional Signal Processing Azadeh Mokari, Shravan Raghunathan, Artem Shydliukh, Oleg Ryabchykov, Christoph Krafft and Thomas Bocklitz

【字体：大中小】 时间：2026年03月18日 来源：Bioengineering 3.7

编辑推荐：

　　傅里叶变换红外（FTIR）成像在临床应用中的速度受制于为降噪而必需的多重信号平均。本研究旨在解决从快速单次扫描输入中同时分离噪声和基线漂移的难题。研究人员引入了一种物理信息级联U-Net架构，该架构通过一个确定性的“物理桥”集成Sensitive Nonlinear Iterative Peak (SNIP)算法，将去噪与基线校正任务分离。在FaDu细胞数据集上的基准测试表明，该级联模型优于传统Savitzky–Golay平滑+SNIP流程和标准的单一U-Net，实现了51.3%的均方根误差降低，并消除了标准深度学习模型常见的光谱幻觉，使成像速度比现有方法提升32倍，为高通量、诊断级的FTIR生物医学成像提供了稳健解决方案。

在生物医学研究的前沿，科学家们渴望能像拥有“化学显微镜”一样，无需染色或标记，就直接看清细胞和组织内部的分子组成。傅里叶变换红外（FTIR）成像技术正是这样一把利器，它通过探测样品对红外光的吸收，生成高分辨率的生物化学图谱，在癌症模型表征等领域展现出巨大潜力。然而，这把利器有个“阿喀琉斯之踵”：为了获得高质量、信噪比高的光谱，通常需要对同一点进行数十甚至上百次扫描取平均，这严重拖慢了成像速度，使得对大视野组织切片进行快速扫描成为奢望，极大地限制了其在临床高通量场景中的应用。反之，如果为了追求速度只进行单次扫描，得到的光谱又会充满高频仪器噪声和由散射、水汽波动等引起的非线性基线漂移，化学信息被严重污染。那么，能否用计算机算法的“魔法”，从一张嘈杂的、扭曲的单次扫描光谱中，精准还原出本应通过多次平均才能得到的高质量化学指纹呢？这正是发表于《Bioengineering》的这项研究致力于攻克的核心难题。

传统上，处理此类低质量光谱依赖于经典的信号处理流程，如先用Savitzky–Golay (SG)滤波器平滑去噪，再用Sensitive Nonlinear Iterative Peak (SNIP)算法进行基线校正。这种方法虽然可解释，但在处理同时包含强噪声和显著基线漂移的数据时力有不逮，且SG滤波可能过度平滑导致峰展宽，损失光谱分辨率。另一方面，基于U-Net等架构的深度学习模型能够学习从噪声数据到干净数据的复杂映射，推理速度快，但纯粹的“黑箱”式端到端学习缺乏明确的光谱物理约束。在缺乏真实干净光谱作为指导的情况下，让一个网络同时学习去除随机噪声和估计复杂的背景漂移，是一个“病态”逆问题，容易导致模型学到数据集的统计捷径，产生不真实的光谱特征（即“幻觉”），或在实验条件变化时泛化性能下降。

为了解决这些挑战，研究人员开展了一项创新的研究，他们提出了一种“物理信息级联U-Net”架构。这项研究的关键在于“分而治之”和“物理引导”的思想。与试图一步到位的单U-Net不同，该架构将复原任务分解为两个专门的阶段：第一阶段U-Net₁专注于去噪，其学习目标是将含有噪声和基线的低质量输入，映射到仍保留基线但已去噪的中间目标；接着，一个被称为“物理桥”的非学习层介入，它执行逆归一化操作，将数据恢复至物理吸光度域，然后应用确定的SNIP算法移除基线，这个过程严格遵循光谱学的几何约束；最后，第二阶段U-Net₂接收基线已被移除的谱图，对其进行精细的残差校正，以修复SNIP可能引入的系统性伪影，并进一步锐化峰形。整个模型采用深度监督策略，在去噪和最终输出两个阶段分别计算损失。为了确保评估的严谨性，研究采用了严格的留一样本交叉验证策略，使用人下咽鳞状细胞癌FaDu细胞系在四个独立视野采集的数据集，其中包含了真实世界的环境波动（如湿度变化），以测试模型的稳定性。研究团队将此级联模型与一个精心调参的传统SG+SNIP流程、以及一个标准的单U-Net模型进行了全面基准比较。

研究人员运用了多个关键技术方法来支撑这项研究。首先，构建了配对的高质量与低质量光谱数据集，通过在同一FaDu细胞样本区域分别采集32次扫描（作为高质量地面真值）和1次或8次扫描（作为低质量输入）来创建监督学习所需的样本对。其次，实施了严格的数据准备与预处理流程，包括使用Otsu阈值法生成细胞掩膜以提取前景光谱、进行水汽校正、以及修剪无生物信息的光谱区域（如CO₂强吸收带）。在预处理中，对高质量目标数据应用SNIP去除基线，而低质量输入则保留其原生基线，以迫使模型学习同时处理噪声和基线。接着，对所有光谱进行标准正态变量归一化和全局最小-最大缩放。最后，利用Optuna框架对传统SG滤波器的参数进行了自动化的贝叶斯超参数搜索，以确保传统方法基准代表了其理论性能上限。神经网络的训练则采用了相同的超参数设置，并使用早期停止策略防止过拟合。

研究结果

•
架构性能对比：在全局保真度指标上，提出的级联U-Net模型显著优于其他方法。对于1次扫描输入，其输出的均方根误差相对于原始输入降低了51.3%，明显优于单U-Net的40.2%和传统SG+SNIP流程的33.7%。在平均绝对误差指标上也观察到一致的趋势。
•
峰感知化学保真度：除了全局误差，研究还采用了能敏感反映峰形变化的“光谱角制图”和“峰强度误差”等指标进行评估。结果显示，级联架构在保持峰强度和形状方面具有最高的保真度，并且成功消除了在单U-Net输出中观察到的光谱幻觉现象（即模型生成的虚假谱峰）。
•
对不稳定条件的鲁棒性：在包含环境不稳定（如湿度波动）导致光谱漂移的测试样本上，级联模型展现了优异的稳定性。其性能下降最小，而单U-Net模型在此类分布外条件下的表现明显变差，产生了更多伪影，这验证了嵌入确定性物理桥在提升模型鲁棒性方面的价值。
•
成像速度增益：基于1次扫描输入即可重建出诊断质量光谱的能力，意味着该技术能够实现比当前需要32次扫描的标准方法快32倍的成像速度，为大规模组织切片的高通量FTIR扫描打开了大门。

结论与意义

本研究成功开发并验证了一种物理信息引导的级联深度学习架构，用于从极低扫描次数的FTIR光谱中同时进行去噪和基线校正。核心结论是，通过将复原任务解耦为去噪和基线校正两个阶段，并在中间嵌入一个基于SNIP算法的确定性物理桥，可以显著提升模型的性能、化学保真度和对实验条件变化的鲁棒性。该级联模型不仅超越了传统信号处理方法的极限，也克服了标准深度学习模型因缺乏物理约束而产生的谱幻觉和泛化能力差的问题。

这项研究的重要意义在于它为解决FTIR生物医学成像中“速度与质量”的根本矛盾提供了一条切实可行的技术路径。它表明，将深度学习的强大表达能力与领域知识（物理约束）相结合，是开发下一代稳健、可解释生物医学图像分析工具的有效策略。该方法使得单次扫描的快速FTIR成像能够产出可用于诊断的高质量生化图谱，将成像通量提高了数十倍，从而有望加速FTIR技术在癌症研究、组织病理学等领域的临床转化和应用普及。最终，该框架为其他基于光谱或成像的、受类似噪声与基线问题困扰的生物医学检测技术提供了有益的范式参考。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号