《ACS ES&T Air》:Airborne Particulate Matter Sensing via Laser Filament–Interaction and Deep Learning
引言
空气中颗粒物污染是全球性的健康危机,每年导致数百万人过早死亡,并与呼吸系统疾病、心血管问题及预期寿命缩短相关。然而,当前监测空气中颗粒物(尤其是在远距离和室外多变环境中)的方法在覆盖范围和特异性方面仍然有限。传统系统通常依赖于基于过滤器的采样后进行离线分析,或利用光学测量,但这些方法通常无法分辨单个颗粒物的类型或尺寸。这些限制阻碍了及时的环境评估、健康警报发布以及生物或化学相关气溶胶颗粒运动的追踪。
远程传感技术如激光雷达(LiDAR)提供了探测远处物体的强大工具,但大多数激光雷达系统仅提供整体的后向散射强度,并未优化用于物种级别的区分。尽管多波长和基于去偏振的激光雷达的发展改善了气溶胶分类,但该技术在分辨小的、稀疏分布的颗粒或区分生物与非生物成分方面存在困难。相比之下,飞秒激光脉冲产生的激光成丝(即形成细长的光和等离子体通道)为探测远距离物体提供了新途径。它已成为一种有前景的大气诊断工具,能够从气体和气溶胶中产生强烈的后向散射信号,包括宽带超连续谱、荧光和等离子体发射。这些成丝可以在空气中传播数米至数公里,形成具有高峰值强度的自导引等离子体通道,使其成为远程实时光学探测的理想候选者。
与空间受限且不稳定的成丝前等离子体生成不同,完全成丝提供了自导引传播机制,在数毫米及更长的距离上具有钳制强度。这种扩展的高强度相互作用体积显著增加了颗粒物与光相互作用的可能性,导致更一致的信号生成,从而实现可靠的物种级别区分。因此,成丝不仅是达到高峰值强度的手段,更是实现远距离单颗粒稳定实时探测的关键机制。尽管前景广阔,利用成丝探测和分类空气中颗粒物的研究仍探索不足。现有的基于成丝的方法通常侧重于气体探测或整体气溶胶效应,而未针对单个颗粒物事件。
一些光学系统先前已通过使用荧光和成像技术展示了颗粒物类型区分能力。例如,Kaye等人开发了一种用于网络部署的低成本多通道气溶胶荧光传感器,依赖紫外激发检测生物颗粒。类似地,K?nemann等人引入了光谱强度生物气溶胶传感器(SIBS),可实时测量单颗粒的光谱分辨荧光,从而实现更快更准确的生物气溶胶分类。自动花粉计数器,如?auliene等人报道的Rapid-E系统,结合了成像和荧光方法用于空气中过敏原的实时监测。尽管这些系统已被证明有效,但它们需要专用的激发源且必须靠近样品。相比之下,本研究采用成丝诱导的等离子体发射进行空气中激发,提供了在数十至数百米距离上进行远程传感的潜力。这项原理验证研究在受控的近场配置中表征了颗粒物-成丝相互作用,为未来利用成丝传播进行远距离气溶胶探测的技术奠定了基础。
本研究展示了一种结合超快激光成丝、高分辨率成像和深度学习的新方法,用于探测和分类空气中的粉笔尘、花粉粒和盐晶体。这些颗粒物进入激光产生的成丝后,其光学发射事件(源于颗粒在成丝中的烧蚀和碎裂)被捕获并分析。深度学习是一种机器学习方法,此前已应用于空气中颗粒物的光谱、图像、散射图案和全息图像分类。通过训练一个基于标记的成丝-颗粒相互作用视频帧的网络,本研究证明可以从单次光学发射事件中识别空气中颗粒物。尽管本文讨论的配置是在受控环境中进行成丝诱导发射成像和分类的近场原理验证,但该方法展示了利用具有远距离扩展潜力的成丝进行颗粒物探测的可能性,为空气质量监测的远程传感开辟了新途径。
实验方法
激光成丝生成与光学设置
飞秒激光脉冲(190 fs,1030 nm,6 kHz重复频率,6 W PHAROS Light Conversion)通过一个100 mm焦距的平凸熔融石英透镜聚焦到环境空气中,以产生激光成丝。输入光束直径为8.9 mm(1/e2),脉冲能量从激光最大输出的20%扫描至100%(0.2–1.0 mJ/脉冲,对应的衍射极限峰值强度约为1.1 × 1014至 5.6 × 1014W/cm2),以确认成丝形成并确定可检测到颗粒物发射信号且保持成丝稳定性的区域。因此,所有颗粒物输送和成像均在激光最大脉冲能量下进行,以确保获得稳健且一致的发射信号用于分析。
光学布局如图1a所示。使用一个长工作距离的50倍物镜(Olympus SLMPLN,NA 0.35)收集从成丝垂直方向发射的光。该物镜允许距成丝18 mm的工作距离。物镜安装在平移台上,并使用高分辨率彩色CMOS相机(Basler daA1920-160uc,1920 × 1200像素)进行对准。对准后,将相机从其磁性底座上取下,并在其位置安装一个光纤耦合光谱仪(B&W Tek Glacier X,冷却CCD),使用SMA-to-SM1适配器(CVH100-COL Thorlabs)和25 mm平凸透镜将准直光导入光纤。这种可互换配置允许同一光轴既用于通过成像进行对准,也用于光谱测量。此外,在另一侧放置了另一台高分辨率彩色CMOS相机(Basler daA1920-160uc)配35 mm镜头(Tamron),用于收集整个激光诱导电离长度的图像,以监测成丝过程。
图1b显示了在不同激光功率(25%、50%、75%和100%)下等离子体通道的侧视图图像。这些图像揭示了随着功率增加,成丝逐渐延伸、分裂和亮度增加。在满功率下,成丝长度约为3 mm,与通常与成丝相关的钳制强度区域一致。值得注意的是,在100%功率下清晰可见成丝分裂,表明存在强烈的非线性传播效应。
图1c显示了在20%至100%递增激光功率下记录的等离子体发射光谱。光谱数据为成丝起始和演化提供了进一步证据。随着激光功率增加,光谱显示出明显的光谱展宽迹象,这是自相位调制和等离子体生成等非线性光学过程的标志。此外,光谱强度在较高功率下趋于稳定,表明强度钳制,这是成丝的一个关键特征,由于克尔自聚焦和等离子体散焦之间的动态平衡,峰值强度稳定下来。侧视成像显示在100%功率下成丝分裂最清晰,光谱表明成丝起始接近约85%功率,此时连续谱展宽开始。超过此点后,光谱增长而无进一步蓝移表明强度钳制开始。虽然可见等离子体通道形成在约75%最大功率时变得清晰可见,并伴有宽带发射,但完全成丝(其特征是自导引、高强度通道,具有稳定的等离子体发射和光谱强度钳制)发生在接近85%功率时。选择此成丝区域进行后续测量,因为它提供了更强烈和扩展的稳定相互作用区域,确保了可重复的烧蚀和散射特征,并减少了变异性。
图1d展示了代表性颗粒物(即空白对照(未添加颗粒物的成丝)、粉笔尘、花粉和盐)的显微镜图像,以及相应在成丝内捕获的光学发射事件。应注意,进入成丝的颗粒物很可能被烧蚀、部分烧蚀或碎裂,因此发射特征来源于这些较小的碎片或等离子体,而非完整的颗粒。这些图像用作神经网络的输入,该网络根据学习到的特征对颗粒物类型进行分类。
实验室内空气中颗粒物浓度使用Burkard个人体积空气采样器进行评估,操作流速为10 L min–1,持续9分钟,对应采样体积为0.09 m3。实验在受控条件(温度21 °C,相对湿度34%)下进行,并在采样区域周围放置聚苯乙烯屏蔽以最小化成丝区域内的气流。沉积在撞击表面的颗粒物使用暗场显微镜成像,并通过基于全局强度阈值处理(尺寸纳入标准为≥3 μm等效直径)的自动分割进行分析。在整个采样区域,检测到342个颗粒物,估计浓度约为3.4 × 103颗粒物/m–3,表面密度为28 颗粒物/mm–2。平均颗粒尺寸为6.0 μm(中位数3.9 μm)。这些测量为屏蔽实验室环境提供了指示性基线。
光谱表征
在不同功率水平下收集光谱,积分时间为5秒,并进行暗背景扣除。随后,重新定位相机以在颗粒物输送和与成丝相互作用期间捕获发射事件。
样品制备
花粉来自黄花蔊菜(Iva xanthiifolia)物种,商业购买(Sigma-Aldrich, P7395-1G);粉笔尘(主要为CaCO3)取自白色粉笔棒(Crayola No. 280);研磨盐晶体(主要为NaCl)取自Saxa细餐桌盐。颗粒物在静止空气条件下通过光学级棉签 applicators(Thorlabs CTA10,6英寸木棒,非研磨棉头)释放到位于激光成丝路径上方500 μm处的2 cm长锥形聚丙烯漏斗(5 mm入口直径,2 mm出口直径)中,从而送入光束。在样品之间更换棉签,使用无菌手套处理,并在每次沉积之间用丙酮清洁漏斗以最小化交叉污染。
使用配备20倍LU Plan ELWD 0.4 NA物镜的Nikon Eclipse显微镜,在暗场照明下对沉积在载玻片(25 × 75 × 1 mm3,钠钙玻璃)上的颗粒物进行成像,以测量颗粒尺寸,沉积方法与通过成丝光束沉积相同。图像比例使用载物台测微尺校准,得到约0.192 μm/像素。颗粒尺寸范围及其平均值和标准偏差为:粉笔尘3–28 μm(9.4 ± 4.1 μm),花粉粒4.6–30.7 μm(20.7 ± 3.8 μm),盐晶体12–37 μm(21.8 ± 6.8 μm)。尺寸通过MATLAB 2024a中的图像处理代码确定。形状分析揭示了类别间的显著差异:粉笔颗粒的平均圆形度和偏心率为0.74 ± 0.08和0.60 ± 0.15,花粉粒为0.86 ± 0.11和0.55 ± 0.17,盐晶体为0.70 ± 0.07和0.66 ± 0.17。这些指标表明花粉粒通常更接近球形,而盐和粉笔显示出更大的伸长和不规则性。这种形态变异性会影响烧蚀行为,从而影响发射和分类的复杂性。图2说明了形态趋势,显示了直径与圆形度的散点图以及尺寸变异性的箱线图。
发现沉积到载玻片后的图像中不存在任何棉絮碎片。因此,在沉积过程中不太可能有棉纤维通过成丝,并且由于棉签纤维尺寸在显微镜下测量明显大于目标颗粒物,任何沉积在光束路径中的纤维在烧蚀过程中都很容易区分。此外,由于所有样品使用相同类型的棉签 applicator,此类事件在三个颗粒物类别中是一致的。
通过使用50倍物镜对成丝区域成像,我们在颗粒物通过漏斗时使用白光LED光源(Thorlabs, PSX501)照明分散的颗粒物。为避免烧蚀,我们在没有成丝的情况下捕获每个类别的九张图像。在成丝区域内,颗粒物计数平均为粉笔5个,花粉1个,盐3个。
机器学习分类
从10秒录制序列(30 fps,50 ms积分时间)中提取视频帧,并根据已知输送物种(即粉笔、花粉、盐和空白背景)手动标记。每张图像以1920 × 1200像素分辨率获取,并裁剪成两个960 × 960像素的片段,垂直居中以保留成丝区域同时去除外围伪影。这些裁剪后的图像随后被组织到特定类别的文件夹中,用于构建标记图像数据存储。在训练之前,所有图像调整大小为512 × 512像素以匹配神经网络的输入维度。最终训练数据集包括71张空白图像、59张粉笔图像、63张花粉图像和33张盐图像,总计226个精选样本。从中,180张图像用于训练,46张用于验证,另外26张图像放在单独文件夹中用于最终测试和分析。这确保了模型在未见过的数据上进行评估,同时跨所有四个类别保持相对平衡的训练集。
在MATLAB中训练一个卷积神经网络(CNN)来对成丝及其任何发射事件的彩色图像进行分类。该网络由四个卷积块组成,每个块采用具有3×3内核和相同填充的卷积层,随后是批量归一化和ReLU激活函数。前三个块各包含两个卷积层,使得在下采样之前能够进行更深层次的特征提取。在每个块之后应用步长为二的最大池化层,逐步将空间维度从512×512减少到256×256,然后到128×128,最后到64×64。滤波器数量跨块增加以捕获层次化特征:第一个块32个滤波器,第二个块64个滤波器,第三个块128个滤波器。包含第四个块,该块由具有256个滤波器的单个卷积层组成,以增强高级特征抽象。为减轻过拟合,在分类头之前应用了丢弃率为0.5的Dropout层。分类器包含两个全连接层:第一个由128个单元和ReLU激活组成,第二个映射到输出类别数量,随后是Softmax层和分类层。输入层接受尺寸为512×512×3的24位RGB图像,输出是单个类别输出(空白、粉笔、花粉或盐)。神经网络架构示意图如图3所示。
训练使用Adam优化器进行,初始学习率为1×10–4,并采用分段计划,每30个周期将学习率降低0.1倍。网络训练60个周期,小批量大小为8,数据在每个周期进行洗牌。每100次迭代进行一次验证检查。虽然数据集规模适中可能增加过拟合风险,但所应用的数据增强有效增加了样本多样性。数据增强包括随机X和Y轴图像翻转、随机图像旋转±5°、随机图像在Y和X方向的尺度变化(0.95至1.05),以及还包括随机垂直平移图像在±64像素(图像尺寸的八分之一)以内,以在保留特征空间完整性的同时提高泛化能力。未进行X方向平移,因为平移任何显著量都可能移除重要的发射事件。使用分类交叉熵损失函数进行优化。
结果与讨论
在100%激光功率下的分类结果以混淆矩阵形式显示在图4a中,沿左上到右下对角线的百分比越高、颜色越亮表示结果越准确。分类准确率最高的是空白(100%)和粉笔(89.8%),其次是盐(87.5%)和花粉(72.7%),平均准确率为87.5%。主要的错误是花粉和粉笔之间的混淆(27.3%)。每张图像的平均置信度分数代表CNN对其预测类别赋予的平均概率。对于测试数据,空白获得最高平均置信度(0.988),其次是粉笔(0.881)、盐(0.851)和花粉(0.711)。请注意,置信度反映了网络的确定性,而非正确性,因此高置信度的误分类表明过度自信。CNN在未见测试集上的分类性能对所有四个颗粒物类别(空白、粉笔、花粉和盐)的平均F1-score约为0.87。花粉相对较低的置信度,结合其较低的召回率和F1-score,表明该类更难区分,可能由于与粉笔发射事件的光谱或形态特征重叠。
为测试神经网络的鲁棒性,对在85%全激光功率下拍摄的额外发射事件图像进行了分类。总共使用107张图像进行测试,每个类别大致均分(25张空白,28张粉笔,27张花粉,27张盐)。结果展示在图4b的混淆矩阵中,显示整体性能保持强劲,平均准确率为88.9%。粉笔达到最高准确率(96.4%)和F1-score(0.915),其次是盐(97.2%准确率和0.941 F1-score)和空白(93.5%准确率和0.877 F1-score)。花粉仍然是最具挑战性的类别,F1-score为0.809,分类准确率为70.4%,反映出误分类为空白的情况增加(25.9%),可能是由于发射强度降低或发射事件尺寸较小。平均置信度分数进一步说明了这些趋势:空白和粉笔以高确定性分类(分别为0.990和0.956),盐保持稳健为0.886,而花粉显示最低置信度0.688,与其降低的准确率一致。这些结果证实了CNN在降低激光功率下仍保持强大的分类能力。
为解释CNN的决策过程,将Grad-CAM应用于100%激光功率下的测试数据,生成热图以突出对模型预测最具影响力的图像区域。我们使用第三个卷积块中的第二个ReLU激活进行Grad-CAM提取,因为该中层卷积层捕获细粒度的空间和光谱特征,同时保留足够的信息来解释CNN的焦点。较早的层倾向于编码低级特征(如边缘和梯度),而更深的层抽象语义内容。
选定的正确分类图像如图5a所示,其相应的Grad-CAM可视化如图5b所示,以提供对CNN决策过程的洞察。例如,尽管空白成丝图像中光束内没有颗粒物,但空白成丝的Grad-CAM激活覆盖了成丝长度和背景,因为网络使用较大区域来识别其为空白,这表明CNN可能响应于较大的结构均匀性,而非在其他面板(粉笔、花粉和盐类别)中观察到的较小离散颗粒特征。此外,粉笔和花粉的分类似乎聚焦于小颗粒,而盐的分类则聚焦于更广泛的强度区域,如图像中的黄/橙色区域。有趣的是,在花粉面板中,CNN选择性地突出绿色颗粒,而通常忽略视觉上显著的粉色颗粒,尽管花粉和粉笔图像都包含粉色和绿色颗粒。
为研究CNN识别颗粒物的光谱特征,我们分析了从Grad-CAM突出显示区域(64×64图像块)提取的归一化色度值(参见图6a的红 vs. 绿色度图),这些数据来自100%激光功率下正确分类的数据。从每个块中选取前30个最亮像素,并为每个正确分类的类别计算三个最强烈Grad-CAM区域的色度值。该方法隔离了相对颜色信息而非原始RGB强度,减少了对帧间亮度变化的依赖。
图6a中的散点图揭示了类别间的部分聚类,因此使用分析来评估颗粒物类型在颜色空间中的分离程度。使用轮廓分数量化分离度,其范围从-1到+1,接近+1的值表示分离良好的簇,0表示重叠,负值暗示误分类。加权平均轮廓分数为0.151(95%置信区间0.131–0.172)。空白强烈 distinct(平均值=0.924,中位数=0.942,四分位距(IQR)=0.038,100%正轮廓,n=1170)。IQR代表中间50%值的分布,表明空白的轮廓分数紧密聚集。花粉显示出弱但为正的结构(平均值=0.081,中位数=0.411,IQR=0.986,69.5%为正,n=930),表明分布广泛但具有正核心。另一方面,粉笔(平均值=-0.341,29.0%为正,n=790)和盐(平均值=-0.283,36.5%为正,n=1043)表现出显著重叠。色度质心之间的马氏距离(一种考虑方差和协方差的多变量分离度量)确认粉笔和盐是最接近的对(距离=0.765)。这些发现表明CNN性能依赖于结合形态和光谱线索,而非仅靠色度。
Grad-CAM可视化支持这一解释,显示网络注意力集中在局部化的发射结构上,无论大小。这些光谱趋势可以在图6b中直观观察到,该图展示了每种颗粒物类型的代表性图像块。这些块对应于Grad-CAM实际突出显示的区域(即图5a中的图像区域)。粉笔一致表现为明亮、饱和的粉色斑点,花粉为独特的绿色特征,盐为强度较低、弥散的斑块,显示黄色和红绿强度混合。空白区域显示很少或无信号。
这些光谱特征在图6c中得到进一步说明,该图显示了每种颗粒物类型在100%激光功率下成丝相互作用期间的代表性发射光谱。每个光谱使用B&W Tek Glacier X光谱仪记录,积分时间1秒,并通过减去暗背景和仅成丝参考谱进行处理,以确保准确的颗粒物特定发射 profile。很明显,粉笔在可见光范围内表现出多个尖锐峰,与钙的离散电子跃迁一致,这主导了其发射特征。花粉表现出不同的 profile,其特征在于跨越大部分可见光谱的宽发射带,在500–550 nm附近的绿色区域有显著特征。这种行为指示了复杂的有机荧光团(如类黄酮和类胡萝卜素)以及痕量金属元素的次要贡献,这些元素可能引入弱的窄发射线。这种化学多样性产生了更丰富的光谱特征,与Grad-CAM块和色度散点图中观察到的弥散绿色调一致。相比之下,盐以589 nm附近的强烈特征(对应于钠D线)为主,光谱在其他波长仅有一些附加结构。总的来说,这些发现强化了颗粒物分类基于基本组成差异,粉笔和盐呈现高度可分离的、线状主导的光谱,而花粉占据了一个与盐部分重叠的更连续的光谱空间。
Grad-CAM分析提供了影响预测区域的大致可视化,但并未完全捕捉网络的完整内部特征抽象。突出显示的区域代表一个贡献因素而非完整的决策基础。因此,即使存在重叠的光谱特征,CNN实现高准确率的能力意味着它还利用了微妙的空间模式和高阶特征组合,超出了简单的颜色空间可分离性。
虽然本研究中相机与成丝之间的距离为18 mm,但这项工作展示了一种对成丝发射事件进行分类的原理验证技术。由于成丝具有在远距离上保持高峰值强度的独特优势(不同于快速发散的传统高斯光束),这意味着可以从位于数十至数百米外的颗粒物获得强烈的散射和烧蚀信号。尽管本研究侧重于在受控条件下使用侧置相机进行原理验证测量,但未来的方法学可以利用望远镜光学和偏移抛物面镜进行后向散射收集,以从成丝沿线的任何点检索信号,实现远程单端传感。此类发展将使基于成丝的诊断技术从实验室环境应用到现实世界场景,包括大气监测和远程气溶胶表征。
尽管我们证明了在受控实验室条件下自动颗粒物探测的可行性,但在实际部署中,各种因素(如可变气流和波动的湿度、温度)可能影响性能。距离限制和天气效应(包括光学元件上的冷凝或灰尘积聚)也可能影响成像质量和分类准确率。为解决这些限制,未来的工作将涉及在不同环境条件下系统性地增强图像数据集,并开发能够在动态设置中运行的集成采样-成像设置。通过在不同条件(气流、湿度、光照(日光)状态)下的观测反馈对神经网络进行迭代优化,将提高检测准确率和在多变条件下的韧性。未来的工作还需要探索自适应光学和光束整形,以在现实环境中的可变条件下保持成丝稳定性。
所提出方法在现实环境中的适用性还需要解决大气中存在的各种环境气溶胶。例如,环境气溶胶通常包含各种具有可变形态、组成和 thus 光学特性的复杂混合物,这可能降低分类置信度并增加干扰可能性。虽然通过扩展数据集以包含更广泛的颗粒物类型,同时引入“未知”类别和基于置信度的阈值将进一步提高鲁棒性,但解决这些限制可能需要替代的神经网络,例如YOLO,它可以对图像或散射事件中的特定区域进行分类。此外,物理信息神经网络通过嵌入激光-物质相互作用和成丝诱导烧蚀产生的特征光谱特征的先验知识,为更准确的分类提供了一条有前景的途径。在学习过程中纳入这些物理约束可以引导神经网络朝着物理上合理的预测方向发展,从而改善复杂气溶胶混合物的区分,并减少在可变环境条件下的模糊性。
结论
我们证明了飞秒激光成丝结合光学成像和轻量化深度学习用于空气中颗粒物远程识别的可行性。粉笔尘、花粉粒和盐晶体被引入激光成丝,它们的相互作用产生光学发射事件,这些事件被成像并随后用于训练和评估神经网络。该模型在所有类别上实现了高准确率,包括在测试由产生85%激光功率的成丝引起的发射事件时也是如此。对神经网络分类中重要的光学发射事件的红 vs. 绿色度值的散点图突出显示空白、粉笔、花粉和盐特征具有不同的光谱值。因此发现神经网络关注于区分性颗粒特征而非背景信号。
虽然通过更大的数据集和更高帧率成像可能会提高性能,但本研究为单颗粒空气中颗粒物的实时远程传感奠定了清晰的基础。未来的工作将侧重于通过扩展覆盖范围以包含更广泛的空气中颗粒物、延长成丝长度以及整合光谱-空间特征以实现多模态分类来增强鲁棒性。