迈向单粒子电感耦合等离子体质谱中原始数据处理的标准化

《Talanta Open》:Towards the harmonization of raw data processing in single particle inductively coupled plasma mass spectrometry

【字体: 时间:2026年02月22日 来源:Talanta Open 3.7

编辑推荐:

  本研究系统评估了SP-ICP-MS数据处理工具的可靠性,通过SPCal开源软件与专用软件对比,验证了基于5倍标准差临界值的阈值算法在降低误判粒子事件(<10次/小时)方面的有效性,提出需根据基线强度(Poisson或Gaussian分布)动态选择临界值计算方法,为行业数据标准化处理提供依据。

  
伊莎贝尔·阿巴德-阿尔瓦罗(Isabel Abad-Alvaro)|爱德华多·博莱亚(Eduardo Bolea)|弗朗西斯科·拉博尔达(Francisco Laborda)
分析光谱与传感器小组(GEAS),萨拉戈萨大学环境科学研究所(IUCA),佩德罗·塞尔布纳街12号,50009萨拉戈萨,西班牙

摘要

尽管已经有了针对单粒子电感耦合等离子体质谱(SP-ICP-MS)的先进数据处理工具,但由于缺乏验证,用户仍不能完全依赖这些工具来获得可靠和准确的信息。在这项工作中,我们对现有的数据处理方法进行了深入评估,特别关注了用于计算基线和粒子读数区分临界值、粒子事件计数以及确定其总强度的标准和表达式,以便在该领域内促进这些方法的标准化,尽管主要关注的是四极杆仪器。基线强度是最关键的变量,因为其大小决定了应根据具体情况应用泊松(Poisson)还是高斯(Gaussian)方法来区分基线和粒子读数。在覆盖因子为5的情况下应用相应方法后,在各种实验条件下(基线强度、读数次数、停留时间),假阳性(将基线读数误认为是粒子事件)的发生率低于10%。然而,在存在纳米粒子和微粒子以及停留时间较短的情况下,使用较低的覆盖因子(例如3)会导致假阳性增加,这是因为低强度粒子事件更易发生。因此,应避免这种条件。
使用免费且开源的SPCal工具处理在不同停留时间和基线水平下测量的纳米粒子和微粒子悬浮液的数据时,当应用适当的临界值时,可以得到可靠的计数结果和总强度。因此,这一工具验证了一种专有软件的概念验证,证实了其结果的可比性,除非是在高基线水平或使用短停留时间的情况下,前提是应用了原本未在该专有软件中实现的临界值计算方法。

引言

自从第一台具有单粒子检测功能的商用电感耦合等离子体质谱仪问世以来已经过去了十年[1],而单粒子电感耦合等离子体质谱(SP-ICP-MS)的概念提出也已超过二十年[2]。这项技术经历了在仪器、计量学和方法论层面上的快速发展。如今,SP-ICP-MS方法已被广泛应用于各种分析问题,并已成为一种广泛商业化的常规工具[3]、[4]、[5]。根据霍里克(Horlick)[6]的观点,可以说SP-ICP-MS已经度过了其发展初期阶段,可以认为是成熟的。然而,与该技术的计量学方面以及数据处理相关的一些问题仍需要进一步标准化,以便更广泛地推广和应用SP-ICP-MS。
SP-ICP-MS的发展与快速数据采集ICP-MS光谱仪的商业化密切相关,这使得停留时间可以缩短至10微秒,而不再是毫秒级别[1]、[7]。由于粒子事件的持续时间在几百微秒范围内,使用毫秒级停留时间时,事件会被记录为脉冲(每次读数一个事件),而使用微秒级停留时间时,则会被记录为多个读数形成的峰。因此,当每次读数一个事件时,可以使用电子表格(如Single Particle Calculation (SPC)工具[8]进行数据处理;但当每次读数多个事件时,则需要更复杂的数据处理工具。这促使ICP-MS制造商在其软件中开发了专门的数据处理模块[7]。这类专有软件的缺点在于实现的算法并不总是公开,且其验证过程也不直观。Chronakis等人[9]最近总结了SP-ICP-MS中使用的各种数据处理工具。在这方面,现在已经有了用于SP-ICP-MS数据处理的开源和免费工具(SPCal [10]、[11],网址:https://github.com/djdt/spcal 和 TOF-SPI [12],网址:https://github.com/TOFMS-GG-Group/TOF-SPI)。TOF-SPI是一款专为特定ICP-TOF仪器编写的数据处理软件,而SPCal则是一个开源软件,可以处理来自任何类型ICP-MS光谱仪的原始数据,包括使用ICP-TOF-MS仪器记录的质量谱。
计量学标准化包括明确的数据处理标准和确定SP-ICP-MS中不同测量量的程序,以及估算相应检测限的表达式。最近,ISO修订了2019年发布的SP-ICP-MS技术规范[13],涵盖了校准和实验程序方面的内容,但未涉及原始数据的基本处理。关于检测限,Currie提出的用于估算泊松分布数据浓度检测限的方法[14]已被应用于SP-ICP-MS,并提出了元素质量、粒子大小和数量浓度检测限的标准和表达式[15]、[16]。
SP-ICP-MS数据处理的关键步骤是区分基线读数和粒子事件对应的读数。最常用的方法是基于基线标准差定义的阈值(z-sigma标准),超过阈值的粒子读数被视为异常值[17]、[18]。将这种方法应用于数据集的最简单方法是计算整个数据集的平均值,移除所有高于平均值加上标准差倍数的读数,然后迭代处理剩余读数,直到没有更多读数需要移除[17]。这种方法假设基线遵循高斯分布。然而,ICP-MS信号实际上受泊松过程控制[19],只有在高计数强度时才会呈现高斯分布;否则,由于闪烁噪声占主导,信号遵循类泊松分布。Laborda等人[15]在研究四极杆仪器时考虑了低计数基线的泊松特性,而Gundlach-Graham等人[20]证明,在现代飞行时间仪器中,基线遵循复合泊松分布,这会由于微通道板探测器的快速模拟-数字转换增益统计而产生额外的噪声成分。在这两种情况下,基线标准差不是直接测量的,而是通过基线计数强度的平方根来估算[14]。对于四极杆仪器,基线的特殊行为导致在处理数据集时需要根据基线强度应用所谓的泊松滤波器或高斯滤波器[10]。
将SP-ICP-MS的基线读数及其分布视为空白测量,可以应用Currie提出的临界值概念来描述传统定量方法的检测能力[14],并将阈值视为临界值[15]、[20]。传统意义上的临界值是指仪器响应高于该值时,可以可靠地认为存在分析物,但这意味着存在一定的误检测概率,从而产生假阳性。在SP-ICP-MS中,临界值有助于控制假阳性的数量(将基线读数误认为是粒子读数的情况),应将其降至零[21]或降至最低[22],以避免降低浓度检测限的准确性。由于SP-ICP-MS中的基线分布是离散的而非连续的,因此可以通过上述的z因子来实现这种零水平的假阳性。尽管通常应用3作为临界值[17],但采用传统浓度检测限计算公式中的典型值并不能完全消除假阳性,而使用5作为临界值已被证明是在不同数据采集条件下避免假阳性同时不降低小粒子检测能力的合理折中方案[16]、[21]、[23]。
尽管在数据处理及其工具实现方面取得了许多进展,但SP-ICP-MS用户似乎仍未充分认识到其重要性,或仍不愿对数据处理方法进行标准化。以2024年发表的88篇关于四极杆SP-ICP-MS的文章为例,只有半数文章报告了所使用的数据处理软件/工具。在报告软件的文章中,一半使用了仪器制造商提供的软件,25%使用了自行开发的工具(电子表格或用Python、MATLAB、GNU Octave、R编写的程序)。另外25%使用了免费工具(主要是SPC电子表格或SPCal),或之前为激光烧蚀ICP-MS开发的软件(Hyper Dimensional Image Processing)。关于所应用的阈值标准,只有三分之一的文章进行了报告,其中3-sigma是最常用的(43%),其次是5-sigma(36%)。不过,超过20%的文章报告了其他替代标准的应用。在大多数研究中,都假设基线遵循高斯分布;而不到7%的出版物考虑了泊松分布。
鉴于目前有免费、开源且文档齐全的数据处理工具可用,SP-ICP-MS用户有机会以更灵活的方式检查和验证他们的结果以及所使用的工具。然而,使用这些工具需要具备相应的知识和程序。因此,本工作的目标是利用免费工具SPCal,在多种实验条件下评估用于计算SP-ICP-MS临界值的不同标准和表达式,验证这些工具的有效性,并比较使用专有软件所获得的结果。最终目标是建立可靠的标准化标准,以促进SP-ICP-MS数据处理方法的统一和验证。

仪器介绍

本研究使用了Perkin-Elmer NexION 2000B质谱仪(加拿大多伦多)进行单粒子模式的ICP-MS测量。样品引入系统包括一个玻璃同心雾化器和一个带挡板的气旋喷雾室(Meinhard),用于引入纳米粒子。实验中使用的氩气雾化器流量为1.02 L min-1,样品流速为0.377 mL min-1。对于微粒子的分析,使用了Asperon?线性通道喷雾室样品引入系统(Perkin)

基线/粒子读数的区分:临界值的计算

尽管已经采用了一些标准来区分粒子读数和基线读数,但普遍认为应采用非常严格的标准以尽可能消除所有基线读数,从而减少假阳性的发生,因为假阳性会被误认为是粒子,从而影响浓度检测限的准确性[21]、[22]。然而,过于严格的标准可能会对元素的尺寸/质量产生负面影响

结论

尽管从仪器和方法论的角度来看,SP-ICP-MS已经是一项成熟的技术,但由于可用的数据处理方法众多且缺乏标准化,其在数据处理方面仍存在严重限制。这意味着用户不能完全依赖现有的数据处理工具来获得可靠和准确的信息。在这种情况下,开源和免费的数据处理工具的可用性有助于巩固其计量学基础

作者贡献声明

弗朗西斯科·拉博尔达(Francisco Laborda):撰写——初稿撰写、监督、资金获取、概念构思。伊莎贝尔·阿巴德-阿尔瓦罗(Isabel Abad-Alvaro):撰写——审稿与编辑、研究、数据管理。爱德华多·博莱亚(Eduardo Bolea):撰写——审稿与编辑、监督、资金获取

数据可用性

数据可在Zenodo平台上获取。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究工作。

致谢

本项工作得到了西班牙科学与创新部(MCIN/AEI/10.13039/501100011033)项目PID2021-123203OB-I00、“ERDF A way of making Europe”以及阿拉贡政府的资助(项目E29_23R)。I.A.感谢欧盟下一代计划(EU)和西班牙大学部的资助(María Zambrano Grant,项目编号MZ-240621)。作者还要感谢萨拉戈萨大学的研究支持服务(Servicio General de Apoyo a la Investigación-SAI)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号