《Epidemics》:Assessing methodological variability in wastewater surveillance: A wavelet decomposition approach
编辑推荐:
本研究针对废水监测中因样本收集与处理方法(如进水与沉降固体)不同而引入的方法学噪声,影响了真实流行病学信号的识别和跨站点可比性这一核心挑战。作者利用离散小波变换对来自加州五个城市的SARS-CoV-2 RNA纵向数据进行分析,分离信号中的高频(噪声)与低频(趋势)成分。研究表明,通过保留低频近似系数进行重构,可有效滤除方法学噪声,使同一城市的不同样本类型(进水与沉降固体)信号紧密聚类,从而揭示共同的流行病学趋势。该方法为废水数据去噪、增强跨区域和样本类型信号可比性提供了可扩展的技术路径。
想象一下,公共卫生部门拥有一个“社区体温计”,能够通过分析居民楼的下水道污水,实时、无创地监控整个社区的健康状况,甚至能在人们大规模出现症状之前,就预警传染病的抬头。这并非科幻,而是“基于废水的流行病学”所描绘的未来。在COVID-19大流行期间,监测污水中的SARS-CoV-2病毒RNA,已成为追踪社区感染趋势的强大工具。然而,这个看似完美的工具内部,却存在一个恼人的“杂音”问题。不同的实验室、不同的采样方法(比如采集未处理的进水,还是采集沉淀下来的固体)、不同的处理流程,都会在最终的数据中引入“噪声”。这些噪声就像一层浓雾,有时会掩盖病毒传播的真实趋势,更严重的是,让来自不同地区、使用不同方法得到的数据难以直接比较。例如,当我们试图整合加州A市污水“进水”的数据和B市污水“沉淀固体”的数据,来绘制一幅全州的疫情地图时,这张地图的波动有多少是真实的疫情变化,又有多少仅仅是采样和分析方法不同造成的“假象”呢?为了拨开这层迷雾,让“社区体温计”的读数更清晰、更可比,由Maria L. Daza–Torres等人领导的研究团队,在《Epidemics》期刊上发表了一项创新性研究。他们尝试用一种名为“离散小波变换”的信号处理“利器”,来精准地区分废水数据中哪些是社区感染的“真实脉动”,哪些是技术操作带来的“不和谐杂音”。
研究人员开展这项研究,主要运用了几项关键技术。首先,他们收集了美国加州中央谷地五个城市在2022年4月至11月间的废水样本,包括进水和沉降固体两种类型,对样本进行处理、RNA提取,并通过逆转录微滴数字PCR检测SARS-CoV-2 N基因RNA,并用辣椒轻斑驳病毒的浓度进行标准化,得到归一化的病毒浓度时间序列数据。面对数据缺失,他们采用了10天移动平均等多种插补方法进行填补。研究的核心是离散小波变换分析,他们选择了Daubechies 4小波基,对每个时间序列信号进行多级分解,得到代表长期趋势的近似系数和代表高频波动的细节系数。最后,他们通过层次聚类 方法,分析原始信号和经过不同尺度滤波后的重构信号之间的相似性模式。
4.1. 小波分解
研究人员对五个城市(埃斯帕托、洛斯巴诺斯、特洛克、温特斯、伍德兰)的归一化SARS-CoV-2浓度时间序列(包括进水和沉降固体)应用了三级离散小波分解。分解将每个原始信号分离为三个细节系数(cD1, cD2, cD3, 对应从高到低的不同频率波动)和一个近似系数(cA3, 代表最平滑的长期趋势)。通过重构每个频率分量的贡献,研究发现,进水和沉降固体信号之间的差异在高频细节分量中最为明显,表现为视觉上不同的模式和较低的相关性;而在低频近似分量中,两种样本类型的信号则表现出高度一致性。这初步表明,方法学差异可能更多体现在短期、高频的波动中,而长期的流行病学趋势是共享的。
4.2. 滤波信号的聚类分析
为了验证上述观察,研究人员系统地“过滤”掉高频噪声。他们通过逆离散小波变换,逐步重建了保留不同低频成分的信号:S1(保留cA3, cD2, cD3)、S2(保留cA3和cD3)和S3(仅保留cA3)。对这些不同“平滑度”的信号进行层次聚类分析,得出了关键结论:对原始信号、S1信号和S2信号进行聚类,均未能形成清晰的、按城市分组的模式,样本类型和城市混杂在一起。然而,当对仅包含最平滑趋势的S3信号(即仅基于近似系数cA3重构的信号)进行聚类时,清晰的、城市特异性的分组出现了——来自同一城市的进水样本和沉降固体样本紧密地聚类在一起。 这一结果有力地支持了研究假设:高频分量(细节系数)主要由样本处理和实验室噪声驱动,而低频分量(近似系数)则反映了共享的、城市层面的流行病学趋势。
本研究通过引入离散小波变换这一强大的信号处理工具,成功地“解码”了废水监测数据中的复杂性。研究结论明确:废水中SARS-CoV-2信号的高频波动成分主要承载了由样本类型(进水 vs. 沉降固体)差异、实验室处理流程等技术因素引入的“方法学噪声”;而平滑的低频趋势成分,则稳健地捕获了社区层面共同的流行病学动态。这意味着,通过有选择性地滤除高频噪声,可以有效地“净化”废水监测数据,从而更清晰地揭示病毒传播的真实轨迹。
这项研究的意义重大且深远。在方法论上,它为解决废水流行病学中长期存在的数据可比性难题提供了一个创新、可扩展的框架。研究证明,即使在不同样本类型、不同处理方法导致原始数据存在显著差异的情况下,通过小波去噪,仍能提取出可比的流行病学核心信号。这对于推动建立区域乃至国家级的废水监测数据整合平台至关重要,因为它为整合来自不同实验室、采用不同协议的数据提供了理论基础和技术路径。在公共卫生实践层面,更干净、更可比的信号意味着更准确的疫情趋势判断、更及时的早期预警,以及更可靠的公共卫生决策支持。最终,这项研究不仅增强了我们“聆听”社区疾病信号的能力,也让这把“社区体温计”变得更加精准和可靠,为未来应对各类传染病威胁提供了更强大的监测工具。