FRESH:一个用于多参数环境监测和短期预测的自主物联网平台 Feiling Pan 和 James A. Covington

《Analytica》:FRESH: An Autonomous IoT Platform for Multi-Parameter Environmental Sensing and Short-Term Forecasting Feiling Pan and James A. Covington

【字体: 时间:2026年05月12日 来源:Analytica 3.6

编辑推荐:

  **摘要** 环境监测系统通常受到高成本、便携性有限、污染物覆盖范围受限以及依赖固定基础设施的制约,这些因素限制了它们在分布式实时感知中的应用。本文介绍了FRESH——一个基于物联网(IoT)的自主平台,用于多参数环境监测和短期预测。该系统集成了空气质量、温度条件、光照、声学

  **摘要**
环境监测系统通常受到高成本、便携性有限、污染物覆盖范围受限以及依赖固定基础设施的制约,这些因素限制了它们在分布式实时感知中的应用。本文介绍了FRESH——一个基于物联网(IoT)的自主平台,用于多参数环境监测和短期预测。该系统集成了空气质量、温度条件、光照、声学和天气传感器,并支持基于GSM的远程数据传输、机载数据记录以及混合电池-太阳能电源管理。FRESH被部署在英国考文垂的多个室内和室外地点以及华威大学,在10个月的时间里评估了其在不同环境条件下的实际性能。除了连续的环境监测外,还开发了机器学习模型来预测选定环境变量的短期变化。在测试的模型中,对于几个关键参数(包括颗粒物(R2 = 0.93)、挥发性有机化合物(R2 = 0.92)和臭氧(R2 = 0.98)获得了最佳的预测性能。结果表明,FRESH具有支持便携式多参数环境监测的潜力,并结合了短期预测功能,为分布式感知和本地化预警应用的发展提供了基础。

**1. 引言**
环境污染日益成为公共健康问题,在城市和工业环境中都是一个主要挑战。大约90%的欧洲城市面临较高的空气污染水平[1],长期暴露于污染环境中与身体健康问题[2]和不良心理健康结果[3]有关。同时,最需要环境监测的地方可能缺乏可靠的基础设施,特别是接入主电源和稳定的互联网连接,这限制了传统监测系统的部署[4]。现有的环境监测系统也存在实际限制:许多系统仅监测有限的变量,提供有限的实时数据访问,或依赖固定基础设施,降低了其分布式和便携使用的适用性。尽管短期预测对于在潜在有害环境变化发生之前识别它们具有重要价值,但预测能力常常缺失。这些限制促使人们开发出便携、自主、能够进行多参数感知的系统,并支持实时观测和短期预测。

为了改善环境监测,已经探索了多种方法。NB-IoT(物联网)和边缘计算系统被用于实时检测和早期预警空气污染物(如CO2和烟雾),具有低功耗和长距离通信的优点,但存在传感器精度和潜在覆盖范围差距的限制[5]。为了提高空气质量监测,De Vito等人结合了电化学和颗粒物传感器以及数据驱动的校准方法和实时数据管理工具[6],而Zafra-Perez等人将低成本颗粒物传感器与官方监测站进行校准,并将气象数据纳入现场部署[7]。De Vito还开发了一个分布式隧道监测网络,将污染物测量数据与交通流量信息联系起来[8]。更广泛地说,基于物联网的环境监测综述显示,基于Arduino的系统在该领域占主导地位,而相对较少的研究结合了GSM连接、太阳能或定制服务器基础设施[4]。此外,电源管理[9,10]、人体工程学设计[4]、传感器覆盖范围[11]、数据分析和可视化[12]以及长期传感器精度和稳定性[13]仍然是持续面临的挑战。最近,基于机器学习的预测技术也受到了越来越多的关注。例如,Misra和Li应用LSTM方法进行环境预测,并报告了有希望的预测性能[14]。

为了应对这些挑战,本文介绍了FRESH(Friendly peRsonalised Environmental Screening for Healthy living),一个基于物联网的自主平台,用于多参数环境监测和短期预测。FRESH集成了空气质量、温度条件、光照、声学和天气传感器,并支持通过GSM进行远程传输、本地存储以及混合电池-太阳能电源管理。该系统在华威大学校园和考文垂市区进行部署,以评估其在不同环境中的实际运行情况。此外,还开发了机器学习模型来研究选定环境变量的短期预测。因此,本研究的目的是描述FRESH平台的设计和部署,并评估其作为具有集成短期环境预测功能的便携式多参数感知系统的潜力。

**2. 材料与方法**
在这项研究中,开发了一个FRESH单元网络,用于室内外环境监测。与大型固定监测站相比,FRESH旨在提供更高的便携性、更广泛的感觉能力和更低的部署成本,同时支持实时数据采集、本地存储、远程传输和短期预测。该系统测量环境条件(温度、湿度、压力)、声学因素(噪音)、光照条件(光强度和紫外线(UV)光)、天气变量(风速、风向和降雨量)以及空气质量指标(CO2、CO、NO2、SO2、O3、挥发性有机化合物(VOCs)和颗粒物(PM)。选择这些变量是因为它们与人类健康和环境暴露有关,包括温度和湿度对皮肤和呼吸健康的影响[15,16],高浓度CO2[17]、噪音[18]、VOCs[19]、UV辐射[20,21]、PM2.5[22]以及NO2、O3、SO2和CO等气体污染物对呼吸系统和更广泛健康结果的影响[23,24,25]。本研究使用的风险阈值来自文献和WHO指南,并在表1中总结[26,27,28,29,30,31,32,33,34,35,36]。对于颗粒物,风险范围基于24小时平均浓度而非瞬时值,以减少短暂波动对环境安全评估的影响。

**2.1. 硬件设计**
FRESH硬件被设计为一个紧凑的、自主的多参数环境监测平台。该系统集成了温度条件、空气质量、光照、声学和天气传感器,以及机载数据记录、GSM通信和混合电池-太阳能电源管理。表2总结了当前实现中使用的传感器。在某些情况下,为了扩大检测能力和潜在提高不同环境条件下的测量精度,对相关污染物配备了多个传感器。这些传感器根据测量范围、功耗、尺寸、接口兼容性和集成到便携式现场单元的适用性进行选择。VOC和NOx指数是传感器提供的相对值,范围从1到500。这些指数值是无单位的,用于识别相对污染事件而非绝对质量浓度。由于早期现场测试表明天气条件对解释环境测量结果很重要,因此加入了SparkFun(Niwot, CO, USA)的天气套件(SEN-15901),包括风速计、风速计和雨量计。GSM连接通过SIM7600E模块(SIMCom, Shanghai, China)提供,用于通过UART接口进行远程数据传输。主控制器是Microchip(Chandler, AZ, USA)的SAMD51微控制器,拥有120 MHz Cortex-M4核心、1 MB闪存和256 kB RAM。图1提供了FRESH系统的概览。

**2.2. 软件设计**
FRESH软件架构包括运行在微控制器上的嵌入式固件和用于数据接收、存储和可视化的服务器端平台。嵌入式软件使用Arduino C和Arduino IDE 2.2.1在华威大学开发,控制传感器采集、信号处理、校准程序、本地存储和无线传输。传感器数据在定义的时间间隔内采样,格式化为JSON,并通过SIM7600 GSM模块(SIMCom, Shanghai, China)使用HTTP POST传输。固件还支持串行调试和SD卡备份,以在通信中断时提供本地数据冗余。在服务器端,使用Ubuntu Linux开发了一个基于Flask的网络应用程序,用于接收、存储和显示上传的测量数据。该平台使用Python v3.10、MySQL v8.0、HTML5、CSS3、JavaScript(ECMAScript 2022)和Vue.js v3.2实现,支持桌面和移动访问。上传的数据存储在MySQL数据库中,并通过基于浏览器的仪表板展示,允许用户查看来自各个FRESH单元的测量数据、浏览部署位置、按日期过滤记录并导出选定数据集进行进一步分析。图3显示了用于数据可视化和设备管理的仪表板界面。

**2.3. 校准**
为了在不同操作条件下提高测量可靠性,对选定的FRESH传感器进行了多点校准。校准包括将每个传感器暴露在定义的参考条件模型下,记录传感器响应,并拟合测量值和参考值之间的校正关系。表3总结了本研究中使用的校准源、校准点和参考仪器。对于气体传感器校准,使用在空气中预定义浓度下的认证气体 cylinders 作为参考源,无需进一步稀释。例如,温度校准使用设定在0、5、10、15和20 °C的温度控制室(QED Mini-Excel)进行。FRESH单元被放置在室内,相应的传感器读数在每个设定点记录下来,室内温度与参考源进行验证。然后使用回归分析定义传感器输出和参考温度之间的关系,并将得到的校准方程应用于校正传感器响应。校准后,单元在同一条件下重新测试。温度测量误差从校准前的约±1.2 °C降低到校准后的约±0.3 °C。对于气体校准,以NO2为例,我们遵循了为安全产品设计的行业标准方法。我们使用了符合ISO 6142[36]、ISO 6143[37]或ISO 16664[38]标准的气体 cylinders。FRESH和仪表位于相同的受控连续流路径上,气体通过FRESH单元的入口端口输送。采样间隔设置为3秒,同时记录FRESH ADC值和仪表读数。为了减少Alphasense NO2-A43F传感器原始信号的噪声波动,通过滑动平均滤波提取出了平滑的响应趋势线。基于该传感器的线性响应特性,使用线性回归模型将平滑后的ADC响应值与仪表数据(0–5 ppm)相关联[39]。校准完成后,通过第二次实验确认了模型的准确性。NO2校准曲线和数据处理细节见补充信息中的S2节。工厂校准的VOC传感器SGP41(Sensirion AG,瑞士St?fa)和ENS160(ScioSense,荷兰Eindhoven)的功能性能使用了100 ppm的异丁烯源进行了验证。该测试作为功能检查,以确保在FRESH系统的概念验证框架内传感器的完整性和响应性,而不要求对VOC指数进行高精度的定量校准。

2.4. 机器学习
FRESH平台的一个关键目标是研究是否可以将短期预测与实时环境监测相结合。除了支持早期识别潜在的不利环境条件外,预测建模还有助于减少由于通信故障或电源中断导致的临时数据损失的影响。这对于FRESH尤为重要,因为该系统使用太阳能辅助供电,在北半球冬季等阳光较少的时期可能会经历能源可用性的降低。在这项研究中,使用了FRESH在2024年8月至10月期间收集的数据,开发了时间分辨率为5分钟的短期预测模型。基于之前的环境预测研究[40,41,42,43,44,45],选择了三种建模方法进行比较:K最近邻(KNN)、自回归积分滑动平均(ARIMA)和长短期记忆(LSTM)网络。选择KNN是因为其计算复杂度低,并且适合无需大量预训练的局部预测。选择LSTM是因为它可以捕获非线性时间依赖性,并在时空环境预测任务中表现良好。这些方法共同提供了非参数机器学习模型、深度学习序列模型和传统统计预测模型之间的比较。

对于每个环境变量,分别训练和评估了模型。KNN模型在不同的邻居数量(k = 2–10)范围内进行了测试,以确定每个变量的最佳配置。ARIMA模型参数使用auto.arima()程序选择。使用Augmented Dickey–Fuller检验评估平稳性,并在需要时应用差分以改善平稳性。然后根据赤池信息量准则(AIC)[44]进行模型选择。对于LSTM,使用滑动窗口方法构建时间步长数据集来捕捉时间依赖性。该网络由一个包含50个神经元的LSTM层和一个全连接输出层组成。训练采用32的批量大小进行了100个周期。

模型性能使用决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)[46]进行评估。这些指标用于比较三种方法在所有监测变量上的预测性能,并确定每个变量最合适的模型。最佳模型结果见第3.3节和表4。

3. 结果
3.1. 部署
FRESH设备被部署在英国考文垂市中心的多个地点以及华威大学校园内,包括停车场、建筑后院、室内建筑位置和公交车站。这些地点在空气流通、人类活动、污染源接近度和局部微气候条件方面存在差异。在不同的天气和活动条件下进行了超过6个月的监测,以评估系统在不同环境中的运行情况。同时,应用ARIMA、KNN和LSTM模型为选定的环境变量生成短期预测。在新生周(2024年9月14日至20日),当交通和校园活动增加时,温度、湿度、CO2、CO、NO2、SO2、O3和与天气相关的变量保持在定义的健康范围内。公交车站的噪声水平仅偶尔超过80 dB阈值。最高的PM10峰值出现在停车场(180 μg/m3),尽管其24小时平均值仍在其可接受范围内。所有地点的PM2.5浓度平均低于15 μg/m3。某些时期的UV指数值偶尔超过9。VOC在校园内代表了最一致的超标信号,特别是在室内实验室位置和停车场。通风有限的封闭空间内的VOC水平较高,而停车场内的较高值与车辆排放一致。更多特定站点的详细信息见补充信息。

从2024年8月到2025年6月,一个FRESH设备被部署在一条繁忙的城市道路上,靠近一个社区图书馆。选择该地点是因为其交通密度高且靠近商业和居民区。图4显示了平均每日超标频率。VOC的超标频率最高,其次是PM2.5和PM10。周末PM超标频率的增加可能与社区图书馆相关的私人车辆流量和短期停车(接送)有关。相比之下,UV超标频率始终较低,没有系统性的周偏差。这些结果表明FRESH平台能够足够敏感地捕捉到由活动驱动的局部环境变化。

图4. 2024年8月至2025年6月考文垂城市部署站点监测变量的平均每日超标频率。

图5比较了2024年9月16日至2025年5月16日期间工作日和周末五个代表性环境中的PM2.5超标事件平均数量:城市区域、校园公交车站、校园停车场、校园建筑后院和校园室内区域。城市站点的超标频率最高,其次是校园停车场,而其他校园位置的超标频率较低。

3.2. 数据概览
图6展示了2024年6月至8月期间部署在建筑后院的FRESH单元收集的测量数据的热图。该图总结了测量环境变量之间的相关性。观察到PM2.5和PM1之间存在强正相关(0.83),这与颗粒物的相关性一致。O3与温度(0.61)、光照(0.58)和UV(0.57)呈正相关,这与在高光照和温度条件下光化学臭氧的形成一致[47]。NO2与湿度(0.68)呈正相关,而SO2与温度(0.53)也呈正相关[48]。如先前对电化学气体传感器的研究所述,传感器响应也可能受到环境温度和湿度的影响[49]。NO2与温度(?0.63)和NO2与O3(?0.58)之间呈现负相关,这与涉及氮氧化物和臭氧的温度依赖性大气反应路径一致[50]。SO2与湿度(?0.55)、噪声(?0.57)和降雨(?0.63)呈负相关。降雨可能通过湿沉降减少大气中的SO2[51]。

图7显示了2024年9月至2025年6月期间City、Backyard、Bus Station、Laboratory和Parking Lot站点PM2.5、VOC指数、NOx指数和噪声的每周平均值。近一年的部署显示了系统的长期耐用性。Laboratory站点的数据间隙主要是由于设备被重新分配用于并行实验,而其他站点的轻微间隙是由于太阳能充电有限,尤其是在冬季月份。PM2.5在大多数监测期间保持在15 μg/m3以下,但在2024年11月底和2025年5月初在City和Backyard站点有所增加。VOC指数通常保持在200以下,除了2025年2月底在Bus Station和Backyard站点略有增加。噪声水平大多在45至60 dB之间波动。这些数据表明,在监测的各个站点中,超标事件是偶发的而非持续的,并且取决于污染物类型和位置。

3.3. 短期预测性能
在数据处理和实验设计阶段,本研究遵循了时间序列分析的标准程序。数据集涵盖了2024年9月至2025年9月的停车场环境的年度监测记录。本研究采用时间顺序验证而不是随机分割,将年度数据分为70%的训练数据、10%的验证数据和20%的独立测试数据。这种结构确保模型仅基于历史信息进行预测。在模型训练期间,为深度学习架构引入了基于验证损失的提前停止机制。当验证集的性能连续五个周期没有改善时,自动停止训练以降低对历史噪声的过拟合风险。该实验使用单步多步预测,使用前12个时间步长(1小时)的观测值作为输入。通过滑动窗口技术,捕捉环境指标的波动和滞后效应,以实现接下来三个时间步长(15分钟)的短期预测。为了设定性能基准,本研究比较了多种模型,包括经典的统计ARIMA模型、作为非参数机器学习代表的KNN回归(K值范围从1到10用于参数优化),以及作为深度学习序列模型的LSTM网络。最终,使用R2和RMSE确定了每个监测变量中表现最佳的预测方法。

本研究直接对NO2、SO2、CO和O3传感器的ADC原始读数进行了建模。这种在电信号级别的低层次时间序列分析旨在减少由浓度转换公式引起的二次误差的积累,并保留传感器的原始响应特性。表4总结了每个环境属性的最佳模型。

通过比较多个模型,发现不同变量的预测性能各不相同。对于环境参数,温度和湿度显示出高可预测性。ARIMA和KNN的性能显示了这种数据的周期性和惯性。对于核心空气质量指标PM1、VOC(ENS)和O3(ZMOD),LSTM模型取得了高分,表明深度学习网络可能具有捕捉复杂环境中与污染物变化相关的非线性时间模式的潜力,而CO2、PM2.5和VOC(SGP)则使用ARIMA模型表现最佳。对于气象和物理波动参数,风力(ws)、风向(wd)和紫外线辐射(UV)的预测准确性处于中等水平。这可能是由于建筑物障碍物和车辆运动在停车场微气候中造成的湍流。对于光照指标,尽管KNN(k = 10)捕捉到了一些趋势,但较大的RMSE反映了与快速天气变化(如云层覆盖)相关的预测挑战。在复杂气体组分的预测中,虽然ARIMA和KNN表现出一定的适应性,但它们的R2值通常在0.32到0.68之间。这主要是因为实验使用了具有宽测量范围的工业级传感器,而实际环境中的污染物浓度远低于其满量程值。因此,传感器信号受到背景噪声的影响。

值得注意的是,噪声指标的R2值仅为0.123,是所有预测维度中最低的值。这可能是因为噪声主要由离散和瞬时的声音源(如车辆喇叭和发动机启动-停止事件)驱动,缺乏长期预测记忆。

在这项研究中,机器学习被用于两种目的:估计缺失值和支持15分钟的短期趋势预测。当有限的阳光导致数据中断时,模型用于根据历史模式估计缺失值,并探索滚动短期预测的可行性。这些结果应被视为初步的概念验证,在用于操作预警或决策支持应用之前需要进一步验证。**讨论**
本研究提出了FRESH,这是一个基于物联网(IoT)的自主平台,用于多参数环境监测,并具备集成短期预测功能。该系统结合了空气质量、温度条件、光照、声学和天气的感知能力,以及GSM传输、本地存储和太阳能辅助的电力管理技术。与文献中报道的许多环境物联网系统不同,FRESH旨在同时满足监测需求和在实际环境中(包括室内和室外)的长期部署需求。这种广泛的感知能力、便携的部署方式以及集成的预测功能是该平台的主要优势之一。先前的综述和研究指出,许多现有系统在感知范围、电力自主性、远距离通信或实时数据访问方面存在局限性[4,11,13],而更专业的系统通常专注于特定的污染物群体或特定的应用场景[5,6,7,8]。

现场部署结果表明,FRESH能够区分不同的环境环境和污染物特征。校园内的检测点中,大多数监测变量的超标频率较低;而在室内实验室、停车场和城市道路沿线的检测点,挥发性有机化合物(VOCs)的超标频率较高。城市环境中的VOCs和颗粒物超标情况也比校园环境更为普遍。这些结果表明,该平台能够捕捉到具有不同交通密度、通风条件和人类活动模式的环境之间的显著差异。相关性分析进一步显示,FRESH收集的数据结构足够清晰,能够显示出某些污染物与气象变量之间的预期关系,尤其是颗粒物组分以及臭氧、光照、紫外线和温度之间的关系。

预测结果初步证明了将短期预测集成到分布式环境监测中的潜在价值。没有一种模型在所有变量上都表现最佳。ARIMA模型在温度、二氧化碳(CO2)等相对稳定或具有规律变化的变量上表现出较好性能;KNN模型在湿度、VOC(SGP)等变化较大的污染物上表现良好;LSTM模型在PM1、VOC(ENS)和臭氧(ZMOD)的预测上取得了最佳效果。这一模式表明,模型的适用性可能取决于被预测变量的时间变化特性,而并非存在一种普遍适用的预测方法。这方面的发现与早期研究结果一致,即不同的预测模型适用于不同的环境预测问题,这取决于数据结构、非线性和时间依赖性[14,40,41,42,43,44,45,46]。

本研究也发现了一些局限性。首先,部署规模相对较小,仅有少数FRESH设备在校园和城市地区运行,且部分监测期间的污染物水平较低。其次,尽管校准程序提高了部分传感器的测量性能,但尚未在所有监测变量上对参考级仪器进行全面的验证。第三,预测模型是基于有限的时间段训练的,因此应将其视为短期预测的概念验证,而非一个完全可推广的预测框架。此外,本研究未对平台的仪表盘或警报功能进行正式的用户评估,因此该系统在实际应用中对公众决策支持的有效性仍有待验证。

从工程角度来看,未来仍有几个发展方向:扩大部署范围可以提高数据的代表性,为评估设备在不同季节和地点的功能提供更坚实的基础;与参考仪器进行更广泛的比较可以增强对传感器性能和长期漂移行为的信心;通过延长训练时间、增加模型类型以及为不同环境变量设定明确的预测周期,可以进一步改进预测框架。在用户端,专门的移动界面或警报系统可以使该平台在提升环境意识和提供决策支持方面更加实用。最后,FRESH依赖太阳能供电在光线不足的情况下(尤其是在冬季)仍有局限性,这凸显了进一步优化能量收集和电力管理的必要性。总体而言,结果表明FRESH是一个有前景的分布式环境感知平台,但仍需进一步验证和完善。

**结论**
本研究描述了FRESH的设计、部署及初步评估结果。FRESH是一个基于物联网的自主平台,用于多参数环境监测和短期预测,集成了空气质量、温度、光学、声学和天气感知功能,以及GSM通信、本地数据存储和混合电池-太阳能电力管理技术。在校园和城市环境中的现场部署表明,该平台能够长期收集多参数环境数据,并区分不同的环境条件。预测结果表明,对于一些关键变量,短期趋势预测是可行的,尽管表现最好的模型因变量而异。这些结果为分布式环境监测和未来 localized 警报系统的开发提供了有用基础。然而,在将该平台转化为经过全面验证的实际应用解决方案之前,还需要扩大部署范围、改进用户界面测试,并进一步研究传感器漂移现象和冬季电力管理问题。

**补充材料**
相关支持信息可下载地址:
https://www.mdpi.com/article/10.3390/s26103015/s1
- 图S1:FRESH的电路板
- 图S2:NOx的校准过程
- 图S3:环境要素的箱线图
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号