深度學習在空氣污染預測領域的應用：趨勢、技術與未來展望

【字体：大中小】 时间：2026年02月14日 来源：ARTIFICIAL INTELLIGENCE REVIEW 13.9

编辑推荐：

　　這篇系統性綜述聚焦於解決傳統空氣污染預測模型無法充分表徵多污染物、氣象驅動因素和人為影響間複雜非線性交互作用的難題。研究人員整合了全球超過150項同儕評審研究，探討了包括獨立模型、混合模型和先進時空模型在內的廣泛深度學習架構在空氣品質預測中的應用。結果顯示，深度學習模型在明確建模多源輸入和時空依賴性時，通常優於傳統方法。該綜述為尋求透明、可推廣且與政策相關的預測系統的研究者、從業者和決策者提供了全面且關鍵的見解，對環境管理和公共衛生保護具有重要意義。

潔淨空氣是健康生活的必要條件，也是影響整體生活品質的最關鍵因素之一。然而，全球環境正面臨嚴峻挑戰：近99%的世界人口暴露在污染空氣中，其造成的全球經濟負擔估計約為8兆美元。空氣中充滿了包括顆粒物（PM）、硫氧化物（SO_x）、氮氧化物（NO_x）、臭氧（O₃）、一氧化碳（CO）和氨（NH₃）在內的多種有毒污染物，對人體健康造成急性和慢性影響，尤其對兒童、老年人、有基礎疾病者和社會經濟邊緣化社群影響更甚。準確預測空氣污染水準對於預防和控制空氣污染至關重要，然而，傳統的統計和確定性模型由於難以捕捉大氣污染物、氣象變數和人為活動之間的複雜關係，經常無法提供高精度的預報，這激發了人們對深度學習（DL）方法日益增長的應用興趣。

為了系統性地梳理這一快速發展領域的最新進展，一篇發表於《ARTIFICIAL INTELLIGENCE REVIEW》的系統性綜述文章應運而生。該研究旨在透過整合來自不同地理區域、採用多種深度學習架構的超過150項同儕評審研究的證據，提供一個全面且批判性的綜合分析，為尋求透明、可推廣且與政策相關的預測系統的研究者、從業者和決策者提供可操作的見解。

研究人員遵循PRISMA（系統性綜述和薈萃分析的首選報告項目）框架，系統檢索了2019年至2025年間的科學文獻。他們使用布林運算組合了空氣品質和深度學習相關術語進行搜尋，最終納入了159項符合預設條件的深度學習空氣品質預測研究。研究對這些文獻進行了結構化的資料提取與綜合分析，涵蓋研究地點、資料集類型、預測污染物、深度學習模型架構、輸入特徵、訓練/驗證方法、評估指標以及關鍵發現與限制。此外，研究還根據一套改編自TRIPOD-AI和PROBAST指南的標準，對所有納入研究進行了模型特異性的品質與偏倚風險評估。

深度學習模型在空氣品質預測中的應用

深度學習作為機器學習的一個專門分支，其核心在於利用多層神經網路來學習資料中的固有模式。相較於傳統機器學習需要手動特徵工程，深度學習採用端到端的學習方式，能夠直接從非結構化資料中學習，尤其擅長捕捉輸入與輸出變數之間的非線性關係，這使其在處理空氣品質這類複雜、高維且具有動態時空依賴性的數據時表現出色。研究歸納了幾類主要的深度學習模型族及其在空氣品質預測中的應用：

•
卷積神經網路（CNN）：特別擅長學習污染物的空間結構，廣泛應用於衛星圖像、天空照片或空間感測器網路等網格狀資料。
•
循環神經網路（RNN, LSTM, GRU）：長短期記憶網路（LSTM）及其變體透過記憶單元和門控機制，能有效保留長期時間資訊，是目前污染物時間序列預測中最常用且高效的模型之一。門控循環單元（GRU）在簡化LSTM結構的同時保留了建模長期依賴的能力，是計算效率較高的替代方案。
•
前饋網路（MLP, DNN, DBN）：多層感知機（MLP）、深度神經網路（DNN）和深度信念網路（DBN）能有效處理非線性特徵交互作用。DBN利用堆疊的受限玻爾茲曼機進行層次表徵學習，在無監督特徵提取方面尤其有用。
•
生成模型（SAE, GAN）：稀疏自動編碼器（SAE）可用於特徵提取和異常檢測；生成對抗網路（GAN）則常用於資料增強和填補缺失觀測值。
•
混合與先進架構：研究指出，結合CNN空間特徵提取能力和LSTM時間序列建模能力的混合模型（如CNN-LSTM）表現出眾。此外，圖神經網路（GNN）、時空卷積網路（ST-Conv）以及結合注意力機制的模型（如Spatio-attention embedded RNN）等先進架構，能夠更顯式地建模監測站點間的空間圖結構和複雜的時空依賴關係，代表了該領域的前沿方向。

全球研究趨勢與性能比較

該綜述對全球範圍內應用深度學習進行空氣品質預測的研究進行了地理分佈分析。結果顯示，相關研究高度集中在亞洲數據豐富的城市地區，這也反映了當前文獻在地域分佈上的碎片化特徵。在預測的污染物方面，PM_2.5因其對公眾健康的顯著影響而成為最常被預測的目標，其次是PM₁₀和空氣品質指數（AQI）。從模型使用頻率來看，LSTM及其變體是最主流的時間序列編碼器，而CNN-LSTM則是最受歡迎的混合架構。整體而言，深度學習模型，特別是那些能夠顯式建模多源輸入和時空依賴性的模型，其預測性能普遍優於傳統方法。

時空深度學習架構的關鍵技術

為了有效建模空氣品質在空間和時間上的複雜動態，深度學習方法需要同時捕捉污染物濃度隨時間的演化以及不同監測位置之間的空間關係。研究詳細分析了用於構建空間圖（Graph）結構以表徵站點間關係的幾種策略：

•
靜態圖：使用固定的空間結構，通常基於地理距離、K最近鄰連接或長期的污染物相關性模式構建。
•
動態圖：其結構隨時間更新，以捕捉污染物傳輸路徑、風向風速等氣象條件變化導致的短期空間依賴性演化。
•
學習或自適應圖：超越預定義的空間結構，直接從數據中推斷可能隱藏或非線性的空間依賴關係，通常透過注意力機制或嵌入策略實現。
•
外生與多視圖圖：整合風向、地形、土地利用、交通密度等額外的環境和背景因素來豐富空間表徵，構建更能反映真實大氣過程的圖結構。

這些不同的圖構建與加權策略直接影響了模型訊息傳遞的方式及其捕捉複雜、不規則空間模式的能力，是先進時空預測模型的關鍵組成部分。

挑戰、限制與未來方向

儘管深度學習在空氣品質預測中展現出巨大潛力，但該綜述也指出了當前研究面臨的多重挑戰與限制。首先，現有文獻呈現碎片化狀態，研究高度集中在特定數據豐富的區域，導致模型的外部效度和泛化能力較弱，難以直接應用於其他地理環境或不同季節條件。其次，數據集存在異質性，不同研究使用的數據來源、預處理方法和評估協議不一致，這使得跨研究性能比較變得困難，也阻礙了標準化基準的建立。此外，許多深度學習模型作為“黑箱”，其可解釋性有限，決策過程不透明，這在要求高可靠性和問責制的環境政策制定中是一個重大障礙。與之相關的是不確定性量化的普遍缺乏，模型很少提供預測值的置信區間，降低了預測結果在風險評估和預警發布中的實用性。最後，計算資源需求和模型透明度不足也影響了其在實際業務系統中的部署。

為應對這些挑戰，研究指出了幾個有前景的未來方向。推動標準化的數據預處理和基準測試實踐至關重要，這將促進公平比較和模型複現。發展混合架構、物理資訊模型以及生成式深度學習架構，有助於融合領域知識、提高預測可靠性和生成合成數據以彌補數據缺口。同時，必須加強模型的可解釋性和不確定性量化能力，以建立信任並支援決策。最後，構建全球代表性的數據集並在多樣化環境中進行嚴格的模型驗證，是提升模型泛化能力和實際應用價值的關鍵。

結論

綜上所述，這項系統性綜述證明了深度學習在革新空氣品質預測方面的關鍵作用。通過對超過150項研究的綜合分析，明確顯示出在明確建模多源輸入和時空依賴性的情況下，深度學習模型相較於傳統方法具有顯著優勢。各種架構，從經典的LSTM、CNN到先進的圖神經網路和注意力機制混合模型，已被成功應用於預測PM_2.5、AQI等多種污染物指標。然而，該領域仍面臨著研究地域集中、數據異質、評估標準不一、模型可解釋性與泛化能力不足等核心挑戰。未來的發展取決於能否建立標準化的評估框架、開發融合物理機制的可解釋模型，並在更廣泛的時空背景下驗證其穩健性。這篇綜述不僅為研究人員和從業者繪製了清晰的技術路線圖，也為政策制定者提供了關於如何利用更準確、可靠的預測工具來製定環境管理與公共衛生保護策略的深刻見解，對於推動智慧、可持續的城市環境建設具有重要的指導意義。

热点排行