将地表建模与多尺度自适应融合技术相结合:在易受云层影响的复杂地形中生成每小时一次、分辨率为1公里的全天候地表温度(LST)数据
《Science of Remote Sensing》:Coupling land surface modeling with multi-scale adaptive fusion: Generating hourly 1-km all-weather LST in cloud-prone complex terrain
【字体:
大
中
小
】
时间:2026年05月10日
来源:Science of Remote Sensing 5.2
编辑推荐:
周纪|段际凯|马进|唐文斌|余文平|侯应旭|曹瑞银
中国电子科技大学资源与环境学院,成都,611731
**摘要**
在多云且地形复杂的地区获取高时空分辨率的地表温度(LST)数据面临双重挑战:云层造成的数据缺失和地形引起的纹理模糊。为了解决这些问题,本研究提出了一
周纪|段际凯|马进|唐文斌|余文平|侯应旭|曹瑞银
中国电子科技大学资源与环境学院,成都,611731
**摘要**
在多云且地形复杂的地区获取高时空分辨率的地表温度(LST)数据面临双重挑战:云层造成的数据缺失和地形引起的纹理模糊。为了解决这些问题,本研究提出了一种新框架,将Noah-MP物理模拟与地形驱动的误差解耦和多尺度自适应加权(TED-MSAW)引擎相结合,生成了1公里分辨率、每小时一次的全天气LST数据集。首先,使用Noah-MP建立时空连续的“物理锚点”,确保填充空缺的过程遵循地表能量平衡定律。其次,TED-MSAW引擎利用广义贝叶斯三重配置方案实现对地表复杂性的“隐式感知”,动态解耦地形引起的系统误差并自适应调整融合权重,有效抑制噪声的同时保留精细的热度纹理。验证结果显示,与实地观测数据的一致性较好,验证点的均方根误差(RMSE)为1.74开尔文。此外,与Fengyun-4B(FY-4B)产品的对比测试中,RMSE为2.65开尔文,进一步证明了该框架的一致性。基于SHAP的归因分析表明,土地覆盖类型和海拔高度是主要的误差驱动因素。该模型通过自适应补偿机制展示了减轻几何偏差的能力。本研究提出了一种将物理机制与统计学习相结合的通用解决方案,旨在复杂环境中解决时空分辨率的矛盾。
**1. 引言**
地表温度(LST)是地球系统科学中的关键参数,在研究陆地-大气能量交换、水文循环、城市热岛效应和气候变化等方面起着重要作用(Li等人,2023年)。LST数据的准确性和时空分辨率直接决定了相关研究和应用的深度和可靠性。随着各领域对精细数据的需求不断增长,兼具1公里空间分辨率和每小时动态监测能力的LST数据已成为当前应用的核心要求(Tang等人,2024年),因为它们同时满足了区域尺度和短期过程分析的双重需求。此类数据广泛支持包括农业干旱监测(Wu等人,2025年)、动态城市热岛评估(Tan等人,2025年)、森林火灾风险预警和恢复监测(Zhao等人,2024年)、高精度水文模型驱动(X. Li等人,2024年)以及极端天气事件的预警和响应(Yu等人,2025年)等关键领域。在多云且地形复杂的地区,这种数据的需求尤为迫切,因为这些地区通常同时存在快速的时间热动态和强烈的空间热梯度。
然而,由于当前观测方法的技术瓶颈,在这种极具挑战性的环境中获取高质量的LST数据仍然极其困难(Z.-L. Li等人,2024年)。尽管卫星遥感提供了广泛的覆盖范围,但在空间和时间分辨率之间存在固有的权衡:极轨卫星可以提供精细的空间细节,但重访周期长,无法捕捉日变化;地球静止卫星虽然能够进行高频观测,但空间分辨率相对粗糙(通常>2公里)。更严重的是,在多云和雾天区域,热红外传感器经常被云层“遮挡”,导致大量数据缺失,严重干扰地表热过程的连续监测(Reiners等人,2023年;Liu等人,2023年)。微波遥感虽然可以穿透云层和雾气,但其空间分辨率难以满足局部尺度研究的需求,且其反演精度容易受到地表粗糙度和土壤湿度的干扰(Ji等人,2024年)。数值模型可以提供时空连续的背景场,但通常依赖于粗糙的网格,这不可避免地会平滑崎岖地形中的关键地形纹理和微气候异质性(Zhang等人,2022年)。因此,整合多源数据优势的LST融合技术已成为填补这些观测空缺的主流解决方案(Mo等人,2021年)。
尽管近年来在多源数据融合技术方面取得了显著进展(Ding等人,2023b;Bae等人,2025年),相关研究涵盖了多种融合场景,如被动微波和热红外数据融合(Xu和Cheng,2021年;Zhang等人,2020年;Song等人,2024年)、极轨卫星和地球静止卫星数据融合(Wu等人,2015年;Adeniran等人,2024年;Wang等人,2024年)、卫星反演数据与再分析数据融合(Ding等人,2023a;Jia等人,2021年;Long等人,2020年;X. Zhang等人,2021年;Quan等人,2023年;Gong等人,2023年),以及卫星数据与模型模拟结果的融合(Ma等人,2022年;Chen等人,2024年),但现有方法在应用于多云和复杂地形地区时仍面临两个核心限制:(1)填充空缺时缺乏物理锚点:大多数现有的全天气LST生成方法依赖数学插值来填补云层下的空缺,这些纯数据驱动的方法经常忽略地表能量平衡的物理机制,在长期云层覆盖下容易产生不现实的线性伪影,无法准确描述云层下的实际冷却或加热过程;(2)加权过程中缺乏空间意识:传统的融合算法通常采用固定窗口协方差或全局加权方案,将研究区域视为均匀的整体,忽略了地形起伏引起的强空间异质性(Zhao和Li,2015年)。在破碎的地形区域,这种策略无法区分山脊、山谷和平坦盆地等微地形,导致精细的热度纹理模糊,并难以消除由破碎地表覆盖引起的发射率误差(Ma等人,2024年)。
为了解决上述挑战,本研究提出了一种框架,将地表过程模拟与多尺度自适应融合相结合,旨在实现全天气连续性的物理一致性和保留地形细节的空间适应性。首先,为了减轻持续云层污染造成的数据缺失,本研究使用了降尺度的气象数据来驱动Noah-MP地表模型,生成了空间连续的1公里LST背景场。作为物理锚点,该方案确保重建的LST符合现实的地表能量平衡日变化,而不仅仅是简单的统计外推,从而为后续融合提供了坚实的物理基础。同时,依靠模型的非定向能量平衡约束,这种方法间接削弱了山区由地形-辐射耦合效应引起的系统偏差。其次,为了解决降噪和保留精细空间纹理之间的权衡,构建了地形增强数据融合和多尺度自适应加权(TED-MSAW)框架。作为一种针对复杂山地景观的地形约束融合模块,TED方案结合了海拔、坡度和朝向等地形因素,以捕捉强烈的地表空间异质性,并适应崎岖地形中的剧烈环境梯度。在该框架中,主要采用广义BTCH方法进行随机误差的统计分解和量化。由于BTCH假设误差独立性,它无法完全分离卫星反演和模型模拟中常见的地形引起的系统偏差。BTCH估计的像素级误差方差有效描述了多源LST数据集之间随机误差的空间差异。在山区,LST的随机不确定性与局部地形效应(如起伏地形和地形阴影)高度相关。因此,误差方差的空间模式可以作为景观复杂性的合理代理,并为多尺度自适应加权提供定量支持。多尺度自适应加权策略旨在平衡空间平滑和细节锐化,防止在崎岖区域过度平滑导致精细地形细节的丢失,同时利用较大的移动窗口在均匀表面上提高时空稳定性。最终,物理地表约束和统计自适应多尺度融合的结合使得在复杂地形和频繁多云条件下实现全天气和高精度LST重建成为可能。
下一节第2节将重点描述本研究的研究区域和所使用的数据。第3节强调研究方法和所采用的模型,分析结果和讨论将在第4节中呈现。最后,第5节提供结论。
**2. 研究区域和数据**
**2.1 研究区域**
本研究聚焦中国西南部的四川省,如图1所示。其西部以高海拔高原和崎岖地形为主,东部则是相对平坦的盆地,地形开阔且平缓。该省拥有复杂的地形和多样化的土地覆盖类型,包括森林、草地、农田和城市区域。受亚热带季风气候和高原山地气候的影响,加上境内众多河流的存在,四川省由于地形效应而表现出多云和多雾的特征。这给使用热红外遥感获取准确和连续的LST数据带来了巨大挑战。图1(f)展示了从Himawari-8卫星获取的LST数据,显示由于云层和雾层覆盖,超过一半的时间出现数据缺失。
**2.2 模型驱动数据**
本研究采用全球陆地数据同化系统(GLDAS)和欧洲中期天气预报再分析第5版陆地(ERA5-Land)数据集作为地表过程模型的驱动数据,这些数据为模拟地表能量平衡和驱动LST融合模型提供了关键输入,主要包括近地面风速、温度、湿度、大气压力、降水和辐射。选择这两个数据集不仅是为了满足三元系统的输入要求,还利用了它们在气象驱动条件和物理参数化适应性方面的固有差异。这些差异可以最大化每个数据源的误差独立性,有效减少单一驱动方案引起的系统偏差,进一步提高TED-MSAW多尺度融合模型在复杂地形区域的稳健性。其中,GLDAS经过严格的质量控制和校准,适用于长期区域地表模拟;ERA5-Land具有更精细的时空分辨率,能够更好地捕捉快速的大气变化。在模型驱动之前,这两个数据集的变量在定义、单位和时间分辨率上进行了统一处理。鉴于大气变量的空间异质性相对较弱,它们通过双线性插值重新采样至1公里分辨率。模型使用1公里分辨率的土地利用数据来表征细尺度的表面异质性,进一步确保了模拟的可靠性和驱动数据在统一网格上的合理空间代表性。
GLDAS数据集使用先进的地表过程模型和数据同化技术生成,提供最佳的地表状态和通量场产品(Rodell等人,2004年)。它的空间分辨率为0.25°,时间分辨率为3小时,访问链接为https://disc.gsfc.nasa.gov/datasets/GLDAS_NOAH025_3H_2.1/summary。ERA5-Land结合了来自世界各地的模型数据和观测数据,并利用物理定律将其整合为一个全球完整且一致的再分析数据集(Mu?oz-Sabater等人,2021年)。它的空间分辨率为0.1°,时间分辨率为1小时,可在https://cds.climate.copernicus.eu/datasets/reanalysis-era5-land?tab=download下载。
**2.3 卫星数据**
为了充分考虑地表异质性,本研究使用中分辨率成像光谱辐射计(MODIS)MCD12Q1 LC Type1土地分类数据作为地表过程模型的静态输入。该产品通过对MODIS Terra和Aqua卫星的反射数据进行监督分类生成,空间分辨率为500米,年时间为1年。本研究采用了国际地圈-生物圈计划(IGBP)定义的17种土地覆盖类型,包括自然植被、开发土地和非植被区域。数据可在此处获取:https://www.earthdata.nasa.gov/data/catalog/lpcloud-mcd12q1-061。需要注意的是,图1(e)所示,研究区域中不存在第7类(开阔灌木)。
来自日本Himawari-8卫星(140.7°E)的LST数据(在本研究中称为H8 LST)是通过应用高级Himawari成像仪的第13、14和15波段的数据,通过非线性三波段算法检索得到的。验证结果已确认,该方法的准确性高于分窗算法(Yamamoto等人,2018年)。该方法的空间分辨率为0.02°,时间分辨率为1小时。韩国GK2A卫星(128.2°E)的LST产品(GK2A LST)来自地球静止轨道多功能卫星2A上的高级气象成像仪,其空间分辨率为2公里,时间分辨率为1小时,可通过https://datasvc.nmsc.kma.go.kr/datasvc/html/data/listData.do获取。这两个地球静止轨道卫星的LST数据集主要用于多源数据融合。此外,为了在晴朗天气条件下促进独立比较,本研究还使用了风云-4B(FY-4B)卫星(105°E)的LST产品。该产品根据普朗克黑体辐射定律,从10.8和12.0μm热红外通道的亮度温度中提取而来(Dong等人,2023年),空间分辨率为4公里,时间分辨率为1小时。它是研究区域内唯一具有1小时时间分辨率的地球静止轨道卫星LST产品,其他产品包括H8和GK2A,虽然空间分辨率合适但覆盖范围不够全面。其可靠性已在最近的研究中得到验证(Ye等人,2026年;Na等人,2026年)。为了减少云层污染的影响,验证过程中仅使用了高质量的晴天像素。卫星LST数据通过双线性插值重新采样到相同的1公里网格,以实现与模型模拟的空间一致性。
2.4. 站点数据
由于研究区域内公开的实地LST数据非常稀缺,本研究采用了两种类型的站点数据集以实现对研究区域的最大空间覆盖:(1)使用Stefan-Boltzmann定律从两个配备长波辐射测量设备的站点获取LST数据(分别是HutouCun和曹上,如图1(b)中的橙色圆圈所示),时间分辨率为每小时;(2)选择来自全球历史气候网络的每小时气温数据进行验证,网址为:https://www.ncei.noaa.gov/products/global-historical-climatology-network-hourly。考虑到数据完整性、数据质量和站点的空间代表性等因素,最终选择了7个站点进行分析(如图1(b)中用红色五角星标记的站点),时间分辨率为3小时。本研究使用了2024年的数据进行融合和分析;因此,下载了2024年全年的所有可用数据。H8 LST和GK2A LST用于多源融合,而FY-4B LST和站点气温数据用于验证融合结果。值得注意的是,FY-4B卫星在2024年3月5日进行了轨道调整。为了消除由于观测角度差异引起的误差,仅下载了2024年3月6日至年底的FY-4B每小时LST数据进行比较分析。
3. 方法论
为了解决数据缺失和云层覆盖复杂地形导致的纹理模糊问题,本研究提出了一种稳健的框架,通过结合地表过程模拟和多尺度自适应融合方法,构建空间连续的、每小时的、1公里的、全天候的地面温度产品。核心算法是TED-MSAW,它整合了物理定律和统计学习方法。如图2所示,工作流程包括两个阶段:
**第一阶段:物理模拟基础**。使用Noah-MP模型生成时空连续的LST背景场,作为全天候重建的“物理锚点”。依靠该模型的非方向性能量平衡约束,间接限制了由地形-辐射耦合引起的系统偏差。
**第二阶段:自适应融合引擎**。采用TED-MSAW引擎主要用于在统计层面分离和量化随机误差,并根据从空间统计中隐式识别的表面复杂性,自适应地融合多源数据,以适应山区强烈的空间异质性。
**下载:下载高分辨率图像(511KB)**
**下载:下载全尺寸图像**
**图2. 使用多尺度贝叶斯协方差融合三角帽算法的研究区域多源LST融合流程图**
3.1. 第一阶段:通过Noah-MP进行的高分辨率物理模拟
研究区域内频繁的大规模云层和雾霭事件为热红外传感器造成了“数据真空”。为了解决这个问题,我们使用Noah-MP地表模型构建一个物理上一致的背景场。与简单的插值方法不同,Noah-MP通过迭代求解地表能量平衡方程来生成LST,确保即使在长期数据缺失期间,重建的热动态仍然遵循物理定律(Niu等人,2011年)。该模型由从ERA5-Land和GLDAS提取的静态降尺度气象强迫数据驱动。至关重要的是,高分辨率的静态参数(包括1公里数字高程模型(DEM)和土地覆盖类型)被输入,以细粒度解析表面异质性。基于不同的强迫数据,生成了两组每小时的1公里背景LST:ERA5-Land Noah-MP LST和GLDAS Noah-MP LST。
考虑到复杂底层表面的“马赛克”特性,Noah-MP采用“半瓦片”方法,将冠层与地表分离。网格单元被划分为植被覆盖部分(Fveg,该参数源自MODIS每月的气候绿色植被比例数据)和裸土覆盖部分(1?Fveg)。因此,Fveg作为权重系数,用于整合这两个子表面的能量通量。最终,整个网格的能量预算可以通过以下方程表示:
(1)
Sav + Sag = Ln + H + LE + G
其中Sav和Sag分别表示网格内的冠层和地面吸收的太阳辐射;Ln是净长波辐射;H是感热通量;LE是潜热通量;G是地表热通量。
每个通量分量的计算过程如方程(2)所示:
(2)
Ln = (1?Fveg)Lng,b + Fveg(Lnv + Ln,v)
LE = (1?Fveg)LEg,b + Fveg(LEv + LEg,v)
H = (1?Fveg)Hg,b + Fveg(Hv + Hg,v)
G = (1?Fveg)Gb + FvegGv
其中下标b表示裸土;v表示植被覆盖的地表;g表示地面。植被冠层温度Tv可以通过方程(3)计算:
(3)
Sav = FvegLnv(Tv) + Hv(Tv)
植被覆盖部分的地表温度Tg,v可以通过方程(4)计算:
(4)
FvegSag = Fveg(Lng,v(Tg,v) + Hg,v(Tg,v)
裸土覆盖部分的地表温度Tg,b可以通过方程(5)计算:
(5)
(1?Fveg)Sag = (1?Fveg)(Lng,b(Tg,b) + Hg,b(Tg,b) + Leg,b(Tg,b))
通过迭代求解方程(1)至(5),可以获得所有的能量通量,最终使用方程(6)得出LST:
(6)
??T = (Ld + Ln) ? (1??s)×Ld
?s×σ
其中Ld是大气强迫产生的向下长波辐射;Ln是净长波辐射;?s是地表发射率;σ是Stefan-Boltzmann常数(5.67 × 10?8 Wm?2K?4)。
3.2. 第二阶段-A:基于地形的误差解耦(TED)
将卫星观测数据与模型模拟的背景场融合需要准确的误差估计作为前提。在地形起伏严重的区域,由于误差具有空间非平稳性,传统的误差估计方法往往无法达到所需的精度。为了解决这个问题,本研究提出了一种TED策略,采用广义BTCH方法(Vernotte和Lantz,2018年)来实现误差量化和权重分配,而不是直接分离与地形相关的系统误差。考虑到研究区域内频繁的云层覆盖导致的时间序列不连续性,统计稳定性是BTCH应用的主要关注点。为了解决由于样本量不足引起的方差估计不稳定性,我们采用了“年度每小时”计算策略,即使用整个2024年(每小时时间分辨率)作为一个时间窗口。应用了严格的三元配点约束,确保只包含所有三个源的有效观测数据,从而保证方差估计的稳健性。尽管广义BTCH模型没有直接包含DEM、坡度等地形变量,但它仅基于多源LST数据集之间的固有差异来量化统计误差,并通过捕捉空间异质性来隐式响应地形条件。在复杂地形下,几何变形和方向性表面热各向异性会导致独立LST源之间的明显偏差。在TED中,地形约束与BTCH统计误差估计相结合。BTCH生成像素级别的误差方差以支持自适应权重分配,但由于假设误差独立性,它无法消除由地形引起的共享系统偏差。因此,误差方差的空间模式仅有助于表征局部不确定性,并与地形因素一起优化融合权重。它只是在统计层面上减弱局部异常差异,而不是物理上去除或纠正与地形相关的系统误差。
对于N个数据源(xi),观测值被建模为真值(xt)加上误差(?i):
(7) xi = xt + ?i
为了求解独立的误差方差σi2,我们基于差异的方差构建了一个方程组:
(8)
σ12 + σ22 = Var(x1?x2) + 2Cov(x1,x2)
σ12 + σ32 = Var(x1?x3) + 2Cov(x1,x3)
?
σN?12 + σN2 = Var(xN?1?xN) + 2Cov(xN?1,xN)
在这个方程中,每个数据源的每个像素的σi2是一个待确定的未知量,用于评估相应数据源的随机不确定性。当N>3时,通过最小二乘法求解该方程组得到这个值。Var表示两个数据集之间差异的方差,Cov表示误差协方差。这两者都是在移动窗口(窗口大小:3 × 3, 7 × 7, 15 × 15)内计算的,以确保结果反映不同尺度复杂地形区域的空间异质性。以Cov为例,其计算过程如下:
(9)
Cov(xi,xj)s,h = 1
n?1
∑k=1n
xi,s,h,k?x?i,s,h
xj,s,h,k?x?j,s,h
在这个方程中,s和h分别表示像素s和小时h的空间位置;n表示在像素s和小时h处可用的有效样本总数;k是有效时空配点样本的索引。
3.3. 第二阶段-B:多尺度自适应权重分配(MSAW)
传统的固定窗口融合存在一个权衡:大窗口可以减少噪声,但会模糊地形纹理(山脊/山谷);小窗口可以保留细节,但对噪声敏感。为了解决这个问题,我们设计了由隐式表面复杂性指标驱动的MSAW机制。该算法在多个尺度上执行TED解决方案。我们定义尺度稳定性因子(sk)为尺度平均方差的倒数。在物理上,这个因子作为表面复杂性的检测器:在复杂地形(高异质性)中,大窗口混合了不同的像素,导致高方差和低稳定性sk。算法自然地给大尺度赋予较低的权重,优先考虑3 × 3尺度以保留纹理。相反,在均匀的盆地中,大窗口提供稳定的统计数据(高sk),促使算法优先考虑15 × 15尺度以平滑噪声。
计算过程如下:
(1) 尺度平均方差:对于尺度k,计算所有有效源的平均方差:
(10) σk2 = 1
Ns,k
∑i=1Ns,k
σi,k2
(2) 尺度稳定性因子:
(11) sk = 1
σk2 + λ
其中σk2是表面复杂性的动态指标。
(3) 最终权重计算:通过汇总所有尺度的权重来获得每个数据源的最终权重:
(12)
wifinal = ∑k=1Nscales
Wk?wi,k
其中wifinal表示数据源i的最终权重;wi,k是数据源i在第k尺度上的权重;Nscales是在融合过程中设置的尺度总数。Wk是尺度权重系数,通过TED方法计算的误差方差的标准化处理得出,其具体计算公式为:
(13)
Wk = sk
∑k=1Nscales
calessk
其中∑k=1Nscalessk是尺度稳定性因子的总和,Wk与地形复杂性和尺度的可靠性密切相关。
值得注意的是,MSAW机制中的多尺度切换并不表示固定窗口大小(如3 × 3和15 × 15)之间的离散突变,而是一个由尺度稳定性因子sk(方程(11))和尺度平均方差σk2(方程(10))驱动的逐像素连续自适应过程。由于尺度权重Wk是由不断变化的sk动态确定的,随着场景中表面复杂性的变化而平滑演变,因此在最终权重计算(方程(12))中连续累积了不同尺度的影响。这本质上避免了在不同地形之间的边缘伪影、块状或不连续性。该机制赋予了融合过程出色的空间感知能力,能够根据局部地形特征动态调整权重:在复杂和陡坡区域,适当降低卫星观测的权重,并相应增加Noah-MP物理模拟的贡献比例;在平坦和均匀的区域,卫星观测和物理模拟的权重得到合理平衡,以保留由地形驱动的详细特征,同时避免人为伪影。这种设计不仅可以在统计层面减弱地形阴影和几何偏差引起的局部异常效应,还可以减轻违反广义贝叶斯BTCH方法中误差独立性假设的不利影响,显著提高最终LST产品的空间一致性和物理合理性,并增强融合结果的稳健性。考虑到与像素级贝叶斯迭代和多尺度窗口切换相关的计算成本,所提出的框架保持了良好的计算效率。整体复杂性得到了很好的控制,该算法可以利用常见的并行计算资源高效实现。因此,它表现出在区域应用和近实时运营LST生产中的良好可行性。3.4. 全天候重建和间隙填充最终的全天候LST是使用自适应推导出的权重生成的:(14)LSTfused=∑i=1Nwifinal?xi∑i=1Nwifinal关于云污染像素的填充和权重计算,权重是基于2024年整年的每小时平均LST得出的,这大大减少了由云污染引起的缺失权重像素。对于小的分散缺失区域,采用最近邻插值来填充间隙。对于卫星数据完全缺失的较大连续云覆盖区域,Noah-MP地表模型的物理锚定效果变得占主导地位。根据Rolland等人(2024年)提出的方法,我们采用方差辅助的时空邻域插值来进行间隙填充。由于Noah-MP提供了连续的物理一致背景场,因此填充过程受到模型模拟的物理时间趋势的约束,从而避免了在纯数学插值中常见的人为伪影。最后,通过自适应多尺度加权融合得到了完整的合并结果。3.5. 评估指标为了评估融合LST的准确性,采用了决定系数(R2)、偏差、平均绝对误差(MAE)和均方根误差(RMSE)。在整个研究区域进行了系统验证。评估是以逐像素的方式进行的,以全面描述融合产品的空间性能。R2反映了整体的线性一致性,而偏差、MAE和RMSE量化了系统偏差和整体误差大小。这些指标共同允许对所提出的融合方法进行全面和客观的评估。4. 结果与讨论4.1. 融合权重的时空分布特征图3(a)显示了通过所提方法得出的每个LST数据的月平均融合权重。可以观察到,H8和GK2A卫星获取的LST的权重在四川盆地相对较低,但在其他地区较高,这主要是由于盆地内的封闭地形、水汽扩散不良以及频繁的云和雾。GK2A的总体权重高于H8,这与H8较大的观测角度及其更明显的观测角度效应有关。GLDAS Noah-MP表现出最高的总体权重,特别是在盆地内,主要是由于其出色的时空连续性、强大的物理一致性和无云污染以及较低的数据不确定性。ERA5-Land Noah-MP在研究区域西北部的相对较低权重可以通过该地区的复杂地形和较大的模拟偏差来解释。总体而言,在所有条件下,GLDAS Noah-MP LST的权重显著高于H8/GK2A卫星LST,这源于数据质量和物理机制的综合作用。基于模型的数据是完整、稳定的,并且与较低的不确定性相关。相比之下,卫星观测不仅受到云层覆盖和气溶胶的影响,还受到其非天底观测几何形状与地表模型输出的天底等效值之间的几何不匹配的影响。表面发射率的方向性引入了额外的差异,进一步降低了分配给卫星数据的权重。同时,卫星数据在平坦和晴朗天空区域的较高权重及其在复杂地形中的明显下降也反映了数据质量和观测角度效应的空间异质性。图3(b)显示了不同坡度下平均融合权重的变化。GLDAS Noah-MP LST的权重相对最高,表明融合模型最依赖于这个地表模型数据集,这也充分验证了地表模型提供了高质量的前置数据。ERA5 Noah-MP LST在平坦地区的权重最高,这可能是因为其空间分辨率过于粗糙,无法很好地反映地形异质性。GK2A LST的权重通常高于H8,这可能是由于其角度效应较弱;此外,两者的整体变化趋势基本一致,两者都能比两个地表模型LST数据集更有效地捕捉地形信息。下载:下载高分辨率图像(1MB)下载:下载全尺寸图像图3. (a) 每个LST数据集的平均融合权重空间分布;(b) 不同坡度区间内平均融合权重的变化;(c) 不同朝向下平均融合权重的变化;(d) 不同土地覆盖类型下平均融合权重的变化。图3(c)显示了不同朝向下平均融合权重的变化。可以观察到,朝向对融合权重的影响可以忽略不计,所有朝向下的权重差异很小。这可能是由于LST在 hourly 规模上的误差变化相对较小。图3(d)展示了不同土地覆盖类型下平均融合权重的变化。可以看出,不同土地覆盖类型下的融合权重存在显著差异,但对于Class 15来说,这些差异非常相似。这表明不同的LST数据源具有某种程度的互补特性,融合模型动态调整权重以避免过分依赖单一数据源,从而确保融合结果的稳定性。为了更清楚地了解融合权重的日变化特性,绘制了每小时H8 LST融合权重的空间分布结果,如图4(a)所示。可以清楚地观察到,随着太阳辐射的增加,研究区域西部的权重逐渐减小,在当地时间大约14:00(图中对应06:00)达到最小值,然后逐渐增加,并在夜间稳定下来。这主要是由于中午周围的大气湍流,以及西部较大的地形起伏,这使得辐射传输过程变得复杂,引入了显著的误差,增加了融合的不确定性。此外,东部盆地的融合权重始终保持较低。这主要是因为该盆地被高山环绕,地形封闭,水汽和热量的积累使得卫星难以准确捕捉这里的热量交换过程。其他三个LST数据集的每小时融合权重的空间分布与H8相似,都表现出明显的日变化特性,而总体分布趋势与图3(a)所示一致。图4(b)显示了各种LST数据集的平均融合权重的每小时变化曲线。可以观察到,这些LST数据集的融合权重在日出(0 h)和日落(10 h)时显著波动。这主要是因为这些时期太阳高度角极低,增强了大气散射和吸收效应,削弱了表面辐射信号。因此,LST反演误差增加,融合模型迅速降低了不可靠数据源的权重,并切换到更可靠的数据源。此外,白天获取的卫星LST数据集的权重低于夜间,这可能是由于白天强烈的大气运动引入了一定的反演误差。下载:下载高分辨率图像(4MB)下载:下载全尺寸图像图4. (a) 年平均H8 LST的每小时融合权重空间分布;(b) 每个LST数据集在每小时尺度上的空间平均融合权重的时间变化。4.2. 在晴朗天空条件下与FY-4B LST的对比为了评估融合LST结果的合理性,在晴朗天空条件下对融合LST和FY-4B LST进行了独立对比,结果如图5所示。总体散点沿1:1参考线(y = x)密集分布,红色拟合线与参考线非常吻合,表明融合LST和FY-4B LST之间存在强烈的线性一致性,没有显著的系统偏差。定量统计结果显示,两者之间的决定系数R2达到0.921,MAE为2.06 K,RMSE为2.65 K,反映了融合结果与FY-4B观测之间的高整体一致性。边缘直方图的分布特征也表明,融合LST的温度分布与FY-4B LST非常吻合,没有引入额外的分布畸变。这些结果表明,本研究中建立的多源LST融合框架能够生成与FY-4B晴朗天空观测具有高一致性的融合产品。下载:下载高分辨率图像(319KB)下载:下载全尺寸图像图5. 融合LST与FY-4B LST的年平均值之间的相关性分析。4.3. 各种LST的瞬时空间分布分析图6展示了2024年3月21日UTC 15:00时多源LST融合结果和单一数据源的空间对比。主面板(a)显示了研究区域内融合LST的空间分布,整体温度从西北向东南递增。低温区集中在西北部(245–250 K),高温区分布在东南部(290–305 K),这清楚地反映了区域地形和气候的空间模式。局部放大的子面板(b–g)的比较显示,卫星遥感产品(b–d)通常受到传感器分辨率和云干扰的限制,无法平衡空间细节和覆盖完整性:H8(b)显示出由于分辨率粗糙而产生的明显马赛克效应;GK2A(c)由于散布的云层导致观测缺失而显示出破碎的空间分布;而FY-4B(d)遭受最严重的大规模数据缺失。相比之下,尽管ERA5-Land Noah-MP(e)实现了完整的空间覆盖,但仍保留了明显的网格锯齿特征;相比之下,GDLAS Noah-MP(f)展示了由高分辨率静态数据驱动的清晰连续的地形纹理。最终的融合LST(g)在复杂地形区域合理地保持了GDLAS的高空间分辨率特性。在保持相对清晰的地形纹理结构的同时,它有效地结合了来自卫星观测的地表温度信息,并填补了H8、GK2A和FY-4B中的数据空白和马赛克伪影。因此,获得了一个空间连续且物理上合理的的高分辨率LST场。这些结果表明,TED-MSAW模型在重建复杂山区精细表面热细节方面表现出良好的性能。为了进一步定量评估融合模型在复杂地形区域重建表面温度的空间细节能力,图7采用了3 × 3移动窗口局部标准差(Local STD)来表征多源LST产品的局部热变异性,并结合地形因素进行了全面分析。作为关键指标,局部热变异性有效地反映了山地热环境的空间异质性,并描绘了由微地形驱动的精细尺度LST差异。视觉对比表明,低分辨率卫星观测(H8和FY-4B)通常表现出较低的Local STD值和过度平滑的热纹理,无法捕捉由微地形起伏主导的精细热变化。尽管ERA5-Land可以表示区域宏观热模式,但它受到明显的马赛克伪影和过度平滑的影响,导致失去了由地形控制的高频空间细节。得益于高分辨率地形强迫约束,GLDAS Noah-MP在热纹理和地形破碎性之间显示出高空间一致性。TED-MSAW融合的LST数据集继承了陆地表面模型产品的优越地形耦合特性。其高热变性区域清晰地反映了诸如山脊和河谷等微地形的空间差异,并与地形起伏和坡度梯度的空间模式很好地吻合。每个子图中标记了三个定量指标,用于进一步量化不同LST产品之间的地形耦合差异。LST与海拔高度之间的(R2)值量化了海拔高度对空间LST差异的解释能力。LST梯度方向与地形朝向之间的最小方位角(θ)代表了热分布与地形方向之间的空间匹配程度,其中较小的θ值表示朝向对热模式的约束更强。偏相关系数(r)在考虑海拔高度作为协变量的情况下,独立揭示了坡度对局部LST空间变异性的影响。以2024年4月16日22:00 UTC为例,TED-MSAW融合产品展现了最佳的地形协同性能,具有较高的地形解释系数(R2 = 0.6)、较小的LST梯度与朝向之间的偏差(θ = 90)以及合理的坡度依赖性(r = 0.2)。这些结果表明,融合数据集能够更真实地表征山区的地形控制热空间模式。总体而言,TED-MSAW融合框架能够有效填补卫星观测中的缺失信息,并消除再分析数据中的镶嵌伪影。它大大提高了山地LST的精细空间表达能力,并抑制了由于分辨率差异和观测噪声引起的异常热纹理。此外,所提出的方法能够准确再现受局部地形效应调节的精细热结构,包括地形起伏和坡度朝向阴影。本文的融合策略最终增强了复杂山区LST空间分布的物理合理性和地形耦合一致性。
下载:下载高分辨率图像(655KB)
下载:下载全尺寸图像
图6. (a) 2024-03-21 15:00 UTC时研究区域内融合LST的瞬时空间分布;(b–g) 融合LST与各个LST数据集(H8、GK2A、FY-4B、ERA5-Land Noah-MP、GLDAS Noah-MP)的局部比较。
下载:下载高分辨率图像(801KB)
下载:下载全尺寸图像
图7. 不同LST产品的局部空间纹理(Local STD)与地形因素的比较。(a)–(e) 分别代表H8、GK2A、FY-4B、ERA5-Land Noah-MP和GLDAS Noah-MP的Local STD;(f) 表示本研究中提出的TED-MSAW融合LST的Local STD;(g)–(i) 分别代表地形崎岖度(DEM Local STD)、坡度和朝向。
下载:下载高分辨率图像(911KB)
下载:下载全尺寸图像
图8. (a) 不同坡度区间内融合LST与FY-4B LST之间的相关性分析;(b) 不同朝向下融合LST与FY-4B LST的统计指标;(c) 不同土地覆盖类型下融合LST与FY-4B LST的统计指标。
4.4. 与地形和土地覆盖的一致性变化
为了分析地形复杂性对融合结果的影响,我们将地形坡度分为不同的等级,并计算了每个类别内融合LST与FY-4B LST之间的一致性指标。结果如图8(a)所示。可以观察到,随着坡度的增加,相关系数R2逐渐减小,而MAE和RMSE倾向于上升。在平坦地区,RMSE为1.62 K,而在极陡坡地区增加到2.99 K,增加了1.37 K。这表明,在较缓的坡度区域,融合LST与FY-4B LST之间的一致性更高。这种差异可能源于陡峭山区更复杂的局部气象条件和辐射传输过程,这些过程会对不同的LST产品引入不同程度的干扰,进而影响它们之间的一致性。此外,我们将地形朝向分为不同的类别,并计算了每个类别内融合LST与FY-4B LST之间的一致性指标。结果如图8(b)所示。可以看出,与坡度不同,朝向对融合LST与FY-4B LST之间的一致性影响相对较小。R2值保持在0.88左右,RMSE在所有朝向类别中大约为1.89 K,最大差异小于0.12 K。最后,不同土地覆盖类型下融合LST与FY-4B LST之间的一致性指标如图8(c)所示。在不同土地覆盖类别之间可以看到明显的一致性差异。具体而言,在“城市和建成区”以及“耕地/自然植被镶嵌区”,一致性相对较高,RMSE值低于1.1 K。这可能归因于这些区域相对均匀的表面组成和稳定的辐射传输过程,从而使得融合LST与卫星观测结果更为一致。相比之下,“永久性冰雪”和“沙地、岩石和土壤”区域的一致性相对较低,RMSE值高于2.8 K。这可能是由于这些区域表面异质性强和辐射特性在空间上的大变化所致。同时,永久性冰雪具有较高的反射率和独特的热辐射特性,其信号对温度和雪况敏感。这些因素可能导致这些土地覆盖类型中融合LST与FY-4B LST之间的一致性较低。未来的研究可以进一步结合辅助信息,如雪覆盖比例、动态表面发射率和土壤湿度,为雪/冰和沙/土土地覆盖类型开发专门的误差校正模型,从而进一步提高这些区域的LST融合精度。
4.5. 全天气性能和与地面观测的对比
为了检验不同LST产品在原始空间分辨率下的与地面观测结果的一致性,我们提取了每个数据集在站点位置的原始分辨率像素值,并将其与实地测量结果进行比较。选择了两个具有长波辐射观测的站点(HuTouCun和CaoShang)与融合LST进行时间对比。如图9所示,实地LST是根据方程(6)推导出来的,表面发射率是根据每个站点所在地的土地覆盖类型确定的。时间序列曲线显示,卫星反演的LST由于云层和大气效应存在大量数据缺失,而融合LST实现了时间上的连续估计。散点图表明,卫星LST在某些时间点存在显著的异常值,这可能与大气湍流和云层污染有关。相比之下,融合LST继承了陆地表面模型的时间连续性优势,有效填补了卫星观测中的数据空白。同时,它与地面观测结果(Obs)有更好的数值一致性,并能较好地捕捉极端天气条件下的温度波动。在晴朗天气条件下,两个站点处融合LST与地面观测结果的一致性与卫星反演的LST相当,甚至在某些时期更为一致。这表明TED-MSAW方法能够在保持高质量卫星观测详细特征的同时,不会显著降低与地面观测的一致性。在多云天气条件下,传统的卫星LST产品存在广泛的数据缺失。与两种陆地表面模型模拟相比,融合LST在云覆盖区域提供了更合理的温度估计。这表明,借助Noah-MP的物理先验和地形适应性加权方案,融合结果不仅有效地填补了卫星观测中的数据空白,还在一定程度上减轻了单一模型的系统偏差,实现了时间上连续的全天气陆地表面温度估计。
鉴于研究区域内具有长波辐射观测的站点数量有限,难以进行LST产品的空间全面验证。因此,我们采用了多个站点的近地面气温数据,对融合LST和原始LST产品进行了更广泛的区域一致性评估。陆地表面温度和近地面气温表现出强烈的时空同步性和相关性,因为两者都受到太阳辐射、陆地表面属性和大气边界层过程等核心因素的共同调节。在局部尺度上,陆地-空气温度差异相对稳定(Mo等人,2025年)。因此,LST与近地面气温之间的决定系数R2可以有效地表征LST产品的时空变化与实际表面热状况之间的一致性。这种策略已广泛用于LST产品的区域一致性评估(Metz等人,2014年;Mildrexler等人,2011年;Lian等人,2017年)。
下载:下载高分辨率图像(1MB)
下载:下载全尺寸图像
图9. 不同LST产品与实地观测LST之间的时间序列和一致性分析:(a) HuTouCun站点;(b) CaoShang站点。每个站点上空气温度与不同LST之间的R2统计结果汇总在表1中。从总体比较来看,融合LST与空气温度的一致性相对更强。虽然它在少数个别站点(例如LIJING站点)在晴朗天气条件下未达到最高的R2值,但在大多数站点上的表现优于其他LST产品。同时,LST与空气温度之间的相关性表现出明显的地形差异:复杂地形区域的站点R2值均低于0.9,而四川盆地等平坦地区的R2值通常高于0.9。具体来说,NANCHONG站点在晴朗天气条件下的融合LST与空气温度之间的R2达到0.98,是所有站点中最高的。这种空间差异主要源于平坦地形下表面同质性和陆地-空气温度差异的时空变异性较小,从而导致LST与近地面气温之间的耦合关系更稳定。相比之下,在复杂的山区,地形起伏、异质土地覆盖和局部环流会加剧陆地-空气温度差异的波动,从而削弱相关性。然而,在晴朗天气条件下,所有LST产品的R2值都高于多云天气条件(差异约为0.03到0.1),这一特征在七个站点中相对一致。这主要是因为晴朗天气下卫星反演不受云层污染的影响,陆地表面模型的物理模拟也更为稳定,从而使得LST与空气温度之间的耦合更加紧密。在多云条件下,云层遮挡和大气辐射干扰会在一定程度上削弱这种相关性。
表1. 空气温度站点及其与LST产品之间R2的元数据
站点 经度(°E) 纬度(°N) 卫星LST 基于物理的/LST
H8 GK2A FY-4B ERA5-Land Noah-MP GLDAS Noah-MP TED-MSAW
空的 空的 空的 空的 空的
GARZE 100.03 1.617 0.65 0.60 0.72 0.83 0.75 0.85 0.78 0.85 0.79
西昌 102.26 72 7.90 0.74 0.81 0.75 0.90 0.87 0.88 0.86 0.89 0.87
丽江 100.46 72 6.83 30.59 0.68 0.56 0.87 0.69 0.88 0.75 0.86 0.76
文江 103.86 73 0.75 0.79 0.92 0.76 0.96 0.93 0.95 0.93 0.96 0.94
重庆 106.46 72 9.58 30.85 0.87 0.87 0.90 0.90 0.91 0.90 0.95 0.92
贵阳 106.73 32 6.58 30.77 0.79 0.86 0.91 0.92 0.87 0.88 0.92
南充 106.08 33 0.80 0.85 0.92 0.88 0.98 0.96 0.98 0.96 0.97
注:粗体值表示每个站点的最大R2。
4.6. 错误机制分析
为了揭示融合LST错误的内在驱动机制,本研究采用了SHAP(Shapley Additive exPlanations)方法来量化地形和表面特性对错误的贡献方向和强度(图10)。
SHAP beeswarm图的结果表明,土地覆盖类型和海拔高度是融合错误的主要驱动因素。高价值土地覆盖类型和高海拔高度产生正的SHAP值,显著增加了融合错误。相反,低价值土地覆盖类型和低海拔高度与负的SHAP值相关,有效抑制了错误。这种现象源于复杂环境中多源数据的精度下降:高度异质的表面增加了遥感反演的不确定性,而复杂地形和高海拔地区的大气衰减的联合效应降低了遥感和陆地表面模型数据的质量,最终加剧了融合错误。
下载:下载高分辨率图像(226KB)
下载:下载全尺寸图像
图10. (a) 各LST数据集的年平均值与FY-4B LST之间的相关性分析;(b) 各LST数据集的年平均值与融合LST之间的相关性分析。
坡度对错误的影响呈现出明显的双向模式:高坡度值(红点)对应负的SHAP值,而低坡度值(蓝点)对应正的SHAP值。这一结果反映了融合模型的不确定性感知避免机制,而不仅仅是简单的错误补偿。在高坡度区域,TED-MSAW算法检测到卫星观测中的不确定性增加,并通过降低这些易出错数据的权重来有效惩罚其贡献。通过避免依赖这些易出错的卫星数据,并将重点转移到模拟的背景场,该模型成功减轻了地形错误的传播。相反,在低坡度区域,模型对卫星数据赋予了更高的信任度;因此,卫星数据中固有的噪声或偏差更有可能传播到融合结果中,导致误差相对增加。相比之下,坡向的影响可以忽略不计,SHAP值集中在零附近并且分布均匀。这与之前的研究结果一致,即坡向对融合权重的影响很小,证实了其在融合过程中的次要作用。总体而言,土地覆盖类型和海拔是融合误差的主要来源。通过模型的权重惩罚策略,坡度的潜在负面影响得到了有效规避,而坡向的影响仍然很小。这些发现为未来融合模型的优化提供了明确的指导方向。
5. 结论
为了解决四川盆地及其周边复杂山区在多云条件下LST数据缺失和空间精度有限的问题,本研究构建了一个TED-MSAW框架,将物理模型约束与地形适应性融合策略相结合,生成了1公里分辨率的小时全天气地表温度数据集。主要结论如下:
(1)物理先验驱动的全天气LST重建:借助Noah-MP地表模型提供的物理约束,最终实现了云覆盖区域的连续LST估算,确保了地表热过程的时空一致性。地面站对比结果显示,融合产品与实地观测结果具有良好的一致性(RMSE = 1.74 K)和时间稳定性,其整体性能优于原始的低分辨率模型模拟结果。
(2)地形适应性空间优化机制:TED-MSAW融合策略能够适应性地感知地表异质性。通过在复杂地形和陡坡区域适当降低卫星观测的权重,并增强平坦和均匀区域卫星观测的贡献,实现了多源数据的动态最优分配。在抑制异常干扰的同时,它能够很好地保留由地形驱动的细微热结构。
(3)基于SHAP的一致性差异归因分析:归因结果表明,土地覆盖类型和海拔是影响融合LST一致性的关键因素,其影响显著高于坡度。这也表明地表发射率的不确定性可能是区域差异的主要来源。与坡度相关的负SHAP值进一步表明,所提出的模型能够有效缓解由地形几何效应引起的系统偏差。
总之,在多云和复杂地形这种极具挑战性的环境中,纯数据驱动的方法很难获得稳定可靠的LST结果。“物理机制约束+自适应数据融合”的结合思路可以为平衡时空分辨率与实现连续可靠的全天气地表温度估算提供有效的参考。未来的研究将进一步引入动态地表发射率校正方案,以减少地表异质性引起的不确定性。需要注意的是,本研究中的地面评估受到站点数量和空间覆盖范围的限制,相关结果具有一定的区域代表性。未来的工作将纳入更多类型的地面观测数据,进行更全面的不确定性分析和跨区域验证。此外,BTCH统计方法无法区分系统方向偏差和随机观测误差。地球同步卫星在研究区域内的观测角度相似,导致常见的角度偏差。本研究通过使用天底等价的Noah-MP模拟间接缓解了方向效应,但没有进行严格的角度归一化,这需要在未来的工作中加以改进。
**作者贡献声明**
周杰:撰写 – 审稿与编辑,撰写 – 原稿,监督,项目管理,方法论,资金获取,概念化。
段继凯:撰写 – 审稿与编辑,撰写 – 原稿,可视化,调查,资金获取,正式分析。
马进:撰写 – 审稿与编辑,撰写 – 原稿,验证。
唐文斌:撰写 – 审稿与编辑,撰写 – 原稿,方法论。
余文平:资源提供。
侯英旭:可视化,数据管理。
曹瑞银:资源提供。