《Remote Sensing of Environment》:TIDA-SR: A time-conditioned deformable attention network for DEM super-resolution in cloud-covered mountainous regions
编辑推荐:
针对山区云雾遮挡导致的DEM精度低和分辨率不足问题,本研究提出TIDA-SR模型,结合时间条件、可变形卷积与注意力机制,通过多源DEM融合策略提升重建精度,实验表明其RMSE和MAE较传统方法降低5%-78%,地形特征恢复更优,在黄土高原和落基山脉验证中有效解决边界融合问题,为高精度地形重建提供新方法。
Kai Chen|Fayuan Li|Sijin Li|Haoyu Cao|Wen Dai|Guoan Tang
南京师范大学地理学院,中国南京210023
摘要
山区复杂的地形和多变的气候条件常常导致云层和雾的遮挡,这阻碍了使用光学卫星摄影测量技术生成高分辨率数字高程模型(DEM)(精度低于10米)。为了解决受云层影响区域DEM精度不足和数据缺失的问题,本研究提出了一种基于时间条件的可变形卷积注意力超分辨率网络(TIDA-SR)。该网络利用开源DEM进行超分辨率重建,并通过羽毛状融合策略整合多个DEM源,以实现高精度结果。其架构结合了扩散过程、可变形卷积和卷积块注意力模块(CBAM),以及复合损失函数,以增强对复杂地形细节的恢复能力。TIDA-SR网络结合GF-7立体影像生成的5米DEM和开源30米DEM,用于重建和融合受云层影响的区域,达到5米的分辨率。在黄土高原和落基山的实验结果表明,与传统插值方法和现有深度学习方法相比,TIDA-SR在验证数据集上的RMSE和MAE分别降低了约5%–78%,在开源DEM数据集上降低了3%–25%。在验证数据集上,坡度精度提高了约3%–42%,在开源DEM数据集上提高了3%–8%。羽毛状融合策略有效缓解了云层区域与非云层区域之间的拼接伪影,提升了整体空间连续性。TIDA-SR在受云层影响的山区高分辨率DEM重建中表现出优异的性能,具有广泛的实际应用潜力,包括地表过程模拟、山地水文建模、地貌分析等地形驱动的地球科学任务。
引言
山区地形以显著的高程变化和复杂的地貌形态为特征,在维持下游地区的水文循环、支持丰富的生物多样性以及形成明显的垂直地带性方面发挥着关键作用(Kumar等人,1997;K??b,2002;Daly等人,2008;Li等人,2024d;Mo等人,2025)。此外,由于陡峭复杂的坡度、不稳定的地质结构以及强烈的降雨等因素,山区极易发生地质灾害,如滑坡、泥石流和落石,从而对人类安全和基础设施稳定性构成严重威胁(Singh等人,2023;Xiong等人,2023;Jian等人,2025)。在这种情况下,高精度和高分辨率的数字高程模型(DEM)作为表示和模拟地形的基本数据是不可或缺的。DEM的分辨率和精度越高,能够捕获的地形信息就越丰富,对真实地形的描绘就越细致(Dai等人,2019;Van Wees等人,2024;Weiting和Zhongbao,2025)。因此,获取高质量的山区DEM对于环境监测、灾害预防与缓解、工程建设以及生态保护具有重要意义。高质量的DEM不仅需要提供广泛的空间覆盖范围,还需要实现高空间分辨率和精度,从而更真实地反映复杂地形特征。因此,垂直精度、空间覆盖范围和分辨率是评估DEM数据质量的重要标准。近年来,光学摄影测量、雷达干涉测量、LiDAR和深度学习等技术的进步极大地促进了DEM的获取(Guth等人,2021;Tao等人,2022;Xiong等人,2022;Wang等人,2024;Cao等人,2025)。其中,光学卫星摄影测量因其成本效益和广泛的覆盖能力,已成为构建区域高质量DEM的最重要方法之一(Bhushan等人,2021;Li等人,2024c;Hong等人,2024;Xiong等人,2025;Clark等人,2025)。然而,由于山区地形的复杂性和气候条件的变化,使用光学卫星摄影测量在这些地区生成DEM时,经常受到云层和雾的遮挡以及山体阴影的严重限制。这些限制经常导致生成的DEM存在较大的高程误差,进而对后续的地球科学分析和实际应用造成严重制约。因此,在提高空间分辨率的同时优化垂直精度仍然是山区DEM建模中的一个基本科学挑战(Dong等人,2020;Li等人,2022;Zhao等人,2024)。
为了解决云层覆盖和数据缺失的问题,现有研究主要采取了两种方法。第一种方法是通过添加额外的立体图像对来补充或替换缺失区域。然而,光学卫星立体图像对通常覆盖数百平方公里,典型的云层覆盖率为1%到10%。因此,即使对于相对较小的云层覆盖区域,也需要大量的额外图像。此外,统计结果表明,光学摄影测量卫星的利用效率仅约为40%(Ebel等人,2022;Wang等人,2023a)。因此,尽管增加更多的立体图像对可以部分缓解数据缺失的问题,但不可避免地会消耗大量的计算和存储资源。
第二种方法是通过整合地球科学知识来提升现有的DEM产品。当遮挡区域较小且地形相对平坦时,数学插值方法可以利用空间相似性获得满意的结果。然而,在具有显著高程变化和复杂结构的山区,简单的插值方法往往无法满足精度要求。鉴于此背景,深度学习方法因其强大的非线性建模和重建能力而逐渐成为热门研究课题。现有的基于深度学习的DEM重建方法大致可分为两类:特征线重建和超分辨率重建。第一类特征线重建(Chen等人,2023;Li等人,2024c;Chen等人,2024;Zhang等人,2025)主要应用于数据完全缺失的区域。例如,Li等人(2022)和Zhao等人(2024)从遥感图像中提取特征线,在训练区域建立特征线与DEM之间的映射,并推断出空白区域的DEM值。然而,由于输入信息不足,这种方法在缺乏地形特征的区域内常常产生较大误差。第二类是对低分辨率DEM进行超分辨率重建(Zhang等人,2022;Jiang等人,2023;Han等人,2025;Wang等人,2024g),基于粗分辨率DEM逐网格恢复高精度地形信息。由于输入信息分布更均匀,这种方法具有更大的应用潜力。在典型的DEM超分辨率任务中,建立低分辨率DEM和高分辨率DEM之间的映射,并扩展到空间相邻区域。传统的插值方法(如双线性插值和双三次卷积)在恢复高频细节方面能力有限,只能缓解由低分辨率引起的可见不连续性或斑块状伪影。相比之下,深度学习方法可以通过大量参数拟合复杂的映射,从而将更多高频地形信息注入重建过程。目前,主流模型包括CNN、GAN、DDPM及其变体。此外,一些研究(Tan等人,2024;Gao等人,2025;Cao等人,2025)尝试结合图像和水文知识等辅助信息,进一步提高重建质量和细尺度地形细节的表示。
然而,大多数现有的基于深度学习的超分辨率方法主要关注像素级别的垂直精度指标作为优化目标,而忽略了坡度、朝向和地形起伏等关键地貌特征(Li,2025)。因此,重建的DEM虽然视觉上更加平滑,但往往缺乏地貌真实性(Yao等人,2024;Gao等人,2025)。因此,如何在保证高精度的同时增强地形结构的真实表现仍是一个紧迫的科学挑战。
为了解决上述挑战,本研究提出了一种基于时间条件的可变形卷积注意力超分辨率网络(TIDA-SR),通过开源DEM的超分辨率重建云层和雾层覆盖区域的山区DEM,并结合羽毛状融合策略实现高精度多源DEM整合。这样,该方法在提高开源DEM的空间分辨率的同时,也优化了垂直精度。本研究的主要贡献如下:
(1)提出TIDA-SR网络用于DEM超分辨率重建,增强对复杂地形特征的恢复能力;
(2)引入羽毛状融合策略,将超分辨率DEM与无云区域整合,从而提高空间连续性并减少边界伪影;
(3)证明所提出的方法在像素级精度和地貌一致性方面优于传统插值和现有深度学习方法。
研究区域和数据
本研究选择的区域包括中国的黄土高原和美国的落基山脉(图1)。黄土高原的土壤质地松散,该地区长期受到强降雨和风蚀的影响,形成了多条沟壑的破碎地形,是世界上最复杂的地形区域之一(Wang等人,2025;Li等人,2025)。美国的落基山脉面积广阔,有许多山脉和陡峭的地形
概述
本研究的工作流程如图2所示。首先,通过光学摄影测量卫星立体图像对和机载激光高度数据的组合块调整生成5米DEM。然后将获得的DEM分为云层覆盖区域和无云区域。构建TIDA-SR网络,将无云DEM按6的缩放因子裁剪为训练数据集,生成5米和30米DEM的超分辨率权重文件。接下来,
云层重建结果
为了更好地评估结构和纹理的真实性,提取了阴影地图作为地形衍生物(图5)。结果显示,传统插值方法(双线性和双三次插值)生成的阴影与参考数据有显著偏差。特别是6×插值引入了明显的“棋盘状伪影”,因为这些方法无法增强高频信息,导致地形阴影出现明显失真。
相比之下,基于深度学习的
不同超分辨率尺度的影响
根据Gao等人(2025)的报告,超分辨率尺度对模型精度有显著影响。一般来说,较大的上采样因子要求网络预测更多的缺失信息,引入更高的不确定性,从而使精度提升变得更加困难。为了评估所提方法在不同上采样因子下的性能,在TIDA-SR网络上进行了四次超分辨率实验(×2、×4、×6和×8)
结论
本研究提出了一种TIDA-SR方法,该方法在山区云层覆盖区域的DEM重建中提高了高程精度和结构真实性,在数值和视觉性能方面优于传统方法和主流深度学习模型。通过结合时间条件和扩散扰动机制,该模型增强了细节恢复和泛化能力;可变形卷积和注意力模块进一步提高了
CRediT作者贡献声明
Kai Chen:撰写——原始草案、可视化、验证、软件、方法论、数据整理、概念化。Fayuan Li:资金获取、概念化。Sijin Li:撰写——审稿与编辑、资金获取、概念化。Haoyu Cao:软件、研究。Wen Dai:方法论。Guoan Tang:资源、资金获取。
致谢
我们感谢国家自然科学基金(资助编号42271421和42401507)、江苏省自然科学基金(资助编号BK20240600)、江苏省研究生研究与实践创新计划(KYCX25_1979)以及浙江省数字智能监测与流域环境修复重点实验室(编号KF-202505)提供的财政支持。