编辑推荐:
土地沉降易发性制图框架融合PSI与机器学习模型,以奎塔市为例,利用Sentinel-1数据提取229,836个PS点,通过13个水文地质和人为因素训练模型,随机森林(AUC 0.94)最优,较其他模型精度提升4.4%-2.7%,为高城市化地区提供可靠的风险管理工具。
萨吉德·侯赛因(Sajid Hussain)|宾·潘(Bin Pan)|瓦吉德·侯赛因(Wajid Hussain)|俞成潘(Yucheng Pan)|李和平(Heping Li)|纳齐赫·Y·雷布(Nazih Y. Rebouh)|卡迪贾·亚希亚·法克伊(Khadeijah Yahya Faqeih)|索玛雅·莫斯里夫·阿拉姆里(Somayah Moshrif Alamri)|埃曼·拉菲·阿拉梅里(Eman Rafi Alamery)|阿基尔·塔里克(Aqil Tariq)
武汉大学遥感与信息工程学院,中国武汉430079
摘要
由于地壳构造运动、海平面上升和快速城市化,城市地面沉降对全球基础设施的韧性构成了威胁。在巴基斯坦奎达市,提出了一种结合了持续散射体干涉测量(PSI)和集成机器学习(ML)的地面沉降敏感性制图(LSSM)混合框架。利用两年的Sentinel-1上升波段SAR数据进行处理,通过PSI技术获得了从每年+42毫米(抬升)到-172毫米(沉降)的视线方向(LOS)速度,所有像素的相干性均高于0.75。经过多重共线性预筛选的13个水文地质和人为因素被用作预测变量。通过设定每年-15毫米的PS速度阈值来定义二元目标,这最大化了敏感性指数分布的可分性。最终获得了229,836个点的PS数据,并将其分为训练集和验证集。选择了三种不同的算法模型进行比较——从可解释的决策树(DT)到集成学习随机森林(RF)以及复杂的非线性人工神经网络(ANN)——以全面评估它们在地面沉降敏感性制图方面的预测能力和鲁棒性。随机森林(RF)的预测能力最高,曲线下面积(AUC)为0.94,超过了人工神经网络(ANN)的0.91和决策树(DT)的0.89。RF的准确率比ANN高出2.7%,比DT模型高出约4.4%。PSI-ML工作流程为分析地面沉降提供了一个稳健且可迁移的框架。这种方法对于全球快速城市化城市中的主动风险管理和基于证据的规划至关重要。
引言
地面沉降是指地球表面向下移动的现象,目前全球约有12亿人受到其影响,预计到2040年这一现象将影响全球8%的土地面积,潜在的经济损失每年超过数十亿美元(Herrera-García等人,2021年)。目前已有150多个国家记录到可测量的地面沉降现象(Bagheri-Gavkosh等人,2021年),其中1,596个主要城市位于可能受影响的区域(Herrera-García等人,2021年)。虽然构造压缩、碳酸盐溶解和沉积物固结仍然是重要的自然驱动因素(Shirzaei等人,2021年),但人为因素,特别是过度抽取地下水、石油天然气开采以及不断扩张的建成区的静态负荷,使得这一过程加速(Song等人,2024年)。这种微妙且渐进的变形往往在差异性沉降超过工程耐受阈值之前难以被检测到。到那时,关键基础设施、高层建筑和沿海防洪设施可能已经遭受了不可逆的损害(Li等人,2020年)。
巴基斯坦也不例外。全国范围的调查显示,该国是已记录到地面沉降现象的150个国家之一,地下水枯竭和区域性地壳构造活动是主要诱因(Amin等人,2022年;Hussain等人,2022年;Hussain等人,2024年;Sajjad等人,2024年)。虽然印度河流域是该国主要的农业命脉,但这一危机最严重的表现出现在俾路支斯坦封闭的高海拔干旱盆地,其中奎达谷是快速含水层枯竭的典型例子。全国范围内,含水层的抽取量超过每年50-550亿立方米,使巴基斯坦成为全球五大地下水开采国之一(Qureshi等人,2010年)。尽管全国范围内的InSAR覆盖尚未系统化,但个别研究显示印度河三角洲的沉降速率为每年20-90毫米(Kakar等人,2020年),旁遮普省中部运河区域的沉降速率高达每年150毫米(Sajjad等人,2024年)。这些数值与墨西哥城或雅加达的沉降速率相当,凸显了全国范围变形测绘的紧迫性。
奎达是俾路支斯坦的省会,也是本研究的重点研究对象。该城市位于一个构造活跃的半干旱裂谷中,海拔约1,650米,下方覆盖着200-400米的可压缩湖泊淤泥和粘土(Saif等人,2024年)。由于人口快速增长(每年4.3%),市政用水需求增加到约4500万立方米/天,其中92%的用水来自钻探在浅层奎达含水层中的500多口井(Dawood等人,2021年)。目前市中心地区的地下水位下降速率超过每年3米,形成了一个35平方公里的沉降锥体,其水头低于地表60米(Qureshi等人,2022年)。2004-2014年间对机场道路进行的早期测量已经显示出150-200毫米的累积沉降(Khan等人,2013年),而2003年至2023年的最新研究表明,奎达的累积沉降达到了273厘米(Kakar等人,2025年)。这些沉降速率是全球平均海平面上升速率的两倍,超过了通常用于高敏感性分区的每年15毫米的阈值(Herrera-García等人,2021年),表明奎达正经历南亚地区最快的人为沉降现象之一。
传统的基于地面的监测方法(如水准测量、GPS网络和钻孔伸长计)虽然能提供毫米级的精度基准,但在空间上分布稀疏、耗时且难以捕捉城市内部变形场的精细异质性(Abidin等人,2013年;Motagh等人,2007年)。持续散射体干涉测量(PSI)是一种多时相InSAR技术,它利用相位稳定的雷达目标,在各种天气条件下都能提供密集的城市范围位移时间序列,精度达到亚厘米级别(Ferretti等人,2002年)。最近的城市规模研究表明,PSI能够分辨出数百米范围内变化超过100毫米/年的沉降速率,从而揭示了之前未记录的不稳定热点(Busetti等人,2020年;Nolesini等人,2016年)。
将这些高分辨率测量结果整合到可操作的风险地图中,需要强大的预测模型来区分水文地质因素和人为因素之间的非线性相互作用。早期的GIS基敏感性评估依赖于知识驱动的方法,如层次分析法(AHP)和双变量统计,以及频率比(FR)、证据权重(WOE)和证据信念函数(EBF)(Bianchini等人,2019年;Nhu等人,2020年)。尽管这些方法透明,但它们因主观权重分配和空间自相关处理能力有限而受到批评。随后,人工神经网络(ANN)、支持向量机(SVM)、随机森林(RF)、提升回归树(BRT)、逻辑回归(LR)、决策树(CART:分类与回归树)、自适应神经模糊推理系统(ANFIS)、卷积神经网络(CNN)等机器学习算法获得了广泛应用,这些算法在学习复杂、尺度依赖的关系方面表现出色,并减少了专家偏见(Band等人,2020年;Kalantar等人,2020年;Nhu等人,2020年;Shafizadeh-Moghadam等人,2018年)。在伊朗、韩国和中国的比较研究中,基于集成树的模型,尤其是随机森林(RF),在地面沉降敏感性制图(LSSM)方面始终名列前茅(Hakim等人,2025年;Sadeghfam等人,2025年;Yaragunda等人,2025年;Yu等人,2025年)。
尽管取得了这些进展,但仍存在三个关键问题。首先,大多数机器学习工作流程使用来自光学图像、InSAR相干性掩膜或地质地图的粗略清单,从而因位置不确定性而削弱了预测信号的准确性(Chen等人,2025年;Chen,2025年)。其次,敏感性标签通常通过任意速度阈值来确定,忽略了稳定和沉降区域之间的内在差异性。第三,模型验证通常采用随机交叉验证,这违反了空间独立性假设,导致准确性指标被高估(Kumar等人,2025年)。
为了解决LSSM中的这三个问题,我们采用了一种基于证据的工作流程:(i)我们使用PSI处理了两年的Sentinel-1上升波段数据,提取了63,412个持续散射体,获得了厘米级别的视线方向速度,地理定位误差小于5米(Ferretti等人,2001年);(ii)我们通过最大化稳定和不稳定概率分布之间的Bhattacharyya距离来优化类别边界,从而确定数据驱动的敏感性阈值为每年-15毫米(Zhao等人,2024年);(iii)我们采用空间不相交的交叉验证方法,将PSI数据分成五个互斥的地理组,确保独立的训练和盲测,从而获得保守且可迁移的结果。
本研究以巴基斯坦的奎达市为研究对象,该市位于印度板块西缘的一个地震活跃的半干旱盆地。过去二十年里,奎达经历了快速的人口增长和未经规划的城市扩张。为了满足市政供水和灌溉园艺的需求,大量抽取地下水,加上在未固结的冲积-湖泊沉积物上建造重型工程结构,引发了人们对地面沉降加速的担忧。然而,系统的变形测量和敏感性评估仍然缺失。因此,奎达为在数据稀缺、快速沉降的环境中整合Sentinel-1 PSI位移和集成机器学习技术进行高分辨率LSSM提供了理想的自然实验室。
研究区域
奎达是巴基斯坦俾路支斯坦省的首府、行政、教育和经济中心,位于皮辛洛拉(Pishin Lora)地区盆地。从地缘政治角度来看,它靠近阿富汗坎大哈省的边界。由于位于巴基斯坦南部的内陆流域,周围环绕着苏莱曼山脉(Suleiman Mountains),因此具有典型的干旱至半干旱气候(Hussain等人,2025年)。奎达被穆尔德尔(Murdar)、奇尔坦(Chiltan)、塔卡图(Takatu)和扎尔贡(Zarghoon)山脉所环绕,位于一个高
PSI测量的地面变形结果
利用两年的数据,通过PSI方法估计了地面变形速率,范围从每年42毫米(抬升)到-172毫米(平均速度为-4.82毫米/年)(图5a)。平均均方根误差(RMSE)为3.67(标准差=1.84),平均MuSigma为2.72(标准差=1.92),共处理了2,623,432个点。为了生成连续的变形表面,我们比较了两种确定性插值方法:普通克里金法(OKG)和逆距离加权法(IDW)
模型基准测试和因素解释
表3中的比较指标证实了随机森林集成模型的优越预测能力。随机森林(RF)的准确率为94%,精确率为96%,召回率为93%,超过了人工神经网络(ANN)的89%、91%和87%,以及决策树(DT)的84%、82%和80%。我们的随机森林模型准确率达到了94%,显著优于多个国际基准模型。具体来说,我们的模型预测能力超过了伊朗卡尚平原(Kashan Plain)的RF应用(Hosseinzadeh等人,
结论
在这项研究中,我们开发了一种高性能的混合地面沉降敏感性制图(LSSM)框架,并通过系统集成持续散射体干涉测量(PSI)和机器学习(ML)对其进行了严格验证。该方法成功地利用两年的Sentinel-1 SAR数据合成了高精度的变形清单,显示最大平均沉降量为172毫米。通过使用13个预筛选的水文地质因素
CRediT作者贡献声明
卡迪贾·亚希亚·法克伊(Khadeijah Yahya Faqeih):撰写 – 审稿与编辑、可视化、验证。索玛雅·莫斯里夫·阿拉姆里(Somayah Moshrif Alamri):撰写 – 审稿与编辑、调查、数据管理。纳齐赫·Y·雷布(Nazih Y. Rebouh):撰写 – 审稿与编辑、调查、数据管理。萨吉德·侯赛因(Sajid Hussain):撰写 – 初稿撰写、软件开发、方法论设计、正式分析、数据管理、概念构思。埃曼·拉菲·阿拉梅里(Eman Rafi Alamery):资源获取、数据管理。阿基尔·塔里克(Aqil Tariq):撰写 – 审稿与编辑、监督、数据管理。俞成潘(Yucheng Pan):撰写 – 审稿与
利益冲突声明
作者声明没有已知的可能影响本文研究的利益冲突。
数据可用性声明
这些数据基于正在进行的博士研究项目,可根据合理请求提供。
资助
公主努拉·宾特·阿卜杜勒拉赫曼大学(Princess Nourah bint Abdulrahman University)支持项目编号(PNURSP2026R674),沙特阿拉伯利雅得利益冲突声明
作者声明没有已知的可能影响本文研究的财务利益冲突或个人关系。
致谢
公主努拉·宾特·阿卜杜勒拉赫曼大学支持项目编号(PNURSP2026R6743),沙特阿拉伯利雅得