全球城市化正以前所未有的速度重塑地球表面,预计到2050年城市土地面积将增加两倍,不透水表面的扩张可能会破坏水文循环并加剧热岛效应(如渗透减少),进一步导致栖息地丧失(Seto等人,2012b)。比利时是欧洲城市化程度最高的国家之一,其城市建成区及相关面积从1990年的10.2%(497,959公顷)增长到2023年的21.9%(672,741公顷),30年间增长了11.7个百分点(来源:比利时统计局)。十大城市地区(如布鲁塞尔、安特卫普)的不透水表面每年增加约1.2%,这种快速的城市化严重破坏了湿地生态系统:卫星分析显示,布鲁塞尔首都大区在1990年至2018年间失去了28%的自然湿地(Copernicus土地监测服务,CLMS)。生态系统功能的退化主要是由于不透水表面的扩张,这破坏了土壤的持水能力(Devos等人,2020;Aouadi等人,2021),严重限制了水鸟的筑巢地点和无脊椎动物猎物的获取。此外,这些地区还面临着栖息地破碎化和城市内部及邻近湿地捕食压力加剧的双重挑战(L?ffler等人,2024;McMahon等人,2024)。城市湿地生态系统还面临着来自城市径流中的重金属等环境毒理风险(Mukherjee等人,2022),以及多重压力对水鸟活动节律和觅食行为的影响,包括河岸光污染(Khanduri等人,2023)。
从城市生态规划的角度来看,不透水表面的扩张阻碍了生态连通性,因此合理构建“蓝绿基础设施网络”尤为重要(Tzoulas等人,2007)。此外,生物多样性敏感的城市设计原则表明,当不透水覆盖超过物种的耐受水平时,生态功能会崩溃(M?rtberg等人,2007;Mammides等人,2024)。这些不透水表面梯度与空间规划工具相互关联:高不透水表面区域触发分区代码要求,而低不透水表面走廊则激活生态补偿机制(如人工湿地)。同时,城市紧凑政策将开发集中在30%的城市范围内,反而加剧了对剩余湿地的不透水表面压力,需要城市蓝绿基础设施(UGBI)作为必要的补偿要素(Molné等人,2023)。这一综合框架可以通过形态空间模式分析进行实证测量,其中不透水表面驱动的湿地破碎化与水鸟多样性丧失直接相关(Andrade等人,2018;Zhang和Ouyang,2019)。这种理论-政策联系支持了我们使用机器学习方法来量化不透水表面阈值。我们的建模方法,特别是XgBoost和随机森林方法,能够有效捕捉水鸟分布与城市景观特征之间的复杂甚至非线性关系,这对于准确预测栖息地适宜性至关重要(Chen等人,2025),也有助于更广泛的威胁评估(Cook等人,2025;Kater和Baxter,2025;Dang等人,2026)。此外,作为湿地的“指标”,水鸟的分布模式反映了栖息地的完整性(如水文连通性、食物资源可用性),并指示了更广泛的城市生态系统稳定性(Péron等人,2013;Rajpar等人,2022)。然而,现有研究主要集中在大型保护区域(如1平方公里网格),并且在高密度城市环境中,不透水表面与水鸟分布之间的栖息地异质性存在差距(Banville等人,2017)。
传统的生物多样性监测依赖于标准化的野外调查,这些调查成本高昂且受空间限制,难以满足快速变化的城市生态系统的需求。公民科学平台(如eBird)通过众包方式彻底改变了数据收集方式(Lindenmayer和Likens,2011)。eBird的全球数据库积累了约1.05亿条记录和10,959个物种数据,其中比利时贡献了约59,103条记录和445个物种数据(截至2025年9月2日),显著提高了空间和时间分辨率(Sullivan等人,2014;Kelling等人,2019)。然而,公民科学数据可能存在空间采样偏差,这可能导致高覆盖率区域的栖息地适宜性被高估,而郊区或eBird较少访问的野生区域的生态潜力被低估(Johnston等人,2021)。此外,大多数研究仅使用土地覆盖因素和MaxENT来模拟物种出现情况(Jiang等人,2024),这些方法往往高估了这些因素的权重(Isaac等人,2014)。为了解决这个问题,我们的研究应用了多种环境因素和机器学习方法,并叠加了不透水表面覆盖信息,以优化数据偏差。
高分辨率环境数据的获取和处理仍然是城市生态建模中的核心挑战(Degerickx等人,2020;Liang等人,2020;Neyns和Canters,2022)。与其他数据源和图像处理平台相比,Google Earth Engine(GEE)平台整合了多源遥感数据(如Sentinel-2)与云计算,能够快速提取精细分辨率为10米的土地表面参数,如土地覆盖、土地表面温度和NDVI(Brown等人,2022;?olak和Sunar,2022;Lasaponara等人,2022)。这种分辨率对于捕捉城市栖息地的异质性和微观特征(如小池塘、排水沟、狭窄的绿色走廊)至关重要,这些特征在较低分辨率的分析中可能会被忽略(如Landsat 8、MODIS)。
随着机器学习的进步,XgBoost(XgB)和随机森林(RF)算法在生态建模中的表现优于传统方法(如MaxENT和SVM)。XgB和RF能够捕捉环境变量之间的非线性相互作用,从而提高预测准确性。与MaxENT和SVM相比,这些方法在处理微观尺度的城市生态环境时具有更大的适应性(Chen和Guestrin,2016;Smith,2019;Zhao等人,2022;Jiang等人,2024)。尽管深度学习方法(如卷积神经网络)已应用于生态研究,但其“黑箱”特性限制了可解释性,这也是为什么它们未被本研究采用的原因。相比之下,XgBoost和随机森林提供了更直观的特征重要性分析,有助于揭示环境变量如何影响水鸟分布的机制,从而为生态保护策略提供科学依据。
因此,本研究旨在解决比利时十大城市地区(50-200平方公里)的两个核心问题:(1)如何将Google Earth Engine(GEE)环境数据(如Sentinel-2 NDVI、不透水表面概率、生物气候数据)的10米分辨率与经过空间过滤的eBird公民科学观测数据相结合,使用两种机器学习算法(XgBoost和随机森林)创建高精度的城市水鸟分布模型;(2)如何确定不透水表面覆盖对水鸟栖息地适宜性的阈值效应,并将研究结果转化为生态规划策略。研究框架通过数据预处理(如将MODIS表面温度降尺度到10米)、交叉验证(AUC、F1分数)以及模型特征重要性的可解释性分析来优化模型性能,以优先识别关键驱动因素,如不透水表面覆盖、NDVI和水文连通性。基于上述方法,获得了比利时十大城市地区水鸟潜在空间分布和模式的比较和地图,为理解不透水表面效应和全球城市尺度上的水鸟保护提供了宝贵的见解。