融合街景视觉聚类与空间格局的无监督城市树木多样性测绘框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年02月26日 来源：Scientific Reports 3.9

编辑推荐：

　　为了解决缺乏详细冠层数据以及有监督AI方法需标注数据且泛化性受限的问题，研究人员开展了一项关于无监督聚类框架的研究。该研究将街景图像视觉嵌入与空间种植模式结合，在八个北美城市中无需标签即可估计生物多样性。结果表明，该方法在属级恢复了高保真的多样性模式，与Shannon和Simpson指数的真实情况相比Wasserstein距离低，并保留了空间自相关性。这项可扩展、精细化的方法为缺乏详细清单的城市提供了生物多样性绘图路径，支持公平的绿色空间获取和城市生态系统的适应性管理。

在城市化浪潮不断推进的今天，城市树木生物多样性如同城市生态系统的“绿色血脉”，对城市的气候韧性、生态稳定性和宜居性至关重要。然而，绘制这份“绿色地图”却面临着巨大挑战。大多数城市对其树冠的了解停留在粗浅层面，详细的物种清单宛如稀缺的拼图碎片。传统的实地调查方法虽然能提供可靠的多样性估计，例如Shannon和Simpson指数，但其高成本与耗时性让许多城市望而却步。与此同时，看似高效的人工智能方法也陷入了困境——有监督学习依赖于大量带标签的数据，但这些数据往往具有地域局限性，难以“举一反三”地推广到其他城市。如何在不依赖昂贵人工标注、又能实现跨区域通用性的前提下，快速、准确地摸清城市树木的家底，成为了城市生态学家和规划者面前的一道难题。

针对这一系列问题，一项发表在《Scientific Reports》上的研究提出了一种创新的解决方案。研究团队开发了一个无监督聚类框架，巧妙地绕过了对标注数据的依赖。该方法的核心在于将街景图像（street-level imagery）中提取的视觉嵌入（visual embeddings）与树木的空间种植模式进行集成，从而实现对生物多样性的估计。研究人员将这一方法应用于八个北美城市，结果令人振奋：该方法能够以高保真度恢复出属级（genus-level）的树木多样性分布模式。与实地调查得到的地面真实数据（ground truth）相比，该方法估算出的Shannon指数和Simpson指数均表现出极低的Wasserstein距离，这意味着模型的估计分布与真实分布非常接近。更重要的是，该方法还成功保留了生物多样性在空间上的自相关特性，揭示了城市中绿色斑块可能存在的聚集或扩散规律。这项研究的意义非凡，它提供了一种可扩展、精细化的新途径，使得那些缺乏详细本底资料的城市也能绘制出自己的生物多样性地图。这不仅为持续、低成本的生态监测铺平了道路，也为促进绿色资源公平享有、实现城市生态系统的适应性管理提供了有力的科学工具。

为开展此项研究，作者主要运用了以下几个关键技术方法：首先，研究基于覆盖多个城市的街景图像库构建视觉数据集。其次，采用预训练的深度学习模型从这些图像中提取高维视觉特征嵌入（visual embeddings）。接着，通过结合地理空间坐标，引入空间上下文信息。最后，利用无监督聚类算法（未具体说明算法类型）对这些融合了视觉与空间信息的特征进行分组，从而识别出不同的树木类型或属，进而计算如Shannon指数和Simpson指数等多样性指标。研究评估所依赖的地面真实数据，来源于各城市已有的、通过传统实地调查获取的树木清单数据库。

研究结果

•
方法概述与验证框架：研究首先阐述了所提出的无监督聚类框架的整体流程，从街景图像输入到最终多样性指数计算。通过在美国八个城市（如西雅图、纽约等）的应用，构建了验证体系，将模型输出与这些城市已有的、详尽的实地调查清单进行对比，以评估框架的有效性。
•
属级多样性模式的高保真恢复：分析表明，该无监督方法能够准确地捕捉到城市内部及城市之间树木属（genus）的组成与分布差异。生成的多样性地图与基于实地数据绘制的基准地图在空间格局上高度一致，直观证明了该方法在识别宏观和局部多样性模式上的能力。
•
多样性指数的准确估算：通过量化比较，模型估算的香农多样性指数（Shannon index）和辛普森多样性指数（Simpson index）与地面真实值之间的Wasserstein距离（一种衡量概率分布差异的度量）普遍较低。这表明模型不仅恢复了空间模式，在多样性指标的绝对数值估算上也具有较高的准确性。
•
空间自相关性的保留：研究利用莫兰指数（Moran's I）等空间统计学方法进行分析，发现模型预测的生物多样性表面与真实数据一样，展现出显著的空间自相关性。这意味着该方法成功保留了生态数据中“相近相似”的关键空间结构特征，而非产生随机或过度平滑的结果。
•
跨城市的可扩展性与鲁棒性：将模型在一个城市训练后直接应用于另一个未见过的城市进行测试，结果显示其仍然能够保持合理的性能。这初步证明了该无监督框架具有一定的跨区域泛化能力，减少了对于每个目标城市都需要大量标注数据的依赖，体现了其作为通用工具的潜力。

结论与讨论

本研究的核心结论是，通过整合街景图像的视觉信息与树木的空间分布模式，无需任何人工标注，即可实现大规模、精细尺度的城市树木多样性测绘。该方法在多个北美城市的验证中表现出色，不仅高保真地恢复了属级多样性图谱，准确估算了Shannon和Simpson指数，还保留了关键的空间统计特性。

其重要意义在于多方面突破了现有瓶颈。在科学方法上，它展示了无监督学习在生态学复杂场景中解决“数据荒”问题的强大潜力，为类似缺乏标签数据的生物多样性监测研究提供了新范式。在应用实践上，它首次提供了一种兼具高精度、低成本和高可扩展性的解决方案，使得任何拥有街景图像覆盖的城市都能快速建立和更新自己的树木多样性数据库。这直接支持了对城市生态系统健康状况的常态化监测，为评估气候韧性、规划绿色基础设施、促进环境正义（确保所有社区公平享有生态福祉）提供了不可或缺的数据基础。最终，这项技术为实现可持续、可适应和更公平的城市未来贡献了关键的“数据基础设施”。

联系信箱：

粤ICP备09063491号

热点排行