《People and Nature》:Where were all the trees? Computer vision meets landscape history to unlock the potential of historical Ordnance Survey maps
编辑推荐:
摘要
英国地形测量局(Ordnance Survey, OS)1:2500郡系列(County Series)首版地图标注了林地、果园等成片树木区域及独立散生树木,是维多利亚时期全英树木空间分布的独特一手数据源。研究人员开发了一种非技术性的深度学习计算机视觉新
摘要
英国地形测量局(Ordnance Survey, OS)1:2500郡系列(County Series)首版地图标注了林地、果园等成片树木区域及独立散生树木,是维多利亚时期全英树木空间分布的独特一手数据源。研究人员开发了一种非技术性的深度学习计算机视觉新方法——单次符号检测模型(You Only Look for a Symbol Once, YOLSO),用于快速识别并地理配准该系列地图中的树木符号。通过对档案的系统梳理,研究人员阐明了OS绘制树木的决策逻辑:旨在标绘所有大型显著散生树木,但前提是不干扰或遮挡其他地图要素。为验证OS原始制图的准确性,研究人员将1:2500地图上的树木符号数量与更大比例尺图件及同期历史照片进行了比对。进一步,研究人员以约克(York)、卡迪夫(Cardiff)和米尔顿凯恩斯(Milton Keynes)三座城市及其腹地为例,分析了散生树木密度与聚落密度的相关性,验证了数字化历史树木数据集的应用价值。综合与应用前景:本研究展望构建覆盖大不列颠的国家历史树木地图(National Historic Tree Map),该成果可用于解析不同类型景观的树木分布特征,并作为20世纪及未来树木景观变迁研究的基准线。
论文解读
研究背景与意义
现有林业调查数据多始于19世纪末,遥感技术主要用于现代监测,针对维多利亚时代散生树木的历史分布数据极为匮乏。然而,过去的管理实践塑造了当代树木景观的结构与生态文化价值,历史趋势分析对当代树木管理至关重要。英国地形测量局(Ordnance Survey, OS)于19世纪中后期测绘的1:2500郡系列(County Series)首版地图,罕见地包含了散生树木符号,覆盖了当时英国大部分耕作区,包含数百万个树木符号,构成了维多利亚时代树木分布的独特基线数据。长期以来,由于缺乏高效的数字化手段,研究人员难以将其转化为可分析的地理空间数据,限制了其在环境史研究中的应用。
关键技术方法
研究人员采用Landmark Information Group提供的按国家网格(National Grid)切割的1平方公里瓦片数据集作为底图,以解决原始地图投影(Cassini Projection)与现代坐标系不匹配的问题。核心算法为研究人员自主研发的单次符号检测模型(You Only Look for a Symbol Once, YOLSO),该模型基于单阶段检测器(single-shot detector)架构,针对地图符号尺寸固定、分布稀疏的特点进行了优化,融合了难负样本挖掘(hard negative mining)技术,能够同时实现独立树木的目标检测(object detection)和成片林地的语义分割(semantic segmentation)。为验证算法精度与历史地图的准确性,研究人员结合了档案分析、大比例尺城镇平面图(Town Plan, 1:500)比对以及56张同期历史照片的实证校验。研究区域涵盖约克、卡迪夫的城市及腹地,以及当时尚为乡村的米尔顿凯恩斯。
研究结果
2 树木制图规则(MAPPING TREES)
通过梳理爱尔兰国家档案馆(National Archives of Ireland)藏存的OS内部通函,研究人员还原了19世纪的制图规范。OS旨在描绘所有大型、显眼或孤立的树木,灌木和小树则被忽略。制图的核心原则是:树木符号不得遮挡更重要的地物细节。1893年的通函明确规定,除地标性树木、公园内的大树及行道树外,不再绘制单株树木、灌木及花园内的小树丛。此外,为了避免混淆,村庄和密集建成区的细小观赏树及果树常被省略。
3 数字数据集构建(CREATING A DIGITAL DATASET)
研究揭示了历史地图数字化的难点。由于OS按军事分区组织绘图,不同分区的绘图员使用的树木印章样式存在差异,加之印刷过程中的油墨差异和复制失真,导致符号形态多变。此外,卡西尼投影(Cassini Projection)在图幅边缘存在尺度畸变,且相邻图幅拼接困难,这对计算机视觉(Computer Vision)算法的鲁棒性提出了极高要求。
4 YOLSO模型(YOU ONLY LOOK FOR A SYMBOL ONCE)
YOLSO模型通过将图像划分为网格单元,利用卷积神经网络(Convolutional Neural Network, CNN)提取特征。该模型假设每个32×32像素的网格单元最多包含一个物体中心,有效避免了传统模板匹配(Template Matching)在处理符号遮挡、截断和形变时的失效问题。模型利用GPU加速,处理单张1平方公里瓦片仅需40毫秒,具备全国尺度数据处理的能力。
5 YOLSO模型评估(EVALUATING YOLSO)
在测试集上的评估显示,YOLSO对独立树木的检测准确率达93.2%,误检率为7.5%。若需区分针叶、阔叶和果树类别,准确率为90.4%。对于林地等成片区域,模型能正确识别87.7%的林地面积(平均每平方公里0.0309平方公里),漏检和误检分别占1.3%和1.42%。
6 历史树木景观表征(REPRESENTING THE HISTORIC TREESCAPE)
通过与1:500大比例尺城镇平面图的对比发现,1:2500地图存在显著的低估现象。在约克和卡迪夫的样本中,1:500地图上显示的树木数量是1:2500地图的1.6倍至3.4倍。结合历史照片验证,研究人员推算1:2500地图上的1个树木符号平均对应现实中2.2棵真实大树。据此估算,19世纪后期约克及其腹地约有13.57万棵散生大树,卡迪夫约有5.93万棵。这种低估在城市密集区尤为明显,因为建筑物和文字注记挤占了树木符号的空间。
7 历史树木景观特征(CHARACTERISING THE HISTORIC TREESCAPE)
空间统计分析表明,散生树木密度与地图地物密度(代表人类活动强度)呈正相关,但这种相关性在不同城市表现各异。米尔顿凯恩斯(当时为农村)相关性最强(Spearman's rho = 0.416),约克次之(0.366),卡迪夫最弱(0.196)。分析显示,树木倾向于聚集在聚落周围,但在高密度城市中心、工业码头区和排屋街道,树木覆盖率极低,甚至低于现代水平。
讨论与结论
研究表明,OS 1:2500地图虽未穷尽所有树木,但确实记录了当时显著的散生树木。利用YOLSO模型成功将这一历史“怪癖”转化为宝贵的数据资产。研究人员推断,当时的制图员遵循了“不遮挡重要地物”的原则,导致城市核心区树木被系统性低估。尽管如此,该数据集仍能反映宏观的树木分布格局。研究发现,历史上的树木分布与人类聚落关系密切,但在工业化核心区这种关系发生断裂。这一发现有助于理解现存树木种群的起源,并为未来的树木种植政策提供历史维度的参考。研究人员展望,基于此方法构建的大不列颠国家历史树木地图(National Historic Tree Map),将成为连接过去、现在与未来环境变化研究的重要桥梁。