目前,全球超过40%的人口居住在农村地区,这使得农村的可持续性对经济发展和社会稳定至关重要(Harrington, 2016)。然而,由于长期以城市为中心的发展,农村在住房和基础设施方面落后(Y. Liu & Li, 2017; Li et al., 2019)。多个联合国可持续发展目标,包括清洁水和卫生(SDG 6)、可持续社区(SDG 11)和减贫(SDG 1),直接针对农村定居点的发展。为此,许多国家,特别是像中国这样的发展中国家,已经启动了农村振兴计划,以改善村庄建设和提高农村生活条件(Li et al., 2020; So, 2019)。在这种背景下,科学准确地评估村庄建设水平对于制定地方发展策略和指导有针对性的政策行动变得越来越重要(Cheng et al., 2025; Huang et al., 2025)。
农村地区覆盖广阔的领土,村庄分布分散,这使得数据收集成本特别高。与数据丰富的城市环境不同,农村面临严重的数据稀缺问题。因此,对村庄发展的评估仍然严重依赖传统的实地调查,这些调查耗时、昂贵且更新缓慢。这对大规模和长期监测提出了重大挑战。最近,多源大数据的兴起和技术的快速进步提供了新的解决方案。其中,街道视图影像(SVI)因其对建成环境的丰富视觉表现而受到关注(Biljecki & Ito, 2021)。在人工智能和计算机视觉的支持下,SVI已广泛应用于城市研究,并显示出进行大规模自动化农村评估的潜力(Fan et al., 2023; He & Li, 2021; Larkin et al., 2025; Liang et al., 2023)。值得注意的是,多模态大语言模型(MLLM)的出现进一步降低了图像解释的技术门槛和成本(Chang et al., 2024; Malekzadeh et al., 2025)。
然而,将现有的图像解释技术从城市环境适应到农村环境面临关键挑战。首先,农村地区的SVI覆盖范围有限,因为主要的地图服务提供商主要关注城市地区;其次,农村场景与城市环境有很大不同,难以应用为城市开发的城市模型和数据标签;第三,大多数城市SVI研究关注主观感知(如视觉吸引力、安全性),这些指标不适合评估客观的农村建成环境。这引发了一个关键问题:如何更有效地在农村环境中应用SVI和计算机视觉技术,以减少传统实地调查所需的人工和时间成本?
基于此背景,本研究开发了一个用于村庄视图影像(VVI)的众包数据收集平台,并建立了一个智能评估框架来评估村庄建设。该框架评估农村建成环境各个组成部分的建设水平。我们使用MLLM作为评估引擎,并根据政策要求和专家知识设计结构化提示,以实现各种建成环境元素的准确评估。我们将这一评估框架应用于中国99个样本县,并通过与其他独立调查的数据进行比较来验证其有效性。此外,我们还探讨了这一智能评估框架在农村规划和政策实施中的潜在实际应用。
本研究的创新和贡献主要体现在以下三个方面:(1)它提出了一个基于VVI和MLLM的智能评估框架,能够在相对较低的成本和技术门槛下客观评估农村地区的各种建成环境元素,减少了对传统实地调查中人工现场评估的依赖;(2)它引入了一种基于政策要求和专家知识的三层提示设计策略,显著提高了MLLM在农村环境中的评估性能;(3)从实际角度来看,该评估框架与相关政策要求紧密对齐,有助于识别村庄建设中的问题,并支持地方政府制定有针对性的干预措施。