探索生成式人工智能在补充多利益相关者景观偏好评估方面的潜力

《Landscape and Urban Planning》:Exploring the potential of generative AI to complement multi-stakeholder landscape preference assessment

【字体: 时间:2026年02月25日 来源:Landscape and Urban Planning 9.2

编辑推荐:

  多模态大语言模型(GPT-4o和Qwen3)用于评估中国桑基鱼塘与堤塘农田景观的多主体偏好,发现GPT-4o预测精度更高,但存在建筑元素权重偏高等偏差,通过融合多主体重要性权重提升模型与人类判断的一致性达38%-85%。

  
林静雅|陈重志|冯天|霍世高|张凯欣|董白玉|向珊珊|王凯|黄璐
浙江大学环境与资源科学学院,杭州310058,中国

摘要

随着城市化和农业集约化的持续进行,理解和结合不同利益相关者的偏好对于可持续的土地利用和管理变得至关重要。传统的景观偏好评估受到可扩展性有限、成本高和时间消耗大的限制,这凸显了人工智能在补充人类评估方面的潜力。本研究采用了两种多模态大语言模型(MLLMs),GPT-4o和Qwen3,来模拟和分析中国桑树-堤坝和鱼塘农业景观中农民、游客和专家的景观偏好。通过极端梯度提升和Shapley加性解释方法,研究了MLLMs预测与人类判断之间的差异,并探讨了特定景观特征如何影响利益相关者的偏好。此外,还将利益相关者对景观特征的重要性权重纳入提示中,以提高模型与人类感知的一致性。结果表明,GPT-4o在预测人类偏好方面优于Qwen3。虽然人类更重视堤坝-池塘的比例和鱼塘的形状,但GPT-4o倾向于优先考虑建筑环境特征,如当地建筑物。将利益相关者的评估纳入提示过程后,模型与人类的相关性分别提高了约38%、85%和54%。这些发现表明,MLLMs可以作为多利益相关者景观偏好评估的适应性工具,为将多样化的人类观点融入景观规划和决策提供了新的机会。

引言

随着城市化和农业集约化的加剧,由于休闲时间的增加和生活水平的提高,人们对愉悦环境的需求也在上升(Guo等人,2010年)。人们对景观的期望不仅仅是作为生产或实用的空间,还希望它们能成为文化价值、休闲和身份的来源。农业景观具有多重功能,为人类提供了远超农业生产的有益功能和服务(Junge等人,2015年)。由于这些景观同时支持食品生产、生态调节和文化认同,它们经常在不同利益相关者群体之间引发竞争性期望。在这种情况下,理解景观偏好已成为将公共价值观融入土地利用规划、政策制定和可持续景观管理的重要基础(Nielsen等人,2012年)。
景观偏好是指个体对景观的主动识别和选择(Yin等人,2023年)。在评估这些偏好时,重要的是要认识到公众并不是一个同质的群体;相反,它由对景观保护或改善持有不同甚至冲突观点的个体组成(Grammatikopoulou等人,2012年)。承认这种多样性是必要的,因为将多个利益相关者的观点纳入政治决策不仅能够增强公众对政策结果的信任和接受度(Howley等人,2012年),还有助于更有效地管理农业区域(Raymond & Brown,2011年)。
关于景观偏好的实证研究传统上依赖于结构化问卷(Pe?a等人,2015年)、偏好访谈(van Zanten等人,2016年)以及基于自然性等环境属性评估感知吸引力的参与式方法(Crossman等人,2013年)。使用照片作为辅助工具在景观偏好研究中能够产生可靠的结果(Dramstad等人,2006年)。然而,这些传统方法通常资源密集、耗时且依赖人工解释,难以在更广泛的空间或社会背景下进行扩展(Tenerelli等人,2017年)。作为对这些限制的回应,社交媒体数据最近作为可扩展的替代方案受到了越来越多的关注。然而,此类内容通常反映了用户的聚合偏好,从而使得区分不同利益相关者群体的具体偏好变得复杂。
生成式人工智能(AI)的快速发展为解决景观偏好研究中的限制提供了新的机会。最初,生成式AI的重点是文本生成,例如大语言模型(LLMs)。这些模型已经普及,并越来越多地被认为能够在用户研究(Hamalainen等人,2023年)、注释任务(Gilardi等人,2023年)、计算社会科学(Ziems等人,2023年)和意见调查(Argyle等人,2023年)等领域取代成本较高的人类参与者。最近的研究表明,LLMs可以用于评估开放式故事生成文本的质量,其评估结果与人类专家的结果一致(Chiang和Lee,2023年)。此外,通过结合人类和AI驱动的评估机制,可以通过模拟具有特定角色的对话从不同视角和立场提供有价值的见解(Matsumoto等人,2024年)。LLMs在处理复杂的个体差异方面表现出色,并有助于在不同群体观点的模拟中促进共识的形成(Li等人,2024年)。LLMs展示了作为类人代理的潜力,但它们对人类行为的模拟准确性仍需进一步研究(Veselovsky等人,2025年)。
在景观偏好研究中,视觉和文本数据对于全面理解人类的感知和评估都至关重要。然而,传统的单一模态基于文本的模型在完全捕捉这些视觉方面存在局限性。多模态大语言模型(MLLMs)的出现,如Chat Generative Pre-Trained Transformer(GPT)-4o(OpenAI)、Kosmos-2.5(Microsoft)和Qwen3(Alibaba)(Huang等人,2023年),通过结合文本交互能力和图像理解解决了这一限制。现代MLLMs作为生成式AI的强大扩展,已经发展成为多功能助手,能够从简单的文本输入自动分析景观图像,从而降低了在景观研究中使用AI的技术障碍,使从多个利益相关者角度进行景观偏好评估变得更加可行。
最近的研究表明,像GPT-4这样的模型可以分析城市街道场景图像,根据预定义的标准识别关键景观特征并对景观进行评分(Malekzadeh等人,2025年)。此外,使用ChatGPT-4和LLaVA模型评估自然景观在与复杂性、连贯性、神秘感和整体偏好等维度上与人类判断显示出显著的相关性(Tung等人,2025年)。尽管MLMMs在景观偏好评估方面具有巨大潜力(Zhang等人,2025年),但它们在模仿人类感知方面的能力,尤其是在不同利益相关者群体之间,尚未得到充分验证。此外,随着AI辅助工具越来越多地融入景观和环境研究,研究结果也表现出日益多样性。一些研究报告AI生成的结果与人类评估高度一致,而其他研究则表明MLMMs的景观感知与人类偏好经常不一致(Huang等人,2024年;Liu等人,2025年)。这种变异性突显了系统评估AI和人类评估之间一致性的必要性,并需要制定策略来更好地解决模型输出与人类评估之间的差异。减少这种感知差异可以提高AI评估的可靠性,并支持可扩展的可持续景观管理。
当前的研究主要集中在MLMMs是否能够模拟人类行为上。然而,如何提高模型评估结果与人类认知之间的一致性仍然是一个持续研究的领域。提示工程已被证明可以有效减轻MLMMs中的某些类型的偏见(Chung等人,2024年)。尽管如此,识别能够优化评估一致性的具体提示仍然是一个关键挑战。此外,MLMMs的训练方法固有的局限性使得捕捉不同身份群体的细微差别变得困难,从而限制了它们在替代主观评估任务中的适用性。因此,虽然MLMMs在模拟不同利益相关者的景观偏好评估方面具有巨大潜力,但需要进一步的技术进步和理论发展以实现更高的一致性和更广泛的适用性。
本研究的主要目的是探讨生成式AI技术在模拟多个利益相关者视角的景观偏好评估方面的潜力和局限性。具体来说,本研究旨在回答以下问题:
  • (1)
    MLMMs在多大程度上能够反映多个利益相关者的景观偏好评估?
  • (2)
    人类和MLMMs评估之间的差异来源是什么?
  • (3)
    如何减少MLMMs和人类评估之间的差距?
  • 部分片段

    材料与方法

    通过构建来自Rednote平台和实地航拍资源的农业景观图像数据集,研究通过三个主要步骤来解决研究问题(图1)。具体来说,为了解决问题1(即图1中的步骤1),选择了两种MLLMs,GPT-4o和Qwen3作为基础模型,并为不同的利益相关者(农民、游客和专家)设计了相应的提示。

    GPT-4o与Qwen3的模型比较

    调查人群的分布相对均衡(图3a)。在性别方面,男性(46%)和女性(54%)参与者之间有轻微差异。关于年龄,参与者群体相对年轻,大多数年龄在21-40岁之间(38%),但也有一定比例的老年参与者(12%)。从地理上看,大多数参与者来自东部地区(51%),其次是中部地区(30%)。总体而言,

    人类-AI协作框架用于景观偏好评估

    最近的研究展示了MLMMs在景观偏好评估方面的可行性和潜力,但它们与人类感知的一致性仍然有限。例如,模型和人类得出的判断之间存在显著差异(Tung等人,2025年),只有2.4%的ChatGPT的回答与人类偏好相符(Liu等人,2025年)。我们的研究证实,MLMMs可以有效地识别和评估视觉景观特征,但它们仍然

    结论

    本研究探讨了MLMMs在模拟多个利益相关者群体的景观偏好评估方面的潜力和局限性。通过将模型生成的评估(GPT-4o和Qwen3)与人类参与者的评估进行比较,我们发现尽管MLMMs能够捕捉到利益相关者偏好的一般模式,但它们仍然无法完全反映不同用户群体之间的细微差别。为了弥合这一差距,我们通过

    CRediT作者贡献声明

    林静雅:写作——审阅与编辑,撰写初稿,验证,监督,项目管理,方法论,调查,资金获取,正式分析,数据管理,概念化。陈重志:写作——审阅与编辑,可视化,验证,监督,项目管理,方法论,正式分析,数据管理,概念化。冯天:写作——审阅与编辑,验证,监督,项目管理,方法论,正式

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

    致谢

    作者衷心感谢Matthias Bürgi博士在修订过程中提供的深刻评论和建设性建议,同时也感谢湖州学术工作站、湖州迪岗徐园生态旅游发展有限公司的成员、当地农民和游客提供的调查数据。本工作得到了浙江省自然科学基金[资助编号:LTGS23F020001和LTGS24D010003]和基础研究
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号