跨综合指数模型结构的内部有效性验证评估

《Risk Analysis》：An Internal Validation Assessment of Scale Across Composite Index Model Structures

【字体：大中小】 时间：2026年05月02日 来源：Risk Analysis 3.3

编辑推荐：

　　**摘要** 自然灾害的规划至关重要，因为这些事件可能导致大规模破坏并严重影响人们的生计。为了辅助灾害准备决策，组织可以利用复合指数（如社会脆弱性指数（SVI）来识别脆弱人群，确保在规划过程中考虑到那些存在内在社会不平等的人。然而，SVI的构建涉及多种方法，这些方法引入了认知不

　　**摘要**

自然灾害的规划至关重要，因为这些事件可能导致大规模破坏并严重影响人们的生计。为了辅助灾害准备决策，组织可以利用复合指数（如社会脆弱性指数（SVI）来识别脆弱人群，确保在规划过程中考虑到那些存在内在社会不平等的人。然而，SVI的构建涉及多种方法，这些方法引入了认知不确定性，可能会影响最终的决策。尽管在理解构建过程如何影响指数结果方面已经取得了一些进展，但SVI模型的空间要素尚未得到充分探索，对于尺度选择的影响也存在不同的观点。本研究通过评估标量属性（区域单位和地理边界）选择的变化以及指标选择对两个指数（疾病控制中心SVI和灾害脆弱性与韧性研究所SVI）排名的影响，来填补这一空白。我们考察了三种模型结构下的这些变化：带有z分数标准化的层次模型、带有百分位数排名标准化的层次模型以及带有z分数标准化的归纳模型，并采用了不确定性和敏感性分析方法。在改变标量和指标属性时，我们发现归纳模型的稳健性低于层次模型。我们还观察到指标选择是所有模型结构中SVI排名变化的主要驱动因素。然而，我们也发现尺度选择和交互效应对SVI排名的变化有显著但混合的影响。我们的研究结果强调了尺度选择在塑造指数结果中的作用，并强调了在创建SVI时进行批判性评估的必要性，以推进公平的灾害管理。

**1 引言**

严重的灾害事件会对人们及其生计造成广泛的破坏（Cutter 2021）。社会不平等（Blaikie等人2004；Felsenstein和Lichter 2014）以及基于地点的暴露风险（Lee和Van Zandt 2019），受到社会经济和人口因素的影响，往往会放大这些事件的影响（Cutter和Finch 2008）。这些条件通过限制社会经济和种族边缘化社区的资金准备、应对能力和从灾害中恢复的能力，增加了它们的脆弱性（Berberian等人2022；Cutter等人2003）。基于Cutter（1996）的“灾害地点”理论模型，研究人员开发了工具来量化灾难对人类造成的风险和脆弱性（详见文本S1中关于人类-灾害相互作用的讨论）。这些工具可以支持资源分配、应急响应和社区外展等主动决策，以应对社会和自然灾害（Rufat等人2015；Spielman等人2020）。值得注意的例子包括南卡罗来纳大学灾害脆弱性与韧性研究所（HVRI）的社会脆弱性指数（SoVI）（南卡罗来纳大学2016）以及疾病控制中心（CDC）和有毒物质与疾病登记署（ATSDR）的社会脆弱性指数（SVI）（CDC/ATSDR社会脆弱性指数2022）。社会脆弱性指数（SVI）工具在基础理论、指标选择、构建方法和其他特征方面存在很大差异。仅就构建方法而言，构建指数的方法可以包括层次化、演绎法、归纳法、以利益相关者为中心的方法以及其他先进的统计技术（Rufat等人2015）。一个真正有效的复合指数工具必须实用、透明、可解释，并且在内部、外部和理论上具有一致性（Spielman等人2020）。开发符合这些标准的SVI的复杂性，加上其在研究和实践中的日益广泛应用，促使了许多研究来检验指数的有效性。在有效性的各个维度中，内部有效性受到了特别关注（Jones和Andrey 2007；Reckien 2018；Schmidtlein等人2008；Tate 2012, 2013；Yoon 2012；Zhang和Huang 2013）。内部验证考察了模型的各个阶段如何影响指数的构建和结果（Tate 2012），通常通过不确定性和敏感性分析来进行评估，通常使用蒙特卡洛模拟（Aroca-Jiménez等人2022；Davidson和Lambert 2001；He等人2023；Tate 2012, 2013；Wilson等人2020）。其他方法包括相关性分析（Anderson等人2019；Jones和Andrey 2007）、回归分析（Cai等人2016；Schmidtlein等人2008）和手动构建（Wilson等人2020）。尽管在验证SVI方面取得了显著进展，但仍需要进一步的研究来提高其敏感性和准确性，以便将其作为辅助决策的工具（Anderson等人2019；Beccari 2016；Rufat等人2015, 2019）。有关通过内部验证研究指数构建阶段的详细方法和示例出版物，请参见表S1。本研究通过探讨尺度这一关键模型阶段，进一步推进了内部验证，尺度是制定空间明确脆弱性测量的重要步骤。文献揭示了尺度重要性的不一致性（He和Guan 2024；Schmidtlein等人2008；Spielman等人2020；Tarling 2017；Tate 2012），并强调了尺度对于不同概念框架和结构设计的SVI的验证和构建是一个问题（Cardwell 2022）。还发现尺度会导致对脆弱性空间模式的不同解释（Hinojos等人2023；Remo等人2016；Spielman等人2020；Tanir等人2021）。尺度包括两个要素：粒度观察水平（即区域单位）和地理边界。区域单位可能包括街区、街区组（BG）、区域、县或州，这些由美国人口普查局的数据产品定义（Bureau 2022）。地理边界描述了用于生成脆弱性测量的数据划分，例如国家、州或地方级别的评估（Stafford和Abramowitz 2017）。对于SVI的创建，没有标准的区域单位或地理边界划分。例如，CDC SVI可以在普查区域和县级别获得，地理比较可以在州和国家级别进行。SoVI则在县级别操作，比较可以在州和国家级别进行。文献中提出了各种用于SVI创建的区域单位，包括普查街区（Wood等人2010）、街区组（Hile和Cova 2015；Kaalund等人2022；Pricope等人2019）、区域（Anderson等人2019；Blackwood和Cutter 2023；Chakraborty等人2005；Johnson和Owusu 2024；Kaalund等人2022；Shao等人2020；Tate等人2021；Wang和Sebastian 2021）、县（Khajehei等人2020；Loni和Asadi 2024；Phelos等人2021；Yu等人2020），以及高分辨率区域单位如税区（Nelson等人2015），范围从国家到地方边界。鉴于文献中缺乏一致性，了解标量选择及其交互作用如何影响SVI的不确定性和敏感性对于改进其设计和有效性以捕捉社会脆弱性至关重要。之前的内部验证工作试图通过研究区域单位选择如何影响SVI结果来解决这个问题（Schmidtlein等人2008；Tate 2012）。例如，一项针对SoVI的全球敏感性分析发现，街区组（BGs）和区域（tracts）之间的选择显著影响了归纳模型的结果，但对演绎模型或层次模型没有显著影响（Tate 2012）。而使用归纳模型的局部敏感性分析发现，区域单位选择（县与中间尺度与区域）并没有显著改变社会脆弱性的格局（Schmidtlein等人2008）。这些矛盾的发现表明，区域单位选择对SVI结果的影响仍然不清楚，特别是对于归纳模型。此外，由于在验证研究中重点关注SoVI，也有必要探索其他常用的SVI（如CDC SVI）在不同模型结构中对不同区域单位选择的响应。本研究旨在澄清区域单位选择如何影响SVI结果，并解决各种模型结构中的不一致性。地理边界选择是SVI设计中的另一个关键阶段，其影响在不同研究中也表现出变异性。虽然地理边界通常设置在国家或州级别，但局部敏感性研究表明，基于边界选择的结果有所不同。例如，一项基于旧金山的 studies 使用CDC SVI层次模型在区域级别进行的研究得出结论，地理边界选择（国家、州和地方级别）对结果没有显著影响（Tarling 2017）。然而，作者警告说，这一发现可能仅适用于具有大量空间单位的地区，从而限制了其普遍性。相比之下，弗吉尼亚州汉普顿的一项研究发现，基于主成分分析（PCA）的归纳模型对边界划分敏感（Stafford和Abramowitz 2017）。同样，Spielman等人（2020）强调了SoVI归纳模型在加利福尼亚州各县使用不同边界时的内部一致性缺失，例如FEMA区域和整个美国。当前的文献尚未确定这些发现是否适用于具有不同理论基础和结构设计的SVI。有限的内部验证研究探讨了区域单位和地理边界选择如何影响具有不同认知框架和结构设计的指数的结果。本研究迫切需要比较现有的脆弱性指数，从而超越以往的文献（Sheehan等人2023）。通过不确定性和全球敏感性分析，我们研究了标量属性和指标集的选择及其整体交互作用如何影响各种SVI模型结构的模型稳健性和变异性。具体来说，我们探讨了（1）SVI构建中的空间建模决策如何影响不同结构设计下的指数结果的稳健性？以及（2）哪些空间属性及其交互作用对SVI结果的变异性贡献最大？

**2 方法和数据集**

**2.1 研究地点**

我们的研究区域是南卡罗来纳州的查尔斯顿（SC），这是一个具有复杂历史背景的城市沿海地区，是大西洋沿岸的中心经济枢纽（Adams 2004）（图1）。这个人口密集的地区拥有超过813,000人，其中包括查尔斯顿市内的151,612名居民（Charleston Regional Development Alliance 2022）。作为参考，查尔斯顿大都会统计区在2020年至2021年的人口增长率高于南卡罗来纳州和整个美国（Charleston Regional Development Alliance 2022）。预测表明，查尔斯顿的人口预计在未来50年内将翻一番（Byrd 2021），并且到2024年将超过之前的2040年人口估计（BCDCOG 2012）。图1显示了美国南卡罗来纳州查尔斯顿的研究地点。除了人口增长外，查尔斯顿还面临着多种自然灾害，被认为是该州最危险的县（CRHMP 2020）。自2023年以来，查尔斯顿县因沿海和突发洪水、热带风暴、风暴潮和暴雨而经历了近59次灾害事件，导致超过237,000美元的财产损失（NOAA 2025）。该市最紧迫的灾害包括飓风、地表洪水、河流洪水或沿海洪水的复合洪水以及海平面上升（SLR）（Charleston SC 2024；CRHMP 2020）。值得注意的是，SLR是查尔斯顿社区利益相关者认为的三大主要灾害之一（CRHMP 2020）。在过去20年中，查尔斯顿经历了0.5英尺的海平面上升，而在上个世纪，该地区总共经历了1.07英尺的海平面上升（Charleston SC 2024），这表明海平面上升速度很快。如果不采取任何减排措施，美国在未来一个世纪内可能会经历3到7英尺的海平面上升（Sweet等人2022）。即使是中等的海平面上升预测也表明，如果没有战略性的适应措施，大部分海岸地区可能会被淹没。考虑到社会和历史动态（Rosen 2021），以及查尔斯顿灾害暴露风险的增加，评估整个城市的社会脆弱性至关重要。上半岛的许多地区，特别是在阿什利河沿岸和库珀河附近的东侧社区，存在显著的社会脆弱性（Taylor等人2022）。这些社区贫困水平较高，低收入人群较多，历史上处于边缘地位，并面临许多环境负担（Taylor等人2022）。脆弱性的增加和历史上处于不利地位的社区的存在突显了进行全面脆弱性量化的必要性。

**2.2 研究设计**

为了回答我们的研究问题，我们首先选择了两组指标、两种类型的区域单位和三种地理边界，以评估三种结构设计下的SVI排名（图2）。我们研究的三种模型结构和标准化类型包括：（1）基于CDC SVI的带有百分位数排名标准化的层次设计，（2）基于SoVI的带有z分数标准化的PCA归纳方法，以及（3）受爱尔兰环境灾害社会脆弱性指数（ISVEHI）启发的带有z分数标准化的层次设计（Fitton等人2021）。我们选择了两组基于CDC SVI（n = 16）和SoVI（n = 28）的指标。这些模型是使用人口普查的区块（BG）和区域单元（tract）进行应用的，地理边界在佛罗里达州（SC）的州级层面进行了检查，参考了美国地质调查局（USGS）对佛罗里达州东部地区的地貌海岸划分（USGS 2023），以及查尔斯顿市（Charleston, SC）的城市边界。每次分析都保持了相同的边界划分，即查尔斯顿市，但根据所选的边界不同，输入数据也有所变化。然后，我们使用不确定性和全局敏感性分析来评估每个社会脆弱性指数（SVI）模型配置的影响，以了解标量、指标和结构决策对SVI结果的影响，具体内容将在以下章节中详细说明。图2在图形查看器中打开（PowerPoint）。

方法论框架。PCA指的是主成分分析（principal component analysis），PC等同于主成分（principal component），ACS是美国人口普查局的美国社区调查（American Community Survey），表示中位数（median），是变异系数（coefficient of variation），RQ表示研究问题（research question）。*有关SVI指标集，请参见表S2和S3；有关SoVI指标集的排除指标，请参见表S3。

2.3 数据集

为了生成SVI，我们从美国人口普查局（2021年）的5年美国社区调查（ACS）估计数据中获取了空间指标。这些指标是使用R包tidycensus（Walker和Herman 2022）在人口普查区块（BG）和区域（tract）级别获取的。所选的指标是CDC SVI和SoVI最新版本的独特指标。为了直接跨尺度比较，我们平均了每个区域内的区块级指数得分，从而得到了区块级数据的表示，然后将其与最初在区域级别生成的得分进行了比较。这种方法确保了数据来源的一致性和时间对齐性，以支持地方政策和决策制定（Englund等人2023）。详细的领域、指标和代码标识符在表S2和S3中提供。我们使用RStudio版本4.3.2（Posit Team 2023）进行了所有SVI计算。地理边界是根据州级、海岸级和城市级的地图数据定义的，用于分组区块和区域（Bureau 2022）。州边界由美国人口普查局（United States Census Bureau 2018）定义，海岸边界由USGS对大西洋平原的地貌划分定义（Fenneman和Johnson 1946；USGS 2023），查尔斯顿市的边界则根据查尔斯顿市开放数据门户发布的细分信息定义（City of Charleston 2024）。对于城市边界，我们通过将区块与区域叠加来进行直接跨尺度比较。我们选择这些地理边界来代表全州视角、海岸危险区域和局部城市级别。所有地理映射都是在ArcGIS Pro版本2.7.0（ESRI Inc. 2020）中完成的。有关每个地理边界上的人口普查区域单元数量和缺失人口的详细信息，请参见表S4。

2.4 社会脆弱性指数模型

本研究的一个关键考虑因素是在测试区域单元、地理边界和脆弱性指标集变化的同时，选择适当的SVI模型结构来生成社会脆弱性得分。我们考虑了三种模型结构：一种基于z分数标准化的归纳结构（模仿SoVI），一种基于百分位数排序标准化的层次结构（基于CDC SVI），以及一种基于z分数标准化的层次结构（遵循ISVEHI）。选择这些模型结构是因为它们在研究、政策和实际应用中得到了广泛的应用。有关每个指数的核心特征和背景信息的详细概述，请参阅文本S3和表S5。

2.5 跨模型结构构建社会脆弱性指数

这三种模型结构在将指标汇总为SVI的方法上有所不同（工作流程见图S1，代码库见文本S2）。在所有模型结构中，我们在创建SVI时对指标进行了几步预处理（见文本S4）。预处理之后，我们通过百分位数排序标准化或z分数标准化来对指标进行归一化。对于层次模型，我们将解释脆弱性的指标分为具有相似维度的几个领域。然后，我们跨领域汇总这些指标，使用SVI组合得出每个普查单元的SVI得分。相比之下，归纳结构的后续步骤包括进行PCA，并使用varimax旋转和Kaiser准则选择来生成一组不相关的潜在因素（Remo等人2016）。我们将得到的主成分因子汇总起来，为每个统计单元生成社会脆弱性得分。最终，我们自动化了每种模型结构、指标集和空间尺度的指数得分计算，得到了36个独特的SVI输出。所有得分都存储在Excel中，用于在RStudio版本4.3.2（Posit Team 2023）中进行不确定性和敏感性分析。

2.6 内部验证研究设计概述

在建立了SVI的构建框架之后，我们进行了内部验证评估，使用了不确定性和基于方差的全球敏感性分析（图2）。根据Tate（2012）的方法，我们的内部验证框架包括四个阶段：（1）确定每个模型阶段的输入分布（区域单元、地理边界和指标集选择），（2）进行蒙特卡洛模拟（Monte Carlo Simulation），（3）进行不确定性分析，（4）进行基于方差的全球敏感性分析。

2.7 样本分布、蒙特卡洛模拟和不确定性分析

通过不确定性分析，我们旨在了解标量和基于指标的模型阶段如何影响SVI模型的稳健性，特别是其在脆弱性排名方面的准确性和精确性。我们首先定义了模型阶段的样本分布，每个阶段都使用相同的离散概率分布。例如，在选择区域单元模型阶段时，选择区块（BG）或区域（tract）区域单元的概率是相等的（0.5）（表1）。表1. SVI模型阶段的不确定性及全球敏感性分析参数。

在生成SVI排名之后，我们定义了一个基线指数，作为“衡量标准”来评估不同的SVI配置与现状的比较。我们使用公式（2）计算每次模拟相对于基线指数的平均偏差指标，将SVI排名与基线指数进行比较（Tate 2012）。

在产生SVI排名后，我们定义了一个基线指数，作为评估不同SVI配置与现状相比的“衡量标准”。我们使用公式（2）计算每次模拟相对于基线指数的平均偏差指标，比较SVI排名与基线指数（Tate 2012）。

2.8 全局敏感性分析

在不确定性分析之后，我们进行了全局敏感性分析，以了解SVI模型中的变化（即不确定性）是如何归因于各个标量和基于指标的模型阶段及其整体交互作用的（Saltelli等人2010）。我们选择了全局敏感性分析，因为这种方法不仅能够分解输出方差来自各个单独模型阶段的影响，还能分解它们在输入模型阶段内的相互作用（Saisana和Saltelli 2008），通常通过蒙特卡洛模拟来实现（Tate 2012；Wilson等人2020）。虽然局部敏感性分析通常使用相关性或简单方差分析（ANOVA），保持所有组件稳定并一次改变一个因素，但它们没有考虑到复合指数内模型阶段之间的相互作用，而这些相互作用可能是相当大的（Tate 2012）。我们利用不确定性分布，评估从蒙特卡洛模拟生成的相对于基线排名的平均偏差，来进行敏感性分析。具体来说，我们应用了Sobol的敏感性分析来量化每个模型阶段、区域单元、地理边界和指标集的贡献，以及它们对SVI总输出方差的综合交互效应。这些发现提供了基于模型构建选择的SVI排名敏感性的见解，超出了单独检查各个阶段的范畴。计算了两个Sobol指数的蒙特卡洛估计值，范围在[0,1]之间：一阶敏感性指数（）衡量改变单个模型阶段对输出方差的贡献，总阶敏感性指数（）捕捉单个模型阶段及其与其他模型阶段的交互效应（He等人2024）。一阶指数和总阶指数之间的差异反映了所研究模型阶段之间的交互潜力。Sobol指数是使用Saltelli等人2010（方程3）和Jansen 1999（方程4）（Jansen 1999；Saltelli等人2010）的方法估计的。

方程（3）和（4）强调了两个抽样矩阵，其中n是样本大小，m是输入模型阶段的数量。每个抽样因子被描述为，其中i是行的索引，j是列的索引。矩阵M是一个混合矩阵，其中第j列来自矩阵M1，而其他列来自矩阵M2。最后，S表示模型M的总输出方差（Saltelli等人2010）。注意，敏感性分析是在RStudio 4.3.2（Posit Team 2023）中进行的。有关Sobol指数公式的更多细节，请参见表S7；有关因子方差分析的更多信息，请参见文本S5、图S10以及表S9–S11。为了确定哪些模型阶段具有高度影响力，一个通用指南是由Saisana等人（2005，Saisana等人2005；Tate 2012）建议并遵循的，即将Sobol指数与输入模型阶段数量的倒数进行比较。在这种情况下，如果有三个模型阶段，一阶指数值大于0.33则表明对该模型输出有相对较大的影响。然而，即使一阶指数较低，模型阶段仍可能通过交互作用显著增加不确定性。为了评估这一点，可以检查总阶指数，该指数同时捕捉主要效应和交互效应。接近0的值表明模型阶段没有影响力，而较高的值则表明其通过与其他阶段的交互作用而重要（Tate 2012）。

3 结果

3.1 SVI构建中的空间建模决策如何影响不同结构设计下指数结果的稳健性？通过不确定性分析，我们发现模型结构的选择显著影响了从基线排名开始SVI排名的整体稳健性。在改变模型阶段时，归纳结构产生的指数结构远不如层次模型准确和精确（图3）。例如，对于SoVI基线，归纳结构在49个普查区域内偏离基线脆弱性排名10.41个位置，方差为12.34个位置。相比之下，层次模型显示出相当高的准确性和精确性结果，其中基于百分位排名的层次模型在基线选择方面表现出最大的稳健性。

不确定性分析比较了CDC SVI和SoVI基线在不同模型结构、地理边界、区域单元选择下的平均偏离基线排名的描述性统计量与模拟频率。结果被分为三个不同的层次：上层三分之一（红色三角形 = 低 = L）、中层三分之一（黄色矩形 = 中等 = M）和下层三分之一（绿色三角形 = 高 = H）。对于稳健性结果，“A” = 准确性，“P” = 精确性。详见图S2–S7中的频率与平均偏离分布。

3.2 哪些空间属性及其交互作用对SVI结果的变异性贡献最大？使用Sobol指数进行的全球敏感性分析揭示了区域单元、地理边界和指标集的选择及其交互作用如何影响SVI结果的变异性。我们分析了一阶和总阶指数，发现指标集的选择在所有模型结构和基线中具有最显著的影响大小（图5）。相比之下，标量模型阶段的影响相对较低且混合，其对指数变异性的影响取决于模型结构、用于比较的基线和标准化模式。

4 讨论

4.1 SVI模型结构的稳健性

在检查不确定性分析结果后，我们发现归纳模型在改变标量和基于指标的模型阶段时，其结构不如层次模型稳健（即准确和精确）。这一结果与Tate（2012）的发现不一致，Tate认为层次模型最准确，归纳模型最精确。这种差异可能是由于研究设计的不同，因为Tate（2012）研究了替代模型阶段，如测量误差、转换、使用PCA的归纳模型的因子保留、指标加权以及使用的指标的微小调整。另一方面，我们的研究在CDC SVI和SoVI的最新版本之间对指标集进行了更广泛的更改，并关注了SVI发展的标量属性。模型阶段的差异阻碍了结果的全面比较。此外，文献表明SoVI构建具有灵活性，这基于其广泛的应用（Hile和Cova 2015）以及对空间尺度的不敏感性和对指标的微小调整（Schmidtlein等人2008）。我们的研究表明，SoVI框架缺乏稳健性且敏感性较高，这表明在SoVI构建中需要更加谨慎。

4.2 规模选择与SVI精度

我们的研究强调了在SVI构建中选择适当规模的重要性。随着区域单元和边界选择的精细化，我们发现所有模型结构中的SVI排名精度都有所提高。这一趋势突显了捕捉社会脆弱性的局部变异性的重要性，特别是在那些社会经济弱势群体居住的地区以及容易受到自然灾害影响的地区。然而，就准确性而言，基于基线选择的标量属性在模型结构中没有明确趋势。这引发了这样一个问题：选择基线——即内部验证评估中所谓的“预期”参考点——如何反映当前文献中的准确不确定性和敏感性估计？此外，我们发现随着社会脆弱性的增加，变异性会减少。这一结果进一步证实了Wilson等人（2020）的发现，他们发现了与Tate（2013）相反的结果，即SVI排名随着社会脆弱性的增加而增加。正如Wilson等人所强调的，这些结果可能基于考虑的模型阶段而呈现不同的趋势。然而，我们的研究呈现了更相似的区域规模（即49个普查单元与Tate [2013] 中使用的83个单元）、统计方法以及与Tate研究相似的CoV值范围，这些因素可能影响了观察到的趋势。

4.3 SVI对标量属性的敏感性

先前的内部验证研究发现，基于标量的模型阶段作为SVI创建中的有影响力参数存在差异。在我们的研究中，我们发现，在归纳模型中，地理边界选择及其交互作用是引入SVI结果变异性的最具影响力的标量模型阶段。区域单元选择基于其在一阶敏感性指数方面的影响几乎可以忽略不计；然而，其交互效应明显高于层次模型中观察到的效应。虽然这两个标量阶段的一阶效应均为0%，但它们的总阶指数分别达到了7%（区域单元）和12%（地理边界），表明它们的主要贡献是通过与其他标量和指标模型阶段的交互作用。这些发现也强调了在不确定性和敏感性分析中进行基线选择的重要性，以进行内部验证评估。然而，在改变层次模型的标准化类型时，我们发现基于百分位排名的层次模型在指标模型阶段表现出较低但相对较高的一阶指数效应，解释了85%（SoVI基线）到77%（CDC SVI基线）的输出方差。对于这种模型结构，在几乎所有情况下，标量属性作为主要效应和交互效应引入的变异性都大于使用z分数标准化的层次模型。对于归纳模型结构，我们发现对指标集选择的敏感性适中，解释了54%（SoVI基线）到65%（CDC SVI基线）的输出方差，低于任一层次模型。然而，归纳模型在所有基线中都表现出最强的标量组件之间的交互效应。在标量模型阶段中，地理边界选择的影响比区域单元选择更为显著，作为一阶效应贡献了高达11%，在考虑交互效应时高达33%（在SoVI基线下）。详见表S8中的数值一阶和总阶Sobol敏感性指数值。

4.2 规模选择与SVI精度

我们的研究强调了在SVI构建中选择适当规模的重要性。随着区域单元和边界选择的精细化，我们发现所有模型结构中的SVI排名精度都有所提高。这一趋势突显了捕捉社会脆弱性的局部变异性的重要性，特别是在那些社会经济弱势群体居住的地区以及容易受到自然灾害影响的地区。然而，就准确性而言，基于基线选择的标量属性在模型结构中没有明确趋势。这引发了这样一个问题：选择基线——即内部验证评估中所谓的“预期”的参考点——如何反映当前文献中的准确不确定性和敏感性估计？此外，我们发现随着社会脆弱性的增加，变异性会减少。这一结果进一步证实了Wilson等人（2020）的发现，他们发现了与Tate（2013）相反的结果，即SVI排名随着社会脆弱性的增加而增加。正如Wilson等人所强调的，这些结果可能基于考虑的模型阶段而呈现不同的趋势。然而，我们的研究呈现了更相似的区域规模（即49个普查单元与Tate [2013] 中使用的83个单元）、统计方法以及与Tate研究相似的CoV值范围，这些因素可能是影响观察到的趋势的潜在因素。

4.3 SVI对标量属性的敏感性

先前的内部验证研究发现，基于标量的模型阶段作为SVI创建中的有影响力参数存在差异。在我们的研究中，我们发现，在归纳模型中，地理边界选择及其交互作用是引入SVI结果变异性的最具影响力的标量模型阶段。区域单元选择基于其在一阶敏感性指数方面的影响几乎可以忽略不计；然而，其交互效应明显高于层次模型中观察到的效应。虽然这一发现并不直接反驳Tate（2012）关于区域单元选择对归纳模型显著影响的观察，但它揭示了SVI内部验证文献中较少探索的标量模型阶段：地理边界选择（Nelson 2025；Tate 2012）。这些结果加强了Spielman等人（2020）和Stafford和Abramowitz（2017）的早期观察，他们指出，如SoVI这样的归纳模型对比较区域单元所使用的地理边界的定义很敏感（Spielman等人2020；Stafford和Abramowitz 2017）。我们的发现还表明，使用百分位排名的层次模型在评估为孤立的标量模型阶段时，对区域单元选择的敏感性相当，甚至略高。相比之下，使用z分数标准化的层次模型对任一标量属性的敏感性都很低。对于这两种层次模型，结果的方差主要由标量属性之间的交互效应驱动，其中一些效应因基线而异。这些结果与Tarling（2017）的观点相反，Tarling认为CDC SVI的层次模型可以有效地适应不同的地理边界，为具有大量普查单元的地区产生相似的结果。然而，Tarling（2017）的分析依赖于使用皮尔逊相关性的局部敏感性方法，该方法没有考虑模型阶段之间的交互效应。尽管我们的分析中使用的汇总人口统计单位数量显著减少，但我们发现Tarling（2017）的结论并非普遍适用，具有层次结构的统计脆弱性指数（SVIs）的边界选择应当谨慎进行。我们的研究结果表明，地理边界选择本身可能并不具有决定性影响；然而，这一模型阶段在其他模型组件（如指标选择和区域单位选择）的相互作用下可能会产生重要影响，而这些组件更显著地驱动SVI结果的变化。Tarling的局部敏感性方法并未捕捉到这些交互效应，这进一步凸显了在评估不同SVI设计中地理边界选择和其他模型阶段的作用时，需要采用更全面的全球敏感性方法。总体而言，我们的研究展示了具有不同理论基础和结构设计的SVIs对不同区域单位和地理边界的敏感性，进一步证实了Spielman等人（2020）的研究结果。我们的结果还表明，标量模型阶段本身可能不像指标选择那样具有决定性影响，但它们与其他模型阶段的交互作用可能会影响SVI的结果，尤其是取决于用于生成脆弱性得分的模型结构。对于使用SVIs的研究人员或实践者来说，理解这些因素之间的微妙关系至关重要。

4.4 SVI对指标选择的敏感性

我们的敏感性分析还表明，不同模型结构中指标选择对模型结果的影响最大。这一结果在意料之中，因为文献（Bucherie等人2022；Clark等人1974；Spielman等人2020；Tarling 2017）已经指出，指标的选择可能是主观的，并且基于创建者的判断进行分类，这可能导致即使在相同风险类型下也会产生不同的结果（Bucherie等人2022）。归纳模型和层次模型的结构对指标选择及其标量组分的交互作用表现出更高的敏感性。这一结果强调了指标选择在决定SVI的变异性和敏感性方面所起的关键作用。未来的研究可以通过探索不同景观和额外标量属性中指标和尺度（区域单位和地理边界）的联合作用来进一步发展。

4.5 规范化方法

两种层次模型之间的主要区别在于所采用的规范化类型：一种使用z分数标准化，另一种采用百分位数排名规范化。对于规范化选择作为SVI开发中的一个阶段的重要性，存在不同的观点。一些研究者（如Tate 2012）认为规范化是一个不重要的阶段，而其他研究者（如Talukder等人2017）则强调其在开发综合指标中的关键作用。本研究的结果表明，规范化方法是一个需要考虑的重要模型阶段。具体来说，在本研究中，所采用的规范化类型影响了SVI排名中的变异性。

4.6 在社会脆弱性指数开发和使用中的尺度相关考虑

与其他综合脆弱性和风险指数一样，SVI也受到不确定性和不精确性的影响（He等人2023）。尽管这些模型基于广泛的研究和可信的理论框架，但它们仍然容易受到数据和方法论限制的影响。本研究并非要否定SVI的使用，而是为了阐明与尺度相关的决策（特别是区域单位分辨率，这在文献中已被广泛研究）和地理边界范围（Nelson 2025）如何导致SVI结果的显著差异。总体而言，本研究旨在为使用SVI进行规划、资金分配和相关决策的实践者、政策制定者和研究人员提供信息，说明尺度选择可能对社会脆弱性的量化构成根本性挑战。尺度选择并非一个中立的决策，不应被视为技术上的事后考虑。我们的内部验证分析结果表明，区域单位分辨率和地理范围可以根据构建方法（即模型结构）及其与其他模型组分的相互作用，在不同程度上影响SVI结果的不确定性。我们敦促SVI用户以及类似构建的综合指数用户不仅要了解其分析区域内指标数据的质量和局限性，还要批判性地考虑尺度决策如何影响对脆弱性的解读。更精细的空间分辨率和更局部的地理边界在需要提高精度的局部尺度上可能具有优势；然而，更精细的尺度并不总是更优的，更大的尺度由于数据聚合而引入了自己的解释限制。因此，尺度选择应基于指数的预期应用以及对其如何影响SVI估计有效性的清晰理解来进行。

4.7 局限性和未来工作

这种方法存在一些局限性，这些局限性指出了未来在SVI内部验证方面改进的机会。主要限制在于指数构建方面。首先，我们没有解决不同指标集之间指标的多共线性问题。我们选择保留所有指标，以保持与SoVI（南卡罗来纳大学2016）和CDC SVI（CDC/ATSDR社会脆弱性指数2022）中使用的方法一致。然而，为了透明度，我们使用方差膨胀因子（VIF）和皮尔逊相关矩阵（见表S12和S13，图S11和S22）对每个指标集进行了多共线性分析。唯一显著的多共线性存在于SoVI指标的普查区域层面，而在城市地理边界层面则不存在（见表S12和图S13）。除此之外，我们在研究区域内使用的普查指标之间的多共线性总体上很小。未来的研究可以解决这一多共线性问题。其次，遵循SoVI的方法，我们没有因数据缺失而删除任何普查指标；只删除了人口为零的普查单位。缺失的数据被替换为研究区域内指标的平均值。然而，根据CDC SVI的方法，普查单位中的缺失数据并未计入最终的SVI计算。未来的研究可以探讨数据缺失以及通过各种技术替代指标数据如何影响空间模式、不确定性及敏感性结果。第三，本研究关注的是BGs和普查区域单位，使用了来自普查ACS的一致数据集以确保有足够的单位进行PCA分析。未来的工作可以扩展分析，包括其他不同聚合级别的空间单位，如街区或县，以提高适用性。最后，本研究调查了这些SVI模型阶段变化在查尔斯顿市的影响。研究者发现，不同人口统计特征的位置对SVI的不确定性和敏感性影响不大，主要取决于所使用的构建方法（Tate 2012）。将这项研究扩展到其他地理区域，包括更多的统计单位，将推动相关文献的发展，因为这里的研究已经包括了其他标量组件和更多的指标变化。

5 结论

我们的研究为构建SVI的方法论挑战提供了有价值的见解。我们的关键发现强调了SVI模型结构在指数开发各个阶段的稳健性和敏感性，包括标量属性和指标选择，无论是归纳模型还是层次模型。我们的结果包括对不同区域单位、地理边界以及研究和实践中常用的社会脆弱性指标的SVI排名的深入不确定性和敏感性分析。结果表明，与归纳模型相比，层次模型对基于标量和指标的模型阶段变化的稳健性更高。然而，两种结构都对指标选择表现出更高的敏感性。此外，每种模型对标量属性及其与指标的相互作用也表现出不同的敏感性。这些结果强调了在SVI构建中仔细考虑这些因素的重要性，以及在SVI模型中实施数据和使用汇总指数以促进灾害管理中的公平决策的重要性。最终，SVI的构建决定了谁被视为脆弱群体以及原因，这强调了需要谨慎行事，因为方法选择可能会无意中排除某些社区获得必要的支持和投资。

致谢

作者感谢国家科学基金会（Grant #2244715）对Selena Hinojos的部分资助，以及乔治华盛顿大学对这项工作的支持。本材料中表达的任何观点、发现、结论或建议不一定反映资助机构的观点。作者还要衷心感谢Kathryn Roscoe博士对本研究的宝贵评审。在准备这项工作时，作者使用了Grammarly公司（n.d.）提供的服务来提高文本的正确性。使用该工具/服务后，作者根据需要审查和编辑了内容，并对出版物的内容负全责。

利益冲突

作者声明没有利益冲突。

数据可用性声明

本研究中使用的所有社会脆弱性指数数据以及重现分析所需的代码均可在HydroShare上公开获取：Hinojos, S. A., C. Grady. 2025. “An Internal Validation Assessment of Scale Across Social Vulnerability Index Model Structures (Uncertainty and Global Sensitivity Analysis)”，HydroShare, https://doi.org/10.4211/hs.719a8d719907435dade9102aa9a0fa8d。

热点排行