极端风险决策建模:一种新方法及其在基于PM2.5的空气污染问题中的应用

《Computational Statistics & Data Analysis》:Extreme risk decision modeling: a new approach with an application to air pollution based on PM2.5

【字体: 时间:2026年05月10日 来源:Computational Statistics & Data Analysis 1.6

编辑推荐:

  伊琳·布里托|玛尔塔·费雷拉 米尼奥大学数学系数学中心,吉马良斯4800-058,葡萄牙 **摘要** 极端风险是指发生概率极低的事件或情景,但它们可能带来灾难性后果。这些风险通常超出了正常的预期范围,并且根据具体情况,可能导致财务或经济损失、人员伤亡或环境破坏。本

  伊琳·布里托|玛尔塔·费雷拉
米尼奥大学数学系数学中心,吉马良斯4800-058,葡萄牙

**摘要**
极端风险是指发生概率极低的事件或情景,但它们可能带来灾难性后果。这些风险通常超出了正常的预期范围,并且根据具体情况,可能导致财务或经济损失、人员伤亡或环境破坏。本文的主要目的是开发能够考虑极端值存在的极端风险决策模型。针对广义帕累托分布,定义了基于均值和标准差以及均值和风险价值的双组分风险模型,并研究了这些模型参数的相关性质。此外还表明,这些新风险模型可以表示为多标准决策方法——加法比率评估方法。通过分析欧洲某城市的细颗粒物(PM2.5)浓度,将这些风险模型应用于空气污染风险评估,以识别一年中风险最高的月份和时期。

**1. 引言**
风险度量和风险模型主要是在经济、金融或精算领域开发和应用的,用于支持风险管理决策。其中一些模型建立在冯·诺依曼和摩根斯坦(von Neumann and Morgenstern,1944)提出的期望效用理论的基础上。根据这一理论,面对不确定的结果时,个体寻求最大化其期望效用而非期望货币价值。由于期望效用理论往往与实证发现不符(如卡尼曼和特沃斯基(Kahneman and Tversky,1979)所指出的),因此对该模型提出了扩展和替代方案。一些泛化模型将期望效用与其他风险度量结合使用(参见例如Geissel等人(2022年)、Brito(2020年)、Brito(2022年)的研究),例如方差或熵。这些属于简单的风险度量(参见Brachinger和Weber(1997年)),可以单独或组合应用于风险决策问题(也参见Jia和Dyer(2009年))。均值和方差是最常用的度量方法(参见例如Markowitz(2000年)、Pollatsek和Tversky(1970年))。包含额外度量的扩展风险模型示例包括:均值-方差-偏度模型(Li等人,2010年)、均值-方差-偏度-熵模型(Usta和Kantar,2011年)以及均值-方差-偏度-峰度-熵模型(Aksarayli和Pala,2018年)。在金融或精算领域广泛使用的其他流行风险度量还包括损失概率或风险价值(Kaas等人,2008年;Klugman等人,2019年),它表示在一定概率下不会被超过的最大值。

在环境风险评估中,特别是在空气污染方面,文献中开发和技术主要采用概率方法,侧重于分析污染物平均浓度、超过监管限值的频率以及空气质量指数。这些方法的主要缺点是无法考虑特定的风险特征,如不确定性和极端值的存在。

本工作的目标是开发使用两个组分评估风险的风险模型:结合均值和标准差的均值-标准差风险模型(Mean-SD Risk Model),以及结合均值和风险价值的均值-风险价值风险模型(Mean-VaR Risk Model),并通过一个权衡因子进行整合。此外,这些模型明确考虑了极端值的独特特性,因为它们是在极端值理论框架内使用广义帕累托(Generalized Pareto,GP)分布构建的。GP分布主要用于处理罕见和极端事件的领域,在这些领域中理解分布的尾部至关重要(Balkema和Haan(1974年)、Pickands(1975年)、Davison和Smith(1990年)、Beirlant等人(2004年)。从环境研究与风险管理到金融和保险,GP为极端结果的可能性提供了宝贵的洞察,帮助组织有效规划和减轻风险(Castillo和Serra(2015年)、Lomba和Alves(2020年)、Moreira和Ferreira(2025年)。为了严格表征极端值的概率和严重性(即超过高阈值的观测值),人们通常会转向极端值理论。该领域的一个核心结果是Pickands-Balkema-de Haan定理(Balkema和Haan(1974年)、Pickands(1975年),它指出对于足够高的阈值(μ),超过值的条件分布趋近于GP分布。GP分布由一个尺度参数(σ?>?0)和一个形状参数(γ∈R)参数化,后者也称为极端值指数或尾部指数。这种灵活性使其非常适合“超过阈值的峰值”方法:选择一个高阈值(μ),用最大似然法拟合GP分布,然后利用拟合模型来推断更极端事件的概率和幅度。

关于双组分风险模型,将展示它们可以表示为多标准决策(MCDM)方法(Sahoo和Goswami,2023年):加法比率评估(ARAS)方法(Zavadskas和Turskis,2010年;参见也Liu和Xu,2021年)。在ARAS方法中,首先对每个标准进行归一化并赋予权重,然后汇总它们以计算一个效用分数,该分数表明每个选项与理想解决方案的接近程度。然后可以根据效用分数对选项进行排名。为了将风险模型重新表述为ARAS方法,将采用ARAS方法的归一化技术来定义此处提出的标准化风险模型。

这些新风险模型适用于涉及极端事件的多种场景。本研究重点关注它们在基于细颗粒物(PM2.5)浓度的空气污染风险评估中的应用。

空气污染是最大的环境健康风险之一。大量研究表明,暴露于空气污染会对健康产生负面影响,导致呼吸系统问题、心血管疾病和预期寿命缩短(参见例如Orellano等人(2020年))。细颗粒物(PM2.5)被认为是全球最具危害性的空气污染物。PM2.5是指直径为2.5μm或更小的颗粒物。这些颗粒物主要来源于家庭取暖用固体燃料的燃烧、工业活动和道路交通。尽管欧盟(EU)的排放量持续减少且整体空气质量有所改善,但大多数欧盟城市人口仍暴露在有害健康的污染物水平下,96%的城市人口暴露在超过世界卫生组织(WHO)2021年年度指导值5μg/m3的不安全PM2.5浓度中(参见EEA(2024年))。关于与PM2.5平均暴露指数相关的EU标准(参见EEA(2024年),该指数评估城市地区普通人口的长期暴露情况,所有欧盟成员国在2022年仍满足2015年环境空气质量指令设定的20μg/m3的暴露浓度要求。

文献中有关PM2.5定量空气污染风险评估的示例文章包括:Liu等人(2023年)分析了北京冬季的PM2.5水平,以基于平均浓度预测和评估空气污染风险;Lin等人(2022年)提出了一个空气质量框架,利用PM2.5超值概率的风险敏感性来确定台湾的空气质量区域;Martins等人(2017年)对大气污染物数据进行了极端值分析,包括将GP分布应用于PM2.5等空气质量指标的升高浓度;Ferreira等人(2012年)和Leiva等人(2016年)也考虑了将极端值模型应用于污染数据——特别是高臭氧浓度水平的建模。

在PM2.5空气污染分析的背景下,本工作的新颖之处在于它采用了一种结合风险度量的定量风险评估方法,同时将极端值理论整合到风险建模框架中。

本文的结构如下:第2节定义了风险度量及相关风险模型,并研究了它们的性质,其中2.1小节专门讨论均值-标准差风险模型和均值-风险价值风险模型,2.2小节介绍了这些模型的性质。第3节介绍了基于广义帕累托分布的极端值理论方法,以建立极端风险度量和相应的极端风险模型:广义帕累托均值-标准差风险模型和广义帕累托均值-风险价值风险模型,并基于其参数分析了这些模型的性质。第4节展示了新风险模型可以表示为多标准决策方法——加法比率评估(ARAS)方法。第5节展示了将这些极端风险模型应用于欧洲某城市的PM2.5空气污染风险评估,目的是根据空气污染风险对一年中的月份和时期进行分类。第6节提出了结论。

**2. 风险模型**
Pollatsek和Tversky(1970年)提出了以下风险模型:给定一组实值随机变量S,将其解释为具有(任意数量)货币结果的赌博,对于X?∈?S,其期望值为E[X],方差为var[X],其风险R(X)由以下公式给出:
(1) R(X) = θvar[X] ? (1?θ)E[X]
其中θ是一个实数,满足0?
通常,在不同背景下进行风险评估时,例如在环境领域,会计算风险指数或风险因素,主要是作为发生概率和后果的乘积,代表预期值。然而,正如Aven(2016年)在分析多项研究后指出的,基于风险作为预期值的一般概念进行的风险评估可能会误导决策者,因此还需要考虑不确定性。

受均值-方差模型的启发,我们将基于以下假设开发两个风险模型,并在此背景下呈现所有后续结果。

**假设1**
随机变量X是一个与风险相关的随机变量,其中X的较高结果代表更高的风险。

**2.1. 均值-标准差风险模型和均值-风险价值风险模型**
在空气污染风险评估的背景下,随机变量X代表某种空气污染物的浓度(或测量值),假设该污染物的浓度越高,对环境和人类健康的危害越大,因此假设1成立,风险随着期望值的增加而增加,同时也会随着方差的增加而增加,因为较高的方差意味着更高的不确定性。根据这种风险认知,定义了以下风险度量,保持均值-方差模型中的线性组合结构,但为了维度一致性,这里选择使用标准差而非方差。

**定义1 均值-标准差风险度量**
X的风险的均值-标准差度量定义为:
(2) R1(X,θ) = θSD[X] + (1?θ)E[X]
其中θ是一个满足0?≤?θ?≤?1的实数常数。

权衡参数θ结合了期望值和标准差对最终风险的贡献,可用于分析每个风险成分对最终风险的影响。如果θ=0,则风险仅由期望值决定;如果θ=1,则风险仅由标准差决定;如果θ=1/2,则风险成分对最终风险的贡献相等。如果θ?∈?(0, 1),则当θ接近0时,期望值对风险度量的影响较大;如果θ趋向于1,则不确定性对风险度量的影响更大。

为了建立一个基于此风险度量的风险决策模型,以评估不同选择的相关风险(这些风险可由不同的随机变量表示),我们定义了以下标准化的均值-标准差风险度量。风险因子的标准化有助于通过聚合改善每个因素的相对贡献,并确保不同随机值的整体风险以一致的方式解释和比较。

**定义2 标准化均值-标准差风险度量**
考虑随机变量集合X={X1,…,XI},并令X∈X。X的风险的标准化均值-标准差(Mean-SD)度量由下式定义:
$$ R_{\text{1}}(X, \theta) = \theta SD_{\text{[X}} + (1-\theta) E_{\text{[X}} $$
其中,$\theta$ 是一个实数常数,满足 $0 \leq \theta \leq 1$,$SD_{\text{[X}}$ 和 $E_{\text{[X}}$ 分别是标准化后的标准差和均值,定义为:
$$ SD_{\text{[X}}} = \frac{SD[X]}{\sum_{i=1}^{I+1} SD[X_i]} $$
$$ E_{\text{[X}}} = \frac{E[X]}{\sum_{i=1}^{I+1} E[X_i]} $$
其中,$E[X_i]$ 是 $X_i$ 的均值,$SD[X]$ 是 $X_i$ 的标准差。

关于标准化,这里采用了通过总和(包括最小值)进行除法的标准化方法,因为这是 Zavadskas 和 Turskis (2010) 在 ARAS 方法中使用的标准化方法。正如后面将看到的,通过这种方式可以将风险模型与 ARAS 方法联系起来,其中额外的最小值对应于最优值。在这种情况下,最优值代表最小风险(参见 Brito (2025))。

风险价值(Value at Risk, VaR)是一种广泛采用的风险度量方法,特别是在金融和精算领域,用于理解和管理金融风险,它用于量化潜在损失。给定一个随机变量 $X$,在置信水平 $1-\alpha$ 下的 VaR 表示为:
$$ VaR[X; \alpha] = \inf\{x \in \mathbb{R} \mid P(X \leq x) \geq 1-\alpha\} $$
其中,$\alpha = 0.05$ 和 $\alpha = 0.01$ 将被使用。VaR 风险度量也适用于其他领域,例如环境风险评估。在空气污染风险评估中,随机变量 $X$ 代表空气污染物的浓度,并假设空气污染的风险随着浓度的增加而增加,$VaR[X; \alpha}$ 定义了置信水平 $1-\alpha$ 下的最差污染物浓度,风险随着 $VaR[X; \alpha$ 的增加而增加。此外,$VaR[X; \alpha]$ 可以被解释为一个回报水平,这是极值理论中常用的概念,在这种情况下,它对应于平均每 $1/\alpha$ 次观测(或时间段)预期被超过的污染物浓度。

定义 3:均值-VaR 风险度量
X 的均值-VaR 风险度量由下式定义:
$$ R_{\text{2}}(X, \theta) = \theta VaR[X; \alpha] + (1-\theta) E[X] $$
其中,$\theta$ 是一个实数常数,满足 $0 \leq \theta \leq 1$。

对于涉及不同随机变量的风险评估,将使用以下标准化风险度量。

定义 4:标准化均值-VaR 风险度量
考虑一组随机变量 $X = \{X_1, \ldots, X_i\}$ 并设 $X \in X$。X 的标准化均值-VaR 风险度量由下式定义:
$$ R_{\text{2}}(X, \theta) = \theta VaR_{\text{[X]; \alpha}} + (1-\theta) E_{\text{[X}}} $$
其中,$\theta$ 是一个实数常数,满足 $0 \leq \theta \leq 1$,$VaR_{\text{[X}; \alpha}$ 和 $E_{\text{[X}}$ 分别是标准化后的风险价值和均值,定义为:
$$ VaR_{\text{[X]; \alpha}} = \frac{VaR[X; \alpha]}{\sum_{i=1}^{I+1} VaR[X_i; \alpha]} $$
$$ E_{\text{[X}}} = \frac{E[X]; \alpha]}{\sum_{i=1}^{I+1} E[X_i]} $$
其中,$E[X_i]$ 是 $X_i$ 的均值,$SD[X_i]$ 是 $X_i$ 的标准差。

基于这些风险度量,我们在定义 5 中定义了风险顺序关系,用于评估不同方案的风险。在当前上下文中,这些方案用 $A_i$ 表示,代表被评估的不同元素或选项,每个方案都与一个风险随机变量 $X_i$ 相关联。例如,在环境风险评估中,方案可能代表不同的地点,相关的随机变量描述了每个地点的特定污染物浓度;或者,方案可能代表不同的时间间隔,随机变量描述了单一样本在各个时间间隔内的污染物浓度。

定义 5:
设 $A_1, \ldots, A_i$ 是不同的方案,它们对应的随机变量为 $X_1, \ldots, X_i$。
(a) 如果对于任意的 $i = 1, 2$,有 $R_{\text{1}}(X_1, \theta) > R_{\text{1}}(X_2, \theta)$,则 $A_1$ 比 $A_2$ 更具风险,即 $A_1 \leq A_2$。
(b) 如果对于任意的 $i = 1, 2$,有 $R_{\text{1}}(X_1, \theta) \geq R_{\text{1}}(X_2, \theta)$,则 $A_1$ 比 $A_2$ 的风险稍低,即 $A_1 \leq A_2$。
(c) 如果对于任意的 $i = 1, 2$,有 $R_{\text{1}}(X_1, \theta) = R_{\text{1}}(X_2, \theta)$,则 $A_1$ 和 $A_2$ 的风险相同,即 $A_1 \sim A_2$。

2.2 风险模型的性质
以下结果表明,所提出的风险模型适用于环境空气污染评估问题的风险描述。
在以下情况下,风险决策是直接的。

命题 1:
设 $X_1$ 和 $X_2$ 是风险随机变量。
1. 考虑在 (3) 中定义的标准化均值-标准差风险度量。那么:
(a) 如果 $E[X_1] > E[X_2]$ 且 $SD[X_1] > SD[X_2]$,则 $R_{\text{1}}(X_1, \theta) > R_{\text{1}}(X_2, \theta)$。
(b) 如果 $E[X_1] < E[X_2]$ 且 $SD[X_1] < SD[X_2]$,则 $R_{\text{1}}(X_1, \theta) < R_{\text{1}}(X_2, \theta)$。

2. 考虑在 (6) 中定义的标准化均值-VaR 风险度量。那么:
(a) 如果 $E[X_1] > E[X_2]$ 且 $VaR[X_1; \alpha] > VaR[X_2; \alpha]$,则 $R_{\text{2}}(X_1, \theta) > R_{\text{2}}(X_2, \theta)$。
(b) 如果 $E[X_1] < E[X_2]$ 且 $VaR[X_1; \alpha] < VaR[X_2; \alpha]$,则 $R_{\text{2}}(X_1, \theta) < R_{\text{2}}(X_2, \theta)$。

命题 2 中的性质直接来自于定义,并表明风险随着随机变量值的增加(减少)而增加(减少),无论是通过加上一个正数(负数)常数,还是通过乘以一个大于 1 的常数(常数属于区间 $(0, 1)$)。这些性质与人们对空气污染背景下风险描述的感知一致,即空气污染物浓度的增加(减少)意味着风险增加(减少)。

命题 3:
设 $X$ 是一个风险随机变量,并考虑在 (3) 中定义的标准化均值-标准差风险度量 $R_{\text{1}}$,以及在 (6) 中定义的标准化均值-VaR 风险度量 $R_{\text{2}}$。
1. 设 $X = \{X, X+\alpha\}$,其中 $\alpha \in \mathbb{R}$。那么:
(7) 如果 $\alpha > 0$,则 $R_{\text{1}}(X+\alpha, \theta) > R_{\text{1}}(X, \theta)$。
(8) 如果 $\alpha < 0$,则 $R_{\text{1}}(X+\alpha, \theta) < R_{\text{1}}(X, \theta)$。

命题 3 进一步表明,风险顺序关系在尺度变化下是不变的。此外,如果一个尺度导致某个特定随机变量的风险低于另一个尺度,这种风险排序将适用于使用这些尺度的所有其他随机变量。

命题 3:
考虑在 (3) 中定义的标准化均值-标准差风险度量 $R_{\text{1}}$,在 (6) 中定义的标准化均值-VaR 风险度量 $R_{\text{2}}$,以及两个风险随机变量 $X_1$ 和 $X_2$,以及 $\alpha, \beta \in \mathbb{R}^+$ 且 $\alpha \neq \beta$。
1. 设 $X = \{X_1, X_2\}$。那么,当且仅当 $R_{\text{1}}(\alpha X_1, \theta) < R_{\text{1}}(\alpha X_2, \theta)$ 对于所有 $i = 1, 2$ 时,有 $R_{\text{1}}(X_1, \theta) < R_{\text{1}}(X_2, \theta)$。

3. 广义帕累托风险模型
在极值理论中,广义帕累托(Generalized Pareto, GP)分布用于模拟分布的尾部,特别是在处理极端事件时。GP 模型能够描述给定数据集或尾部中最大值的行为,例如最高的污染物浓度。更准确地说,对于给定的随机变量 $Y$,固定一个足够高的阈值 $\mu$,条件超额 $X|X > \mu$,其中 $X = Y-\mu$,可以通过以下累积分布函数很好地用 GP 模型来近似:
$$ H(x) = \left\{
\begin{array}{ll}
1 - (1 + \gamma x)^{1-\sigma} + \frac{1}{\gamma} & \gamma \neq 0 \\
1 - e^{-x\sigma} & \gamma = 0
\end{array}
\right. $$
其中 $\sigma > 0$ 是尺度参数,$\gamma$ 是形状参数(Pickands (1975), Balkema 和 Haan (1974))。如果 $\gamma > 0$,分布具有厚尾;如果 $\gamma = 0$,分布简化为指数尾部;如果 $\gamma < 0$,分布具有有界尾部。

GP 分布的均值存在,当 $\gamma < 1$ 时,由下式给出:
$$ E[X] = \sigma^{-1-\gamma} $$

GP 分布的方差存在,当 $\gamma < 1$ 时,由下式给出:
$$ var(X) = \sigma^{2(1-\gamma)} $$

GP 分布的风险价值 $VaR[X; \alpha]$ 由下式确定:
$$ VaR[X; \alpha] = \frac{\sigma^{-1-\gamma}}{\alpha \log\alpha - 1}, \gamma \neq 0 $$

将 (12) 和 (13) 代入定义 1 的表达式 (2) 中,我们定义了广义帕累托均值-标准差风险模型,其中风险决策根据定义 5 中描述的风险顺序关系来做出。

定义 6:GP 均值-标准差风险度量
设 $X$ 是遵循在 (11) 中定义的 GP 分布的随机变量,参数为 $\sigma > 0$ 和 $\gamma < 1$。X 的 GP 均值-标准差风险度量由下式定义:
$$ R_{\text{1}}(GP, \gamma, \sigma, \theta) = \theta \sigma^{-1-\gamma} + (1-\theta) \sigma^{-1-\gamma} $$

现在我们将分析 GP-均值-标准差风险度量随其参数 $\gamma, \sigma$ 和 $\theta$ 的变化。

命题 4:
在 (15) 中定义的 GP-均值-标准差风险度量 $R_{\text{1}}(GP, \gamma, \sigma, \theta)$ 随 $\sigma$ 的增加而增加;随 $\gamma$ 的增加而增加;当 $0 < \gamma < 1$ 时随 $\theta$ 的增加而增加;当 $\gamma = 0$ 时,$R_{\text{1}}(GP, \gamma, \sigma, \theta)$ 随 $\theta$ 的增加而保持不变,在这种情况下 $R_{\text{1}}(GP, \gamma, \sigma, \theta) = \sigma$。

前面的命题结果与风险感知一致:较高的尺度参数表示较大的均值和标准差,而较高的形状参数意味着较重的尾部,因此风险随着这些参数的增加而增加。关于权衡参数的作用,请注意,风险度量 (15) 可以表示为:
$$ R_{\text{1}}(GP, \theta) = \theta E[X] + (1-\theta) \left(E[X] - \sigma^{-1-\gamma} E[X]\right) $$

对于 $\theta = 0$,风险等于 $E[X]$。当 $0 < \gamma < 1$ 时,增加 $\theta$ 会增加风险,因为在这种情况下 $E[X] - \sigma^{-1-\gamma} E[X]$ 是正的,意味着不确定性成分大于均值 $E[X]$。然而,如果 $\gamma < 0$,增加 $\theta$ 会降低风险,因为在这种情况下 $E[X] - \sigma^{-1-\gamma} E[X]$ 是负的,因此 $R_{\text{1}}(GP, \theta) = \theta E[X] - \sigma^{-1-\gamma} E[X]$ 会从 $E[X]$ 中减去,此时 $SD[X] < E[X]$。

对于不同随机变量的风险评估和比较,定义了以下标准化的 GP 风险度量。

定义 7:标准化 GP 均值-标准差风险度量
考虑一组风险随机变量 $X = \{X_1, \ldots, X_i\}$。设 $X_k \in X$ 是遵循在 (11) 中定义的 GP 分布的随机变量,参数为 $\sigma_k > 0$ 和 $\gamma_k < 1$,并且设 $X_i, i = 1, \ldots, I$ 是遵循 GP 分布的随机变量,参数为 $\sigma_i > 0$ 和 $\gamma_i < 1$。X_k 的标准化 GP 均值-标准差风险度量由下式定义:
$$ R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta) = \theta \left(1 + \left(1-\gamma_k\right)^{-1}\right) \sum_{i=1}^{I+1} \sigma_i \left(1-\gamma_i\right)^{-1} \left(1-\theta\right) \sum_{i=1}^{I+1} \sigma_i \left(1-\gamma_i\right) $$

命题 5:
考虑在 (16) 中定义的标准化 GP-均值-标准差风险度量 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$,并设 $F(\gamma_k) = \sum_{i=1}^{I+1} \sigma_i \left(1-\gamma_i - 1-\gamma_k\right) \left(1-\gamma_i\right)^{-2}$。那么,$R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$ 随 $\sigma_k$ 的增加而增加;随 $\gamma_k$ 的增加而增加;当 $F(\gamma_k) > 0$ 时随 $\theta$ 的增加而增加;当 $F(\gamma_k) < 0$ 时随 $\theta$ 的减少而减少;如果 $F(\gamma_k) = 0$,则 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$ 随 $\theta$ 的增加而保持不变。

根据前面的命题,在以下情况下,对于具有最大或最小尾部指数的方案,可以得出风险度量是随 $\theta$ 增加还是减少的结论。

推论 1:
设 $X = \{X_1, \ldots, X_i\}$,$X_k \in X$,并考虑定义 (7) 中的标准化 GP-均值-标准差风险度量 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$。如果对于所有的 $i = 1, \ldots, I$ 有 $\gamma_k > \gamma_i$,则 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$ 随 $\theta$ 的增加而增加;如果对于所有的 $i = 1, \ldots, I$ 有 $\gamma_k < \gamma_i$,则 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$ 随 $\theta$ 的减少而减少;如果 $\gamma_k = \gamma_i$,对于所有的 $i = 1, \ldots, I$,则 $R_{\text{1}}(GP, \gamma_k, \sigma_k, \theta)$ 随 $\theta$ 的增加而保持不变。

因此,给定一组方案,对于具有最大尾部指数的方案,风险随 $\theta$ 的增加而增加,因为 $F(\gamma_k) > 0$;而对于具有最小尾部指数的方案,风险随 $\theta$ 的增加而减少,因为 $F(\不同的权重(无论是客观的还是主观的)可以分配给各个标准,以反映在评估和比较选项时每个标准的相对重要性。由于决策通常涉及多个相互冲突的标准,权重有助于量化每个标准在最终决策过程中的影响。存在不同的客观加权程序来定义标准权重(例如,参见Chatterjee和Chakraborty(2024年)、Hwang等人(1993年)),例如,等权重(或平均权重)方法、标准差方法、变异系数方法、通过标准间相关性确定标准重要性的方法(CRITIC)方法。加性比例评估(ARAS)方法是一种多标准决策方法,由Zavadskas和Turskis(2010年)开发。在ARAS方法中,每个选项相对于最优解的效用程度是通过该选项的解决方案总和与最优解之间的比率来确定的。适用于风险评估的ARAS方法可以描述如下(参见Zavadskas和Turskis(2010年),以及Brito(2025年)对风险评估的调整)。

定义10 ARAS方法与风险标准
考虑选项Ai,i=1,…,I,以及由风险度量RMj,j=1,…,J定义的标准。设X=[xij]I×J为决策矩阵,其中xij是用风险度量RMj确定的选项Ai的风险值。带有风险标准的ARAS方法包括以下步骤:
步骤1 使用(19)计算归一化的风险决策矩阵RA=[rij](I+1)×J
rij=xij∑i=1I+1xij,
其中xI+1,j,j=1,…,J是J个风险标准的最优值。
步骤2 通过(20)计算加权的归一化风险决策矩阵WA=[wij](I+1)×J
wij=wjrij,
i=1,…,I+1,j=1,…,J,
使用满足∑j=1Jwj=1的标准权重。
步骤3 对于每个选项,计算最优性函数:
(21) Si=∑j=1Jwij,
i=1,…,I+1。
步骤4 对于每个选项,确定效用程度ki,
(22) ki=SI+1Si,
i=1,…,I+1,
其中SI+1是最佳理想值。
步骤5 根据它们的效用程度对选项进行排名,其中效用程度最高的选项被排在最前面。

我们将展示,在第2节和第3节中提出的归一化风险决策模型,即归一化均值-标准差(Mean-SD)和归一化均值- VaR(Mean-VaR)风险模型以及相应的GP风险模型,当考虑两个风险标准(在本例中为均值和标准差、均值和VaR)时,可以通过定义一个交换因子作为权重因素,并使用ARAS方法来识别。

注释1
考虑具有随机变量Xi的选项Ai,i=1,…,I。归一化均值-标准差和均值- VaR风险模型分别对应于带有风险标准RM1=SD[X]和RM1=VaR[X;p]的ARAS方法,以及RM2=E[X]的ARAS方法,通过将交换因子识别为标准权重θ=w1和1?θ=w2,其中定义2和定义4中的风险度量对应于定义10中的最优性函数,即R ̄l(Xi,θ)=Si,l=1,2。定义5中的风险顺序关系导致与使用定义10中的效用程度相同的最优解和相同的风险决策:
给定两个选项Ai1和Ai2,i1,i2∈{1,…,I},则
(23) [R ̄l(Xi1,θ)ki2?Ai1?Ai2],
对于l=1,2。
特别地,请注意,考虑到风险决策矩阵X=[xij](I+1)×2,其中xi1=SD[Xi],xi2=E[Xi],对于i=1,…,I,以及xI+1,1=SD[XI+1]=minXi{SD[Xi]},xI+1,2=E[XI+1]=minXi{E[Xi]},定义10中步骤3的最优性函数(24)Si=wi1+wi2=w1ri1+w2ri2,
(25) ri1=SD ̄[Xi]=SD[Xi]∑n=1I+1SD[Xn],ri2=E ̄[Xi]=E[Xi]∑n=1I+1E[Xn],
对应于归一化均值-标准差风险度量(26)R ̄1(Xi,θ)=θSD ̄[Xi]+(1?θ)E ̄[Xi],
其中θ=w1且1?θ=1?w1=w2。同样,通过使用标准RM1=VaR[X;p]代替RM1=SD[X],最优性函数Si也可以与归一化均值- VaR风险度量相对应。

关于这里考虑的风险模型中最佳交换参数θ的确定,由于该参数对应于分配给第一个标准的权重(见注释1:θ=w1,1?θ=w2),并且与多标准决策方法(MCDM)中的标准权重或标准重要性确定相关,因此可以使用客观或主观加权方法获得权重,如前所述。主观加权方法基于决策者的偏好来确定权重。客观加权方法基于可用数据样本和数据的变化来确定权重。对于当前应用,客观加权方法更为合适(因为主观判断以找到最佳风险度量组合以做出最佳决策是复杂的)。标准差程序是一种客观加权方法。该程序为那些能最大程度区分选项风险值的标准分配更高的权重,从而更好地影响选项之间的区分(例如,参见Vavrek(2019年),其中推荐将此方法用于MCDM方法TOPSIS)。在这种方法中,将应用标准差程序来确定最佳权重(交换参数)。在这种情况下,最佳权重意味着相关的风险标准具有更高的标准差,因此具有更大的区分选项的能力。在选项之间变化较大的风险标准被视为更具信息性,因此会被赋予更高的权重。使用此程序,权重通过(27)wj=σj∑k=1Jσk计算,其中σj是(r1j,…,rIj)(即第j个风险标准的归一化风险值的标准差),j=1,…,J的标准差。根据这种方法,风险模型的交换参数θ?定义为(28)θ?=σ1σ1+σ2,其中:对于归一化均值-标准差模型,σ1是(SD ̄[X1],…,SD ̄[XI])的标准差;对于归一化均值- VaR模型,σ1是(VaR ̄[X1;p],…,VaR ̄[XI;p]的标准差;σ2是(E ̄[X1],…,E ̄[XI])的标准差。

5. 应用于PM2.5引起的空气污染风险评估
前几节中开发的风险模型现在将应用于评估由PM2.5引起的空气污染风险,同时考虑数据的月度特性。目标是评估全年的空气污染风险,并识别风险最高的月份。分析中将使用2015年至2023年期间比利时安特卫普的PM2.5月度数据(数据来自欧洲环境署(2025年))。我们排除了2020-2021年的非典型 pandemie 年份。

5.1. GP参数估计
GP分布通过最大似然(ML)在峰值超过阈值(POT)框架内拟合到每个月的超额值。POT方法仅关注数据集中最极端的值,通过选择一个高阈值并分析其上的超额值来进行建模。这种方法允许使用GP分布捕捉尾部行为,提供了一个灵活高效的极端值分析框架。GP参数σ和γ≠0的ML估计器,通过重新参数化τ=γ/σ,满足以下方程:
(29)
{1τ^?(1γ^+1)1Nμ∑i=1NμXi1+τ^Xi=0
γ^=1Nμ∑i=1Nμlog(1+τ^Xi),
其中X1,...,XNμ是选定的高阈值μ的Nμ次超额值。如果γ=0,则σ^=X ̄。选择适当的高阈值μ是极端值理论中的一个关键问题,文献中有几种方法(例如,参见Beirlant等人(2004年)及其中的参考文献)。低阈值可能会导致拟合偏差,而高阈值会增加方差,因此在尾部估计中需要在偏差和方差之间取得平衡。本研究采用的方法依赖于Castillo和Padilla(2016年)最初提出的GP变异系数(CV),并进一步由Moreira和Ferreira(2025年)进行了研究。这种图形和统计程序利用了这样一个性质:对于足够高的阈值,当数据遵循GP分布时,超额值的CV保持不变。通过计算一系列递增阈值的CV并通过参数自举方法测试其恒定性,可以识别出无法拒绝恒定CV的零假设的最小阈值,从而得出一个数据驱动的、与GP一致的截断值。这种方法在ercv包(Castillo等人,2019年)中为R Core(2020)实现。在图1中,我们绘制了经验互补分布函数,即经验1?H和相应的调整模型GP。两条曲线之间的接近度表明模型的拟合是合适的。垂直线对应于使用上述方法选择的阈值μ。表1报告了GP分布参数的估计值以及使用正态近似构建的95%置信区间,ω^j±1.96SE(ω^j),j=1,2,其中ω^=(σ^,γ^)。标准误差(SE)是从观察到的信息矩阵的逆计算得出的,通过数值评估估计值处的对数似然的Hessian得到。当GP模型合适时,形状和尺度参数的置信区间通常覆盖了在附近合理阈值上获得的估计值,表明尾部行为的稳定性。在接下来的两节中,我们还将基于每个月超过选定阈值的超额值的自助重采样来分析GP建模的不确定性。

下载:下载高分辨率图像(351KB)
下载:下载全尺寸图像

图1. 从1月到12月的经验互补分布函数和相应的调整模型GP(橙色曲线)。垂直虚线对应于使用的阈值μ。

表1. GP参数γ^和σ^的估计值及其相应的95%置信区间(γ^inf,γ^sup)和(σ^inf,σ^sup)。
月份 γ^(γ^inf,γ^sup) σ^(σ^inf,σ^sup)
Jan -0.0973 (-0.2819, 0.0872) 14.5742 (10.3446, 18.8038)
Feb -0.0266 (-0.2032, 0.1501) 12.6342 (8.8490, 16.4195)
Mar -0.0017 (-0.1879, 0.1845) 10.7264 (7.2908, 14.1620)
Apr 0.0514 (-0.0619, 0.1648) 8.6523 (6.8384, 10.4662)
May 0.0050 (-0.1305, 0.1204) 4.7854 (3.4861, 6.0848)
Jun 0.1429 (0.0151, 0.2706) 3.1541 (1.9783, 4.3298)
Jul -0.0019 (-0.1496, 0.1458) 2.8192 (1.9477, 3.6908)
Aug 0.1200 (-0.0237, 0.2638) 3.3261 (2.2673, 4.3848)
Sep 0.1756 (0.0134, 0.3378) 3.2612 (2.2221, 4.3004)
Oct -0.0019 (-0.1599, 0.1561) 7.1509 (5.0371, 9.2647)
Nov -0.1606 (-0.3131, -0.0081) 9.9854 (6.7708, 13.2001)
Dec -0.1460 (-0.2756, -0.0165) 11.3116 (8.4443, 14.1789)

表2展示了与模型相关的风险度量,即均值、标准差和在p=0.01和p=0.05时的风险值,分别是从(12)、(13)和(14)得出的,通过用它们的估计值替换σ和γ得出。

表2. γ^和σ^的风险组成部分。
月份 SD[X] E[X] VaR[X;0.01] VaR[X;0.05]
Jan 12.15 15 13.28 16 54.09 25 37.87
Feb 11.99 25 12.30 71 15 4.76
Mar 10.69 00 10.70 82 49 20 38
Apr 9.63 05 9.12 16 44 96 20 32
May 4.73 75 4.76 14 21 78 34
Jun 4.35 41 3.67 98 20 54 91 11
Jul 2.80 87 2.81 40 12 92 71 18
Aug 4.33 60 3.77 98 20 45 19 11
Sep 4.91 11 3.95 59 23 12 85 60
Oct 7.13 74 7.12 13 28 72 13 61
Nov 7.48 53 86 38 32 49 98 23
Dec 8.68 32 9.87 23 77 44 64

表2中用粗体标出了风险度的最佳值(即最低值),这些值都属于7月。这些值在推导归一化GP风险度量的过程中被考虑进去。需要注意的是,从统计学上讲,7月具有最低风险组成部分的原因是它获得了最低的尺度值σ^(参见表1)。尽管风险组成部分的表达还取决于形状参数,而且有五个月显示的γ^值低于7月,但由于σ^的显著较低,两个参数的综合效应使得7月是风险最低的月份。从物理角度来看,7月细颗粒物浓度较低可以解释为这个炎热月份与供暖相关的排放最少,而夏季较高的温度增强了大气的混合和扩散,从而促进了这些污染物的稀释。

5.2. 归一化GP均值-标准差风险模型
计算归一化风险度量的结果见表B.7,这些结果也在图B.4中绘制(见B),可以看到一个模式:较冷的月份显示出较高的值,这些值逐渐向较暖和的月份减少,最终在7月达到最低值。图2绘制了12个月的归一化均值-标准差风险度量,其中θ?∈?[0, 1]。可以观察到,对于某些月份,例如1月或12月,风险随着θ的增加而减少。根据命题5,对于具有正因子F(γk)的选项,风险随着θ的增加而增加;而对于具有负因子的选项,风险随着θ的增加而减少。计算F(γk)(见表B.8中的结果),可以确认1月、2月、11月和12月的风险随着θ的增加而减少,而对于其他月份,风险随着θ的增加而增加。

下载:下载高分辨率图像(475KB)
下载:下载全尺寸图像

图2. 归一化均值-标准差风险,其中垂直线对应于在(30)中得到的θ=0.4752。
图2显示,通常情况下,相对于参数θ,选项的排序相对稳定。实际上,θ的变化只改变了:a) 4月和12月的风险顺序,在θ=0时12月的风险高于4月,然而,由于4月的风险在增加,而12月的风险在减少,因此在θ=0.4372时4月的风险超过了12月;b) 5月和9月的风险顺序,在θ=0时5月的风险高于9月,但在θ=0.8286时风险顺序发生了变化,因此例如在θ=1时9月的风险高于5月。因此,根据归一
根据均值-标准差(Mean-SD)风险排序,对于区间范围Iθ?[0, 1],各个月的风险顺序如下:
- [0, 0.4372):1月 ? 2月 ? 3月 ? 12月 ? 4月 ? 11月 ? 10月 ? 5月 ? 9月 ? 8月 ? 6月 ? 7月
- [0.4372, 0.8286):1月 ? 2月 ? 3月 ? 4月 ? 12月 ? 11月 ? 10月 ? 5月 ? 9月 ? 8月 ? 6月 ? 7月
- [0.8286, 1]:1月 ? 2月 ? 3月 ? 4月 ? 12月 ? 11月 ? 10月 ? 9月 ? 5月 ? 8月 ? 6月 ? 7月

从表3的结果可以看出,在安特卫普,11月至4月的寒冷期间由于PM2.5造成的空气污染风险较高,而5月至10月的温和温暖期间风险较低,其中1月是风险最高的月份,其次是2月和3月;相反,7月的风险最低,6月和8月分别排在第二和第三位。

先前的结果表明,在当前应用中,权衡参数对最终排名结果的影响总体较小。使用标准化均值-标准差(Mean-SD)风险模型时,无论使用标准化的均值(θ=0)还是标准化的标准差(θ=1),最终排名的变化仅涉及四个中等风险级别的选项(参见表3:4月至12月,5月至9月)。接下来将考虑ARAS方法以及标准差加权程序来确定权衡参数θ。

由于使用ARAS方法并根据均值和标准差标准进行的排名必须与表3中的某个排名相匹配,因此可以通过选择特定的加权策略来验证ARAS的输出结果。如第4节所述,此处将应用标准差加权程序(28),得到以下结果:
(30)θ?=0.4752, 1?θ?=0.5248,
相应的结果列在表4中,包括Si、ki和排名顺序。由此可见,使用权衡参数θ?=0.4752得到的排名与表3中θ∈[0.4372, 0.8286]范围内的排名一致。

表4. 优化值Si、效用度ki、使用均值和标准差的ARAS排名顺序,以及标准差加权程序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法(Bootstrap)重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

从表3的结果来看,可以得出结论:在安特卫普,11月至4月的寒冷期间由于PM2.5造成的空气污染风险高于5月至10月的温暖时期,其中1月是风险最高的月份,其次是2月和3月;相反,7月的风险最低,6月和8月分别排在第二和第三位。

之前的研究还表明,在当前应用中,权衡参数对最终排名结果的影响总体较小。无论是使用标准化的均值(θ=0)还是标准化的标准差(θ=1),最终排名的变化仅涉及四个中等风险级别的选项(参见表3:4月至12月,5月至9月)。接下来将考虑ARAS方法以及标准差加权程序来确定权衡参数θ。

由于使用ARAS方法并根据均值和标准差标准进行的排名必须与表3中的某个排名相匹配,因此可以通过选择特定的加权策略来验证ARAS的输出结果。如第4节所述,此处将应用标准差加权程序(28),得到以下结果:
(30)θ?=0.4752, 1?θ?=0.5248,
相应的结果列在表4中,包括Si、ki和排名顺序。由此可见,使用权衡参数θ?=0.4752得到的排名与表3中θ∈[0.4372, 0.8286]范围内的排名一致。

表4. 优化值Si、效用度ki、使用均值和标准差的ARAS排名顺序,以及标准差加权程序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法(Bootstrap)重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

由于使用ARAS方法并根据均值和标准差标准进行的排名必须与表3中的某个排名相匹配,因此可以通过选择特定的加权策略来验证ARAS的输出结果。如第4节所述,此处将应用标准差加权程序(28),得到以下结果:
(30)θ?=0.4752, 1?θ?=0.5248,
相应的结果列在表4中,包括Si、ki和排名顺序。由此可见,使用权衡参数θ?=0.4752得到的排名与表3中θ∈[0.4372, 0.8286]范围内的排名一致。

表4. 优化值Si、效用度ki、使用均值和标准差的ARAS排名顺序,以及标准差加权程序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项)和自助法(Bootstrap)重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

表3显示了参数θ在区间[0,1]内连续变化时的结果。对加权因素进行的敏感性分析表明,该方法具有很强的稳健性,因为只观察到两次排名反转。

为了量化和分析不确定性,我们基于重采样方法生成了10000个自助法(bootstrap)副本,并重新估计了每个样本的广义帕累托(Generalized Pareto)模型。对于每个自助法副本,根据均值-标准差模型计算标准化风险Si(i=1,…,12)。然后确定10000个自助法排名的中位数排名(MedR)(见表4)。可以看出,中位数排名存在平局(1月和2月;5月和9月;6月和8月)。为了确保完整的有序排名,使用10000个自助法排名的平均排名位置(MRP)得到的自助法排名均值(MR)作为平局裁决标准。这种方法在保持中位数稳健性的同时,确保了排名的明确性。通过使用MR打破MedR中的平局,得到的最终排名与均值排名一致。因此,最终的自助法排名由MR给出。

将最终的自助法排名(MR)与之前使用所提方法得到的排名进行比较,可以发现它们非常相似;只发生了两次排名反转,分别是在4月和12月之间,以及6月和8月之间,每次排名只相差一个位置。计算Spearman等级相关系数和Kendalltau相关系数来检查这两个排名的相似性,结果显示它们有很强的相关性,因为相关系数属于区间(0.93,1),p值低于0.01,表明排名之间有显著的相关性。

使用基于自助法的标准差(SD(Si)和SD(R)分别表示估计得分Si和排名的不确定性(见表4)。Si的变异性在所有月份中总体较低,表明得分估计较为稳定,尽管3月(0.0143)和6月(0.0147)的变异性略高。相比之下,5月和7月的变异性最低,表明估计更为精确。通过SD(R)衡量的排名变异性在不同月份间差异较大,特别是1月(3.1292)、2月(2.7559)和3月(2.3459)的排名不确定性最高,表明对重采样的敏感性较强。相反,5月(0.8143)的变异性最低,其次是10月和11月,表明排名位置较为稳定。总体而言,这些结果表明排名不确定性主要由得分的接近程度决定,Si值相似的月份在相对排序上表现出更大的不稳定性。

尽管参数不确定性会导致月度风险排名的轻微变化,但总体而言,各种排名之间有很强的一致性,这表明基于γ^和σ^得到的排名可以视为自助法重采样程序产生的排名的代表。

将研究标准化GP Mean-VaR风险模型,显著性水平分别为p=0.01和p=0.05,其中p=0.01的结果在本节中呈现,p=0.05的结果在附录C中给出。图3包含了使用标准化组件VaR[X;0.01]和E[X]定义的十二个月的标准化GP Mean-VaR风险度量的图形表示(见B.7)。通过改变参数θ,风险顺序发生变化:12月和4月、5月和9月、1月和2月、10月和11月(见表5)。根据命题7计算因子G(γk),得到表B.9中的结果(见B)。由于对于1月、2月、11月和12月,G(γk)<0,这意味着这些月份的风险度量随θ的增加而减少。相反,对于其余月份,风险度量随θ的增加而增加。这种风险线的行为在图3中有所体现。

下载:高分辨率图像(345KB)
下载:全尺寸图像

图3. p=0.01时的标准化GP Mean-VaR风险,其中垂直线对应于(31)中得到的θ=0.4708。

表5. p=0.01时区间范围Iθ?[0, 1]内各个月的风险排序:
- [0, 0.3213):1月 ? 2月 ? 3月 ? 12月 ? 4月 ? 11月 ? 10月 ? 5月 ? 9月 ? 8月 ? 6月 ? 7月
- [0.3213, 0.7311):1月 ? 2月 ? 3月 ? 4月 ? 12月 ? 11月 ? 10月 ? 5月 ? 9月 ? 8月 ? 6月 ? 7月
- [0.7311, 0.8678):1月 ? 2月 ? 3月 ? 4月 ? 12月 ? 11月 ? 10月 ? 9月 ? 5月 ? 6月 ? 8月 ? 7月
- [0.8678, 0.9634):2月 ? 1月 ? 3月 ? 4月 ? 12月 ? 11月 ? 10月 ? 9月 ? 5月 ? 6月 ? 8月 ? 7月

分析表5的结果可以看出,标准化GP Mean-VaR风险模型也将11月至4月的寒冷期间列为因PM2.5导致空气污染风险最高的时期,其中1月是风险最高的月份(θ∈[0, 0.8678)时;2月是风险第二高的月份。对于θ∈[0.8678, 1],这些月份的排名顺序发生了反转。7月是风险最低的月份(θ∈[0, 1]),而6月和8月分别是在θ∈[0, 0.7311)和θ∈[0.7311, 1]时风险第二低的月份。

应用标准差加权程序(28)的ARAS方法,得到以下结果:
(31)θ?=0.4708, 1?θ?=0.5292,
相应的结果列在表6中。可以看出,ARAS排名与表5中权衡参数θ=0.4708(∈[0.3213,0.7311)时的风险排序一致。

表6. 优化值Si、效用度ki、使用均值和VaR以及标准差加权程序的ARAS排名顺序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

表6. 优化值Si、效用度ki、使用均值和VaR以及标准差加权程序的ARAS排名顺序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

分析表5的结果可以看出,标准化GP Mean-VaR风险模型也将11月至4月的寒冷期间列为因PM2.5导致空气污染风险最高的时期,其中1月是风险最高的月份(θ∈[0, 0.8678)时;2月是风险第二高的月份。对于θ∈[0.8678, 1],这些月份的排名顺序发生了反转。7月是风险最低的月份(θ∈[0, 1]),而6月和8月分别是在θ∈[0, 0.7311)和θ∈[0.7311, 1]时风险第二低的月份。

应用标准差加权程序(28)的ARAS方法,得到以下结果:
(31)θ?=0.4708, 1?θ?=0.5292,
相应的结果列在表6中。可以看出,ARAS排名与表5中权衡参数θ=0.4708(∈[0.3213,0.7311)时的风险排序一致。

表6. 优化值Si、效用度ki、使用均值和VaR以及标准差加权程序的ARAS排名顺序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

表6显示,标准化GP Mean-VaR风险模型也将11月至4月的寒冷期间列为因PM2.5导致空气污染风险最高的时期,其中1月是风险最高的月份(θ∈[0, 0.8678)时;2月是风险第二高的月份。对于θ∈[0.8678, 1],这些月份的排名顺序发生了反转。7月是风险最低的月份(θ∈[0, 1]),而6月和8月分别是在θ∈[0, 0.7311)和θ∈[0.7311, 1]时风险第二低的月份。

使用标准差加权程序(28)的ARAS方法,得到以下结果:
(31)θ?=0.4708, 1?θ?=0.5292,
相应的结果列在表6中。可以看出,ARAS排名与表5中权衡参数θ=0.4708(∈[0.3213,0.7311)时的风险排序一致。

表6. 优化值Si、效用度ki、使用均值和VaR以及标准差加权程序的ARAS排名顺序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

分析表5的结果可以看出,标准化GP Mean-VaR风险模型也将11月至4月的寒冷期间列为因PM2.5导致空气污染风险最高的时期,其中1月是风险最高的月份(θ∈[0, 0.8678)时;2月是风险第二高的月份。对于θ∈[0.8678, 1],这些月份的排名顺序发生了反转。7月是风险最低的月份(θ∈[0, 1]),而6月和8月分别是在θ∈[0, 0.7311)和θ∈[0.7311, 1]时风险第二低的月份。

应用标准差加权程序(28)的ARAS方法,得到以下结果:
(31)θ?=0.4708, 1?θ?=0.5292,
相应的结果列在表6中。可以看出,ARAS排名与表5中权衡参数θ=0.4708(∈[0.3213,0.7311)时的风险排序一致。

表6. 优化值Si、效用度ki、使用均值和VaR以及标准差加权程序的ARAS排名顺序(排名顺序1代表最佳分类的选项,即风险最低的选项;排名顺序12代表排名最低的选项,即风险最高的选项)和自助法重采样结果(SD(Si)、MRP、MR、SD(R)、MedR)。

表6显示,标准化GP Mean-VaR风险模型也将11月至4月的寒冷期间列为因PM2.5导致空气污染风险最高的时期,其中1月是风险最高的月份(θ∈[0, 0.8678)时;2月是风险第二高的月份。对于θ∈[0.8678, 1],这些月份的排名顺序发生了反转。7月是风险最低的月份(θ∈[0, 1]),而6月和8月分别是在θ∈[0, 0.7311)和θ∈[0.7311, 1]时风险第二低的月份。

应用标准差加权程序(28)的ARAS方法,得到以下结果:
(31)θ?=0.4708, 1?θ?=0.5292,
相应的结果列在表6中。可以看出,ARAS排名与表5中权衡参数θ=0.4708(∈[0.321排名的自助法标准差(SD(R))和标准化风险估计值的标准差(SD(Si))在三种模型和不同月份之间显示出不同的模式。总体而言,在均值-标准差(Mean–SD)模型下,SD(R)显著较大,尤其是在最初的几个月(1月、2月、3月),这表明排名位置的不稳定性较大。相比之下,均值-风险价值(Mean-VaR)模型产生的值明显较低,其中均值-风险价值p=0.05模型在大多数月份的排名变化最小。然而,在6月出现了一个例外,均值-风险价值模型显示出增加的变异性,超过了均值-标准差模型,表明在该月份的尾部风险度量下排名稳定性降低。关于SD(Si),均值-标准差模型在整个月份中始终表现出最低的变异性。相反,均值-风险价值模型显示出较高的离散度,反映了估计风险的不确定性增加,尤其是在极端分位数上。这一效应在6月尤为明显。总之,均值-标准差模型与排名位置的较高变异性相关,但风险估计的不确定性较低;而均值-风险价值模型虽然总体上提供了更稳定的排名,但以估计风险的增加为代价,特别是在尾部敏感性较高的月份(如6月)。尽管某些月份的风险排名位置有轻微变化,但结合中位数和平均排名的自助法排名分析表明,所计算出的参数估计值得出的风险排名具有代表性。由于使用所提出的风险模型得到的排名总体上没有显著差异,因此可以建立稳定最终决策和月份风险分类。尽管在给定的应用中,排名与例如简单的VaR[X; 0.05]得到的排名非常相似(见表2),但所提出的风险模型的优势在于它们能够通过考虑两种不同的风险标准,并通过权衡因子允许不同的权重分配,从而提供更灵活和多样化的风险分类。

在未来的研究中,有兴趣更深入地研究这些风险模型(特别是通过考察权衡因子的变化如何影响不同数据集和应用领域中的风险),例如环境研究中的温度数据或金融领域的市场数据。

**6. 结论**
本文提出了一种极端风险建模方法,该方法使用两组分风险度量来评估和分类替代方案的风险。新的风险度量结合了均值和标准差、以及均值和风险价值这两个风险组成部分,并通过一个权衡因子来进行综合评估。为了考虑极端事件的特性,这些风险模型是为广义帕累托(Generalized Pareto)分布开发的,并且依赖于分布的形状和尾部参数。分析与风险感知相关的属性,并基于风险模型参数得出了结论。研究表明,当指定两个考虑的风险标准时,这些风险模型可以通过多标准决策方法(Additive Ratio Assessment, ARAS)来识别。当权衡因子在[0,1]区间内连续变化时,这些风险模型涵盖了ARAS方法为不同标准权重程序生成的全部输出范围。这些风险模型被应用于颗粒物PM2.5引起的空气污染风险评估,旨在识别一年中污染最严重的时期,并根据风险对月份进行分类。利用2015-2023年的数据(不包括2020-2021年的大流行年),分析了安特卫普市PM2.5的月度参数浓度。基于月度数据样本,估计了相应GP分布的参数。为十二个月定义了均值-标准差(Mean-SD)和均值-风险价值(Mean-VaR,显著性水平分别为1%和5%)风险模型,并比较了不同权衡因子下的风险情况。所有三种风险模型均将11月至4月的寒冷期认定为安特卫普市PM2.5空气污染风险最高的时期,其中1月是最危险的一个月,其次为2月。相反,夏季时期(7月被归类为风险最低的月份)是PM2.5空气污染风险最低的时期。考虑到基于权衡参数变化的敏感性分析(该参数在ARAS方法中等同于权重因子),可以得出结论,所提出的模型在替代方案的风险评估中非常稳定,只有均值-风险价值p=0.01模型显示出更多的排名反转(5对替代方案的排名位置发生了变化)。特别是获得了使用标准差权重程序确定的权衡因子的ARAS方法的结果。为了量化和分析标准化风险模型中的风险估计不确定性,采用了自助法方法,即对每个月超出选定阈值的异常值进行重采样,然后重新拟合GP模型。总体而言,结果表明基于自助法的排名与从计算出的参数估计值得到的排名大致一致。这项分析全面了解了不确定性,表明虽然自助法识别出对样本变异性敏感的月份(尤其是6月),但总体排名仍然具有较好的稳健性。

所提出的风险评估方法基于广义帕累托分布,允许对极端值进行建模,从而能够考虑在最坏情况下可能发生的罕见极端事件。这种新的风险建模方法对于环境风险评估尤为重要,因为在公共卫生和环境政策的有效规划中,量化极端影响是至关重要的。未来,这些模型打算应用于不同地点的空气污染风险评估,包括寒冷和炎热气候区域的城市,并考虑不同的空气污染物。所提出的方法论和结果为模型的进一步发展和改进提供了基础,例如探索替代参数估计程序、研究其他不同风险度量的组合或纳入额外的风险度量。该方法论还将扩展到广义极值分布(Generalized Extreme Value distribution)。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号