总概率Logit模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

总概率Logit模型

《Journal of Choice Modelling》：Summed-probability logit models

【字体：大中小】 时间：2026年05月10日 来源：Journal of Choice Modelling 2.4

编辑推荐：

　　安德鲁·戴利 ALOGIT软件与分析有限公司，利乌瓦登，荷兰 **摘要** 本文介绍了总结概率logit选择模型，这类模型通过将观察到的选择概率表示为树嵌套logit模型给出的多个概率之和来计算该概率。文中解释了如何使用这些模型来表示不确定选择、交叉嵌套和潜在类别模

　　安德鲁·戴利
ALOGIT软件与分析有限公司，利乌瓦登，荷兰

**摘要**
本文介绍了总结概率logit选择模型，这类模型通过将观察到的选择概率表示为树嵌套logit模型给出的多个概率之和来计算该概率。文中解释了如何使用这些模型来表示不确定选择、交叉嵌套和潜在类别模型，并展示了总结概率表示方法的优势，还包括了对其进行多层次扩展的方法以及如何简化“规模”变量的处理。同时提供了模型估计的公式。总结概率表示方法为理解一类通用的logit模型提供了 insights，并有望帮助分析师高效估计各种模型规格。

**1. 引言**
所谓总结概率模型，是指选择概率pc通过一组替代方案的概率之和来计算的模型：
$$
pc = \sum_{q \in Q(c)} p_q
$$
也就是说，整体概率是定义在集合Q(c)中的各个单独选择q的概率之和，这些选择共同构成了选择c。如果预测各个选择q的模型是树嵌套logit模型，则可以认为该模型属于logit家族。这种形式的模型之前已经在多种不同的表述中得到应用；本文的贡献在于展示了这些模型之间的内在等价性，说明了它们如何解决某些问题，并支持其实际应用。
为了清晰起见，这里讨论的模型代表的是代理人做出的单一选择。由单一代理人做出的一系列相关选择可以通过一系列这种形式的总结概率模型来建模，但本文不涉及这方面的内容。

在本文的主体部分，解释了可以在哪些应用场景中将选择概率有效地表示为概率之和。最后一部分提供了一些有助于估计本文所述类别模型的公式，希望这些公式对实际分析师有所帮助。

**2. 应用场景**
总结概率概念有几个重要的应用场景，本节将对此进行讨论，并探讨该概念有助于解决的一些技术问题。首先，我们明确一下什么是树嵌套模型和树logit模型。原则上，总结概率和树嵌套概念可以应用于除logit之外的其他模型形式，尽管某些方程更具普遍适用性，但在这些情况下logit形式表现得特别好。

根据Daly（1987）的观点，树嵌套选择模型（无论其功能形式如何）可以通过定义一个树函数t来指定，该函数为每个基本和复合替代方案a提供一个唯一的“祖先”t(a)。这个函数允许定义从a到根节点r的“祖先”替代方案序列A(a)：
$$
A(a) = \{ a, t(a), t(t(a)), \ldots, b \} \\
$$
其中b=r。需要注意的是，A(a)包含a但不包含根节点，从而避免了循环。
在树嵌套模型中，选择q的概率可以表示为：
$$
p_q^* = \prod_{a \in A(q)} p_a
$$
或者
$$
p_q^* = \sum_{a \in A(q)} \log(p_a)
$$
其中$l_q^*$是$q$的边际选择概率，$l_a$是$a$的条件概率，即$\log Pr\{a|t(a)\}$。

树嵌套方程（2）可以应用于任何形式的底层模型，但对于logit模型来说，由于其公式在多选项效用最大化方面的独特性质（McFadden, 1974），定义与效用最大化一致的特定模型形式更为直接。同样，使用其他行为范式的模型原则上也可以应用这些公式。在本文的剩余部分，我只详细讨论基于效用最大化的logit模型。

如果每个条件概率$p_a$都由多项式logit公式给出：
$$
p_a = \exp(U_a) / \sum_t(b) = t(a) \exp(U_b)
$$
则称该树模型为树logit模型。效用函数U可以根据具体情境进行定义，以确保与效用最大化的一致性。

**2.1. 不确定选择**
总结概率思想最明显的应用场景是当数据无法明确指示选择时。这种情况可能出现在多种情境中。例如，在Andersson等人（2024）的研究中，长途旅行的选择方式可能是汽车、公交车、火车或飞机。然而，部分数据来自手机记录，无法区分汽车和公交车，因为两者都使用公路。因此，对于这部分数据，公路旅行者的选择概率只能表示为汽车和公交车选择概率之和。如果使用总结概率思想进行建模，将会更加灵活。

**2.2. 交叉嵌套logit**
首先，本文表明，一个不一定是logit形式的交叉嵌套模型可以通过树嵌套模型中的概率之和来复现。
一个两级交叉嵌套选择模型将选择替代方案a的概率表示为：
$$
p_a^* = \sum_{b \in A} p_b p_a^* | b
$$
这里a可以是多个嵌套b的成员，体现了模型的交叉嵌套特性。在交叉嵌套模型中存在多个祖先集合，因此对于替代方案a，从a到根节点r的路径集合$Q(a) = \{ q_{ab} | p_a | b > 0 \}$可能包含多个成员，每个嵌套对应一个成员。
模型（4）可以通过树嵌套选择模型中的概率之和来精确重现。在树模型中，所有替代方案a都属于集合Q(a)。因此，树嵌套模型比交叉嵌套模型具有更多的替代方案。定义$t(q_a) = b$后，我们可以计算每个q的概率为：
$$
p_{q_a}^* = p_b p_a | b
$$
即树嵌套模型（2）的公式。选择交叉嵌套替代方案a的概率就是$p_{q_a}^*$之和：
$$
p_a^* = \sum_{q \in Q(a)} p_t(q)^* p_q | t(q)
$$
这正是所需的总结概率模型（1）。

上述推理显然也可以应用于logit模型，使用方程（3），通过树logit概率之和来表示交叉嵌套logit（CNL）。然而，一个复杂之处在于需要引入“分配参数”，这是CNL的常见特征。

**2.2.1. 分配参数**
在标准的CNL表述（例如Vovsha, 1997）中，存在分配参数，用于指示替代方案对其所属嵌套的贡献程度。分配参数同时影响条件概率和嵌套替代方案的复合效用：
$$
\begin{align*}
U_b &= \lambda \log \left( \sum_{a, b} \alpha_{ab} p_a p_b \right) \\
p_a^* | b &= \alpha_{ab} \exp \left( \frac{U_a}{\lambda_b} \right) / \exp \left( \frac{U_b}{\lambda_b} \right)
\end{align*}
$$
分配参数$\alpha > 0$是一个复杂因素，因为它们在公式中被指数化，并且需要通过a和b进行索引，同时还需要一个可能较为繁琐的归一化步骤。然而，在将CNL重新表述为总结概率树logit模型时，任何替代方案q的直接祖先都是唯一的，因此可以去掉分配参数的第二个索引。然后我们可以设置$\delta_q = \log \alpha_{ab}$，并重新表述方程：
$$
\begin{align*}
U_b &= \lambda \log \left( \sum_t(q) = b \exp \left( \delta_q + U_q \right) / \lambda_b \right) \\
p_q^* | b &= \exp \left( \frac{\delta_q + U_q}{\lambda_b} \right) / \exp \left( \frac{U_b}{\lambda_b} \right)
\end{align*}
$$
此时显然可以将$\delta_q$直接纳入$U_q$中，并作为一个普通线性系数进行估计。
尽管如此，仍需要对分配参数进行归一化。在标准表述中，通常要求$\sum_b \alpha_{ab} = 1$，或者$\sum_b \alpha_{ab} = 1 / \lambda_b$。注意到设置$\delta_q = \log \alpha_{ab} + K$（K为任意值）不会影响概率，因此可以通过设置$K = -\log \alpha_{db}$（即$\delta_d = 0$，其中d为任意常数）来实现适当的归一化，类似于在标准logit模型中将特定于替代方案的常数设为零。根据模型结构的不同，可能还需要进一步进行此类归一化。

**2.2.2. 多层次**
迄今为止的讨论都是关于两级模型，即模型结构由替代方案及其直接祖先嵌套组成，没有其他组件；这是文献中通常遇到的CNL概念。然而，很容易看出方程（9）、（10）可以扩展到任意所需的数量层次。Daly和Bierlaire（2006）讨论了这种可能性，并展示了其与效用最大化的一致性，同时提到了使用总结概率树logit模拟该模型的可能性；而使用t函数的具有多层次的树logit模型则由Daly（1987）提出。

**2.2.3. 规模变量的处理**
在空间选择模型（如住宅或企业选址、目的地选择）中，位置替代方案通常用区域来表示。每个区域包含多个基本替代方案，因此每个区域的选择概率取决于这些基本方案的数量，即区域的“规模”。在空间选择模型中，基本替代方案可以表示为房屋、办公室、就业岗位数量、休闲区域、购物空间等，这些替代方案的数量衡量了区域的规模。替代方案a的规模Sa可以通过在效用函数中包含项$\phi \log Sa$来方便表示（Daly, 1982; Kristoffersson et al., 2018）。参数$\phi$起着特殊作用，可以解释为对规模变量的吸引力弹性。通常$\phi$被限制在1以内，以确保规模增加10%导致吸引力增加10%，尽管可以根据数据估计该参数的具体值。

在树logit模型中，需要在应用规模变量的层次将它们包含在模型中（例如在做出目的地选择的层次）。然而，在CNL中，由于目的地选择取决于嵌套或基本替代方案的不同层次，这一点并不简单。但在总结概率模型中，包含规模变量的层次是明确的，问题可以解决。

**2.3. 潜在类别**
典型的潜在类别模型将选择的概率表示为类别成员概率与该类别选择概率的乘积之和：
$$
p_a^* = \sum_k p_k p_a^* | k
$$
其中索引k遍历所有未观察到的类别（即潜在类别）。如果类别成员模型$p_k^*$和给定类别成员的选择模型$p_a^* | k$都是logit或嵌套logit形式（甚至是CNL），则可以应用本文中的公式。在这种背景下，潜在类别模型的关键特征是选择模型与类别成员模型之间没有效用联系。然而，除非数据集非常大，否则这些具有扩展结构的模型的实用性尚不确定。

**3. 详细估计规范**
在方程（3）中，替代方案a的吸引力$U_a$可以定义来表示消费者的效用，并确保模型以适当的方式连接起来。例如，可以使用更详细的缩放方法：
$$
U_a = 1 - \lambda_t(a) V_a + \lambda_a \log \left( \sum_t(b) = a \exp(U_b) \lambda_a \right) + \phi \log S_a
$$
在方程（A3）中，各项的含义如下：
- $V_a$是从替代方案a获得的代表性（间接）效用；
- “logsum”项表示所有以a为祖先的替代方案的效用，确保整个模型与效用最大化一致；
- $S_a$是替代方案a的规模；
- $\lambda$表示模型在每个层次上的敏感性；$0 < \lambda_a \leq \lambda_t(a) \leq 1$，当$r$是根节点时$\lambda_r = 1$，这是模型的必要归一化。

$2\lambda$是需要估计的参数，V中还可以添加其他参数。参数$\phi$在2.2.3节中有特别的作用。请注意，吸引力中的“大小”因素并不会被除以 λt(a)，这是确保对大小具有适当弹性的关键。这三个因素中的任何一个或全部都可以被省略：方程（11）中的第一个因素通常只出现在简单的选项中，而第二个因素只出现在复合选项中。大小因素在一组祖先 A(q) 中只能出现一次，并且必须出现在大小起作用的那个层面上，正如第 2.2.3 节所解释的那样。方程（3）可以针对模型的参数进行两次求导，使用第二和第三个下标来表示求导过程：

(12) $l_{ai} = U_{ai} - UB(a)i$
(13) $l_{aij} = U_{aij} - UB(a)ij - \sum_{b \in B(a)} p_{b}U_{bi}U_{bj} + UB(a)iUB(a)j$

符号 $UB(a)x$ 是 $ \sum_{t(b)} = t(a)p_{b}U_{bx} $ 的简写，其中 x 表示对一个或两个参数的求导。

模型估计可以通过最大化观测值的对数似然来执行。那么，单个观测值对选择 c 的对数似然的贡献可以使用方程（1）来表示：

(14) $l_{c}^{*} = \log p_{c}^{*} = \log \sum_{q \in Q(c)} p_{q}^{*}$

因此，一组选择的对数似然就是各个单独选择的对数似然的总和。方程（14）可以进行两次求导，得到：

(15) $l_{ci}^{*} = \frac{1}{p_{c}^{*}} \sum_{q \in Q(c)} p_{q}^{*}l_{qi}^{*}$
(16) $l_{cij}^{*} = \frac{1}{p_{c}^{*}} \sum_{q \in Q(c)} \left(p_{q}^{*}l_{qij}^{*} + p_{q}^{*}l_{qi}^{*}l_{qj}^{*} \right) - l_{ci}^{*}l_{cj}^{*}$

方程（16）中的最后一项可以被认为是信息矩阵（有时称为 BHHH 矩阵）中的一个单元格，在对观测值求和时会出现。因此，用于优化和误差估计的导数可以很简单地从公式（2）中得出，这些公式给出了每个组成部分的边际选择概率 $p_{q}^{*}$ 以及对数条件概率 $l_{qi}$ 和 $l_{qij}$ 的导数，这些导数分别给出在方程（12）和（13）中。这些结果需要被代入方程（15）和（16）中。

联系信箱：

粤ICP备09063491号

热点排行