logit回归模型 您所在的位置:网站首页 伽马函数积分怎么算 logit回归模型

logit回归模型

#logit回归模型| 来源: 网络整理| 查看: 265

前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型。

本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇。

温馨提示:阅读本文之前,请准备好纸、笔、以及小板凳。自己动手推导一遍有助于理解。

Probit模型的建模过程回顾

在《效用最大化准则:离散选择模型的核心(Probit篇)——离散选择模型之七》一文中,我们基于效用最大化理论给出了二项Probit模型的推导过程。简单回顾一下建模的过程:

假设对于决策主体n面临两个备选方案i和j方案i的效用 可以表示为可以观测得到的、确定性的部分 和一个随机项 之和:

(1) 类似地,方案j的效用 可以表示为:

(2) 对于决策主体 n 而言,若方案 i 的效用 高于方案 j 的效用 ,则 n 选取方案 i 。也就是说,n 选择方案 i 的概率 等价于事件 发生的概率:

(3) 如果令 和 服从均值为0、方差为 和 的正态分布,则 服从均值为0、方差为 的正态分布。在此基础上,便可以推导出Probit模型的表达形式如下面的(4)式所示。其中, 表示标准正态分布的累积分布函数。

(4) Probit模型的特点

从建模的角度来说,Probit模型假设随机项

和 服从正态分布,这具有一定的合理的——也是其优点; 但是Probit模型没有闭合解——每次算 的值的时候都需要求积分,这就给实际应用造成了一定的不便。

为解决这一问题,研究者提出,若假设随机项

和 服从Gumbel分布(而非上面提到的正态分布),就可以得到一个性质和Probit模型类型、但解析更为方便的模型——这就是二项Logit模型。

Fig.1. 标准正态分布的累积分布函数 Gumbel分布

Gumbel分布是一种极值型分布,常被用于极端事件的估计和预测。比如某水文站,每天观测某条河道的水位,连续观测了50年;如果单独对河道每年的最高水位进行建模,就可以考虑用Gumbel分布。除此之位,Gumbel分布还被应用于地震、洪水等极端自然灾害现象的预测。

记参数为的

、 的Gumbel分布为 ,其概率密度函数(PDF)可以表示为:

(5)

下图2显示了当参数

和 取不同的值时, 所对应的概率密度函数的图形。从图中可以看出, 是位置系数(Gumbel分布的众数是 ), 是尺度系数——与Gumbel分布的离散性有关(Gumbel分布的方差是 )。

Fig.2. Gumbel分布

、 时所对应的Gumbel分布称之为标准Gumbel分布; 的概率分布为:

(6)

其所对应的累积分布函数(CDF)为:

(7)

从图3中可以看出:标准Gumbel分布与标准正态分布的形状大体上接近,但Gumbel分布不是对称的,其分布呈现一定的偏态。另外,Gumbel分布尾巴要比标准正态分布更肥一点。

Fig.3. 标准Gumbel分布和标准正态分布 Logistic分布

在推导二项Logit模型的表达式之前,再介绍另外一个分布:Logistic分布。

随机变量

服从Logistic分布是指 具有下列分布函数和密度函数:

(8)

(9)

其中,

为位置参数, 为形状参数。为方便起见,我们将参数为 、 的Logistic分布记为 。

下图4给出了参数

和 取不同的值时所对应的Logistic分布的概率密度函数(PDF)。从图中可以看出,曲线在 附近增长速度比较快,两端增长速度比较慢。形状参数 的值越小,曲线在 附近增长得越快。当 、 时,称为标准Logistic分布;其所对应的分布函数和密度函数分别为:

(10)

(11)

Fig.4. Logistic分布 Logit模型的推导

先给出一条重要性质:如果随机变量

均服从Gumbel分布,且 之间相互独立,则 服从Logistic分布。 亦即,若: 、 之间相互独立

则:

详细的证明过程请参见《从Gumbel分布到Logistic分布——离散选择模型之九》。

根据上面的(3)式我们知道决策主体 n 选择方案 i 的概率

等价于:

在Logit模型中,我们就是假设随机效用部分

和 均服从Gumbel分布,且 、 之间相互独立。根据上面的性质, 便服从参数为0、1的Logistic分布。于是上面的式子可以进一步改写成:

(12)

分子分母同时乘以

可得:

(13)

式中

、 表示方案i、j的效用中的确定性的部分。前面提到过,效用的确定性部分可以表示成多个自变量的线性组合,即:

最终,在二项Logit模型中,决策者 n 选择方案 i 的概率可以表示为:

(14)

(14)式即为二项Logit模型的表达式。图5给出了仅有一个自变量时的二项Logit和二项Probit的图像:

Fig.5. 二项Logit和二项Probit模型对比

【本篇完】

专栏文章列表(动态更新中...)

离散选择模型基础:

离散选择模型(Discrete Choice Model)简介线性模型 vs. Logistic模型Logit究竟是个啥?Odds 和 Odds Ratio 的区别正确打开/解读Logit模型系数的方式Logit模型拟合实战案例(SAS)Logit模型拟合实战案例(Python)

二项Logit/Probit:

效用最大化准则:离散选择模型的核心(Probit模型上篇)效用最大化准则:离散选择模型的核心(Probit模型下篇)效用最大化准则:离散选择模型的核心(二项Logit模型)从Gumbel分布到Logistic分布

多项Logit(MNL):

效用最大化准则:多项Logit模型(Multinomial Logit, MNL)多项Logit模型(MNL)拟合实战案例(SAS篇)MNL的IIA特性与“红公交/蓝公交悖论”(上篇)MNL的IIA特性与“红公交/蓝公交悖论”(下篇)如何将决策者的属性和方案属性同时放到MNL模型中?Logit模型中的个人属性、方案属性数据处理案例为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你?Logit模型中的ASC(Alternative-Specific Constant)是指什么?

统计学相关:

最大似然估计(上)最大似然估计(下)模型中存在共线性问题,该怎么破?

关注【DCM笔记】公众号,私信作者获取相关文章中的 练习数据 和 代码:



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有