一文讲全空间计量模型:SEM/SLM/SDM/其他变体以及相关LM/LR/Wald/Hausman检验(原创) |
您所在的位置:网站首页 › 面板数据滞后两阶什么意思呀 › 一文讲全空间计量模型:SEM/SLM/SDM/其他变体以及相关LM/LR/Wald/Hausman检验(原创) |
空间计量经济学模型是一个研究空间数据的强大分析工具。但是学习起来,可能会遇到SEM(空间误差模型)、SLM(空间滞后模型)、SDM(空间杜宾模型)还有它们的一大堆变体。 关于这三个主流模型的科普资料还相对丰富,但是深入到到空间杜宾误差模型、空间自回归组合模型、空间滞后的解释变量模型、广义嵌套空间模型,再加上为什么SLM空间滞后模型又叫SAR空间自回归模型,辨析起来一会就头晕了。 以及用于指导模型选择的各种检验——包括LM-lag、LM-error、Robust LM-lag、Robust LM-error、LR-lag、LR-error、Wald检验等,简直眼花缭乱。 如果想要分析固定效应或随机效应,又要学Hausman检验,并且还要确认自己的数据是面板数据而非横截面数据/时间序列数据。 这篇文章是我自己在学习中总结的一些心得,尝试对这些话题做一个个人全面笔记。如果有补充或指正欢迎在评论区交流。 母版模型这些常见的空间计量经济学模型都基于一个共同的母版,称为广义嵌套空间模型(Generalized Nested Spatial Model, GNSM)。 空间效应的判断在研究过程中,如果通过莫兰指数等方法发现研究对象具有空间效应,应选择空间计量模型而非传统的普通最小二乘回归模型(OLS)。 框架涵盖的模型包括SDM(空间杜宾模型)、SDEM(空间杜宾误差模型)、SAC(空间自回归组合模型)、SLM(空间滞后模型)、SEM(空间误差模型)、SLX(空间滞后的解释变量模型)、以及传统的OLS(普通最小二乘回归模型)。 一级退化模型: SDM(空间杜宾模型) SDEM(空间杜宾误差模型) SAC(空间自回归组合模型) 二级退化模型: SLM(空间滞后模型,也称SAR) SEM(空间误差模型) SLX(空间滞后的解释变量模型) 三级退化模型: OLS(普通最小二乘回归模型) 图源知乎,非常全面的一个模型关系解释摆公式是一个了解这些模型非常好用的方法,这一部分喜欢看公式的同学可以研究一下,不喜欢看的可以直接跳过,后面也有文字版的解释 1. 普通最小二乘回归模型(OLS)2. 空间滞后模型(SLM)/空间自回归模型(SAR)3. 空间误差模型(SEM)4. 空间杜宾模型(SDM)5. 空间杜宾误差模型(SDEM)6. 空间自回归组合模型(SAC)7. 空间滞后的解释变量模型(SLX)判断标准判断这些模型差别的标准只有三个: 因变量是否溢出 自变量是否溢出 残差是否空间自相关 模型特征比较原创表格,转载请授权LM检验LM和robust LM检验是在最简单的OLS回归模型基础上“进化”的检验,LM-error看残差是否空间自相关,LM-lag看因变量是否有空间溢出。 LM检验和其对应的Robust形式LM看a或者b是否存在,robustLM看在考虑a的情况下b是否仍然显著。 SDM是SEM和SLM的结合?SDM并不是SEM和SLM的结合,两者真正的结合体是SAC(有种抱错孩子的感觉)。一般说SDM是因为如果在考虑一个的情况下另一个仍然显著,则可以把解释变量的溢出也加上。(既然考虑了因变量溢出还是有残差空间自相关,那就把解释变量的空间溢出也算进来吧) 有没有SDM基础上考虑残差空间自相关的模型?由于SDM没有考虑残差空间自相关,想要解决问题只能采用更高级的空间计量模型。可以看更新的关于SARAR(Spatial Autoregressive Model with Autoregressive Errors)或者一些其他牛逼模型的论文。 LR检验刚才说LM检验是判断模型是否应该“进化”的检验,LR和wald检验是用来判断是否能够“退化”简化的检验。 LR检验(Likelihood Ratio Test)比较包含空间效应(如空间滞后或空间误差)的模型与不包含这些效应的模型之间的拟合优度,来决定是否需要空间组件。如果进化了的模型更优的结论是显著的,那就拒绝退化。 Wald检验Wald检验用来检验模型参数的统计显著性,用于评估特定模型约束(如参数等于零)是否成立。即在老祖宗广义嵌套空间模型的基础上,看那三个参数是否等于零。 除了这三大针对性检验,还有什么检验能判断使用哪个模型?除了这三个检验之外,还可以结合AIC(Akaike Information Criterion)等最小信息准则判断哪个模型更优。 一级退化的模型(SDM\SDEM\SAC)能否用LM检验结果区别?如果LM包括robust LM的error和lag都显著,实际上不能明确应该用SDM\SDEM\SAC中的哪个。没有一种统一的规则来直接指导在LM滞后和LM误差都显著时应选择SDM还是SDEM。这时候就要用赤池信息准则(AIC)或贝叶斯信息准则(BIC),并且考虑研究主题的理论背景和对空间过程的理解,选择最能符合理论预期和研究假设的模型。 SEM/SLM/SDM/SAC的关系到底是?回到最常用的SEM\SLM\SDM上来,可以说说SAR/SLM(空间自回归模型)和SEM(空间误差模型)是SAC(空间自回归组合模型)的特殊简化形式。SDM(空间杜宾模型)虽然不能直接简化成SEM,但是它比SLM\SEM都全面。 检验的理论部分讲完了,实际运用中如何判断SEM\SLM\SDM三大常见模型用哪个?判断SEM\SLM\SDM应该使用哪个时,有两种检验思路: 第一种思路:以SAC为基准模型进行LM检验。 SAC(空间自回归组合模型)同时考虑了空间滞后(SAR)和空间误差(SEM)的效应。将SAC作为基准模型意味着假设数据中可能同时存在空间滞后和空间误差自相关性。 LM检验(Lagrange Multiplier检验)用于检测模型中是否存在未被捕捉的空间自相关性。 LM-lag检验旨在检测数据中是否存在因变量的空间滞后效应,如果显著,则支持存在SAR效应。 LM-err检验则用于检测误差项中的空间自相关性,如果显著,则表明SEM模型更为适宜。 稳健形式的LM检验考虑了同时存在的其他空间依赖性,提供了更为稳健的检验结果。 第二种思路:以SDM为基准模型进行LR和Wald检验 SDM(空间杜宾模型)也是一种复合型空间计量模型,它考虑了解释变量及其空间滞后的影响,但不直接考虑误差项的空间自相关性。 LR(Likelihood Ratio)检验和Wald检验用于比较包含不同空间组件的模型的拟合优度或参数的显著性,亦称为SDM的“退化检验”。 LR-lag和Wald-lag检验专注于测试因变量的空间滞后效应(即SAR效应)在SDM模型中的显著性。如果这些检验不显著,可能表明SAR模型不是必需的。 LR-err和Wald-err检验则用于评估模型误差项空间自相关性(即SEM效应)的重要性。如果检验结果不显著,表明SEM效应可能不需要在SDM模型中被特别考虑。 补充:固定效应/随机效应Hausman检验用于判断这些模型用固定效应还是随机效应更为合适。固定效应又分为时间固定效应、个体固定效应、双固定效应。 Hausman检验是干嘛的?hausman用于处理未观测异质性,这些因素没有被模型直接观测到或包含进来,固定效应或随机效应通过控制不随时间变化/不随个体变化的异质性来提升模型估计准确性。 Hausman检验能对所有空间数据使用吗?hausman检验只能对面板数据(同时有时间和空间变化的数据)使用,横截面数据不可以。 它在sem/sdem/slm/sdm等模型之后都能用,因为前两者考虑到了由空间结构引起的误差相关性,但这并不直接解决未观测异质性问题,后两者则没有考虑由空间结构引起的误差相关性。 SDM在SAR和SEM的基础上都优化了,那是否就不该存在残差空间自相关了?使用SDM的基础上可能还会有残差的空间自相关,因为SDM没有将其考虑在内。这种自相关可能来源于模型未能捕捉的其他空间动态,或者未观测的异质性,即存在未观测的、具有空间结构的变量,这在影响因素驱动因子的回归分析中是很正常的,因为指标选不全。 横截面数据不能使用固定效应/随机效应怎么办?如果使用的是横截面数据(即每个地方只有一个时间的信息),那控制残差空间自相关的办法就不是固定效应/随机效应,考虑未观测异质性的方法只有尝试识别并包含更多的解释变量,尤其是所有重要的解释变量。 谢谢阅读!以上是我在学习过程中的个人总结,如有不对之处欢迎指出!转载请授权 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |