SPSS(八)logistic回归(图文+数据集) 您所在的位置:网站首页 spss中ab啥意思 SPSS(八)logistic回归(图文+数据集)

SPSS(八)logistic回归(图文+数据集)

#SPSS(八)logistic回归(图文+数据集)| 来源: 网络整理| 查看: 265

SPSS(八)logistic回归

我们之前的线性回归也好、线性回归衍生方法也好、非线性回归也好,因变量的类型都是连续性的,假如因变量的类型是分类的呢?logistic回归针对的是二分类的因变量

logistic回归 基于线性回归模型发展而来

线性回归研究的是连续性因变量与自变量之间的关系

有的时候因变量为分类变量,需要研究该分类变量与一组自变量之间的关系

以治疗效果为因变量,结局为治愈/未治愈

如果使用新的宣传方式,决定戒烟的概率是否更高?

 

模型简介

平常的线性回归方程表达式如下

假如我们也是用这种来预测发生概率,则其表达式为

但是在现实情况中,发生率P为因变量,它与自变量之间通常不存在线性关系(一般是两边不敏感,中间敏感,比如收入与轿车拥有率),而且上面表达式不能保证在自变量的各种组合下,因变量的取值仍限制在0~1内,所以数学家们为了解决遇到的这两个问题,将想方设法想找到一种变量变换,能让上式的发生率限制在0~1内,而且两边不敏感,中间敏感,到最后找到了一种变换,将上式的因变量进行如下转换,就能解决我们遇到的问题

所以上面的表达式可以写成

α是常数项,表示自变量取值全为0时,比数(Y=1与Y=0的概率之比)的自然对数值

Beta为logistic回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起比数比(OR)自然对数值的变化量,当概率比较低时候,可以理解概率会上升为原来的几倍

为什么可以直接挂等号呢?当p取0时,趋于负无穷,p取1/2时为0,p取1时趋于正无穷,等式两边值域取值相等

当是上面这个公式和我们平常做回归有什么区别呢?

由于因变量为二分类,所以误差项服从二项分布,而不是正态分布,因此,常用的最小二乘法也不再适用,要用迭代方法估计

 

模型用途

 

案例:低出生体重儿影响因素

 Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素

影响因素分析,求出哪些自变量对因变量发生概率有影响。并计算各自变量对因变量的比数比作为判别分析方法,来估计各种自变量组合条件下因变量各类别的发生概率,从而对结局进行预测。该模型在结果上等价于判别分析

结果变量为是否娩出低出生体重儿(变量名为LOW,1,低出生体重,即婴儿出生体重



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有