二分类Logistic回归:SPSS详细操作及模型预测 您所在的位置:网站首页 spss学生化残差图 二分类Logistic回归:SPSS详细操作及模型预测

二分类Logistic回归:SPSS详细操作及模型预测

2023-04-04 12:23| 来源: 网络整理| 查看: 265

0 分享至

用微信扫码二维码

分享至好友和朋友圈

2016年12月23日,公众号推送了“SPSS实例教程:二分类Logistic回归”:在一项成组设计的病例对照研究中,探讨调整其他变量(性别、年龄、BMI、COPD病史)后,吸烟与肺癌发生之间的关系。

今天,我们推送一篇更为详细的二分类Logistic回归教程,本次的研究目的和上面那篇有所不同,有何不同呢,我们详细来看。

一、问题与数据

研究者想根据年龄、体重、性别和最大摄氧量(VO2max,一项身体健康指标)预测是否患心脏病。为此,研究者招募100名研究对象完成最大摄氧量试验,登记年龄、体重和性别,并评估研究对象目前是否患有心脏病。然后利用Logistic模型判断年龄(age)、体重(weight)、性别(gender)和最大摄氧量(VO2max)能否预测心脏病患病(heart_disease)情况。

部分数据如下图,变量caseno为每个研究对象的唯一编码。

二、对问题的分析

使用Logistic模型前,研究者需判断是否满足以下七个研究假设:

假设1:因变量即结局是二分类变量。

假设2:有至少1个自变量,自变量可以是连续变量,也可以是分类变量。

假设3:每条观测间相互独立。分类变量(包括因变量和自变量)的分类必须全面且每一个分类间互斥。

假设4:最小样本量要求为自变量数目的15倍,也有一些研究者认为样本量应达到自变量数目的50倍

假设5:连续的自变量与因变量的logit转换值之间存在线性关系。

假设6:自变量间不存在共线性。

假设7:没有明显的离群点、杠杆点和强影响点。

三、对假设的判断

假设1-4:取决于研究设计和数据类型,如果不满足则需要更换统计方法。

后3个假设则依赖于二分类Logistic回归是否适用于数据。

假设5: 连续的自变量与因变量的对数间存在线性关系。

在本例中,要求连续的自变量即年龄(age)、体重(weight)、最大摄氧量(VO2max)与因变量即心脏病的logit转换值之间存在线性关系。可以通过多种方法检验该线性关系,例如,用logitP和自变量画散点图,看是否存在线性关系;也可以通过Box-Tidwell方法,即将连续自变量与它们的自然对数值的交互作用项纳入回归方程中。

本文通过Box-Tidwell方法,发现所有连续自变量与因变量logit转换值之间存在线性关系。因为Box-Tidwell方法太过复杂,这里就不再详细介绍,有想详细了解的,可以和小咖(微信:xys2016ykf)联系,小咖把详细步骤发给你~。

如果一个及以上连续自变量与因变量的logit转换值间不存在线性关系,可以对其进行数据转换以满足线性假设,需注意以下几点:

1) 数据转换针对原始的连续自变量,如年龄(age)。

2) 只需转换不满足线性假设的连续自变量,不需要转换满足假设的连续变量和不需要线性假设的分类自变量。

3) 如果可以进行数据转换,需要重新检验是否存在线性关系。

如果采用以上方法仍不满足线性假设,则需要将该变量转换为有序分类变量。

假设6:自变量间不存在共线性。

假设7:没有明显的离群点、杠杆点和强影响点。

1. 该假设的SPSS操作可见后面第四大部分的操作,此处仅展示如何解读结果。结果中Casewise List表格显示学生化残差大于±2倍标准差的观测。学生化残差大于2.5倍标准差的观测,需要研究者进一步观察决定这些观测是否是离群点,如有必要甚至可以从分析中剔除这些观测。Casewise Diagnostics表格中展示这些信息,如下图:

注意1:如果所有观测的学生化残差小于±2倍标准差,SPSS不会输出上表。如果已经剔除离群点,则第一次分析得到的Casewise Diagnostics表格不会再显示。

注意2:可以通过各种残差如标准化残差、学生化残差或者学生化删除残差来检查离群点。在SPSS操作中勾选Casewise diagnostics选项时,SPSS默认使用学生化残差。

本例中,第70个观测(Case Number)的学生化残差为3.349,符合上述判断离群点的标准,如下图中红框显示:

注意:观测数(Case Number)指SPSS系统内自动编码(Data View窗口中最左侧蓝色一列中的编码),而非研究者赋值的编码。

研究者需要查看该观测为离群点的原因,决定是否删除该观测并报告。本例中则报告“纳入分析的观测中有一项观测学生化残差为3.349”。

根据SPSS分析结果,有两种情况:①如果没有离群点,则直接进入第五部分结果解读;②如果有离群点,研究者决定是否剔除这些观测或者对数据进行转换。如果剔除离群点,则需要对剔除后的数据重新进行回归分析。如果进行数据转换,则需要从线性假设重新开始分析。

四、SPSS操作

1. 在主菜单中点击Analyze > Regression > Binary Logistic…,如下图:

点击后出现Logistic Regression对话框,如下图:

2. 将因变量heart_disease选入Dependent框中,自变量age、weight、gender和VO2max选入Covariates框中,如下图:

注意:标准的Logistic回归过程中,应忽略Previous和Next键(用于有序Logistic回归)。Methods选项选择默认值,即“Enter”。如果目前未选择“Enter”,应修改为“Enter”。

3. 点击Categorical键,可显示Logistic Regression:Define Categorical Variables对话框,如下图:

注意:SPSS要求定义所有分类自变量。

4. 将Covariates分类自变量性别(gender)选入Categorical Covariates框中,如下图:

5. 在–Change Contrast–区域,将Reference Category从Last改为First,点击Change键,如下图:

注意:选择Last或First取决于数据。本例中以女性为对照组(赋值为0)将男性与女性对比,故选择First。

6. 点击Continue键,回到Logistic Regression对话框,可见分类自变量性别(gender)显示为“gender(Cat)”,如下图:

注意:分类自变量后显示“(Cat)”说明已正确定义分类变量。本例中性别(gender)显示“gender(Cat)”,说明已被定义为分类变量。

7. 点击Options键,显示出Logistic Regression:Options对话框,如下图:

8. 在-Statistics and Plots-区域,选中Classification plots,Hosmer-Lemeshow goodness-of-fit,Casewise listing of residuals和CI for exp(B)这4个选项。在-Display-区域,选中At last step选项,如下图:

9. 点击Continue键,即可返回Logistic Regression对话框。

10. 点击OK键,即可分析生成结果。

五、结果解释

二分类Logistic回归分析的结果有两个目的:①观察自变量对因变量的影响是否有统计学意义;②观察二分类Logistic回归模型预测因变量的效果。这两个目的可以通过下面的各部分结果反映。

1. Data coding(数据编码):检查变量和数据,包括以下3步。

(1) 检查是否存在缺失观测,纳入分析的观测数是否符合数据库中观测数一致。Case Processing Summary表格如下图:

(2) 确认因变量的编码是否正确。Dependent Variable Encoding表格如下图:

(3) 观察各个分类自变量是否存在某一类观测数过少的情况,此时不利于二分类Logistic回归分析。Categorical Variables Codings表格如下图:

2. Baseline analysis(基本分析):此部分结果的标题为“Block 0:Beginning Block”,为所有自变量不纳入模型、只包括常数项时的结果,可以与纳入所有自变量的模型的结果相比。

(1) Classification Table表格展示,没有任何自变量危险因素时,最好的情况是所有研究对象没有心脏病。如果做这个假设,只能将65%的研究对象正确分至没有心脏病一类(Overall Percentage一行)。

(2) Variables in the Equation表格展示只有常数项纳入模型的结果。

(3) Variables not in the Equation表格展示没纳入模型的自变量。

3. Binomial logistic regression results(二分类Logistic回归结果)

(1) 模型拟合:Omnibus Tests of Model Coefficients展示该模型的统计学意义(与不纳入任何自变量的模型相比),如下图:

二分类Logistic回归中需观察Model一行。从上表中可观察到模型有统计学意义(P /阅读下一篇/ 返回网易首页 下载网易新闻客户端



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有