二分类Logistic回归【详】

您所在的位置:网站首页 回归定义法 二分类Logistic回归【详】

二分类Logistic回归【详】

2024-07-15 23:40:22| 来源: 网络整理| 查看: 265

一、问题与数据

某研究者想了解年龄、性别、BMI和总胆固醇(TC)预测患心脏病(CVD)的能力,招募了100例研究对象,记录了年龄(age)、性别(gender)、BMI,测量血中总胆固醇水平(TC),并评估研究对象目前是否患有心脏病(CVD)。部分数据如图1。

图1 部分数据

二、对问题分析

使用二分类Logistic模型前,需判断是否满足以下7项假设。

假设1:因变量(结局)是二分类变量。

假设2:有至少1个自变量,自变量可以是连续变量,也可以是分类变量。

假设3:每条观测间相互独立。分类变量(包括因变量和自变量)的分类必须全面且每一个分类间互斥。

假设4:最小样本量要求为自变量数目的15倍,但一些研究者认为样本量应达到自变量数目的50倍。

假设5:连续的自变量与因变量的logit转换值之间存在线性关系。

假设6:自变量之间无多重共线性。

假设7:没有明显的离群点、杠杆点和强影响点。

假设1-4取决于研究设计和数据类型,本研究数据满足假设1-4。那么应该如何检验假设5-7,并进行二分类Logistic回归呢?

三、SPSS操作3.1 检验假设5:连续的自变量与因变量的logit转换值之间存在线性关系

连续的自变量与因变量的logit转换值之间是否存在线性关系,可以通过多种方法检验。这里主要介绍Box-Tidwell方法,即将连续自变量与其自然对数值的交互项纳入回归方程。

本研究中,连续的自变量包括age、BMI、TC。使用Box-Tidwell方法时,需要先计算age、BMI、TC的自然对数值,并命名为ln_age、ln_BMI、ln_TC。

(1)计算连续自变量的自然对数值

以age为例,计算age的自然对数值ln_age的SPSS操作如下。在主界面点击 Transform→Compute Variable,出现Compute Variable对话框。在Target Variable框中输入即将生成自然对数值的变量名称(如输入ln_age表示age的自然对数值)。选择Function group菜单下的Arithmetic,选择Functions and special variables菜单下的Ln,双击Ln将该公式选入Numeric Expression框中,最后双击age将该变量选入“LN()”公式中。点击OK生成新变量ln_age(即age的自然对数值)。如图2。

图2 Compute Variable

此时新变量会同时出现在Variable View和Data View窗口中。在Data View窗口中,新生成的ln_age变量如图3。

图3 新生成ln_age变量

重复以上过程,将本研究中的所有连续自变量的自然对数值全部生成。在Data View中,新生成的ln_age,ln_BMI,ln_TC变量如图4。

图4 新生成ln_age、ln_BMI和ln_TC变量

(2)Box-Tidwell法

Box-Tidwell法检验连续的自变量与因变量的logit转换值之间是否存在线性关系的SPSS操作如下。在主界面中点击 Analyze→Regression→Binary Logistic。在Logistic Regression对话框中将变量CVD选入Dependent框中,将变量age、gender、BMI和TC选入Covariates框中。Methods选项选择默认值,即Enter。如果目前未选择Enter,应修改为Enter。如图5。

图5 Logistic Regression

点击Categorical,在Logistic Regression:Define Categorical Variables对话框中,将gender选入Categorical Covariates框中。在Change Contrast区域,将Reference Category从Last改为First后,点击Change→Continue。如图6。

图6 Categorical Variables

对于二分类变量(如本研究的gender),也可以不通过Categorical选项指定参照,SPSS将默认以赋值较低的变量为参照。

Categorical选项可将多分类变量(包括有序多分类和无序多分类)变换成哑变量,指定某一分类为参照。比如,某研究中COPD是多分类变量(分为无COPD病史、轻/中度、重度),如果指定“无COPD病史”的研究对象为参照组,可以分别比较“轻/中度”和“重度”组相对于参照组发生结局的风险。

Contrast右侧的下拉菜单中(该下拉菜单内的选项是几种与参照比较的方式),Indicator方式最常用,其比较方法为:第一类或最后一类为参照类,每一类与参照类比较)。在Reference Category的右侧选择First,表示本研究以女性(赋值为0)为对照组。

回到Logistic Regression对话框后,可见gender已显示为gender(Cat)。分类变量后显示“(Cat)”说明已正确定义分类变量。如图7。

图7 正确定义分类变量

设置好分类自变量后,开始生成交互项。以age和ln_age为例,同时选中age和ln_age(使用Ctrl键+鼠标点击),点击“>a*b>”键,将age* ln_age交互项选入Covariates框中。如图8。

图8 选入交互项

重复以上过程,将所有交互项都选入Covariates框中,点击OK。如图9。

图9 选入所有交互项

(3)假设5的检验结果

查看Variables in the Equation表格中,有交互作用的行及行内“Sig”值,本研究中为age by ln_age、BMI by ln_BMI和TC by ln_TC所在的行及行内“Sig”值。如图10。

图10 假设5的检验结果

如果交互作用有统计学意义(P



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭