预测模型第7期 您所在的位置:网站首页 问卷筛选的五个原则 预测模型第7期

预测模型第7期

2023-05-12 03:50| 来源: 网络整理| 查看: 265

SPSS变量筛选方法

在SPSS中的Logistic回归和Cox回归分析时,软件一般给出了7种变量筛选的方法:

条件参数估计似然比检验(向前:条件); 最大偏似然估计的似然比检验(向前:LR); Wald卡方检验(向前:Wald); 条件参数估计似然比检验(向后:条件); 最大偏似然估计的似然比检验(向后:LR); Wald卡方检验(向后:Wald); Enter法(变量全部进入)。 文献报道

在文献报道中,作者一般会先对每个变量逐一进行单因素回归分析,P值小于0.1的纳入最终回归方程中(这里P值可以小于0.05或0.2,但一般情况下P值可以在0.05-0.2之间)。这种方法存有很大争议。

那么如何选择更好的方法进行变量筛选呢?

老实说,没有标准答案

变量筛选的基本原则

(1) 当样本量足够大,统计检验能力足够时,可以从我们前面提到的六种筛选方法中选择一种。

据此,我们介绍了一种可以帮助快速评估统计学效能的标准:每个变量至少要20个有效样本(事件)。例如,在Cox回归模型中,如果我们纳入10个与预后相关的变量,至少应该招募200名发生事件的患者来评估终点事件,如死亡(应该纳入200名发生死亡结局的患者,而不是总共200名患者)。因为那些没有端点事件的样本不能被认为是有效样本。

(2) 当样本量不符合第一个条件或因其他原因统计效能不足时,应采用大多数临床研究中普遍采用的方法。即可以先对每个变量逐个进行单因素回归分析,P值小于0.2的变量将纳入最终回归方程中。但是这种方法在广泛应用的过程中也颇具争议性。

(3) 即使是第二种方法,在执行过程中也可能会受到挑战。有时,我们发现一些与预后密切相关的变量可能会被排除在已建立的筛选标准外,例如,在一项前列腺癌预后研究中,作者发现在单因素回归模型中Gleason评分与预后没有显著相关性,而Gleason评分在以前的研究中是前列腺癌预后的确认因素。

那么我们现在该怎么办呢?

我们认为,应该将那些与预后显著相关的,但在统计筛选中,不符合标准的变量也纳入最终模型中,这么做是从临床专业的角度进行考虑。综上,笔者推荐第三种变量筛选的方法,统筹考虑统计学上的单因素分析结果与临床专业知识决定纳入最终回归模型中的变量。单因素分析结果和临床因素,样本量和统计效能应综合考虑。

变量筛选的五个考虑因素 临床专业知识。这一点应该是变量筛选最基础的考量,根据目前临床专业知识,已知的确定与结局发生有关的变量应该纳入回归模型,而不去过多考虑其统计学意义。如前文所述例子:Gleason评分与前列腺癌预后显著相关,这是我们的共识,那么对于评价前列腺癌预后影响因素的分析,像Gleason评分这样的变量应该参与建模,而无需去考虑其统计学参数是否有统计学意义。 根据单因素分析结果筛选变量,单因素分析P值“显著”的变量放入多元回归方程。所谓P值“显著”一般设为P


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有