你只会“先单后多”吗? 如何筛选自变量建立多因素回归模型 您所在的位置:网站首页 cox回归模型可引入哪些类型的自变量 你只会“先单后多”吗? 如何筛选自变量建立多因素回归模型

你只会“先单后多”吗? 如何筛选自变量建立多因素回归模型

2023-04-24 19:58| 来源: 网络整理| 查看: 265

《欧洲流行病学》杂志把筛选自变量的方法分为两类,一类是理论驱动方法,另外一类是数据驱动方法,先单因素再多因素或者逐步回归法是数据驱动的一类方法,但不是其中的最主流的方法。

具体来说,现在常见的筛选自变量方法有四种:

“Among those, 146 studies (50%) reported using prior knowledge orcausal graphs for selecting variables, 34 (12%) used change in effect estimate methods, 26 (9%) used stepwise approaches, 16 (5%) employed univariate analyses, 5 (2%) used various other methods and 107 (37%) did not provide sufficient details to allow classification (more than one method could be employed in a single article)”

1)首选方法,是因果关系网络方法,更多的写法是有向无环图(Directed Acyclic Graph,DAG)方法,也就是理论驱动的方法。根据变量与变量的因果关系筛选进入回归模型的自变量。如果理论上不存在因果关系? 别进来!

2)其次是,效应改变法原理,这才是数据驱动的首选方法,自变量筛选中,根据自变量对研究结局影响是否足够大,来筛选自变量。比如当一个变量纳入回归模型后,对重要变量效应值的影响不到10%,那么就认为是多余,删掉!

3)排在第三的是逐步回归法,逐步回归可以处理多重共线性,也是不错的。

4) 第四才是先单因素后多因素的方法。

我们学习回归建模时,往往很多人建议,第三、第四结合起来一起使用吧?其实是没有必要的,这是因为逐步回归法就隐含着先单单因素后多因素的思想,其次,先单后多的方法,已经淘汰了大部分无效的变量,而在此技术上开展逐步回归法,可能伤害了更多具有价值的变量。所以,必须谨慎使用逐步回归法。

三、我的建议:“严进严纳”

综合四大自变量筛选的方法,我认为可以采用"严进严纳" 的理念进行自变量筛选。

严进严纳的方法基本理念是,即在纳入自变量的时候需要严格纳入,在排除自变量的时候,没有多大意义的别放在最终模型中来。其中严进采用理论驱动法,严纳采用数据驱动法。

在严进严纳的基础上,回归分析必须根据研究目的选择合适的自变量的筛选方法。

回归分析主要有哪些研究目的呢?三个:

探讨影响因素

控制偏倚

预测与分类

(1)在探讨影响因素时,首先(1)推荐基于DAG的方法,可筛选合适的自变量,同时建立多个回归分析模型,来研究影响因素;或者(2)可以直接采用先单后多的方法开展分析,若存在着较为严重的共线性,可结合逐步回归方法。

(2)在分析暴露因素与结局关系、需要控制混杂时,推荐采用DAG+效应改变法,可以考虑采用DAG+先单后多的方法;不建议采用逐步回归的方法进行,以免在回归分析删去暴露因素(哪怕没有统计学意义,暴露因素也必须呆在回归分析模型中)。

(3)在开展预测与分类时,则重点考虑逐步回归方法。

总的来说,回归建模推荐的自变量筛选思路是在DAG模型指导下开展“严进严纳”分析,除了预测与分类,不太推荐逐步回归法开展分析。

本文毕,下一篇将介绍最难理解的DAG的方法。

系列撰写者:郑卫军,浙江中医药大学医学统计学教研室主任。这里不妨广而告之,如果您有一个临床试验项目,正处于设计阶段,并且已经或者将要过医院伦理委员会审核,不妨联系郑老师统计团队,我们可以帮助您更好的改善临床试验。

返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有