R语言实战临床预测模型 | 您所在的位置:网站首页 › 临床预测模型是什么 › R语言实战临床预测模型 |
14 lasso回归筛选变量
本文是对glmnet包的说明,主要参考官方文档:https://glmnet.stanford.edu/ glmnet包可以实现lasso回归、岭(ridge)回归、弹性网络(elastic-net),它非常强大,可以用于线性回归、逻辑回归和多项式回归模型、泊松回归、Cox模型、多响应高斯模型和分组多项式回归的Lasso或弹性网络正则化路径拟合,并且效率极高。 我们主要介绍它的lasso回归功能,主要是因为lasso可以把变量的系数变为0,达到筛选变量的目的。并且我们会以逻辑回归和COX回归的lasso为例进行演示。 在进行演示前,有一些基础知识需要大家提前了解。 对于一些回归模型来说,变量的系数可以说明变量的重要程度,所以如果某个变量的系数是0,那么说明这个变量不太重要。lasso回归就可以通过算法让其中一些不重要变量的系数变成0,达到筛选变量的目的。让系数变小,就是大家常说的对系数进行惩罚penalty,也被称为正则化regularization。具体实现方式大家可以自己去学习复杂的公式~ 正则化一般有2种,也就是L1正则化和L2正则化,又称为L1范数和L2范数。如果使用L1正则化,就是lasso回归,使用L2正则化就是岭回归。 在glmnet包中,lambda是总的正则化程度,该值越大惩罚力度越大,最终保留的变量越少,模型复杂度越低;alpha是L1正则化的比例,当alpha=1时,就是lasso,当alpha=0时,就是岭回归,当0 |
CopyRight 2018-2019 实验室设备网 版权所有 |