R语言实战临床预测模型

2024-07-05 11:29| 来源: 网络整理| 查看: 265

14 lasso回归筛选变量

本文是对glmnet包的说明，主要参考官方文档：https://glmnet.stanford.edu/

glmnet包可以实现lasso回归、岭（ridge）回归、弹性网络（elastic-net），它非常强大，可以用于线性回归、逻辑回归和多项式回归模型、泊松回归、Cox模型、多响应高斯模型和分组多项式回归的Lasso或弹性网络正则化路径拟合，并且效率极高。

我们主要介绍它的lasso回归功能，主要是因为lasso可以把变量的系数变为0，达到筛选变量的目的。并且我们会以逻辑回归和COX回归的lasso为例进行演示。

在进行演示前，有一些基础知识需要大家提前了解。

对于一些回归模型来说，变量的系数可以说明变量的重要程度，所以如果某个变量的系数是0，那么说明这个变量不太重要。lasso回归就可以通过算法让其中一些不重要变量的系数变成0，达到筛选变量的目的。让系数变小，就是大家常说的对系数进行惩罚penalty，也被称为正则化regularization。具体实现方式大家可以自己去学习复杂的公式~

正则化一般有2种，也就是L1正则化和L2正则化，又称为L1范数和L2范数。如果使用L1正则化，就是lasso回归，使用L2正则化就是岭回归。

在glmnet包中，lambda是总的正则化程度，该值越大惩罚力度越大，最终保留的变量越少，模型复杂度越低；alpha是L1正则化的比例，当alpha=1时，就是lasso，当alpha=0时，就是岭回归，当0

【本文地址】

公司简介

联系我们