机器学习之Lasso回归 | 您所在的位置:网站首页 › 腰椎侧弯恢复 › 机器学习之Lasso回归 |
生存模型: • Cox单因素分析 (前面一篇文章讲生存分析的时候讲了) • Lasso回归 (本篇文章) • Cox多因素分析 • 随机森林 • 支持向量机 1、lasso回归:从一堆的基因中找到几个关键的用来建模或者预测输入数据:表达矩阵(exprSet)和病人对应的生死(meta$event) image.png 病人的ID判断一下是否相等:这一步是至关重要的,如果样本和病人ID顺序不对,后面都是错的 image.png > identical(stringr::str_sub(colnames(exprSet),1,12),meta$ID) [1] TRUE image.png image.png这个包我没有下载成功。。。。不知道原因是什么,然后我一直搜索。。。 我觉得如果不是网络问题,肯定就是镜像问题,不知道清华镜像最近咋了 然后我就换了厉害无比的阿里云镜像: 划重点!!!!😄 options("repos" = c(CRAN="https://mirrors.aliyun.com/CRAN/"))结果一顿操作猛如虎就成功了。本来都打算放弃了。。。 image.png 下面正式开始:这里是举例子,所以只计算了10个λ值,解释一下输出结果三列的意思。 - Df 是自由度 - 列%Dev代表了由模型解释的残差的比例,对于线性模型来说就是模型拟合的 R^2(R-squred)。它在0和1之间,越接近1说明模型的表现越好,如果是0,说明模型的预测结果还不如直接把因变量的均值作为预测值来的有效。 - Lambda 是构建模型的重要参数。 解释的残差百分比越高越好,但是构建模型使用的基因的数量也不能太多,需要取一个折中值。 image.png #### 2.1挑选合适的λ值 计算1000个,画图,筛选表现最好的λ值 cv_fit |
CopyRight 2018-2019 实验室设备网 版权所有 |