【零代码生信分析小工具】第3更,Lasso回归模型构建,生信必备,超级实用! | 您所在的位置:网站首页 › r语言lasso回归筛选变量代码 › 【零代码生信分析小工具】第3更,Lasso回归模型构建,生信必备,超级实用! |
【零代码生信分析小工具】三更喽~ ~ 模型构建是生信分析最常见、最常用的一个分析内容,基本覆盖80%以上的生信文章,但基本上都是用R包来完成的,新手小白上手比较困难。 不过,不用担心,小云已经想你所想啦,推荐刚入门的选手用一些零代码小工具来解决问题,可以让大家能更快的上手分析!(ps:感觉对自己有用的小伙伴麻烦点个关注哦,布小谷会多多更新的!) 再安利一下这个零代码小工具的分析网站——“云生信在线分析平台”,它包含200多个零代码分析小工具,只需上传数据,直接一键成图,超级适合生信小白使用哦。网址:http://www.biocloudservice.com/home.html ,分析平台开源、注册登录后可免费使用。 今天分享Lasso回归模型构建小工具(小云前面也推荐了2个免疫浸润分析小工具,感兴趣的小伙伴点击文末链接就可以观看啦!),下面跟着小云一起来看看吧! p LASSO回归模型构建小工具分析原理 LASSO 全称 Least absolute shrinkage and selection operator(最小绝对收缩和 选择算子),特点是在拟合广义线性模型的同时进行变量筛选和复杂度调整。 因此,不论目标因变量是连续的,还是二元或者多元离散的,都可以用 LASSO 回归建模然后预测,通过 LASSO Cox 回归模型获得的特征基因。因此本软件基于肿瘤样本的基因表达谱并结合患者生存信息,利用 LASSO 回归(最小绝对收缩和选择算子)算法,得到特征基因。用户只需要输入表达矩阵,软件将自行构造LASSO 回归模型以获取特征基因,同时绘制 LASSO 回归模型图。 p 操作方法 n Step 1 :首先打开云生信在线分析平台,并登录使用。点击“自动化绘制套索算法回归模型图”进入小工具页面: n Step 2:进入小工具页面后,可以看到上传数据选项,点击进入后,提示上传数据需要“文件名和文件格式需要和示例数据一致”。回到工具页面可以根据左上角输入数据模板制作数据。 n Step 3:点击“输入数据模板”,进入以下页面,可以看到给出了1个数据模板,点击数据可以在线预览和下载。 输入数据:表达矩阵 txt 文件lasso_data.txt (包括每个患者的生存状态(0=存活,1=死亡)和生存时间,以及每个患者样本中的基因表达。第一列是生存状态,第二列是生存时间,其他列是基因,每一例患者样本作为行) n Step 4:制作好数据后,在文件上传界面上传所有输入数据,点击上传文件。再返回到工具主页面点击“运行自有数据”即可跳转到结果展示页面。 n Step 5:LASSO 回归模型构建工具共得到4个结果,包括3图1表,每个结果都附带简单说明。可以在结果展示页面直接点击某个图进入预览页面,也可以直接下载使用。 p 结果说明 n LASSO lambda图:图中的每一条曲线代表了每一个自变量系数的变化轨迹,纵坐标是系数的值,横坐标是log(λ)。 LASSO norm图:图中的每一条曲线代表了每一个自变量系数的变化轨迹,纵坐标是系数的值,横坐标是 L1 norm。 n LASSO 系数谱 (lambda.pdf):基于该图选择最佳的λ,两条虚线分别指示了两个特殊的λ值: lambda.min和 lambda.1se 这两个值之间的 lambda 都认为是合适的。lambda.1se 构建的模型最简单,即使用的基因数量少,而 lambda.min 则准确率更高一点,使用的基因数量更多一点,默认选择 lambda.min。 n 特征基因表(lasso_gene.txt):通过 LASSO 系数谱,λ 使用的是 lambda.min 时筛选得到的特征基因,及基因对应的相关系数。 p 结语 LASSO 这种方法是在最小二乘基础上增加了一个惩罚项来对估计参数进行压缩,当参数缩小到小于一个阈值的时候,就令它变为 0,从而选择出对因变量影响较大的自变量并计算出相应的回归系数,最终能得到一个比较精简的模型。lasso 回归简单来说就是从一堆的基因中找到几个关键的用来建模或者预测。本软件通过基于肿瘤样本的表达谱及生存信息,利用 lasso 回归模型的算法来筛选特征基因。设置参数少,用户只需要输入表达矩阵,软件将自行计算出 lasso 模型中的特征基因,同时绘制 lasso 回归模型图。非常适用于生信新手朋友,感兴趣的小伙伴赶快来尝试一波吧!后面还有更多小工具推荐,敬请期待哦! |
CopyRight 2018-2019 实验室设备网 版权所有 |