手把手教学差异表达基因分析 您所在的位置:网站首页 下载找对象并安装 手把手教学差异表达基因分析

手把手教学差异表达基因分析

2023-08-26 04:13| 来源: 网络整理| 查看: 265

文章目录 引言安装并导入DESeq2包数据要求制作dds对象,进行差异分析筛选差异基因完整代码其他问题

引言

对于组学分析来说,常常会寻找组间的差异,例如差异基因(转录组)、差异菌(宏基因组)以及差异通路(宏基因组),而转录组分析上最为经典的DESeq2包对于以上分析也都适用 DESeq最早在2010年发表在Genome Biology上,2014年上更新版本DESeq2。DESeq2是基于负二项广义线性模型估算样本间基因差异表达概率,既适于有生物学重复的也适于没有生物学重复的样本,同时除了在转录组学,在宏基因组上使用DESeq2计算差异菌的也有报道 在这里插入图片描述

安装并导入DESeq2包

DESeq2包目前需要依赖BiocManager包,该包用于管理bioconductor项目中的所有包,因此首先安装该包

# 1.判断是否有BiocManager包,若不存在则安装 options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))) #设置清华镜像,加速下载 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") if (!requireNamespace("DESeq2", quietly = TRUE)) BiocManager::install('DESeq2') #通过BiocManager安装DESeq2 library(DESeq2) #加载library

由于DESeq2包较大,安装时间较长,当导入后没有任何报错即为安装成功

数据要求 1.基因表达矩阵 行为基因,列为样本,需要注意表达数据为原始reads count,DESeq2内部会根据样本大小对counts进行调整,自带标准化过程,不要使用标准化后的FPKM或TPM 在这里插入图片描述2.样本分组信息 样品信息,第一列是样品名称,第二列是样品的处理情况(对照还是处理等),即condition,condition的类型是一个factor,第三列可添加其他信息(可选)。需要自己根据临床/实验分组信息单独建立 在这里插入图片描述 制作dds对象,进行差异分析

想要进行差异分析,首先需要生成DESeq2必须的数据类型,即dds类型数据,DESeq2包使用DESeqDataSet(dds)作为存放count数据及分析结果的对象,每个DESeqDataSet(dds)对象都必须由以下三者:

countData,存放counts matrix的对象colData,存放分组信息和处理信息的对象design公式,对应sample的分组信息,需要以~ 波浪字符进行连接,而不同的信息之间需要以+连接,示例:design=~variable_1 + variable_2 这些分组信息会被用来估算离散度和估算Log2 fold change的模型 注意,为了方便起见,在默认参数下,用户应该把感兴趣的分组信息放在formula的最后,并且确认control组的level是第一个(因子的level,见R语言基础视频) ## 制作dds对象,构建差异基因分析所需的数据格式 dds


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有