揭秘差异基因功能富集分析 您所在的位置:网站首页 kegg通路富集分析中的数据怎么准备 揭秘差异基因功能富集分析

揭秘差异基因功能富集分析

2023-06-09 12:55| 来源: 网络整理| 查看: 265

揭秘差异基因功能富集分析

 

通过差异分析,我们可以知道不同分组间是否存在差异,存在差

异的是哪些基因。再进一步,需要探究这些基因的表达量出现差异是

由哪些生物学过程介导的,我们的实验处理影响了哪些生物学过程。

 

为了探究上述问题,我们首先需要知道基因参与的生物学过程,

这个依赖于我们对生命活动的已有认知,比如常见的

KEGG

数据库,

就存储了基因对应的通路信息。

 

其次,我们还需要一点统计学手段,差异基因的数目是成百上千

的,每个基因又参与多个生物学过程,直接将所有差异基因的功能汇

总,会得到非常多的信息,由于数量庞大,所以看起来是杂乱无章的,

没有任何规律可言,所以需要借助统计学手段,去挖掘差异基因集中

在哪些生物学过程,也就是我们常说的富集分析。

 

从上面的解释可以看到,富集分析有两个核心

 

1.

基因的注释信息

 

基因参与的生物学过程,也称之为基因的功能注释,这部分信息

主要依赖已有的数据库,常见的数据库包括

GO, KEGG, wikipathway, 

reactome

等。

 

需要注意的是,不同数据库覆盖的基因数目是不一样的,以

human

为例,一共

2

万多个蛋白编码基因

 

 

其中有

KEGG pathway

注释的只有

6000

多个。

 

由于已有认知的缺陷,这个是无法避免的问题,只能通过不断的

探索研究来更新和完善数据库中的内容。

 

所以在富集分析时,会集合多个数据库来分析,最常见的就是

GO

KEGG

数据库,近年来

reactome

用的也越来越多。其实,只要是

你感兴趣的功能数据库,都可以拿来做分析。

 

2. 

统计方法

 

如何研究差异基因集中参与的生物学过程,需要借助统计学手段,

常见的方法包括以下两种:

 

1.

 

费舍尔精确检验

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有