RNA 您所在的位置:网站首页 kk怎么画 RNA

RNA

2024-06-26 18:49| 来源: 网络整理| 查看: 265

本节概览: 1.GSEA简单介绍 2.创建GSEA分析所需的geneList,包含log2FoldChange和ENTREZID信息 3.利用clusterProfiler进行GSEA富集GO与KEGG通路 4.GSEA富集结果可视化:GSEA结果图、 gsearank plot 、ridgeplot

1. GSEA简单介绍

以下对GSEA涉及的一些重要概念进行了简单介绍,详细介绍见: 一文掌握GSEA,超详细教程 - 云+社区 - 腾讯云 (tencent.com) 史上最全GSEA可视化教程,今天让你彻底搞懂GSEA! - 知乎 (zhihu.com)

1.1 GSEA定义与基本原理:

定义: 基因集富集分析(Gene Set Enrichment Analysis, GSEA)是一种计算方法,用来确定一组先验定义的基因集是否在两种生物状态之间显示出统计学上显著的、一致的差异。 官网地址:GSEA (gsea-msigdb.org)

基本原理: 使用预定义的基因集(通常来自功能注释或先前实验的结果),将基因按照在两类样本中的差异表达程度排序,然后检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。基因集合富集分析检测基因集合而不是单个基因的表达变化,因此可以包含这些细微的表达变化,预期得到更为理想的结果

与GO\KEGG差异基因富集分析区别: 差异基因富集分析是先筛选差异基因,再判断差异基因在哪些注释的通路存在富集;这涉及到阈值的设定,存在一定主观性并且只能用于表达变化较大的基因,即我们定义的显著差异基因。而GSEA则不局限于差异基因,从基因集的富集角度出发,理论上更容易囊括细微但协调性的变化对生物通路的影响。

gsea.png

1.2 MSigDB(Molecular Signatures Database):

分子特征数据库。一般进行GSEA或GSVA使用的就是该数据库中的基因集,我们也可以自定义基因集。MSigDB所包含的基因集如下所示:

KEGG信息包含在C2中,GO信息包含在C5中。

1.3 GSEA中关键概念

ES(Enrichment Score):富集得分 ES反应基因集成员s在排序列表L的两端富集的程度。计算方式是,从基因集L的第一个基因开始,计算一个累计统计值。当遇到一个落在s里面的基因,则增加统计值。遇到一个不在s里面的基因,则降低统计值。 每一步统计值增加或减少的幅度与基因的表达变化程度(fold-change值)是相关的。富集得分ES最后定义为最大的峰值。正值ES表示基因集在列表的顶部富集,负值ES表示基因集在列表的底部富集。 p-value用来评估富集得分(ES)的显著性,通过排列检验 (permutation test)计算观察到的富集得分(ES)出现的可能性。

NES (Normalized Enrichment Score):标准化富集得分 每个基因子集s计算得到的ES根据基因集的大小进行标准化得到标准化富集得分Normalized Enrichment Score (NES)。随后会针对NES计算假阳性率FDR。

Leading-edge subset:领头基因亚集 对富集贡献最大的基因成员

一般认为|NES|>1,p-value



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有