GEO数据挖掘(学习笔记) | 您所在的位置:网站首页 › 数据挖掘学什么内容 › GEO数据挖掘(学习笔记) |
GEO数据挖掘
1. GEO数据库简介2. 数据下载3. 数据质量检查4. ID转换5. 数据探索5.1 PCA分析5.2 hclust聚类5.3 limma包进行差异分析5.3.1 热图5.3.2 火山图
5.4 GO and KEGG
生信菜鸟一枚,记录下学习生信技能树GEO数据挖掘相关视频的学习笔记。 1. GEO数据库简介NCBI Gene Expression Omnibus(GEO)是一个存储各种高通量实验数据的公共数据库。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。网址如下:https://www.ncbi.nlm.nih.gov/geo/ 2. 数据下载gset是一个列表,里面拥有表达矩阵、分组信息、临床资料等等内容, ########################################### # GEO accession : GSE42872 # Platforms : GPL6244 # BioProject : PRJNA183688 ########################################## #####数据下载##### if(!require(GEOquery)) BiocManager::install("GEOquery") # 安装包 package.version("GEOquery") # 查看版本 help(package = "GEOquery") # 查看GEOquery中的函数 library(GEOquery) # 加载包 library(tidyverse) search() # 查看已加载R包 gset paste(substr(.,1,1),tolower(substr(.,2,nchar(.))),sep = "")} exprset.symbol |
CopyRight 2018-2019 实验室设备网 版权所有 |