比较不同的对单细胞转录组数据聚类的方法 您所在的位置:网站首页 单细胞聚类的方法 比较不同的对单细胞转录组数据聚类的方法

比较不同的对单细胞转录组数据聚类的方法

2024-02-25 15:11| 来源: 网络整理| 查看: 265

背景介绍

聚类之前必须要对表达矩阵进行normalization,而且要去除一些批次效应等外部因素。通过对表达矩阵的聚类,可以把细胞群体分成不同的状态,解释为什么会有不同的群体。不过从计算的角度来说,聚类还是蛮复杂的,各个细胞并没有预先标记好,而且也没办法事先知道可以聚多少类。尤其是在单细胞转录组数据里面有很高的噪音,基因非常多,意味着的维度很高。

对这样的高维数据,需要首先进行降维,可以选择PCA或者t-SNE方法。聚类的话,一般都是无监督聚类方法,比如:hierarchical clustering, k-means clustering and graph-based clustering。算法略微有一点复杂,略过吧。

这里主要比较6个常见的单细胞转录组数据的聚类包:

SINCERA

pcaReduce

SC3

tSNE + k-means

SEURAT

SNN-Cliq

所以需要安装并且加载一些包,安装代码如下;

install.packages('pcaReduce')## try http:// if https:// URLs are not supportedsource("https://bioconductor.org/biocLite.R") biocLite("SC3") biocLite("Seurat") install.packages("devtools")library("devtools")install_github("BPSC","nghiavtr") install_github("hemberg-lab/scRNA.seq.funcs")devtools::install_github("JustinaZ/pcaReduce")

加载代码如下:

library(pcaMethods)library(pcaReduce)library(SC3)library(scater)library(pheatmap)set.seed(1234567)加载测试数据

这里选取的是数据,加载了这个scater包的SCESet对象,包含着一个23730 features, 301 samples 的表达矩阵。

供11已知的种细胞类型,这样聚类的时候就可以跟这个已知信息做对比,看看聚类效果如何。

可以直接用plotPCA来简单PCA并且可视化。

pollen


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有