2020 您所在的位置:网站首页 seq-well 2020

2020

2023-12-25 18:13| 来源: 网络整理| 查看: 265

来源:单细胞天地

一、前言

scRNA-seq技术到目前为止也有一百多个了,但主流的可以大致分为以下几种:

Droplet-based: 10X Genomics, inDrop, Drop-seq

Plate-based with unique molecular identifiers (UMIs): CEL-seq, MARS-seq

Plate-based with reads: Smart-seq2

Other: sci-RNA-seq, Seq-Well

实际上我们需要理解的就是10x数据和Smart-seq2技术啦,最常用而且最常见!

二、10X Genomics的原始数据

目前单细胞是10x的天下,而10x的测序数据,御用软件cellranger其实就是star的包装,关于10X仪器的单细胞转录组数据走cellranger流程,教程如下:

单细胞实战(一)数据下载

单细胞实战(二) cell ranger使用前注意事项

单细胞实战(三) Cell Ranger使用初探

单细胞实战(四) Cell Ranger流程概览

单细胞实战(五) 理解cellranger count的结果

输入数据是测序序列的fastq文件,输出的是表达矩阵。值得注意的是,每个10x样本都有3个fastq文件作为输入,然后输出的表达矩阵,也是3个文件。

在教程:使用seurat3的merge功能整合8个10X单细胞转录组样本和seurat3的merge功能和cellranger的aggr整合多个10X单细胞转录组对比,也给出了后续R代码读取10x单细胞转录组数据的3个文件的表达矩阵。

三、10X Genomics的单细胞公共数据

比如 GSE128033 和 GSE135893,就是10x数据集,随便下载其中一个,就能看到每个样本都是走流程拿到10x单细胞转录组数据的3个文件的表达矩阵。

2.2M Mar 8 2019 GSM3660655_SC94IPFUP_barcodes.tsv.gz 259K Mar 8 2019 GSM3660655_SC94IPFUP_genes.tsv.gz 26M Mar 8 2019 GSM3660655_SC94IPFUP_matrix.mtx.gz 2.2M Mar 8 2019 GSM3660656_SC95IPFLOW_barcodes.tsv.gz 259K Mar 8 2019 GSM3660656_SC95IPFLOW_genes.tsv.gz 31M Mar 8 2019 GSM3660656_SC95IPFLOW_matrix.mtx.gz 2.2M Mar 8 2019 GSM3660657_SC153IPFLOW_barcodes.tsv.gz 259K Mar 8 2019 GSM3660657_SC153IPFLOW_genes.tsv.gz 33M Mar 8 2019 GSM3660657_SC153IPFLOW_matrix.mtx.gz 2.2M Mar 8 2019 GSM3660658_SC154IPFUP_barcodes.tsv.gz 259K Mar 8 2019 GSM3660658_SC154IPFUP_genes.tsv.gz 31M Mar 8 2019 GSM3660658_SC154IPFUP_matrix.mtx.gz

下游处理的时候,一定要保证这3个文件同时存在,而且在同一个文件夹下面。

示例代码是:

rm(list=ls()) options(stringsAsFactors = F) library(Seurat) sce1 counts.id.log 2>&1 & # 得到的就是 count矩阵

大家可能会觉得奇怪,为什么我给到的代码里面的软件,都不是截图文献里面使用的呢?其实转录组数据处理流派太多了,并没有绝对的权威。

同样的,很大概率你不需要自己处理上游数据,而是公共数据库,比如我通常是下载上面的count矩阵,然后走代码:

rm(list=ls()) options(stringsAsFactors = F) # install.packages('R.utils') # install.packages('data.table') library(data.table) # 这个表达矩阵其实是10x的,不过可以演示 a=fread('GSE117988_raw.expMatrix_PBMC.csv.gz',header = TRUE) length(a$V1) length(unique(a$V1)) hg=a$V1 dat=a[,2:ncol(a)] rownames(dat)=hg hg[grepl('^MT-',hg)] colnames(dat) rownames(dat) meta=as.data.frame(colnames(dat)) colnames(meta)=c('cell name') rownames(meta)=colnames(dat) head(meta) ## 前面大量的代码,都是数据预处理 library(Seurat) dat[1:4,1:4] class(dat) # 重点是构建 Seurat对象 pbmc


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有