GEO数据库中单细胞测序数据下载 您所在的位置:网站首页 单细胞工作室 GEO数据库中单细胞测序数据下载

GEO数据库中单细胞测序数据下载

2023-08-28 21:59| 来源: 网络整理| 查看: 265

首先GEO数据库是收集基因表达的数据库

        一般高通量测序文章发表时会将原始数据上传至GEO数据库并在文章中提供GSE 号,如果想对某些文章的数据进行在分析,可以在GEO数据库搜索文章中的GSE号。

        用户提供的原始数据有3种:Platform,Sample和Series。GEO数据库整理后的数据分为:数据集(datasets)和表达谱(profiles)。GEO数据库具体存放四类数据:GDS、GSE、GSM、和GPL。GDS号(GDSxxx)对应的一个同一平台的数据集, 包括微阵列和高通量测序产生的数据;GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台;GSM号(GSMxxx)是具体某个单一样品的数据信息,只能是单一平台的数据;GPL号(GPLxxx)对应平台的信息,例如Illumina测序平台型号、芯片型号等。

       一篇文章可以有一个或多个GSE数据集,一个GSE里可以有一个或多个GSM样本。多个研究的GSM样本可以根据研究目的整合为一个GDS,每个数据集有着自己对应的芯片平台(GPL),一个GSE里可能有多个平台测出的数据。

下载GEO单细胞测序数据集

1.输入数据集或者样本ID

2.进入GSE页面

需要确认此数据是否采用10X Genomics平台(summary可能包含单细胞测序平台信息,若不包含,需搜索并查阅数据来源文章)

3.拉至页面最下方,选择需要下载的样本并点击(注意样本的标注)

4.进入样本GSM页面

5.下拉并点击SRA数据ID

6.进入SRA页面,下拉至最下方点击数据链接

7.进入SRA数据库,点击Data access

8.进入数据下载页面,下载fastq格式原始测序数据

9.BAM数据下载

有时候10x fastq不会被上传到数据库,相反客户会上传bam文件(除了FASTQ文件以外,SRA鼓励提交10x BAM文件),bam是Cell Ranger生成的输出文件之一。如果只有bam文件而无FASTQ文件存在,可以在SRA的“Data access”选项卡中找到bams并下载,下载的bam文件使用10x官方提供的转换工具 bamtofastq(https://support.10xgenomics.com/docs/bamtofastq)将其转换为fastq格式文件。

 

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有