评估单基因在肿瘤的表达情况可以用哪些公开数据库? – 欧阳松的博客 您所在的位置:网站首页 geo数据库教程 评估单基因在肿瘤的表达情况可以用哪些公开数据库? – 欧阳松的博客

评估单基因在肿瘤的表达情况可以用哪些公开数据库? – 欧阳松的博客

2023-09-07 11:26| 来源: 网络整理| 查看: 265

我们都知道,做实验是要花钱的,如果你没有经费,但已经有一个目标基因,现在我们想知道该基因在肿瘤组织中的mRNA水平和蛋白水平的表达情况,同时我们还想知道该基因在肿瘤细胞系的表达情况。那么,在不做实验的情况下如何初步评估呢?

单基因在肿瘤组织中的mRNA表达

目前最大的肿瘤数据库是TCGA,而最综合的数据库是GEO。其中TCGA中为RNA-seq,而GEO数据库中主要以芯片居多。TCGA中包含了少许与肿瘤组织配对的正常组织,GEO则需要进行手动搜索,一般可以两者结合起来,通过多组学数据进行验证。不过如果想偷懒的话还是有一些办法的。

TCGA联合GTEx数据库

TCGA数据库中包含了大量肿瘤组织和少许配对的健康组织,然而有时候健康组织可能偏少,这时候我们还可以联合只包含健康组织的GTEx数据库进行分析。但是,这里面要注意这两个数据库不是同一个平台,所以是存在批次效应的,为了消除这种效应,现在公认的办法是统一基因定量单位为TPM,而不是以前用的FPKM。

最简单的办法就是使用Xena数据库中UCSC Toil RNA-seq Recompute里TCGA TARGET GTEx队列,该队列包含了TCGA和GTEx数据库,并且基因定量单位均统一为log2(tpm+0.001)。

不过更简单的办法就是使用UCSCXenaShiny工具

GENT2数据库

GENT2数据库收录了GEO数据库中的72种肿瘤组织或细胞系的基因芯片表达数据,包括了GPL570和GPL96两个平台数据,样本量也是非常大的,可以作为TCGA的补充

单基因在肿瘤肿瘤中的蛋白表达

目前对于蛋白表达数据库为HPA数据库,该数据库收录了TCGA数据库中肿瘤组织和健康组织的免疫组化染色结果,并且提供了高清图像,可以很好的用来评估肿瘤组织和正常组织在蛋白层面上的表达情况。

单基因在肿瘤细胞系中的mRNA表达

在我们初步评估基因在mRNA水平和蛋白水平的表达情况后,我们还需要筛选合适的细胞系用于后续表型验证,如果没有钱进行筛选的话,我们可以通过CCLE或GENT2数据库,分别从RNA-seq和基因芯片层面进行评估。

CCLE数据库

CCLE是细胞细胞系的基因表达数据库,主要还是RNA-seq数据,包括了所有基因在各种肿瘤细胞系的基因表达情况,可以去官网下载数据,也可以使用Xena数据库提取单基因的表达数据

GENT2数据库

GENT2除了肿瘤组织的芯片表达数据,其实还有细胞系的表达数据,同时也是来源于GEO数据库,并且也是包含了两个平台的数据。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有