ucsc预测出的转录因子怎么导出 您所在的位置:网站首页 怎么找转录因子 ucsc预测出的转录因子怎么导出

ucsc预测出的转录因子怎么导出

#ucsc预测出的转录因子怎么导出| 来源: 网络整理| 查看: 265

原标题:小白实战课堂!转录因子的候选靶基因查询~~

一文学会Harmonizonme和hTFtarget数据库使用方法

嗨,小伙伴们大家好!这里是每周一弘毅专栏,我志向用小小文字助力你的SCI发表之路。接上周话题,转录因子相关课题经常遇到的两个问题,一是已知靶基因寻找它上游的转录因子?二是已知转录因子寻找它可能的靶基因?前一个问题上周已经给大家做过演示,本周针对第二个问题给大家介绍Harmonizonme和hTFtarget数据库,跟着弘毅的脚步一起来看看吧~!

前情提要

1.转录因子相关名词

DBD(DNA binding domain)

TFBS(ranion factor binding site)

Target genes

2.转录因子结合位点预测

JASPAR

NCBI

UCSC数据库

Harmonizonme数据库

数据库概览

进入Harmonizonme主页(https://maayanlab.cloud/Harmonizome/),点击About可见数据库简介,于2016年发布,目前收录来自66个在线数据库的114个基因组学、转录组学、蛋白质组学和代谢组学数据集,着重于定义基因和不同属性之间的关联,属性可以是基因、蛋白质、细胞系、组织、实验干预因素、疾病、表型或药物,并构建基因与基因和属性与属性的相似性网络。本文重点介绍转录因子和靶基因数据集。

7d534588448d3d43f30dee975293edb0.png

功能及操作演示

转录因子靶基因预测,进入Harmonizonme主页,点击SEARCH进入检索界面,下拉菜单选择Database,检索框输入tranion factors targets,回车得到14条检索结果,前6个为转录因子靶基因数据库。

d07e9a7c2a2a407fc96ffd12dd26e172.png

e0514234ddf4720623d96df4055b804c.png

选择CHEA Tranion Factor Targets进入功能页面,首先是该数据库简介,包括数据来源和参考文献,页面下拉依次是不同数据集下载链接,以及该数据库收录的各个转录因子详细信息。

12f183222893f6c9739e86f99e44ad58.png

7872b46dec2ec0aefcb4f622c01fbdfa.png

以人类SOX2为例,检索框输入SOX2,点击进入详情页面,页面下拉可见该数据库收录的SOX2靶基因共8156个。

111bd71ba430e7cbfcdffc73c0a37c4d.png

3faa7dcbfe1b7949f97dcf82cb5fbf65.png

点击Downloads & Tools后面的下载按钮可以下载靶基因列表,该文件为Json文件,对于不熟悉R语言的小伙伴来说极为不友好,可按照另一种方法获取靶基因列表。

2eff9506973e65d51863f9548c99ab03.png

返回上一级页面,下拉到Data Access,点击 Gene-Attribute Edge List下载该数据库全部的转录因子和靶基因信息列表,用Excel打开,其中source列是靶基因,`target列是转录因子,分别提供Gene symbols和Gene ID。

daebd233429a3d6d2c9e810e9b41a909.png

fb0208928bc7660e96431cb4fc24c596.png

使用数据筛选功能,在target列检索SOX2,删除source列重复值,可以得到8156个靶基因结果。

afaa956e53f46fe056854ff3fd388e97.png

同样的方法得到其他5个数据集收录的SOX2靶基因列表,JASPAR Predicted Tranion Factor Targets Dataset中有5个靶基因结果,TRANSFAC Predicted Tranion Factor Targets Dataset中有1228个靶基因结果,TRANSFAC Curated Tranion Factor Targets Dataset、MotifMap Predicted Tranion Factor Targets和ENCODE Tranion Factor Targets Dataset中无SOX2靶基因信息。

hTFtarget数据库

数据库概览

点击(http://bioinfo.life.hust.edu.cn/hTFtarget#!/),进入hTFtarget (Database of Human Tranion Factor Targets)主页,该数据库收录399种细胞系、129种组织或细胞和141种干预因素共569种条件下的7190个实验样本大规模ChIP-Seq数据中659个TFs相关信息。点击Document可看到hTFtarget中关于TFs靶基因数据是基于ChIP-Seq数据分析和TFBSs分析两方面的结果。

5cf63e6fbbe10ad9dd44e1814356f455.png

功能及操作演示

转录因子靶基因预测,进入hTFtarget主页,点击TF进入检索界面,检索框输入SOX2,点击进入详情页面, 点击下载按钮得到SOX2靶基因列表。

f5fc10b436e6828d2b8bf09708af5f7d.png

d4623c6b17e52ee712b02fee62ed9b5e.png

最后将以上两个数据库查到的靶基因列表绘制Venn图取交集,可以使用在线Venn图绘制工具(http://bioinformatics.psb.ugent.be/webtools/Venn/),分别输入CHEA中8156个靶基因,JASPAR中5个靶基因结果,TRANSFAC中1228个靶基因和hTFtarget获取的靶基因列表,结果显示4个数据库共有的SOX2靶基因数目为0,CHEA、TRANSFAC和hTFtarget共有的SOX2靶基因有1个,为RBBP9,Pubmed检索未见报道,可以尝试实验验证一波。

2063804df05557943c24667fb0df0cad.png

f4d5b3588281bd5fbd540581540650aa.png

文献单图复现

文献案例: PMID: 33144585,IF=6.304分

085ca433a0660e45f7c4b9bfb70c7b72.png

本文Figure6A,本文已实验验证主变量miR-671-5的靶基因为转录因子NFIA,随后通过Harmonizome预测到NFIA的1404个候选靶基因,并在GSE21034 数据集获得85个表达差异基因(adjust_P2),二者取交集获得11个候选靶基因,再然后使用cBioPortal分析NFIA与11个候选靶基因相关性,结合Pubmed数据,以及qPCR和WB实验结果,最终能否证实NFIA可以靶向CRYAB并调节其表达。

471496347d0e6fdbccdb629ef639d793.png

单图复现如下:

进入GEO数据库检索GSE21034 ,进入该数据集详情页面,可见该数据集包含GPL5188和GPL10264两个平台测序结果,点击Analyze with GEO2R,选择GPL5188平台加载185个样本,其中包含131例原发肿瘤组织和29例癌旁正常组织,分别添加到分组后,点击Analyze得到差异分析结果,下载后Excel打开,依次如下操作

(1)一个基因对应多个探针的情况保留logFC最大值;

(2)一个探针对应多个基因的情况删除该条目;

(3)空白无名称条目删除;

(4)筛选功能,筛选条件为adjust_P2。最终得到85个表达差异基因。

6e695afddb15c28a1d0f1580c008fdef.png

43acf239bdd343459e85fe75a3ac46a1.png

进入Harmonizonme主页,点击SEARCH进入检索界面,下拉菜单选择Database,检索框输入tranion factors targets,得到6个转录因子靶基因数据库,同前法查询NFIA靶基因,结果只有TRANSFAC Predicted Tranion Factor Targets中查询到NFIA的靶基因1404个,其余5个数据库未收录其靶基因信息,同前法获得NFIA的靶基因列表。

4332a7569dc0481f293de7d819a45660.png

将GEO获得的差异表达基因与Harmonizonme获得的NFIA靶基因列表分别输入在线Venn图绘制工具(http://bioinformatics.psb.ugent.be/webtools/Venn/ ),即可得到Venn图,PS或AI添加交集部分包含的基因名称,即可得到本文Figure6A。

1a9bfe775f86081d2a0b0f68a5f6be2d.png

投我以桃,报之以李,开发并维护数据库不易,小伙伴们使用Harmonizonme和hTFtarget时,别忘记引用以下参考文献哦!~

写在结尾

b47790781bc5152d15753229dc9e6cf3.png

918d929cd545b230159cbecf530e8abb.png

我有双份的快乐,一份留给我家可可爱爱的宝宝和我的family members,一份留给不经意间看到的你!好啦~关于Harmonizonme和hTFtarget数据库加餐就到这里啦!欲知更多生信知识,我们相约“挑圈联靠”公众号~下期再见了~~!

小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!

欢迎大家关注解螺旋生信频道-挑圈联靠公号~

撰文丨弘 毅

排版丨四金兄

值班 | 阿 琛

责任编辑:



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有