NCBI学习心得1 您所在的位置:网站首页 stim医学缩写 NCBI学习心得1

NCBI学习心得1

2023-03-21 20:18| 来源: 网络整理| 查看: 265

NCBI常见数据库 Literature文献 数据库 数据库简介 用途 Bookshelf Bookshelf 数据库 主要收集生物医学方面的书籍,这些书籍可直接通过在Entrez中的链接进行 访问。该系列包括生物医学、其他科学主题书, GeneReviews等遗传资源和 NCBI帮助手册。 MesH 医学主题词表 MeSH数据库存储的是美国国立医学图书馆用于检索PubMed文献所使用的 受控词汇. MeSH术语提供了一个一致的检索方式使得我们对于一个概念对 应多个术语的情况也能方便检索出来. MeSH Database在PubMed中的主要作用: 1·提供主题词的自然信息(词义、同近义词、可组配副主题词等); 12,提供主题检索途径; NLM Catalog 期刊数据库 提供了多种期刊的检索,检索词可以是杂志名称、医学缩写、美国国立医学 , 图书馆编号、国际标准化组织的缩写或刊号…entre数据库中的所有期刊都 能在这个数据库中找到,每一条记录都可链接到NLM LocatorPlus和具有相 近题目或MeSH词汇的相关文件目录信息 PubMed PubMed数据库 PubMed是拥有超过3000万篇生物医学文献的数据库。它们来源于 MEDLINE(生物医学文献数据库)、生命科学领域学术杂志以及在线的专业书 籍. PubMed还提供了访问其他相关网站和其他NCBI分子生物学资源的链接 PubMed Centra PubMed Central数据库 公众医学信息中心( PubMed Central , PMC )是NLM在生命科学领域期刊 文献的数字存档,研究者可免费访问PMC中的全文文献. Genes 数据库 数据库简介 用途 Gene 基因数据库 Gene数据库以基因为记录对象为用户提供基因序列注程和检索服务; GEO DataSets 基因表达数据库 GEO DataSets储存由Gene Expression Omnibus (GEO) repository中得来的基因 表达以及分子丰富性的数据。 (GEO DataSets :收录整个试验的数据) GEO Profiles 基因表达文库 GEO Profiles储存单独的由Gene Expression Omnibus (GEO) repository中得来的 基因表达以及分子丰富性的数据。对挡案的搜索建立在基因注释和事先计算的档案特 性的基础上,并能连接到很多其他相关资源。(GEO Profiles :收录一个基因在一次 试验中的定量基因表达数据) HomoloGene HomoloGene HomoloGene数据库是一个在20种完全测序的真核生物基因组中自动检索同源基因的 系统,包括直系同源与旁系同源. HomoloGene的结果报告包括基因同源性和来自 OMIM、小鼠基因组信息学(Mouse Genome Informatics, MGI)、斑马鱼信息网络 (Zebrafish Information Network, ZFIN)、酵母基因组数据库(Saccharomyces Genome Database, SGD)、直系同源基因簇(Clusters of Orthologous Groups, COG)和果蝇数据库(FlyBase)的基因表型信息, HomoloGene下载功能能下载 HomoloGene中的转录体、蛋白质和基因组序列信息,还能下载基因组中特定基因的 上游和下游序列. PopSet PopSet数据库 包含用于群体进化或变异研究的比对序列(包括蛋白、基因序列) ,这些比对结果主 要用于描述进化和群体变异等事件。 蛋白质 数据库 数据库简介 用途 Conserved Domains 保守结构域数据库 (CDD) CDD是一种蛋白质注释资源,收集了多重比对序列模型以及全长蛋白质序列构建保守 结构域。其使用RPS-BLAST ,基于特异位点得分矩阵( PSSMs) ,对于蛋白质序列中保 |守域进行快速鉴定. Identical Protein Groups Identical Protein Groups数据库 描述在GenBank和RefSea中注释的编码区中鉴定的蛋白质,以及SwissProt和PDB蛋 白质序列的综合记录集合。该资源允许研究人员获得更有针对性的搜索结果并快速识 别感兴趣的蛋白质。 Protein Protein数据库 分为两部分:一部分是通过翻译DNA序列编码区得到的蛋白质序列,这些DNA序列主 要来自于GenBank, EMBL和DDB) :另一部分是存储于PIR, Swiss-Prot, PRF和PDB 中的蛋白序列。 Protein Clusters 蛋白质聚类数据库 相关蛋白质序列(簇)的集合,由完整的原核和细胞器质粒和基因组编码的参考序列 蛋白组成。该数据库提供对注程信息,出版物,域,结构,外部链接和分析工具的轻 松访问。 Sparcle 亚家族蛋白结构标 记引擎 是一种蛋白质序列功能表征和标记的资源,这些蛋白质序列是按照其特有的保守域结构进行分组的。 Structure 结构数据库 (MMDB) 它包含从晶体结构和核磁共振实验中确定下来的蛋白等大分子结构信息, MMDB中的 数据主要来源于PDB,它通过使用Cn3D软件(由NCBI开发的一个3D分子结构浏览 |器) ,方便从Entrez (NCBI的一个主要数据库搜索引擎)的搜索结果中交互地使分子 |结构可视化 遗传学 数据库 数据库简介 用途 ClinVar ClinVar 储存人类变异与观察到的健康状况之间关系的记录以及支持证据的数据库,可以通过 记录上的超链接访问NIH Genetic Testing Registry (GTR), MedGen,Gene, OMIM. PubMed相关信息。 dbGaP 基因型和表型 数据库 储存基因型和表型相互作用研究结果和描述的数据库,这些研究包括全基因组关联: (GWAS )、医学重测序、分子诊断,以及基因型与非临床性状之间的关联。 dbSNP 单核苷酸多态性 数据库 数据库包含单核苷酸突变、微卫星和小规模插入和缺失信息。 dbVar 染色体结构变异 数据库 dbVar数据库储存了大规模基因组变异相关的信息,包括大插入,缺失,易位和倒位。 除了分类突变之外, dbvar还存储已定义突变与表型信息的关联。 GTR The Genetic Testing Registry 基因测试和实验室记录,包括测量的详细信息,如测量和分析以及临床有效性。GTR 也是遗传条件信息的纽带,并提供与各种资源的特定背景相关的链接,包括实践指 南,已发表的文献和遗传数据/信息. GTR的最初范围包括孟德尔疾病的单基因测试 以及阵列,小组和药物遗传学测试. MedGen Medical genetics literature and inks 与医学遗传学相关的疾病和表型信息的门户, MedGen包含来自多个来源的术语列 表,并将它们组织成概念分组和层次分组,还提供了NIH Genetic Testing Registry |(GTR), ClinVar, Gene, OMIM, PubMed和其它来源中的相关的链接链接。 OMIM 人类孟德尔遗传 数据库 |OMIM全称叫做Online Mendelian Inheritance in Man ,是一个不断更新的人类孟 德尔遗传病的数据库,这个数据库主要关注人类基因变异和表型性状之间的关系, 基因组 数据库 数据库简介 用途 Assembly Assembly数据库 一个提供有关基因组组装结构、装配名称和其他元数据、统计报告以及基因组序列数 据链接等信息的数据库. ioCollectiong BioCollections 一个有关培养物、动植物样本和其他自然样本的精选元数据集。记录显示样本状态 有关馆藏的机构的信息,以及NCBI中相关数据链接。 BioProject BioProject 基因组学,功能基因组学和遗传学研究的集合以及其结果数据集的链接,此资源描述 项目范围,材料和目标,并提供一种机制来检索由于注释不一致,多个独立提交以及 通常存储在不同数据库中的各种数据类型的不同性质而经常难以找到的数据集。 BioSample BioSample数据库 BioSample数据库包含实验测定中使用的生物来源材料的描述, Genome 基因组数据库 包含来自1000多种生物的全基因组的序列和比对数据,基因组代表完全测序的生物和 正在进行测序的生物,三个主要领域(细菌,古细菌和真核生物) ,以及许多病毒, 噬菌体,类病毒,质粒和细胞器. Nucleotide 全核苷酸数据库 NCBI维护的核首酸数据库主要由3部分组成:表达序列标签序列EST、基因组测序序列 GSS和核心核苷酸序列,来自多个来源的核苷酸序列的集合,包括GenBank, RefSeq,第三方注释(TPA)数据库和PDB. Probe 探针数据库 用于各种生物医学研究应用的核酸试剂数据库,有关试剂比例、探针有效性和序列相 似性等信息。 SRA SRA数据库 序列读取存档( SRA )存储来自下一代测序平台的测序数据。 axonomy 生物分类数据库 包含了NCBI所有数据库中出现的物种信息(生物的名称、系统发育谱系) 化学物质 数据库 数据库简介 用途 PubCherm BioAssay PubChem BioAssay数据库 PubChem BioAssay提供筛选生物活性化学物质的实验,从这个数据库中可检索到 每个生物实验的描述信息,包括实验条件和实验流程等 PubChem Compound PubChem Compound数据库 包含了已验证过的化合物的描述信息,化合物主要来自PubChem Substance数据库 Pathways Pathways数据库 与基因、蛋白质和化学物质相联系的分子通路。 PubCherm Substance PubChem Substance数据库 存储着来源于多个数据库的化学品样品,除了对这些样品进行简单的描述外,还可链 接到PubMed的引用、蛋白质三维结构及PubChem BioAssay中生物筛选的结果。 API的使用 网页

自行百度

R包使用 开始使用rentrez

要充分利用 NCBI 共享的所有数据,您需要了解他们的数据库、它们包含的记录以及查找这些记录的方式。 NCBI 为他们的每个数据库和rentrez 所利用的EUtils API 提供了广泛的文档。在rentrez 中还有一些辅助功能可以帮助用户了解他们在NCBI 数据库中的使用方式。

首先,您可以使用 entrez_dbs() 查找可用数据库的列表:

123456789> entrez_dbs()[1] "pubmed" "protein" "nuccore" "ipg" "nucleotide" "structure" "genome" [8] "annotinfo" "assembly" "bioproject" "biosample" "blastdbinfo" "books" "cdd" [15] "clinvar" "gap" "gapplus" "grasp" "dbvar" "gene" "gds" [22] "geoprofiles" "homologene" "medgen" "mesh" "nlmcatalog" "omim" "orgtrack" [29] "pmc" "popset" "proteinclusters" "pcassay" "protfam" "pccompound" "pcsubstance" [36] "seqannot" "snp" "sra" "taxonomy" "biocollections" "gtr"

有一组名称以 entrez_db_ 开头的函数可用于收集有关每个数据库的更多信息:

Functions that help you learn about NCBI databases

Function name Return entrez_db_summary() Brief description of what the database is entrez_db_searchable() Set of search terms that can used with this database entrez_db_links() Set of databases that might contain linked records


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有