16s数据库 您所在的位置:网站首页 ssu是什么格式文件 16s数据库

16s数据库

2024-07-17 04:42| 来源: 网络整理| 查看: 265

文章目录 一、Greengenes数据库二、SILVA数据库三、RDP数据库

一、Greengenes数据库

Greengenes数据库由Lawrence Berkeley National Laboratory构建。最新版本为13.8,它对13.5的序列分类进行了修正,13.5版本总共收录16S rRNA序列1,262,986条。这是非冗余的序列,Greengenes可以用Export工具实现对数据的过滤,输出定制的数据库。qiime软件中默认使用的是greengene数据库,为97_otus.fasta这个文件,以及一个对应的注释文件97_otu_taxonomy.txt,一个构建好的系统发育树97_otus.tree。里面包含了99322条非冗余的16S序列。目前最新的文件为99_otus.fasta。Greengenes提供比对工具NAST,可进行多序列比对。提供在线trim处理,可以根据质量值修剪FASTA格式数据文件。qiime中可以使用pynast软件来进行比对,此外,网站的probe工具提供16S rRNA区域探针或者引物的设计功能。GreenGene只包含16S/18S序列,不包含大亚基23S/28S序列。

网站链接:http://greengenes.secondgenome.com/

ftp://greengenes.microbio.me/greengenes_release/ http://greengenes.secondgenome.com/downloads/database/13_5

二、SILVA数据库

SILVA数据库由德国马普研究所和Ribocon主持,提供最新的核糖体大小亚基rRNA注释信息。SILVA数据库是软件包ARB的官方数据库,提供全面的,高质量的可比对的小亚基(如16S/18S,SSU),以及大亚基(23S/28S,LSU)的rRNA序列,用于细菌,古生菌,以及真菌分析。silva也是mothur软件中推荐使用的数据库,截止到本课程制作时间的版本是Version 126,不过126版本目前只提供网络应用,能够下载使用的为123版本。silva数据库提供超过170多万个SSU,9万多LSU序列。silva数据库里面包含五个独立的部分,分别是小亚基的SSU Parc,SSU Ref 以及 SSU Ref NR ,还有大亚基的LSU Parc 与LSU Ref。这些库之间有什么差别呢。这是根据不同的序列长度以及聚类的序列相似性来生成的。官网上面有详细的介绍。我们可以通过网页或者ftp服务器下载silva的数据库。里面包括arb文件和fasta文件,如果不使用arb的软件,我们只需下载fasta的文件。ARB_files存储的为arb格式的文件,Export为fasta序列格式的文件。在16S序列分析中,我们推荐使用SSU Ref NR这个数据库,这个是使用99%的identity标准来进行非冗余处理,准确性更高,在18S序列分析中,使用LSU Ref。并且这些版本的数据库包含一个Guide Tree。

网站链接:http://www.arb-silva.de/

https://www.arb-silva.de/documentation/release-123/

三、RDP数据库

RDP数据库来自于(Ribosomal Database Project),前面课程我们提到过RDP的分析流程。其中数据库提供核糖体相关数据和服务,包括在线的数据分析、比对、16S rRNA序列的注释。RDP最新版本是Release 11.4,发布于2015.5.26,收录了共3,224,600条16S rRNAs序列,108,901条真菌28S rRNA序列,是使用最广的16S rRNA序列数据库。RDP数据库提供16S rRNA序列比对和分类、进化树构建、物种分类heatmap、功能基因分析等方便的数据处理功能。RDP项目提供了完整的16S和18S分析方案,

网站链接:http://rdp.cme.msu.edu/index.jsp

引用:https://www.136.la/shida/show-400776.html



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有