ATAC | 您所在的位置:网站首页 › trim序列 › ATAC |
文章目录
一、 ATAC-seq原理和基础知识1. ATAC-seq原理2. Tn5转座子1. 转座概念2. 参与分子1. 转座子(1) 简化的转座子结构(2) Tn5转座子的结构
2. 转座酶
3. 转座过程
3. fastq文件格式4. sam格式
二、数据比对和过滤
一、 ATAC-seq原理和基础知识
1. ATAC-seq原理
真核生物的DNA并不是裸漏的,而是组蛋白和染色体/染色质结合。DNA一圈一圈的缠绕在8个组蛋白上,形成核小体。一个个核小体构成串珠式的结构,然后进一步折叠、聚合,并在其他架构蛋白的协助下,形成染色体。经过一系列操作就将超长的DNA链,折叠成很小的结构,塞进小小的细胞核内。 可移动的DNA片段即可移动因子在基因组上自由转移称为转座,DNA与所插入的基因位点可以是非同源的。转座是产生基因多样性的重要机制,可移动因子可产生插入、缺失、倒置以及染色体融合突变。 转座需要通过转座酶来催化。原核生物的转座分为两种方式,复制转座和保守转座: 复制转座的供体DNA完整,把通过复制的DNA片段插入基因位点上保守转座则是从供体DNA上分离一段DNA,以转座酶为中介,连接到目标DNA上而实现的 2. 参与分子 转座子(Transposon) : 可移动DNA片段转座酶(Transposase / TNP):催化转座的蛋白质;野生型Tn5转座酶是一种活性极低的蛋白质目标DNA(Target DNA): 可以与转座子在同一个DNA分子上,甚至转座子内;或在另一个DNA分子上 1. 转座子 (1) 简化的转座子结构包含合成Tnp的DNA序列,两个19bp长的末端以及任意DNA序列。 Tn5转座子由两个反向的插入片段 IS50 以及两组 OE 和 IE 构成 IS(insertion sequence): 插入序列,很小(< 2.5 kb)DNA片段,可以在不同的基因位点跳跃,或自我复制。通常存在于细菌与古细菌基因中,但也存在于真核生物的转座元素中。编码的基因一般只与移动有关。 2. 转座酶 Tn5 Tnp是一种转座酶,可以将DNA片段从一个位置移动到另一个位置,来自大肠杆菌,全长477个氨基酸。Tn5 Tnp可以与特异性DNA识别和结合,特异性DAN是指Tn5或IS50的末端反向重复序列。Tn5 Tnp的主要功能区有三个,N末端、催化结构域和C末端: 1. N末端是特异性结合DNA结构域,可以识别和结合Tn5或IS50的末端反向重复序列 2. 催化结构域是转座反应的核心,可以切割和连接DNA,并形成双聚体 3. C末端是合成复合体的必需部分,可以促进Tn5 Tnp之间的相互作用,并影响转座效率 3. 转座过程
fastaq格式是一种基于文本的存储生物序列和对应碱基质量的文件格式。 下面为一个illumina平台测序的真实数据,其中包含了一条reads的信息 @ST-E00126:128:HJFLHCCXX:2:1101:7405:1133 TTGCAAAAAATTTCTCTCATTCTGTAGGTTGCCTGTTCACTCTGATGATAGTTTGTTTTGG + FFKKKFKKFKF |
CopyRight 2018-2019 实验室设备网 版权所有 |