index和barcode有什么区别 | 您所在的位置:网站首页 › barcode什么意思 › index和barcode有什么区别 |
另外,index和barcode有什么区别,为什么用两个fq文件进行区分? 找到10X官方给出的一个解答:https://kb.10xgenomics.com/hc/en-us/articles/115002777072-How-do-I-demultiplex-by-sample-index-and-barcode- i7 sample index(library barcode)是加到Illumina测序接头上的,保证多个测序文库可以在同一个flow-cell上或者同一个lane上进行混合测序(multiplexed)。当然可以自己指定index,但更多情况下会使用10X公司提供的index序列(bundled index sets),针对不同项目使用的index也是不同的。不过共性就是:96孔板的每个孔中都加入了4种不同的index oligos混合(详见:https://kb.10xgenomics.com/hc/en-us/articles/218168503-What-oligos-are-in-my-sample-index-)。 image-20190920110219008 它的作用就是在CellRanger的mkfastq 功能中体现出来的,它自动识别样本index名称(例如:SA-GA-A1),将具有相同4种oligo的fq文件组合在一起,表示同一个样本。它保证了一个测序lane上可以容纳多个样本 然后回过头,又看了看GEO的数据记录,发现的确记录了index信息, 但是作者没有上传最原始的BCL文件,因此无法体验mkfastq的功能,但是官网有测试数据。这里了解大体的拆分流程就好 10X Barcode(Cell barcode) 是10X特有的,用来区分GEMs,也就是对细胞做了一个标记。一般在拆分混养测序数据(demultiplexing)这个过程后进行操作,当然这也很符合原文的操作 在实验建库的过程中,barcoding过程(也就是GEM生成的过程)是早于indexing过程(它是PCR的最后阶段),但是生信分析过程把这两个顺序颠倒过来了,我们需要先根据样本index,利用mkfastq 将reads进行demultiplex,分到各自的测序文库中去,然后对每个文库再处理barcodes信息 UMI的作用呢? 它是为处理PCR 扩增偏差而生 首先,不管是bulk RNA还是scRNA,都需要进行PCR扩增,但是不可避免有一些转录本会被扩增太多次,超过了真实表达量。当起始文库大小很小时(比如单细胞数据),就需要更多次的PCR过程,这个次数越多,引入的误差就越大 UMI就是Unique Molecular Identifier,由4-10个随机核苷酸组成,在mRNA反转录后,进入到文库中,每一个mRNA随机连上一个UMI,根据PCR结果可以计数不同的UMI,最终统计mRNA的数量。 UMI有几个要求: 不能是均聚物 ,如AAAAAAAAAA 不能有N碱基 不能包含碱基质量低于10的碱基 综上所述:raw fastq中包含以下信息 Library Barcode (Sample Index) - Used to pool multiple samples on one sequencing lane Cell Barcode (10x Barcode) – Used to identify the cell the read came from Unique Molecular Index (UMI) – Used to identify reads that arise during PCR replication Sequencing Reads – Used to identify the gene a read came from 那么这三个文件的名称需要修改吗? 我认为是需要修改的,因为命名太模糊,不容易指定文件进行下游分析。 然后看到官网给出的解答:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/2.0/using/fastq-input#wrongname ,也的确说需要修改 那么怎么改? 肯定要批量处理,就利用下载SRA的SRR ID好了 比如,将原来的SRR7692286_1.fastq.gz改成SRR7692286_S1_L001_I1_001.fastq.gz 依次类推,将原来_2的改成R1,将_3改成R2cat SRR_Acc_List-9245-3.txt | while read i ;do (mv ${i}_1*.gz ${i}_S1_L001_I1_001.fastq.gz;mv ${i}_2*.gz ${i}_S1_L001_R1_001.fastq.gz;mv ${i}_3*.gz ${i}_S1_L001_R2_001.fastq.gz);done |
CopyRight 2018-2019 实验室设备网 版权所有 |