TCGA计划的4个找somatic mutation的软件使用体验 您所在的位置:网站首页 somatic突变 TCGA计划的4个找somatic mutation的软件使用体验

TCGA计划的4个找somatic mutation的软件使用体验

2023-09-17 14:18| 来源: 网络整理| 查看: 265

TCGA计划的4个找somatic mutation的软件使用体验

体细胞突变(somatic mutation)是指患者某些组织或者器官后天性地发生了体细胞变异,虽然它不会遗传给后代个体,却可以通过细胞分裂,遗传给子代细胞。体细胞突变对肿瘤的发生发展有关键性的作用,并且它也是制定肿瘤癌症靶向治疗措施的关键所在。NGS使体细胞变异的检测更加全面,成本更低,在检测多种体细胞变异上具有很大的优势,但在使用过程中还存在着挑战:如样品降解、覆盖度不足、遗传异质性和组织污染(杂质)等问题。 为应对以上挑战,降低错误率,科学家采取了不同的算法和统计模型用于检测体细胞突变。目前最受欢迎的有Varscan、SomaticSniper、 Strelka 和MuTect2 。

这些软件大都是直接对肿瘤-正常样本的每个位点进行比较,对肿瘤样本中明显高于正常样本的次等位基因进行标记,作为体细胞变异,同时排除种系突变和杂合性丢失(LOH)情况。虽然这些软件具有较高的引用率,并在不断地更新,但仍存在不足:

a 缺乏完整可靠的实验来评估检测结果;

b 缺乏金标准,不能保证检测到的灵敏度和特异性最高;

c 在实际应用中,各软件的相对优缺点在很大程度上是未知的。

下面是TCGA计划采取的软件:

MuSE varscan MuTect SomaticSniper

当然,能找somatic mutation的软件还有很多,比如Strelka等,就不一一讲解啦。其实最基础的原理都是应该是 除去在normal样本里面出现过的germline变异位点,可以很简单的GATK UnifiedGenotyper followed by simple subtraction即可。

首先用mutect2

这个软件已经被整合到GATK里面啦,所以下载GATK即可使用它。

java软件,下载即可使用,GATK软件下载以前需要自行注册,目前是开放下载了,使用代码是:

GENOME=/home/jianmingzeng/reference/genome/human_g1k_v37/human_g1k_v37.fasta GATK=/home/jianmingzeng/biosoft/GATK/GenomeAnalysisTK.jar DBSNP=/home/jianmingzeng/annotation/variation/human/dbSNP/All_20160601.vcf.gz normal_bam=NPC10F-N_recal.bam tumor_bam=NPC10F-T_recal.bam sample=NPC10F ​ ​ java -Djava.io.tmpdir=$TMPDIR   -Xmx40g -jar $GATK  -T MuTect2 \ -R $GENOME -I:tumor $tumor_bam-I:normal $normal_bam \ --dbsnp  $DBSNP   -o ${sample}-mutect2.vcf

出来的结果里面有些比较陌生的tags,需要仔细理解,这样才能看懂vcf文件,并进行进一步的过滤。

##FILTER= ##FILTER= ##FILTER= ##FILTER= ##FILTER= ##FILTER= ##FILTER= ##FILTER= ##FILTER=

旧版的mutect只是对一个位点REJECT或者PASS,但是新版增加了多种情况来解释为什么REJECT,就是上面的那些tag的组合。

即使我把N-T反过来用mutect2来call somatic mutation,仍然会有125个位点PASS,只需要是在tumor里面纯粹的野生型,在normal里面是AF非常低的杂合即可。

其次是varscan

java软件都是下载即可使用,官网可以下载,我把它下载到了~/biosoft/VarScan/VarScan.v2.3.9.jar目录,使用代码是:

​ ​ TMPDIR=/home/jianmingzeng/tmp/software normal_bam=NPC10F-N_recal.bam tumor_bam=NPC10F-T_recal.bam sample=NPC10F ​ normal_pileup="samtools mpileup -q 1 -f $reference $normal_bam"; tumor_pileup="samtools mpileup -q 1 -f $reference $tumor_bam"; ​ # Next, issue a system call that pipes input from these commands into VarScan : java -Djava.io.tmpdir=$TMPDIR   -Xmx40g  -jar ~/biosoft/VarScan/VarScan.v2.3.9.jar \ somatic


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有