Science发布基因组比对革新技术:泛基因组学映射工具Giraffe 您所在的位置:网站首页 giraffe的短语 Science发布基因组比对革新技术:泛基因组学映射工具Giraffe

Science发布基因组比对革新技术:泛基因组学映射工具Giraffe

#Science发布基因组比对革新技术:泛基因组学映射工具Giraffe| 来源: 网络整理| 查看: 265

74db919f2b789456e9b7254ced2cc2e1.png

目前,基因测序普遍使用的DNA测序仪主要基于短读长测序技术,在获得基因组序列片段后,将其映射到参考基因组序列中来确定染色体位置,识别出其与基因组参照的差异。但完全依赖单一参考序列来鉴别具有遗传多样性的人类亚群中的遗传变异时,不可避免会出现对不同基因组参照序列的错误映射。近年来,随着参考基因组的不断发布以及基因组间的相互比较,人们逐渐认识到单一参考基因组不能代表物种内的多样性,由此,泛基因组(Pan-genome)应运而生。 

泛基因组能够在短读长测序数据集中识别单一参考基因组难以发现的结构变异(SV),了解这些SV的功能影响、与疾病的关联或和进化中的作用。此外,泛基因组还包含多种完整基因组组装及其同源信息。

近日,美国加州大学圣克鲁斯基因研究所的Benedict Paten研究团队在Science杂志上发表了题为“Pangenomics enables genotyping of known structural variants in 5202 diverse genomes”的研究文章。研究团队开发了一种泛基因组短读长映射工具——Giraffe,能够高效地将单个测序reads映射到包含数千个人类基因组的泛基因组上,其运行速度与VG-MAP等现有标准映射方法相当,且减少了映射偏差。Giraffe可基于短读长测序数据对SNV、InDel以及SV进行更准确地基因型分析。研究团队利用Giraffe对5,202个不同人类基因组中的167,000个SV进行基因分型,结果显示Giraffe对SV基因分型具有较高的准确度。同时,Giraffe可以更全面地描述遗传变异的特征,对变异进行更全面的表征,进而改进基因组分析。 

bd31397569215a16b1052f68b4b1e8cc.png

文章发表于Science 

Giraffe的设计基础是:单个测序reads可以与GBWT无间隙局部比对直至末端,序列中不匹配的间隙能够通过间隙比对的方法解决,有效地处理了复杂的图形区域(图1)。Giraffe首先通过读取个体基因组中的参考单倍型将其graph Burrows-Wheeler transform (GBWT)作为输入,并表示为一系列彩色矩形,然后再按照它们在序列中对应的节点进行分割,根据GBWT与序列中节点的同源性进行着色。其中,单个测序reads和GBWT所匹配的最小长度片段被定义为“Seed”(黑框部分),Giraffe可以列举出Seed并按其在序列中的间距(以核苷酸为单位测量)进行聚类,对“高分”的Seed进行线性拓展使其与GBWT最大化地无间隙局部比对。

77ec277cb757fc2d863888da66920cb9.png

图1. Giraffe 操作视图。来源:Science

参考泛基因组可以从多个基因组序列中创建,使用数学图形结构来表示不同序列之间的关系。研究人员利用公开的GRCh38人类参考基因组构建了“1000GP”和“HGSVC”(图2B)两个人类基因组参考图来替代传统线性参考图(图2A)评估Giraffe。 “1000GP”主要包含来自2503个人的76,749,431个SNV,其中包含3,177,111个InDels(



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有