综述 您所在的位置:网站首页 传染病检测方法学分析文献综述 综述

综述

2024-07-02 03:59| 来源: 网络整理| 查看: 265

1 GWAS研究的兴起

复杂疾病是由环境因素与基因共同作用所致, 具有明显的遗传异质性和表型复杂化的特征, 且发病率高, 严重影响人们的身心健康. 越来越多的研究提示, 遗传因素在复杂疾病的发病过程中起到重要作用. 在关联研究方法提出以前, 研究人员主要利用连锁研究方法开展对复杂疾病/性状遗传易感性研究, 发现了一些疾病和性状的易感基因. 然而由于方法自身的局限性以及复杂疾病的表型复杂性、遗传异质性和种族差异性等特性, 以家系为基础的“全基因组连锁研究”的应用遇到了瓶颈, 人们对复杂疾病的研究效率存在质疑[1~3]. 以银屑病为例, 2002年, 安徽医科大学遗传性皮肤病研究团队[4]通过对中国汉族寻常型银屑病家系进行全基因组扫描, 发现4q31(PSORS9)上存在与寻常型银屑病相关的易感基因区域. 随后, 与中国国家人类基因南方研究中心陈竺和黄薇团队以及新加坡国立研究中心刘建军[5]合作, 再次对该区域进行精细定位, 缩小易感区域范围, 选择银屑病病例与正常对照开展候选基因SNPs筛查, 发现IL-15基因可能参与银屑病的发病机制. 但后续的研究发现, 连锁分析在复杂疾病家系中发现的易感位点或基因, 很难在复杂疾病散发病例中得以重复或验证, 因此连锁分析在寻找复杂疾病易感基因上面临困境. 2009~2010年, 本团队[6,7]先后对汉族人群银屑病开展GWAS系列研究, 进一步证实了1996年Risch和Merikangas[8]提出的关于常见复杂疾病的遗传学研究中关联分析较连锁研究有更高效力的理论. 随着HGP, HapMap和千人基因组计划的顺利完成, 人类基因组中常见变异位点的详细图谱已被获取[9]. 在此基础上选取出覆盖全基因组的代表性的分子标记位点, 研发出高通量的基因芯片, 对数百万个常见的变异位点进行成批检测. 研究成果能将遗传多态位点(高密度的遗传变异图谱)和特定疾病(性状)的风险联系起来, 使得GWAS成为可能, 从根本上改变了复杂疾病基因研究的“蓝图”.

图片来自:Activities

2 GWAS的发展

GWAS基于“常见疾病, 常见变异”(common disease, common variant)原理, 应用基因组中数以百万计的单核苷酸多态性(single nucleotide polymorphism, SNP)为分子遗传标记, 进行总体的关联分析, 在全基因组范围内选择遗传变异进行基因分型, 比较患者与对照组之间遗传变异及其频率的差异, 统计分析遗传变异与疾病/性状之间的相关性大小; 筛选出最相关的遗传变异开展多中心、大样本、反复验证, 最终确认与疾病/性状相关的遗传变异[10].

2.1 国际GWAS研究

2005年, Science报道了一篇年龄相关性视网膜黄斑变性的GWAS研究, 是国际上第一个关于复杂疾病易感基因GWAS研究的成果[11], 从此拉开全世界复杂疾病GWAS研究的序幕. 此后一系列复杂疾病易感基因的GWAS报道不断涌现, 研究成果相继发表在Science, Nature, Nat Genet和N Engl J Med等世界权威学术杂志上. 人类遗传变异相关研究入选Science 2007年“世界十大科学进展”; GWAS相关研究于2011年再次被Nature评为年度“重大发现和科学事件”第二位. 据美国NIH全基因组关联研究权威数据库收录(http://www.genome.gov/GWAStudies/). 统计显示, 目前肿瘤、自身免疫性疾病、心血管疾病、神经退行性疾病、精神疾病、炎症性疾病、感染性疾病等, 以及肥胖、身高、肤色、骨密度、血脂等与人类生命密切相关的重要复杂疾病/性状的易感基因被陆续揭示[12]. 截至2018年12月, 该数据库共收录了3675篇相关科技论文, 覆盖了1995个人类复杂疾病或性状, 包含了与这些疾病/性状相关的68289个SNPs, 推动了人类对这些疾病/性状的认识. 该研究方法已成为搜寻易感基因最为有效的手段, 为探讨复杂疾病/性状遗传学发病机制的搜寻提供新的思路和方法, 从而揭示疾病发生、发展与治疗相关的遗传基因.

2.2 中国的GWAS研究

GWAS作为揭示复杂遗传性疾病易感基因的一种行之有效的方法而备受关注. 中国拥有最大的医学资源市场和庞大的患者群体, 具有民族多样性, 且疾病结构谱正在发生改变, 慢性疾病逐渐增多, 有利于进行大规模的基因分型研究, 揭示复杂疾病的遗传学机制, 为复杂疾病的防治指明方向. 此前中国已积极参与各项人类基因组计划, 包括HGP, HapMap以及千人基因组计划, 促进国际交流, GWAS研究基础扎实. 中国在GWAS研究领域虽然起步较晚, 但是在相关复杂疾病及性状的研究领域也做出了突出的贡献并取得重大成果. 上海交通大学Bio-X研究院的贺林、安徽医科大学张学军和孙良丹[13], 在Nature发表了题为“The progress of GWAS in China”的点评性文章, 介绍了中国在复杂疾病GWAS研究领域的进展. 中国研究人员已经对30余种不同的人类疾病进行GWAS研究, 占国际GWAS研究疾病的18.5%, 占国际GWAS发表同类论文的8.1%. 国内GWAS疾病主要包括: 精神疾病(例如精神分裂症、自闭症等)、癌症(例如肝癌、肺癌、鼻咽癌、宫颈癌、食道癌等)、谢性疾病(例如2型糖尿病、多囊卵巢综合征和骨质疏松症)、自身免疫性疾病(例如IgA肾病和强直性脊柱炎)、心血管疾病(例如冠状动脉疾病、高血压)、皮肤复杂疾病(例如银屑病、系统性红斑狼疮、麻风、白癜风和特应性皮炎)等. 上述这些GWAS研究报道了约120个与疾病/性状的易感基因座(http://www.genome.gov/GWAStudies/). 据不完全统计, 截止到2018年12月, GWAS权威数据库已收录中国科学家发表的GWAS研究共计179篇, 包括在N Engl J Med上发表2篇, Nat Genet上发表44篇; 研究的疾病/性状涵盖127种, 病例样本数量约30万, 对照样本数量近40万.

2009年, 安徽医科大学张学军团队与国家人类基因组南方研究中心陈竺、黄薇等17个团队[6]合作发表的中国第一篇GWAS成果. 利用GWAS研究策略首次发现, 位于染色体1q21上的LCE基因是银屑病的易感基因, 该基因编码表皮终末分化角质外膜蛋白, 与银屑病最基本的组织病理学改变——角质形成细胞过度增殖密切相关. Nature China评价“LCE基因有望成为未来银屑病治疗靶标”. 2010年, 该团队在前期银屑病GWAS研究基础上进行了多阶段研究, 又发现6个银屑病易感基因[7], 增加了银屑病的遗传风险因子, 其中一些已被证实与某些自身免疫疾病相关. 随后与深圳华大基因研究院的杨焕明、汪建、王俊团队合作[14], 通过外显子测序和靶向测序发现了7个常见和低频的非同义风险编码SNPs与银屑病发病风险相关, 不仅揭示了疾病免疫失衡的机制和关键调控靶点, 也为新的免疫干预治疗策略提供理论基础和实验依据. 此后, 安徽医科大学皮肤病研究所团队[15~20]又陆续完成系统性红斑狼疮(SLE)、麻风、白癜风、特应性皮炎的系列GWAS研究, 相关成果入选2010年度“中国科学十大进展”. 这些易感基因/位点的发现为阐明疾病的遗传学发病机制提供重要理论依据, 也为国内其他团队研究复杂疾病提供了宝贵的经验.

中国科学家在肿瘤、精神/神经疾病、口腔疾病等疾病易感基因研究上也做出了非凡成就. 2010年, 北京蛋白质组研究中心贺福初团队[21]利用GWAS方法发现1p36.22区域是肝癌新的易感位点, 提示KIF1B, UBE4B或PGD基因相关通路可能参与肿瘤的发病机制. 第二军医大学孙颖浩研究团队[22]在中国人群中发现2个前列腺癌易感位点; 中国科学院昆明动物研究所张亚平研究团队[23]通过GWAS鉴别出了中国汉族人群重型痤疮的2个易感位点等, 基因表达研究显示, 痤疮患者皮损中SELL基因表达水平明显升高, 从而促进痤疮患者炎症反应加重. 上海交通大学Bio-X研究院贺林研究团队[24]通过GWAS发现染色体8p12区域和1q24.2区域内的基因变异影响脑组织中ASH2L, DDHD2, PPAPDC1B, LETM2和FGFR1基因表达; 在精神分裂症和重度抑郁症患者脑海马组织中, FGFR1表达水平明显升高从而影响儿茶酚胺能神经元的功能, 从而可能与精神分裂症的发病机制相关. 中国医学科学院和北京协和医学院林东昕研究团队[25]在中国人胰腺癌的GWAS研究中分别发现5个肿瘤相关易感基因, 为胰腺癌的治疗提供分子靶标. 广州中山大学曾益新研究团队[26]在鼻咽癌的GWAS研究中发现3个易感基因/位点, 提示转化生长因子β和c-Jun N端激酶信号通路在鼻咽癌发病过程中的重要作用. 中国医学科学院阜外医院顾东风研究团队[27]利用GWAS在汉族人群中发现了4个冠状动脉疾病易感位点. 华中科技大学同济医学院马丁研究团队[28]在宫颈癌的GWAS研究中成功发现2个易感位点, 进一步强化了遗传免疫学及一些致癌因素通过影响持续感染及HPV的共同作用机制在宫颈癌的发病风险中发挥重要作用的理论, 为宫颈癌的遗传学研究拓展了新的思路. 南京医科大学沈洪兵研究团队[29]利用GWAS成功鉴定出4个肺癌风险易感区域, 其中2个位点(13q12.12和22q12.2)是首次报道的中国人群肺癌易感位点, 13q12.12区域的TNFRSF19可能参与 c-Jun氨基末端激酶通路, 调节非caspase依赖性的细胞死亡. 22q12.2区域的LIF可能通过活化Janus激酶/信号传导和转录激活因子3途径参与肺癌的发病机制. 华中科技大学邬堂春研究团队[30]发现位于6p21.3区域的HSPA1B基因启动子多态性与中国汉族人群肺癌的发生风险和预后有关. 中南大学夏昆团队[31]鉴定一个自闭症易感位点, 该区域的TRIM33基因不仅在其他与自闭症有着许多相似特征的精神疾病有关, 且在自闭症患者的大脑中表达有显著差异, 因此为揭示自闭症的发病机制提供新的思路. 北京大学精神卫生研究所张岱团队[32]鉴定出一个与精神分裂症相关的易感位点, 该位点的NKAPL基因可能在早期神经发育过程中参与调节神经元的迁移; 另一个基因ZKSCAN4可能通过影响出生后的大脑发育过程参与精神分裂症的发病机制. 河南新乡医学院癌症研究中心王立东[33]在人类第10号和20号染色体上首次发现两个食管癌易感基因, PLCE1基因可能参与调节细胞生长、分化、凋亡和血管生成. C20orf54基因负责运输核黄素作用, 而核黄素缺乏已被证明是食道鳞状细胞癌和贲门腺癌的危险因素, 随后中国医学科学院肿瘤医院肿瘤研究所林东昕研究团队与王立东团队[34]合作, 通过扩大样本量再次发现两个食管癌相关易感位点, 其中TMEM173基因可通过产生1型干扰素, 促进对病毒和细菌的先天免疫反应参与肿瘤的发生发展过程, 为中国食管癌发病机制研究提供了重要的遗传学证据. 武汉大学口腔医院边专团队[35]发现14个新的非综合征型唇腭裂相关易感基因, 大大增加NSCLP的遗传易感性位点的数量以及对颅面畸形遗传病因学的重要见解. 安徽医科大学汪凯和北京大学第三医院邓敏研究团队[36]通过GWAS发现两个肌萎缩侧索硬化易感位点, 这两个位点可解释中国汉族人群该病12.48%疾病风险性, 提示肌萎缩性脊髓侧索硬化症新的发病机制以及遗传异质性. 复旦大学余龙团队[37]运用GWAS发现两个与肝癌(乙肝)相关的易感基因. 山东省皮肤病与性病防治研究所张福仁[17]通过GWAS发现NOD2, RIPK2, TNFSF15, HLA-DRB1和PARK2基因遗传变异, 通过调节干扰素-γ水平, 影响NF-κB和NOD2介导的生物学信号通路而参与其疾病可能的发病机制, 随后再次利用GWAS深入分析, 发现两个与麻风病相关的易感基因, 揭示了IL23R在感染性疾病易感性中的作用, 提示自吞噬作用参与麻风发病机制[38]. 第二军医大学附属长征医院徐沪济研究团队[39]在中国汉族人群类风湿关节炎中发现了两个新的易感位点, 揭示了不同人群类风湿性关节炎遗传背景的异同. 北京协和医院张奉春团队[40]通过GWAS鉴定出一个与原发性干燥综合征相关的易感位点, 提示T细胞和B细胞免疫信号在该病中的作用. 中国科学院上海生命科学研究院林旭团队[41]发现两个中国汉族人群T2D特有的易感位点, 揭示不同人群2型糖尿病遗传易感性的差异, 并揭示该病β细胞受损和胰岛素敏感性降低的机制. 中山大学附属第一医院余学清研究团队[42]则从中国汉族人群中鉴定出了IgA肾病的多个易感位点, 进一步证明了免疫和炎症中涉及的遗传多态性可以影响IgA肾病的易感性和临床表现. 上海交通大学医学院附属仁济医院马雄团队、东南大学生命科学研究院刘向东课题组及苏州大学附属第一人民医院陈卫昌团队[43]的合作研究, 揭示了染色体6个区域内的基因与原发性胆汁性胆管炎(PBC)的发病机制相关, 支持IL21信号通路和Tfh细胞参与原发性胆汁性胆管炎发病的假说. 人类疾病基因研究四川省重点实验室杨正林研究团队[44]鉴定出一个与高度近视眼相关的易感基因, 表明不同种族人群存在遗传异质性, 这为高度近视的发病机制提供了有价值的参考等. 以上GWAS成果进一步促进了复杂疾病的遗传学发病机制研究, 为疾病的风险预测、临床诊断、药物开发及个体化用药指导等提供了理论基础, 相关成果均在国际顶级杂志N Engl J Med, Nature及其子刊等发表. 多项成果入选贺林院士[45]撰写的我国改革开放40年医学遗传学辉煌成就中(表S1).

复旦大学金力和新加坡国立研究中心刘建军[46,47]在近年来开展的GWAS研究中发现, 不同人群、不同地域的群体存在明显的差异. 分析汉族人群的GWAS数据, 发现中国的南北人群间存在着明显的遗传异质性. 在最近开展的SLE多人群GWAS Meta分析中, 发现了HLA区域和IRF5位点在不同人群中的显著遗传异质性[48]. 疾病在不同人群中的遗传异质性提示, 不同人群中存在特异的疾病生物学标记, 进一步证明开展中国人群特异性GWAS研究在揭示中国人群疾病特异性发生机制、发掘潜在关键性分子标志物, 以及开发适应中国人群的特异性新药治疗靶点等方面有重要意义[49].

在中国科学院文献情报中心与汤森路透旗下的知识产权与科技事业部联合举办和发布的《2014研究前沿》中, “全基因组关联研究在人类疾病等复杂性状研究中的应用”被称为生物科学领域年均被引频次最高的热点研究前沿. 2016年实施的“精准医学研究”是被优先启动的重点专项之一, 其中涉及多类常见高发、危害重大疾病的基因组学研究. 利用GWAS的研究方法, 为引领遗传学、临床医学等各个相关学科的研究, 以及生物医学发展带来新的契机. 由此可见, 对中国人群开展更多、更大规模的GWAS研究具有至关重要的意义.

2.3 国际疾病基因组学研究论坛

中国复杂疾病易感基因研究整体水平达到国际先进, 受到国际学术界高度关注和认可. 为进一步推动全基因组关联研究在中国的应用, 促进国际合作, 2011年, 由国际知名的自然出版集团与安徽医科大学共同主办的第一届全基因组关联研究国际论坛在合肥隆重举行. 为提升全基因组关联研究国际论坛学术影响力, 自然出版集团随后与中国GWAS科研团队多次联手, 先后于2012~2019年分别在杭州、上海、北京、长沙、深圳、广州、成都、南京又连续成功举办了共计九届全基因组关联研究国际论坛, 搭建高端学术平台, 增强中国疾病基因组研究领域的国内外学术交流与合作. 该项国际盛会的多次召开, 得到Nat Genet主编的高度认可, 先后3次发表专论称赞会议的成功, 具有即时的、广泛的战略意义. 2011年, 首届论坛成功召开, Nat Genet主编发表专论“Milestone in Anhui”, 充分强调开展多国际中心的全基因组关联研究有助于深入挖掘复杂疾病/性状的生物学发病机制[50]. 2012年, 第二届论坛成功召开, Nat Genet主编发表专论“Asking for more”, 指出随着全基因组关联研究的应用, 需要对前期发现的易感位点进行精细定位研究, 进一步发现与疾病相关的功能变异, 从而鉴别疾病易感基因[51]. 2016年, 第六届论坛成功召开, Nat Genet主编发表专论“Genome variation in precision medicine”, 在全外显子组范围内搜寻与疾病相关的变异有利于推动精准医学的发展, 安徽医科大学张学军教授研究团队[14]利用全基因组外显子测序和靶向测序, 鉴定MHC区域可能存在多个与疾病相关的编码变异, 该项工作的成功开展显示器官移植供体和受体遗传多样性和分布, 可能成为未来健康研究的核心[52]. 本论坛旨在围绕疾病遗传学和基因组学研究领域的前沿和热点, 通过时任Nat Genet主编Myles Axton等权威专家学者的主题报告和专题讨论的形式, 探讨疾病遗传学和基因组学发展方向和趋势, 推进疾病遗传学和基因组学研究成果向临床转化应用, 增进学术交流, 促进国际合作, 搭建国内外合作交流平台, 进而为如何利用发现的疾病潜在治疗靶点和生物学标记服务社会公共卫生和提升人类健康水平提供依据.

3 GWAS研究的扩展

随着GWAS在多种疾病中的广泛应用, 研究者们开始察觉GWAS发现的绝大部分变异并不能够完全解释疾病的发病风险(OR 1.1~1.5)[53]. 许多复杂疾病是由罕见变异造成的[54], 而这种基于芯片的 GWAS 在实验的最开始就漏掉了这部分信息, 因而无法解释复杂的遗传特征. 因此, GWAS后续研究亟须扩展新的方法和研究领域, 如高通量测序、表观基因组学研究、基因型填补研究、eQTL及药物基因组学研究等方法, 来捕获罕见的致病性变异. 这些新方法发现的致病性变异将与GWAS研究成果形成互补, 更准确地揭示疾病复杂的致病机理.

图片来源于网络

3.1 高通量测序

2006年, 以Illumina/Solexa为代表的新一代测序仪的推出, 为基因组多态性的识别带来新的解决方案. 人类基因组绝大部分由重复序列和非蛋白编码区域构成, 而外显子区域, 即蛋白编码区, 仅占人类基因组的1%, 是基因组中与功能最为相关的部分, 85%的功能变异都潜藏在外显子中. 因此, 选择性地针对全基因组编码区(外显子组)进行测序, 将大大降低测序费用, 同时获取最有价值的信息[55]. 随着 2008 年 Ng等人[56]首次对一个体外显子组的变异进行全面分析, 多项运用新一代测序技术进行全基因组外显子测序的研究已经相继开展. Sarah等人[57,58]利用Illumina Genome Analyzer II系统, 先后对4例弗里曼谢尔登综合征(FSS)和4例米勒综合征(Miller syndrome)进行外显子测序, 通过多步骤分类过滤法, 准确鉴定出FSS的致病基因MYH3的突变, 并成功发现了米勒综合征的致病基因DHODH. 外显子测序也同样成功地应用于各种肿瘤(如胰腺癌[59]、类胶质母细胞瘤[60]等多基因复杂疾病). 寻找易感基因的研究中. Jones等人[61]通过对一例胰腺癌患者的全部外显子序列分析, 发现了一个新的易感基因PALB2, 该基因的突变可以解释约3%的家族性胰腺癌的发生. Huyghe等人[62]利用基于全基因组测序技术的GWAS研究, 发现结直肠癌人群在CHD1上有一个保护型的强关联变异信号. 同时通过对125478人的大数据进行整合, 开展Meta分析, 又发现了40个新的独立遗传信号(P 0.2)且具有中度效力(OR≥1.2)的变异; 而对于频率低(MAF



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有