鱼腥草转录组SSR位点信息分析及其多态性研究 您所在的位置:网站首页 基元类型是什么意思啊 鱼腥草转录组SSR位点信息分析及其多态性研究

鱼腥草转录组SSR位点信息分析及其多态性研究

2024-07-06 00:03| 来源: 网络整理| 查看: 265

鱼腥草Houttuynia cordata Thunb.为三白草科(Saururaceae)蕺菜属Houttuynia Thunb.植物[1],因其全株有特殊的鱼腥气味而得名,鱼腥草别名侧耳根、猪鼻孔、狗贴耳等。鱼腥草作为一种具有清热解毒,利尿消肿等功效的中药材,使用历史悠久[2]。其注射液常用来治疗呼吸道、泌尿系统炎症疾病,外科手术中也常用鱼腥草提取液进行消炎、抑菌。对消化系统疾病、皮肤病等也有很好的疗效[3]。

DNA分子标记能在分子水平上检测出DNA遗传多态性,具有较大的应用价值[4]。迄今在鱼腥草植物中所用到的分子标记仍局限于随机扩增多态DNA(RAPD)[5-6]和扩增简单重复序列间区(ISSR)[7]等随机引物标记。由于其稳定性和重现性一直备受质疑,因此目前已较少使用。最常用的特异标记简单序列重复(simple sequence sepeat,SSR)因其重现性好,扩增靶序列在基因组中位置确定等优点,备受研究者青睐。然而,SSR标记的开发难度大,不仅费时费力,且费用很高,多局限在具备全基因组数据或大量表达序列标签的物种中进行开发[8]。目前尚未见鱼腥草植物中开发SSR标记的报道。

前期课题组成员对鱼腥草进行了转录组测序,获得了大量的unigenes序列,本研究将尝试利用这些序列,首次开发鱼腥草的SSR标记,期望这些标记可以用于鱼腥草的亲缘关系分析、种源鉴定及遗传图谱构建等方面的研究。

1 材料与方法 1.1 鱼腥草样品采集、转录组测序与SSR的筛选

采集不同产地的样品16份(表 1),经怀化学院伍贤进教授鉴定为鱼腥草Houttuynia cordata Thunb.。鱼腥草地下茎、地上茎、花和叶片RNA混合样品的转录组测序由华大基因公司进行,共获得185 276条Contigs,组装出63 954条unigenes。以组装出来的Unigene作为参考序列,使用SSR软件MicroSAtellite(http://pgrc.ipk-gatersleben.-de/misa/),来找出所有的SSR。参数设置为“1-12、2-6、3-5、4-5、5-4、6-4”,1-12代表单碱基重复至少12次才算SSR,双碱基6次,三碱基5次,以此类推,重复单元最多有6个碱基。

表 1(Table 1) 表 1 不同来源的鱼腥草材料 Table 1 H. cordata from different sources 编号 来源 编号 来源 1 云南昆明 9 广西陆川 2 贵州花溪 10 江苏连云港 3 四川乐山 11 湖北大悟 4 四川峨眉山 12 湖南株洲 5 重庆 13 江西瑞昌 6 陕西西安 14 湖南溆浦 7 浙江兰溪 15 湖南鹤城杨村 8 广西博白 16 湖南鹤城杨村 表 1 不同来源的鱼腥草材料 Table 1 H. cordata from different sources 1.2 SSR引物设计

对所有SSR重复单元在unigene上前后序列的长度进行筛选。只保留前后序列均不小于150 bp的SSR,用Primer3软件对其设计引物。为验证SSR引物是否可用和检测SSR的可靠性,随机选择合成50对引物,由生工生物工程(上海)股份有限公司合成,然后进行PCR扩增。

1.3 鱼腥草基因组DNA提取与PCR扩增

采用改进的CTAB法提取鱼腥草基因组DNA。利用核酸/蛋白定量仪定量。定量后的DNA稀释至30 μg/mL以备PCR扩增用。反应体系:10×buffer 2 μL,1 mol/L MgCl2 1 μL,10 μmol/L上游引物和下游引物各0.7 μL,2.5 mmol/L dNTPs 1 μL,Taq DNA polymerase 0.5 μL,10 mg/L模板DNA 2 μL,加ddH2O至总16 μL。反应条件为94 ℃预变性1 min,94 ℃变性30 s,最佳Tm退火30 s,72 ℃延伸30 s,循环35次,72 ℃延伸5 min。取扩增产物2 μL先用1.5%琼脂糖判断是否具有多态性条带,确定具有多态性条带的,将剩余产物用8%非变性聚丙烯酰胺凝胶检测,进行基因分型与条带读取。

1.4 数据处理

采用人工读带的方法,将电泳图上可重复的、清晰的条带计为“1”,同一位置无带或不易分辨的弱带计为“0”,建立原始数据矩阵。利用软件Popgene 32计算每对引物扩增位点的等位位点数、多态性信息量、遗传距离,用Mega4软件进行UPGMA聚类分析。

2 结果与分析 2.1 鱼腥草转录组SSR位点数量与分布

对鱼腥草转录组测序获得总长度为43 395 361 bp的63 954条unigenes数目进行检测,在4 413条unigenes数目中找到符合条件的SSR,发生频率(含有SSR的unigenes数目与总unigenes数目之比)为6.9%,其中357条unigenes含1个以上SSR位点,4 056条unigenes数目含单个SSR位点,共检出4 800个SSR位点,复合SSR位点164个。转录组中SSR位点的出现频率(SSR数目与总unigene的数目比值)为7.51%。从分布情况看,鱼腥草转录组中平均9.04 kb有1个SSR。但不同重复基序长度SSR分布的平均距离差别巨大,其中三核苷酸重复最多(1 994个),分布平均距离21.76 kb/SSR,Quad-nucleotide repeat最少(39个),每条SSR分布平均距离1 112.7 kb(表 2)。鱼腥草转录组SSR位点的序列总长达80 754 bp,其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基元的SSR位点的碱基总长分别是17 587、25 362、33 012、800、1 365、2 628 bp。各类型SSR位点的平均长度分别是13、19、17、21、21、24 bp(表 2)。

表 2(Table 2) 表 2 SSR在鱼腥草转录组中的出现频率 Table 2 Occurrence frequency of SSRs in H. cordata transcriptome 重复类型 数目 各类型比例/% 频率/% 平均距离/kb 总长度/bp 平均长度/bp 单核苷酸 1 313 27.35 2.05 33.05 17 587 13 二核苷酸 1 278 26.63 2.00 33.96 25 362 19 三核苷酸 1 994 41.54 3.12 21.76 33 012 17 四核苷酸 39 0.81 0.06 1 112.70 800 21 五核苷酸 66 1.38 0.10 657.55 1 365 21 六核苷酸 110 2.29 0.17 394.50 2 628 24 表 2 SSR在鱼腥草转录组中的出现频率 Table 2 Occurrence frequency of SSRs in H. cordata transcriptome 2.2 鱼腥草转录组SSR的特性

鱼腥草转录组SSR种类丰富,一至六核苷酸重复类型都能看到,但各类型出现频率不同,主要是单核苷酸、二核苷酸和三核苷酸重复,占总SSR的95.52%,其中三核苷酸重复最多,占41.54%,其次是二核苷酸重复和单核苷酸重复类型,分别占26.63%和27.35%,四核苷酸、五核苷酸和六核苷酸重复类型的数量较少,分别占0.81%、1.38%、2.29%。从重复次数来看,发现重复基元以重复5次出现的频率最高,有1 426个,占总SSRs的29.71%,其次是重复6次、≥13次、12次、7次和8次,分别有980、710、608、492、223个SSR,分别占总SSR的20.42%、14.77%、12.59%、10.25%和4.65%,最少的为重复基元重复11次,只有80个,占1.7%(表 3)。对鱼腥草转录组SSR统计分析,发现共有232种重复基元,其中单核苷酸的A/T、G/C重复基元2种。

表 3(Table 3) 表 3 鱼腥草SSR不同基序长度和重复的数量分布 Table 3 Distribution of SSR with different motif types and repeat numbers in H. cordata 重复类型 重复次数 5 6 7 8 9 10 11 12 ≥13 单核苷酸 — — — — — — — 604 709 二核苷酸 — 446 284 202 145 119 78 4 0 三核苷酸 1 275 481 208 21 3 0 2 0 4 四核苷酸 0 34 5 0 0 0 0 0 0 五核苷酸 57 9 0 0 0 0 0 0 0 六核苷酸 94 10 2 3 0 0 0 0 1 表 3 鱼腥草SSR不同基序长度和重复的数量分布 Table 3 Distribution of SSR with different motif types and repeat numbers in H. cordata

二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基元分别有12、58、26、52、84种。从出现频率来看,占优势的重复基元类型是单核苷酸重复基元,其次是二核苷酸和三核苷酸重复基元,其他四核苷酸、五核苷酸和六核苷酸重复基元类型分布较少,出现频率较低(图 1)。

图 1 鱼腥草不同基序SSR类型的频率分布 Fig.1 Frequency distribution of SSR based on different motif sequence types in H. cordata

对二核苷酸和三核苷酸重复基元深入分析,按照4种碱基随机随机组合的方式统计后,发现二核苷酸和三核苷酸重复基元分别为4种和10种,即这2种核苷酸重复基元类型在鱼腥草SSR序列中全部存在。其中二核苷酸重复基元出现最多的是AG/CT,共有1 108个,占该重复基元的86.70%,其他的2种AT/GC、AC/GT则分别仅占6.34%和6.96%;三核苷酸重复种类较多,最多的重复基元为GAA/CTT,共有336个,GAA/CCT也有333个,分别占三核苷酸重复基元的16.85%、16.70%。其次的为GGT/CCA(共有168个)、AGA/TCT(共有153个)、GAG/CTC(共有153个)、GCT/CGA(共有89个)、CAG/GTC(共有62个)。

2.3 SSR引物筛选与验证

选择前后序列均不小于150 bp的SSR 50个,根据引物设计原则,应用软件Primer3设计引物,对所获得的4 800个SSR位点设计引物,共开发出3 068个候选SSR引物。随机挑选了50对引物,其中有43对引物能扩增出清晰条带,并表现出多态性差异,多态信息量(PIC)为0.49~0.96,平均值为0.72;等位基因数范围为3~10,平均为5.74,表观杂合度(Ho),期望杂合度(He)见表 4。利用SSR多态性对16个鱼腥草材料进行聚类分析,聚类结果显示,峨嵋蕺菜单独聚为一类;其他群体聚为一类。四川群体与其他各个省群体分别列为2个亚类;云南、贵州、重庆等的遗传距离较近聚为一群;湖南、湖北的遗传距离较近聚为一群;广西、江西、浙江等的遗传距离较近聚为一群(图 2)。

表 4(Table 4) 表 4 SSR-PCR 筛选引物 Table 4 Screening primers of SSR-PCR 引物 SSRs 正向引物 (5’-3’) 反向引物 (5’-3’) 等位基因数 Ho He PIC HM_1 (TGA)5 GAAGCTTAAGGAGGTAGAGGCTG CAGTAAGTTGTGTCCAAAGGTGC 3 1.00 0.59 0.49 HM_2 (AGA)6 GAAGGACTGCAAGAAACTCTGAA CCCCATCTTCTGTCTCTTCTCTT 7 1.00 0.86 0.84 HM_3 (AC)7 AAACATGCATTGTCACATACAGC AGAGCTCGCGAAATATACTGTTG 6 0.89 0.93 0.93 HM_4 (GGA)5 CGACGACGATGAGACGGT GAGCCCACCCCATCTTTC 4 1.00 0.71 0.63 HM_5 (AG)10 AAGGGGAGAGAAAGAAAGAGAGC CCATAATAAAGCTCAATGCTGCT 6 1.00 0.84 0.79 HM_6 (CTC)5 CTACCAAACCCCTCTCCAAAAT GCAGCAGCAGTAGAGGATTTG 8 0.60 0.79 0.68 HM_7 (GCT)5 CTCGTTCGGCAAACTGCT CGCGTATTATGAGCAGGATTACT 5 0.91 0.90 0.89 HM_8 (TCC)5 CAGTCCTGGTGGACATACTTGAT CAATCGATGATGAGGAAGAAAAC 4 1.00 0.73 0.66 HM_9 (TGA)6 CTGCTGAGTCTGCATTAATTCCT CAGCAGCTTCAGATACCTCAGA 7 1.00 0.79 0.75 HM_10 (AG)6 TATGGTGATAATAATTCCGGTCG TTCTCCCAAATGATGGATGATAA 8 0.67 0.80 0.72 HM_11 (TGG)5 GGTGCAGGTGTTGATGTCCT CAAGGAGAAGTTCGAGGAGGT 10 0.65 0.82 0.73 HM_12 (TTC)6 GAGTCTTCCATTTCTTTTGCTGA GAGTGATGTGGAATGCTCTCTTC 4 1.00 0.76 0.70 HM_13 (TGA)7 GAGCATGACCTTAAAAAGGATGA TAGACAAAAAGAATACCATCGGC 4 1.00 0.75 0.68 HM_14 (TA)7 CATGTCAACGTCATCTGTAGCAT ATTTGGGTAGGGTACTGGAGCTA 5 0.80 0.69 0.65 HM_15 (CT)6 ACCATCTCCTCCGTTCCAC GGAAGTAAAGATCGAGGAGGTCT 8 1.00 0.89 0.84 HM_16 (GCG)6 AGTGATACCTCCTTCTTCCGCTA AGCAACAGGTGACAACGTACC 7 0.63 0.82 0.65 HM_17 (TTC)5 GAGTGAAAGTGTTTGCTTTGGAG CCAACAGAACCAAATAAAACCAA 6 1.00 0.85 0.80 HM_18 (ACT)5 AATTCGAACGCGTAATCATCTT CTAACTTCGTCGAATTGGGTCTT 6 0.54 0.65 0.63 HM_19 (CCA)5 CCTCCTCCTCTTATGGGGG GTGGTGGCGGTCTATTTTCTAA 4 0.58 0.96 0.96 HM_20 (TCA)5 TCAGTATTGAATTTTGTCTCCCC CTTGTTAAACGAGTGATATCGGG 7 0.88 0.79 0.78 HM_21 (GA)8 AAATAGAGTTACAGGCCCCAAAA CTTTGTACTTTTGCGTCCACTTT 8 0.64 0.83 0.76 HM_22 (TTC)5 TTCTGCTTCTTCCCCTTCTTATT GCTTTTACAGAGACCTCTTGTGC 4 0.50 0.67 0.62 HM_23 (TCT)6 GCATTACAAGAACCCAAACACAT ACTACTGGTTCTAAGCGAGGAGC 4 1.00 0.68 0.60 HM_24 (GAA)5 AAATTTTAACAGCAATTCCTCCG TCCTTCTCTGATCTAGGGTTTCC 4 1.00 0.65 0.57 HM_25 (GCG)6 AAGGAGTCCCTGGATACTGCTAC ACCACAAAACGAACGGATTC 7 0.40 0.61 0.52 HM_26 (CT)7 TTCTTCGCTTCTAGATTCCCTTT TCTAGCCAAAGTCTTCCTTCCTT 8 0.67 0.76 0.65 HM_27 (GA)8 ATCAAAGCTGCAAGCTTATATCG TTGTTCACCACTGGAATCACA 5 0.60 0.80 0.73 HM_28 (GGA)5 GGTCTACGGCAAACAGACTAGC CGATCCTCCAACTCCAAAAA 7 0.59 0.80 0.71 HM_29 (AT) 8 CTAGCAGACTGGATGTTGGTTTT GTAAGGCGCATAATACTTGTTGC 4 1.00 0.73 0.66 HM_30 (GCT) 5 AGATCCCCACCCTTTCTTGTAT ATGACTTGATGAAAAAGAGGCAA 4 1.00 0.75 0.68 HM_31 (GCCCCA) 4 GGCATTGCCTATAGAAGAAGTATCA CATTGTTCCACCTGGGTAAGAT 5 0.75 0.63 0.59 HM_32 (TGT) 7 GTACGAAGAGGAGGAATTGGG TCAGAAAAGAAAAACCAGACCAA 8 1.00 0.87 0.82 HM_33 (TCC) 5 GTCAGATCGAGGAGCGTAAATC CCTCCTGATGGAATGAAGATG 6 0.68 0.78 0.67 HM_34 (GAA) 7 GACGCAAGGTAACCCTCAATAAT ATTGCTTTCACTCTGGTTGTCAT 5 0.52 0.71 0.64 HM_35 (GGCGAT) 7 GAGGGAAGAAGGCGATCAG CTGTCTTCTCGAGGACTGCTCT 3 1.00 0.63 0.54 HM_36 (TC) 9 ATTCCCTTCTTCTCTGCCTCTC CGTGCTCAAAGTAGCAGAATCA 3 0.86 0.91 0.90 HM_37 (AGA) 5 CCATAAATACATCACCTCGATCC CCAGCAGAGTTCAACTTGTTCTT 5 0.78 0.80 0.77 HM_38 (GA) 7 ATCTTATCCACAACAAGAAGCCA AAGCTCATGAACATGACACACAG 3 0.91 0.90 0.89 HM_39 (TC) 6 CTCAGGAAAAGTAACACTGGCAT GAGACTTGTCTCCTGCATCAACT 7 1.00 0.85 0.80 HM_40 (GA) 9 AGCCTTCAGGATTACTTCTCCAC AAGATGTCTTCAATCTTCACCCA 5 0.80 0.69 0.65 HM_41 (ACC) 6 GCATTTTGTTTGGATTGACAAAG TGGAGTGCTTTTTAGCAAATTGT 6 1.00 0.79 0.75 HM_42 (TAT) 5 GAAGAAGATGATGCTGATGGTTC ATTCTGTGCAGCTAGTTACCACC 9 0.90 0.89 0.83 HM_43 (CAC) 7 CTGTTGAGGCTGAGGATATTGAG AAACGCGTCAAAGAAGAACATC 8 1.00 0.86 0.81 均值 5.74 0.83 0.78 0.72 表 4 SSR-PCR 筛选引物 Table 4 Screening primers of SSR-PCR 图 2 鱼腥草的UPGMA聚类图 Fig.2 UPGMA dendrogram for H. cordata 3 讨论

基于PCR技术的分子标记,较常用的有随机扩增多态DNA(RAPD)[9]、扩增片段长度多态性(AFLP)[10]和扩增简单重复序列间区(ISSR)[11]等。这些标记因其特异性不强而广泛应用于物种的遗传多样性与亲缘关系等方面的研究,尤其对不具任何基因组信息的非模式生物的研究,凸显其优势。对不具任何基因组信息的鱼腥草,目前已利用RAPD[5-6]、AFLP[12]、ISSR[7]等分子标记进行了研究,由于这些标记的扩增产物是不确定、非特异的,因而用它们得出的结果不能有效地应用于遗传研究和标记辅助育种。SSR分子标记是特异性较强的标记,能有效地克服不确定、非特异的缺点,而且对已开发出大量特异标记的植物,已很少使用非特异标记对其进行遗传多样性与亲缘关系等方面的研究。为了更加有效的开发和利用药用植物鱼腥草的遗传资源,完全有必要开发其特异性较强的分子标记,而且迄今尚未见鱼腥草植物中开发SSR标记的报道。

从鱼腥草转录组中搜索出4 800个SSRs,平均出现频率是1/9.04 kb,和其他物种相比,鱼腥草SSRs出现频率高于小麦(1/15.6 kb)[13]、拟南芥(1/13.83kb)、番茄(1/11.1 kb)、棉花(1/20.0kb)[14]、杨树(1/14.0kb)[15]等植物,表明鱼腥草转录组中SSR数量相当丰富。从鱼腥草SSR重复基元分析,鱼腥草SSR与其他植物相比存在相似性和差异性。其相似性表现在鱼腥草SSR序列的重复基元种类繁多,单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重复基元等。而重复基元主要集中在单核苷酸、二核苷酸和三核苷酸重复。其二核苷酸重复基元以AG/CT为主(占总数的86.70%),这与烟草[16]、茶树[15]、马尾松[17]、杏树[18]等的SSR序列二核苷酸重复基元的情况相似。鱼腥草三核苷酸重复以GAA/CTT重复为主(占16.85%),这与拟南芥[19]、柑橘[20]、烟草[21]等报道的情况基本一致,这可能是这些重复基元与其关键蛋白编码的密码子使用频率有较大的关系[22]。鱼腥草SSR重复基元与其他物种的情况也存在一定的差异性,鱼腥草SSR序列以三核苷酸重复基元重复为主,与茶树[15]、烟草[16]等有所差异。

鱼腥草转录组SSR不但出现频率高,而且类型丰富;利用unigenes序列开发鱼腥草的SSR标记进行试验验证,所开发的SSR标记在鱼腥草基因组中的检测结果多表现为清晰可读的单一主带或2条带,表明被检测的标记在基因组DNA中的位置是特异的,能有效反映其多态性,从多态性潜能的角度考虑,搜索到的这些SSR也具有较高的可用性。可成为鱼腥草基因组DNA遗传多样及其分子生物学其他相关研究的有力工具。本研究结果为进一步发掘新的鱼腥草功能基因SSR标记奠定了基础,这种标记的建立对于加速鱼腥草功能基因资源的开发利用、遗传资源评价及实现特定性状的辅助选择标记育种和开展鱼腥草的比较基因组学研究均具有重要意义与应用价值。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有