FSHW 您所在的位置:网站首页 edge的鉴定 FSHW

FSHW

2023-05-28 20:11| 来源: 网络整理| 查看: 265

0 分享至

用微信扫码二维码

分享至好友和朋友圈

Introduction

枣(Ziziphusjujuba Mill.)是鼠李科植物中公认的最重要的果实品种,距今已有4000多年的历史。枣广泛种植于北半球的温带和亚热带地区,特别是中国的北部。中国是国际上最大的枣果生产国,2014年中国枣种植面积为280万公顷,年产量达到了734万t,占全球总产量的90%以上。作为一种受欢迎而且有重要经济效益的水果,枣以其香甜的口味,独特的风味和较高的高营养价值而倍受赞誉。几千年来,在亚洲国家枣一直作为食品、食品添加剂、香料和中药的主要成分消费。

迄今为止,中国共发现944 个枣品种,主产区包括西北地区(甘肃省、新疆维吾尔自治区)、黄河谷地区(宁夏省、陕西省和山西省)和东部地区(山东省、河北省和河南省),这些地区贡献了全国90%以上的产量。新疆位于中国西北部,气候特征是干旱的大陆性气候,少雨、日照充足、昼夜温差大,这种独特的气候和资源造就了新疆枣果优良的品质。由于具有抗干旱、耐盐碱、耐冷热和高产的各种特性,枣树十分适合在新疆气候下生长。随着枣产业的快速发展,新疆已成为中国五个主要的枣生产地区之一,并成为最大的枣生产和种植区。2017年,新疆总种植面积为100万公顷,占全国30%左右,其中干枣产量为270万t,占全国总产量的一半以上。目前新疆已发现100多个品种,其中以灰枣、骏枣和赞皇大枣栽培面积最大,占新疆种植面积的95%以上。随着对枣品种选育的研究和技术推广,新疆枣品种资源也进一步丰富。

枣果实含有丰富的碳水化合物、有机酸、氨基酸、维生素C和矿物质等营养成分,是镁、磷、钾、钠和锌等矿质元素的良好来源。多糖是成熟枣果实最丰富的成分之一,葡萄糖,果糖,蔗糖,鼠李糖和山梨糖醇是枣果实的主要糖分。从枣果实中已鉴定出不同的有机酸,例如柠檬酸、琥珀酸和苹果酸。枣果实中包含不同类型的氨基酸,例如天冬氨酸、脯氨酸、精氨酸和丙氨酸等。枣是人体Vc的重要来源。枣还是必需脂肪酸的来源,还含有植物化学素。枣果实的总酚含量较为丰富(275.6~541.8 mg GAE/100g),高于其它以高酚含量闻名的常见水果,酚类化合物包括类黄酮、酚酸、单宁等,其中类黄酮化合物主要有原花青素B2、儿茶素、表儿茶素、芦丁和槲皮素-3-O-芸香糖苷等,酚酸主要包括没食子酸、原儿茶酸、咖啡酸和对香豆酸等。枣的健康益处与其生物活性成分的组成密切相关。长期以来,已有大量通过体外和动物模型的研究证明了其药理作用,与枣果实相关的健康益处包括抗癌、抗炎、抗肥胖、抗氧化、肝和胃肠道保护作用、免疫刺激和神经保护作用。

原花青素(proanthocyanidin, PA),又称缩合单宁,是所有次生植物代谢物中最广泛和最丰富的一类成分,它们有助于色素、味道和营养的形成。它是由黄烷-3-醇亚基聚合的寡聚或多聚物,聚合度可能因植物种类而异,通常在2到20之间,在植物中以不同亚基聚合度的混合物出现。PA是枣中主要的多酚活性化合物之一,具有抗氧化剂、抗癌和抗心血管活性等多种理化特性和生物活性。目前关于枣多酚类的转录组学研究主要集中在类黄酮代谢以及与果皮着色相关的花青素合成途径上。原花青素是类黄酮途径的代谢产物之一。然而,枣果实中PA的生物合成和调控机制尚未得到关注,因此仍然未知。此外,传统的基因差异表达分析研究一次只能比较两个样本,并且只关注单个基因的功能,从而忽略了具有相似表达模式的基因之间的相互作用。相反,加权基因共表达网络分析(WGCNA)可以同时比较大量样品的基因表达水平,并通过将转录水平上高度相关的基因聚类到与生物学特性相关的各种模块中以鉴定共表达的基因。因此能够获得更广泛的结果,并适用于处理复杂的大规模的基因表达数据。

中国枣果品种资源丰富,每个品种具有不同的理化、生理和功能特性。过去多数研究是在大陆气候温暖的东部地区对枣品种进行的,而对于来自西北干旱大陆气候区的枣品种的功能和营养成分尚无足够或可靠的报道。此外,迄今鲜有关于枣果实在发育成熟过程中营养、生物活性化合物和抗氧化活性变化的研究。

浙江大学食品科学与营养系沈立荣教授团队和塔里木大学园林学院吴翠云教授团队对三种新疆特色枣和它们的不同发育时期进行了比较转录组分析和WGCNA分析,原花青素比较分析,对枣原花青素合成的潜在分子机制、不同品种原花青素合成途径中涉及的关键基因进行了挖掘,为新疆特色枣的分子育种,提高枣原花青素含量提供了理论依据。本文第一作者为浙江大学食品科学与营养系硕士研究生王文强。

Results and discussion

不同枣品种在发育过程中原花青素、儿茶素和表儿茶素含量的变化

测定了大白铃(DB)、阜帅(FS)和骏枣(JJ)在成熟过程中的外观特写图以及原花青素、儿茶素和表儿茶素含量的变化规律。结果表明,3 个品种枣发育过程中枣果皮颜色的变化,即由绿色(S1时期)变为青白色(S3时期),随后表皮逐渐由红色覆盖(S4时期)直至全红(S5时期)(图1)。由图2可见,3 个枣品种的原花青素总含量均随着枣的发育呈下降的趋势,尤其是在S1-S3时期,几乎呈直线下降。随后在S4时期,大白铃和骏枣的原花青素含量几乎降至最低,分别为0.76 mg/g DW和0.07 mg/g DW。与原花青素含量下降的趋势相似,儿茶素的含量在S1时期最高而后随着成熟度的增加不断降低。值得注意的是,阜帅的儿茶素含量在S4时期出现较大幅度的增加,随后才继续下降。3 个枣品种的表儿茶素含量呈现较为一致的变化,即发育过程中均会出现先上升后下降的趋势。其中,FS的表儿茶素含量在完全成熟(S5时期)之前不断升高,特别是在S4时期陡然增加,由2.30 mg/g DW变为5.74 mg/g DW,随后又骤然下降,而DB和JJ的表儿茶素含量分别在S4和S2时期出现较快的回升。总之,原花青素和儿茶素含量的变化趋势较为一致,而且在S1-S4时期快速下降,而表儿茶素含量的变化因品种而异,S4时期是其突然增加的关键时间节点。综合三种成分的含量随发育时间的变化规律,选择S1(T1)、S3(T2)和S4(T3)这3个发育时期的样品用于随后的转录组学分析。

图1 红枣DB、FS和JJ中总原花青素、儿茶素和表儿茶素在成熟过程中的外观和含量变化。(A) DB FS和JJ果在发育过程中(S1-S5)外观的变化。 (B)枣发育过程中PA儿茶素和表儿茶素在DB、FS和JJ中的积累特征

三个枣品种不同发育期的转录组测序、组装和基因功能注释

通过转录组组装,总共获得了33 324 个基因和42 888 个转录本。剔除至少在一个样品中表达不为0的基因或转录本后,统计得到28 973 个表达基因和37 760 条表达转录本,然后将这些表达的基因和转录本比对到NR、Swiss-Prot、Pfam、COG、GO和KEGG这六大数据库。由表1可见,总共有28 534(98.48%)个基因和37 157(98.4%)条转录本获得注释,其中,NR和COG数据库几乎注释了所有基因,其注释率分别为98.45%和96.73%,GO和KEGG数据库注释率最低,分别为60.48%和41%。439 个基因和603 条转录本未获得注释,这些没有比对成功的序列很有可能是新基因和新转录本。

表1 六大数据库中枣基因和转录本的功能注释

不同枣样本间的PCA分析和差异基因表达分析

主成分分析(PCA)可以降低数据的复杂性,深入挖掘样品之间的关系和变异大小,找出离群样品并判别相似性高的样品簇。由图2可见,最主要的两个主成分PC1和PC2方差贡献率分别为29.43%和13.71%,并将平面划分为了4 个部分。T1阶段的3个枣品种样品聚集在左下平面,可以归为第一类。从样本的聚类距离来看,DB和JJ在T1时期样本间相似性较高,而FS则与它们有较大差异。有趣的是,处于T2时期的DB样品和T3时期的FS样品分别单独聚集在左上平面和右下平面,可以归为第二类和第三类。这两类的离群性表明T2时期和T3时期两个品种与其它品种间十分显著的差异。T2时期的FS和JJ样品,以及T3时期的DB和JJ样品聚集在右上平面,可以归为第四类。综合以上分类结果可以发见,所有样本都具有良好的生物学重复,JJ在T2和T3时期的样本差异并不大,但是与T1时期明显出现了由PC1贡献的差异。而FS样品之间不仅体现了较大的时序差异,而且在品种之间有很大的离群性。DB则只在T2时期出现较大的品种间差异。总体上,这些枣品种和发育时期之间都呈现了一定的差异性,有利于开展随后的差异表达分析。

图2 不同枣品种不同发育时期样本间的主成分分析

不同枣品种在不同发育时期的差异基因表达分析 不同样品之间差异表达的基因可能在枣的生长和发育过程中发挥重要的作用。因此,作者鉴定了不同发育时期的不同枣品种样品之间差异表达的基因(图3)。不同比较组之间差异表达基因数目在3 060~7 817 个之间,大多数比较组间下调的差异表达基因数目要高于上调的基因数。在T1和T3时期之间差异表达的基因数量最高,这是因为枣由发育初期转变为成熟的过程中发生了强烈的新陈代谢活动。不同枣品种在同一发育时期之间的比较,体现了品种之间的差异。从不同品种差异表达基因数量来看,品种之间的差异要小于发育阶段间的差异。统计剔除所有比较组之间的冗余基因后,总共获得了19 621 个非冗余差异表达基因。随后将这些基因用于KEGG富集分析,以探究它们在枣发育过程中参与的代谢途径。图4.8显示,这些差异表达基因主要富集到核糖体途径(Ribosome,281 个)、糖酵解/糖异生途径(Glycolysis/Gluconeogenesis,124 个)、果糖和甘露糖代谢途径(Fructoseandmannose metabolism,72 个)类胡萝卜素生物合成途径(Carotenoidbiosynthesis,43 个)和丙酮酸代谢途径(Pyruvatemetabolism,82 个),说明枣在成熟的过程中发生了强烈的糖的分解和代谢活动,这些基因的参与和调控作用或许可以解释葡萄糖和果糖向蔗糖转变的过程。

图3 18组差异表达基因(DEGs)统计和差异表达基因KEGG富集分析。 (A) 不同发育阶段和不同品种的DEGs数量比较。 (B)所有对照组中发现的非冗余DEGs进行KE

原花青素合成相关基因的鉴定 原花青素是黄烷-3-醇(例如儿茶素和表儿茶素)的寡聚物或多聚物,它们是通过类黄酮代谢途径合成的。因此,作者参考模型植物中类黄酮的合成途径,构建了原花青素的生物合成途径简图(图4A),通过热图展示了参与原花青素合成基因的表达水平(图4B)。共检测到编码13 种酶的35 个的结构基因,其中PAL,C4H和4CL等三种酶参与了一般的苯丙氨酸代谢途径,它们主要负责类黄酮的上游生物合成途径,PAL催化了类黄酮合成的第一步,即将苯丙氨酸转化为反式肉桂酸。在枣中有PAL的4个基因拷贝,只有Zj6461转录水平相对较高,并且在3个枣品种中的T3vsT2和T3vsT1比较组中表达量上调6倍以上,这与表儿茶素含量由1.36 mg/g DW(T1时期)快速积累到5.74 mg/g DW(T3时期)的趋势一致,与骏枣中表儿茶素水平从T1-T3时期逐渐下降的趋势相反,这表明不同枣品种的表儿茶素合成机制可能存在差异。C4H可进一步催化反肉桂酸产生4-香豆酸,在C4H的3个基因拷贝中,Zj10041在骏枣和大白铃中的表达模式较为一致,即在T3时期表达量上调,达到最高值;阜帅在T3时期的转录水平相较于T1和T2都有较大程度的下调,尤其在T2-T3时期,TPM值由55.89减小为0.06,这表明Zj10041可能是引起3个枣品种原花青素、儿茶素和表儿茶素在T3时期变化趋势不一致的重要基因。4CL催化苯丙氨酸途径的最后一步,即将4-香豆酸酰化为4-香豆酰辅酶A。5 个4CL基因拷贝中,Zj25594的表达水平在T3时期达到峰值,并在T2和T3时期明显上调。而Zj75在大白铃中转录水平在T3时期明显下降,与原花青素含量的下降一致。

图4 枣PA生物合成途径的结构基因及其在DB、FS和JJ发育时期的表达水平。(A)枣中PA生物合成途径推测(标红的字代表酶,数字代表编码酶的基因拷贝数),(B) PA生物合成相关基因表达模式热图(颜色表示基因标准化为lgTPM的表达水平,红色代表高表达,蓝色代表低表达)

在苯丙氨酸合成途径之后,一系列酶包括CHS(2个基因)、CHI(1个基因)、F3H(1个基因)、F3'H(2个基因)、FLS(2个基因)、DFR(2个基因)、LAR(2个基因)、ANR(1个基因)、ANS(2个基因)和UFGT(8个基因)参与了类黄酮生物合成途径,其中转录水平差异较大的基因可能对类黄酮的合成产生重要影响。为了挖掘与原花青素生物合成高度相关的关键基因,我们假设至少在两个发育时期比较组中出现上调或下调的基因为共差异表达基因,因此Zj19560(CHS)、Zj12386(DFR)、Zj20989(LAR)、Zj1339(ANR)和Zj20705(ANS)被鉴定为上调的共差异表达基因,表明这些基因可能在上调中起重要作用。值得注意的是,LAR(Zj20989)在T3时期的TPM值极高,在DB、FS和JJ中分别为842.08、1031.77和1254.53,远超过其它基因的表达水平。Zj20989后期的高表达可能与枣中表儿茶素的含量增加有关。然而,仅2个编码FLS的基因(Zj11554和Zj11555)被鉴定为下调的共差异表达基因,表明它们可能是导致枣果实中酚类物质含量降低的重要基因。

枣发育过程中原花青素代谢相关基因的共表达网络分析 将27个枣果实样品中过滤得到的14 335 个基因用于WGCNA分析,以确定原花青素代谢途径中的核心基因(Hubgenes)。通过构建基因树状聚类图,总共鉴定出27个模块(图5),其中,一个树枝代表一个基因,一个颜色代表一个模块。将这些模块中的基因与表型(原花青素、儿茶素和表儿茶素含量)进行相关性分析,并绘制成相关性热图(图5B)。每一个模块包含的基因数在31~4 896 个之间,在这些模块中,具有1 620 个基因的MEblue模块与原花青素和儿茶素含量均呈显著正相关,相关性系数r分别为0.90和0.87;而与表儿茶素的积累几乎没有相关性(r = 0.076,p = 1)。显而易见,这与它们在枣的发育过程中不同的积累模式一致。相反,含有400个基因的MEmagenta模块与原花青素含量(r = -0.85,p = 2×10-10)和儿茶素含量(r = -0.83,p = 8×10-8)显著负相关。此外,还发现包含65个基因的MEdarked模块和表儿茶素含量呈显著正相关(r = 0.77,p = 3×10-6),而包含244个基因的MEsalmon模块则与表儿茶素含量显著负相关(r = -0.70,p = 6×10-5)。这些模块的构建有助于进一步挖掘原花青素合成的相关基因。

图5 表达基因的加权基因共表达网络分析(WGCNA)。(A)显示27个共表达模块的层次簇树,树上的叶子代表一个表达基因,每个树枝代表一个不同颜色的模块。(B)模块-儿茶素/表儿茶素/总PA与相应的p值相关。正方形的颜色比例表示从-1(蓝色)到1(红色)的模块-性状相关性。 (C)“MEblue”“MEmagenta”“MEsalmon”和“Medark”模块中基因的KEGG富集分析。

模块基因的KEGG富集分析 上述结果表明,MEblue和MEmagenta模块与原花青素和儿茶素含量显著相关,而MEdarked和MEsalmon模块与表儿茶素含量显著相关。为了研究这些模块基因参与的代谢通路,将这4个模块基因进行KEGG富集分析。由图5C可见,MEblue模块富集的与多酚化合物代谢相关的途径为异黄酮合成途径(Isoflavonoidbiosynthesis)和花青素合成途径(Anthocyaninbiosynthesis),富集基因数目最多的途径为植物激素信号转导(Planthormonesignaltransduction)和植物-病原体相互作用(Plant-pathogeninteraction)。而MEmagenta模块则主要富集在与糖代谢和脂代谢相关的途径,包括丙酮酸代谢途径(Pyruvatemetabolism)、乙醛酸和二羧酸酯代谢(Glyoxylateanddicarboxylatemetabolism)、三羧酸循环(TCAcycle)、脂肪酸合成(Fattyacidbiosynthesis)脂肪酸降解(Fattyaciddegradation),油菜素类固醇生物合成(Brassinosteroidbiosynthesis)。这表明当原花青素含量快速下降时,糖代谢和脂类代谢可能更加旺盛。值得注意的是,4个基因显著富集于类黄酮合成途径(Flavonoidbiosynthesis)。MEdarked模块只有1个基因显著富集于维生素B6代谢途径(VitaminB6metabolism),而MEsalmon模块最为富集的途径为各种次生代谢产物的生物合成(Biosynthesisofvarioussecondarymetabolites),表明表儿茶素的积累可能与其它次生代谢产物的合成存在竞争。

与原花青素含量相关共表达模块中核心基因的鉴定 核心基因是指共表达模块中具有高连接度(edge number)的基因,被认为是共表达网络的关键基因。显然,MEblue模块含有的1 620 个基因对原花青素积累具有至关重要的影响。因此,作者采用Cytoscape软件通过可视化的方式构建了类黄酮合成相关结构度(图6),结果表明在基因共表达网络中起着重要的作用,因此被认为是原花青素代谢模块的核心基因。表2进一步显示了这些基因的基因显著性(GS)。结果发现,在这些核心基因中,bHLH(Zj15549)和ERF(Zj2360)对于儿茶素表型的基因显著性最高,分别为0.935 和0.906,而MIKC(Zj19478)的基因显著性最低,为0.719。对于原花青素表型来说,Zj7151和Zj31593(ERF)分别具有最高(0.887)和最低(0.70)的基因显著性。此外,在MEblue模块中还观察到9个结构基因,包括1个C4H,1个FLS,3个二磷酸尿核苷葡萄糖基转移酶(UGT)和4个GST基因拷贝。值得注意的是,3个GST基因(即Zj22048、Zj20311和Zj20310)对于原花青素和表儿茶素表型具有较高的基因显著性,范围在0.819〜0.89之间,这暗示着它们可能在原花青素代谢中有重要的转运作用。

图6 MEblue模块中与原花青素合成高度相关基因的共表达网络(颜色色阶表示基因的连接度范围为21-56,除了白色的GST基因的连接度为2)

表2 儿茶素和原花青素合成相关核心基因的基因显著性

原花青素合成相关候选基因的验证 为了验证RNA-Seq数据的准确性,选择了原花青素合成相关的10 个候选基因(DB中10 个,FS和JJ中各5 个基因)进行荧光定量PCR分析。由图7可见,除了LAR以外,其它验证基因在发育初期(T1时期)的表达水平最高,并且随着枣成熟而逐渐降低。LAR在T1时期表达水平极低,但是随着成熟度增加而不断升高,而且远高于其它基因的表达水平。这些结果与转录组测序数据有很高的一致性。进一步通过Person相关性来计算转录水平和相对表达量之间的相关性系数,如图7B所示,通过qRT-PCR定量的相对表达水平和RNA-Seq定量的TPM值呈显著相关,这些结果表明本研究中转录组的测序数据是准确和可靠的。

图7 (A)利用qRT-PCR检测与PA生物合成相关的10 个候选基因的相对表达量((DB中选择10个基因,FS和JJ中均选择5 个基因验证), 同一品种在不同发育阶段的表达量存在显著差异(P



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有