微生物小开放阅读框:小蛋白及翻译调控研究进展 您所在的位置:网站首页 组蛋白编码基因 微生物小开放阅读框:小蛋白及翻译调控研究进展

微生物小开放阅读框:小蛋白及翻译调控研究进展

2024-06-30 14:14| 来源: 网络整理| 查看: 265

小开放阅读框(small open reading frame, sORF)普遍存在于不同生物的基因组中[1]。其中一部分sORF可被转录和翻译,其编码产物称为小蛋白(small protein),又称为微蛋白(microprotein),或迷你蛋白(miniprotein)。但是,由于sORF序列短,可能不具有充分的同源序列信息,或者没有已知的结构域,因此无法进行相应的同源搜索。此外,很多sORF的功能未知,而且有一些功能小蛋白仅在特定条件下表达,很难在大量可能的启动子和终止子中定义具有编码功能的sORF。因此,长期以来很多sORF未被充分注释[2]。此外,相关检测技术的限制也影响了对sORF的充分研究,传统的基因预测为了降低假阳性,习惯性地将编码100个氨基酸以下的sORF注释为非编码RNA (non-coding RNA, ncRNA)[3]。近年来,随着高通量测序、翻译组和质谱分析技术的不断发展,针对小蛋白的发现开发了特定的分析方法[4-6]。针对sORF的生物信息分析技术也不断完善[7],因此,近年来大量sORF的鉴定和功能被不断发现和报道。

越来越多的研究表明,sORF编码的小蛋白参与了多种重要生命过程,例如,DNA修复、信号传导、环境胁迫耐受性、疾病和发育等,已成为近期研究的热点,不仅在微生物,在斑马鱼、果蝇和哺乳动物也不断有新的发现,在多肽类新药开发方面也取得了进展[5-6]。此外,对sORF介导的翻译调控作用研究结果显示,这些被翻译的顺式调控元件不仅具有理论研究价值,也有潜在的应用前景。但是,目前大量关于小蛋白和sORF介导的翻译调控的相关研究主要集中在植物和小鼠等高等生物中,而在微生物中的相关研究还相对比较有限。

微生物及其产品广泛应用在食品、饲料、医药、农业和生物能源等不同领域。微生物sORF的发现和作用机制研究不仅有助于深入理解微生物对环境的响应和代谢重塑[8],也对精准设计和改造微生物菌株,提高生产效率,更好服务产业具有重要意义[9]。本文对目前微生物相关的sORF研究进行了综述,并对未来sORF的研究趋势进行了展望。

1 sORF和小蛋白简介

由于大量的sORF功能未知,sORF被称为基因组中的“暗物质”[10]。sORF在原核生物中指编码小于50个氨基酸的开放阅读框,在真核生物中,除植物中指编码小于150个氨基酸外,一般指代编码小于100个氨基酸的开放阅读框。sORF与基因组中非传统ORF (alternative ORF, alt-ORF)最主要的区别是对编码产物长度的限定不同。alt-ORF指在转录本(编码或非编码)上以ATG起始的尚未被注释的任何编码大于30个氨基酸的ORF[3],因此,sORF与alt-ORF存在交集。尽管目前使用编码氨基酸的长度作为定义小蛋白的标准具有一定的主观性,但值得注意的是,sORF编码的小蛋白与常见的多肽最主要区别为小蛋白是由独立的ORF所编码,而不是通过大分子蛋白质加工或降解而成。

根据sORF在转录本上的位置,分为5′非翻译区(untranslated region, UTR)的上游ORF (upstream ORF, uORF)、3′UTR的下游ORF (downstream ORF, dORF)、编码区与非编码区重叠区域的交错sORF (interlaced-sORF)和长链非编码RNA上的sORF (lncRNA-sORF)[5] (图 1)。这些sORF都可能翻译出具有独立功能的小蛋白。目前,部分研究学者将能够编码翻译出小蛋白的uORF和dORF归类为alt-ORF[3]。有的sORF的翻译产物具有独立的生物学功能,这类小蛋白常发现于lncRNA-sORF [11];有的sORF则是调控其下游或上游主ORF的顺式调控元件(图 1)。

图 1 sORF在转录本上的定位分类及其翻译后的功能分类 Figure 1 Classification of sORFs based on their localization on transcripts and classification by their post-translational functions. uORF: Upstream sORF; dORF: Downstream sORF; CD-sORF: Coding sequence-sORF. 图选项 2 sORF和小蛋白的挖掘和鉴定

目前,挖掘潜在sORF的高通量筛选方法主要包括生物信息学分析、翻译组测序策略和质谱蛋白组分析。高通量测序技术的应用对鉴定sORF非常重要(图 2)。虽然通过生物信息学分析可以预测出大量的sORF,但是真正能表达出小蛋白只是其中的小部分,因此,需要对翻译的sORF和有生物学功能的小蛋白进行高效筛选和鉴定。这里我们总结了近年来生物信息学分析技术、翻译组测序策略和质谱蛋白组分析技术在挖掘sORF及检测其翻译的应用。

图 2 多组学技术进行sORF高通量筛选的方法 Figure 2 High-throughput screening methods for sORFs via multiple omics techniques. 图选项 2.1 生物信息学分析

生物信息学分析是预测sORF的第一步,目的是将具有功能表达的元素从随机发生的噪声中区分出来,但是,目前实现高灵敏度和特异性的预测仍然具有挑战性。引起这种挑战性的主要原因之一是肽长度的阈值设置[12]。过去在蛋白质编码序列预测过程中,一般设置的长度阈值为100个氨基酸,忽略了更短ORF编码基因的表达和功能作用;另一个原因是替代起始密码子的使用,使新sORF的发现更加复杂,例如,一些蛋白质以非AUG起始密码子起始翻译[13-14],而这类蛋白质在基因注释中通常被忽略。

大多数情况下,生物信息学分析挖掘sORFs依赖于通用原则,包括(1) 通过不同物种之间的序列比对,筛选保守的sORF;(2) sORFs序列内编码区域的密码子使用等特征分析;(3) 评估与之前鉴定的蛋白质或某些功能域的序列相似性[12]。其中,序列保守性和相似性是常用的度量指标。但是,识别潜在的sORF受到多物种比对的质量和已知基因相似度的限制,而且短序列在定量保守方法中往往得分较低。因此,近期研究人员改进开发的MicroPeptide tool (MiPepid),可在全基因组范围内挖掘sORF,该工具利用小蛋白作为训练集的逻辑回归模型来预测sORF,提高了注释能力[15]。此外,smORFunction通过重新注释的微阵列探针估计sORF的RNA表达,可根据已知功能注释的相关基因预测sORF的功能[16]。尽管以上研究促进了sORF的注释和预测几率,但是实验数据的集成仍然是鉴定真实sORF的关键。对于非保守型或新型的功能性sORF,实验方法的可靠性也是做出决定性结论所必不可少的。目前,研究人员也开发了一些小蛋白数据库,已收录了多种模式物种基于翻译组、蛋白组发现的小蛋白,这些数据库为小蛋白的生物信息学分析和功能研究提供了基础[7]。

2.2 翻译组测序分析

传统的mRNA测序不能准确地显示基因的翻译情况,mRNA转录不一定代表蛋白质的实际表达[17]。多聚体分析(polysome profiling)和翻译核糖体亲和纯化(translating ribosome affinity purification, TRAP)技术已经广泛应用于翻译调控的研究。多聚体分析是一种通过梯度离心分离多聚体相关mRNA的技术,通过Northern blotting、RT-qPCR或深度测序来识别和量化积极翻译的转录本。其优势在于使用RT-qPCR靶向的分析具有成本低效率高的特点,并且结合免疫印迹或蛋白质组学有助于监测与核糖体或翻译起始复合物相关的蛋白质[18]。TRAP技术则是通过在生物体内表达表位标记的核糖体蛋白,使核糖体结合的mRNA复合物能够免疫纯化。其优势在于能够减少试剂对mRNA-核糖核蛋白的污染,适用于分析植物多细胞器官或组织中特定细胞类型的翻译[19]。此外,近来亦有研究开发利用全长翻译mRNA测序或称为核糖体新生链复合体结合RNA测序(ribosome nascent-chain complex-bound RNA sequencing, RNC-seq),以更好地揭示蛋白质翻译起始的全局情况[20],结合mRNA-seq和RNC-seq分析可以同时评估mRNA转录和蛋白质合成,识别转录和转录后的基因调控。但是,与多聚体分析和TRAP技术类似,这3种方法都不能为转录本上的核糖体提供位置信息,因此,无法区分在mRNA上停滞不前的翻译和非翻译核糖体,从而不能确定多顺反子的翻译,无法识别单个转录本中和不同区域(如sORF)的RNA。

2009年首次报道的核糖体印迹分析(ribosome profiling, Ribo-seq)可以直接检测全基因组sORF的翻译[21]。与其他技术不同的是,Ribo-seq测定核糖体所结合的正在翻译的mRNA,也可进行翻译速率的检测。在不同物种中Ribo-seq的应用分析显示,许多被认为缺乏编码潜能的RNA,包括长链非编码RNA (long non-coding RNA, lncRNA)、5′UTR和3′UTR[22-24]等,实际上是能被翻译的,陆续有报道描述了在不同生物的lncRNA中检测到小蛋白的表达[5, 11]。但是,Ribo-seq所检测到的可能不是翻译本身,也可能是共纯化的核糖体部分[25],因此,提高Ribo-seq对于sORF的检测精度,需要在实验技术上进一步改进或加强后续数据集的计算分析[26]。技术上的改进包括使用harringtonin或lactimidomycin使核糖体停留在起始密码子上,以分类翻译起始位点[27-29],以及对翻译核糖体进行亲和分离,避免超速离心时不相关核糖体的共同纯化[30];Aspden等提出Poly-Ribo-Seq方法,该方法通过只分离出代表活性翻译的多聚体用于足迹分析[31];Archer等提出翻译复合体图谱测序(TCP-seq)方法,在常规80S保护印迹的基础上,利用甲醛交联分离出小核糖体亚基相关的mRNA片段,从而获得翻译起始和延伸信息[32]。另一方面,越来越多的基于Ribo-seq数据的检测分析工具逐渐发展起来,包括RiboTaper、ORFRATER和ORF finder[33]。此外,建立了完善的指标来评估这些预测的编码潜力,如FLOSS、ORFscore和RRS[4, 22, 34]。尽管翻译组分析对确定sORF是否有翻译活性非常重要,但翻译的结果并不一定会产生稳定存在于细胞中的功能性小蛋白。因此,以质谱为基础的翻译产物识别对于小蛋白的鉴定也至关重要。

2.3 质谱分析鉴定小蛋白

质谱分析是一种直接检测多肽的方法。该技术应用液相色谱(liquid chromatography, LC),串联质谱(tandem mass spectrometry, MS/MS)进行分析。通过获得的MS/MS光谱中的多肽与参考蛋白序列数据库中所有候选多肽的理论光谱进行匹配。最常用的数据库包括Ensembl、RefSeq和UniProtKB。目前存在的问题和挑战包括:一是由于sORF的多态位点、可变剪接或缺乏注释,使得许多小蛋白尚未在参考数据库中得到注释;二是长度较短,可能没有或很少包含合适的胰蛋白酶酶切位点,从而使它们相对于较大和更稳定的蛋白质产生偏差;三是丰度较低。经典自下而上的蛋白质组学使用数据依赖模式(data dependent analysis, DDA)来识别酶切蛋白,导致了对高丰度肽的偏倚,负面影响了对微量蛋白的检测。针对以上这些问题,研究人员一方面提出了针对小蛋白鉴定的方法,包括利用不同的蛋白酶或自上向下分析天然小蛋白,优化提取缓冲液、大小选择或分馏方案,以提高检测灵敏度[5, 35-36];另一方面是建立定制的数据库,如Guruceaga等提出了蛋白质基因组(proteogenomic)工作流程,整合了基因组、转录组和蛋白质组数据,根据测序信息建立自定义搜索数据库,可以提高识别新肽的能力[37]。但是,由于蛋白质组学方法还不够灵敏,且考虑到Ribo-seq与最终蛋白产物的密切关系,利用Ribo-seq数据替代RNA-seq构建自定义数据库是另一种扩展MS搜索空间的选择[38-39],例如Martinez等将从头进行转录组组装和核糖体分析集成改进,在人类细胞系中注释了数千个sORF[29, 40]。

另外,数据处理也是影响检测结果的重要因素。新工具的开发促进了质谱技术的数据分析,如数据独立获取(data-independent acquisition, DIA)质谱[41],系统地选择了整个质量范围进行进一步的碎片化,增加了检测单个肽的概率,为低丰富的蛋白质检测打开新的机会。

3 微生物小蛋白功能的多样性和作用机制

目前,对原核微生物的新小蛋白研究表明,小蛋白的鉴定具有广阔的挖掘空间。对肠道沙门氏菌的一项研究鉴定了130个未注释的sORF,并证实了25个新小蛋白的合成,其中Mia-28 (24 aa)、Mia-31 (13 aa)、Mia-63 (45 aa)和STM14_1499 (35 aa) 4个小蛋白在低镁胁迫下可诱导该菌被巨噬细胞吞噬[42]。在致病性大肠杆菌O157:H7 Saka中,Ribo-seq分析为14个sORF以及几个稍长的ORF的翻译提供了证据,其中一个潜在的小蛋白(X049,38 aa)的合成被质谱证实[43]。2018年,van OrsdeL等通过在染色体上一个sORF的3′端添加一个表位标签,通过免疫印迹试验鉴定出36个新的大肠杆菌小蛋白,提示大肠杆菌中仍存在大量尚未鉴定的小蛋白[44]。

在真核模式真菌中,对酿酒酵母(Saccharomyces cerevisiae) ATCC 204508/S288c中小蛋白研究相对较多。酿酒酵母基因组中共有16条染色体,6 275个基因,其中5 885个被鉴定为蛋白编码基因[45]。根据UniProt蛋白数据库的收录结果,酿酒酵母ATCC 204508/S288c基因组中共有515个编码小蛋白(少于100 aa)的sORF,占其可编码基因的8.75%,其中377个sORF编码的小蛋白的功能是未知的,占了小蛋白编码基因的73.2%,说明酿酒酵母基因组中存在许多有待被功能注释的小蛋白,也提示对酿酒酵母小蛋白的研究还存在着非常大的空间。酿酒酵母S288c基因组中小蛋白的长度分析显示,UniProt数据库收录的酿酒酵母515个sORF中,320个sORF编码的小蛋白的长度在61至100个氨基酸之间,136个sORF编码少于50个氨基酸的小蛋白,且大部分功能未知,其中,11个功能已知的小蛋白(25−50 aa)与核糖体蛋白、线粒体、氨基酸合成调控功能相关。除了鉴定技术更倾向鉴定分子量较大的小蛋白外,较短的小蛋白的疏水倾向特性较强以及小蛋白只在特定条件下表达,这可能是造成小蛋白的鉴定偏向较长蛋白的原因[46]。

早在30年前,有研究报道酿酒酵母基因组中sORF可能具有编码蛋白功能[47],继而陆续发现具有不同生物学功能的小蛋白。2006年,Kastenmayer等将酵母基因组中sORF编码的小蛋白进行同源性分析,发现裂殖酵母(Schizosaccharomyces pombe)、蚯蚓(Pheretima)、拟南芥(Arabidopsis thaliana)、果蝇(Drosophila melanogaster)和人类等代表性真核生物中,与酿酒酵母相似的小蛋白约占60%,提示了这类相对保守的sORF编码的小蛋白在真核生物中可能参与必要的生物功能,从而也启示了利用同源序列挖掘及研究小蛋白功能的有效性[48]。Brar等在2012年利用Ribo-seq发现酿酒酵母减数分裂过程中大量未注释sORF的增强翻译,从而提出小蛋白可能与减数分裂调控相关,提示了减数分裂中普遍存在翻译控制[49]。进一步在检测2 500个新预测的sORF过程中,Hollerer等发现在酿酒酵母减数分裂过程中sORF的表达约占细胞翻译能力的10%−20%,这一发现有助于阐明减数分裂细胞广泛重组的分子基础[50]。He等通过蛋白质富集方法成功鉴定了酿酒酵母S288c中117个小蛋白,发现其中31个可能参与能量转换途径、细胞壁合成与组装、端粒保护、转录调控、翻译过程、组氨酸合成、蛋白质胞内转运和分泌过程及蛋白折叠等过程;通过比较4种不同的富集策略(Urea_Tricine、HCl_Tricine、Urea_MWCO和HCl_MWCO)并鉴定了3个因小蛋白不稳定原因而漏注释的sORF (YKL104W-A、YHR052C-B和YHR054C-B),但该研究并没有进一步解析该3个小蛋白的具体功能[51]。

环境胁迫条件下基因表达重编程是细胞应对逆境胁迫的关键机制[52],值得注意的是“隐匿”的sORF所编码的小蛋白在胁迫逆境中发挥着重要作用。Kessler等在2003年通过酿酒酵母全基因组预测蛋白序列的比较,分析出117个sORF,其中84个可发生转录,选取在多种生物中具有同源性的smORF2验证发现该sORF可被翻译成蛋白。酿酒酵母基因smORF2缺失突变体在37下无法生长,在30下生长缓慢,推测该基因与温度敏感相关[53]。Kastenmayer等曾以构建基因缺失突变体的策略来验证酿酒酵母在高温胁迫、非发酵碳源及DNA受损物质存在的情况下生长所需的sORF,发现YJL062W-A、YPL189C-A和YDR524W-C编码的小蛋白的缺失引起了相应的表型缺陷[48]。López-Martínez等实验证明小蛋白Stf2p及Sip8p有助于提高酿酒酵母脱水后的存活率[54-55]。此外,Vargas-Maya等鉴定了酿酒酵母一个编码未知功能蛋白的sORF YNR034W-A,基因表达图谱显示YNR034W-A在高乙醇浓度及高糖胁迫条件下表达量显著增加,且在酿酒酵母过表达菌株中有助于提高龙舌兰酒的发酵效率,推测该sORF在高酒精浓度等环境胁迫的耐受性方面具有一定的作用[56]。以上这些发现说明,环境胁迫响应的sORF的挖掘对构建抗逆性增强的生产菌株具有很好的应用前景。表 1总结了报道的酿酒酵母中与抗逆性和非发酵碳源等利用有关的小蛋白。

表 1. 酿酒酵母sORF编码的功能小蛋白举例 Table 1. Examples of small proteins encoded by sORFs in Saccharomyces cerevisiae Function Gene name Systematic name Length (amino acids) References Aiding in chromosome segregation DAD3 YBR233W-A 94 [48] Thermos-sensitivity smORF2 YBL071W-A 82 [53] Resistance to dehydration STF2 YGR008C 84 [54] Resistance to high sugar and alcohol concentrations EGO4 YNR034W-A 98 [56] ER to Golgi transport YOS1 YERO74W 87 [57] Pseudouridylation and processing of pre-18S rRNA NOP10 YHRO72W 58 [58] Mitochondrial protein required for outer membrane protein import MIM2 YLR099W-A 87 [59] Potentially function in the secretory pathway KSH1 YNL024C-A 72 [60] Splicing and for assembly of SF3b SF3 YNL138W-A 85 [61] DNA damage and growth TSC3 YBR058C-A 80 [62] Subunit of the mitochondrial inner membrane peptidase SOM1 YEL059C-A 74 [63] Cytochrome oxidase assembly factor COA2 YPL189C-A 68 [64] Phospholipid-binding hydrophilin SIP18 YMR175W 79 [65] 表选项

近年来也报道了一些丝状真菌小蛋白的分析和功能。例如,在植物病原真菌灰霉菌(Botrytis cinerea)感染期的分泌物中发现了一个植物毒性小蛋白BcSSP2 (90 aa),该小蛋白富含半胱氨酸且没有任何已知的结构域,进一步的研究表明该小蛋白受到类受体激酶BAK1和SOBIR1的负调控,可诱导植物产生免疫抗性[66]。丝状真菌的G蛋白γ亚基与其生长发育、致病性等有关,最近,国内研究者发现草酸青霉(Penicillium oxalicum)的G蛋白γ亚基可调节植物生物质降解酶(如纤维素酶、木聚糖酶和生淀粉酶)的生物合成[67]。对31个真菌基因组进行了保守小蛋白的分析发现,1 986个相对保守的小蛋白,其中三分之一没有功能注释,包括丝状真菌中的黑曲霉(Aspergillus niger)、米曲霉(A. oryzae)、构巢曲霉(A. nidulans)和烟曲霉(A. fumigatus)等[68]。这些研究表明,小蛋白对丝状真菌的发育、致病真菌防治和工业应用具有潜在的重要作用,加强对微生物小蛋白的功能研究非常必要。

4 微生物sORF的翻译调节功能

近期,我国学者利用生物信息学方法对多个真核生物进行sORF预测,发现木霉(Trichoderma)和青霉(Penicillium)基因组存在1万到5万多个uORF,在产黄青霉(P. chrysogenum)中有1.44万个菌种独特的uORF,在P. copropilum中这个数字多达5.8万个[68]。这些uORF具有十分广阔的研究前景[8],将这些调控元件有效地与相应的生物工程技术结合,具有广泛的应用价值,例如,在提高菌株耐受性和减少改造菌株的多效性以提高目标产物产量等方面。基于现有的对酿酒酵母的5′UTR的研究,研究人员已构建出预测蛋白质丰度-yUTR Calculator[69],提示5′UTR调控元件(包括uORF、Kozak序列、上游起始密码子等)仍有待发掘[70]。虽然sORF作为调控元件在微生物代谢工程改造领域的应用尚未见报道,但是在植物中利用sORF所介导的翻译调控,尤其是uORF的翻译调控进行育种已有一些成功的先例[71-73],为提高植物的耐受性、抗病性提供了精准的调控。例如,将病原菌的TBF1的uORF所介导的翻译调控导入拟南芥和水稻中,以调控自激活免疫受体Snc1-1和AtNPR1的产生,成功提高所调控相应植株的抗病性[74]。将加速细胞的ACD11的uORF所介导的翻译调控导入拟南芥中,植株提高表达凝集素受体激酶AtLecRKVI.2,增强了植株对辣椒疫霉的抗性[75]。这些新的发现和应用为利用sORF进行微生物菌种选育提供了可行的参考[3, 22]。

5 sORF功能和机理的研究策略

深入探究sORF编码的小蛋白,包括其功能作用、互作网络等,需要建立可靠的研究策略来实现。基于CRISPR-Cas9 (clustered regularly interspaced short palindromic repeats-associated protein 9)基因组编辑技术极大促进了对sORF编码的小蛋白的高通量功能鉴定。利用CRISPR-Cas9在酿酒酵母中构建DNA序列突变体库,从315个sORF中分析出68个可能与抗真菌药物抗性以及DNA损伤抗性功能相关的功能性小蛋白[76];在人类细胞系中,利用基于CRISPR-Cas9筛选策略识别数百个alt-ORF,并鉴定了sORF编码小蛋白的功能特征及白细胞抗原系统的新元件[77]。对于小蛋白互作网络的探究可利用传统的免疫沉淀,但该方法往往会有小蛋白的非特异性相互作用的富集,为此,Chu等应用了依赖于抗坏血酸过氧化物酶2 (APEX)的原位邻近标记方法,来探究小蛋白-蛋白相互作用[78]。Koh等将光交联的非典型氨基酸AbK整合到sORF编码的小蛋白中,利用基于亲和性的方法有效地识别了与之相互作用伙伴,成功地发现了一个由sORF编码的组蛋白结合蛋白(SEHBP),并且发现该小蛋白是一种保守的转录因子,在人类细胞中过表达时诱导一个强大的转录程序[79]。考虑到荧光标签所增加的分子量和结构可能会显著影响小蛋白在体内的生理生化特性,Lafranchi等开发了单残基末端标记(STELLA)标签,实现在小蛋白的氨基端或羧基端引入一个非典型氨基酸,用于后续的特异性荧光标记,这种方法提供了一种普遍适用且易于扩展的策略,避免了小蛋白核心序列的改变[80]。另一方面,目前通过报告基因探究sORF的翻译调控作用是可行有效的研究策略。此外,Jiménez-Bremont等将拟南芥多胺氧化酶2 (AtPAO2) 5′UTR区域的uORF及其突变体分别与GUS报告基因进行融合,探究了AtPAO2 uORF的翻译对主ORF翻译抑制的必要性[81]。Ai等通过开发的荧光报告系统检测了加速细胞的ACD11的uORF (uORFACD11)的翻译调控作用[75]。但这种传统的uORF功能分析限制了uORF的研究规模,近来,Mcmanus等结合流式细胞仪同时检测评估了酵母的数千个uORF的功能及其影响,为探究uORF的翻译调节功能提供高通量的策略[82-83]。以上这些研究为更广泛探索微生物中sORF及其编码的小蛋白提供了方法学上的借鉴。

6 结语与展望

生物信息学的进步有助于促进sORF编码小蛋白的挖掘,随着转录组学、蛋白组学、核糖体分析、质谱分析、基因组编辑和机器学习[84]等技术的发展,使小蛋白的鉴定变得高效和可靠。未来针对小蛋白注释和分析的生物信息技术将不断完善。目前小蛋白数据库主要收录的仍然是模式物种,未来也将进一步扩展到更多的物种。同时,鉴定小蛋白的质谱检测技术也将进一步成熟,并借助生物信息分析技术发现更多的小蛋白。高通量的遗传操作技术,尤其是基于CRISPR-Cas系统的基因编辑技术将为验证小蛋白和sORFs的功能提供实验证据。可以预见,未来生物信息学、质谱分析技术以及基因功能实验等多学科多领域的更充分结合,将为小蛋白的鉴定提供更有力的支撑。目前越来越多被遗漏的sORF和小蛋白陆续在人类细胞系和植物中被发现,预计未来会有更多相关成果报道。而微生物底盘细胞生长快、应用广和操作简易,亦有作为未来聚焦的研究对象的优势。

由于sORF长度短,易合成,在作为合成生物学元件方面具有独到的优势,预计能在人工调节复合体功能和活性方面做出突出的贡献。小蛋白的分子结构及代谢机制的揭示有助于促进小蛋白的开发应用,例如,对小蛋白在耐受性方面的功能研究有利于选育高抗逆的工业菌株,克服产物和底物中毒性物质的抑制。小蛋白分子量小,具渗透性及灵活性,适合应用于药物设计,尤其是小分子药物设计。但是,目前亟需克服的瓶颈依然是sORF及小蛋白的识别与功能鉴定。一方面,如何用多组学技术挖掘sORF及其编码的小蛋白,决定了我们打开“黑匣子”的程度,另一方面,目前以经典的功能缺失的遗传分析方法鉴定sORF功能,其最大缺陷是容易忽略对表型改变不明显的sORF突变体的发现,其实这些sORF是有功能的,因此需要考虑增强相关的表型,比如可以通过不同强度过表达sORF进行功能鉴定,以及开发其他不同的功能鉴定策略。

另外,目前sORF编码的小蛋白研究受到了普遍的关注,已经证明很多小蛋白能提高微生物的抗逆性,但是uORF作为有效的顺式调控元件和翻译调控盒在微生物工程领域中的应用尚属空白。这种精细调控可减少传统过表达所产生的多效反应[75],目前在植物抗病性方面得到良好的应用。未来相关研究应用于微生物的合成生物学和代谢工程改造有可能实现对产物的精细动态调控。

综上所述,sORF及其编码的小蛋白的鉴定、功能和作用机理研究,以及其在生物工程领域的应用存在着巨大的潜力,值得进一步深入挖掘与探索。此外,微生物sORF的研究也将为研究植物和人类疾病治疗等高等生物相关的研究提供借鉴。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有