调控的基因编辑系统【掌桥专利】 您所在的位置:网站首页 基因cc2d2a 调控的基因编辑系统【掌桥专利】

调控的基因编辑系统【掌桥专利】

#调控的基因编辑系统【掌桥专利】| 来源: 网络整理| 查看: 265

优先权声明

本申请根据35U.S.C.§119(e)要求于2018年10月9日提交的美国临时申请第62/743,317号和于2019年7月3日提交的美国临时申请第62/870,427号的权益,其全部内容通过引用以其整体并入本文。

有关序列表的电子递交的声明

根据37C.F.R.§1.821提交了ASCII文本格式的序列表,命名为5470-858WO_ST25.txt,大小为371,885字节,于2019年10月8日生成并通过EFS-Web递交,代替纸质副本。特此将该序列表以引用的方式并入本文的说明书中作为其公开内容。

技术领域

本发明涉及用于调控基因编辑的组合物及其使用方法。

发明背景

基因组测序技术和分析方法的最新进展已经显著加速了对与多种生物学功能和疾病有关的遗传因子进行分类和映射作图的能力。精确靶向基因组的能力将通过允许个别遗传元件的选择性改变来允许因果遗传变异的反向工程化,并促进合成生物学、生物技术和医学应用。尽管已经在基因组编辑技术方面取得了进展,但是已经发现,在基因编辑期间可能发生大量脱靶(例如,意外的突变),这限制了该方法作为治疗方案。因此,需要一种针对其靶标具有更高的特异性和可靠性的更精确的基因组编辑系统。

内源基因表达在几个转录后水平上被进一步调控,这些水平可能是探索外源基因表达的更精确控制的领域。例如,RNA的产生受转录速率控制,但功能性RNA需要正确剪接,然后才能产生正确的基因产物。通过调控转基因RNA的剪接,可以控制基因产物的产生。本发明提供了用于在细胞中精确控制基因组编辑系统的表达的组合物和方法,从而降低了脱靶效应并增加其特异性。

发明内容

本发明提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有你想要改变的基因序列(例如,靶基因序列)的细胞中导入:a)包含编码核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其编码序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从前体mRNA信息中被剪接时,产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和b)结合所述调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少所述外显子并编码对靶基因的基因编辑起作用的核酸酶的mRNA。在一个实施方案中,该系统还包含能够结合靶基因序列的gRNA。

在此方面的一个实施方案中,核酸酶是CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶或转录激活因子样效应物核酸酶。在此方面的一个实施方案中,核酸酶是核酸内切酶或核酸外切酶。

可以使用本文所述的系统和方法调控任何基因。例如,在一个实施方案中,待调控的基因是选自由以下组成的组的疾病或病症的疾病相关基因:肌萎缩性侧索硬化症;内毒素血症;动脉粥样硬化性血管疾病,即冠状动脉疾病;支架再狭窄;颈动脉代谢性疾病;中风;急性心肌梗死;心力衰竭;外周动脉疾病;肢体缺血;静脉移植失败;AV内瘘失败(AVfistula failure);克罗恩病;溃疡性结肠炎;回肠炎和肠炎;阴道炎;银屑病和炎症性皮肤病如皮炎;湿疹;特应性皮炎;过敏性接触性皮炎;荨麻疹;血管炎;脊柱关节病(spondyloarthropathies);硬皮病;呼吸道过敏性疾病如哮喘;过敏性鼻炎;超敏性肺病;关节炎(例如,类风湿性关节炎和银屑病性关节炎);湿疹;牛皮癣;骨关节炎;多发性硬化;系统性红斑狼疮;糖尿病;肾小球肾炎;移植排斥(包括同种异体移植排斥和移植物抗宿主病)或工程化组织的排斥;传染病;肌炎;炎性CNS病症;中风;闭合性脑损伤(closed-headinjuries);神经退行性疾病;阿尔茨海默病;脑炎;脑膜炎;骨质疏松;痛风;肝炎;肝静脉闭塞病(VOD);出血性膀胱炎;肾炎;脓毒症;结节病;结膜炎;耳炎;慢性阻塞性肺病;鼻窦炎;贝赫切特综合征;移植物抗肿瘤效应;粘膜炎;阑尾炎;阑尾破裂;腹膜炎;主动脉瓣疾病;二尖瓣疾病;雷特综合征;结节性硬化症;苯丙酮尿症;斯-李-奥(Smith-Lemli-Opitz)综合征和脆性X综合征;帕金森病;Aicardi-Goutières综合征;亚历山大病;Allan-Hemdon-Dudley综合征;POLG相关病症;α-甘露糖苷贮积症(II型和III型);

在一个实施方案中,被调控的基因是肌营养不良蛋白(dystrophin)基因。肌营养不良蛋白基因位于X染色体上,且该基因的突变可导致各种疾病状态,例如杜氏(Duchenne)肌营养不良、Becker型肌营养不良、X连锁扩张型心肌病和家族性扩张型心肌病。在一个实施方案中,肌营养不良蛋白基因在通常带有导致所述疾病的突变(例如,1、6、7、8、23、43、44、45、46、50、51、52、53或55)的外显子处被靶向。

在一个实施方案中,存在gRNA。例如,TGCAAAAACCCAAAATATTT(SEQ ID NO:81);AAAATATTTTAGCTCCTACT(SEQ ID NO:82);CAGAGTAACAGTCTGAGTAG(SEQ ID NO:83);TAAGGGATATTTGTTCTTAC(SEQ ID NO:84);CTAAGGGATATT TGTTCT TA(SEQ ID NO:85);和TGTT CT TACAGGCAACAATG(SEQ ID NO:86)。本文例如在表1中提供了其他示例性gRNA。

在一个实施方案中,被调控的基因是疾病或疼痛基因。本文所述的基因编辑系统可用于改变或调控与疾病(例如,克罗恩病或神经性疼痛,例如与周围神经系统或中枢神经系统相关的疼痛)相关的基因。例如,可以使用本文所述的基因编辑系统抑制在疼痛患者的背根神经节中异常表达(例如,过表达、或低表达)的基因,或调控有害刺激转导、电压门控钠通道(例如,Ca2+通道、K+通道、Na+通道)、NMDA受体、配体门控离子通道、Mas相关G蛋白偶联受体(Mrgprs)的功能或为上述功能所需的基因以治疗、改善、抑制或减少神经性疼痛。可使用本文所述的基因编辑系统抑制以治疗、改善、抑制或减轻神经性疼痛的示例性基因包括但不限于Navl.l、Nav1.2、Nav1.3、Nav1.4、Nav1.5、Nav1.6、Nav1.7、Nav1.8和Nav1.9、血管紧张素II的2型受体、辣椒素受体-1(VR-1)、酪氨酸受体激酶A(TrkA)、缓激肽受体、CSF1-DAP12途径成员(例如,CSF1、CSFR1或DAP12)。

在一个实施方案中,具有降低的脱靶效应的用于编辑与神经性疼痛相关的基因(例如,改变至少一种基因产物的表达)的系统包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子从mRNA信息中被剪接以产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;b)结合神经性疼痛相关基因(例如,Nav 1.8)的gRNA;和c)结合调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少所述外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。

在一个实施方案中,所描述的发明的gRNA针对Nav 1.8,以沉默Nav1.8。靶向Nav1.8的示例性gRNA包括但不限于表2中所列的gRNA。

在一个实施方案中,所描述的发明的gRNA针对转录起始位点(TSS)上游的前200bp以激活Nav1.8。靶向Nav 1.8的示例性gRNA包括但不限于表3中所列的gRNA。

在此方面和本文所述的所有方面的一个实施方案中,调控核酸序列是β珠蛋白突变型内含子(mutant intron)。

在此方面和本文所述的所有方面的一个实施方案中,系统包含至少两个调控核酸序列。

在此方面和本文所述的所有方面的一个实施方案中,调控核酸序列包含选自由以下组成的组的序列:SEQ ID NO:18(IVS2-654内含子C-T)、SEQ ID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:51(具有657G突变的IVS2-654内含子)、SEQ ID NO:52(具有658T突变的IVS2-654内含子)、SEQ ID NO:20(具有657GT突变的IVS2-654内含子)、SEQ IDNO:53(具有200bp缺失的IVS2-654内含子)、SEQ ID NO:68(仅具有197bp的IVS2-654内含子)、SEQ ID NO:55(具有6A突变的IVS2-654内含子)、SEQ ID NO:56(具有564C突变的IVS2-654内含子)、SEQ ID NO:57(具有841A突变的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ ID NO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ ID NO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)、SEQ ID NO:74、SEQID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148;及其任何组合,包括单一序列。

在此方面和本文所述的所有方面的一个实施方案中,结合调控序列的寡核苷酸包含选自以下的序列:SEQ ID NO:37(IVS2-654 CT的寡核苷酸)、SEQ ID NO:38(具有657GT突变的IVS2-654的寡核苷酸)、SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)、SEQ IDNO:40(针对IVS2-654中564C突变的寡核苷酸)、SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)、SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)、SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)、SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)、SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)、SEQ ID NO:49(针对IVS2-705的寡核苷酸)、SEQ ID NO:76(诱导反义外显子23跳跃的寡核苷酸)以及SEQ ID NO 138(针对LUC-AON1的寡核苷酸)、SEQ ID NO:139(针对LUC-AON2的寡核苷酸)、SEQ ID NO:140(针对LUC-AON3的寡核苷酸)、SEQ ID NO:141(针对LUC-AON4的寡核苷酸)、SEQ ID NO:142(针对IVS2(S0)-654,LUC-654的寡核苷酸)和SEQ ID NO:149(针对野生型调控序列的寡核苷酸)。

在此方面和本文所述的所有方面的一个实施方案中,结合调控序列的寡核苷酸包含选自表4中列出的那些序列的序列。

在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:138的序列的寡核苷酸(例如,LNA-AON1)结合具有SEQ ID NO:143的序列的调控序列。

在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:139的序列的寡核苷酸(例如,LNA-AON2)结合具有SEQ ID NO:144的序列的调控序列。

在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:140的序列的寡核苷酸(例如,LNA-AON3)结合具有SEQ ID NO:145的序列的调控序列。

在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:141的序列的寡核苷酸(例如,LNA-AON4)结合具有SEQ ID NO:146的序列的调控序列。

在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:142的序列的寡核苷酸(例如,LNA-654)结合具有SEQ ID NO:147的序列的调控序列。

在此方面和本文所述的所有方面的一个实施方案中,寡核苷酸结合的调控序列选自表5中列出的那些序列。

在此方面和本文所述的所有方面的一个实施方案中,脱靶效应降低至少30%(降低至少40%、至少50%、至少60%、至少70%、至少80%、至少90%)。

在此方面和本文所述的所有方面的一个实施方案中,组分(a)和(b)位于相同或不同的载体上。

在此方面和本文所述的所有方面的一个实施方案中,将组分(b)作为裸DNA导入细胞。在此方面和本文所述的所有方面的一个实施方案中,使用脂质制剂将组分(b)导入细胞。在此方面和本文所述的所有方面的一个实施方案中,使用纳米颗粒将组分(b)导入细胞。

在此方面和本文所述的所有方面的一个实施方案中,在施用(a)之后的时间点施用组分(b)。在此方面和本文所述的所有方面中的另一个实施方案中,组分(a)和(b)基本上同时施用。

在此方面和本文所述的所有方面的一个实施方案中,在缺少(b)或没有(b)表达的情况下,在细胞中检测不到(a)的表达。例如,(a)的表达在细胞中为“关闭(OFF)”,直到它与(b)在细胞中共表达。伴随(b)表达或存在(b),(a)在细胞中被“打开(ON)”。

在一个实施方案中,组分(b)控制基因编辑系统的“打开(ON)”和/或“关闭(OFF)”状态。

在一个实施方案中,基因编辑系统可以选择性地“打开(ON)”或“关闭(OFF)”。在另一个实施方案中,基因编辑系统可以在空间和/或局部控制下选择性地“打开(ON)”或“关闭(OFF)”。在一个实施方案中,系统的组分可以被局部递送/施用至期望的位点、位置,器官、细胞类型、组织类型等,以诱导基因编辑系统局部“打开(ON)”。在一个实施方案中,可以持续给定的时间段施用基因编辑系统的组分,以控制系统“打开(ON)”或“关闭(OFF)”的时机。不需要在具有空间和/或时间控制的情况下递送/施用系统的所有组分。例如,组分(a)可以全身施用,而组分(b)可以局部施用和/或持续特定的时间段。例如,取决于受试者的疼痛程度,人们可以将系统“打开(ON)”或“关闭(OFF)”。

在此方面和本文所述的所有方面的一个实施方案中,(a)的表达取决于(b)的表达。

在此方面和本文所述的所有方面的一个实施方案中,载体是病毒载体。示例性的病毒载体包括但不限于AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。

在此方面和本文所述的所有方面的一个实施方案中,载体是非病毒载体。

在此方面和本文所述的所有方面的一个实施方案中,核酸酶是CRISPR相关的核酸酶。

在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶为基因编辑创建双链断裂,并且其中该CRISPR相关的核酸酶选自由以下组成的组:Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。

在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶是选自金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、嗜热链球菌(Streptococcusthermophilus)(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)(NmCas9)、新杀手弗朗西丝菌(Francisella novicida)(FnCas9)和空肠弯曲菌(Campylobacter jejuni)(CjCas9)的Cas9变体。

在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶已经被修饰用于基因编辑,但是没有双链DNA断裂(例如,CRISPRi或CRISPRa),并且选自由dCas、nCas和Cas 13组成的组。

在此方面和本文所述的所有方面的一个实施方案中,基因编辑正在降低一种或多种基因产物的表达。在此方面和本文所述的所有方面的一个实施方案中,基因编辑正在增加一种或多种基因产物的表达。

在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶被密码子优化以在真核细胞中表达。

在此方面和本文所述的所有方面的一个实施方案中,细胞是哺乳动物或人细胞。

在此方面和本文所述的所有方面的一个实施方案中,细胞在体内或体外。

在此方面和本文所述的所有方面的一个实施方案中,靶基因是疾病基因。

本文所述的本发明的另一个方面提供了用于编辑受试者中的基因的方法,该方法包括向需要基因编辑的受试者施用本文所述的任何系统。

附图简述

图1A-1C显示了剪接位点优化对诱导的影响。(图1A)IVS2-654内含子及其剪接模式的示意图。灰色框:人β珠蛋白的外显子,白色框:可替代使用的外显子(AUE),虚线:内含子。(图1B)剪接位点的修饰。上图:灰色框:荧光素酶编码区,白色框:可替代使用的外显子(调控蛋白的非天然存在的外显子),实线:内含子,虚线:选择性剪接路径。中间图:IVS2-654内含子的5'和3'剪接位点序列。下图:具有修饰的序列的可替代5'剪接位点。(图1C)荧光素酶活性的测量。我们在有或没有结合调控序列的对应寡核苷酸(AON)的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。前两行中的数据指示相对光单位(RLU)/μg。第三行中的数据呈现为具有AON的表达相对于无AON的表达的增加倍数。

图2A-2C显示了对内含子尺寸的优化。(图2A)原始IVS2-654和IVS2(S0)-654内含子的示意图。白色框:可替代使用的外显子。虚线:内含子。示出了IVS2的5'和3'剪接位点的核苷酸编号和IVS2(S0)缺失后的连接区。(图2B)IVS2(S0)-654(SEQ ID NO:147)的总核苷酸序列。(图2C)IVS(S0)-654对荧光素酶诱导的影响。我们在有或没有AON654的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。数据呈现为含有AON654时的表达相对于不含AON654时的表达的增加倍数。

图3A-3C显示了其对应的AON对含有修饰内含子的构建体的荧光素酶表达的调控。(图3A)构建体及其AON靶序列的示意图。(图3B)AON对各构建体的诱导。在有或没有所示AON的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。数据呈现为含有AON时的表达相对于无AON时的表达的增加倍数。(图3C)通过对应AON诱导荧光素酶表达。

图4A-4B显示了其对应的AON对多基因表达的差异化调控。(图4A)每种构建体及其AON的预期途径的示意图。(图4B)对三种个体基因表达的差异调控。上图显示了荧光显微镜下的GFP。LNADGTl特异性诱导GFP表达。中间图显示了荧光显微镜下的RFP。LNADGT2特异性诱导RFP表达。下图显示了对每个样品的荧光素酶活性的测量。LNALucS1特异性诱导荧光素酶表达。

图5A和5B显示了在小鼠肝脏中AON对AAV2.5-CBh-Luc-DGT1荧光素酶表达的调控。(图5A)所示条件下的荧光素酶活性。(图5B)所示包括AON1+I条件下的荧光素酶活性。

图6A-6B显示了在小鼠眼睛中AON对AAV2.5-CBh-Luc-DGT1荧光素酶表达的调控。(图6A)实验概要。短箭头表示载体注射的时间点。箭头表示AON注射的时间点。长箭头表示荧光素酶活性测量的时间点。(图6B)AON诱导载体的荧光素酶表达。该示意图显示了每次施用AON后小鼠眼睛的荧光素酶活性(RLU)。

图7显示了野生型人β珠蛋白内含子剪接的示意图。灰色数字框显示外显子。

图8显示了在氨基酸654处含有点突变(C-T)的人β珠蛋白IVS2-654突变体的示意图。

图9显示了人β珠蛋白IVS2-654突变体中第二个内含子的错误内含子剪接的示意图。内含子2的错误剪接抑制了β珠蛋白功能。粗箭头表示优先的剪接变体。标记了5'剪接位点(5'SS)。

图10显示了结合调控序列的寡核苷酸(由黑色线条显示)的示意图,该调控序列结合人β珠蛋白IVS2-654突变体的5'SS并驱动优先剪接为野生型剪接。

图11显示了Luc-IVS2-654(B)的示意图。该构建体包含图10所示的可被选择性剪接的调控序列(参见图10中的相应虚线),即,定义位于外显子侧翼的第一内含子和第二内含子的第一组剪接位点和第二组剪接位点。该可被选择性剪接的调控序列被符合读框地放置到编码待调控蛋白,例如报告基因诸如所例示的荧光素酶或核酸酶诸如CRISPR相关的核酸酶的核苷酸序列内。在不存在阻断第二组剪接元件的寡核苷酸(oligo)或该寡核苷酸不表达的情况下,该盒的插入导致可变剪接事件(alternate splicing event),其保留非天然存在于待调控蛋白中的外显子(AS)(细箭头),从而产生无功能蛋白质。当结合调控序列的寡核苷酸与该盒结合时,发生正确的剪接,并且去除该外显子(粗箭头)从而产生功能性蛋白质(CS)。该图中例示了荧光素酶。当存在结合阻止第二组剪接元件剪接的调控序列的寡核苷酸时,观察到荧光素酶诱导水平增加了11倍。

图12A-12C显示了含有GFP的IVS 2-654(B)盒的修改的剪接。(图12A)GFP654INT的示意图,其包含图10中在外显子侧翼使用的的盒(参见相应的虚线)。结合调控序列的寡核苷酸由灰色线条表示。该盒的插入导致保留该外显子(空心箭头)的可变剪接(AS)。当结合调控序列的寡核苷酸结合该盒时,发生正确剪接(CS),并且去除该外显子(空心箭头)。(图12B)不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的所示细胞系中的GFP654INT表达。只有当结合调控序列的寡核苷酸被结合时,GFP的表达才是可见的。使用GFP wtINT作为对照。(图12C)显示不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的所示细胞系中的AS或CS的射线照片。

图13显示了在不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的眼睛中GFP654INT的体内表达。使用GFP wtINT作为对照。

图14是改变内含子长度和数目的各种pGL3-654突变体的示意图。B是含有两组剪接元件(即,四个剪接位点,一个选择性剪接位点)的原始850bp IVS2-654内含子。B(S0)被改变为减小内含子的尺寸,同时保持剪接元件组,例如缺失200bp片段。AB(S0)具有两个最小调控序列,其中每一个与寡核苷酸结合。

图15A-15C显示了增加剪接受体或供体强度的各种pGL3-654突变体。(图15A)与图10中使用的盒相邻的侧翼序列的示意图。显示了野生型序列(上行)的突变(下行)。(图15B)所示构建体的增加倍数。(图15C)各种pGL3-654突变体与内含子的长度和数目的示意图。图15A中示出了斜线之间的区域。

图16显示了所示荧光素酶构建体的侧翼序列。

图17A-17E显示了与所示突变体中的调控序列结合的给定寡核苷酸的特异性。B(S0-GT)(FIG.17A)、LUCS1(e)(FIG.17B)、DGT1(f)(FIG.17C)、DGT2(e)(FIG.17D)和DGT3(h)(FIG.17E)。结合调控序列的寡核苷酸仅在结合至其对应突变体时增加诱导倍数。

图18A和18B显示了含有图10发现的盒的AAT的体内表达。在施用寡核苷酸前1年,经由AAV在小鼠中表达含有该盒的AAT。(图18A)显示在未施用反义寡聚核苷酸(ASO)、施用错配寡聚核苷酸(LNA654M)或结合调控序列的寡聚核苷酸(LNA654)之后AAT的AS或CS的射线照片。正确剪接(CS),下方条带。选择性剪接(AS)上方条带。(图18B)在诱导(例如,施用所示的寡核苷酸)后所示天数的AAT表达。

具体实施方式

如本文所用,“一个(a、an)”或“该(the)”可以是单数或复数,这取决于这种使用的上下文。例如,“一个细胞(a cell)”可以意指单个细胞或其可以意指多个细胞。

也如本文所用,“和/或”是指并涵盖一个或多个相关所列项目的任一个和所有可能的组合,以及当以备选方式(“或”)解释时不组合。

此外,当涉及可测量值,例如本发明的组合物的量、剂量、时间、温度等时,本文所用的术语“约”意指包括指定量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。

本发明提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入:(a)包含编码核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从mRNA信息被剪接时,产生编码无功能核酸酶的mRNA,该无功能性核酸酶包含由非天然存在的外显子编码的氨基酸序列;和(b)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。

在一个实施方案中,组分(a)和(b)位于同一载体上。在另一个实施方案中,组分(a)和(b)位于两个不同的载体上。

在一个实施方案中,系统还包括将结合靶基因序列的gRNA导入细胞中,如果该系统中包含的核酸酶是CRISPR相关的核酸酶的话。在一个实施方案中,组分(a)和(b)以及gRNA位于同一载体上。在另一个实施方案中,组分(a)和(b)以及gRNA位于三个不同的载体上。在另一个实施方案中,(a)和(b)位于同一载体上,而gRNA位于不同的载体上;或者(a)和gRNA位于同一载体上,而(b)位于不同的载体上;或者(b)和gRNA位于同一载体上,而(a)位于不同的载体上。当本文所述的至少两个组分位于同一载体上时,该组分在载体上的顺序可互换。

载体可以是但不限于非病毒载体、病毒载体和合成的生物纳米颗粒。本发明的病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。

在一个实施方案中,组分(a)和(b)基本上同时施用给受试者。在一个实施方案中,组分(a)和(b)在不同的时间点施用给受试者。例如,组分(a)的施用时间点晚于(b)。或者,组分(a)的施用时间点早于(b)。在一个实施方案中,组分(b)在(a)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23小时或更多小时施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30天或更多天施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10、11个月或更多个月施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10年或更多年施用。

在一个实施方案中,gRNA与(a)基本上同时施用。在另一个实施方案中,gRNA在与(a)不同的时间点施用。例如,可以在施用(a)之前的时间点施用gRNA。或者,可以在施用(a)之后的时间点施用gRNA。在一个实施方案中,gRNA可以基本上与(b)同时、在(b)之前或之后施用。

在一个实施方案中,组分(b)被施用给受试者一次。在可选实施方案中,组分(b)在给定的时间段内(例如,数小时、数天、数月、数年或更长)被施用给受试者至少两次,例如至少1、2、3、4、5、6、7、8、9、10或更多次。

在一个实施方案中,(a)的表达取决于(b)的表达。换句话说,(a)不会在细胞中表达,除非(b)随后存在于同一细胞内或在同一细胞中表达。因此,在本文所述的某些实施方案中,本文所述的系统在关闭(OFF)位置(例如,未表达)被导入(例如,受试者)并与本发明的结合调控序列的寡核苷酸和/或小分子接触将系统切换至打开(ON)位置(例如,表达)。本文还提供了将处于打开(ON)位置被导入(例如,导入受试者中)的系统转换到关闭(OFF)位置的方法,例如抑制赋予生物学功能的异源蛋白和/或RNA产生的方法,包括:a)在允许剪接的条件下使结合调控序列的寡核苷酸和/或小分子与本发明的核酸接触,其中小分子阻断第一组剪接元件的成员,导致去除了第二内含子,从而抑制第一RNA的产生。

本发明还提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从mRNA信息被剪接时,产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;b)结合靶基因序列的gRNA;和c)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和基因编辑靶序列起作用的核酸酶的mRNA。

在一个实施方案中,组分(a)、(b)和(c)位于同一载体上。在另一个实施方案中,组分(a)、(b)和(c)位于三个不同的载体上。在另一个实施方案中,(a)和(b)位于同一载体上,而(c)位于不同的载体上;或者(a)和(c)位于同一载体上,而(b)位于不同载体上;或者(b)和(c)位于同一载体上,而(a)位于不同的载体上。当至少两个组分位于同一载体上时,该组分载体上的顺序可互换。

载体可以是但不限于非病毒载体、病毒载体和合成的生物纳米颗粒。本发明的病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。

在一个实施方案中,组分(a)、(b)和(c)基本上同时施用给受试者。在一个实施方案中,组分(a)、(b)和(c)在不同的时间点施用给受试者。在可选实施方案中,组分(c)在(a)和(b)之后的时间点施用,例如组分(a)和(b)基本上同时施用,而(c)在该施用后至少一周施用。在一个实施方案中,组分(c)在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23小时或更多小时施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30天或更多天施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11个月或更多个月施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10年或更多年施用。

在一个实施方案中,组分(c)被施用给受试者一次。在可选实施方案中,组分(c)在给定的时间段内(例如,数小时、数天、数月、数年或更长)被施用给受试者至少两次,例如至少1、2、3、4、5、6、7、8、9、10或更多次。

在一个实施方案中,(a)和(b)的表达依赖于(c)的表达。换句话说,(a)和(b)不会在细胞中表达,除非(c)随后存在于同一细胞内或在同一细胞中表达。因此,在本文所述的某些实施方案中,本文所述的系统在关闭(OFF)位置(例如,未表达)被导入(例如,受试者)并且与结合本发明的调控序列的寡核苷酸和/或小分子的接触将系统切换至打开(ON)位置(例如,表达)。本文还提供了将处于打开(ON)位置被导入(例如,导入受试者中)的系统转到关闭(OFF)位置的方法,例如抑制赋予生物学功能的异源蛋白和/或RNA产生的方法,包括:a)在允许剪接的条件下使结合调控序列的寡核苷酸和/或小分子与本发明的核酸接触,其中小分子阻断第一组剪接元件的成员,导致去除了第二内含子,从而抑制第一RNA的产生。

在一个实施方式中,gRNA的表达依赖(b)的表达。

在一个实施方案中,核酸酶是CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶、转录激活因子样效应物核酸酶、核酸内切酶或核酸外切酶。

如本文所用,术语“核酸酶(nuclease)”是指具有DNA裂解活性的分子。用于在本文公开的方法中使用的核酸酶试剂的具体实例包括RNA引导的CRISPR-Cas9系统、锌指蛋白、大范围核酸酶、TAL结构域、TALEN、酵母装配重组酶(yeast assembly recombinase)、亮氨酸拉链、CRISPR/Cas核酸内切酶以及本领域技术人员已知的其他核酸酶。可以选择或设计核酸酶以获得在给定的靶位点裂解的特异性。例如,可对核酸酶进行选择以在靶位点切割,从而在切割的多核苷酸和不同的多核苷酸之间产生重叠末端。具有蛋白质和RNA元件的核酸酶,例如CRISPR-Cas9,可被提供为已经与剂复合的核酸酶,或者可被提供为分开的蛋白质和RNA元件,在这种情况下,它们在本文所述的反应混合物中复合形成核酸酶。在一个实施方案中,使用Cas9以外的核酸酶。

如本文所用,术语“核酸酶的识别位点”是指由核酸酶在此处诱导切口或双链断裂的DNA序列。核酸酶的识别位点可以是对细胞内源性的(或天然的)或者核酸酶的识别位点对细胞可以是外源性的。在具体的实施方案中,识别位点是对细胞外源性的,且因此不是该细胞的基因组中天然存在的。仍在另外的实施方案中,识别位点对于细胞和人们想要定位在靶基因座处的目的多核苷酸而言是外源性的。在另外的实施方案中,外源性或内源性识别位点在宿主细胞的基因组中仅呈现一次。在具体的实施方案中,鉴定了在基因组内仅出现一次的内源性或天然位点。这样的位点随后可以用于设计将在该内源性识别位点处产生切口或双链断裂的核酸酶试剂。

识别位点的长度可以变化,并且包括例如约30-36bp(对于锌指核酸酶(ZFN)对(即每个ZFN的识别位点为约15-18bp))、约36bp(对于转录激活因子样效应物核酸酶(TALEN))或者约20bp(对于CRISPR/Cas9向导RNA)的识别位点。

在一些实施方案中,识别位点位于编码选择性标志物(selection marker)的多核苷酸内。这样的位置可以位于选择性标志物的编码区内或影响选择性标志物的表达的调控区内。因此,核酸酶试剂的识别位点可以位于选择性标志物的内含子、编码选择性标志物的多核苷酸的启动子、增强子、调控区或任何非蛋白编码区中。在一些实施方案中,识别位点处的切口或双链断裂破坏选择性标志物的活性。测定功能选择性标志物的存在或不存在的方法是本领域技术人员已知的。

在所需的识别位点中诱导切口或双链断裂的任何核酸酶都可用于本文公开的方法和组合物中。可以使用天然存在的或天然的核酸酶,只要该核酸酶试剂在所需的识别位点中诱导切口或双链断裂即可。或者,可以使用修饰的或工程化的核酸酶试剂。“工程化的核酸酶”包括从其天然形式被工程化(修饰或衍生)为特异性识别期望的识别位点并在期望的识别位点诱导切口或双链断裂的核酸酶。因此,工程化的核酸酶试剂可以从天然的、天然存在的核酸酶试剂获得,或者其可以是人工创建或合成的。核酸酶试剂的修饰在蛋白质裂解试剂中可少至一个氨基酸,或在核酸裂解试剂中可少至一个核苷酸。在一些实施方案中,工程化的核酸酶在识别位点诱导切口或双链断裂,其中该识别位点不是天然(非工程化或非修饰的)核酸酶试剂所识别的序列。在识别位点或其他DNA中产生切口或双链断裂在本文中可称为“切割(cutting)”或“裂解(cleaving)”识别位点或其他DNA。

随后细胞以两种方式中的一种可修复这些断裂:非同源末端连接和同源介导的修复(同源重组)。在非同源末端连接(NHEJ)中,双链断裂通过将断裂末端彼此直接连接而被修复。如此,尽管某些核酸材料可能丢失,从而导致缺失,但是没有新的核酸材料插入该位点。在同源介导的修复(homology-directed repair)中,与裂解的靶DNA序列具有同源性的供体多核苷酸可用作修复裂解的靶DNA序列的模板,导致遗传信息从供体多核苷酸转移至靶DNA。因此,新的核酸材料可被插入/复制到该位点中。NHEJ和/或同源介导的修复引起的对靶DNA的修饰可用于基因校正、基因置换、基因加标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。

在一个实施方案中,核酸酶是CRISPR相关的核酸酶。天然原核CRISPR相关的核酸酶系统包括具有恒定长度的间插可变序列的短重复序列的阵列(即,成簇的规律间隔的短回文重复序列),以及CRISPR相关(“Cas”)的核酸酶蛋白。转录的CRISPR阵列的RNA被一部分Cas蛋白加工成小向导RNA,其通常具有如下所讨论的两个组分。存在至少三种不同的系统:I型、II型和III型。在这3种系统中,参与将RNA加工成成熟crRNA的酶是不同的。在天然原核系统中,向导RNA(“gRNA”)包括两个短的、非编码的RNA种类,称为CRISPR RNA(“crRNA”)和反式作用RNA(“tracrRNA”)。在示例性系统中,gRNA与核酸酶(例如Cas核酸酶)形成复合物。gRNA:核酸酶复合物结合具有前间隔序列邻近基序(protospacer adjacent motif,“PAM”)和前间隔序列的靶多核苷酸序列,前间隔序列是与gRNA的一部分互补的序列。gRNA:核酸酶复合物对靶多核苷酸的识别和结合诱导靶多核苷酸的裂解。天然CRISPR相关的核酸酶系统在原核生物中起到免疫系统的作用,其中gRNA:核酸酶复合物以类似于真核生物体中RNAi的方式识别外源遗传因子并使之沉默,从而赋予对诸如质粒和噬菌体等外源遗传原件的抗性。已经证明,单一向导RNA(“sgRNA”)可以代替天然存在的crRNA和tracrRNA之间形成的复合物。

任何CRISPR相关的核酸酶可用于本发明的系统和方法中。CRISPR核酸酶系统是本领域技术人员已知的,例如,参见专利/申请8,993,233、US 2015/0291965、US 2016/0175462、US 2015/0020223、US 2014/0179770、8,697,359;8,771,945;8,795,965;WO2015/191693;US 8,889,418;WO 2015/089351;WO 2015/089486;WO 2016/028682;WO2016/049258;WO 2016/094867;WO 2016/094872;WO 2016/094874;WO 2016/112242;US2016/0153004;US 2015/0056705;US 2016/0090607;US 2016/0029604;8,865,406;8,871,445;其每一个均通过引用以其整体并入本文。

在一个实施方案中,核酸酶是大范围核酸酶。已基于保守序列基序,将大范围核酸酶分为4个家族,这些家族是LAGLIDADG(SEQ ID NO:153)、GIY-YIG、H-N-H和His-Cys盒子家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HEase以其长识别位点和耐受其DNA底物中的某些序列多态性而著称。大范围核酸酶的结构域、结构和功能是已知的,参见例如Guhan和Muniyappa(2003)Crit Rev Biochem Mol Biol 38:199-248;Lucas等人,(2001)Nucleic Acids Res 29:960-9;Jurica和Stoddard,(1999)Cell Mol Life Sci 55:1304-26;Stoddard,(2006)Q Rev Biophys 38:49-95;和Moure等人,(2002)Nat StructBiol 9:764。在一些实例中,使用了天然存在的变体和/或工程化的衍生性大范围核酸酶。用于修饰动力学、辅因子相互作用、表达、最佳条件和/或识别位点特异性以及筛选活性的方法是已知的,参见例如Epinat等人,(2003)Nucleic Acids Res 31:2952-62;Chevalier等人,(2002)Mol Cell 10:895-905;Gimble等人,(2003)Mol Biol 334:993-1008;Seligman等人,(2002)Nucleic Acids Res 30:3870-9;Sussman等人,(2004)J Mol Biol342:31-41;Rosen等人,(2006)Nucleic Acids Res 34:4791-800;Chames等人,(2005)Nucleic Acids Res 33:el78;Smith等人,(2006)Nucleic Acids Res 34:el49;Gruen等人,(2002)Nucleic Acids Res 30:e29;Chen和Zhao,(2005)Nucleic Acids Res 33:el54;W02005105989;W02003078619;W02006097854;W02006097853;W02006097784;和W02004031346,其通过引用以其整体并入本文。

本文可使用任何大范围核酸酶,包括但不限于I-Scel、I-SceII、1-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-Ceul、I-CeuAIIP、I-Crel、1-CrepsbIP、I-CrepsbIIP、1-CrepsbIIIP、1-CrepsbIVP、I-Tlil、I-Ppol、PI-PspI、F-Scel、F-Scell、F-Suvl、F-TevI、F-TevII、I-Amal、I-Anil、I-Chul、I-Cmoel、I-Cpal、I-CpaII、I-CsmI、I-Cvul、I-CvuAIP、I-DdiI、I-DdiII、I-Dirl、I-Dmol、I-HmuI、I-HmuII、I-HsNIP、I-Llal、I-Msol、I-Naal、I-NanI、I-NcIIP、I-NgrIP、I-Nitl、I-Njal、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrlP、I-PobIP、I-Porl、I-PorIIP、I-PbpIP、I-SpBetaIP、I-Scal、I-SexIP、I-SneIP、I-Spoml、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68O3I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-Tful、PI-TfuII、PI-Thyl、PI-Tlil、ΡΙ-TliII或其任何活性变体或片段。

在一个实施方案中,大范围核酸酶识别12至40个碱基对的双链DNA序列。在一个实施方案中,大范围核酸酶识别基因组中一个完全匹配的靶序列。在一个实施方案中,大范围核酸酶是归巢核酸酶(homing nuclease)。在一个实施方案中,归巢核酸酶是归巢核酸酶的LAGLIDADG(SEQ ID NO:153)家族。在一个实施方案中,归巢核酸酶的LAGLIDADG(SEQ IDNO:153)家族选自I-Scel、I-Crel和I-Dmol。

在一个实施方案中,核酸酶是锌指核酸酶(ZFN)。在一个实施方案中,ZFN的每个单体包含3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域结合3bp亚位点。在其他实施方案中,ZFN是嵌合蛋白,其包含与独立的核酸酶可操作地连接的基于锌指的DNA结合结构域。在一个实施方案中,该独立的核酸内切酶是FokI核酸内切酶。在一个实施方案中,核酸酶试剂包含第一ZFN和第二ZFN,其中第一ZFN和第二ZFN各自与FokI核酸酶亚基可操作地连接,其中第一ZFN和第二ZFN识别靶DNA序列的每条链中被约5-7bp间隔子隔开的两个连续的靶DNA序列,并且其中该FokI核酸酶亚基二聚化以创建产生双链断裂的活性核酸酶。参见,例如,US20060246567;US20080182332;US20020081614;US20030021776;WO 2002/057308A2;US20130123484;US20100291048;WO 2011/017293A2;和Gaj等人,(2013)Trends in Biotechnology,31(7):397-405,其每一个通过引用以其整体并入本文。

在一个实施方式中,核酸酶是转录激活因子样效应因子核酸酶(TALEN)。TAL效应TALEN核酸酶是一类序列特异性核酸酶,其可用于在原核或真核生物体的基因组中的特异性靶序列处产生双链断裂。TAL效应物核酸酶通过将天然的或工程化的转录激活因子样(TAL)效应因子或其功能部分融合到核酸内切酶(诸如例如FokI)的催化结构域而产生。独特的模块化TAL效应物DNA结合结构域允许设计具有潜在的任何给定DNA识别特异性的蛋白质。因此,TAL效应物核酸酶的DNA结合结构域可以被工程化以识别特异性DNA靶位点,并因此用于在期望的靶序列处产生双链断裂。参见,WO 2010/079430;Morbitzer等人,(2010)PNAS10.1073/pnas.1013133107;Scholze&Boch(2010)Virulence 1:428-43;Christian等人,Genetics(2010)186:757-761;Li等人,(2010)Nuc.Acids Res.(2010)doi:10.1093/nar/gkq704;和Miller等人,(2011)Nature Biotechnology 29:143-148;其全部内容通过引用以其整体并入本文。

合适的TAL核酸酶的实例和用于制备合适的TAL核酸酶的方法公开于例如美国专利申请第2011/0239315、2011/0269234、2011/0145940、2003/0232410、2005/0208489、2005/0026157、2005/0064474、2006/0188987和2006/0063231号(其每一个通过引用以其整体并入本文)。在多种实施方案中,TAL效应因子核酸酶被工程化,其在例如目的基因组基因座中的靶核酸序列中或其附近切割,其中靶核酸序列位于待被靶向载体修饰的序列处或其附近。适合用于与本文提供的各种方法和组合物的TAL核酸酶包括那些经特殊设计以在待被本文所述的靶向载体修饰的靶核酸序列处或其附近结合的核酸酶。

在一个实施方案中,TALEN的每个单体包括33-35个TAL重复,其这些TAL重复通过两个高变残基识别单个碱基对。在一个实施方案中,核酸酶试剂是包含与独立的核酸酶可操作地连接的基于TAL重复的DNA结合结构域的嵌合蛋白。在一个实施方案中,该独立的核酸酶是FokI核酸内切酶。在一个实施方案中,核酸酶试剂包含第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域,其中第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域各自与FokI核酸酶亚基可操作地连接,其中第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域识别靶DNA序列的每条链中被不同长度(12-20bp)的间隔子序列隔开的两个连续的靶DNA序列,并且其中FokI核酸酶亚基二聚化以创建在靶序列处产生双链断裂的活性核酸酶。

在一个实施方案中,核酸酶是例如催化RNA降解的核糖核酸酶。为了RNA编辑目的,核糖核酸酶可以与CRISPR-Cas激发的RNA靶向系统(CIRT)的其他组分(例如,RNA发夹结合蛋白、与发夹结合蛋白和互补靶RNA相互作用的gRNA以及结合并稳定gRNA的带电荷蛋白)协同使用。示例性核糖核酸酶包括:外切核糖核酸酶(例如,多核苷酸磷酸化酶(PNPase)、RNase PH、RNase R、RNase D、RNase T、寡核糖核酸酶、核糖核酸外切酶I和核糖核酸外切酶II)、核糖核酸内切酶(例如,RNase A、RNase H、RNase III、RNase L、RNase P、RNase PhyM、RNase T1、RNase T2、RNase U2和RNase V)、PIN结构域核酸酶、无活性PIN结构域核酸酶、YTHDF1、YTHDF2、hADAR2、突变体hADAR2(例如,E488W)。可用于用CIRT进行RNA编辑的核糖核酸酶进一步描述于,例如,Rauch,S.等人,Cell;178(122-134页),2019;Mali,P.Cell(Leading Edge Previews),2019;和Lerner,Louise.“Using human genome,scientistsbuild CRISPR for RNA to open pathways for medicine.”2019年6月20日UChicagoNews.Web.访问日期2019年7月3日;其内容通过引用以其整体并入本文。

在一个实施方案中,核酸酶是限制性核酸内切酶(即限制性酶),包括I型、II型、III型和IV型核酸内切酶。I型和III型限制性核酸内切酶识别特异性识别位点,但通常在距核酸酶结合位点的可变位置处裂解,该可变位置可能距离裂解位点(识别位点)数百个碱基对。在II型系统中,限制性活性不依赖于任何甲基化酶活性,并且裂解通常发生在结合位点内或其附近的特定位点。大多数II型酶切割回文序列,然而Ila型酶识别非回文识别位点并在识别位点外裂解,lib型酶切割序列两次,其中两个位点都位于识别位点外,且Ils型酶识别不对称识别位点并在一侧且在距离识别位点约1-20个核苷酸的特定距离处裂解。IV型限制性酶靶向甲基化DNA。限制性内切酶进一步描述并分类于例如REBASE数据库中(网页为rebase.neb.com);Roberts等人,(2003)Nucleic Acids Res 31:418-20),Roberts等人,(2003)Nucleic Acids Res 31:1805-12和Belfort等人,(2002)Mobile DNA II第761-783页,Craigie等人编辑(ASM Press,Washington,DC)。

在一个实施方案中,核酸酶是核酸外切酶。核酸外切酶是通过破坏多核苷酸链的5'或3'末端的磷酸二酯键的水解反应裂解多核苷酸链末端的核苷酸而起作用的酶。核酸外切酶可以是细胞内源性的或外源性的。天然核酸外切酶的非限制性实例包括核酸外切酶I,核酸外切酶II、核酸外切酶III、核酸外切酶IV、核酸外切酶V和核酸外切酶VIII。

在另一个实施方案中,核酸酶是格氏嗜盐碱杆菌(Natronobacterium gregoryi)Argonaute蛋白(NgAgo)。NgAgo是利用一对5'磷酸化的反向互补向导DNA或RNA(例如,siRNA)靶向并切割靶核酸(例如,基因组DNA)的核酸内切酶。重要的是,Argonaute蛋白不需要靶核酸序列中的基序(例如,PAM)。

用于NgAgo的序列是本领域已知的。例如,NgAgo可以具有SEQ ID NO:154的序列。

SEQ ID NO:154是编码NgAgo的氨基酸序列(NCBI登录号:ANC90309.1)。

NgAgo的表达和正确折叠对盐浓度等条件敏感。NgAgo可以在具有高浓度盐的细胞中表达。NgAgo可以在具有低或中等盐浓度的细胞中表达,并且所得到的表达的NgAgo蛋白可以分成可溶和不可溶的级分。在可溶部分中可以发现功能性NgAgo。

靶核酸的向导DNA序列可以是靶核酸中的任一具有20-30个碱基对(bp)例如,22bp、24bp、26bp、28bp或30bp的序列。

如实施例1所述的产生包含调控序列(β珠蛋白内含子区)的NgAgo。利用限制性消化将调控序列的内含子区(例如,SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)亚克隆到携带NgAgo的AAV载体质粒中。

在一个实施方案中,核酸酶是人工限制性DNA切割子(cutter)(ARCUT)。使用本文所述的材料和方法,可以使用称为人工限制性DNA切割子(ARCUT)的非限制性酶方法学来编辑细胞的染色体DNA。该方法使用假互补(pseudo-complementary)肽核酸(pcPNA)来指定染色体或端粒区域内的裂解位点。一旦pcPNA指定了位点,此处的切割就由执行剪接功能的铈(CE)和EDTA(化学混合物)进行。此外,该技术使用DNA连接酶,该DNA连接酶稍后可在剪接位点内连接任何所需的DNA(参见例如,Komiyama M,Chemical modifications ofartificial restriction DNA cutter(ARCUT)to promote its in vivo and in vitroapplications,Artif.DNA PNA XNA.2014;5:e1112457.)。

在一个实施方案中,待调控的基因是选自由以下组成的组的疾病的相关基因:肌萎缩性侧索硬化症;内毒素血症;动脉粥样硬化性血管疾病即冠状动脉疾病;支架再狭窄;颈动脉代谢性疾病;中风;急性心肌梗死;心力衰竭;外周动脉疾病;肢体缺血;静脉移植失败;AV内瘘失败;克罗恩病;溃疡性结肠炎;回肠炎和肠炎;阴道炎;银屑病和炎症性皮肤病如皮炎;湿疹;特应性皮炎;过敏性接触性皮炎;荨麻疹;血管炎;脊椎关节病;硬皮病;呼吸道过敏性疾病如哮喘;过敏性鼻炎;超敏性肺病;关节炎(例如,类风湿性关节炎和银屑病性关节炎);湿疹;牛皮癣;骨关节炎;多发性硬化;系统性红斑狼疮;糖尿病;肾小球肾炎;移植排斥(包括同种异体移植排斥和移植物抗宿主病)或工程化组织的排斥;传染病;肌炎;炎性CNS病症;中风;闭合性脑损伤;神经退行性疾病;阿尔茨海默病;脑炎;脑膜炎;骨质疏松;痛风;肝炎;肝静脉闭塞病(VOD);出血性膀胱炎;肾炎;脓毒症;结节病;结膜炎;耳炎;慢性阻塞性肺病;鼻窦炎;贝赫切特综合征;移植物抗肿瘤效应;粘膜炎;阑尾炎;阑尾破裂;腹膜炎;主动脉瓣疾病;二尖瓣疾病;雷特综合征;结节性硬化症;苯丙酮尿症;斯-李-奥综合征和脆性X综合征;帕金森病;Aicardi-Goutières综合征;亚历山大病;Allan-Hemdon-Dudley综合征;POLG相关病症;α-甘露糖苷贮积症(II型和III型);

在一个实施方案中,被调控的基因是肌营养不良蛋白基因。肌营养不良蛋白基因位于X染色体上,且该基因的突变可导致各种疾病状态,例如杜氏肌营养不良、Becker型肌营养不良、X连锁扩张型心肌病和家族性扩张型心肌病。在一个实施方案中,肌营养不良蛋白基因在通常带有导致所述疾病的突变(例如,1、6、7、8、23、43、44、45、46、50、51、52、53或55)的外显子处被靶向。

DMD的示例性向导RNA(gRNA)包括但不限于表1中所列的gRNA。

靶向DMD基因以使其沉默的方法进一步描述于,例如国际专利申请WO 2016/025469和WO 2016/161380,其通过引用以其整体并入本文。

在一个实施方案中,被调控的基因是UBE3A。UBE3A在某些组织中是双等位基因表达的(biallelically expressed),例如,神经元仅表达UBE3A的母系遗传拷贝。神经元中位于染色体15q11-q13中的母系UBE3A基因的失活或有害突变导致天使人综合征。在一个实施方案中,神经元的UBE3A被调控。在一个实施方案中,在神经元细胞中被印记即被沉默的父系UBE3A被调控。在例如以下文献中进一步描述了用于治疗Angelman综合征的UBE3A调节:Huang,HS.等人,Nature;第481卷,2012;Judson,MC等人,Neuron;第90卷,2016;和Judson,MC等人,Trends in Neurosciences;34(6),2011;其内容通过引用以其整体并入本文。

在另一个实施方案中,被调控的基因是选自以下的疾病基因:

1p36;18p;6p21.3;14q32;AAAS;FGD1;EDNRB;CP(3p26.3);LMBR1;COL2A1(12q13.11);4p16.3;HMBS;ADSL;ABCD1;JAG1;NOTCH2;TP63;TREX1;RNASEH2A;RNASEH2B;RNASEH2C;SAMHD1;ADAR;IFIH1;GFAP;HGD;10q26.13;ATP1A3;ALMS1;ALAD;FGFR2;VPS33B;ATM;PITX2;FOXO1A;FOXC1;PAX6;10q26;FGFR2;IGF-2;CDKN1C;H19;KCNQ1OT1;BTD;BCS1L;15q26.1;17FLCN;ATP2A1;MAOA;NOTCH3;HTRA1;X 17q24.3-q25.1;ASPA;RAB23;SNAP29;FTR(7q31.2);PMP22;MFN2;CHD7;LYST;RUNX2;ERCC6;ERCC8;X RPS6KA3;COH1;COL11A1;COL11A2;COL2A1;NTRK1;PTEN;CPOX;14q13-q21;5p;16q12;FGFR2;FGFR3;FGFR3;ATP2A2;Xp11.22CLCN5;OCRL;WT1;18q;22q11.2;HSPB8;HSPB1;HSPB3;GARS;REEP1;IGHMBP2;SLC5A7;DCTN1;TRPV4;SIGMAR1;COL1A1;COL1A2;COL3A1;COL5A1;COL5A2;TNXB;ADAMTS2;PLOD1;B4GALT7;DSE;EMD;LMNA;SYNE1;SYNE2;FHL1;TMEM43;FECH;FANCA;FANCB;FANCC;FANCD1;FANCD2;FANCE;FANCF;FANCG;FANCI;FANCJ;FANCL;FANCM;FANCN;FANCP;FANCS;RAD51C;XPF;GLA(Xq22.1);APC;IKBKAP;MYCN;MED12;FXN;GALT;GALK1;GALE;GBA(1);PAX6;GCDH;ETFA;ETFB;ETFDH;BCS1L;MYO5A;RAB27A;MLPH;ATP2C1(3);ABCA12;HFE;HAMP;HFE2B;TFR2;TF;CP;FVIII;UROD;3q12;ENG;ACVRL1;MADH4;GNE;MYHC2A;VCP;HNRPA2B1;HNRNPA1;EXT1;EXT2;EXT3;HPS1;HPS3;HPS4;HPS5;HPS6;HPS7;AP3B1;PMP22;NODAL;NKX2-5;ZIC3;CCDC11;CFC1;SESN1;CBS(gene);HD;IDS;IDUA;AASS;AGXT;GRHPR;DHDPSL;ABCA1;COL2A1;FGFR3(4p16.3);20q11.2;IKBKG(Xq28);TBX4;15q11-14;FGFR2;INNPP5E;TMEM216;AHI1;NPHP1;CEP290;TMEM67;RPGRIP1L;ARL13B;CC2D2A;OFD1;TMEM138;TCTN3;ZNF423;AMRC9;ALS2;COL2A1;PDGFRB;GAL;ATP13A2;LCAT;HPRT(X);TP53;MSH2;MLH1;MSH6;PMS2;PMS1;TGFBR2;MLH3;RYR1(19q13.2);BCKDHA;BCKDHB;DBT;DLD;ARSB;20q13.2-13.3;XK(X);AP1S1;MEFV;ATP7A(Xq21.1);MMAA;MMAB;MMACHC;MMADHC;LMBRD1;MUT;RAB3GAP(2q21.3);ASPM(1q31);GALNS;GLB1;ZEB2(2);FGFR3;MEN1;RET;MSTN;DMPK;CNBP;HYAL1;17q11.2;SMPD1;NPA;NPB;NPC1;NPC2;GLDC;AMT;GCSH;PTPN11;KRAS;SOS1RAF1;NRAS;HRAS;BRAF;SHOC2;MAP2K1;MAP2K2;CBL;RELN;RAG1;RAG2;COL1A1;COL1A2;IFITM5;PANK2(20p13-p12.3);UROD;PDS;STK11;FGFR1;FGFR2;PAH;AASDHPPT;TCF4(18);PKD1(16)or PKD2(4);DNAI1;DNAH5;TXNDC3;DNAH11;DNAI2;KTU;RSPH4A;RSPH9;LRRC50;PROC;PROS1;ABCC6;RP1;RP2;RPGR;PRPH2;IMPDH1;PRPF31;CRB1;PRPF8;TULP1;CA4;HPRPF3;ABCA4;EYS;CERKL;FSCN2;TOPORS;SNRNP200;PRCD;NR2E3;MERTK;USH2A;PROM1;KLHL7;CNGB1;TTC8;ARL6;DHDDS;BEST1;LRAT;SPARA7;CRX;MECP2;ESCO2;CREBBP;HEXB;SGSH;NAGLU;HGSNAT;GNS;HSPG2;COL2A1;FBN1;11p15;Xp11.22;PHF8;ABCB7;SLC25A38;GLRX5;GUSB;DHCR7;17p11.2;ATXN1;ATXN2;ATXN3;PLEKHG4;SPTBN2;CACNA1A;ATXN7;ATXN8OS;ATXN10;TTBK2;PPP2R2B;KCNC3;PRKCG;ITPR1;TBP;KCND3;FGF14;FGFR3;ABCA4;CNGB3;ELOVL4;PROM1;COL11A1;COL11A2;COL2A1;COL9A1;COL2A1;HEXA(15);GCH1;PCBD1;PTS;QDPR;MTHFR;DHFR;FGFR3;5q32-q33.1(TCOF1;POLR1C;or POLR1D);TSC1;TSC2;MYO7A;USH1C;CDH23;PCDH15;USH1G;USH2A;GPR98;DFNB31;CLRN1;PPOX;VHL;PAX3;MITF;WS2B;WS2C;SNAI2;EDNRB;EDN3;SOX10;COL11A2;ATP7B;C2ORF37(2q22.3-q35);4p16.3;15ERCC4;CENPVL1;CENPVL2;GSPT2;MAGED1;ALAS2(X);PEX1;PEX2;PEX3;PEX5;PEX6;PEX10;PEX12;PEX13;PEX14;PEX16;PEX19;和PEX26。

在一个实施方案中,被调控的基因是与神经性疼痛相关的基因。神经性疼痛的特征是自发的超敏疼痛反应,并且通常可以在原始神经损伤治愈后持续很长时间。这种异常升高的疼痛反应可被观察为痛觉过敏(对有害疼痛刺激的敏感性增加)或异常性疼痛(对非有害刺激如冷、热或触觉的异常疼痛反应)。神经性疼痛可以是急性的或慢性的。神经性疼痛的示例性类型包括疱疹后神经痛、HIV远端感觉性多发性神经病变、糖尿病神经性疼痛、与创伤性神经损伤相关的神经性疼痛、与中风相关的神经性疼痛、与多发性硬化相关的神经性疼痛、与脊髓空洞症相关的神经性疼痛、与癫痫相关的神经性疼痛、与脊髓损伤相关的神经性疼痛和与癌症相关的神经性疼痛。

本文所述的基因编辑系统可用于改变或调控与神经性疼痛(例如,与周围神经系统或中枢神经系统相关的疼痛)相关的基因。例如,可以使用本文所述的基因编辑系统抑制在疼痛患者的背根神经节中异常表达(例如,过表达、或低表达)的基因,或调控有害刺激转导、电压门控钠通道(例如,Ca2+通道、K+通道、Na+通道)、NMDA受体、配体门控离子通道、Mas相关G蛋白偶联受体(Mrgprs)的功能或为上述功能所需的基因以治疗、改善、抑制或减少神经性疼痛。可使用本文所述的基因编辑系统被抑制以治疗、改善、抑制或减轻神经性疼痛的示例性基因包括但不限于Navl.l、Nav1.2、Nav1.3、Nav1.4、Nav1.5、Nav1.6、Nav1.7、Nav1.8和Nav1.9、血管紧张素II 2型受体、辣椒素受体-1(VR-1)、酪氨酸受体激酶A(TrkA)、缓激肽受体、CSF1-DAP12途径成员(例如,CSF1、CSFR1或DAP12)。

在一个实施方案中,具有降低的脱靶效应的用于编辑与神经性疼痛相关的基因(例如,改变至少一种基因产物的表达)的系统包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子从mRNA信息被剪接以产生编码无功能核酸酶的mRNA,该无功能性核酸酶包含由非天然存在的外显子编码的氨基酸序列;(b)结合神经性疼痛相关基因(例如,Nav 1.8)的gRNA;和(c)结合调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA内剪接,从而产生缺少外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。

在一个实施方案中,gRNA针对Nav 1.8。用于靶向待抑制的Nav 1.8的示例性gRNA包括但不限于表2中列出的gRNA。

在某些实施方案中,例如,用于调控疼痛基因的CRISPR相关的核酸酶被连接至一个功能结构域,该功能结构域促进基因(例如,一种过表达的疾病基因)的阻遏,从而导致该基因的转录被阻遏。用来与DNA结合结构域(例如,失活Cas9)融合以用于阻遏基因(例如,Nav 1.8)表达的示例性功能域是来自人KOX-1蛋白的KOX阻遏结构域或KRAB阻遏结构域(参见,例如,Thiesen等人,New Biologist 2,363-374(1990);Margolin等人,Proc.Natl.Acad.Sci.USA 91,4509-4513(1994);Pengue等人,Nucl.Acids Res.22:2908-2914(1994);Witzgall等人,Proc.Natl.Acad.Sci.USA91,4514-4518(1994)。另一种合适的阻遏结构域是甲基结合结构域蛋白2B(MBD-2B)(还参见Hendrich等人,(1999)Mamm Genome10:906-912对MBD蛋白的描述。另一个示例性阻遏结构域是与v-ErbA蛋白相关的阻遏结构域。参见,例如,Damm等人(1989)Nature 339:593-597;Evans(1989)Int.J.Cancer增刊4:26-28;Pain等人(1990)New Biol.2:284-294;Sap等人,(1989)Nature 340:242-244;Zenke等人(1988)Cell 52:107-119;和Zenke等人(1990)Cell 61:1035-1049。另外的示例性阻遏结构域包括但不限于KRAB(也称为“KOX”)、SID、MBD2、MBD3、DNMT家族的成员(例如DNMT1、DNMT3A、DNMT3B)、Rb和MeCP2)。参见,例如Bird等人(1999)Cell 99:451-454;Tyler等人,(1999)Cell 99:443-446;Knoepfler等人(1999)Cell 99:447-450;和Robertson等人(2000)Nature Genet.25:338-342。另外的示例性阻遏结构域包括但不限于ROM2和AtHD2A。参见,例如,Chem等人(1996)Plant Cell 8:305-321;和Wu等人(2000)Plant J.22:19-27。

在一个实施方案中,所描述的发明的CRISPR相关的核酸酶(例如失活Cas9)被连接至KOX阻遏结构域。

在某些实施方案中,例如用于调节疾病相关基因或疼痛基因的CRISPR相关的核酸酶被连接至一个功能域,该功能域促进基因(例如,低表达疾病基因)的转录激活,从而导致该基因的转录被激活。用于实现这种激活的合适的结构域包括HSV VP16活化结构域(参见,例如,Hagmann等人,J.Virol.71,5952-5962(1997))、核激素受体(nuclear hormonereceptor)(参见,例如,Torchia等人,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚基(Bitko&Barik,J.Virol.72:5610-5618(1998)和Doyle&Hunt,Neuroreport 8:2937-2942(1997));Liu等人,Cancer Gene Ther.5:3-28(1998)),或人工嵌合功能结构域如VP64(Seifpal等人,EMBO J.11,4961-4968(1992))。另外的示例性激活结构域包括但不限于VP16、VP64、p300、CBP、PCAF、SRC1 PvALF、AtHD2A和ERF-2。参见,例如,Robyr等人(2000)Mol.Endocrinol.14:329-347;Collingwood等人(1999)J.Mol.Endocrinol.23:255-275;Leo等人(2000)Gene 245:1-11;Manteuffel-Cymborowska(1999)ActaBiochim.Pol.46:77-89;McKenna等人(1999)J.Steroid Biochem.Mol.Biol.69:3-12;Malik等人(2000)Trends Biochem.Sci.25:277-283;和Lemon等人(1999)Curr.Opin.Genet.Dev.9:499-504;OsGAI、HALF-1、Cl、AP1、ARF-5、ARF-6、ARF-7和ARF-8、CPRF1、CPRF4、MYC-RP/GP和TRABI。参见,例如,Ogawa等人(2000)Gene 245:21-29;Okanami等人(1996)Genes Cells 1:87-99;Goff等人(1991)Genes Dev.5:298-309;Cho等人(1999)Plant Mol.Biol.40:419-429;Ulmason等人(1999)Proc.Natl.Acad.Sci.USA 96:5844-5849;Sprenger-Haus-sels等人(2000)Plant J.22:1-8;Gong等人,(1999)PlantMol.Biol.41:33-44;和Hobo等人(1999)Proc.Natl.Acad.Sci.USA 96:15,348-15,353。

在一个实施方案中,本文所述的基因编辑系统用于激活被阻遏的基因(repressedgene)的转录。例如,本文所述的系统可以用于激活本文所述的基因(例如,疾病基因或与疼痛相关的基因(例如,被阻遏的Nav 1.8)的转录。

在一个实施方案中,gRNA被引导至Nav 1.8的转录起始位点(TSS)上游的前200bp,并导致稳健的转录激活。用于靶向待转录激活的Nav 1.8的示例性gRNA包括但不限于表3中所列的gRNA。

本发明实施方案中的调控序列可以是限定包含一个或多个突变的内含子的核苷酸序列,该突变的存在产生了第一组剪接元件和第二组剪接元件。在一些实施方案中,调控序列可以是定义内含子-外显子-内含子区的序列,其中内含子和/或外显子区中的突变导致了第一组剪接元件和第二组剪接元件的存在。在该后一实施方案中,当第二组剪接元件有活性时,结果是产生内含子-外显子-内含子区中的外显子的RNA。

本文还提供了筛选方法,例如鉴定阻断本文所述的基因编辑系统的调控核酸的第二组剪接元件的成员的寡核苷酸或其他化合物或复合物的方法,包括:(a)在允许剪接的条件下,使编码包含调控核酸序列的核酸酶的核酸(或者可替代地包含调控核酸的报告基因)与寡核苷酸/化合物在细胞内接触;和b)检测在调控核酸序列内缺乏非天然存在的外显子序列的mRNA的产生,通过产生这类mRNA鉴定了阻断第二组剪接元件的成员的寡核苷酸或化合物/复合物。可选地,检测到功能性蛋白质(例如报告蛋白)或核酸酶是抑制/阻断第二组剪接元件的寡核苷酸/化合物的标志(indicator)。

内含子是真核DNA或RNA的一部分,其介于该DNA或RNA的编码部分或“外显子”之间。内含子和外显子被从DNA转录成RNA,该RNA被称为“初级转录物,RNA前体”(或“前体mRNA(pre-mRNA)”)。内含子必须从前体mRNA中去除,从而可以产生由外显子编码的蛋白质。去除前体mRNA中的内含子并随后连接外显子是在剪接过程中进行的。

剪接过程是在转录后(即转录后地)但在翻译之前对RNA进行的并由剪接因子介导的一系列反应。因此,“前体mRNA”是既包含外显子又包含一个或多个内含子的RNA,并且“信使RNA(mRNA或RNA)”是已经从其中去除任何内含子并且其中外显子被顺序地连接在一起的RNA,从而可以通过用核糖体翻译成功能性蛋白质或者通过翻译成功能性RNA而由此产生基因产物。

内含子的特征是作为剪接机制的一部分并且是剪接所必需的一组“剪接元件”。内含子是相对短的、保守的核酸片段,其结合进行剪接反应的各种剪接因子。因此,每个内含子由5'剪接位点、3'剪接位点和位于其间的分支点限定。剪接元件还包含位于外显子中的外显子剪接增强子和沉默子,以及位于内含子中的与剪接位点和分支点相距一定距离的内含子剪接增强子和沉默子。除了剪接位点和分支点之外,这些元件还控制可变的、异常的和组成型剪接。

可以在本文所述的基因编辑系统中使用指导包含调控序列的核酸酶表达的各种启动子。实例包括但不限于组成型启动子、阻遏型启动子和/或诱导型启动子,它们的一些非限制性实例包括病毒启动子(例如,CMV、SV40)、组织特异性启动子(例如,肌肉(例如,MCK)、心脏(例如,NSE)、眼(例如,MSK)和合成型启动子(SP1元件)以及鸡β肌动蛋白启动子(CB或CBA)。启动子可以存在任何位置,在该位置其与核酸酶序列可操作地缔合。

此外,可以相同或不同的一个或多个启动子可以一起存在于同一核酸分子中,或者位于核酸分子上相对于彼此和/或相对于核酸内存在的核酸酶序列和/或调控序列的不同位置。此外,内部核糖体进入信号(IRES)和/或其他核糖体-通读元件可存在于该核酸分子上。可以相同或不同的一种或多种这样的IRES和/或核糖体通读元件可以一起存在于同一核酸分子中和/或在核酸分子上的不同位置存在于该同一核酸分子中。当多个核酸酶序列存在于核酸分子上时,这类IRES和核糖体通读元件可用于经由帽-非依赖性机制翻译信使RNA序列。

发现调控序列在核酸酶的编码区内,并且被放置成使得当调节序列的外显子被表达时,其具有符合读框的终止密码子。如下文所例示的,调控序列可以被被包括在核酸酶例如Cpf1或Cas9或其他核酸酶的编码区域内的任何地方。在一些实施方案中,调控序列位于核酸酶序列的5'核苷酸的三分之一内的任何位置、核酸酶序列的中间核苷酸的三分之一内的任何位置和/或核酸酶序列的3'核苷酸的三分之一内的任何位置。在一些实施方案中,调控序列位于核酸酶序列中的开放阅读框和多聚A位点之间的任何位置。优选地,调控序列位于核酸酶编码序列的5'端或其附近,例如距离5'末端5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸以内。调控核酸位于编码核酸酶的核酸序列内的任何位置,使得蛋白质中非天然存在的外显子被表达(具有符合读框的终止密码子)。

在其中本发明的基因编辑系统中存在两个或更多个调控序列的某些实施方案中,可以将两个或更多个调控序列定位为隔开至少约5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸,包括本文中没有具体叙述的5至1000之间的任何数量的核苷酸。

本发明的核酸分子的调控序列可以包含定义位于非天然存在的外显子侧翼的第一内含子序列和第二内含子序列的第一组剪接元件和第二组剪接元件、基本上由其组成和/或由其组成。本文所用的“非天然存在的外显子”是在正常情况下在待调控的野生型蛋白中不存在的外显子,并且其在编码序列中的存在导致缺乏野生型功能的蛋白质被表达。当第一内含子序列和第二内含子序列被逐个(individually)剪接时,产生编码无功能核酸酶的RNA分子,例如由于其包含具有终止密码子的非天然存在的外显子。可选地,在第二组剪接元件没有活性的情况下,外显子、第一和第二内含子全部被剪接以产生编码有功能的核酸酶的mRNA,该核酸酶对于基因编辑例如碱基编辑或核酸内切酶活性是有功能的,以便于基因置换/修复。在一些实施方案中,本发明的调控序列可以包含一个或多个突变,所述突变可以是取代、添加、缺失等。

基因编辑系统的组分可以存在于载体中,且这样的载体可以存在于细胞中。任何合适的载体都包括在本发明的实施方案中,包括但不限于非病毒载体(例如,核酸、微环(minicircle)、线性DNA、质粒、泊洛沙姆(poloxymer)、外来体和脂质体)、病毒载体和合成的生物纳米颗粒(BNP)(例如,由不同的腺相关病毒以及其他细小病毒合成设计)。

对于本领域技术人员显而易见的是,任何合适的载体都可以用于递送本发明的基因编辑系统。递送载体的选择可以根据本领域已知的多种因素进行,包括靶宿主的年龄和种类、体外与体内递送、期望的表达水平和持久性、预期目的(例如,用于治疗或多肽生产)、靶细胞或器官、递送途径、分离的核酸的尺寸、安全性考虑等。

合适的载体还包括病毒载体(例如,逆转录病毒、甲病毒;牛痘病毒;腺病毒、腺相关病毒或单纯疱疹病毒)、脂质载体、聚赖氨酸载体、与核酸分子一起使用的合成聚氨基聚合物载体,诸如质粒等。

本领域已知的任何病毒载体都可用于本发明。这类病毒载体的实例包括但不限于衍生自以下的载体:腺病毒科(Adenoviridae);双RNA病毒科(Birnaviridae);布尼亚病毒科(Bunyaviridae);杯状病毒科(Caliciviridae),毛发病毒组(Capillovirus group);香石竹潜病毒组(Carlavirus group);香石竹斑驳病毒组(Carmovirus virus group);花椰菜花叶病毒组(Group Caulimovirus);黄花丝状病毒组(Closterovirus Group);鸭跖草黄斑驳病毒组(Commelina yellow mottle virus group);豇豆花叶病毒组(Comovirusvirus group);冠状病毒科(Coronaviridae);PM2噬菌体组;环病毒科(Corcicoviridae);潜隐病毒组(Group Cryptic virus);隐病毒组(group Cryptovirus);黄瓜花叶病毒组家族([PHgr]6噬菌体组;囊状噬菌体科(Cysioviridae);香石竹环斑病组(Group Carnationringspot);香石竹病毒组(Dianthovirus virus group);蚕豆枯萎病组(Group Broadbean wilt);豆科病毒组(Fabavirus virus group);丝状病毒科(Filoviridae);黄病毒科(Flaviviridae);真菌传杆状病毒组;双生病毒组(Group Geminivirus);贾第鞭毛虫病毒组(Group Giardiavirus);肝DNA病毒科(Hepadnaviridae);疱疹病毒科(Herpesviridae);大麦病毒组(Hordeivirus virus group);Illar病毒组(Illarvirus virus group);丝状噬菌体科(Inoviridae);虹彩病毒科(Iridoviridae);光滑病毒科(Leviviridae);脂毛噬菌体科(Lipothrixviridae);黄矮病毒组(Luteovirus group);玉米雷亚朵非纳病毒组(Marafivirus virus group);玉米褪绿矮缩病毒组(Maize chlorotic dwarf virusgroup);微小噬菌体科;肌病毒科(Myoviridae);坏死病毒组(Necrovirus group);线虫传多角体病毒组(Nepovirus virus group);野田村病毒科(Nodaviridae);正粘病毒科(Orthomyxoviridae);乳多空病毒科(Papovaviridae);副粘病毒科(Paramyxoviridae);欧防风黄点病毒组(Parsnip yellow fleck virus group);分体病毒科(Partitiviridae);细小病毒科(Parvoviridae);豌豆耳突花叶病毒组(Peaenation mosaic virus group);藻类DNA病毒科(Phycodnaviridae);微小RNA病毒科(Picornaviridae);芽生噬菌体科(Plasmaviridae);短尾噬菌体科(Podoviridae);多DNA病毒科(Polydnaviridae);马铃薯X病毒组(Potexvirus group);马铃薯Y病毒属(Potyvirus);痘病毒科(Poxviridae);呼肠孤病毒科(Reoviridae);逆转录病毒科(Retroviridae);弹状病毒科(Rhabdoviridae);根前毛菌病毒组(Group Rhizidiovirus);长尾噬菌体科(Siphoviridae);南方菜豆花叶病毒组(Sobemovirus group);SSV 1型噬菌体;复层病毒科(Tectiviridae);纤细病毒属(Tenuivirus);四病毒科(Tetraviridae);烟草花叶病毒组(Group Tobamovirus);烟草脆裂病毒组(Group Tobravirus);披膜病毒科(Togaviridae);番茄丛矮病毒组(GroupTombusvirus);隆病毒组(Group Torovirus);全病毒科(Totiviridae);芜菁黄花叶病毒组(Group Tymovirus);和植物卫星病毒(Plant virus satellites)。

产生重组病毒载体和使用病毒载体进行核酸递送的方案可参见,例如,CurrentProtocols in Molecular Biology,Ausubel,F.M.等人(编辑)Greene PublishingAssociates,(1989)和其他标准实验室手册(例如,Vectors for Gene Therapy.In:Current Protocols in Human Genetics.John Wiley and Sons,Inc.:1997)。本发明的方法中采用的载体的非限制性实例包括用于将核酸递送到细胞中的任何核苷酸构建体,例如质粒、非病毒载体或病毒载体,例如可以包装重组逆转录病毒基因组的逆转录病毒载体(参见例如,Pastan等人,Proc.Natl.Acad.Sci.U.S.A.85:4486(1988);Miller等人,Mol.Cell.Biol.6:2895(1986))。例如,重组逆转录病毒然后可用于感染并由此将本发明的核酸递送至受感染的细胞。当然,将改变的核酸导入哺乳动物细胞的确切方法不限于使用逆转录病毒载体。其他技术可广泛用于该程序,包括使用腺病毒载体(Mitani等人,Hum.Gene Ther.5:941-948,1994)、腺相关病毒(AAV)载体(Goodman等人,Blood 84:1492-1500,1994)、慢病毒载体(Naldini等人,Science 272:263-267,1996)、假型逆转录病毒载体(Agrawal等人,Exper.Hematol.24:738-747,1996),和现在已知或以后鉴定的任何其他载体系统。还包括嵌合病毒颗粒,其是本领域熟知的并且可以包含两种或多种不同病毒的病毒蛋白和/或核酸的任意组合以产生功能性病毒载体。本发明的嵌合病毒颗粒还可以包含非病毒来源的氨基酸和/或核苷酸序列(例如,以促进载体靶向特定细胞或组织和/或诱导特异性免疫应答)。本发明还提供了“靶向”病毒颗粒(例如,包含细小病毒衣壳和重组AAV基因组的细小病毒载体,其中外源靶向序列已插入或替换到细小病毒衣壳中)。

也可以使用物理转导技术,例如脂质体递送和受体介导的胞吞机制以及其他胞吞机制(参见,例如,Schwartzenberger等人,Blood 87:472-478,1996)。本发明可结合这些和/或其他通常使用的核酸转移方法的任一种使用。包括病毒载体、化学转染子或物理-机械方法如电穿孔和DNA的直接扩散(direct diffusion)的合适转染方法由例如Wolff等人,Science 247:1465-1468(1990);和Wolff,Nature 352:815-818,(1991)描述。

因此,本发明的基因编辑系统的施用可以通过众多熟知方法中的任何一种来实现,例如但不限于在质粒或病毒载体中直接转移核酸,或通过在细胞中的转移,或与诸如阳离子脂质体等载体组合。这些方法是本领域熟知的并且容易适用于本文所述的方法。此外,这些方法可用于通过使用载体的靶向特性靶向某些疾病和组织、器官和/或细胞类型和/或细胞群体,这将是本领域技术人员所熟知的。还应充分理解,细胞和组织特异性启动子可用于本发明的基因编辑系统以靶向特定组织和细胞和/或以治疗特定疾病和病症。

如本领域所熟知的,包含本发明的基因编辑系统的细胞可以是任何细胞,包括但不限于来自肌肉细胞(例如,平滑肌细胞、骨骼肌细胞、心肌细胞)、肝脏细胞(例如,肝细胞)、心脏细胞、脑细胞(例如,神经元细胞)、眼细胞(例如,视网膜细胞;角膜细胞)、胰腺细胞、肾细胞、内皮细胞、上皮细胞、干细胞(例如,骨髓细胞;脐带血细胞)、组织培养细胞(例如,HeLa细胞等)。

在一个实施方案中,与不具有所要求保护的发明的组分的给定工程化基因编辑系统(例如,CRISPR/Cas、TALEN、锌指)的脱靶效应相比,本文所述的基因编辑系统可将(例如由诸如Cas3或Cas9等CRISPR/Cas基因编辑或TALEN基因编辑引起的)脱靶效应降低至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更多。如本文所用,“脱靶效应(off target effect)”是指,通过使用工程化核酸酶活性(例如基因编辑系统的核酸内切酶)而产生的非特异性或非想要的基因突变。未与其靶DNA结合的核酸酶可裂解脱靶双链断裂并在该位置产生基因突变。“脱靶效应”可以是非想要的点突变、缺失、插入、倒位、易位等。本领域技术人员可以通过例如在激活本文所述的基因编辑系统之前和之后的基因组测序来确定是否已经发生脱靶效应,以确定例如在基因编辑后是否在除靶序列以外的位置存在基因突变。评估基因编辑后脱靶效应的方法进一步综述于,例如,专利申请号WO 2015/113063;Slaymaker等人,Science,2016;351(6268):84-88;Morgens等人,Nature Communications.2017;8(15178);Koo等人,Mol Cells.205:38(6):475-481;和HHaeussler等人,Genome Biology.2016;17:148;其每一个通过引用以其整体并入本文。

在一些实施方案中,当与其他基因编辑系统相比时,本发明的核酸具有降低的“渗漏(leakiness)”水平。“渗漏”是指当系统处于“关闭(OFF)”位置时产生的基因产物或功能性RNA的量。例如,在本文所述的一些实施方案中,当本发明的基因编辑系统与结合调控序列的寡核苷酸、小分子和/或本发明的其他化合物不接触时,本发明的系统处于“关闭(OFF)”位置,且因此,第一内含子不被剪接。渗漏可能是这种调控系统中固有的问题,但是在本系统的一些实施方案中,渗漏水平可能低于本领域已知的系统中的渗漏水平。因此,本发明还提供了与其他基因表达调控系统相比具有降低的渗漏的基因表达调控系统,其中该系统包含本发明的基因编辑系统和/或本发明的载体。与其他系统相比,本系统中的渗漏降低的程度可以比在本领域已知的系统中观察到的渗漏量低5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。

作为一个实例,系统的渗漏量可以通过在系统中使用报告基因并检测当系统处于“关闭(OFF)”位置时产生的报告基因产物的量来确定。可以采用多种测定来检测报告基因产物,包括但不限于蛋白质检测测定如ELISA和蛋白印迹以及核酸检测测定如聚合酶链反应、DNA印迹和RNA印迹。用于检测基因产物的其他测定可以包括功能测定,例如,测量归因于基因产物的生物活性的量。本发明的核酸和方法可用于比较分析以证明渗漏水平与其他已知的基因调控表达系统和其中使用的核酸相比降低。

本文还提供了使用本发明的基因编辑系统的各种方法。在一个实施方案中,提供了用于编辑基因的方法。该方法包括向细胞施用基因编辑系统的以下三种组分:i)包含编码核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子被从mRNA信息剪接以产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和ii)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。

在一个实施方案中,该方法还包括将gRNA施用给细胞,如果该系统中使用的核酸酶是CRISPR相关的核酸酶的话。

在一个实施方案中,核酸酶是CRISPR相关的核酸酶,例如Cas蛋白。示例性的Cas蛋白包括但不限于Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。

在一个实施方案中,CRISPR相关的核酸酶是例如分离自细菌酿脓链球菌(Streptococcus pyogenes)的Cas9或Cas9变体(SpCas9)。该CRISPR相关的核酸酶为实现其裂解作用与向导RNA(gRNA)相关,该向导RNA将核酸酶引导至期望的靶序列,该靶序列例如具有前间隔序列邻近基序(PAM)序列(在靶序列的下游)。一旦Cas9识别出PAM序列(在SpCas9的情况下为5'-NGG-3,其中N为任何核苷酸),它就会在靶位置处产生双链断裂(DSB)。Cas9活性是蛋白质的两个部分的共同作用:感测gRNA互补序列的识别部分(recognition lobe)和裂解DNA的核酸酶部分(nuclease lobe)。

在一个实施方案中,CRISPR相关的核酸酶是一种增强的特异性spCas9(eSpCas9)变体,其进一步描述于Slaymaker等人,Science.2016;351(6268):84-88,其通过引用以其整体并入本文。

在一个实施方案中,CRISPR相关的核酸酶是Cas的天然变体。在CRISPR实验中,Cas9变体包括,例如,仅举几例,金黄色葡萄球菌(SaCas9)、嗜热链球菌(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、新杀手弗朗西丝菌(FnCas9)和空肠弯曲菌(CjCas9)。核酸酶可以基于优选的PAM序列或尺寸来确定。例如,在一个实施方案中,核酸酶是SaCas9核酸酶,其尺寸比SpCas9小约1kb,因此其可更容易地被包装到病毒载体中,并且例如,它们是两种最紧凑的天然CRISPR变体。SaCas9进一步以例如,CasX和CasY被描述(Burstein,David等人,New CRISPR–Cas systems from uncultivated microbes.Nature542.7640(2017):237;Ran,F.A.等人,In vivo genome editing using Staphylococcusaureus Cas9.Nature 520(186);2015;和Friedland,AE Characterization ofStaphylococcus aureus Cas9:a smaller Cas9 for all-in-one adeno-associatedvirus delivery and paired nickase application.Genome Biol.16:257;2015.;其内容通过引用以其整体并入本文。

各物种的Cas9序列是本领域已知的。例如,金黄色葡萄球菌(saCas9)具有SEQ IDNO:150的序列。

SEQ ID NO:150是编码金黄色葡萄球菌Cas9的氨基酸序列。

在一个实施方案中,CRISPR相关的核酸酶是衍生自空肠弯曲菌(C.jejuni)的Cas9。这种空肠弯曲菌Cas 9(CjCas9)进一步描述于例如,国际专利申请WO 2016/021973A1中,其通过引用以其整体并入本文。

SEQ ID NO:152是编码CjCas9的氨基酸序列。

在一个实施方案中,CRISPR相关的核酸酶是Cas12a(也称为Cpf1)。由于Cas9需要NGG的富含鸟嘌呤的PAM序列,因此它不太适合靶向富含AT的序列。Zetsche等人表征了一种核酸酶(参见例如,美国专利申请US 2016/0208243的序列和变体,通过引用以其整体并入本文),其来自普氏菌属(Prevotella)和弗朗西斯菌属(Francisella)1的CRISPR(Cfp1;现在被分类为Cas12a),可在靶向富含AT的DNA序列时使用。Cfp1在靶DNA中产生交错的双链切口,而不是SpCas9产生的平端切口,并且对于实验是有用的(凭借HDR修复结果)。此外,Cfp1比SpCas9小并且不需要示踪剂RNA。因此Cfp1所需的向导RNA长度更短,使其生产更为经济。

多个物种的Cfp1序列是本领域已知的。例如,氨基酸球菌属的种(Acidaminococcus sp.)Cfp1具有SEQ ID NO:151的序列。

SEQ ID NO:151是编码氨基酸球菌属的种的Cfp1的氨基酸序列。

在一个实施方案中,CRISPR相关的核酸酶是用于CRISPRi或CRISPRa系统的工程化的Cas9变体,例如,Cas9切口酶或失活Cas9。例如,在单链DNA链上产生切口而不是产生双链断裂的变体。(参见例如,Cong,Le等人,“Multiplex genome engineering using CRISPR/Cas systems”Science(2013):1231143;Mali,Prashant等人,“CAS9 transcriptionalactivators for target specificity screening and paired nickases forcooperative genome engineering.Nature biotechnology 31.9(2013):833;Ran,F.Ann等人Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editingspecificity.Cell 154.6(2013):1380-1389;Cho,Seung Woo等人Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickasesGenome research 24.1(2014):132-141,其每一个通过引用以其整体并入本文。在一些实施方案中,两种向导RNA与nCAS9一起使用。可选地,可以使用利用单一gRNA的eSpCas9。虽然切口酶显示了高特异性,但它们依赖两个向导RNA到达靶位点,从而减少了基因组中潜在靶位点的数量。Cas9的工程化版本创建了一个替代方案,该改进方案使用单一向导RNA提高了保真度;(参见例如,Qi,Lei S.等人,“Repurposing CRISPR as an RNA-guided platformfor sequence-specific control of gene expression.Cell 152.5(2013):1173-1183,其通过引用以其整体并入本文)。

在一个实施方案中,CRISPR相关的核酸酶是SpCas9-HF1或HypaCas9Kleinstiver(参见例如,Benjamin P.等人High-fidelity CRISPR–Cas9nucleases with nodetectable genome-wide off-target effects Nature 529.7587(2016):490;Chen,Janice S.等人,Enhanced proofreading governs CRISPR–Cas9 targeting accuracyNature 550.7676(2017):407,其每一个通过引用以其整体并入本文。

在一个实施方案中,CRISPR相关的核酸酶是识别广泛的PAM序列的xCas9核酸酶,从而将基因组中的靶位点增加到四分之一(参见例如,Hu,Johnny H.等人,Evolved Cas9variants with broad PAM compatibility and high DNA specificity Nature(2018),通过引用以其整体并入本文。

在一个实施方案中,CRISPR相关的核酸酶是分割型Cas9(split Cas9)。可进行与荧光蛋白如GFP的融合。这将允许对基因组位点进行成像(参见“Dynamic Imaging ofGenomic Loci in Living Human Cells by an Optimized CRISPR/Cas System”ChenB等人,Cell 2013),但是以可诱导的方式。如此,在一些实施方案中,一个或多个Cas9部分可以与荧光蛋白(例如GFP)缔合(并且特别是与之融合)。通常,使用分割型Case9方法可以对Case 9进行任意使用,无论是寻求野生型、切口酶还是失活Cas9(具有或不具有相关的功能域)。

在一个实施方案中,CRISPR相关的核酸酶是二聚体CRISPR RNA引导的Fokl核酸酶(参见,例如,Tsai SG等人,Nat Biotechnol.2014.32(6):569-576,其通过引用以其整体并入本文)。

在一个实施方案中,CRISPR相关的核酸酶是脑膜炎奈瑟球菌(NmCas9)。NmCas9不同于其他已知的Cas9核酸酶,例如,不同于SaCas9和StCas9,因为它识别5'-NNNNGATT-3'PAM序列;参见,例如,Esvelt,KM.等人,Nature Methods(2013);和Hou,Z.等人,PNAS(2013),其内容通过引用以其整体并入本文。

在一个实施方案中,CRISPR相关的核酸酶是截短的。如本文所用,“截短的(truncated)”是指一种核酸酶已被修饰以从野生型序列去除某些氨基酸。截短的核酸酶可以保留其功能,例如,DNA切割,或者它可以缺乏其功能(例如,无活性的核酸酶)。在一个实施方案中,CRISPR相关的核酸酶是截短的Cas9。在一个实施方案中,CRISPR相关的核酸酶是截短的NmCas9。截短的Cas9核酸酶例如,NmCas9的序列进一步描述于美国专利申请号2019/0040371,其通过引用以其整体并入本文。

在一个实施方案中,CRISPR相关的核酸酶是无活性Cas9、失活Cas9(也称为dCAS9)。失活Cas9(dCas9)CRISPR变体是通过简单地使核酸酶催化结构域失活同时保持识别结构域而制成的,识别结构域允许向导RNA介导的对特定DNA序列的靶向(Komor,AlexisC.等人Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage)”Nature 533.7603(2016):420,通过引用以其整体并入本文)。已知dCas9通过物理阻断转录使基因表达沉默。dCas9也已经与其他蛋白质融合并用于各种应用。例如,基因激活剂或抑制剂可以与dCas9融合以激活或阻遏基因表达(CRISPRa和CRISPRi)。此外,将荧光染料标记至dCas9能够使基因组中的特定DNA片段可视化(Gaudelli,Nicole M.等人,Programmable base editing of A·T to G·C in genomicDNA without DNA cleavage Nature 551.7681(2017):464,其通过引用以其整体并入本文)。在一个实施方案中,使用了FokI融合的dCas9(Abudayyeh,Omar O.等人,C2c2 is asingle-component programmable RNA-guided RNA-targeting CRISPReffector.Science353.6299(2016):aaf557314,通过引用以其整体并入本文)。

在一个实施方案中,失活的CRISPR相关的核酸酶因用作碱基编辑器而成为功能性基因编辑核酸酶。碱基编辑器酶由与将GC转化为AT的催化酶,胞苷氨酶融合的失活Cas9结构域组成或者由例如与Cas9融合的将AT转化为GC的tRNA腺苷脱氨酶组成,因此允许基因组中全范围的核苷酸交换:参见例如,Komor,Alexis C.等人,Programmable editing of atarget base in genomic DNA without double-stranded DNA cleavage.Nature533.7603(2016):420;Gaudelli,Nicole M.等人,Programmable base editing of A·Tto G·C in genomic DNA without DNA cleavage.Nature 551.7681(2017):464;通过引用以其整体并入本文。

在一个实施方案中,靶序列是RNA并且CRISPR相关的核酸酶是RNA编辑器例如Cas1391和Cas1392(参见例如,Abudayyeh,Omar 0.等人,RNA targeting with CRISPR—Cas13.Nature 550.7675(2017):280;Smargon,Aaron A.等人,Cas13b is a type VI-BCRISPR-associated RNA-guided RNase differentially regulated by accessoryproteins Csx27 and Csx28.”Molecular cell 65.4(2017):618-630;其每一个通过引用以其整体并入本文。在一个实施方案中,核酸酶是Cas13d。通过扫描原核生物序列获得类似于先前已知的Cas13酶的核酸酶,鉴定了Cas13d核糖核酸酶家族。这些RNA引导的RNA酶比Cas13a—Cas13c核酸酶小约20%,但显示出与先前已知的变体相当的靶向效率。这些酶的较小尺寸赋予它们若干优点,例如更便于包装和递送到细胞中(参见例如,Konermann,Silvana等人,“Transcriptome Engineering with RNA-Targeting Type VI-D CRISPREffectors.Cell(2018);Yan,Winston X.等人Cas13d Is a Compact RNA-Targeting TypeVI CRISPR Effector Positively Modulated by a WYL-Domain-Containing AccessoryProtein.Molecular cell(2018),其每一个通过引用以其整体并入本文)。

靶多核苷酸(例如,靶序列)包括本文所述的共定位复合物可用于调控或切割的任何多核苷酸序列。靶多核苷酸包括基因。出于本公开的目的,DNA(例如双链DNA)可包括靶多核苷酸,并且共定位复合物可在靶多核苷酸处或挨着靶多核苷酸或在靶多核苷酸附近与DNA结合或以其他方式与DNA共定位并且以共定位复合物可对靶多核苷酸发挥所需作用的方式。这样的靶多核苷酸可以包括内源性(或天然存在的)多核苷酸和外源性(或外来的)多核苷酸。基于本公开,本领域技术人员将能够容易地鉴定或设计共定位至包括靶核酸的DNA的向导RNA和Cas9蛋白。技术人员还能够鉴定同样共定位至包括靶核酸的DNA的转录调控蛋白或结构域。DNA包括基因组DNA、线粒体DNA、病毒DNA或外源DNA。

在一个实施方案中,靶多核苷酸是疾病基因。如本文所用,“疾病基因”是指具有导致给定疾病或引起给定疾病发作的遗传改变(例如,遗传突变)的基因。遗传改变可以是但不限于错义突变、无义突变、取代、插入、缺失、重复、移码突变、易位、倒位、重复扩增或编码的隐蔽(cryptic)起始位点或终止位点。遗传改变可导致例如基因或基因产物的活性增加、基因或基因产物的活性降低、基因的可变剪接、截短的基因或基因产物或延长的基因或基因产物。换句话说,疾病基因的遗传改变导致基因或基因产物的活性、功能和/或水平与野生型基因(例如,不具有基因突变的基因)相比被改变。下文进一步描述可以用本文所述的系统治疗的示例性疾病及其相应的疾病基因。给定疾病的疾病基因是本领域已知的。本领域技术人员可以使用标准技术确定受试者中给定基因的遗传改变的类型。例如,可对患有给定疾病的受试者进行基因组测序,并比较未患有该疾病的受试者的基因组序列。使用该技术,本领域技术人员可以评估受试者基因组中任何基因的序列,或者可以专门集中于推定的或已知的疾病基因。

如本文所用,术语“向导RNA”通常是指这样的RNA分子(或总的一组RNA分子),其可以结合CRISPR相关的核酸酶(例如,核酸内切酶,例如Cas蛋白)并且帮助将核酸内切酶靶向至靶多核苷酸(例如,DNA)内的特定位置。向导RNA可以包含crRNA片段和tracrRNA片段。如本文所用,术语“crRNA”或“crRNA片段”是指RNA分子或其部分,其包括多核苷酸靶向引导序列、茎序列和任选的5'突出端序列(5'-overhang sequence)。如本文所用,术语“tracrRNA”或“tracrRNA片段”是指包括蛋白结合片段的RNA分子或其部分(例如,蛋白结合片段能够与CRISPR相关蛋白如Cas9相互作用。术语“向导RNA”涵盖单一向导RNA(sgRNA),其中crRNA片段和tracrRNA片段位于同一RNA分子中。术语“向导RNA”还共同涵盖两种或更多种RNA分子的组,其中crRNA片段和tracrRNA片段位于不同的RNA分子中。

具有“gRNA功能”的合成向导RNA是这样一种向导RNA,其具有天然存在的向导RNA的一种或多种功能(例如与核酸内切酶缔合)或向导RNA与核酸内切酶联合所执行的功能。在某些实施方案中,功能性包括结合靶多核苷酸。在某些实施方案中,功能性包括将核酸内切酶或gRNA:核酸内切酶复合物靶向到靶多核苷酸。在某些实施方案中,功能性包括使靶多核苷酸产生切口。在某些实施方案中,功能性包括裂解靶多核苷酸。在某些实施方案中,功能性包括与核酸内切酶缔合或结合。在某些实施方案中,功能性是向导RNA在具有核酸内切酶的CRISPR相关的核酸酶系统(包括具有工程化核酸内切酶,例如,工程化Cas蛋白的人工CRISPR相关的核酸酶系统)中的任何其他已知功能。在某些实施方案中,功能性是天然向导RNA的任何其他功能。合成的向导RNA可以具有比天然存在的向导RNA更高或更低程度的gRNA功能。在某些实施方案中,与类似的天然存在的向导RNA相比,合成的向导RNA可能在一种性质方面具有较大的功能性,而在另一种性质方面具有较小的功能性。

例如,与本文所述系统一起使用的向导RNA是本领域已知的,并且进一步描述于美国专利第9,834,791号;和专利申请号US2013/0254304。例如,与ZFN系统一起使用的向导RNA是本领域已知的,并且进一步描述于国际专利申请号W02014/186,585。本文引用的专利通过引用以其整体并入本文。

可以使用例如以下的预测软件为给定的靶序列轻松生成向导RNA序列:CRISPRdirect(可在万维网上的crisper.dbels.jp/获得),参见Natio等人Bioinformatics(2015)4月1日;31(7):1120-1123;ATUM gRNA设计工具(可在万维网上的atum.bio:ecommerce/cas9/input获得);CRISPR-ERA(可在万维网上的crispr-era.stanford.eduu/indexjsp获得),参见Liu等人Bioinformatics,(2015)11月15日;31(22):3676-3678。本文引用的所有参考文献通过引用以其整体并入本文。公开可用的gRNA设计软件的非限制性实例包括:sgRNA Scorer 1.0、Quilt通用向导RNA设计器、Cas-OFFinder&Cas-Designer、CRISPR-ERA、CRISPR/Cas9靶标在线预测器、设计gRNA的Off-Spotter、CRISPRMultiTargeter、ZiFiT Targeter、CRISPRdirect、来自crispr.mit.edu/的CRISPR设计、E-CRISP等。

本文所述的向导RNA可以被修饰,例如,通过化学修饰。向导RNA的示例性化学修饰描述于例如专利申请W02016/089,433中,其通过引用以其整体并入本文。

在本文所述的任何方法中,可以将结合调控序列和/或小分子和/或其他化合物的寡核苷酸导入包含本文所述的基因编辑系统的组分的细胞中,并且这样的细胞可以位于动物中,所述动物可以是人、非人哺乳动物(狗、猫、马、牛等)或其他动物。

当编码一种或多种单一向导RNA的核酸和编码本文所述的CRISPR相关的核酸酶(RNA引导的核酸酶)的核酸各自需要在体内施用时,特别考虑使用腺病毒相关载体(AAV)。用于同时将核酸递送至基因组编辑/片段化系统的所有组分(例如,sgRNA、RNA-引导的核酸内切酶)的其他载体包括慢病毒载体,例如EB(Epstein Barr)病毒、人免疫缺陷病毒(HIV)和乙型肝炎病毒(HBV)。RNA引导的基因组编辑系统的每个组分(例如,sgRNA和核酸内切酶)可以在单独的载体(病毒或非病毒)中递送,如本领域已知的或如本文所述的。此外,与调控序列结合并阻止导致功能性核酸酶表达的剪接的基因编辑系统的寡核苷酸组分可以通过裸DNA、非病毒载体或通过使用病毒载体递送。

高剂量的核酸酶(例如Cas9)可以加剧显示与导引链极少错配的脱靶序列的插入缺失(indel)频率。如果错配是不连续的和/或在向导物的种子区之外,则这样的序列是特别敏感的。在本文中,我们描述了一种通过核酸酶活性的特异性调控(对CRISPR相关的核酸酶活性的时间控制和局部控制)来减轻脱靶效应的方法。本文所述的基因编辑系统可以用于在长期表达实验中降低剂量并且因此导致与组成型活性的CRISPR相关的核酸酶(例如,Cas9)相比降低的脱靶插入缺失。在一些实施方案中,使用了使毒性和脱靶效应的水平最小化的其他方法,并且包括例如使用Cas切口酶mRNA(例如,具有D10A突变的酿脓链球菌Cas9)和一对靶向目标位点的向导RNA,还参见WO 2014/093622(PCT/US2013/074667),其通过引用以其整体并入本文。

结合本发明的调控序列的寡核苷酸是阻止在特定剪接位点的剪接活性的寡核苷酸(例如,RNA或DNA或两者的组合)。结合调控序列的寡核苷酸结合的核苷酸序列是指导剪接事件的剪接元件组例如第二组剪接元件的成员,从而抑制剪接。因此,结合调控序列的寡核苷酸可以与剪接点、5'剪接元件、3'剪接元件、隐蔽剪接元件、分支点、隐蔽分支点、天然剪接元件、突变剪接元件等互补。本发明的结合调控序列的寡核苷酸的一些非限制性实例包括对珠蛋白内含子654T突变特异的GCTATTACCTTAACCCAG(SEQ ID NO:37);对珠蛋白内含子657GT突变特异的GCACTTACCTTAACCCAG(SEQ ID NO:38)。其他实例包括包含以下的核苷酸序列、主要由以下的核苷酸序列组成或由以下的核苷酸序列组成的寡核苷酸:SEQ IDNo:37、38、42、49、46、47、48、39、40、41、43、44、45、72、73、76、79和80。在这些寡核苷酸序列的上下文中,“主要由…组成”意指该寡核苷酸可以在寡核苷酸序列的3'端或5'端包括另外的核苷酸(例如,1、2、3、4、5、6、7、8、9或10个另外的核苷酸),这些另外的核苷酸实质上不影响寡核苷酸的功能或活性(例如,这些另外的核苷酸不与互补于原始寡核苷酸序列的序列杂交)。

在一个实施方案中,结合调控结构域的寡核苷酸具有选自表4的序列。

在一个实施方案中,具有SEQ ID NO:138的序列的寡核苷酸(例如,LNA-AON1)结合具有SEQ ID NO:143序列的调控序列。

在一个实施方案中,具有SEQ ID NO:139的序列的寡核苷酸(例如,LNA-AON2)结合具有SEQ ID NO:144的序列的调控序列。

在一个实施方案中,具有SEQ ID NO:140的序列的寡核苷酸(例如,LNA-AON3)结合具有SEQ ID NO:145的序列的调控序列。

在一个实施方案中,具有SEQ ID NO:141的序列的寡核苷酸(例如,LNA-AON4)结合具有SEQ ID NO:146的序列的调控序列。

在一个实施方案中,具有SEQ ID NO:142的序列的寡核苷酸(例如,LNA-654)结合具有SEQ ID NO:147的序列的调控序列。

在一个实施方案中,寡核苷酸结合的调控序列选自表5。

在一个实施方案中,调控序列野生型247aa:GGGTTAAG/GCAATAGC具有SEQ ID NO:148的核苷酸序列。

在一个实施方案中,结合野生型247aa调控序列的寡核苷酸(oligo)是寡核苷酸

在一个实施方案中,调控序列IVS2(S0)-654:GGGTTAAG/GTAATAGC具有SEQ ID NO:147的核苷酸序列。

在一个实施方案中,结合IVS2(S0)-654调控序列的寡核苷酸是寡核苷酸Oligo5'-GcTaTtAcCtTaAcCc-3'(SEQ ID NO:142)。

在一个实施方案中,调控序列LUC-AON1:GAGGGCAG/GTGAGTAC具有SEQ ID NO:143的核苷酸序列。

在一个实施方案中,结合LUC-AON1调控序列的寡核苷酸是寡核苷酸

在一个实施方案中,调控序列LUC-AON2:GTGCCGAG/GTAAGTTC具有SEQ ID NO:144的核苷酸序列。

在一个实施方案中,结合LUC-AON2调控序列的寡核苷酸是寡核苷酸

在一个实施方案中,调控序列LUC-AON3:CTGACTAG/GTGAGTCC具有SEQ ID NO:SEQID NO:145的核苷酸序列。

在一个实施方案中,结合LUC-AON3调控序列的寡核苷酸是寡核苷酸

在一个实施方案中,调控序列Luc-AON4:GCCAATAG/GTAAGTGC具有SEQ ID NO:146的核苷酸序列。

在一个实施方案中,结合LUC-AON4调控序列的寡核苷酸是寡核苷酸

在一些实施方案中,结合调控序列的寡核苷酸可以是不激活RNA酶H的寡核苷酸。不激活RNA酶H的寡核苷酸可以根据已知技术制备。参见,例如,Pederson等人的美国专利第5,149,797号。这种寡核苷酸可以是脱氧核糖核苷酸或核糖核苷酸序列,包含在空间上阻碍或阻止RNA酶H与包含该寡核苷酸作为其一个成员的双链体分子的结合的任何结构修饰,该结构修饰基本上不阻碍或破坏双链体的形成。因为参与双链体形成的寡核苷酸部分与参与RNA酶H结合的寡核苷酸部分有很大的不同,所以许多不激活RNA酶H的寡核苷酸是可用的。

本发明的寡核苷酸也可以是这样的寡核苷酸,其中至少一个或全部核苷酸间桥连的磷酸酯残基是修饰的磷酸酯,例如甲基膦酸酯、甲基硫代磷酸酯、磷酰吗啉酯(phosphoromorpholidate)、磷酰哌嗪酯(phosphoropiperazidate)和氨基磷酸酯(phosphoramidate)。作为另外的实例,核苷酸间桥连磷酸酯残基中的每隔一个可以如描述的那样进行修饰。在另一个非限制性实例中,这种寡核苷酸是其中至少一个或全部核苷酸含有2'低级烷基部分(例如,C1-C4、直链或支链的、饱和或不饱和的烷基,例如甲基、乙基、乙烯基、丙基、1-丙烯基、2-丙烯基和异丙基)的寡核苷酸。例如,核苷酸中每隔一个可以如描述的那样进行修饰。(还参见Furdon等人Nucleic Acids Res.17:9193-9204(1989);Agrawal等人,Proc.Natl.Acad.Sci.USA 87:1401-1405(1990);Baker等人Nucleic AcidsRes.18,3537-3543(1990);Sproat等人Nucleic Acids Res.17:3373-3386(1989);Walder和Walder,Proc.Natl.Acad.Sci.USA 85:5011-5015(1988))因此,在一些实施方案中,本发明的阻断核苷酸可以包含修饰的核苷酸间桥连磷酸酯残基,其可以是但不限于甲基硫代磷酸酯、磷酰吗啉酯、磷酰哌嗪酯和/或氨基磷酸酯的任意组合。在某些实施方案中,阻断可以包括在其2'位具有低级烷基取代基的核苷酸。

本文所述的调控序列的寡核苷酸可被例如小分子修饰以增加其在细胞中向RNA的募集。以这种方式修饰的寡核苷酸当在细胞中与小分子共表达时将具有增加的结合和裂解RNA的效率。对这种修饰的其他综述可见于,例如,Costales,MG等人,J.Am.Chem.Soc.2081,140;6741,-6744;美国专利申请号US2008/0227213A1;和国际专利号WO 2015/021415A1;其每一个通过引用以其整体并入本文。

可以修饰本文的结合调控序列的寡核苷酸,例如为了增加寡核苷酸的渗透性、亲和力、稳定性(例如,防止其降解)和药效学性质。这种修饰的实例包括但不限于肽核酸(PNA)和锁核酸(LNA)。这些修饰的进一步综述可见于,例如,Havens,MA等人Nucleic AcidsResearch 2016:44(14);6549-6563,其通过引用以其整体并入本文。

在PNA中,主链由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元构成。不同的碱基(嘌呤和嘧啶)通过亚甲基羰基键(methyl carbonyl linkage)与主链连接。不同于DNA或其他DNA类似物,PNA不含有任何戊糖部分或磷酸基团。PNA被描述得类似N末端在第一(左)位置且C末端在右的肽。PNA主链不带电荷,并且这为该聚合物提供的PNA/DNA链之间的结合比在PNA链和在DNA链之间强得多。这是由于PNA和DNA链之间缺乏电荷排斥。

与在低于10℃的温度下变性的DNA dT/DNA dA 6聚体双链体相比,使用同型嘧啶链的早期实验显示6聚体PNAT/DNA dA的Tm被确定为31℃。

其肽主链带有嘌呤和嘧啶碱基的PNA并不是容易被核酸酶或蛋白酶识别的分子种类。因此它们抗酶降解。PNA在宽pH范围内也是稳定的。因为它们不易被酶降解,这些聚合物的寿命在体外和体内都被延长。此外,它们不带电荷的事实有助于它们穿过细胞膜,并且它们更强的结合特性应减少调控基因表达所需的寡核苷酸的量。

LNA是一类含有核苷的核酸,其主要的区别特征是在核糖环的2'-O和4'-C原子之间存在亚甲基桥。该桥限制了核苷酸类似物的呋喃核糖环的柔性并将其锁定为刚性双环N-型构象。此外,LNA诱导相邻的DNA碱基采取这种构象,导致形成热力学上更稳定形式的A双链LNA核苷,其含有在DNA(A、T、G、C)中出现的四个常见核酸碱基,它们可以根据标准沃森-克里克法则与其互补核苷碱基配对。使用标准亚磷酰胺DNA合成化学可以将LNA与DNA或RNA以及其他核酸类似物混合。因此,LNA寡核苷酸可以容易地用例如氨基-接头、生物素、荧光团等加标签。因此,在引物和探针的设计中存在非常高的自由度。它们的锁定构象增加了对互补序列的结合亲和力,并提供了新的化学方法来优化和微调用于灵敏和特异地检测核酸的引物和探针。该差异在实验上可观察为LNA-NA异源双链体的增加的热稳定性,并且取决于序列中存在的LNA核苷的数目以及所使用的碱基的化学性质。这种实验差异可用于调控寡核苷酸探针的特异性,该探针被设计为通过标准杂交技术检测特定核酸靶标。

如本文所用,“第二组剪接元件的成员”包括参与激活来自前体mRNA的第二内含子剪接的任何元件。例如,第二组剪接元件的元件可以是天然DNA和/或前体mRNA中的突变的结果,该突变可以是产生新剪接元件的置换突变和/或添加突变和/或缺失突变。新剪接元件因此是限定第二内含子的第二组剪接元件的一个成员。第二组剪接元件的其余成员也可以是限定第一内含子的剪接元件组的成员。例如,如果突变产生了既在第一3'剪接位点上游(即在其5'端)又在第一分支点下游(即在其3'端)的新的第二3'剪接位点,那么第一5'剪接位点和第一分支点可作为第一组剪接元件和第二组剪接元件二者的成员。

在一些情况下,导入第二组剪接元件可导致正常休眠的或作为剪接元件不起作用的RNA的天然区域被激活并用作剪接元件。这些元件被称为“隐蔽(cryptic)”元件。例如,如果导入新的3'剪接位点,其位于第一3'剪接位点和第一分支点之间,则其可以激活新的3'剪接位点和第一分支点之间的隐蔽分支点。

在其他情况下,导入位于第一分支点和第一5'剪接位点之间的新的5'剪接位点可以进一步在该新的5'剪接位点的上游顺序地激活隐蔽3'剪接位点和隐蔽分支点。在这种情况下,第一内含子被分为两个异常内含子,其间有一个新的外显子。

此外,在第一剪接元件(特别是分支点)也是第二组剪接元件的成员的一些情况下,有可能会阻断第一元件并激活隐蔽元件(即,隐蔽分支点),该隐蔽元件将募集第一组剪接元件的其余成员相对于不正确的剪接强制正确的剪接。还要注意,当激活隐蔽剪接元件时,它可以位于内含子和/或相邻外显子中的一个外显子中。因此如上所述,根据构成“第二组剪接元件”的剪接元件组,本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物可以阻断各种不同的剪接元件以实施本发明。例如,它可以阻断突变元件、隐蔽元件、天然元件、5'剪接位点、3'剪接位点和/或分支点。通常,如上所述,它不会阻断也定义第一内含子的剪接元件,当然考虑了阻断第一内含子的剪接元件激活隐蔽元件的情况,该隐蔽元件随后充当第一组剪接元件的替代成员并参与正确剪接。

结合调节序列的寡核苷酸的长度(即其中的核苷酸数目)不是关键的,只要其选择性地结合期望的位置即可,并且可以根据常规程序确定。因此,在一些实施方案中,本发明的结合调控序列的寡核苷酸的长度可以为约5至约100个核苷酸。特别地,本发明的阻断核苷酸长度可以是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个核苷酸。在一些实施方案中,本发明的结合调控序列的寡核苷酸长度为8至50个核苷酸。又在本发明的其他实施方案中,结合调控序列的寡核苷酸的长度为15-25个核苷酸,并且长度也可以是18-20个核苷酸。结合调控序列的寡核苷酸可以作为相同寡核苷酸的群体和/或以任何组合和/或相对于彼此的任何比例存在的不同寡核苷酸的群体用在本文所述的方法中。

本发明的小分子是与其他小分子相比结构和/或功能不同并且具有低分子量(例如,小于5,000道尔顿)的活性化合物。小分子可以是天然或合成物质。它们可以通过有机化学方案合成和/或从天然来源如植物、真菌和微生物分离。小分子可以是“药物样的”(例如,阿斯匹林、青霉素、化疗药物)有毒的和/或天然的。小分子药物可以是一种或多种活性化合物,通常配制为可口服的丸剂,其与特定的生物靶标(例如受体、酶或离子通道)相互作用以提供治疗效果。本发明的小分子的具体但非限制性的实例包括抗生素、核苷类似物(例如,丰加霉素)和适体(例如,RNA适体;DNA适体)。

本发明的小分子可以是存在于任何数量的小分子文库中的小分子,其中一些可商购获得。可以含有本发明的小分子的文库的非限制性实例包括从各种商业实体例如SPECS和BioSPEC B.V.(Rijswijk荷兰)、Chembridge Corporation(San Diego,CA)、ComgenexUSA Inc.,(Princeton,NJ)、Maybridge Chemical Ltd.(Cornwall,UK)以及Asinex(Moscow,Russia)获得的小分子文库。一个典型实例称为DIVERSetTM,可从ChemBridgeCorporation,16981Via Tazon,Suite G,San Diego,Calif.92127获得。DIVERSetTM含有10,000至50,000个药物样、手工合成的小分子。预先选择化合物以形成“通用”库,该“通用”库涵盖具有最小数量的化合物的最大药效团多样性且适于高通量或低通量筛选。关于其他文库的描述,参见,例如Tan等人,“Stereoselective Synthesis of Over Two MillionCompounds Having Structural Features Both Reminiscent of Natural Products andCompatible with Miniaturized Cell-Based Assays 120,8565-8566,1998;Floyd等人,Prog Med Chem 36:91-168,1999。许多文库可从例如AnalytiCon USA Inc.,P.O.Box5926,Kingwood,Tex.77325;3D制药公司(3-Dimensional Pharmaceuticals,Inc.),665Stockton Drive,Suite 104,Exton,Pa.19341,-1151;Tripos Inc.,1699Hanley Rd.,St.Louis,Mo.,63144-2913等商购获得。

本发明的小分子和其他化合物可以通过多种机制起作用以改变本发明核酸中的剪接事件。例如,本发明的小分子和其他化合物可以干扰剪接复合物、剪接体及其组分例如hnRNP、snRNP、SR-蛋白和其他剪接因子或元件的形成和/或功能和/或其他性质,导致前体mRNA分子中的剪接事件被阻止和/或诱导。作为另一个实例,本发明的小分子和其他化合物可以防止和/或修饰基因产物的转录,该基因产物可以包括例如但不限于hnRNP、snRNP、SR蛋白和其他剪接因子,其随后参与特定剪接体的形成和/或功能。本发明的小分子和其他化合物还可以防止和/或改变基因产物的磷酸化、糖基化和/或其他修饰,该基因产物包括但不限于hnRNP、snRNP、SR蛋白和其他剪接因子,其随后参与特定剪接体的形成和/或功能。另外,本发明的小分子和其他化合物可以结合和/或以其他方式影响特异性前体mRNA,从而通过不涉及以序列特异性方式与RNA碱基配对的机制来阻止或诱导特定剪接事件。

本发明还提供了在受试者中进行基因编辑的方法,包括:a)将本发明的基因编辑系统导入受试者;和b)将本发明的结合调控序列的寡核苷酸和/或小分子和/或阻断第二组剪接元件的成员的其他化合物导入受试者,从而产生在受试者中赋予生物学功能的蛋白质和/或RNA。

可以根据领域已知的方法随时间监测受试者中发生的基因编辑的程度,并且当量降至期望的和/或治疗水平以下时,可以将结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者中以增加蛋白质和/或RNA的产量,从而调控产量。

在本文所述的方法中,其中在结合调控序列的寡核苷酸和/或小分子和/或其他化合物(它们的存在将导致第二组剪接元件中的成员被阻断)不存在或不存在其表达的情况下将本发明的基因编辑系统施用给受试者,该核酸、载体和/或细胞可能最初存在于受试者中。在这种状态下,第二组剪接元件是有活性的,并且受试者中不产生或极少(例如,微不足道)产生赋予生物学功能的如由核酸酶序列编码的外源蛋白、肽和/或RNA。当受试者中存在本发明的结合调控序的寡核苷酸、小分子和/或其他化合物时,核酸上的第二组剪接元件的成员被阻断,导致第一内含子通过剪接被去除并随后在受试者中产生由赋予生物学功能(例如,基因编辑)的核酸酶序列编码的蛋白质和/或RNA。

结合调控序列的寡核苷酸、小分子和/或其他化合物可以在相对于将本发明的基因编辑系统导入受试者的任何时间导入受试者。例如,可以在将核酸、载体和/或细胞导入受试者之前、同时和/或之后,将结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者。此外,结合调控序列的寡核苷酸、小分子和/或其他化合物可以在任何时间间隔内一次或多次施用,并且可以延长至贯穿受试者的寿命。

因此,在一些实施方案中,本发明提供了一种治疗受试者的疾病或病症的方法,包括:a)将有效量的本发明的基因编辑系统导入受试者;和b)将有效量的本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者,从而治疗受试者中的病症。当核酸、载体和/或细胞以及结合调控序列的寡核苷酸、小分子和/或其他化合物在受试者中存在时,它们是在结合调控序列的寡核苷酸、小分子和/或其他化合物能够接触核酸并阻断第二组剪接元件的成员的条件下存在的,从而导致受试者中产生赋予生物学功能的蛋白质、肽和/或RNA。参见例如图11;当第二组剪接元件被结合调控序列(ASO(LNA544))的寡核苷酸阻断时,产生了编码正确蛋白质而没有非天然外显子的mRNA(CS)。然而,当缺少寡核苷酸时,第一内含子和第二内含子逐个地被从前体mRNA剪接,产生包含(例如,包含框内终止密码子的)非天然存在的外显子的mRNA,并且产生无功能蛋白质(AS)。

在另外的实施方案中,根据本发明的方法调控基因表达可以与本文所述系统相反地进行。具体地,在一些实施方案中,在存在结合调控序列的寡核苷酸、调控剪接介导的表达的小分子和/或其他化合物时,系统处于本文所述的“关闭(OFF)”位置。

在一个实施方案中,例如,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在空间控制下被选择性地控制。例如,系统的组分可以被局部递送/施用至期望的位点、位置、器官、细胞类型、组织类型等,以诱导基因编辑系统局部“打开(ON)”。不需要所有组分都被局部递送/施用。在一个实施方案中,组分(a)和(b)可以全身施用,而组分(c)可以局部施用,导致基因编辑系统的局部控制(例如,“打开(ON)”)。在一个实施方案中,组分(a)和(b)可以局部施用,而组分(c)可以全身施用。可以通过将组分直接递送至特定位置来实现基因编辑系统的组分的局部递送。可选地,可使用将组分驱动至特定位置的定位序列或允许所述组分在特定位置表达的特定启动子来实现局部递送。在一个实施方案中,通过直接注射(例如注射至肌肉、心脏或其他器官)来实现局部递送。

在另一个实施方案中,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在时间控制下被选择性地控制。例如,可以在给定的持续时间内施用基因编辑系统的组分,以控制系统“打开(ON)”或“关闭(OFF)”的时间。例如,组分(c)的脉冲施用(例如,间歇施用)可能导致基因编辑系统反复地“打开(ON)”和“关闭(OFF)”。

在一个实施方案中,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在时间控制和空间控制下被选择性地控制。

治疗

本发明的基因编辑系统、结合调控序列的寡核苷酸、小分子和/或其他化合物的“有效量”是指无毒但足以提供期望效果(可能是有益效果和/或治疗效果)的量。如本领域所充分理解的,所需的确切量将随受试者而变化,这取决于受试者的年龄、性别、物种、一般情况、正在治疗的病况的严重程度、所施用的特定药剂等。在任何单独情况下,适当的“有效”量可以由本领域技术人员通过参考相关的教科书和文献(例如,Remington’sPharmaceutical Sciences(最新版本))和/或通过使用常规药理学程序来确定。

本文所用的“治疗(treat或treating)”是指任何类型的治疗,其对被诊断患有、有风险患有、怀疑患有和/或可能患有能够以有利方式对本发明的蛋白质和/或RNA作出响应的疾病或病症的受试者给予益处。益处可包括受试者的病况(例如,一种或多种症状)的改善、病况进展的延迟和/或逆转、疾病或病症发作的阻止或延迟等。

可以通过本发明的方法治疗的疾病和/或病症的非限制性实例和可以由本发明的核酸酶序列编码并且可以赋予治疗效果的基因产物的一些实例包括代谢疾病,例如糖尿病(胰岛素)、生长/发育障碍(生长激素;调控生长因子的锌指蛋白)、血液凝固障碍(例如,血友病A(因子VIII);血友病B(因子IX)、中枢神经系统疾病(例如,癫痫发作(seizure)、帕金森病(神经胶质衍生的神经营养因子(GDNF)和GDNF样生长因子)、阿尔茨海默病(神经生长因子、GDNF和GDNF样生长因子)、肌萎缩性侧索硬化、脱髓鞘疾病)、骨同种异体移植(骨形态发生蛋白2)(蛋白1-9,例如,MBP2)、炎性病症(例如,关节炎、自身免疫性疾病)、肥胖、癌症、心血管疾病(例如,充血性心力衰竭(磷蛋白和与Ca泵有关的基因)、黄斑变性(色素上皮衍生因子(PDEF)、13-地中海贫血、a-地中海贫血、泰-萨综合征(Tay-Sachssyndrome)、苯丙酮尿症、囊性纤维化和/或病毒感染)。

另外的实例包括编码可溶性CD4的核酸(用于治疗AIDS)和编码α-抗胰蛋白酶的核酸(用于治疗由α-抗胰蛋白酶缺乏引起的肺气肿)。可以通过本发明的方法和组合物治疗的其他疾病、综合征和病况包括,例如,腺苷脱氨酶缺乏症、镰状细胞缺乏症、脑病如亨廷顿氏病、溶酶体贮积病、戈谢病、赫尔勒氏综合征、克拉伯氏病、运动神经元疾病如显性脊髓小脑性共济失调(实例包括SCA1、SCA2和SCA3)、地中海贫血、血友病、苯丙酮尿症和心脏病,例如由胆固醇代谢改变和免疫系统缺陷引起的那些。可通过这些方法治疗的其他疾病包括代谢性疾病,例如肌肉骨骼疾病、心血管疾病和癌症。还可以将本发明的基因编辑系统递送至气道上皮细胞以治疗遗传疾病例如囊性纤维化、假性醛固酮减少症(pseudohypoaldosteronism)和纤毛不动综合征以及非遗传疾病(例如,支气管炎、哮喘)。还可以将本发明的基因编辑系统递送至肺泡上皮细胞以治疗遗传疾病如α-1-抗胰蛋白酶以及肺病(例如,治疗肺炎和肺气肿肺纤维化、肺水肿;将编码表面活性蛋白的核酸递送至早产婴儿或ARDS患者)。

通常,本发明的基因编辑系统可用于递送具有生物学功能的任何核酸,以治疗或改善与基因表达相关的任何疾病相关的症状。例证性的疾病状态包括但不限于:囊性纤维化(和其他肺部疾病)、血友病A、血友病B、地中海贫血、贫血和其他血液病、AIDS、癌症(例如,脑肿瘤)、糖尿病、肌肉萎缩症(例如,杜氏肌肉萎缩症、Becker型肌肉萎缩症)、戈谢病、赫尔勒氏综合征、腺苷脱氨酶缺乏症、糖原贮积病和其他代谢缺陷、粘多糖病以及实体器官(例如脑、肝、肾、心脏、肺、眼睛等)的疾病。

在某些实施方案中,可以施用本发明的递送载体以治疗CNS疾病,包括遗传疾病、神经变性疾病、精神障碍和/或肿瘤。示例性的CNS疾病包括但不限于阿尔茨海默病、帕金森病、亨廷顿病、雷特综合征、卡纳万病、雷氏病(Leigh's disease)、雷夫叙姆病、妥瑞综合征、原发性侧索硬化症、肌萎缩性侧索硬化症、进行性肌萎缩症、匹克氏病、肌肉萎缩症、多发性硬化症、重症肌无力、宾斯旺格病(Binswanger's disease)、脊髓或头部受伤引起的外伤、泰萨病(Tay Sachs disease)、Lesch-Nyhan综合征、癫痫、脑梗塞、精神疾病包括情绪障碍(例如抑郁症、双相情感障碍、持续性情感障碍、继发性情绪障碍)、精神分裂症、药物依赖(例如,酒精中毒和其他物质依赖)、神经症(例如,焦虑、强迫性障碍、躯体形式障碍、解离性障碍、忧郁、产后抑郁症)、精神病(例如,幻觉和妄想)、痴呆、妄想症、注意力缺陷障碍、性心理障碍、睡眠障碍、疼痛障碍、饮食或体重障碍(例如,肥胖、恶病质、神经性厌食症和贪食症)以及CNS的癌症和肿瘤(例如,垂体肿瘤)。

可根据本发明的方法治疗的CNS病症包括涉及视网膜、后束(posterior tract)和视神经的眼科病症(例如,色素性视网膜炎、糖尿病性视网膜病和其他视网膜变性疾病、葡萄膜炎、年龄相关性黄斑变性、青光眼)。

大多数(如果不是全部)眼科疾病和病症与以下三种类型的适应症状中的一种或多种相关:(1)血管生成、(2)炎症和(3)退化。本发明的递送载体可用于递送抗血管生成因子;抗炎因子;延缓细胞退化、促进细胞存留(cell sparing)或促进细胞生长的因子以及前述的组合。

例如,糖尿病性视网膜病的特征为血管生成。可通过眼内(例如,在玻璃体中)或眼周(例如,在眼球筋膜下区域中)递送一种或多种抗血管生成因子来治疗糖尿病性视网膜病。一种或多种神经营养因子也可通过眼内(例如,在玻璃体内)或眼周被共递送。葡萄膜炎涉及炎症。一种或多种抗炎因子可以通过眼内(例如,玻璃体或前房)施用本发明的核酸来施用。

相比之下,色素性视网膜炎的特征为视网膜变性。在代表性的实施方案中,色素性视网膜炎可以通过眼内(例如,玻璃体)施用编码一种或多种神经营养因子的递送载体来治疗。年龄相关性黄斑变性涉及血管生成和视网膜变性。这种疾病可通过眼内(例如,玻璃体)施用编码一种或多种神经营养因子的本发明的基因编辑系统和/或眼内或眼周(例如,在筋膜下区域(sub-Tenon’s region)中)施用编码一种或多种抗血管生成因子的本发明的基因编辑系统来治疗。

青光眼的特征为眼压升高和视网膜神经节细胞损失。青光眼的治疗包括使用本发明的递送载体施用一种或多种保护细胞免受兴奋毒性损伤的神经保护试剂。这类试剂包括经眼内递送,优选经玻璃体内递送的N-甲基-D-天冬氨酸(NMDA)拮抗剂、细胞因子和神经营养因子。

在其他实施方案中,本发明可用于治疗癫痫,以降低癫痫的发作、发病率和/或严重性。癫痫的治疗方法的疗效可以通过行为(例如,眼睛或嘴巴的抖动、声响(tick))和/或电记录方式(electrographic means)(大多数癫痫发作具有电记录异常的征象)来评估。因此,本发明还可以用于治疗癫痫,癫痫的标志是随着时间的推移多次发作。

作为另一实例,可以使用本发明的递送载体将生长抑素(或其活性片段)施用给脑,以治疗垂体肿瘤。根据该实施方案,编码生长抑素(或其活性片段)的递送载体可以通过微量注射施用给垂体。同样,这种治疗可用于治疗肢端肥大症(即,垂体生长激素分泌异常)。生长抑素的核酸(例如,GenBank登录号J00306)和氨基酸(例如,GenBank登录号P01166含有加工的活性肽,生长抑素-28和生长抑素-14)序列是本领域已知的。

在其他实施方案中,通过使用本发明的基因编辑系统可以调控可变剪接事件。例如,可以将本发明的基因编辑系统与本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物一起导入受试者以产生第一蛋白和/或RNA,该第一蛋白和/或RNA由于激活剪接组的特定组而在受试者中提供了生物学功能。相同的核酸可被工程化为编码不同的蛋白、肽和/或RNA,该蛋白、肽和/或RNA通过激活剪接组中的不同组而在受试者中提供生物学功能。当将本发明的结合调控序列的不同寡核苷酸、小分子和/或化合物导入受试者时,产生了不同的蛋白和/或RNA。例如,当存在结合调控序列的第一寡核苷酸、小分子和/或其他化合物时,第一RNA可以产生第一目的蛋白;并且在添加本发明的结合调控序列的不同的第二寡核苷酸、小分子和/或化合物之后,第二RNA会导致产生第二目的蛋白或目的功能性RNA(例如,可以产生第一蛋白的同种型(例如,白介素(IL)-4)及其剪接变体IL-4A2)。(参见,例如,Fletcher等人“Increased expression of mRNA encoding interleukin(IL)-4and itssplice variant IL-4A2 in cells from contacts of Mycobacterium tuberculosis,inthe absence of in vitro stimulation”Immunology2004年8月;112(4):669-73;Minn等人,“Insulinomas and expression of an insulin splice variant”Lancet 2004年1月31日;363(9406):363-7;Schlueter等人“Tissue-specific expression patterns of theRAGE receptor and its soluble forms--a result of regulated alternativesplicing?”Biochim Biophys Acta 2003年10月20日;1630(1):1-6;Vegran等人“Implication of alternative splice transcripts of caspase-3and survivin inchemoresistance”Bull Cancer2005年3月;92(3):219-26;Ren等人,“Alternativesplicing of vitamin D-24-hydroxylase:A novel mechanism for the regulation ofextra-renal 1,25-dihydroxyvitamin D synthesis”JBiol Chem.2005年3月23日;“Mutant huntington protein:a substrate for transglutaminase 1,2,and 3”JNeuropathol Exp Neurol 2005年1月;64(1):58-65;Ding和Keller,“Splice variants ofthe receptor for advanced glycosylation end products(RAGE)in human brain”Neurosci Lett.2005年1月3日;373(1):67-72;“Transcript scanning reveals noveland extensive splice variations in human 1-type voltage-gated calciumchannel,Cav1.2 al subunit”J Biol Chem 2004年10月22日;279(43):44335-43,Epub200年8月6日。所有这些参考文献通过引用以其整体并入本文。

本发明还以组合物提供了本发明的基因编辑系统。因此,在另外的实施方案中,本发明提供了在药学上可接受的载体中包含本发明的基因编辑系统、本发明的载体和/或本发明的细胞的组合物。“药学上可接受的载体”是指与药物组合物中的其他成分相容并且对受试者无害或无毒的载体。特别地,期望药学上可接受的载体是一种无菌载体,其被配制用于施用至或递送至本发明的受试者。

还提供了包含本发明的组合物和药学上可接受的载体的药物组合物。本文所述的组合物可被配制以便根据已知技术在药物载体中施用。参见,例如Remington,The ScienceAnd Practice of Pharmacy(最新版本)。载体可以是固体或液体、或两者,并且优选与本发明的组合物一起配制为单位剂量制剂,例如片剂,其可以占组合物重量的约0.01%或0.5%至约95%或99%。药物组合物通过任何熟知的制药技术制备,包括但不限于混合任选地包含一种或多种辅助成分的组分。

本发明的药物组合物包括适合于口服、直肠、局部、吸入(例如,通过气雾剂)、含服(例如,舌下)、阴道、肠胃外(例如,皮下、肌内、皮内、关节内、胸膜内、腹膜内、脑内、动脉内或静脉内)、局部(即,皮肤和粘膜表面,包括气道表面)以及经皮施用的那些;但是如本领域众所周知的,在任何给定情况下最合适的途径都取决于此类因素如受试者的物种、年龄、性别和总体状况,所治疗病况的性质和严重程度和/或正在施用的特定组合物的性质(即,剂量、配方)。适于口服施用的药物组合物可以以离散单位存在,例如胶囊剂、扁囊剂、锭剂或片剂,其各自含有预定量的本发明的组合物;粉末或颗粒;水性或非水性液体中的溶液或悬浮液;或水包油或油包水乳液。可以通过将本发明的组合物复合到能够耐受动物肠道中的消化酶降解的载体上来进行口服递送。这类载体的实例包括本领域已知的塑料胶囊或片剂。这类制剂通过任何合适的制药方法制备,该方法包括使组合物与合适的载体(其可含有一种或多种如上所述的辅助成分)联合的步骤。通常,通过将组合物与液体或细碎的固体载体或两者均匀且紧密地混合,并且随后如果需要,使所得混合物成形来制备根据本发明的实施方案的药物组合物。例如,可通过压缩或模制含有组合物的粉末或颗粒,任选地与一种或多种辅助成分一起来制备片剂。通过在合适的机器中压缩自由流动形式的组合物,例如任选地与粘合剂、润滑剂、惰性稀释剂和/或表面活性剂/分散剂混合的粉末或颗粒来制备压缩片剂。通过在合适的机器中对用惰性液体粘合剂润湿的粉末状化合物进行摸制来制备模制片剂。

适于含服(舌下)施用的药物组合物包括:锭剂,其在调味基质(通常为蔗糖和阿拉伯胶或黄蓍胶)中包含本发明的组合物;以及软锭剂,其在惰性基质如明胶和甘油或蔗糖和阿拉伯胶中包含所述组合物。

适于肠胃外施用的本发明的药物组合物可以包含本发明组合物的无菌水性和非水性注射溶液,该制剂优选地与预期接受者的血液等渗。这些制剂可以含有抗氧化剂、缓冲剂、抑菌剂和溶质,其使得组合物与预期接受者的血液等渗。水性和非水性无菌悬浮液、溶液和乳液可包括悬浮剂和增稠剂。非水性溶剂的实例是丙二醇、聚乙二醇、植物油如橄榄油以及可注射的有机酯如油酸乙酯。水性载体包括水、醇/水溶液,乳液或悬浮液,包括盐水和缓冲介质。肠胃外载体包括氯化钠溶液、林格氏葡萄糖、葡萄糖和氯化钠、乳酸化林格氏溶液或不挥发性油。静脉内载体包括流体和营养补充剂、电解质补充剂(例如基于林格氏葡萄糖的那些)等。还可以存在防腐剂和其他添加剂,诸如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。

组合物可以存在于单位剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在使用前立即添加无菌液体载体,例如盐水或注射用水。临时注射溶液和悬浮液可以由前述种类的无菌粉末、颗粒和片剂制备。例如,可以提供在密封容器中的单位剂型的本发明的可注射的、稳定的、无菌的组合物。该组合物可以以冻干剂的形式提供,该冻干剂可以用合适的药学上可接受的载体重构以形成适于注射到受试者体内的液体组合物。该单位剂型可以是约1μg至约10g的本发明的组合物。当组合物基本上不溶于水时,可以包括足够量的生理学上可接受的乳化剂,以在水性载体中乳化该组合物。一种这样的有用的乳化剂是磷脂酰胆碱。

适于直肠施用的药物组合物优选作为单位剂量的栓剂存在。这些可以通过将组合物与一种或多种常规固体载体诸如例如可可脂混合,然后使所得混合物成形来制备。

适于局部施用给皮肤的本发明的药物组合物优选采取软膏剂、乳膏剂、洗剂、糊剂、凝胶剂、喷雾剂、气雾剂或油的形式。可使用的载体包括但不限于凡士林、羊毛脂、聚乙二醇、醇、透皮增强剂及其两种或更多种的组合。在一些实施方案中,例如,可以通过将本发明的药物组合物与能够进入皮肤的亲脂性试剂(例如,DMSO)混合来进行局部递送。

适于经皮施用的药物组合物可以是适于与受试者的表皮保持长时间紧密接触的离散贴剂的形式。适用于经皮施用的组合物也可通过离子电渗法递送(参见,例如,Pharmaceutical Research 3:318(1986)),并且通常采取本发明组合物的任选缓冲水溶液的形式。合适的制剂可以包含柠檬酸盐或bis\tris缓冲液(pH 6)或乙醇/水,并且可以含有0.1至0.1M的活性成分。

本发明的组合物的有效量将随组合物和受试者的不同而变化,并且将取决于多种因素,例如年龄、物种、性别、体重、受试者的总体状况和待治疗的具体疾病或病症。有效量可以根据本领域技术人员已知的常规药理学程序来确定。在一些实施方案中,从约0.1μg/kg至约1gm/kg的剂量将具有治疗功效。在使用病毒载体递送本发明的基因编辑系统的实施方案中,可以测量病毒剂量以包括特定数量的病毒颗粒或噬斑形成单位(pfu)或感染性颗粒,这取决于所使用的病毒。例如,在一些实施方案中,特定的单位剂量可以包括约10

本发明组合物的施用频率可以是赋予所需治疗效果必需的频率。例如,组合物可以每天施用一次、两次、三次、四次或更多次;每周施用一次、两次、三次、四次或更多次;每月施用一次、两次、三次、四次或更多次;每年施用一次、两次、三次或四次和/或根据控制特定病症和/或实现特定效果和/或益处的需要来施用。在一些实施方案中,在受试者的一生中,一剂、二剂、三剂或四剂可能足以实现所需的治疗效果。本发明组合物的施用量和施用频率将根据所治疗或待预防的具体病况和所需的治疗效果而变化。

在一个实施方案中,在给定的时间段(例如,受试者的终生或疾病的持续时间)内将结合调控序列的寡核苷酸重复施用给受试者。例如,结合调控序列的寡核苷酸可以每天施用一次、两次、三次、四次或更多次;每周施用一次、两次、三次、四次或更多次;每月施用一次、两次、三次、四次或更多次;每年施用一次、两次、三次或四次,和/或根据控制特定病况和/或实现特定效果和/或益处的需要来施用。

组合物的组分(例如,(a)包含编码核酸酶的核酸序列的载体;(b)结合调控序列的寡核苷酸)可以基本上同时施用给受试者。可选地,这些组分可以在不同的时间施用,例如,(a)可以在施用(b)之后或之前至少一小时、至少一天、至少一周、至少一个月、至少一年施用。

组合物的组分(例如,(a)包含编码CRISPR相关的核酸酶的核酸序列的载体;(b)结合靶基因序列的gRNA;和(c)结合调控序列的寡核苷酸)可以基本上同时施用给受试者。可选地,这些组分可以在不同的时间施用,例如,(a)和(b)可以基本上同时施用,并且(c)可以在(a)和(b)的施用之后至少一小时、至少一天、至少一周、至少一个月、至少一年施用。

本文所述的基因编辑系统的组分不需要以相同的频率、间隔和/或水平施用。本文特别考虑的是,各组分以产生所需治疗效果的频率、间隔和/或水平施用。

本发明的组合物可以在体内或体外施用给受试者的细胞。为了体内施用给受试者的细胞,以及为了施用给受试者,本发明的组合物可以例如如上所述通过口服、肠胃外(例如静脉内)、通过肌内注射、皮内(例如,通过基因枪)、腹膜内注射、皮下注射、透皮、体外、局部等进行施用。此外,可以根据本领域熟知的方法将本发明的组合物脉冲到从受试者的细胞分离或培养的树突细胞上,或者可以脉冲到大量PBMC或从受试者中消除的多种细胞上。

如果采用离体方法,则可根据本领域熟知的标准方案将细胞或组织移出并维持在体外,同时将本发明的组合物导入到细胞或组织中。例如,本发明的基因编辑系统可以通过任何基因转移机制(例如病毒介导的基因递送、磷酸钙介导的基因递送、电穿孔、显微注射或蛋白脂质体)导入细胞。然后根据针对细胞或组织类型的标准方法,将转导的和/或转染的细胞输注(例如,在药学上可接受的载体中)或移植回受试者。用于将各种细胞移植或输注到受试者中的标准方法是已知的。

本发明的制剂可以包含活性化合物的无菌水性和非水性注射溶液,该制剂优选与预期接受者的血液等渗并且基本上无热原。这些制剂可以含有抗氧化剂、缓冲剂、抑菌剂和溶质,其使得制剂与预期接受者的血液等渗。水性和非水性无菌悬浮液可包括悬浮剂和增稠剂。制剂可以存在于单位剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在使用前立即添加无菌液体载体,例如盐水或注射用水。

本文所述的组分(例如,(a)包含编码核酸酶的核酸序列的载体;(b)结合调控序列的寡核苷酸)可以配制到同一组合物(例如,一种组合物具有所有组分)中。可选地,这些组分可以配制到两种不同的组合物中。

本文所述的组分(例如,(a)包含编码CRISPR相关的核酸酶的核酸序列的载体;(b)结合靶基因序列的gRNA;和(c)结合调控序列的寡核苷酸)可以配制到同一组合物(例如,一种组合物具有所有组分)。可选地,这些组分可配制到不同的组合物中,例如,(a)和(b)配制到一种组合物中,并且(c)配制到不同的组合物中;或者(a)、(b)、(c)全部配制到不同的组合物中。

在一种制剂中,本发明的基因编辑系统的组分可以作为裸DNA递送或导入受试者。

在一种制剂中,本发明的基因编辑系统的组分可以包含在可能适合于肠胃外施用的脂质颗粒或囊泡中(例如脂质体或微晶)。只要化合物包含在其中,颗粒可以是任何合适的结构例如单层或多层。带正电荷的脂质如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”对于这类颗粒和囊泡是特别优选的。这类脂质颗粒的制备是熟知的。参见,例如,Janoff等人的美国专利第4,880,635号;Kurono等人的美国专利第4,906,477号;Wallach的美国专利第4,911,928号;Wallach的美国专利No.4,917,951;Allen等人的美国专利第4,920,016号;Wheatley等人的美国专利第4,921,757号等等。在一种制剂中,本发明的基因编辑系统可以包含在纳米颗粒内。在另一种制剂中,本发明的基因编辑系统可以包含在重组AAV衣壳内。

在一个实施方案中,经由裸DNA或在脂质颗粒、纳米颗粒或重组AAV衣壳内将组分(c)递送到受试者或导入受试者。

本发明的药物组合物可用于例如生产用于治疗本文所述的疾病和/或病症的药物。

本发明包括以下序列:

SEQ ID NO:1.质粒TRCBA-int-luc mut。核苷酸163-2036:CBA启动子;核苷酸2739-4573:突变型内含子(654C-T);核苷酸4592-4813:polyA信号。

SEQ ID NO:2.质粒TRCBA-int-luc(wt)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:野生型内含子(654C);核苷酸2071-4573:荧光素酶中的内含子;核苷酸4592-4813:多聚A信号。

SEQ ID NO:3.质粒TRCBA-int-luc(657GT)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:突变型内含子(654C-T);657TA-GT);核苷酸2071-4573:荧光素酶中的内含子;核苷酸4592-4813:多聚A信号。

SEQ ID NO:4.质粒GL3-int-Luc(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797:突变型内含子(654C-T);核苷酸2814-3035:多聚A信号;核苷酸280-2782:具有突变型内含子的荧光素酶。WO 2006/119137PCT/US2006/016514

SEQ ID NO:5.质粒GL3-int-Luc(wt)。核苷酸48-250:SV40启动子;核苷酸948-1797:wt内含子(654C);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。

SEQ ID NO:6.质粒GL3-int-Luc(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1797:内含子(654C-T;657TA-GT);核苷酸280-2782:具有突变型内含子的荧光素酶;核苷酸2814-3035:多聚A信号。

SEQ ID NO:7.质粒GL3-2int-fron-sph(mut)。核苷酸48-250:SV40启动子;核苷酸251-1100;1771-2620:突变型内含子(654C-T);核苷酸1103-3635:具有突变型内含子的荧光素酶;核苷酸3637-3858:多聚A信号。

SEQ ID NO:8.质粒GL3-3int-2fron-sph(mut).核苷酸48-250:SV40启动子;核苷酸251-1100;1106-1965;2635-3484:突变型内含子(654C-T);核苷酸1967-4469:具有突变型内含子的荧光素酶;核苷酸4514-4735:多聚A信号。

SEQ ID NO:9.质粒GL3-int-luc A(mut)。核苷酸48-250:SV40启动子;核苷酸673-1522:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。

SEQ ID NO:10.质粒GL3-int-Luc B(mut)。核苷酸48-250:SV40启动子;核苷酸1440-2289:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。

SEQ ID NO:11.质粒GL3-int-Luc C(mut)。核苷酸48-250:SV40启动子;核苷酸1691-2540:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。

SEQ ID NO:12.质粒GL3-int-fron(mut)。核苷酸48-250:SV40启动子;核苷酸251-1100:内含子(654C-T);核苷酸1103-2755:具有内含子的荧光素酶;核苷酸2787-3008:多聚A信号。

SEQ ID NO:13.质粒GL3-2int-sph(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797;1798-2647:内含子(654C-T);核苷酸280-3632:具有内含子的荧光素酶;核苷酸3664-3885:多聚A信号。

SEQ ID NO:14.质粒GL3-2int-sph C(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797;2541-3390:内含子(654C-T);核苷酸280-3632:具有内含子的荧光素酶;核苷酸3664-3885:多聚A信号。

SEQ ID NO:15.质粒GL3-sint200-sph(mut)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T);核苷酸280-2582:具有内含子的荧光素酶;核苷酸2794-2835:多聚A信号。

SEQ ID NO:16.质粒GL3-sint200-sph(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T;657TA-GT);核苷酸280-2582:具有内含子的荧光素酶;核苷酸2794-2835:多聚A信号。

SEQ ID NO:17.质粒GL3-sint425-sph。核苷酸48-250:SV40启动子;核苷酸948-1373:内含子(654C-T);核苷酸280-2358:具有内含子的荧光素酶;核苷酸2569-2615:多聚A信号。

SEQ ID NO:18.突变型内含子(654C-T).

SEQ ID NO:19.野生型内含子(654C).

SEQ ID NO:20.具有两个突变(654C-T;657TA-GT)的内含子。

SEQ ID NO:21.核苷酸669-1518处具有突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:22.核苷酸669-1518处具有野生型内含子的荧光素酶cDNA。

SEQ ID NO:23.核苷酸669-1518处具有双突变型内含子(C654 C-T;657TA-GT)的荧光素酶cDNA。

SEQ ID NO:24.核苷酸1-850处具有突变型内含子(654C-T)和核苷酸1521-2370处具有突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:25.核苷酸1-850处具有突变型内含子(654C-T)以及核苷酸861-1710和核苷酸2385-3234处具有两个突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:26.可选位置A(核苷酸394-1243)处具有突变型内含子(654

C-T)的荧光素酶cDNA。

SEQ ID NO:27.可选位置B(核苷酸1161-2010)处具有突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:28.可选位置C(核苷酸1412-2261)处具有突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:29.在翻译起始位点上游(核苷酸1-850)具有突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:30.核苷酸669-1518和核苷酸1519-2368处具有两个突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:31.核苷酸669-1518和核苷酸2262-3111处具有两个突变型内含子(654C-T)的荧光素酶cDNA。

SEQ ID NO:32.核苷酸669-1318处有突变型内含子(654C-T)和200个碱基对缺失的荧光素酶cDNA。

SEQ ID NO:33.核苷酸669-1318处有双突变型内含子(654C-T;657

TA-GT)和200个碱基对缺失的荧光素酶cDNA。

SEQ ID NO:34.核苷酸669-1094处有突变型内含子(654C-T)和425个碱基对缺失的荧光素酶cDNA。

SEQ ID NO:35.核苷酸2866-3715处具有α抗胰蛋白酶cDNA和突变型内含子(654C-T)的质粒TRCBA。

SEQ ID NO:36.核苷酸772-1621处具有突变型内含子(654C-T)的α抗胰蛋白酶cDNA。

SEQ ID NO:37.结合IVS2-654的调控序列的寡核苷酸GCT ATT ACC TTA ACC CAG。

SEQ ID NO:38.结合IVS2-654(具有657GT突变)的调控序列的寡核苷酸GCA CTTACC TTA ACC CAG。

SEQ ID NO:50(具有564CT突变的IVS2-654内含子)。

SEQ ID NO:51(具有657G突变的IVS2-654内含子)。

SEQ ID NO:52(具有658T突变的IVS2-654内含子)。

SEQ ID NO:20(具有657GT突变的IVS2-654内含子)。

SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)。

SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)。

SEQ ID NO:68(仅具有197bp的IVS2-654内含子)。

SEQ ID NO:69(仅具有247bp的IVS2-654内含子)。

SEQ IDNO:55(具有6A突变的IVS2-654内含子)。

SEQ ID NO:56(具有564C突变的IVS2-654内含子)。

SEQ IDNO:57(具有841A突变的IVS2-654内含子)。

SEQ ID NO:58(IVS2-705内含子)。

SEQ ID NO:59(具有564CT突变的IVS2-705内含子)。

SEQ ID NO:60(具有657G突变的I VS2-705内含子)。

SEQ ID NO:61(具有658T突变的IVS2-705内含子)。

SEQ ID NO:62(具有657GT突变的IVS2-705内含子)。

SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)。

SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)。

SEQ IDNO:65(具有6A突变的IVS2-705内含子)。

SEQ ID NO:66(具有564C突变的IVS2-705内含子)。

SEQ IDNO:67(具有841A突变的IVS2-705内含子)。

SEQ ID NO:70(CFTR外显子19野生型序列)。

SEQ ID NO:71(CFTR外显子19 3849+10kb C-T突变)。

SEQ ID NO:72(CFTR外显子19野生型寡核苷酸)。

SEQ ID NO:70(CFTR外显子19 3849+10kb C-T突变寡核苷酸)。

SEQ ID NO:74(小鼠肌营养不良蛋白内含子22、外显子23和内含子23野生型序列)。

SEQ ID NO:75(mdx小鼠肌营养不良蛋白内含子22、外显子23和内含子23无义突变)。

SEQ ID NO:76(诱导反义外显子23跳跃的寡核苷酸)。

SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)。

SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)。

SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)。

SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)。

SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)。

SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)。

SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)。

SEQ ID NO:49(针对IVS2-705的寡核苷酸)。

SEQ ID NO:46(针对IVS2-654的寡核苷酸)。

SEQ ID NO:47(针对IVS2-654的寡核苷酸)。

SEQ ID NO:48(针对IVS2-654的寡核苷酸)。

本文引用的所有出版物、专利申请、专利、专利出版物和其他参考文献通过引用以其整体并入本文,以获得与出现所述参考文献的句子和/或段落有关的教导。给出以下实例以例示本发明,而不应解释为对本发明的限制。

本发明可进一步描述于以下编号的段落中:

1.一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入:

a)包含编码核酸酶的核酸序列的载体,其中编码所述核酸酶的所述核酸在其序列内包含调控核酸序列,所述调控核酸序列具有限定第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中所述第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中所述第一内含子和第二内含子从前体mRNA信息中被剪接以产生编码无功能核酸酶的mRNA,所述无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和

b)结合所述调控核酸序列的寡核苷酸,

其中在所述细胞内,所述寡核苷酸阻止所述第二组剪接元件从所述mRNA被剪接,从而产生缺少所述外显子并编码对靶基因的基因编辑起作用的核酸酶的mRNA。

2.根据段落1所述的系统,其中所述核酸酶选自由以下组成的组:CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶和转录激活因子样效应物核酸酶。

3.根据段落1所述的系统,其中所述核酸酶是核酸内切酶或核酸外切酶。

4.根据前述任一段落所述的系统,其中组分(a)还包含结合所述靶基因序列的gRNA。

5.根据前述任一段落所述的系统,其中所述调控核酸序列是β珠蛋白突变型内含子。

6.根据前述任一段落所述的系统,其包含至少两个调控核酸序列。

7.根据前述任一段落所述的系统,其中所述调控核酸序列包含选自由以下组成的组的序列:SEQ ID NO:18(IVS2-654内含子C-T)、SEQ ID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:51(具有657G突变的IVS2-654内含子)、SEQ ID NO:52(具有658T突变的IVS2-654内含子)、SEQ ID NO:20(具有657GT突变的IVS2-654内含子)、SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)、SEQ ID NO:68(仅具有197bp的IVS2-654内含子)、SEQ IDNO:55(具有6A突变的IVS2-654内含子)、SEQ ID NO:56(具有564C突变的IVS2-654内含子)、SEQ ID NO:57(具有841A突变的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ ID NO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ ID NO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148;及其任何组合,包括单一序列。

8.根据前述任一段落所述的系统,其中结合所述调控序列的所述寡核苷酸包含选自由以下组成的组的序列:SEQ ID NO:37(针对IVS2-654 CT的寡核苷酸)、SEQ ID NO:38(针对具有657GT突变的IVS2-654的寡核苷酸)、SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)、SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)、SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)、SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)、SEQID NO:44(针对IVS2-654中657G突变的寡核苷酸)、SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)、SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)、SEQ ID NO:49(针对IVS2-705的寡核苷酸)、SEQ ID NO:76(诱导反义外显子23跳跃是的寡核苷酸)以及SEQID NO138(针对LUC-AON1的寡核苷酸)、SEQ ID NO:139(针对LUC-AON2的寡核苷酸)、SEQ IDNO:140(针对LUC-AON3的寡核苷酸)、SEQ ID NO:141(针对LUC-AON4的寡核苷酸)、SEQ IDNO:142(针对IVS2(S0)-654,LUC-654的寡核苷酸)和SEQ ID NO:149(针对野生型调控序列的寡核苷酸)。

9.根据前述任一段落所述的系统,其中所述脱靶效应降低至少30%。

10.根据前述任一段落所述的系统,其中所述脱靶效应降低至少40%、至少50%、至少60%、至少70%、至少80%或至少90%或更多。

11.根据前述任一段落所述的系统,其中组分(a)和(b)位于相同或不同的载体上。

12.根据前述任一段落所述的系统,其中将组分(b)作为裸DNA导入细胞。

13.根据前述任一段落所述的系统,其中使用脂质制剂将组分(b)导入细胞。

14.根据前述任一段落所述的系统,其中使用纳米颗粒将组分(b)导入细胞。

15.根据前述任一段落所述的系统,其中在施用(a)之后的时间点施用组分(b)。

16.根据前述任一段落所述的系统,其中组分(a)和(b)基本上同时施用。

17.根据前述任一段落所述的系统,其中在缺少(b)或没有(b)表达的情况下,在细胞中检测不到(a)的表达。

18.根据前述任一段落所述的系统,其中(a)的表达依赖于(b)的表达。

19.根据前述任一段落所述的系统,其中组分(b)控制系统的“打开(ON)”和/或“关闭(OFF)”状态。

20.根据段落19述的系统,其中所述“打开(ON)”和/或“关闭(OFF)”状态处于选择性控制下。

21.根据段落20述的系统,其中所述选择性控制是空间控制和/或时间控制。

22.根据前述任一段落所述的系统,其中所述载体是病毒载体。

23.根据段落22述的系统,其中所述病毒载体选自由以下组成的组:AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。

24.根据前述任一段落所述的系统,其中所述载体是非病毒载体。

25.根据前述任一段落所述的系统,其中所述核酸酶是CRISPR相关的核酸酶。

26.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶为基因编辑创建双链断裂,并且其中所述CRISPR相关的核酸酶选自由以下组成的组:Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。

27.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶是选自金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、嗜热链球菌(Streptococcusthermophilus)(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)(NmCas9)、新杀手弗朗西丝菌(Francisella novicida)(FnCas9)和空肠弯曲菌(Campylobacter jejuni)(CjCas9)的Cas9变体。

28.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶已经被修饰用于基因编辑但不产生双链DNA断裂(例如,CRISPRi或CRISPRa),并且选自由dCas、nCas和Cas13组成的组。

29.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶被密码子优化以在真核细胞中表达。

30.根据前述任一段落所述的系统,其中所述基因编辑是降低一种或多种基因产物的表达。

31.根据前述任一段落所述的系统,其中所述基因编辑是增加一种或多种基因产物的表达。

32.根据前述任一段落所述的系统,其中所述细胞是哺乳动物细胞或人类细胞。

33.根据前述任一段落所述的系统,其中所述细胞位于体内。

34.根据前述任一段落所述的系统,其中所述细胞位于体外。

35.根据前述任一段落所述的系统,其中所述靶基因是疾病基因。

36.一种用于编辑受试者中的基因的方法,所述方法包括向需要基因编辑的受试者施用段落1-35所述的系统。

实施例

实施例1.通过选择性剪接差异调控AAV载体中的多个转基因

介绍

野生型AAV是非致病性的、无包膜的、小的单链DNA病毒,其具有长4.7kb的基因组。重组AAV已被开发并用作基因治疗载体几十年。调控转基因表达的能力对于确保许多基因治疗策略的安全性是至关重要的。已针对AAV载体介导的基因转移测试了几种控制转基因表达的策略(如tet-on或雷帕霉素诱导型系统)。取决于待治疗的靶标,每种调控系统具有优点和缺点。作为开发转基因调控系统的策略,将IVS2-654内含子的剪接转换机制调整为AAV介导的基因递送,所述转基因调控系统简化基因递送系统、消除针对反式激活蛋白的免疫反应并单独诱导多个转基因、且更重要的是使AAV载体的包装能力最大化。

已知超过90%的包含多个外显子的转录物会经历选择性剪接。在这些条件下,剪接位点的选择是决定基因表达的关键因素之一。据报道,许多遗传性疾病的病例是由改变剪接模式的突变引起的。在过去的几十年中,反义寡核苷酸(AON)的用途已得到深入研究,并在体外和体内作为可通过恢复或改变剪接来控制基因表达的治疗剂被应用。通过使用AON进行剪接转换来恢复功能性基因表达的第一靶标之一是β珠蛋白基因的地中海贫血突变。β珠蛋白转录物的第二内含子IVS2含有共有的5'和3'剪接位点,且该内含子在正常条件下在剪接过程中被组成性去除以产生功能性蛋白。地中海贫血患者中经常发现的突变之一是IVS2的654位核苷酸C变为T,这种改变在653位产生异常的5'剪接位点,并带有一个隐蔽3'剪接位点,以及在上游选择性使用的外显子(AUE)(图1A)。这些隐蔽剪接位点是剪接机制优选使用的,随后将AUE保留在β珠蛋白mRNA中,这使开放阅读框向下游偏移并产生截短的蛋白质。通过施用AON可以恢复这种异常剪接,AON结合隐蔽5'剪接位点并阻断其使用(图1A)。在最近的出版物中,发明人使用IVS2-654突变型内含子和对应的AON表明该诱导型系统可用于在体外和体内控制AAV介导的转基因。

调控转基因表达的能力对于确保许多基因治疗策略的安全性是必要的。对于由于新生血管紊乱导致的眼部疾病的基因治疗尤其如此,其可能需要长期存在多种血管生成抑制蛋白(angiostatic protein),这些蛋白可能会抑制正常血管以及异常血管。理论上,可以联合多种电流调控系统来调控多种转基因。然而,由于这些系统的要求,这种方法会非常麻烦。因此,开发了选择性剪接作为独立控制多个转基因在相同生物体中表达的策略。在本文描述的基于选择性剪接的调控系统中,通过使用靶向5'选择性剪接位点的AON调控转基因信息的选择性剪接来控制转基因表达。在先前的研究中,本发明人成功地使用了LNA654(一种与5'选择性剪接位点及其侧翼序列互补的16聚体寡核苷酸)来诱导转基因表达。在该系统中,可以通过AON的特异性来决定剪接转换。修饰的AON、LNA对其靶标具有高度特异性。它们的特异性可以通过几个核苷酸差异来区分。这种能力对于多种基因调控是非常有利的。内含子中选择性使用的5'供体位点的侧翼区域中的仅仅几个改变的核苷酸就可以成为另一个可区分的靶标。因此,可应用它们因其靶区域的几个改变的核苷酸而单独控制多个基因的能力,而无需改变骨架。使用不同的靶向AON来独立控制同一生物体中多个转基因的表达将是可能的。这种想法将允许单个患者接受需要转基因表达差异调控的多基因疗法。

在本文中,报道了,通过优化内含子大小和剪接位点,这种诱导型系统被显著改善以获得紧密和有效的调控。这种优化的系统证明了在体外和体内显著改善的转基因诱导。此外,通过在小鼠眼中重新施用AON可以再诱导转基因表达。本文还显示了这种系统使用一组修饰的内含子及其对应的AON可用于差异化调控多种转基因。

结果

优化IVS2-654内含子的选择性5'剪接位点以有效调控。

为促进选择性剪接的优化以控制转基因表达,利用萤火虫的荧光素酶标记基因来插入850bp选择性剪接内含子IVS2-654。因此,在存在或不存在AON的情况下,通过测定包含AUE和跳过AUE两种条件下的荧光素酶表达水平,可以方便地确定转基因表达的控制。首先,通过修饰IVS2-654内含子的选择性剪接位点来优化选择性剪接以控制转基因表达。IVS2-654内含子在657和658处的核苷酸序列(即选择性5'剪接位点的第5个和第6个下游核苷酸)是T和A。与共有5'剪接位点的G和T相比,这些序列的共有性较低。核苷酸657处的T被转换为G,658处的A被转化为T,或TA被转化为GT。这些突变通过使剪接位点与共有序列更相似或相同来增加选择性5'剪接位点的强度(图1B)。使用PEI转染方法将得到的质粒和对应的AON转染到293细胞中。转染后24小时,收获细胞以对荧光素酶的表达定量。构建体658T在诱导水平上产生了与构建体IVS2-654相比大约两倍的提高。因此,构建体657G和657GT导致诱导水平提高190和250倍(图1C)。诱导水平的增加显然是由于转基因表达的背景水平比转基因表达的诱导水平更急剧的降低。这些结果表明,通过调节剪接位点的强度,可以优化选择性剪接以控制转基因表达。

优化IVS2-654内含子尺寸以将AAV的转基因能力最大化。

AAV具有4.7kb的包装限制,因为其根据启动子的尺寸、多聚A和ITR仅允许转基因编码区的最大尺寸为约3kb。原始IVS2-654内含子长度为850个核苷酸(nt)(图2A),将该内含子插入待调控的转基因的开放阅读框(ORF)进一步降低了转基因的克隆能力。因此,850nt IVS2-654被转化为称为S0的247nt的小内含子,其含有β珠蛋白mRNA的有效剪接所需的必需剪接位点和AUE以及5'端上的第32个核苷酸和3'端上的最后57个核苷酸(图2B)。将S0内含子插入到荧光素酶基因中,产生构建体IVS2(S0)-654,导致信息的选择性剪接。重要的是,AON对小内含子的诱导水平与对原始IVS2-654内含子的诱导水平相似(图2C)。

其对应的AON对含有修饰的内含子的构建体的荧光素酶表达的个体化调控。

产生了在5'选择性剪接位点IVS(S0)-654的5'选择性剪接位点的侧翼区含有不同序列的四种构建体(图3A)。保留了对于剪接是关键的5'选择性剪接位点651-658的8个核苷酸,并且剪接位点外部的突变核苷酸彼此具有至少5个核苷酸(nt)的差异。在HEK293细胞中测试每种构建体的表达以确定其转基因是否由其对应的AON诱导,并且是否受其他非对应的AON的影响。观察到对应的AON对报告基因表达的诱导,但没有被其他AON交叉调控(图3B)。尽管构建体之间的诱导效率是可变的,但与IVS(S0)-654相比,所有四种构建体都导致转基因诱导水平提高(图3C)。这些数据证实了转基因的剪接被AON以高度序列特异性的方式控制,从而允许多个转基因的差异化调控。

其对应的AON对多基因表达的差异调控

用其对应的AON测试了3种不同报告基因的差异表达。将修饰的内含子AON4导入荧光素酶,AON1导入绿色荧光蛋白(GFP),且AON 2导入红色荧光蛋白(RFP)。将那些报告基因分别亚克隆到CBh载体骨架中(Luc-AON 4、GFP-AON 1和RFP-AON 2)(图4A和4B)。在转染后的当天,将三种质粒的混合物转染到HEK293细胞中,并且用单独的AON、LNAAON4、LNAAON1和LNAAON2处理细胞。观察到每种AON特异性地诱导其对应的靶基因(图5B)。这些数据表明使用本文所述的诱导型载体及其对应的AON可以个体化调控多种转基因的表达。

AON对携带优化的IVS 2突变型内含子的AAV载体在小鼠肝脏中的荧光素酶表达的调控

为了证明含有优化的小内含子的调控系统也可起到控制动物中的转基因表达的功能,在6周龄雌性Balb/c小鼠中测试了AAV2.5-CBh-Luc-AON1载体。将AAV载体以1x10

通过在小鼠眼中施用AON可重新诱导AAV2.5-CBh-Luc-DGT1的荧光素酶表达。

我们在小鼠眼中测试了诱导型载体Luc-AON1,其在启动子CBh控制下使用修饰的AAV2衣壳AAV 2.5。在视网膜下注射病毒载体4周后,给予玻璃体内注射对应的AON、LNAAON1或错配的AON、LNA654。在注射AON后3周,注射LNAAONI的眼中的平均荧光素酶活性是注射LNAA654的眼中的平均荧光素酶活性的2.5倍高(P=0.0038,图6)。在注射LNAAON1后6周和9周,平均荧光素酶活性降低,但仍显著高于注射LNA654的眼中的荧光素酶活性。AON注射后13周不再有统计学显著性差异,因此在16周给予第二次AON玻璃体内注射。3周后,注射LNAAON1的眼的平均荧光素酶活性增加,并且是注射LNA654的眼的2倍高(P=0.017)。3周后,荧光素酶活性的差异不再显著(P=0.079)。在第23周进行AON的第三次玻璃体内注射。3周后,注射LNAAON1的眼和注射LNA654的眼之间的荧光素酶活性没有统计学显著差异。这些数据提供了在眼中使用诱导型系统的概念证明,并表明至少可以进行一次重新诱导,但是诱导的幅度可能会随时间降低。

讨论

本文提供的研究成功地证明了通过优化的诱导型载体AAV 2.5-CBh-Luc-AON 1介导的体外荧光素酶表达的诱导改善。还成功地证明了用相同载体对小鼠肝脏和眼中荧光素酶表达的诱导。与没有AON的情况相比,在IVS 2内含子657和658处将核苷酸T和A修改为G和T通过显著降低背景表达而使AON对荧光素酶的诱导增加超过100倍。这很可能是对剪接过程的紧密调控,该紧密调控通过使剪接位点更接近共有序列来增加选择性使用的5'剪接位点的强度。与长度为850nt的原始IVS 2-654相比诱导强度没有变化的小的长度为247nt的IVS 2-654内含子S0允许在AAV系统中更大的转基因克隆能力。同时,优化的诱导型系统可用于控制AAV介导的转基因表达。

血管生成是一个复杂的多步骤过程,涉及通过血管内皮细胞增殖、迁移、管形成和细胞外基质重塑而使血管内皮细胞从现有血管中萌发。该过程由生长因子、细胞外基质和细胞组分之间的复杂相互作用控制,最终结果由血管生成和血管生成抑制因子的平衡决定。许多生长因子分子参与控制血管生成,并且对它们中的一个或组合的治疗性操纵提供了控制眼中新血管形成的潜在手段。到目前为止,实验模型中使用基因治疗方法靶向的细胞因子和/或已被增强的血管生成抑制蛋白包括血管内皮生长因子(VEGF)、胰岛素样生长因子-1(IGF-1)、色素上皮衍生因子(PEDF)、基质金属蛋白酶(MMP)、血管抑素(angiostatin)、内皮抑素和整联蛋白。然而,没有一个能使新血管形成几乎完全消退。在患有视网膜新生血管性疾病的患者中有效控制血管生成可能需要在眼中长期存在血管生成抑制蛋白。对新生血管形成的不当抑制可能导致对正常眼部结构的损伤。因此,需要开发能够适当调控基因表达的策略以使局部毒性的可能性最小化。在本研究中,成功地证明了使用优化的诱导型系统可以控制小鼠眼中的转基因表达。在小鼠眼中,在用携带含有荧光素酶基因的DGT1内含子的AAV2.5载体转导后,通过施用AON证明了对荧光素酶活性的特异性诱导。还证明了通过在小鼠眼中重新施用AON可再诱导该系统。此外,成功地证明了用其对应的AON,3种不同的报告基因被个体化表达。AON4、AON1和AON2在没有任何交叉的情况下分别独立地调控荧光素酶、GFP和RFP的表达。对每个靶转基因使用与选择性使用的5'剪接位点及其侧翼序列互补的16聚体AON以个体化诱导表达。该16核苷酸区由剪接位点必需的8个核苷酸和对于侧翼区的8个核苷酸组成。在侧翼序列中有8个碱基可以突变而不影响选择性剪接位点的强度。结果表明,每个AON彼此之间存在6-7个错配,且不交叉调节靶基因的选择性剪接。因此,在5'剪接位点的靶区内,可突变比所需碱基更多的碱基(8>6)以创建不会被其他AON交叉调控的不同靶序列。这种转基因调控的能力对于通常使用的调控系统如tet-on和雷帕霉素诱导型系统是不可能的。实际上,这些系统中的每一个理论上只能独立地调控一个转基因。总之,这些数据表明该新型优化调控系统可能是一种非常有用的在临床上应用以差异化调控多种转基因表达以用于临床相关疾病如眼部新血管形成的基因治疗的策略。

材料和方法

细胞的维持。将人胚肾(HEK)293细胞维持在Dulbecco改良的Eagle培养基中,该培养基含有10%热灭活的胎牛血清和1X Penn/Strep(DMEM+,Sigma)。使细胞在37℃在5%CO

AAV载体质粒。所有携带荧光素酶的AAV载体质粒均由pTR-CBh-LuciferaseGL3+NotI(Xiaohuai等人)产生。用SphI和XcmI限制性酶消化将内含子区亚克隆到该质粒中。使用标准PCR技术在IVS2-654的选择性使用的5'剪接位点处进行突变,并进行测序以确保它们与预期得一致。

pZsGreen 1-Dr(#632428)和pDsRed-Express-Dr(#632423)购自Clontech。使用AgeI和NotI从pTR-CBh-Luciferase GL3+NotI质粒取出荧光素酶编码区,并用ZsGreen1-Dr或DsRed-Express-Dr编码区替换,分别命名为pTR-CBh-ZsGreen1-Dr和pTR-CBh-DsRed-Express-Dr。然后,将突变的IVS(S0)-654内含子,AON1插入pTR-CBh-ZsGreen1-Dr的ZsGreen1-Dr编码区,并将其命名为pTR-CBh-ZsGreen1-Dr-AON1。同样将修饰的IVS(S0)-654内含子,AON2插入pTR-CBh-DsRed-Express-Dr的DsRed-Express-Dr编码区,并将其命名为pTR-CBh-RedDr-AON2。

反义寡核苷酸。修饰的反义寡核苷酸LNA购自Exiqon。LNA-DGT1由UNC的Juliano博士慷慨提供。在表4中,大写字母表示LNA碱基,且小写字母表示天然DNA碱基。

AAV载体产生和表征。如Grieger等人所述,使用在无血清悬浮条件下在摇瓶中生长的HEK293细胞产生重组AAV载体(手稿在准备中)。简而言之,使用聚乙烯亚胺(Polysciences)和以下质粒:pXX680、pXR2.5和pTR-CBh-Luc-AON1转染悬浮HEK293细胞,以产生携带CBh-Luc-AON1的AAV。转染后48小时,将细胞培养物离心并弃去上清液。将细胞重悬并通过超声裂解。向裂解液中加入550U单位的DNA酶,并在37℃孵育45分钟,接着在9400xg离心以沉淀细胞碎片,并将澄清的裂解液上样到改良的不连续碘克沙醇梯度中,接着进行柱层析。然后使用如前所述的QPCR测定确定每种AAV载体制备物的物理粒子滴度(physicalparticle titer)。

转基因表达的体外表征。使用三个标记基因(萤火虫荧光素酶、ZsGreen1-Dr和DsRed-Express-Dr)在24孔板中使用培养的细胞系在体外研究转基因表达的调控。为了测量荧光素酶活性,如使用PEI转染方法所示,用500ng对应的质粒和10pmol的AON转染每个24孔板中的细胞。在转染后24小时,用100μl的1x报告物裂解缓冲液(Promega,货号E 4030)裂解细胞。然后将20ul裂解液与100μl荧光素酶底物(Promega,货号E4030)混合以确定荧光素酶活性。

对于涉及ZsGreen1-Dr和DsRed-Express-Dr标记基因的研究,使用PEI转染法用含有10pmol的AON的500ng质粒转染细胞。转染后,将细胞再培养48小时并使用荧光显微镜成像。

转基因表达的体内表征。使用荧光素酶研究6周龄雌性Balb/c小鼠中的转基因表达调控。以1x10

为了测试眼中的诱导型AAV载体,严格按照视觉和眼科研究协会关于动物在研究中使用的声明对小鼠进行人道处理。如先前所述(Mori等人),用Harvard泵装置和拉伸式玻璃微量移液器(pulled glass micropipette)对4周龄Balb/c小鼠进行视网膜下注射含有10

参考文献

1.Mori K,Duh E,Gehlbach P,Ando A,Takahashi K,Pearlman J,Mori K,YangHS,Zack DJ,Ettyreddy D,Brough DE,Wei LL,Campochiaro PA:Pigment epithelium-derived factor inhibits retinal and choroidal neovascularization.J.Cell.Physiol.188:253-263,2001

实施例2.产生包含调控核酸序列的saCas9

如实施例1所述,产生包含调控序列(β珠蛋白内含子区)的saCas9。使用限制性消化将调控序列内含子区(例如,SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)亚克隆到携带saCas 9的AAV载体质粒中。

实施例3.基因编辑的脱靶效应测定

消化的基因组的测序(Digenome-seqover)是一种体外Cas9消化的全基因组测序,它是一种稳健、灵敏、无偏和成本有效的用于分析可编程核酸酶(例如Cas9)在哺乳动物(例如人细胞)中的全基因组脱靶效应的方法。

使用lipofectamine 2000(Life Technologies)将表达Nav 1.8定向性的gRNA的HeLa、HEK和CHO细胞用以下进行转染:(1)无核酸酶(例如,未转染群体);(2)组成型活性的Casp 9;(3)不含结合调控序列的寡核苷酸的本文所述的基因编辑系统,例如处于“关闭(OFF)”位置的核酸酶;以及(4)本文所述的基因编辑系统和结合调控序列的寡核苷酸,例如,处于“打开(ON)”位置的核酸酶。在含有10%FBS的DMEM培养基中培养HeLa细胞。将细胞培养48小时。

体外裂解基因组DNA。

然后,使用DNeasy Tissue试剂盒(Qiagen),从每个细胞群体中分离完整的基因组DNA。将分离自未转染细胞群的DNA独立地与且不与本文所述的组成型活性核酸酶一起孵育,以允许对分离的DNA的消化。从核酸酶表达群体中分离的DNA用它们所指示的核酸酶分离,以允许对分离的DNA进行酶切。该反应在37℃在反应缓冲液(100mM NaCl,50mM Tris–HCl,10mM MgCl

全基因组测序和Digenome-seq.

使用标准方法通过全基因组测序分析纯化的消化的DNA。用核酸酶消化产生具有相同5’末端的DNA片段,其产生在裂解位点垂直对齐的序列读段。相反,没有相同5'端的所有其他序列读段将以交错的方式排列。将序列读段映射到参照基因组,并使用整合基因组学查看器(IGV)观察中靶位点(on-target site)(例如,Nav 1.8序列)和脱靶位点(off-target site)(例如,非Nav 1.8序列)上的序列排列模式。IGV可在万维网(例如,softward.broadinstitute.org/software/igv/)上获得。Digenome-Seq进一步描述于,例如,国际专利申请号WO 2016/076672l;Kim等人Nat Methods,2015,12:237-243.;Mei等人,J Genet Genomics 2016;43:63-75;Hu等人,Nat Protoc.2016;11:853-871;其各自通过引用以其整体并入本文。分析Digenome-seq数据的其他程序可在万维网(例如,rgenome.net/digenome/portable)上获得。

将组成型活性的Cas 9的脱靶效应与在用组成型活性的Cas 9消化的未转染细胞群体中观察到的任何脱靶效应进行比较。鉴定常见的脱靶位点且不予考虑,如在核酸酶消化的和未进行核酸酶消化的未转染细胞群之间鉴定的任何常见的脱靶位点。将在“打开(ON)”核酸酶群体中鉴定的脱靶位点与“关闭(OFF)”核酸酶群体中的进行比较,且不予考虑。不予考虑这些位点(例如,鉴定为真正的脱靶效应)的原因是,它们不太可能是由核酸酶的脱靶编辑引起的。

Digenome-seq揭示了在HeLa细胞中,组成型活性的Cas9导致脱靶效应(例如,编辑)的发生率与本文所述的“打开(ON)”基因编辑系统相比增加,表明与常规CRISPR/Cas9基因编辑相比,本文所述的基因编辑系统提供显著降低的脱靶效应率。此外,脱靶编辑和中靶编辑揭示了例如,对Nav 1.8序列的编辑在表达“关闭(OFF)”基因编辑系统的细胞中不发生,表明本文所述的基因编辑系统提供了对基因编辑的时间和空间控制。此外,这些结果是在本文测试的所有细胞类型中总结的,表明降低的脱靶效应是该基因编辑系统的特征,而不是细胞类型特异性的。

序列表

北卡罗来纳大学查佩尔希尔分校

理查·J·萨谬斯基

调控的基因编辑系统

5470-858WO

62/870,427

2019-07-03

62/743,317

2018-10-09

154

PatentIn version 3.5

1

7713

DNA

人工的(Artificial)

质粒TRCBA-int-luc-mut(654 C-T)

内含子

(2739)..(3588)

1

gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60

ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120

cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180

attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240

tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300

atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360

tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420

gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480

agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540

acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600

cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660

cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720

catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780

agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840

gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900

gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960

ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200

gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380

gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440

ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500

gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560

ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620

gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680

agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740

cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800

ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860

tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920

cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980

cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040

tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100

ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160

aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220

atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280

gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340

ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400

gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460

aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520

atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580

catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640

acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700

cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760

gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820

gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880

gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940

tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000

acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060

cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120

tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180

taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240

taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300

taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360

aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca tataaatatt 3420

tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480

agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540

taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600

tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660

tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720

atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780

ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840

taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900

tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960

agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020

attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080

aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140

gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200

cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260

tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320

aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380

ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440

aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500

cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560

gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620

ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680

attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740

cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800

tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860

ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920

ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980

cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040

acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100

ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160

tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220

aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280

acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340

tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400

caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460

gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520

tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580

tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640

ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700

gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760

gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820

gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880

tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180

ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140

gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380

cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620

ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680

cgtattaccg cctttgagtg agctgatacc gct 7713

2

7713

DNA

人工的

质粒TRCBA-int-luc(wt)

内含子

(2739)..(3588)

2

gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60

ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120

cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180

attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240

tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300

atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360

tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420

gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480

agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540

acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600

cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660

cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720

catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780

agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840

gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900

gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960

ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200

gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380

gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440

ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500

gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560

ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620

gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680

agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740

cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800

ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860

tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920

cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980

cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040

tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100

ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160

aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220

atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280

gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340

ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400

gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460

aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520

atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580

catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640

acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700

cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760

gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820

gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880

gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940

tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000

acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060

cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120

tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180

taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240

taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300

taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360

aagaataaca gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt 3420

tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480

agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540

taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600

tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660

tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720

atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780

ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840

taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900

tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960

agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020

attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080

aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140

gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200

cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260

tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320

aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380

ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440

aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500

cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560

gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620

ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680

attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740

cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800

tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860

ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920

ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980

cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040

acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100

ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160

tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220

aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280

acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340

tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400

caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460

gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520

tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580

tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640

ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700

gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760

gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820

gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880

tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180

ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140

gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380

cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620

ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680

cgtattaccg cctttgagtg agctgatacc gct 7713

3

7713

DNA

人工的

质粒TRCBA-int-luc (654 C-T, 657 TA-GT)

内含子

(2739)..(3588)

3

gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60

ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120

cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180

attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240

tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300

atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360

tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420

gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480

agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540

acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600

cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660

cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720

catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780

agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840

gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900

gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960

ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200

gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380

gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440

ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500

gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560

ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620

gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680

agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740

cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800

ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860

tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920

cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980

cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040

tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100

ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160

aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220

atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280

gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340

ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400

gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460

aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520

atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580

catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640

acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700

cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760

gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820

gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880

gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940

tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000

acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060

cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120

tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180

taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240

taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300

taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360

aagaataaca gtgataattt ctgggttaag gcaagtgcaa tatttctgca tataaatatt 3420

tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480

agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540

taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600

tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660

tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720

atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780

ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840

taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900

tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960

agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020

attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080

aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140

gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200

cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260

tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320

aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380

ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440

aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500

cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560

gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620

ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680

attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740

cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800

tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860

ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920

ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980

cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040

acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100

ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160

tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220

aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280

acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340

tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400

caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460

gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520

tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580

tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640

ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700

gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760

gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820

gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880

tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180

ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140

gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380

cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620

ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680

cgtattaccg cctttgagtg agctgatacc gct 7713

4

5860

DNA

人工的

质粒GL3-int-Luc-mut(654 C-T)

内含子

(948)..(1797)

4

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140

ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200

ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260

cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320

tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380

gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440

ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560

accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620

ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680

ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740

agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800

tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860

tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920

aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980

tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040

cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100

ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160

gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220

agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280

taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

5

5860

DNA

人工的

质粒GL3-int-Luc(wt)

内含子

(948)..(1797)

5

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140

ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200

ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260

cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320

tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380

gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440

ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560

accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat 1620

ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680

ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740

agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800

tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860

tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920

aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980

tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040

cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100

ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160

gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220

agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280

taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

6

5860

DNA

人工的

质粒GL3-int-Luc(654 C-T, 657 TA-GT)

内含子

(48)..(1797)

6

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140

ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200

ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260

cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320

tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380

gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440

ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560

accattctaa agaataacag tgataatttc tgggttaagg taagtgcaat atttctgcat 1620

ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680

ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740

agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800

tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860

tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920

aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980

tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040

cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100

ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160

gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220

agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280

taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

7

6683

DNA

人工的

质粒GL3-2int-fron-sph-mut

内含子

(251)..(1100)

内含子

(1771)..(2620)

7

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300

aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360

aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420

aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480

ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540

aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600

tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660

ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720

accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780

ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840

tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900

aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960

aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020

tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080

ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140

attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200

cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260

cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320

tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380

gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440

attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500

gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560

ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620

tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680

actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740

aactgcctgc gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt 1800

tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1860

tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1920

ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1980

tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 2040

aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 2100

attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 2160

cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 2220

taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 2280

gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 2340

ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 2400

cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 2460

taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 2520

ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 2580

tttgctaatc atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc 2640

aaatcattcc ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt 2700

ttactacact cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag 2760

aagagctgtt tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa 2820

ccctattctc cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac 2880

acgaaattgc ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga 2940

ggttccatct gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc 3000

tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg 3060

aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac 3120

tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg 3180

ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg 3240

aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg 3300

ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg 3360

caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg 3420

gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga 3480

aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac 3540

tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg 3600

tgtaattcta gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg 3660

agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 3720

atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 3780

gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa 3840

acctctacaa atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc 3900

aacccagtca gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact 3960

gtcttcttta tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct 4020

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 4080

ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4140

ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4200

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4260

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4320

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4380

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4440

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4500

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4560

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4620

tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4680

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4740

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4800

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4860

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4920

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4980

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 5040

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 5100

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 5160

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 5220

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 5280

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 5340

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 5400

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 5460

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5520

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5580

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 5640

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 5700

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 5760

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 5820

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 5880

ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 5940

gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 6000

acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 6060

cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 6120

tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 6180

gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 6240

cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 6300

gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 6360

gaattttaac aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg 6420

ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata 6480

agtaagtaat attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt 6540

tcattacatc tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat 6600

caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt 6660

gccagaacat ttctctatcg ata 6683

8

7547

DNA

人工的

质粒GL3-3int-2fron-sph(mut)

内含子

(251)..(1100)

内含子

(1111)..(1960)

内含子

(2635)..(3484)

8

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300

aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360

aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420

aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480

ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540

aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600

tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660

ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720

accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780

ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840

tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900

aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960

aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020

tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080

ctcttatctt cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt 1140

tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1200

tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1260

ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1320

tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 1380

aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 1440

attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 1500

cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 1560

taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 1620

gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 1680

ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 1740

cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 1800

taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 1860

ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 1920

tttgctaatc atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa 1980

aaacataaag aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca 2040

actgcataag gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc 2100

acatatcgag gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga 2160

agctatgaaa cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc 2220

tcttcaattc tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc 2280

gaacgacatt tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt 2340

ggtgttcgtt tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat 2400

catccaaaaa attattatca tggattctaa aacggattac cagggatttc agtcgatgta 2460

cacgttcgtc acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc 2520

cttcgatagg gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc 2580

taaaggtgtc gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt 2640

ctatgggacc cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg 2700

aaggggagaa gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg 2760

tggaagtctc aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt 2820

tgtttaattc ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc 2880

cttaacattg tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa 2940

aactttacac agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata 3000

ttcataatct ccctacttta ttttctttta tttttaattg atacataatc attatacata 3060

tttatgggtt aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat 3120

tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta 3180

tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc 3240

tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt 3300

tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt catattgcta 3360

atagcagcta caatccagct accattctgc ttttatttta tggttgggat aaggctggat 3420

tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc 3480

acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc 3540

cattccatca cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag 3600

tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga 3660

ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg 3720

acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg 3780

aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc 3840

tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg 3900

tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc 3960

tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg 4020

taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag 4080

acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga 4140

ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc 4200

ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg 4260

ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg 4320

tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag 4380

taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg 4440

ccaagaaggg cggaaagatc gccgtgtaat tctagagtcg gggcggccgg ccgcttcgag 4500

cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 4560

aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 4620

ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 4680

gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatcgat aaggatccgt 4740

cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4800

actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 4860

gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4920

agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4980

aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5040

gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5100

tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5160

cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5220

ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5280

cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5340

atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5400

agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5460

gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5520

gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5580

tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5640

agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5700

gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5760

aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5820

aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5880

ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5940

gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6000

aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6060

ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6120

tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6180

ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6240

cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6300

agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6360

gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6420

gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6480

acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6540

acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6600

agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6660

aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6720

gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6780

tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 6840

ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 6900

cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 6960

ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 7020

tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 7080

gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 7140

ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 7200

gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 7260

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7320

acgccagccc aagctaccat gataagtaag taatattaag gtacgggagg tacttggagc 7380

ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt gtgtgaatcg 7440

atagtactaa catacgctct ccatcaaaac aaaacgaaac aaaacaaact agcaaaatag 7500

gctgtcccca gtgcaagtgc aggtgccaga acatttctct atcgata 7547

9

5860

DNA

人工的

质粒GL3-int-luc A(mut)

内含子

(673)..(1522)

9

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggtgagtct atgggaccct tgatgttttc tttccccttc ttttctatgg 720

ttaagttcat gtcataggaa ggggagaagt aacagggtac agtttagaat gggaaacaga 780

cgaatgattg catcagtgtg gaagtctcag gatcgtttta gtttctttta tttgctgttc 840

ataacaattg ttttcttttg tttaattctt gctttctttt tttttcttct ccgcaatttt 900

tactattata cttaatgcct taacattgtg tataacaaaa ggaaatatct ctgagataca 960

ttaagtaact taaaaaaaaa ctttacacag tctgcctagt acattactat ttggaatata 1020

tgtgtgctta tttgcatatt cataatctcc ctactttatt ttcttttatt tttaattgat 1080

acataatcat tatacatatt tatgggttaa agtgtaatgt tttaatatgt gtacacatat 1140

tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 1200

acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 1260

gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1320

taaggtaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1380

agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttatg 1440

gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcatgttcat 1500

acctcttatc ttcctcccac aggggttgca aaaaattttg aacgtgcaaa aaaagctccc 1560

aatcatccaa aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 1620

gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga 1680

gtccttcgat agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct 1740

gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga 1800

tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860

tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920

aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980

tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040

cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100

ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160

gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220

agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280

taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

10

5860

DNA

人工的

质粒GL3-int-Luc B

内含子

(1440)..(2289)

10

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960

ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020

ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080

tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140

gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200

aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260

gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320

gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380

ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaagg 1440

tgagtctatg ggacccttga tgttttcttt ccccttcttt tctatggtta agttcatgtc 1500

ataggaaggg gagaagtaac agggtacagt ttagaatggg aaacagacga atgattgcat 1560

cagtgtggaa gtctcaggat cgttttagtt tcttttattt gctgttcata acaattgttt 1620

tcttttgttt aattcttgct ttcttttttt ttcttctccg caatttttac tattatactt 1680

aatgccttaa cattgtgtat aacaaaagga aatatctctg agatacatta agtaacttaa 1740

aaaaaaactt tacacagtct gcctagtaca ttactatttg gaatatatgt gtgcttattt 1800

gcatattcat aatctcccta ctttattttc ttttattttt aattgataca taatcattat 1860

acatatttat gggttaaagt gtaatgtttt aatatgtgta cacatattga ccaaatcagg 1920

gtaattttgc atttgtaatt ttaaaaaatg ctttcttctt ttaatatact tttttgttta 1980

tcttatttct aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc 2040

atgcctcttt gcaccattct aaagaataac agtgataatt tctgggttaa ggtaatagca 2100

atatttctgc atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat 2160

tgctaatagc agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc 2220

tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc 2280

ctcccacaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

11

5860

DNA

人工的

质粒GL3-int-Luc C

内含子

(1691)..(2540)

11

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960

ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020

ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080

tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140

gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200

aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260

gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320

gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380

ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga 1440

ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg 1500

accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 1560

gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat 1620

caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca 1680

ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 1740

aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 1800

aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 1860

aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 1920

ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 1980

aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 2040

tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 2100

ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 2160

accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 2220

ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 2280

tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 2340

aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 2400

aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 2460

tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 2520

ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580

tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640

tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700

aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760

gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820

gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880

tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940

agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000

tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060

tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100

aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520

taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580

ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640

cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700

ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760

taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820

ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860

12

5833

DNA

人工的

质粒GL3-int-fron(mut)

内含子

(251)..(1100)

12

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300

aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360

aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420

aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480

ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540

aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600

tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660

ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720

accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780

ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840

tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900

aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960

aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020

tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080

ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140

attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200

cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260

cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320

tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380

gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440

attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500

gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560

ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620

tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680

actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740

aactgcctgc gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc 1800

ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 1860

cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 1920

tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 1980

cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2040

ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2100

gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2160

cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2220

tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2280

aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2340

caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 2400

catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 2460

attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 2520

cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 2580

gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 2640

cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 2700

aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaattcta 2760

gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca 2820

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2880

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2940

tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa 3000

atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc aacccagtca 3060

gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta 3120

tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct cactgactcg 3180

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3240

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3300

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3360

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3420

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3480

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3540

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3600

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3660

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3720

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 3780

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3840

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3900

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3960

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4020

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4080

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 4140

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 4200

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 4260

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 4320

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 4380

aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 4440

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 4500

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 4560

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 4620

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 4680

cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 4740

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 4800

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 4860

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 4920

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4980

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5040

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc gccctgtagc 5100

ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 5160

gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 5220

ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 5280

ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 5340

acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 5400

actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 5460

atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 5520

aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg 5580

cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata agtaagtaat 5640

attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt tcattacatc 5700

tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat caaaacaaaa 5760

cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt gccagaacat 5820

ttctctatcg ata 5833

13

6710

DNA

人工的

质粒GL3-2int-sph(mut)

内含子

(948)..(1797)

内含子

(1798)..(2647)

13

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140

ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200

ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260

cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320

tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380

gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440

ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560

accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620

ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680

ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740

agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacaggtg 1800

agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1860

aggaagggga gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1920

gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1980

ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 2040

tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 2100

aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 2160

atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 2220

atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 2280

aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 2340

ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 2400

gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg taatagcaat 2460

atttctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 2520

ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2580

gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2640

cccacagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg 2700

ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc 2760

gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca 2820

agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga 2880

ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta 2940

aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg 3000

ggctcactga gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg 3060

cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa 3120

cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt 3180

atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg 3240

gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc 3300

tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac 3360

accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc 3420

ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480

acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540

aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600

aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660

gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720

aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780

gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840

tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900

cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960

atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020

ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080

gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140

cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200

gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260

aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320

ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380

cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440

ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500

cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560

agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620

gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680

gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740

tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800

agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860

agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920

atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980

cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040

actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100

aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160

cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220

ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280

cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340

ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400

cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460

ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520

tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580

ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640

aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700

gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760

gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820

ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880

catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940

atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000

ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060

tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120

gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180

gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240

ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300

ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360

tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420

ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480

attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540

agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600

tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660

taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710

14

6710

DNA

人工的

质粒GL3-2int-Sph-C

内含子

(948)..(1797)

内含子

(2541)..(3390)

14

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140

ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200

ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260

cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320

tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380

gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440

ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560

accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620

ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680

ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740

agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800

tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860

tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920

aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980

tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040

cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100

ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160

gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220

agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280

taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340

tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400

ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460

caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520

cttcgacgca ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt 2580

ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 2640

gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 2700

tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 2760

gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 2820

gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 2880

ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 2940

taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 3000

acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 3060

tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 3120

gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 3180

ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 3240

ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 3300

attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 3360

atgttcatac ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc 3420

ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480

acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540

aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600

aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660

gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720

aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780

gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840

tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900

cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960

atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020

ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080

gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140

cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200

gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260

aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320

ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380

cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440

ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500

cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560

agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620

gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680

gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740

tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800

agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860

agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920

atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980

cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040

actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100

aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160

cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220

ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280

cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340

ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400

cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460

ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520

tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580

ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640

aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700

gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760

gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820

ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880

catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940

atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000

ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060

tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120

gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180

gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240

ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300

ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360

tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420

ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480

attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540

agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600

tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660

taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710

15

5660

DNA

人工的

质粒GL3-sint200-sph(mut)

内含子

(948)..(1597)

15

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140

ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200

tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260

ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320

tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380

tgataatttc tgggttaagg taatagcaat atttctgcat ataaatattt ctgcatataa 1440

attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500

tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560

gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620

tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680

ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740

agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800

tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860

aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920

tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980

ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040

cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100

gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160

tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220

acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280

ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340

gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400

agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460

agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520

acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580

aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640

ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700

ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760

ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820

tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880

ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940

ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000

tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060

aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120

gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180

ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240

ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300

gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360

ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420

cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480

cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540

gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600

aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660

tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720

gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780

tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840

gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900

tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960

ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020

ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080

tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140

aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200

gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260

gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320

ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380

gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440

gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500

gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560

tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620

gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680

agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740

aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800

ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860

gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920

ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980

tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040

cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100

acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160

ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220

gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280

tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340

ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400

ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460

aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520

ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580

aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640

agaacatttc tctatcgata 5660

16

5660

DNA

人工的

质粒GL3-sint200-sph(657 GT)

内含子

(948)..(1597)

16

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020

gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080

ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140

ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200

tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260

ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320

tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380

tgataatttc tgggttaagg taagtgcaat atttctgcat ataaatattt ctgcatataa 1440

attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500

tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560

gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620

tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680

ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740

agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800

tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860

aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920

tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980

ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040

cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100

gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160

tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220

acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280

ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340

gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400

agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460

agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520

acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580

aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640

ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700

ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760

ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820

tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880

ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940

ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000

tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060

aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120

gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180

ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240

ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300

gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360

ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420

cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480

cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540

gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600

aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660

tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720

gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780

tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840

gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900

tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960

ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020

ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080

tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140

aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200

gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260

gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320

ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380

gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440

gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500

gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560

tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620

gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680

agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740

aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800

ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860

gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920

ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980

tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040

cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100

acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160

ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220

gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280

tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340

ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400

ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460

aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520

ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580

aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640

agaacatttc tctatcgata 5660

17

5436

DNA

人工的

质粒GL3-sint425-sph

内含子

(948)..(1373)

17

ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120

cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180

ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240

caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300

aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360

aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420

gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480

aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540

ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600

atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660

gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720

aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780

gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840

agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900

gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960

acccttgatg ttttctttcc tgtacacata ttgaccaaat cagggtaatt ttgcatttgt 1020

aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact 1080

ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca 1140

ttctaaagaa taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa 1200

atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac 1260

aatccagcta ccattctgct tttattttat ggttgggata aggctggatt attctgagtc 1320

caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca cagagatcct 1380

atttttggca atcaaatcat tccggatact gcgattttaa gtgttgttcc attccatcac 1440

ggttttggaa tgtttactac actcggatat ttgatatgtg gatttcgagt cgtcttaatg 1500

tatagatttg aagaagagct gtttctgagg agccttcagg attacaagat tcaaagtgcg 1560

ctgctggtgc caaccctatt ctccttcttc gccaaaagca ctctgattga caaatacgat 1620

ttatctaatt tacacgaaat tgcttctggt ggcgctcccc tctctaagga agtcggggaa 1680

gcggttgcca agaggttcca tctgccaggt atcaggcaag gatatgggct cactgagact 1740

acatcagcta ttctgattac acccgagggg gatgataaac cgggcgcggt cggtaaagtt 1800

gttccatttt ttgaagcgaa ggttgtggat ctggataccg ggaaaacgct gggcgttaat 1860

caaagaggcg aactgtgtgt gagaggtcct atgattatgt ccggttatgt aaacaatccg 1920

gaagcgacca acgccttgat tgacaaggat ggatggctac attctggaga catagcttac 1980

tgggacgaag acgaacactt cttcatcgtt gaccgcctga agtctctgat taagtacaaa 2040

ggctatcagg tggctcccgc tgaattggaa tccatcttgc tccaacaccc caacatcttc 2100

gacgcaggtg tcgcaggtct tcccgacgat gacgccggtg aacttcccgc cgccgttgtt 2160

gttttggagc acggaaagac gatgacggaa aaagagatcg tggattacgt cgccagtcaa 2220

gtaacaaccg cgaaaaagtt gcgcggagga gttgtgtttg tggacgaagt accgaaaggt 2280

cttaccggaa aactcgacgc aagaaaaatc agagagatcc tcataaaggc caagaagggc 2340

ggaaagatcg ccgtgtaatt ctagagtcgg ggcggccggc cgcttcgagc agacatgata 2400

agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2460

tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2520

aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2580

taaagcaagt aaaacctcta caaatgtggt aaaatcgata aggatccgtc gaccgatgcc 2640

cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc 2700

cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctt 2760

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 2820

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 2880

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2940

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 3000

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 3060

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 3120

tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 3180

agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 3240

atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 3300

acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 3360

actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 3420

tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 3480

tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3540

tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3600

tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 3660

caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 3720

cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 3780

agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 3840

acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 3900

gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 3960

ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 4020

tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 4080

ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 4140

tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 4200

attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 4260

agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 4320

ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 4380

ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 4440

cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 4500

gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 4560

tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 4620

tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 4680

tgccacctga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 4740

gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 4800

ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 4860

tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 4920

gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 4980

ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 5040

ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 5100

aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttgccat tcgccattca 5160

ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccca 5220

agctaccatg ataagtaagt aatattaagg tacgggaggt acttggagcg gccgcaataa 5280

aatatcttta ttttcattac atctgtgtgt tggttttttg tgtgaatcga tagtactaac 5340

atacgctctc catcaaaaca aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag 5400

tgcaagtgca ggtgccagaa catttctcta tcgata 5436

18

850

DNA

人工的

突变型内含子(654 C-T)

misc_feature

(654)..(654)

β-珠蛋白内含子654 C-T突变

18

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

19

850

DNA

智人(Homo sapiens)

misc_feature

(1)..(850)

野生型β-珠蛋白内含子

19

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

20

850

DNA

人工的

具有两个突变(654 C-T;657 TA-GT)的内含子

misc_feature

(654)..(654)

β-珠蛋白内含子654 C-T突变

misc_feature

(657)..(658)

β-珠蛋白内含子657 TA-GT突变

20

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagtgc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

21

2503

DNA

人工的

具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(669)..(1518)

21

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840

caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900

attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960

gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020

tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080

aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140

caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200

ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260

caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320

gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380

gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500

cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560

tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620

atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680

tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740

aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800

tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860

gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920

taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980

taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

22

2503

DNA

人工的

具有野生型内含子的荧光素酶cDNA

内含子

(669)..(1518)

22

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840

caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900

attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960

gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020

tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080

aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140

caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200

ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260

caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320

gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380

gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500

cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560

tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620

atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680

tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740

aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800

tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860

gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920

taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980

taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

23

2503

DNA

人工的

具有双突变型内含子(C654 C-T;657 TA-GT)的荧光素酶cDNA

内含子

(669)..(1518)

23

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840

caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900

attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960

gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020

tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080

aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140

caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200

ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260

caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320

gtaagtgcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380

gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500

cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560

tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620

atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680

tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740

aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800

tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860

gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920

taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980

taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

24

3355

DNA

人工的

具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(1)..(850)

内含子

(1521)..(2370)

24

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900

ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960

cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020

ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080

agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140

tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200

agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260

ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320

gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380

aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440

aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500

gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt tccccttctt 1560

ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1620

gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1680

tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1740

gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1800

gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1860

ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1920

taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1980

acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 2040

tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 2100

gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 2160

ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 2220

ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 2280

attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 2340

atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc aaatcattcc 2400

ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 2460

cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 2520

tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 2580

cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2640

ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2700

gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2760

cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2820

tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2880

aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2940

caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 3000

catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 3060

attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 3120

cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 3180

gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 3240

cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 3300

aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 3355

25

4219

DNA

人工的

具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(1)..(850)

内含子

(861)..(1710)

内含子

(2385)..(3234)

25

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt tccccttctt 900

ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 960

gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1020

tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1080

gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1140

gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1200

ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1260

taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1320

acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1380

tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1440

gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1500

ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1560

ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1620

attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1680

atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa aaacataaag 1740

aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca actgcataag 1800

gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc acatatcgag 1860

gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga agctatgaaa 1920

cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc tcttcaattc 1980

tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc gaacgacatt 2040

tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt ggtgttcgtt 2100

tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat catccaaaaa 2160

attattatca tggattctaa aacggattac cagggatttc agtcgatgta cacgttcgtc 2220

acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc cttcgatagg 2280

gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc taaaggtgtc 2340

gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt ctatgggacc 2400

cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg aaggggagaa 2460

gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg tggaagtctc 2520

aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt tgtttaattc 2580

ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc cttaacattg 2640

tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa aactttacac 2700

agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata ttcataatct 2760

ccctacttta ttttctttta tttttaattg atacataatc attatacata tttatgggtt 2820

aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat tttgcatttg 2880

taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta tttctaatac 2940

tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc tctttgcacc 3000

attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt tctgcatata 3060

aatatttctg catataaatt gtaactgatg taagaggttt catattgcta atagcagcta 3120

caatccagct accattctgc ttttatttta tggttgggat aaggctggat tattctgagt 3180

ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc acagagatcc 3240

tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc cattccatca 3300

cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag tcgtcttaat 3360

gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga ttcaaagtgc 3420

gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg acaaatacga 3480

tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg aagtcgggga 3540

agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc tcactgagac 3600

tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt 3660

tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa 3720

tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc 3780

ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag acatagctta 3840

ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa 3900

aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt 3960

cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt 4020

tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca 4080

agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg 4140

tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg 4200

cggaaagatc gccgtgtaa 4219

26

2503

DNA

人工的

在可变位置A处具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(394)..(1243)

26

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggtgagtc tatgggaccc ttgatgtttt 420

ctttcccctt cttttctatg gttaagttca tgtcatagga aggggagaag taacagggta 480

cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt 540

agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt 600

ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa 660

aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag 720

tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat 780

tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg 840

ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa 900

aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc 960

tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa 1020

taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa atatttctgc 1080

atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1140

ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1200

ccttttgcta atcatgttca tacctcttat cttcctccca caggggttgc aaaaaatttt 1260

gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga 1320

ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa 1380

tgaatacgat tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa 1440

ctcctctgga tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt 1500

gagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560

tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620

atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680

tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740

aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800

tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860

gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920

taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980

taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

27

2503

DNA

人工的

在可变位置B处具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(1161)..(2010)

27

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720

gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780

cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840

aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900

attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960

aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020

gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080

gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140

acgctgggcg ttaatcaaag gtgagtctat gggacccttg atgttttctt tccccttctt 1200

ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1260

gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1320

tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1380

gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1440

gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1500

ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1560

taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1620

acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1680

tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1740

gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1800

ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1860

ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1920

attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1980

atgttcatac ctcttatctt cctcccacag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

28

2503

DNA

人工的

在可变位置C处具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(1412)..(2261)

28

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720

gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780

cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840

aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900

attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960

aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020

gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080

gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140

acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200

tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260

ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320

ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380

caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt gatgttttct 1440

ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta acagggtaca 1500

gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag 1560

tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt 1620

ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag 1680

gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta 1740

cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt 1800

tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt 1860

ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa 1920

tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc 1980

tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata 2040

acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat atttctgcat 2100

ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc 2160

attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 2220

ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg acgatgacgc 2280

cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340

gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400

gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460

gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503

29

2505

DNA

人工的

在翻译起始位点上游具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(1)..(850)

29

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900

ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960

cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020

ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080

agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140

tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200

agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260

ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320

gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380

aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440

aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500

gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg 1560

attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg 1620

atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tctgaggagc 1680

cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc 1740

aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctggtggc 1800

gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct gccaggtatc 1860

aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat 1920

gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg 1980

gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg 2040

attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga 2100

tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catcgttgac 2160

cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga attggaatcc 2220

atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc cgacgatgac 2280

gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa 2340

gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt 2400

gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga 2460

gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 2505

30

3353

DNA

人工的

具有两个突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(669)..(1518)

内含子

(1519)..(2368)

30

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840

caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900

attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960

gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020

tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080

aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140

caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200

ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260

caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320

gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380

gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500

cttatcttcc tcccacaggt gagtctatgg gacccttgat gttttctttc cccttctttt 1560

ctatggttaa gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga 1620

aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg 1680

ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc 1740

aatttttact attatactta atgccttaac attgtgtata acaaaaggaa atatctctga 1800

gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg 1860

aatatatgtg tgcttatttg catattcata atctccctac tttattttct tttattttta 1920

attgatacat aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac 1980

acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt 2040

taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 2100

aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 2160

ctgggttaag gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 2220

gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 2280

tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat 2340

gttcatacct cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg 2400

atactgcgat tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg 2460

gatatttgat atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc 2520

tgaggagcct tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct 2580

tcttcgccaa aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt 2640

ctggtggcgc tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc 2700

caggtatcag gcaaggatat gggctcactg agactacatc agctattctg attacacccg 2760

agggggatga taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg 2820

tggatctgga taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag 2880

gtcctatgat tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca 2940

aggatggatg gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca 3000

tcgttgaccg cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat 3060

tggaatccat cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg 3120

acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180

cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240

gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300

aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353

31

3353

DNA

人工的

具有两个突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(669)..(1518)

内含子

(2262)..(3111)

31

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840

caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900

attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960

gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020

tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080

aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140

caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200

ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260

caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320

gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380

gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500

cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560

tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620

atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680

tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740

aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800

tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860

gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920

taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980

taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040

tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100

gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160

cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220

cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt 2280

gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta 2340

acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg 2400

atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg 2460

ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt 2520

ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt 2580

ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc 2640

tactttattt tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa 2700

gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 2760

ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 2820

ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 2880

ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat 2940

atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 3000

tccagctacc attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca 3060

agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg 3120

acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180

cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240

gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300

aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353

32

2303

DNA

人工的

具有突变型内含子的荧光素酶cDNA

内含子

(669)..(1318)

32

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840

atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900

ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960

tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020

atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080

caccattcta aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca 1140

tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320

atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380

atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440

taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500

gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560

acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620

gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680

agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740

aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800

ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860

atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920

cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980

acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040

tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100

ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160

gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220

aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280

agggcggaaa gatcgccgtg taa 2303

33

2303

DNA

人工的

具有双突变型内含子(654 C-T;657 TA-GT)的荧光素酶cDNA

内含子

(669)..(1318)

33

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720

gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780

tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840

atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900

ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960

tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020

atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080

caccattcta aagaataaca gtgataattt ctgggttaag gtaagtgcaa tatttctgca 1140

tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320

atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380

atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440

taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500

gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560

acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620

gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680

agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740

aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800

ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860

atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920

cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980

acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040

tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100

ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160

gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220

aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280

agggcggaaa gatcgccgtg taa 2303

34

2079

DNA

人工的

具有突变型内含子(654 C-T)的荧光素酶cDNA

内含子

(669)..(1094)

34

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccaggt gagtctatgg gacccttgat gttttctttc ctgtacacat attgaccaaa 720

tcagggtaat tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt 780

gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat 840

gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa 900

tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt 960

catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat 1020

aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta 1080

tcttcctccc acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta 1140

agtgttgttc cattccatca cggttttgga atgtttacta cactcggata tttgatatgt 1200

ggatttcgag tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag 1260

gattacaaga ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc 1320

actctgattg acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc 1380

ctctctaagg aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa 1440

ggatatgggc tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa 1500

ccgggcgcgg tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc 1560

gggaaaacgc tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg 1620

tccggttatg taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta 1680

cattctggag acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg 1740

aagtctctga ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg 1800

ctccaacacc ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt 1860

gaacttcccg ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc 1920

gtggattacg tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt 1980

gtggacgaag taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc 2040

ctcataaagg ccaagaaggg cggaaagatc gccgtgtaa 2079

35

7449

DNA

人工的

具有α抗胰蛋白酶cDNA和突变型内含子(654 C-T)的质粒TRCBA

内含子

(2866)..(3715)

突变型β-珠蛋白内含子(654C-T)

35

gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60

ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120

cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180

attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240

tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300

atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360

tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420

gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480

agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540

acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600

cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660

cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720

catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780

agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840

gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900

gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960

ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200

gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380

gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440

ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500

gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560

ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620

gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680

agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740

cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800

ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860

tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920

cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980

cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcgat 2040

atcaagcttg gggattttca ggcaccacca ctgacctggg acagtgaatc gacaatgccg 2100

tcttctgtct cgtggggcat cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc 2160

ctggctgagg atccccaggg agatgctgcc cagaagacag atacatccca ccatgatcag 2220

gatcacccaa ccttcaacaa gatcaccccc aacctggctg agttcgcctt cagcctatac 2280

cgccagctgg cacaccagtc caacagcacc aatatcttct tctccccagt gagcatcgct 2340

acagcctttg caatgctctc cctggggacc aaggctgaca ctcacgatga aatcctggag 2400

ggcctgaatt tcaacctcac ggagattccg gaggctcaga gccatgaagg ctgccaggaa 2460

ctcctccgta ccctcaacca gccagacagc cagctccagc tgaccaccgg caatggcctg 2520

tgcctcagcg agggcctgaa gcaagtggat aagtttttgg aggatgttaa aaagttgtac 2580

cactcataag ccttcactgt caacttcggg gacaccgaag aggccaagaa acagatcaac 2640

gattacgttg agaagggtac tcaagggaaa atggtggatg tggtcaagga gcttgacaga 2700

gacacagttt ttgctctggt gaattacatc ttctttaaag gcaaatggga gagacccttt 2760

gaagtcaagg acaccgagga agaggacttc cacgtggacc aggtgaccac cgtgaaggtg 2820

cctatgatga agcgtttagt catgtttaac atccagcact gtaaggtgag tctatgggac 2880

ccttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggaga 2940

agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 3000

caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 3060

cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 3120

gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 3180

cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 3240

tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 3300

taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 3360

gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 3420

ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 3480

cattctaaag aataacagtg ataatttctg ggttaaggta atagcaatat ttctgcatat 3540

aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 3600

acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 3660

tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagaagct 3720

ttccagctgg gtgctgctga tgaaatacct gggcaatgcc accgccatct tcttcctgcc 3780

tgatgagggg aaactacagc acctggaaaa tgaactcacc cacgatatca tcaccaagtt 3840

cctggaaaat gaagacagaa ggtctgccag cttacattta cccaaactgt ccattactgg 3900

aacctatgat ctgaagagcg tcctgggtca actgggcatc actaaggtct tcagcaatgg 3960

ggctgacctc tccgtggtca cagaggaggc acccctgaag ctctccaatg ccgtgcataa 4020

ggctgtgctg accatcgacg agaaagggac tgaagctgct ggggccatgt ttttagaggc 4080

catacccatg tctatccccc ccgaggtcaa ggtcaacaaa ccctttgtct tcttaatgat 4140

tgaacaaaat accaagtctc ccctcttcat gggaaaagtg gtgaatccca cccaaaaata 4200

actgcctctc gctcctcaac ccctcccctc catccctggc cccctccctg gatgacatta 4260

aagaagggtt gagctggtaa cccccccccc ccctgcaggg gccctcgacc cgggcggccg 4320

cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4380

tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4440

agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4500

gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4560

gatctaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4620

tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 4680

cgagcgagcg cgcagagagg gagtggccaa cccccccccc cccccccctg cagcctggcg 4740

taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgtagcc tgaatggcga 4800

atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 4860

cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 4920

tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 4980

ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 5040

tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 5100

taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 5160

tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 5220

aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttcctgat gcgctatttt 5280

ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc 5340

tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 5400

cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 5460

atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata 5520

cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 5580

tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaatact ttcaaatatg 5640

tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 5700

atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 5760

gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 5820

cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 5880

gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 5940

cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 6000

gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 6060

tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 6120

ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 6180

gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 6240

cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 6300

tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 6360

tcggcccttc cggctggctg gtttattgcg gataaatctg gagccggtga gcgtgggtct 6420

cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 6480

acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 6540

tcactgatta agcattggta actgtcagac caagtttact catatatact ttagattgat 6600

ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg 6660

accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 6720

aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 6780

ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 6840

gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 6900

ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 6960

ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 7020

ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 7080

gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg 7140

cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 7200

cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 7260

cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 7320

aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 7380

ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 7440

gataccgct 7449

36

2107

DNA

人工的

具有突变型内含子(654 C-T)的α抗胰蛋白酶cDNA

内含子

(772)..(1621)

突变型β-珠蛋白内含子(654C-T)

36

atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct 60

gtctccctgg ctgaggatcc ccagggagat gctgcccaga agacagatac atcccaccat 120

gatcaggatc acccaacctt caacaagatc acccccaacc tggctgagtt cgccttcagc 180

ctataccgcc agctggcaca ccagtccaac agcaccaata tcttcttctc cccagtgagc 240

atcgctacag cctttgcaat gctctccctg gggaccaagg ctgacactca cgatgaaatc 300

ctggagggcc tgaatttcaa cctcacggag attccggagg ctcagagcca tgaaggctgc 360

caggaactcc tccgtaccct caaccagcca gacagccagc tccagctgac caccggcaat 420

ggcctgtgcc tcagcgaggg cctgaagcaa gtggataagt ttttggagga tgttaaaaag 480

ttgtaccact cataagcctt cactgtcaac ttcggggaca ccgaagaggc caagaaacag 540

atcaacgatt acgttgagaa gggtactcaa gggaaaatgg tggatgtggt caaggagctt 600

gacagagaca cagtttttgc tctggtgaat tacatcttct ttaaaggcaa atgggagaga 660

ccctttgaag tcaaggacac cgaggaagag gacttccacg tggaccaggt gaccaccgtg 720

aaggtgccta tgatgaagcg tttagtcatg tttaacatcc agcactgtaa ggtgagtcta 780

tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 840

gggagaagta acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg 900

aagtctcagg atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt 960

ttaattcttg ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt 1020

aacattgtgt ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac 1080

tttacacagt ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc 1140

ataatctccc tactttattt tcttttattt ttaattgata cataatcatt atacatattt 1200

atgggttaaa gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt 1260

gcatttgtaa ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt 1320

ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct 1380

ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct 1440

gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata 1500

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1560

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1620

gaagctttcc agctgggtgc tgctgatgaa atacctgggc aatgccaccg ccatcttctt 1680

cctgcctgat gaggggaaac tacagcacct ggaaaatgaa ctcacccacg atatcatcac 1740

caagttcctg gaaaatgaag acagaaggtc tgccagctta catttaccca aactgtccat 1800

tactggaacc tatgatctga agagcgtcct gggtcaactg ggcatcacta aggtcttcag 1860

caatggggct gacctctccg tggtcacaga ggaggcaccc ctgaagctct ccaatgccgt 1920

gcataaggct gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt 1980

agaggccata cccatgtcta tcccccccga ggtcaaggtc aacaaaccct ttgtcttctt 2040

aatgattgaa caaaatacca agtctcccct cttcatggga aaagtggtga atcccaccca 2100

aaaataa 2107

37

18

DNA

人工的

结合调控序列的寡核苷酸

37

gctattacct taacccag 18

38

18

DNA

人工的

结合调控序列的寡核苷酸

38

gcacttacct taacccag 18

39

18

DNA

人工的

针对IVS2-654中6A突变的寡核苷酸

39

caagggtccc atagtctc 18

40

18

DNA

人工的

针对IVS2-654中564C突变的寡核苷酸

40

gaaagagatg agggaaag 18

41

18

DNA

人工的

针对IVS2-654中564CT突变的寡核苷酸

41

gaaagagaag agggaaag 18

42

18

DNA

人工的

针对IVS2-705中705G突变的寡核苷酸

42

cctcttacct cagttaca 18

43

18

DNA

人工的

针对IVS2-654中841A突变的寡核苷酸

43

ctgtgggagt aagataag 18

44

18

DNA

人工的

针对IVS2-654中657G突变的寡核苷酸

44

gctcttacct taacccag 18

45

18

DNA

人工的

针对IVS2-654中658T突变的寡核苷酸

45

gcaattacct taacccag 18

46

18

DNA

人工的

针对IVS2-654的寡核苷酸

46

caagggtccc atagactc 18

47

18

DNA

人工的

针对IVS2-654的寡核苷酸

47

gaaagagatt agggaaag 18

48

18

DNA

人工的

针对IVS2-654的寡核苷酸

48

ctgtgggagg aagataag 18

49

18

DNA

人工的

针对IVS2-705的寡核苷酸

49

cctcttacat cagttaca 18

50

850

DNA

人工的

具有564CT突变的IVS2-654内含子

misc_feature

(564)..(565)

564CT突变

misc_feature

(654)..(654)

654T突变

50

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

51

850

DNA

人工的

具有657G突变的IVS2-654内含子

misc_feature

(654)..(654)

654T突变

misc_feature

(657)..(657)

657G突变

51

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

52

850

DNA

人工的

具有658T突变的IVS2-654内含子

misc_feature

(654)..(654)

654T突变

misc_feature

(658)..(658)

658T突变

52

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaattgc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

53

650

DNA

人工的

具有200 bp缺失的IVS2-654内含子

misc_feature

(454)..(454)

C-T突变

53

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180

actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240

tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300

tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360

cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420

taaagaataa cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata 480

tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat 540

ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600

gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650

54

426

DNA

人工的

具有425 bp缺失的IVS2-654内含子

misc_feature

(230)..(230)

C-T突变

54

gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60

attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120

tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180

cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggt aatagcaata 240

tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 300

taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360

attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420

ccacag 426

55

850

DNA

人工的

具有6A突变的IVS2-654内含子

misc_feature

(6)..(6)

6A突变

misc_feature

(654)..(654)

654T突变

55

gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

56

850

DNA

人工的

具有564C突变的IVS2-654内含子

misc_feature

(564)..(564)

564C突变

misc_feature

(654)..(654)

654T突变

56

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

57

850

DNA

人工的

具有841A突变的IVS2-654内含子

misc_feature

(654)..(654)

654T突变

misc_feature

(841)..(841)

841A突变

57

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

actcccacag 850

58

850

DNA

人工的

IVS2-705内含子

misc_feature

(705)..(705)

705G突变

58

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

59

850

DNA

人工的

具有564CT突变的IVS2-705内含子

misc_feature

(564)..(565)

564CT突变

misc_feature

(705)..(705)

705G突变

59

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

60

850

DNA

人工的

具有657G突变的IVS2-705内含子

misc_feature

(657)..(657)

657G突变

misc_feature

(705)..(705)

705G突变

60

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

61

850

DNA

人工的

具有658T突变的IVS2-705内含子

misc_feature

(658)..(658)

658T突变

misc_feature

(705)..(705)

705G突变

61

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaattgc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

62

850

DNA

人工的

具有657GT突变的IVS2-705内含子

misc_feature

(657)..(658)

657GT突变

misc_feature

(705)..(705)

705G突变

62

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagtgc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

63

650

DNA

人工的

具有200 bp缺失的IVS2-705内含子

misc_feature

(505)..(505)

T-G突变

63

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180

actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240

tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300

tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360

cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420

taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata 480

tttctgcata taaattgtaa ctgaggtaag aggtttcata ttgctaatag cagctacaat 540

ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600

gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650

64

426

DNA

人工的

具有425 bp缺失的IVS2-705内含子

misc_feature

(281)..(281)

T-G突变

64

gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60

attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120

tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180

cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 240

tttctgcata taaatatttc tgcatataaa ttgtaactga ggtaagaggt ttcatattgc 300

taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360

attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420

ccacag 426

65

850

DNA

人工的

具有6A突变的IVS2-705内含子

misc_feature

(6)..(6)

6A突变

misc_feature

(705)..(705)

705G突变

65

gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

66

850

DNA

人工的

具有564C突变的IVS2-705内含子

misc_feature

(564)..(564)

564C突变

misc_feature

(705)..(705)

705G突变

66

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

cctcccacag 850

67

850

DNA

人工的

具有841A突变的IVS2-705内含子

misc_feature

(705)..(705)

705G突变

misc_feature

(841)..(841)

841A突变

67

gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60

cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120

tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180

ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240

taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300

aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360

tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420

tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480

ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540

atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600

catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660

aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720

ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780

ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840

actcccacag 850

68

196

DNA

人工的

IVS2-654内含子197 bp

68

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct cttctctttc tttcaggtga ttgactgact gggttaaggt aatagcgccg 120

ttgaaaacct cagccgtata gtccaagcta ggcccttttg ctaatcatgt tcatacctct 180

tatcttcctc ccacag 196

69

247

DNA

人工的

IVS-654内含子247 bp

69

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 240

cccacag 247

70

14667

DNA

智人

misc_feature

(1)..(14667)

CFTR基因外显子19

misc_feature

(12191)..(12191)

3849 + 10 kb C-T突变位点

70

gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60

tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120

taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180

gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240

aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300

atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360

aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420

tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480

atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540

ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600

ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660

gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720

attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780

aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840

gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900

gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960

atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020

catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080

gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140

aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200

tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260

aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320

ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380

agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440

ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500

tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560

agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620

ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680

gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740

caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800

agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860

ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920

tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980

tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040

ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100

aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160

taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220

aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280

taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340

gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400

tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460

tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520

ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580

gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640

aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700

cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760

attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820

tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880

aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940

gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000

acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060

atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120

agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180

tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240

atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300

caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360

cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420

caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480

tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540

tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600

atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660

gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720

ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780

accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840

caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900

ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960

gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020

ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080

agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140

agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200

cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260

aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320

aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380

tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440

acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500

gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560

tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620

ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680

tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740

tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800

aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860

atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920

gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980

gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040

caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100

aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160

tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220

attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280

taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340

gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400

gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460

gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520

ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580

tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640

tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700

ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760

atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820

cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880

tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940

aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000

tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060

ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120

tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180

gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240

tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300

aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360

ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420

ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480

atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540

gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600

tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660

aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720

attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780

atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840

ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900

aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960

tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020

attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080

gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140

gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200

attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260

cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320

tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380

tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440

atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500

ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560

ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620

tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680

gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740

ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800

ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860

tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920

taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980

ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040

ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100

ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160

ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220

acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280

tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340

ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400

ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460

ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520

ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580

gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640

tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700

aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760

gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820

ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880

ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940

atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000

ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060

tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120

cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180

ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240

tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300

cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360

catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420

ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480

ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540

ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600

tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660

tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720

ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780

tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840

tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900

gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960

gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020

tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080

tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140

ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200

gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260

ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320

ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380

tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440

cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500

tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560

tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620

agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680

tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740

ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800

gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860

gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920

gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980

aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040

cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100

aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160

atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220

gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280

atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340

gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400

aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460

actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520

ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580

ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640

cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700

ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760

tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820

taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880

gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940

acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000

ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060

acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120

gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180

attaaaatgg cgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240

acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300

tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360

ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420

aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480

actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540

ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600

ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660

aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720

agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780

atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840

acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900

aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960

gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020

ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080

ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140

ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200

gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260

ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320

attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380

ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440

accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500

acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560

agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620

tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680

aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740

aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800

gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860

tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920

tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980

ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040

aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100

ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160

tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220

tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280

ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340

gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400

taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460

tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520

aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580

ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640

agtgatccca tcacttttac cttatag 14667

71

14667

DNA

智人

misc_feature

(1)..(14667)

含有3849 + 10 kb C-T突变的CFTR外显子19

misc_feature

(12191)..(12191)

3849 + 10 kb C-T突变

71

gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60

tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120

taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180

gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240

aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300

atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360

aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420

tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480

atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540

ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600

ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660

gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720

attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780

aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840

gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900

gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960

atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020

catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080

gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140

aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200

tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260

aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320

ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380

agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440

ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500

tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560

agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620

ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680

gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740

caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800

agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860

ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920

tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980

tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040

ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100

aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160

taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220

aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280

taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340

gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400

tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460

tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520

ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580

gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640

aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700

cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760

attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820

tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880

aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940

gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000

acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060

atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120

agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180

tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240

atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300

caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360

cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420

caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480

tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540

tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600

atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660

gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720

ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780

accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840

caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900

ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960

gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020

ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080

agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140

agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200

cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260

aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320

aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380

tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440

acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500

gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560

tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620

ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680

tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740

tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800

aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860

atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920

gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980

gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040

caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100

aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160

tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220

attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280

taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340

gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400

gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460

gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520

ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580

tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640

tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700

ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760

atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820

cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880

tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940

aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000

tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060

ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120

tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180

gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240

tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300

aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360

ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420

ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480

atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540

gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600

tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660

aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720

attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780

atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840

ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900

aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960

tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020

attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080

gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140

gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200

attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260

cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320

tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380

tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440

atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500

ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560

ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620

tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680

gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740

ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800

ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860

tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920

taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980

ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040

ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100

ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160

ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220

acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280

tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340

ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400

ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460

ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520

ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580

gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640

tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700

aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760

gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820

ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880

ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940

atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000

ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060

tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120

cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180

ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240

tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300

cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360

catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420

ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480

ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540

ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600

tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660

tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720

ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780

tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840

tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900

gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960

gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020

tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080

tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140

ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200

gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260

ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320

ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380

tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440

cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500

tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560

tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620

agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680

tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740

ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800

gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860

gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920

gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980

aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040

cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100

aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160

atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220

gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280

atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340

gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400

aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460

actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520

ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580

ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640

cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700

ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760

tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820

taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880

gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940

acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000

ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060

acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120

gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180

attaaaatgg tgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240

acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300

tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360

ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420

aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480

actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540

ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600

ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660

aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720

agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780

atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840

acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900

aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960

gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020

ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080

ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140

ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200

gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260

ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320

attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380

ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440

accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500

acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560

agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620

tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680

aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740

aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800

gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860

tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920

tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980

ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040

aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100

ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160

tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220

tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280

ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340

gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400

taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460

tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520

aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580

ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640

agtgatccca tcacttttac cttatag 14667

72

18

DNA

人工的

CFTR外显子19野生型的寡核苷酸

72

gtcttactcg ccatttta 18

73

18

DNA

人工的

CFTR外显子19 3849 + 10 kb C-T突变的寡核苷酸

misc_feature

(10)..(10)

3849 + 10 kb C-T突变

73

gtcttactca ccatttta 18

74

3733

DNA

小鼠

misc_feature

(1)..(3733)

野生型小鼠肌营养不良蛋白内含子22、外显子23和内含子

23序列

内含子

(1)..(913)

内含子 22

外显子

(914)..(1126)

外显子 23

内含子

(1127)..(3733)

内含子 23

74

gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60

tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120

gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180

ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240

agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300

tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360

tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420

caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480

tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540

ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600

taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660

acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720

tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780

atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840

accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900

atttaatttt gag gct ctg caa agt tct ttg aaa gag caa caa aat ggc 949

Ala Leu Gln Ser Ser Leu Lys Glu Gln Gln Asn Gly

1 5 10

ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997

Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro

15 20 25

tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045

Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly

30 35 40

cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093

His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu

45 50 55 60

gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146

Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln

65 70

taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206

cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266

acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326

aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386

aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446

tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506

actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566

ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626

actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686

taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746

caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806

atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866

ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926

taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986

tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046

ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106

aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166

ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226

ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286

ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346

gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406

acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466

atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526

ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586

tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646

tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706

tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766

ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826

agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886

ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946

ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006

atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066

atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126

aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186

ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246

taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306

tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366

agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426

ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486

aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546

gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606

aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666

atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726

attccag 3733

75

3733

DNA

小鼠

misc_feature

(1)..(3733)

mdx小鼠肌营养不良蛋白内含子22、外显子23和内含子

23序列

内含子

(1)..(913)

内含子 22

外显子

(914)..(1126)

外显子 23

misc_feature

(941)..(941)

mdx C-T 无义突变

内含子

(1127)..(3733)

内含子 23

75

gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60

tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120

gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180

ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240

agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300

tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360

tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420

caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480

tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540

ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600

taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660

acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720

tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780

atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840

accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900

atttaatttt gag gct ctg caa agt tct ttg aaa gag caa taa aat ggc 949

Ala Leu Gln Ser Ser Leu Lys Glu Gln Asn Gly

1 5 10

ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997

Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro

15 20 25

tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045

Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly

30 35 40

cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093

His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu

45 50 55

gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146

Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln

60 65 70

taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206

cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266

acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326

aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386

aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446

tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506

actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566

ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626

actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686

taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746

caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806

atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866

ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926

taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986

tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046

ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106

aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166

ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226

ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286

ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346

gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406

acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466

atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526

ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586

tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646

tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706

tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766

ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826

agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886

ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946

ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006

atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066

atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126

aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186

ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246

taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306

tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366

agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426

ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486

aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546

gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606

aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666

atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726

attccag 3733

76

25

DNA

人工的

诱导反义外显子23跳跃的寡核苷酸

misc_feature

(1)..(25)

诱导外显子23跳跃的寡核苷酸

76

aacctcggct tacctgaaat tttcg 25

77

1653

DNA

Hotaria parvula

77

atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360

tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600

tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660

catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720

gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780

cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840

aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900

attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960

aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020

gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080

gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140

acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200

tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260

ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320

ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380

caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt 1440

cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500

tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560

gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620

aaggccaaga agggcggaaa gatcgccgtg taa 1653

78

17578

DNA

智人

内含子

(1)..(13645)

内含子 9

外显子

(13646)..(13738)

内含子 9

内含子

(13739)..(17578)

内含子 10

78

gtgagagtgg ctggctgcgc gtggaggtgt ggggggctgc gcctggaggg gtagggctgt 60

gcctggaagg gtagggctgc gcctggaggt gcgcggttga gcgtggagtc gtgggactgt 120

gcatggaggt gtggggctcc ccgcacctga gcacccccgc ataacacccc agtcccctct 180

ggaccctctt caaggaagtt cagttcttta ttgggctctc cactacactg tgagtgccct 240

cctcaggcga gagaacgttc tggctcttct cttgcccctt cagcccctgt taatcggaca 300

gagatggcag ggctgtgtct ccacggccgg aggctctcat agtcagggca cccacagcgg 360

ttccccacct gccttctggg cagaatacac tgccacccat aggtcagcat ctccactcgt 420

gggccatctg cttaggttgg gttcctctgg attctgggga gattgggggt tctgttttga 480

tcagctgatt cttctgggag caagtgggtg ctcgcgagct ctccagcttc ctaaaggtgg 540

agaagcacag acttcggggg cctggcctgg atccctttcc ccattcctgt ccctgtgccc 600

ctcgtctggg tgcgttaggg ctgacataca aagcaccaca gtgaaagaac agcagtatgc 660

ctcctcacta gccaggtgtg ggcgggtggg tttcttccaa ggcctctctg tggccgtggg 720

tagccacctc tgtcctgcac cgctgcagtc ttccctctgt gtgtgctcct ggtagctctg 780

cgcatgctca tcttcttata agaacaccat ggcagctggg cgtagtggct cacgcctata 840

atcccagcac tttgggaggc tgaggcaggc agatcacgag gtcaggagtt cgagaccaac 900

ctgaccaaca gggtgaaacc tcgtctctac taaaaataca aaaatacctg ggcgtggtgg 960

tggtgcgcgc ctataatccc agctactcag gaggctgagg caggagaatc gcttgaaccc 1020

aggaggcaga ggttgcagtg agccgagata gtgccactgc actccagttt gagcaacaga 1080

gcgagactct gtctcaaaac aaaataaaac aaaccaaaaa aacccaccat ggcttagggc 1140

ccagcctgat gacctcattt ttcacttagt cacctctcta aaggccctgt ctccaaatag 1200

agtcacattc taaggtacgg gggtgttggg gaggggggtt agggcttcaa catgtgaatt 1260

tgcggggacc acaattcagc ccaggacccc gctcccgcca cccagcactg gggagctggg 1320

gaagggtgaa gaggaggctg ggggtgagaa ggaccacagc tcactctgag gctgcagatg 1380

tgctgggcct tctgggcact gggcctcggg gagctagggg gctttctgga accctgggcc 1440

tgcgtgtcag cttgcctccc ccacgcaggc gctctccaca ccattgaagt tcttatcact 1500

tgggtctgag cctggggcat ttggacggag ggtggccacc agtgcacatg ggcaccttgc 1560

ctcaaaccct gccacctccc cccacccagg atcccccctg cccccgaaca agcttgtgag 1620

tgcagtgtca catcccatcg ggatggaaat ggacggtcgg gttaaaaggg acgcatgtgt 1680

agaccctgcc tctgtgcatc aggcctcttt tgagagtccc tgcgtgccag gcggtgcaca 1740

gaggtggaga agactcggct gtgccccaga gcacctcctc tcatcgagga aaggacagac 1800

agtggctccc ctgtggctgt ggggacaagg gcagagctcc ctggaacaca ggagggaggg 1860

aaggaagaga acatctcaga atctccctcc tgatggcaaa cgatccgggt taaattaagg 1920

tccggccttt tcctgctcag gcatgtggag cttgtagtgg aagaggctct ctggaccctc 1980

atccaccaca gtggcctggt tagagacctt ggggaaataa ctcacaggtg acccagggcc 2040

tctgtcctgt accgcagctg agggaaactg tcctgcgctt ccactgggga caatgcgctc 2100

cctcgtctcc agactttcca gtcctcattc ggttctcgaa agtcgcctcc agaagcccca 2160

tcttgggacc accgtgactt tcattctcca gggtgcctgg ccttggtgct gcccaagacc 2220

ccagaggggc cctcactggc ctttcctgcc ttttctccca ttgcccaccc atgcaccccc 2280

atcctgctcc agcacccaga ctgccatcca ggatctcctc aagtcacata acaagcagca 2340

cccacaaggt gctcccttcc ccctagcctg aatctgctgc tccccgtctg gggttccccg 2400

cccatgcacc tctgggggcc cctgggttct gccataccct gccctgtgtc ccatggtggg 2460

gaatgtcctt ctctccttat ctcttccctt cccttaaatc caagttcagt tgccatctcc 2520

tccaggaagt cttcctggat tcccctctct cttcttaaag cccctgtaaa ctctgaccac 2580

actgagcatg tgtctgctgc tccctagtct gggccatgag tgagggtgga ggccaagtct 2640

catgcatttt tgcagccccc acaagactgt gcaggtggcc ggccctcatt gaatgcgggg 2700

ttaatttaac tcagcctctg tgtgagtgga tgattcaggt tgccagagac agaaccctca 2760

gcttagcatg ggaagtagct tccctgttga ccctgagttc atctgaggtt ggcttggaag 2820

gtgtgggcac catttggccc agttcttaca gctctgaaga gagcagcagg aatggggctg 2880

agcagggaag acaactttcc attgaaggcc cctttcaggg ccagaactgt ccctcccacc 2940

ctgcagctgc cctgcctctg cccatgaggg gtgagagtca ggcgacctca tgccaagtgt 3000

agaaaggggc agacgggagc cccaggttat gacgtcacca tgctgggtgg aggcagcacg 3060

tccaaatcta ctaaagggtt aaaggagaaa gggtgacttg acttttcttg agatattttg 3120

ggggacgaag tgtggaaaag tggcagagga cacagtcaca gcctccctta aatgccagga 3180

aagcctagaa aaattgtctg aaactaaacc tcagccataa caaagaccaa cacatgaatc 3240

tccaggaaaa aagaaaaaga aaaatgtcat acagggtcca tgcacaagag cctttaaaat 3300

gacccgctga agggtgtcag gcctcctcct cctggactgg cctgaaggct ccacgagctt 3360

ttgctgagac ctttgggtcc ctgtggcctc atgtagtacc cagtatgcag taagtgctca 3420

ataaatgttt ggctacaaaa gaggcaaagc tggcggagtc tgaagaatcc ctcaaccgtg 3480

ccggaacaga tgctaacacc aaagggaaaa gagcaggagc caagtcacgt ttgggaacct 3540

gcagaggctg aaaactgccg cagattgctg caaatcattg ggggaaaaac ggaaaacgtc 3600

tgttttcccc tttgtgcttt tctctgtttt cttctttgtg cttttctctg ttttcaggat 3660

ttgctacagt gaacatagat tgctttgggg ccccaaatgg aattattttg aaaggaaaat 3720

gcagataatc aggtggccgc actggagcac cagctgggta ggggtagaga ttgcaggcaa 3780

ggaggaggag ctgggtgggg tgccaggcag gaagagcccg taggccccgc cgatcttgtg 3840

ggagtcgtgg gtggcagtgt tccctccaga ctgtaaaagg gagcacctgg cgggaagagg 3900

gaattctttt aaacatcatt ccagtgcccg agcctcctgg acctgttgtc atcttgaggt 3960

gggcctcccc tgggtgactc tagtgtgcag cctggctgag actcagtggc cctgggttct 4020

tactgctgac acctaccctc aacctcaacc actgcggcct cctgtgcacc ctgatccagt 4080

ggctcatttt ccactttcag tcccagctct atccctattt gcagtttcca agtgcctggt 4140

cctcagtcag ctcagaccca gccaggccag cccctggttc ccacatcccc tttgccaagc 4200

tcatccccgc cctgtttggc ctgcgggagt gggagtgtgt ccagacacag agacaaagga 4260

ccagctttta aaacattttg ttggggccag gtgtggtggc tcacacctaa tcccaacacc 4320

tggggaggcc aaggcagaag gatcacttga gtccaggagt tcaagaccag cctgggcaac 4380

atagggagac cctgtctcta caattttttt tttaattagc tgggcctgtt ggcactctcc 4440

tgtagttcca gctactctag aggctgaggt gggaggactg cttgagcctg ggaggtcagg 4500

gctgcaatga gccatgttca caccactgaa cgccagcctg ggcgagaccc tgtatcaaaa 4560

aagtaaagta aaatgaatcc tgtacgttat attaaggtgc cccaaattgt acttagaagg 4620

atttcatagt tttaaatact tttgttattt aaaaaattaa atgactgcag catataaatt 4680

aggttcttaa tggaggggaa aaagagtaca agaaaagaaa taagaatcta gaaacaaaga 4740

taagagcaga aataaaccag aaaacacaac cttgcactcc taacttaaaa aaaaaaatga 4800

agaaaacaca accagtaaaa caacatataa cagcattaag agctggctcc tggctgggcg 4860

cggtggcgca tgcctgtaat cccaacactt tgggaggccg atgctggagg atcacttgag 4920

accaggagtt caaggttgca gtgagctatg atcataccac tacaccctag cctgggcaac 4980

acagtgagac tgagactcta ttaaaaaaaa aatgctggtt ccttccttat ttcattcctt 5040

tattcattca ttcagacaac atttatgggg cacttctgag caccaggctc tgtgctaaga 5100

gcttttgccc ccagggtcca ggccagggga caggggcagg tgagcagaga aacagggcca 5160

gtcacagcag caggaggaat gtaggatgga gagcttggcc aggcaaggac atgcaggggg 5220

agcagcctgc acaagtcagc aagccagaga agacaggcag acccttgttt gggacctgtt 5280

cagtggcctt tgaaaggaca gcccccaccc ggagtgctgg gtgcaggagc tgaaggagga 5340

tagtggaaca ctgcaacgtg gagctcttca gagcaaaagc aaaataaaca actggaggca 5400

gctggggcag cagagggtgt gtgttcagca ctaaggggtg tgaagcttga gcgctaggag 5460

agttcacact ggcagaagag aggttggggc agctgcaagc ctctggacat cgcccgacag 5520

gacagagggt ggtggacggt ggccctgaag agaggctcag ttcagctggc agtggccgtg 5580

ggagtgctga agcaggcagg ctgtcggcat ctgctgggga cggttaagca ggggtgaggg 5640

cccagcctca gcagcccttc ttggggggtc gctgggaaac atagaggaga actgaagaag 5700

cagggagtcc cagggtccat gcagggcgag agagaagttg ctcatgtggg gcccaggctg 5760

caggatcagg agaactgggg accctgtgac tgccagcggg gagaaggggg tgtgcaggat 5820

catgcccagg gaagggccca ggggcccaag catggggggg cctggttggc tctgagaaga 5880

tggagctaaa gtcactttct cggaggatgt ccaggccaat agttgggatg tgaagacgtg 5940

aagcagcaca gagcctggaa gcccaggatg gacagaaacc tacctgagca gtggggcttt 6000

gaaagccttg gggcgggggg tgcaatattc aagatggcca caagatggca atagaatgct 6060

gtaactttct tggttctggg ccgcagcctg ggtggctgct tccttccctg tgtgtattga 6120

tttgtttctc ttttttgaga cagagtcttg ctgggttgcc caggctggag tgcagtggtg 6180

cgatcatagc tcactgcagc cttgaagtcc tgagctcaag agatccttcc acctcagcct 6240

cctgagtagt tgggaccaca ggcttgcacc acagtgccca actaatttct tatatttttt 6300

gtagagatgg ggtttcactg tgtcgcccag gatggtcttg aactcctggg ctcaagtgat 6360

cctcctgcct cagcctcgca aattgctggg attacaggtg tgagccacca tgcccgacct 6420

tctcttttta agggcgtgtg tgtgtgtgtg tgtgtgtggg cgcactctcg tcttcacctt 6480

cccccagcct tgctctgtct ctacccagtc acctctgccc atctctccga tctgtttctc 6540

tctcctttta cccctctttc ctccctcctc atacaccact gaccattata gagaactgag 6600

tattctaaaa atacatttta tttatttatt ttgagacaga gtctcactct gtcacccagg 6660

ctggagtgca gtggtgcaat ctcggctcac tgcaacctcc gcctcccagg ttgaagcaac 6720

tctcctgcct cagcctccct agtagctggg attacaagca cacaccacca tgcctagcaa 6780

atttttatat ttttagtaga ggaggagtgt caccatgttt gccaagctgg tctcaaactc 6840

ctggcctcag gtgatctgcc taccttggtc tcccaaagtg ctgggattac aggtgtgagc 6900

caccacgcct gcccttaaaa atacattata tttaatagca aagccccagt tgtcacttta 6960

aaaagcatct atgtagaaca tttatgtgga ataaatacag tgaatttgta cgtggaatcg 7020

tttgcctctc ctcaatcagg gccagggatg caggtgagct tgggctgaga tgtcagaccc 7080

cacagtaagt ggggggcaga gccaggctgg gaccctcctc taggacagct ctgtaactct 7140

gagaccctcc aggcatcttt tcctgtacct cagtgcttct gaaaaatctg tgtgaatcaa 7200

atcattttaa aggagcttgg gttcatcact gtttaaagga cagtgtaaat aattctgaag 7260

gtgactctac cctgttattt gatctcttct ttggccagct gacttaacag gacatagaca 7320

ggttttcctg tgtcagttcc taagctgatc accttggact tgaagaggag gcttgtgtgg 7380

gcatccagtg cccaccccgg gttaaactcc cagcagagta ttgcactggg cttgctgagc 7440

ctggtgaggc aaagcacagc acagcgagca ccaggcagtg ctggagacag gccaagtctg 7500

ggccagcctg ggagccaact gtgaggcacg gacggggctg tggggctgtg gggctgcagg 7560

cttggggcca gggagggagg gctgggctct ttggaacagc cttgagagaa ctgaacccaa 7620

acaaaaccag atcaaggtct agtgagagct tagggctgct ttgggtgctc caggaaattg 7680

attaaaccaa gtggacacac acccccagcc ccacctcacc acagcctctc cttcagggtc 7740

aaactctgac cacagacatt tctcccctga ctaggagttc cctggatcaa aattgggagc 7800

ttgcaacaca tcgttctctc ccttgatggt ttttgtcagt gtctatccag agctgaagtg 7860

taatatatat gttactgtag ctgagaaatt aaatttcagg attctgattt cataatgaca 7920

accattcctc ttttctctcc cttctgtaaa tctaagattc tataaacggt gttgacttaa 7980

tgtgacaatt ggcagtagtt caggtctgct ttgtaaatac ccttgtgtct attgtaaaat 8040

ctcacaaagg cttgttgcct tttttgtggg gttagaacaa gaaaaagcca catggaaaaa 8100

aaatttcttt tttgtttttt tgtttgcttg tttttttgag acagagtttc actctgtcgc 8160

ccaggctgga gtgcagtggt gcgatctccg cccactgcaa gctccacctc ccgggttcat 8220

gctattctcc tgtctcagcc tcccaagtag ctgggactgc aggtgcccgc caccacacct 8280

ggctaatttt tttgtatttt tagtagagac ggggtttcac cgtgttagcc aggatggtct 8340

caatctcctg acctcgtcat ctgcctgcct cggcctccca aagtgctgag attacaggcg 8400

tgagccaccg tgcccggcca gaaaaaaaca tttctaagta tgtggcagat actgaattat 8460

tgcttaatgt cctttgattc atttgtttaa tttctttaat ggattagtac agaaaacaaa 8520

gttctcttcc ttgaaaaact ggtaagtttt ctttgtcaga taaggagagt taaataaccc 8580

atgacatttc cctttttgcc tcggcttcca ggaagctcaa agttaaatgt aatgatcact 8640

cttgtaatta tcagtgttga tgcccttccc ttcttctaat gttactcttt acattttcct 8700

gctttattat tgtgtgtgtt ttctaattct aagctgttcc cactcctttc tgaaagcagg 8760

caaatcttct aagccttatc cactgaaaag ttatgaataa aaaatgatcg tcaagcctac 8820

aggtgctgag gctactccag aggctgaggc cagaggacca cttgagccca ggaatttgag 8880

acctgggctg ggcagcatag caagactcta tctccattaa aactattttt ttttatttaa 8940

aaaataatcc gcaaagaagg agtttatgtg ggattcctta aaatcggagg gtggcatgaa 9000

ttgattcaaa gacttgtgca gagggcgaca gtgactcctt gagaagcagt gtgagaaagc 9060

ctgtcccacc tccttccgca gctccagcct gggctgaggc actgtcacag tgtctccttg 9120

ctggcaggag agaatttcaa cattcaccaa aaagtagtat tgtttttatt aggtttatga 9180

ggctgtagcc ttgaggacag cccaggacaa ctttgttgtc acatagatag cctgtggcta 9240

caaactctga gatctagatt cttctgcggc tgcttctgac ctgagaaagt tgcggaacct 9300

cagcgagcct cacatggcct ccttgtcctt aacgtgggga cggtgggcaa gaaaggtgat 9360

gtggcactag agatttatcc atctctaaag gaggagtgga ttgtacattg aaacaccaga 9420

gaaggaatta caaaggaaga atttgagtat ctaaaaatgt aggtcaggcg ctcctgtgtt 9480

gattgcaggg ctattcacaa tagccaagat ttggaagcaa cccaagtgtc catcaacaga 9540

caaatggata aagaaaatgt ggtgcatata cacaatggaa tactattcag ccatgaaaaa 9600

gaatgagaat ctgtcatttg aaacaacatg gatggaactg gaggacatta tgttaagtga 9660

aataagccag acagaaggac agacttcaca tgttctcaca catttgtggg agctaaaaat 9720

taaactcatg gagatagaga gtagaaggat ggttaccaga ggctgaggag ggtggagggg 9780

agcagggaga aagtagggat ggttaatggg tacaaaaacg tagttagcat gcatagatct 9840

agtattggat agcacagcag ggtgacgaca gccaacagta atttatagta catttaaaaa 9900

caactaaaag agtgtaactg gactggctaa catggtgaaa ccccgtctct actaaaaata 9960

caaaaattag ctgggcacgg tggctcacgc ctgtaatccc agcactttgg gaggccgagg 10020

cgggccgatc acgaggtcag gagatcgaga ccatcctagc taacatggtg aaaccccgtc 10080

tctactacaa atacaaaaaa aagaaaaaat tagccgggca tggtggtggg cgcctgtagt 10140

cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc ggagcttgca 10200

gtgagccgag atcgcgccac tgcactccag cctgggcgac aaggcaagat tctatctcaa 10260

aaaaataaaa ataaaataaa ataaaataat aaaataaaat aaaataaaat aaaataaaat 10320

aaataaaata aaatgtataa ttggaatgtt tataacacaa gaaatgataa atgcttgagg 10380

tgatagatac cccattcacc gtgatgtgat tattgcacaa tgtatgtctg tatctaaata 10440

tctcatgtac cccacaagta tatacaccta ctatgtaccc atataaattt aaaattaaaa 10500

aattataaaa caaaaataaa taagtaaatt aaaatgtagg ctggacaccg tggttcacgc 10560

ctgtaatccc agtgctttgt gaggctgagg tgagagaatc acttgagccc aggagtttga 10620

gaccggcctg ggtgacatag cgagacccca tcatcacaaa gaatttttaa aaattagctg 10680

ggcgtggtag cacataccgg tagttccagc tacttgggag accgaggcag gaggattgct 10740

tgagcccagg agtttaaggc tgcagtgagc tacgatggcg ccactgcatt ccagcctggg 10800

tgacagagtg agagcttgtc tctattttaa aaataataaa aagaataaat aaaaataaat 10860

taaaatgtaa atatgtgcat gttagaaaaa atacacccat cagcaaaaag ggggtaaagg 10920

agcgatttca gtcataattg gagagatgca gaataagcca gcaatgcagt ttcttttatt 10980

ttggtcaaaa aaaataagca aaacaatgtt gtaaacaccc agtgctggca gcaatgtggt 11040

gaggctggct ctctcaccag ggctcacagg gaaaactcat gcaacccttt tagaaagcca 11100

tgtggagagt tgtaccgaga ggttttagaa tatttataac tttgacccag aaattctatt 11160

ctaggactct gtgttatgaa aataacccat catatggaaa aagctccttt cagaaagagg 11220

ttcatgggag gctgtttgta tttttttttt ctttgcatca aatccagctc ctgcaggact 11280

gtttgtatta ttgaagtaca aagtggaatc aatacaaatg ttggatagca ggggaacaat 11340

attcacaaaa tggaatggga catagtatta aacatagtgc ttctgatgac cgtagaccat 11400

agacaatgct taggatatga tatcacttct tttgttgttt tttgtatttt gagacgaagt 11460

ctcattctgt cacccaggct ggagttcagt ggcgccatct cagctcactg caacctccat 11520

ctcccgggtt caagctattc tccttcctca acctcccgag tagctgggtt gcgcaccacc 11580

atgcctggct aacttttgta tttttagtac agacggggtt tcaccacgtt ggccaggctg 11640

ctcttgaact cctgacgtca ggtgatccac cagccttgac ctcccaaagt gctaggatta 11700

caggagccac tgtacccagc ctaggatatg atatcacttc ttagagcaag atacaaaatt 11760

gcatgtgcac aataattcta ccaagtatag gtatacaggg gtagttatat ataaatgaga 11820

cttcaaggaa atacaacaaa atgcaatcgt gattgtgtta gggtggtaag aaaacggttt 11880

ttgctttgat gagctctgtt ttttaaaatc gttatatttt ctaataaaaa tacatagtct 11940

tttgaaggaa cataaaagat tatgaagaaa tgagttagat attgattcct attgaagatt 12000

cagacaagta aaattaaggg gaaaaaaaac gggatgaacc agaagtcagg ctggagttcc 12060

aaccccagat ccgacagccc aggctgatgg ggcctccagg gcagtggttt ccacccagca 12120

ttctcaaaag agccactgag gtctcagtgc cattttcaag atttcggaag cggcctgggc 12180

acggctggtc cttcactggg atcaccactt ggcaattatt tacacctgag acgaatgaaa 12240

accagagtgc tgagattaca ggcatggtgg cttacgcttg taatcggctt tgggaagccg 12300

aggtgggctg attgcttgag cccaggagtt tcaaactatc ctggacaaca tagcatgacc 12360

tcgtctctac aaaaaataca aaaaatttgc caggtgtggt ggcatgtgcc tgtggtccca 12420

gctacttggg aggctgaagt aggagaatcc cctgagccct gggaagtcga ggctgcactg 12480

agccgtgatg gtgtcactgc actccagcct gggtgacaaa gtgagaccct atctcacaaa 12540

gaaaaaaaac aaaacaaaaa acccaaagca cactgtttcc actgtttcca gagttcctga 12600

gaggaaaggt caccgggtga ggaagacgtt ctcactgatc tggcagagaa aatgtccagt 12660

ttttccaact ccctaaacca tggttttcta tttcatagtt cttaggcaaa ttggtaaaaa 12720

tcatttctca tcaaaacgct gatattttca cacctccctg gtgtctgcag aaagaacctt 12780

ccagaaatgc agtcgtggga gacccatcca ggccacccct gcttatggaa gagctgagaa 12840

aaagccccac gggagcattt gctcagcttc cgttacgcac ctagtggcat tgtgggtggg 12900

agagggctgg tgggtggatg gaaggagaag gcacagcccc cccttgcagg gacagagccc 12960

tcgtacagaa gggacacccc acatttgtct tccccacaaa gcggcctgtg tcctgcctac 13020

ggggtcaggg cttctcaaac ctggctgtgt gtcagaatca ccaggggaac ttttcaaaac 13080

tagagagact gaagccagac tcctagattc taattctagg tcagggctag gggctgagat 13140

tgtaaaaatc cacaggtgat tctgatgccc ggcaggcttg agaacagccg cagggagttc 13200

tctgggaatg tgccggtggg tctagccagg tgtgagtgga gatgccgggg aacttcctat 13260

tactcactcg tcagtgtggc cgaacacatt tttcacttga cctcaggctg gtgaacgctc 13320

ccctctgggg ttcaggcctc acgatgccat ccttttgtga agtgaggacc tgcaatccca 13380

gcttcgtaaa gcccgctgga aatcactcac acttctggga tgccttcaga gcagccctct 13440

atcccttcag ctcccctggg atgtgactcg acctcccgtc actccccaga ctgcctctgc 13500

caagtccgaa agtggaggca tccttgcgag caagtaggcg ggtccagggt ggcgcatgtc 13560

actcatcgaa agtggaggcg tccttgcgag caagcaggcg ggtccagggt ggcgtgtcac 13620

tcatcctttt ttctggctac caaag gtg cag ata att aat aag aag ctg gat 13672

Val Gln Ile Ile Asn Lys Lys Leu Asp

1 5

ctt agc aac gtc cag tcc aag tgt ggc tca aag gat aat atc aaa cac 13720

Leu Ser Asn Val Gln Ser Lys Cys Gly Ser Lys Asp Asn Ile Lys His

10 15 20 25

gtc ccg gga ggc ggc agt gtgagtacct tcacacgtcc catgcgccgt 13768

Val Pro Gly Gly Gly Ser

30

gctgtggctt gaattattag gaagtggtgt gagtgcgtac acttgcgaga cactgcatag 13828

aataaatcct tcttgggctc tcaggatctg gctgcgacct ctgggtgaat gtagcccggc 13888

tccccacatt cccccacacg gtccactgtt cccagaagcc ccttcctcat attctaggag 13948

ggggtgtccc agcatttctg ggtcccccag cctgcgcagg ctgtgtggac agaatagggc 14008

agatgacgga ccctctctcc ggaccctgcc tgggaagctg agaataccca tcaaagtctc 14068

cttccactca tgcccagccc tgtccccagg agccccatag cccattggaa gttgggctga 14128

aggtggtggc acctgagact gggctgccgc ctcctccccc gacacctggg caggttgacg 14188

ttgagtggct ccactgtgga caggtgaccc gtttgttctg atgagcggac accaaggtct 14248

tactgtcctg ctcagctgct gctcctacac gttcaaggca ggagccgatt cctaagcctc 14308

cagcttatgc ttagcctgcg ccaccctctg gcagagactc cagatgcaaa gagccaaacc 14368

aaagtgcgac aggtccctct gcccagcgtt gaggtgtggc agagaaatgc tgcttttggc 14428

ccttttagat ttggctgcct cttgccagga gtggtggctc gtgcctgtaa ttccagcact 14488

ttgggagact aaggcgggag gttcgcttga gcccaggagt tcaagaccag cctgggcaac 14548

aatgagaccc ctgtgtctac aaaaagaatt aaaattagcc aggtgtggtg gcacgcacct 14608

gtagtcccag ctacttggga ggctgaggtg ggaggattgc ctgagtccgg gaggcggaag 14668

ttgcaaggag ccatgatcgc gccactgcac ttcaacctag gcaacagagt gagactttgt 14728

ctcaaaaaac aatcatataa taattttaaa ataaatagat ttggcttcct ctaaatgtcc 14788

ccggggactc cgtgcatctt ctgtggagtg tctccgtgag attcgggact cagatcctca 14848

agtgcaactg acccacccga taagctgagg cttcatcatc ccctggccgg tctatgtcga 14908

ctgggcaccc gaggctcctc tcccaccagc tctcttggtc agctgaaagc aaactgttaa 14968

caccctgggg agctggacgt atgagaccct tggggtggga ggcgttgatt tttgagagca 15028

atcacctggc cctggctggc agtaccggga cactgctgtg gctccggggt gggctgtctc 15088

cagaaaatgc ctggcctgag gcagccaccc gcatccagcc cagagggttt attcttgcaa 15148

tgtgctgctg cttcctgccc tgagcacctg gatcccggct tctgccctga ggccccttga 15208

gtcccacagg tagcaagcgc ttgccctgcg gctgctgcat ggggctaact aacgcttcct 15268

caccagtgtc tgctaagtgt ctcctctgtc tcccacgccc tgctctcctg tccccccagt 15328

ttgtctgctg tgaggggaca gaagaggtgt gtgccgcccc cacccctgcc cgggcccttg 15388

ttcctgggat tgctgttttc agctgtttga gctttgatcc tggttctctg gcttcctcaa 15448

agtgagctcg gccagaggag gaaggccatg tgctttctgg ttgaagtcaa gtctggtgcc 15508

ctggtggagg ctgtgctgct gaggcggagc tggggagaga gtgcacacgg gctgcgtggc 15568

caacccctct gggtagctga tgcccaaaga cgctgcagtg cccaggacat ctgggacctc 15628

cctggggccc gcccgtgtgt cccgcgctgt gttcatctgc gggctagcct gtgacccgcg 15688

ctgtgctcgt ctgcgggcta gcctgtgtcc cgcgctctgc ttgtctgcgg tctagcctgt 15748

gacctggcag agagccacca gatgtcccgg gctgagcact gccctctgag caccttcaca 15808

ggaagccctt ctcctggtga gaagagatgc cagcccctgg catctggggg cactggatcc 15868

ctggcctgag ccctagcctc tccccagcct gggggcccct tcccagcagg ctggccctgc 15928

tccttctcta cctgggaccc ttctgcctcc tggctggacc ctggaagctc tgcagggcct 15988

gctgtccccc tccctgccct ccaggtatcc tgaccaccgg ccctggctcc cactgccatc 16048

cactcctctc ctttctggcc gttccctggt ccctgtccca gcccccctcc ccctctcacg 16108

agttacctca cccaggccag agggaagagg gaaggaggcc ctggtcatac cagcacgtcc 16168

tcccacctcc ctcggccctg gtccaccccc tcagtgctgg cctcagagca cagctctctc 16228

caagccaggc cgcgcgccat ccatcctccc tgtcccccaa cgtccttgcc acagatcatg 16288

tccgccctga cacacatggg tctcagccat ctctgcccca gttaactccc catccataaa 16348

gagcacatgc cagccgacac caaaataatt cgggatggtt ccagtttaga cctaagtgga 16408

aggagaaacc accacctgcc ctgcaccttg ttttttggtg accttgataa accatcttca 16468

gccatgaagc cagctgtctc ccaggaagct ccagggcggt gcttcctcgg gagctgactg 16528

ataggtggga ggtggctgcc cccttgcacc ctcaggtgac cccacacaag gccactgctg 16588

gaggccctgg ggactccagg aatgtcaatc agtgacctgc cccccaggcc ccacacagcc 16648

atggctgcat agaggcctgc ctccaaggga cctgtctgtc tgccactgtg gagtccctac 16708

agcgtgcccc ccacagggga gctggttctt tgactgagat cagctggcag ctcagggtca 16768

tcattcccag agggagcggt gccctggagg ccacaggcct cctcatgtgt gtctgcgtcc 16828

gctcgagctt actgagacac taaatctgtt ggtttctgct gtgccaccta cccaccctgt 16888

tggtgttgct ttgttcctat tgctaaagac aggaatgtcc aggacactga gtgtgcaggt 16948

gcctgctggt tctcacgtcc gagctgctga actccgctgg gtcctgctta ctgatggtct 17008

ttgctctagt gctttccagg gtccgtggaa gcttttcctg gaataaagcc cacgcatcga 17068

ccctcacagc gcctcccctc tttgaggccc agcagatacc ccactcctgc ctttccagca 17128

agatttttca gatgctgtgc atactcatca tattgatcac ttttttcttc atgcctgatt 17188

gtgatctgtc aatttcatgt caggaaaggg agtgacattt ttacacttaa gcgtttgctg 17248

agcaaatgtc tgggtcttgc acaatgacaa tgggtccctg tttttcccag aggctctttt 17308

gttctgcagg gattgaagac actccagtcc cacagtcccc agctcccctg gggcagggtt 17368

ggcagaattt cgacaacaca tttttccacc ctgactagga tgtgctcctc atggcagctg 17428

ggaaccactg tccaataagg gcctgggctt acacagctgc ttctcattga gttacaccct 17488

taataaaata atcccatttt atcctttttg tctctctgtc ttcctctctc tctgcctttc 17548

ctcttctctc tcctcctctc tcatctccag 17578

79

18

DNA

人工的

合成寡核苷酸

79

tatctgcacc tttggtag 18

80

21

DNA

人工的

合成寡核苷酸

80

tgaaggtact cacactgccg c 21

81

20

DNA

人工的

向导RNA

81

tgcaaaaacc caaaatattt 20

82

20

DNA

人工的

向导RNA

82

aaaatatttt agctcctact 20

83

20

DNA

人工的

向导RNA

83

cagagtaaca gtctgagtag 20

84

20

DNA

人工的

向导RNA

84

taagggatat ttgttcttac 20

85

20

DNA

人工的

向导RNA

85

ctaagggata tttgttctta 20

86

20

DNA

人工的

向导RNA

86

tgttcttaca ggcaacaatg 20

87

20

DNA

人工的

向导RNA

87

tgtatgcttt tctgttaaag 20

88

20

DNA

人工的

向导RNA

88

atgtgtatgc ttttctgtta 20

89

20

DNA

人工的

向导RNA

89

gtgtatgctt ttctgttaaa 20

90

20

DNA

人工的

向导RNA

90

ttgccttttt ggtatcttac 20

91

20

DNA

人工的

向导RNA

91

tttgcctttt tggtatctta 20

92

20

DNA

人工的

向导RNA

92

cgctgcccaa tgccatcctg 20

93

20

DNA

人工的

向导RNA

93

atttattttt ccttttattc 20

94

20

DNA

人工的

向导RNA

94

tttcctttta ttctagttga 20

95

20

DNA

人工的

向导RNA

95

tgattctgaa ttctttcaac 20

96

20

DNA

人工的

向导RNA

96

atccatatgc ttttacctgc 20

97

20

DNA

人工的

向导RNA

97

gatccatatg cttttacctg 20

98

20

DNA

人工的

向导RNA

98

cagatctgtc aaatcgcctg 20

99

20

DNA

人工的

向导RNA

99

ttattcttct ttctccaggc 20

100

20

DNA

人工的

向导RNA

100

aattttattc ttctttctcc 20

101

20

DNA

人工的

向导RNA

101

caattttatt cttctttctc 20

102

20

DNA

人工的

向导RNA

102

gttttaaaat ttttatatta 20

103

20

DNA

人工的

向导RNA

103

ttttatatta cagaatataa 20

104

20

DNA

人工的

向导RNA

104

atattacaga atataaaaga 20

105

20

DNA

人工的

向导RNA

105

tgtgtatgtg tatgtgtttt 20

106

20

DNA

人工的

向导RNA

106

tatgtgtatg tgttttaggc 20

107

20

DNA

人工的

向导RNA

107

ctattccagt caaataggtc 20

108

20

DNA

人工的

向导RNA

108

gtgtagtgtt aatgtgctta 20

109

20

DNA

人工的

向导RNA

109

ggacttctta tctggatagg 20

110

20

DNA

人工的

向导RNA

110

taggtggtat caacatctgt 20

111

20

DNA

人工的

向导RNA

111

tgaaaattta tttccacatg 20

112

20

DNA

人工的

向导RNA

112

gaaaatttat ttccacatgt 20

113

20

DNA

人工的

向导RNA

113

ttacattttt gacctacatg 20

114

20

DNA

人工的

向导RNA

114

aaagaaaatc acagaaacca 20

115

20

DNA

人工的

向导RNA

115

aaaatcacag aaaccaaggt 20

116

20

DNA

人工的

向导RNA

116

ggtatctttg atactaacct 20

117

20

DNA

人工的

向导RNA

117

tatgtgttac ctacccttgt 20

118

20

DNA

人工的

向导RNA

118

aaatgtacaa ggaccgacaa 20

119

20

DNA

人工的

向导RNA

119

gtacaaggac cgacaagggt 20

120

20

DNA

人工的

向导RNA

120

tgcactattc tcaacaggta 20

121

20

DNA

人工的

向导RNA

121

tcaaatgcac tattctcaac 20

122

20

DNA

人工的

向导RNA

122

ctttacacac tttacctgtt 20

123

20

DNA

人工的

向导RNA

123

atgctctcat ccatagtcat 20

124

20

DNA

人工的

向导RNA

124

tctcatccat agtcataggt 20

125

20

DNA

人工的

向导RNA

125

catccatagt cataggtaag 20

126

20

DNA

人工的

向导RNA

126

tgaacatttg gtcctttgca 20

127

20

DNA

人工的

向导RNA

127

tctgaacatt tggtcctttg 20

128

20

DNA

人工的

向导RNA

128

tctcgctcac tcaccctgca 20

129

20

DNA

人工的

向导RNA

129

ggcacagcaa tagatctccg 20

130

20

DNA

人工的

向导RNA

130

taagaactct gaatgtccgc 20

131

20

DNA

人工的

向导RNA

131

gttcttctga tcaggttgaa 20

132

20

DNA

人工的

向导RNA

132

tcacgtacct gagagatcct 20

133

20

DNA

人工的

向导RNA

133

gaatagccac agggcccgag 20

134

20

DNA

人工的

向导RNA

134

tgaagccttg ataaagatac 20

135

20

DNA

人工的

向导RNA

135

cagatatgag ggtgggagaa 20

136

20

DNA

人工的

向导RNA

136

caggggaatg ggttcctggg 20

137

20

DNA

人工的

向导RNA

137

cccctccctg aactcacact 20

138

16

DNA

人工的

结合调控序列的寡核苷酸

138

gtactcacct gccctc 16

139

16

DNA

人工的

结合调控序列的寡核苷酸

139

gaacttacct cggcac 16

140

16

DNA

人工的

结合调控序列的寡核苷酸

140

ggactcacct agtcag 16

141

16

DNA

人工的

结合调控序列的寡核苷酸

141

gcacttacct attggc 16

142

16

DNA

人工的

结合调控序列的寡核苷酸

142

gctattacct taaccc 16

143

247

DNA

人工的

调控序列

143

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgagggcagg tgagtacaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

144

247

DNA

人工的

调控序列

144

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgtgccgagg taagttcaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

145

247

DNA

人工的

调控序列

145

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tctgactagg tgagtccaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

146

247

DNA

人工的

调控序列

146

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgccaatagg taagtgcaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

147

247

DNA

人工的

调控序列

147

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

148

247

DNA

人工的

调控序列

148

gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60

tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120

accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat 180

ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240

cccacag 247

149

16

DNA

人工的

结合调控序列的寡核苷酸

149

gctattgcct taaccc 16

150

1053

PRT

金黄色葡萄球菌

150

Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys

1010 1015 1020

Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu

1025 1030 1035

Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1040 1045 1050

151

1307

PRT

发酵氨基酸球菌(Acidaminococcus fermentans)

151

Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln

20 25 30

Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys

35 40 45

Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln

50 55 60

Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile

65 70 75 80

Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile

85 90 95

Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly

100 105 110

Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile

115 120 125

Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys

130 135 140

Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg

145 150 155 160

Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg

165 170 175

Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg

180 185 190

Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe

195 200 205

Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn

210 215 220

Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val

225 230 235 240

Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp

245 250 255

Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu

260 265 270

Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn

275 280 285

Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro

290 295 300

Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu

305 310 315 320

Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr

325 330 335

Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu

340 345 350

Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His

355 360 365

Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr

370 375 380

Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys

385 390 395 400

Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu

405 410 415

Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser

420 425 430

Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala

435 440 445

Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys

450 455 460

Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu

465 470 475 480

Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe

485 490 495

Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser

500 505 510

Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val

515 520 525

Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp

530 535 540

Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn

545 550 555 560

Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys

565 570 575

Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys

580 585 590

Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys

595 600 605

Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr

610 615 620

Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys

625 630 635 640

Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln

645 650 655

Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala

660 665 670

Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr

675 680 685

Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr

690 695 700

Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His

705 710 715 720

Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu

725 730 735

Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys

740 745 750

Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu

755 760 765

Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln

770 775 780

Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His

785 790 795 800

Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr

805 810 815

Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His

820 825 830

Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn

835 840 845

Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe

850 855 860

Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln

865 870 875 880

Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu

885 890 895

Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg

900 905 910

Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu

915 920 925

Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu

930 935 940

Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val

945 950 955 960

Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile

965 970 975

His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu

980 985 990

Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu

995 1000 1005

Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu

1010 1015 1020

Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly

1025 1030 1035

Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala

1040 1045 1050

Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro

1055 1060 1065

Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe

1070 1075 1080

Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu

1085 1090 1095

Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe

1100 1105 1110

Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly

1115 1120 1125

Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn

1130 1135 1140

Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys

1145 1150 1155

Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr

1160 1165 1170

Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu

1175 1180 1185

Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu

1190 1195 1200

Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu

1205 1210 1215

Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly

1220 1225 1230

Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys

1235 1240 1245

Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp

1250 1255 1260

Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu

1265 1270 1275

Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile

1280 1285 1290

Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn

1295 1300 1305

152

984

PRT

空肠弯曲菌

152

Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp

1 5 10 15

Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe

20 25 30

Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg

35 40 45

Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg

50 55 60

Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr

65 70 75 80

Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly

85 90 95

Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu

100 105 110

Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg

115 120 125

Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala

130 135 140

Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln

145 150 155 160

Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu

165 170 175

Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu

180 185 190

Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe

195 200 205

Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu

210 215 220

Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser

225 230 235 240

His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro

245 250 255

Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile

260 265 270

Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys

275 280 285

Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu

290 295 300

Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu

305 310 315 320

Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys

325 330 335

Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu

340 345 350

Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu

355 360 365

Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser

370 375 380

Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala

385 390 395 400

Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu

405 410 415

Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys

420 425 430

Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr

435 440 445

Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn

450 455 460

Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu

465 470 475 480

Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys

485 490 495

Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys

500 505 510

Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg

515 520 525

Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile

530 535 540

Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile

545 550 555 560

Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu

565 570 575

Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu

580 585 590

Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala

595 600 605

Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr

610 615 620

Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr

625 630 635 640

Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp

645 650 655

Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln

660 665 670

Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser

675 680 685

Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His

690 695 700

Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser

705 710 715 720

Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser

725 730 735

Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys

740 745 750

Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp

755 760 765

Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser

770 775 780

Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln

785 790 795 800

Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys

805 810 815

Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg

820 825 830

Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro

835 840 845

Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val

850 855 860

Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu

865 870 875 880

Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile

885 890 895

Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe

900 905 910

Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe

915 920 925

Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu

930 935 940

Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe

945 950 955 960

Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe

965 970 975

Arg Gln Arg Glu Asp Phe Lys Lys

980

153

9

PRT

人工的

结构基序

153

Leu Ala Gly Leu Ile Asp Ala Asp Gly

1 5

154

887

PRT

格氏嗜盐碱杆菌

154

Met Thr Val Ile Asp Leu Asp Ser Thr Thr Thr Ala Asp Glu Leu Thr

1 5 10 15

Ser Gly His Thr Tyr Asp Ile Ser Val Thr Leu Thr Gly Val Tyr Asp

20 25 30

Asn Thr Asp Glu Gln His Pro Arg Met Ser Leu Ala Phe Glu Gln Asp

35 40 45

Asn Gly Glu Arg Arg Tyr Ile Thr Leu Trp Lys Asn Thr Thr Pro Lys

50 55 60

Asp Val Phe Thr Tyr Asp Tyr Ala Thr Gly Ser Thr Tyr Ile Phe Thr

65 70 75 80

Asn Ile Asp Tyr Glu Val Lys Asp Gly Tyr Glu Asn Leu Thr Ala Thr

85 90 95

Tyr Gln Thr Thr Val Glu Asn Ala Thr Ala Gln Glu Val Gly Thr Thr

100 105 110

Asp Glu Asp Glu Thr Phe Ala Gly Gly Glu Pro Leu Asp His His Leu

115 120 125

Asp Asp Ala Leu Asn Glu Thr Pro Asp Asp Ala Glu Thr Glu Ser Asp

130 135 140

Ser Gly His Val Met Thr Ser Phe Ala Ser Arg Asp Gln Leu Pro Glu

145 150 155 160

Trp Thr Leu His Thr Tyr Thr Leu Thr Ala Thr Asp Gly Ala Lys Thr

165 170 175

Asp Thr Glu Tyr Ala Arg Arg Thr Leu Ala Tyr Thr Val Arg Gln Glu

180 185 190

Leu Tyr Thr Asp His Asp Ala Ala Pro Val Ala Thr Asp Gly Leu Met

195 200 205

Leu Leu Thr Pro Glu Pro Leu Gly Glu Thr Pro Leu Asp Leu Asp Cys

210 215 220

Gly Val Arg Val Glu Ala Asp Glu Thr Arg Thr Leu Asp Tyr Thr Thr

225 230 235 240

Ala Lys Asp Arg Leu Leu Ala Arg Glu Leu Val Glu Glu Gly Leu Lys

245 250 255

Arg Ser Leu Trp Asp Asp Tyr Leu Val Arg Gly Ile Asp Glu Val Leu

260 265 270

Ser Lys Glu Pro Val Leu Thr Cys Asp Glu Phe Asp Leu His Glu Arg

275 280 285

Tyr Asp Leu Ser Val Glu Val Gly His Ser Gly Arg Ala Tyr Leu His

290 295 300

Ile Asn Phe Arg His Arg Phe Val Pro Lys Leu Thr Leu Ala Asp Ile

305 310 315 320

Asp Asp Asp Asn Ile Tyr Pro Gly Leu Arg Val Lys Thr Thr Tyr Arg

325 330 335

Pro Arg Arg Gly His Ile Val Trp Gly Leu Arg Asp Glu Cys Ala Thr

340 345 350

Asp Ser Leu Asn Thr Leu Gly Asn Gln Ser Val Val Ala Tyr His Arg

355 360 365

Asn Asn Gln Thr Pro Ile Asn Thr Asp Leu Leu Asp Ala Ile Glu Ala

370 375 380

Ala Asp Arg Arg Val Val Glu Thr Arg Arg Gln Gly His Gly Asp Asp

385 390 395 400

Ala Val Ser Phe Pro Gln Glu Leu Leu Ala Val Glu Pro Asn Thr His

405 410 415

Gln Ile Lys Gln Phe Ala Ser Asp Gly Phe His Gln Gln Ala Arg Ser

420 425 430

Lys Thr Arg Leu Ser Ala Ser Arg Cys Ser Glu Lys Ala Gln Ala Phe

435 440 445

Ala Glu Arg Leu Asp Pro Val Arg Leu Asn Gly Ser Thr Val Glu Phe

450 455 460

Ser Ser Glu Phe Phe Thr Gly Asn Asn Glu Gln Gln Leu Arg Leu Leu

465 470 475 480

Tyr Glu Asn Gly Glu Ser Val Leu Thr Phe Arg Asp Gly Ala Arg Gly

485 490 495

Ala His Pro Asp Glu Thr Phe Ser Lys Gly Ile Val Asn Pro Pro Glu

500 505 510

Ser Phe Glu Val Ala Val Val Leu Pro Glu Gln Gln Ala Asp Thr Cys

515 520 525

Lys Ala Gln Trp Asp Thr Met Ala Asp Leu Leu Asn Gln Ala Gly Ala

530 535 540

Pro Pro Thr Arg Ser Glu Thr Val Gln Tyr Asp Ala Phe Ser Ser Pro

545 550 555 560

Glu Ser Ile Ser Leu Asn Val Ala Gly Ala Ile Asp Pro Ser Glu Val

565 570 575

Asp Ala Ala Phe Val Val Leu Pro Pro Asp Gln Glu Gly Phe Ala Asp

580 585 590

Leu Ala Ser Pro Thr Glu Thr Tyr Asp Glu Leu Lys Lys Ala Leu Ala

595 600 605

Asn Met Gly Ile Tyr Ser Gln Met Ala Tyr Phe Asp Arg Phe Arg Asp

610 615 620

Ala Lys Ile Phe Tyr Thr Arg Asn Val Ala Leu Gly Leu Leu Ala Ala

625 630 635 640

Ala Gly Gly Val Ala Phe Thr Thr Glu His Ala Met Pro Gly Asp Ala

645 650 655

Asp Met Phe Ile Gly Ile Asp Val Ser Arg Ser Tyr Pro Glu Asp Gly

660 665 670

Ala Ser Gly Gln Ile Asn Ile Ala Ala Thr Ala Thr Ala Val Tyr Lys

675 680 685

Asp Gly Thr Ile Leu Gly His Ser Ser Thr Arg Pro Gln Leu Gly Glu

690 695 700

Lys Leu Gln Ser Thr Asp Val Arg Asp Ile Met Lys Asn Ala Ile Leu

705 710 715 720

Gly Tyr Gln Gln Val Thr Gly Glu Ser Pro Thr His Ile Val Ile His

725 730 735

Arg Asp Gly Phe Met Asn Glu Asp Leu Asp Pro Ala Thr Glu Phe Leu

740 745 750

Asn Glu Gln Gly Val Glu Tyr Asp Ile Val Glu Ile Arg Lys Gln Pro

755 760 765

Gln Thr Arg Leu Leu Ala Val Ser Asp Val Gln Tyr Asp Thr Pro Val

770 775 780

Lys Ser Ile Ala Ala Ile Asn Gln Asn Glu Pro Arg Ala Thr Val Ala

785 790 795 800

Thr Phe Gly Ala Pro Glu Tyr Leu Ala Thr Arg Asp Gly Gly Gly Leu

805 810 815

Pro Arg Pro Ile Gln Ile Glu Arg Val Ala Gly Glu Thr Asp Ile Glu

820 825 830

Thr Leu Thr Arg Gln Val Tyr Leu Leu Ser Gln Ser His Ile Gln Val

835 840 845

His Asn Ser Thr Ala Arg Leu Pro Ile Thr Thr Ala Tyr Ala Asp Gln

850 855 860

Ala Ser Thr His Ala Thr Lys Gly Tyr Leu Val Gln Thr Gly Ala Phe

865 870 875 880

Glu Ser Asn Val Gly Phe Leu

885



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有