调控的基因编辑系统【掌桥专利】 | 您所在的位置:网站首页 › 基因cc2d2a › 调控的基因编辑系统【掌桥专利】 |
优先权声明 本申请根据35U.S.C.§119(e)要求于2018年10月9日提交的美国临时申请第62/743,317号和于2019年7月3日提交的美国临时申请第62/870,427号的权益,其全部内容通过引用以其整体并入本文。 有关序列表的电子递交的声明 根据37C.F.R.§1.821提交了ASCII文本格式的序列表,命名为5470-858WO_ST25.txt,大小为371,885字节,于2019年10月8日生成并通过EFS-Web递交,代替纸质副本。特此将该序列表以引用的方式并入本文的说明书中作为其公开内容。 技术领域 本发明涉及用于调控基因编辑的组合物及其使用方法。 发明背景 基因组测序技术和分析方法的最新进展已经显著加速了对与多种生物学功能和疾病有关的遗传因子进行分类和映射作图的能力。精确靶向基因组的能力将通过允许个别遗传元件的选择性改变来允许因果遗传变异的反向工程化,并促进合成生物学、生物技术和医学应用。尽管已经在基因组编辑技术方面取得了进展,但是已经发现,在基因编辑期间可能发生大量脱靶(例如,意外的突变),这限制了该方法作为治疗方案。因此,需要一种针对其靶标具有更高的特异性和可靠性的更精确的基因组编辑系统。 内源基因表达在几个转录后水平上被进一步调控,这些水平可能是探索外源基因表达的更精确控制的领域。例如,RNA的产生受转录速率控制,但功能性RNA需要正确剪接,然后才能产生正确的基因产物。通过调控转基因RNA的剪接,可以控制基因产物的产生。本发明提供了用于在细胞中精确控制基因组编辑系统的表达的组合物和方法,从而降低了脱靶效应并增加其特异性。 发明内容 本发明提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有你想要改变的基因序列(例如,靶基因序列)的细胞中导入:a)包含编码核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其编码序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从前体mRNA信息中被剪接时,产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和b)结合所述调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少所述外显子并编码对靶基因的基因编辑起作用的核酸酶的mRNA。在一个实施方案中,该系统还包含能够结合靶基因序列的gRNA。 在此方面的一个实施方案中,核酸酶是CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶或转录激活因子样效应物核酸酶。在此方面的一个实施方案中,核酸酶是核酸内切酶或核酸外切酶。 可以使用本文所述的系统和方法调控任何基因。例如,在一个实施方案中,待调控的基因是选自由以下组成的组的疾病或病症的疾病相关基因:肌萎缩性侧索硬化症;内毒素血症;动脉粥样硬化性血管疾病,即冠状动脉疾病;支架再狭窄;颈动脉代谢性疾病;中风;急性心肌梗死;心力衰竭;外周动脉疾病;肢体缺血;静脉移植失败;AV内瘘失败(AVfistula failure);克罗恩病;溃疡性结肠炎;回肠炎和肠炎;阴道炎;银屑病和炎症性皮肤病如皮炎;湿疹;特应性皮炎;过敏性接触性皮炎;荨麻疹;血管炎;脊柱关节病(spondyloarthropathies);硬皮病;呼吸道过敏性疾病如哮喘;过敏性鼻炎;超敏性肺病;关节炎(例如,类风湿性关节炎和银屑病性关节炎);湿疹;牛皮癣;骨关节炎;多发性硬化;系统性红斑狼疮;糖尿病;肾小球肾炎;移植排斥(包括同种异体移植排斥和移植物抗宿主病)或工程化组织的排斥;传染病;肌炎;炎性CNS病症;中风;闭合性脑损伤(closed-headinjuries);神经退行性疾病;阿尔茨海默病;脑炎;脑膜炎;骨质疏松;痛风;肝炎;肝静脉闭塞病(VOD);出血性膀胱炎;肾炎;脓毒症;结节病;结膜炎;耳炎;慢性阻塞性肺病;鼻窦炎;贝赫切特综合征;移植物抗肿瘤效应;粘膜炎;阑尾炎;阑尾破裂;腹膜炎;主动脉瓣疾病;二尖瓣疾病;雷特综合征;结节性硬化症;苯丙酮尿症;斯-李-奥(Smith-Lemli-Opitz)综合征和脆性X综合征;帕金森病;Aicardi-Goutières综合征;亚历山大病;Allan-Hemdon-Dudley综合征;POLG相关病症;α-甘露糖苷贮积症(II型和III型); 在一个实施方案中,被调控的基因是肌营养不良蛋白(dystrophin)基因。肌营养不良蛋白基因位于X染色体上,且该基因的突变可导致各种疾病状态,例如杜氏(Duchenne)肌营养不良、Becker型肌营养不良、X连锁扩张型心肌病和家族性扩张型心肌病。在一个实施方案中,肌营养不良蛋白基因在通常带有导致所述疾病的突变(例如,1、6、7、8、23、43、44、45、46、50、51、52、53或55)的外显子处被靶向。 在一个实施方案中,存在gRNA。例如,TGCAAAAACCCAAAATATTT(SEQ ID NO:81);AAAATATTTTAGCTCCTACT(SEQ ID NO:82);CAGAGTAACAGTCTGAGTAG(SEQ ID NO:83);TAAGGGATATTTGTTCTTAC(SEQ ID NO:84);CTAAGGGATATT TGTTCT TA(SEQ ID NO:85);和TGTT CT TACAGGCAACAATG(SEQ ID NO:86)。本文例如在表1中提供了其他示例性gRNA。
在一个实施方案中,被调控的基因是疾病或疼痛基因。本文所述的基因编辑系统可用于改变或调控与疾病(例如,克罗恩病或神经性疼痛,例如与周围神经系统或中枢神经系统相关的疼痛)相关的基因。例如,可以使用本文所述的基因编辑系统抑制在疼痛患者的背根神经节中异常表达(例如,过表达、或低表达)的基因,或调控有害刺激转导、电压门控钠通道(例如,Ca2+通道、K+通道、Na+通道)、NMDA受体、配体门控离子通道、Mas相关G蛋白偶联受体(Mrgprs)的功能或为上述功能所需的基因以治疗、改善、抑制或减少神经性疼痛。可使用本文所述的基因编辑系统抑制以治疗、改善、抑制或减轻神经性疼痛的示例性基因包括但不限于Navl.l、Nav1.2、Nav1.3、Nav1.4、Nav1.5、Nav1.6、Nav1.7、Nav1.8和Nav1.9、血管紧张素II的2型受体、辣椒素受体-1(VR-1)、酪氨酸受体激酶A(TrkA)、缓激肽受体、CSF1-DAP12途径成员(例如,CSF1、CSFR1或DAP12)。 在一个实施方案中,具有降低的脱靶效应的用于编辑与神经性疼痛相关的基因(例如,改变至少一种基因产物的表达)的系统包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子从mRNA信息中被剪接以产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;b)结合神经性疼痛相关基因(例如,Nav 1.8)的gRNA;和c)结合调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少所述外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。 在一个实施方案中,所描述的发明的gRNA针对Nav 1.8,以沉默Nav1.8。靶向Nav1.8的示例性gRNA包括但不限于表2中所列的gRNA。
在一个实施方案中,所描述的发明的gRNA针对转录起始位点(TSS)上游的前200bp以激活Nav1.8。靶向Nav 1.8的示例性gRNA包括但不限于表3中所列的gRNA。
在此方面和本文所述的所有方面的一个实施方案中,调控核酸序列是β珠蛋白突变型内含子(mutant intron)。 在此方面和本文所述的所有方面的一个实施方案中,系统包含至少两个调控核酸序列。 在此方面和本文所述的所有方面的一个实施方案中,调控核酸序列包含选自由以下组成的组的序列:SEQ ID NO:18(IVS2-654内含子C-T)、SEQ ID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:51(具有657G突变的IVS2-654内含子)、SEQ ID NO:52(具有658T突变的IVS2-654内含子)、SEQ ID NO:20(具有657GT突变的IVS2-654内含子)、SEQ IDNO:53(具有200bp缺失的IVS2-654内含子)、SEQ ID NO:68(仅具有197bp的IVS2-654内含子)、SEQ ID NO:55(具有6A突变的IVS2-654内含子)、SEQ ID NO:56(具有564C突变的IVS2-654内含子)、SEQ ID NO:57(具有841A突变的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ ID NO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ ID NO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)、SEQ ID NO:74、SEQID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148;及其任何组合,包括单一序列。 在此方面和本文所述的所有方面的一个实施方案中,结合调控序列的寡核苷酸包含选自以下的序列:SEQ ID NO:37(IVS2-654 CT的寡核苷酸)、SEQ ID NO:38(具有657GT突变的IVS2-654的寡核苷酸)、SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)、SEQ IDNO:40(针对IVS2-654中564C突变的寡核苷酸)、SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)、SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)、SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)、SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)、SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)、SEQ ID NO:49(针对IVS2-705的寡核苷酸)、SEQ ID NO:76(诱导反义外显子23跳跃的寡核苷酸)以及SEQ ID NO 138(针对LUC-AON1的寡核苷酸)、SEQ ID NO:139(针对LUC-AON2的寡核苷酸)、SEQ ID NO:140(针对LUC-AON3的寡核苷酸)、SEQ ID NO:141(针对LUC-AON4的寡核苷酸)、SEQ ID NO:142(针对IVS2(S0)-654,LUC-654的寡核苷酸)和SEQ ID NO:149(针对野生型调控序列的寡核苷酸)。 在此方面和本文所述的所有方面的一个实施方案中,结合调控序列的寡核苷酸包含选自表4中列出的那些序列的序列。
在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:138的序列的寡核苷酸(例如,LNA-AON1)结合具有SEQ ID NO:143的序列的调控序列。 在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:139的序列的寡核苷酸(例如,LNA-AON2)结合具有SEQ ID NO:144的序列的调控序列。 在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:140的序列的寡核苷酸(例如,LNA-AON3)结合具有SEQ ID NO:145的序列的调控序列。 在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:141的序列的寡核苷酸(例如,LNA-AON4)结合具有SEQ ID NO:146的序列的调控序列。 在此方面和本文所述的所有方面的一个实施方案中,具有SEQ ID NO:142的序列的寡核苷酸(例如,LNA-654)结合具有SEQ ID NO:147的序列的调控序列。 在此方面和本文所述的所有方面的一个实施方案中,寡核苷酸结合的调控序列选自表5中列出的那些序列。
在此方面和本文所述的所有方面的一个实施方案中,脱靶效应降低至少30%(降低至少40%、至少50%、至少60%、至少70%、至少80%、至少90%)。 在此方面和本文所述的所有方面的一个实施方案中,组分(a)和(b)位于相同或不同的载体上。 在此方面和本文所述的所有方面的一个实施方案中,将组分(b)作为裸DNA导入细胞。在此方面和本文所述的所有方面的一个实施方案中,使用脂质制剂将组分(b)导入细胞。在此方面和本文所述的所有方面的一个实施方案中,使用纳米颗粒将组分(b)导入细胞。 在此方面和本文所述的所有方面的一个实施方案中,在施用(a)之后的时间点施用组分(b)。在此方面和本文所述的所有方面中的另一个实施方案中,组分(a)和(b)基本上同时施用。 在此方面和本文所述的所有方面的一个实施方案中,在缺少(b)或没有(b)表达的情况下,在细胞中检测不到(a)的表达。例如,(a)的表达在细胞中为“关闭(OFF)”,直到它与(b)在细胞中共表达。伴随(b)表达或存在(b),(a)在细胞中被“打开(ON)”。 在一个实施方案中,组分(b)控制基因编辑系统的“打开(ON)”和/或“关闭(OFF)”状态。 在一个实施方案中,基因编辑系统可以选择性地“打开(ON)”或“关闭(OFF)”。在另一个实施方案中,基因编辑系统可以在空间和/或局部控制下选择性地“打开(ON)”或“关闭(OFF)”。在一个实施方案中,系统的组分可以被局部递送/施用至期望的位点、位置,器官、细胞类型、组织类型等,以诱导基因编辑系统局部“打开(ON)”。在一个实施方案中,可以持续给定的时间段施用基因编辑系统的组分,以控制系统“打开(ON)”或“关闭(OFF)”的时机。不需要在具有空间和/或时间控制的情况下递送/施用系统的所有组分。例如,组分(a)可以全身施用,而组分(b)可以局部施用和/或持续特定的时间段。例如,取决于受试者的疼痛程度,人们可以将系统“打开(ON)”或“关闭(OFF)”。 在此方面和本文所述的所有方面的一个实施方案中,(a)的表达取决于(b)的表达。 在此方面和本文所述的所有方面的一个实施方案中,载体是病毒载体。示例性的病毒载体包括但不限于AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。 在此方面和本文所述的所有方面的一个实施方案中,载体是非病毒载体。 在此方面和本文所述的所有方面的一个实施方案中,核酸酶是CRISPR相关的核酸酶。 在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶为基因编辑创建双链断裂,并且其中该CRISPR相关的核酸酶选自由以下组成的组:Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。 在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶是选自金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、嗜热链球菌(Streptococcusthermophilus)(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)(NmCas9)、新杀手弗朗西丝菌(Francisella novicida)(FnCas9)和空肠弯曲菌(Campylobacter jejuni)(CjCas9)的Cas9变体。 在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶已经被修饰用于基因编辑,但是没有双链DNA断裂(例如,CRISPRi或CRISPRa),并且选自由dCas、nCas和Cas 13组成的组。 在此方面和本文所述的所有方面的一个实施方案中,基因编辑正在降低一种或多种基因产物的表达。在此方面和本文所述的所有方面的一个实施方案中,基因编辑正在增加一种或多种基因产物的表达。 在此方面和本文所述的所有方面的一个实施方案中,CRISPR相关的核酸酶被密码子优化以在真核细胞中表达。 在此方面和本文所述的所有方面的一个实施方案中,细胞是哺乳动物或人细胞。 在此方面和本文所述的所有方面的一个实施方案中,细胞在体内或体外。 在此方面和本文所述的所有方面的一个实施方案中,靶基因是疾病基因。 本文所述的本发明的另一个方面提供了用于编辑受试者中的基因的方法,该方法包括向需要基因编辑的受试者施用本文所述的任何系统。 附图简述 图1A-1C显示了剪接位点优化对诱导的影响。(图1A)IVS2-654内含子及其剪接模式的示意图。灰色框:人β珠蛋白的外显子,白色框:可替代使用的外显子(AUE),虚线:内含子。(图1B)剪接位点的修饰。上图:灰色框:荧光素酶编码区,白色框:可替代使用的外显子(调控蛋白的非天然存在的外显子),实线:内含子,虚线:选择性剪接路径。中间图:IVS2-654内含子的5'和3'剪接位点序列。下图:具有修饰的序列的可替代5'剪接位点。(图1C)荧光素酶活性的测量。我们在有或没有结合调控序列的对应寡核苷酸(AON)的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。前两行中的数据指示相对光单位(RLU)/μg。第三行中的数据呈现为具有AON的表达相对于无AON的表达的增加倍数。 图2A-2C显示了对内含子尺寸的优化。(图2A)原始IVS2-654和IVS2(S0)-654内含子的示意图。白色框:可替代使用的外显子。虚线:内含子。示出了IVS2的5'和3'剪接位点的核苷酸编号和IVS2(S0)缺失后的连接区。(图2B)IVS2(S0)-654(SEQ ID NO:147)的总核苷酸序列。(图2C)IVS(S0)-654对荧光素酶诱导的影响。我们在有或没有AON654的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。数据呈现为含有AON654时的表达相对于不含AON654时的表达的增加倍数。 图3A-3C显示了其对应的AON对含有修饰内含子的构建体的荧光素酶表达的调控。(图3A)构建体及其AON靶序列的示意图。(图3B)AON对各构建体的诱导。在有或没有所示AON的情况下将各构建体转染到HEK293细胞中后24小时进行荧光素酶测定。数据呈现为含有AON时的表达相对于无AON时的表达的增加倍数。(图3C)通过对应AON诱导荧光素酶表达。 图4A-4B显示了其对应的AON对多基因表达的差异化调控。(图4A)每种构建体及其AON的预期途径的示意图。(图4B)对三种个体基因表达的差异调控。上图显示了荧光显微镜下的GFP。LNADGTl特异性诱导GFP表达。中间图显示了荧光显微镜下的RFP。LNADGT2特异性诱导RFP表达。下图显示了对每个样品的荧光素酶活性的测量。LNALucS1特异性诱导荧光素酶表达。 图5A和5B显示了在小鼠肝脏中AON对AAV2.5-CBh-Luc-DGT1荧光素酶表达的调控。(图5A)所示条件下的荧光素酶活性。(图5B)所示包括AON1+I条件下的荧光素酶活性。 图6A-6B显示了在小鼠眼睛中AON对AAV2.5-CBh-Luc-DGT1荧光素酶表达的调控。(图6A)实验概要。短箭头表示载体注射的时间点。箭头表示AON注射的时间点。长箭头表示荧光素酶活性测量的时间点。(图6B)AON诱导载体的荧光素酶表达。该示意图显示了每次施用AON后小鼠眼睛的荧光素酶活性(RLU)。 图7显示了野生型人β珠蛋白内含子剪接的示意图。灰色数字框显示外显子。 图8显示了在氨基酸654处含有点突变(C-T)的人β珠蛋白IVS2-654突变体的示意图。 图9显示了人β珠蛋白IVS2-654突变体中第二个内含子的错误内含子剪接的示意图。内含子2的错误剪接抑制了β珠蛋白功能。粗箭头表示优先的剪接变体。标记了5'剪接位点(5'SS)。 图10显示了结合调控序列的寡核苷酸(由黑色线条显示)的示意图,该调控序列结合人β珠蛋白IVS2-654突变体的5'SS并驱动优先剪接为野生型剪接。 图11显示了Luc-IVS2-654(B)的示意图。该构建体包含图10所示的可被选择性剪接的调控序列(参见图10中的相应虚线),即,定义位于外显子侧翼的第一内含子和第二内含子的第一组剪接位点和第二组剪接位点。该可被选择性剪接的调控序列被符合读框地放置到编码待调控蛋白,例如报告基因诸如所例示的荧光素酶或核酸酶诸如CRISPR相关的核酸酶的核苷酸序列内。在不存在阻断第二组剪接元件的寡核苷酸(oligo)或该寡核苷酸不表达的情况下,该盒的插入导致可变剪接事件(alternate splicing event),其保留非天然存在于待调控蛋白中的外显子(AS)(细箭头),从而产生无功能蛋白质。当结合调控序列的寡核苷酸与该盒结合时,发生正确的剪接,并且去除该外显子(粗箭头)从而产生功能性蛋白质(CS)。该图中例示了荧光素酶。当存在结合阻止第二组剪接元件剪接的调控序列的寡核苷酸时,观察到荧光素酶诱导水平增加了11倍。 图12A-12C显示了含有GFP的IVS 2-654(B)盒的修改的剪接。(图12A)GFP654INT的示意图,其包含图10中在外显子侧翼使用的的盒(参见相应的虚线)。结合调控序列的寡核苷酸由灰色线条表示。该盒的插入导致保留该外显子(空心箭头)的可变剪接(AS)。当结合调控序列的寡核苷酸结合该盒时,发生正确剪接(CS),并且去除该外显子(空心箭头)。(图12B)不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的所示细胞系中的GFP654INT表达。只有当结合调控序列的寡核苷酸被结合时,GFP的表达才是可见的。使用GFP wtINT作为对照。(图12C)显示不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的所示细胞系中的AS或CS的射线照片。 图13显示了在不含反义寡核苷酸(ASO)、含有错配寡核苷酸(LNA654M)或结合调控序列的寡核苷酸(LNA654)的眼睛中GFP654INT的体内表达。使用GFP wtINT作为对照。 图14是改变内含子长度和数目的各种pGL3-654突变体的示意图。B是含有两组剪接元件(即,四个剪接位点,一个选择性剪接位点)的原始850bp IVS2-654内含子。B(S0)被改变为减小内含子的尺寸,同时保持剪接元件组,例如缺失200bp片段。AB(S0)具有两个最小调控序列,其中每一个与寡核苷酸结合。 图15A-15C显示了增加剪接受体或供体强度的各种pGL3-654突变体。(图15A)与图10中使用的盒相邻的侧翼序列的示意图。显示了野生型序列(上行)的突变(下行)。(图15B)所示构建体的增加倍数。(图15C)各种pGL3-654突变体与内含子的长度和数目的示意图。图15A中示出了斜线之间的区域。 图16显示了所示荧光素酶构建体的侧翼序列。 图17A-17E显示了与所示突变体中的调控序列结合的给定寡核苷酸的特异性。B(S0-GT)(FIG.17A)、LUCS1(e)(FIG.17B)、DGT1(f)(FIG.17C)、DGT2(e)(FIG.17D)和DGT3(h)(FIG.17E)。结合调控序列的寡核苷酸仅在结合至其对应突变体时增加诱导倍数。 图18A和18B显示了含有图10发现的盒的AAT的体内表达。在施用寡核苷酸前1年,经由AAV在小鼠中表达含有该盒的AAT。(图18A)显示在未施用反义寡聚核苷酸(ASO)、施用错配寡聚核苷酸(LNA654M)或结合调控序列的寡聚核苷酸(LNA654)之后AAT的AS或CS的射线照片。正确剪接(CS),下方条带。选择性剪接(AS)上方条带。(图18B)在诱导(例如,施用所示的寡核苷酸)后所示天数的AAT表达。 具体实施方式 如本文所用,“一个(a、an)”或“该(the)”可以是单数或复数,这取决于这种使用的上下文。例如,“一个细胞(a cell)”可以意指单个细胞或其可以意指多个细胞。 也如本文所用,“和/或”是指并涵盖一个或多个相关所列项目的任一个和所有可能的组合,以及当以备选方式(“或”)解释时不组合。 此外,当涉及可测量值,例如本发明的组合物的量、剂量、时间、温度等时,本文所用的术语“约”意指包括指定量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。 本发明提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入:(a)包含编码核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从mRNA信息被剪接时,产生编码无功能核酸酶的mRNA,该无功能性核酸酶包含由非天然存在的外显子编码的氨基酸序列;和(b)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。 在一个实施方案中,组分(a)和(b)位于同一载体上。在另一个实施方案中,组分(a)和(b)位于两个不同的载体上。 在一个实施方案中,系统还包括将结合靶基因序列的gRNA导入细胞中,如果该系统中包含的核酸酶是CRISPR相关的核酸酶的话。在一个实施方案中,组分(a)和(b)以及gRNA位于同一载体上。在另一个实施方案中,组分(a)和(b)以及gRNA位于三个不同的载体上。在另一个实施方案中,(a)和(b)位于同一载体上,而gRNA位于不同的载体上;或者(a)和gRNA位于同一载体上,而(b)位于不同的载体上;或者(b)和gRNA位于同一载体上,而(a)位于不同的载体上。当本文所述的至少两个组分位于同一载体上时,该组分在载体上的顺序可互换。 载体可以是但不限于非病毒载体、病毒载体和合成的生物纳米颗粒。本发明的病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。 在一个实施方案中,组分(a)和(b)基本上同时施用给受试者。在一个实施方案中,组分(a)和(b)在不同的时间点施用给受试者。例如,组分(a)的施用时间点晚于(b)。或者,组分(a)的施用时间点早于(b)。在一个实施方案中,组分(b)在(a)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23小时或更多小时施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30天或更多天施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10、11个月或更多个月施用;或在(a)之后至少1、2、3、4、5、6、7、8、9、10年或更多年施用。 在一个实施方案中,gRNA与(a)基本上同时施用。在另一个实施方案中,gRNA在与(a)不同的时间点施用。例如,可以在施用(a)之前的时间点施用gRNA。或者,可以在施用(a)之后的时间点施用gRNA。在一个实施方案中,gRNA可以基本上与(b)同时、在(b)之前或之后施用。 在一个实施方案中,组分(b)被施用给受试者一次。在可选实施方案中,组分(b)在给定的时间段内(例如,数小时、数天、数月、数年或更长)被施用给受试者至少两次,例如至少1、2、3、4、5、6、7、8、9、10或更多次。 在一个实施方案中,(a)的表达取决于(b)的表达。换句话说,(a)不会在细胞中表达,除非(b)随后存在于同一细胞内或在同一细胞中表达。因此,在本文所述的某些实施方案中,本文所述的系统在关闭(OFF)位置(例如,未表达)被导入(例如,受试者)并与本发明的结合调控序列的寡核苷酸和/或小分子接触将系统切换至打开(ON)位置(例如,表达)。本文还提供了将处于打开(ON)位置被导入(例如,导入受试者中)的系统转换到关闭(OFF)位置的方法,例如抑制赋予生物学功能的异源蛋白和/或RNA产生的方法,包括:a)在允许剪接的条件下使结合调控序列的寡核苷酸和/或小分子与本发明的核酸接触,其中小分子阻断第一组剪接元件的成员,导致去除了第二内含子,从而抑制第一RNA的产生。 本发明还提供了一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体(例如,病毒或非病毒载体、rAAV等),其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中当第一内含子和第二内含子从mRNA信息被剪接时,产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;b)结合靶基因序列的gRNA;和c)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和基因编辑靶序列起作用的核酸酶的mRNA。 在一个实施方案中,组分(a)、(b)和(c)位于同一载体上。在另一个实施方案中,组分(a)、(b)和(c)位于三个不同的载体上。在另一个实施方案中,(a)和(b)位于同一载体上,而(c)位于不同的载体上;或者(a)和(c)位于同一载体上,而(b)位于不同载体上;或者(b)和(c)位于同一载体上,而(a)位于不同的载体上。当至少两个组分位于同一载体上时,该组分载体上的顺序可互换。 载体可以是但不限于非病毒载体、病毒载体和合成的生物纳米颗粒。本发明的病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。 在一个实施方案中,组分(a)、(b)和(c)基本上同时施用给受试者。在一个实施方案中,组分(a)、(b)和(c)在不同的时间点施用给受试者。在可选实施方案中,组分(c)在(a)和(b)之后的时间点施用,例如组分(a)和(b)基本上同时施用,而(c)在该施用后至少一周施用。在一个实施方案中,组分(c)在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23小时或更多小时施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30天或更多天施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10、11个月或更多个月施用;或在(a)和/或(b)之后至少1、2、3、4、5、6、7、8、9、10年或更多年施用。 在一个实施方案中,组分(c)被施用给受试者一次。在可选实施方案中,组分(c)在给定的时间段内(例如,数小时、数天、数月、数年或更长)被施用给受试者至少两次,例如至少1、2、3、4、5、6、7、8、9、10或更多次。 在一个实施方案中,(a)和(b)的表达依赖于(c)的表达。换句话说,(a)和(b)不会在细胞中表达,除非(c)随后存在于同一细胞内或在同一细胞中表达。因此,在本文所述的某些实施方案中,本文所述的系统在关闭(OFF)位置(例如,未表达)被导入(例如,受试者)并且与结合本发明的调控序列的寡核苷酸和/或小分子的接触将系统切换至打开(ON)位置(例如,表达)。本文还提供了将处于打开(ON)位置被导入(例如,导入受试者中)的系统转到关闭(OFF)位置的方法,例如抑制赋予生物学功能的异源蛋白和/或RNA产生的方法,包括:a)在允许剪接的条件下使结合调控序列的寡核苷酸和/或小分子与本发明的核酸接触,其中小分子阻断第一组剪接元件的成员,导致去除了第二内含子,从而抑制第一RNA的产生。 在一个实施方式中,gRNA的表达依赖(b)的表达。 在一个实施方案中,核酸酶是CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶、转录激活因子样效应物核酸酶、核酸内切酶或核酸外切酶。 如本文所用,术语“核酸酶(nuclease)”是指具有DNA裂解活性的分子。用于在本文公开的方法中使用的核酸酶试剂的具体实例包括RNA引导的CRISPR-Cas9系统、锌指蛋白、大范围核酸酶、TAL结构域、TALEN、酵母装配重组酶(yeast assembly recombinase)、亮氨酸拉链、CRISPR/Cas核酸内切酶以及本领域技术人员已知的其他核酸酶。可以选择或设计核酸酶以获得在给定的靶位点裂解的特异性。例如,可对核酸酶进行选择以在靶位点切割,从而在切割的多核苷酸和不同的多核苷酸之间产生重叠末端。具有蛋白质和RNA元件的核酸酶,例如CRISPR-Cas9,可被提供为已经与剂复合的核酸酶,或者可被提供为分开的蛋白质和RNA元件,在这种情况下,它们在本文所述的反应混合物中复合形成核酸酶。在一个实施方案中,使用Cas9以外的核酸酶。 如本文所用,术语“核酸酶的识别位点”是指由核酸酶在此处诱导切口或双链断裂的DNA序列。核酸酶的识别位点可以是对细胞内源性的(或天然的)或者核酸酶的识别位点对细胞可以是外源性的。在具体的实施方案中,识别位点是对细胞外源性的,且因此不是该细胞的基因组中天然存在的。仍在另外的实施方案中,识别位点对于细胞和人们想要定位在靶基因座处的目的多核苷酸而言是外源性的。在另外的实施方案中,外源性或内源性识别位点在宿主细胞的基因组中仅呈现一次。在具体的实施方案中,鉴定了在基因组内仅出现一次的内源性或天然位点。这样的位点随后可以用于设计将在该内源性识别位点处产生切口或双链断裂的核酸酶试剂。 识别位点的长度可以变化,并且包括例如约30-36bp(对于锌指核酸酶(ZFN)对(即每个ZFN的识别位点为约15-18bp))、约36bp(对于转录激活因子样效应物核酸酶(TALEN))或者约20bp(对于CRISPR/Cas9向导RNA)的识别位点。 在一些实施方案中,识别位点位于编码选择性标志物(selection marker)的多核苷酸内。这样的位置可以位于选择性标志物的编码区内或影响选择性标志物的表达的调控区内。因此,核酸酶试剂的识别位点可以位于选择性标志物的内含子、编码选择性标志物的多核苷酸的启动子、增强子、调控区或任何非蛋白编码区中。在一些实施方案中,识别位点处的切口或双链断裂破坏选择性标志物的活性。测定功能选择性标志物的存在或不存在的方法是本领域技术人员已知的。 在所需的识别位点中诱导切口或双链断裂的任何核酸酶都可用于本文公开的方法和组合物中。可以使用天然存在的或天然的核酸酶,只要该核酸酶试剂在所需的识别位点中诱导切口或双链断裂即可。或者,可以使用修饰的或工程化的核酸酶试剂。“工程化的核酸酶”包括从其天然形式被工程化(修饰或衍生)为特异性识别期望的识别位点并在期望的识别位点诱导切口或双链断裂的核酸酶。因此,工程化的核酸酶试剂可以从天然的、天然存在的核酸酶试剂获得,或者其可以是人工创建或合成的。核酸酶试剂的修饰在蛋白质裂解试剂中可少至一个氨基酸,或在核酸裂解试剂中可少至一个核苷酸。在一些实施方案中,工程化的核酸酶在识别位点诱导切口或双链断裂,其中该识别位点不是天然(非工程化或非修饰的)核酸酶试剂所识别的序列。在识别位点或其他DNA中产生切口或双链断裂在本文中可称为“切割(cutting)”或“裂解(cleaving)”识别位点或其他DNA。 随后细胞以两种方式中的一种可修复这些断裂:非同源末端连接和同源介导的修复(同源重组)。在非同源末端连接(NHEJ)中,双链断裂通过将断裂末端彼此直接连接而被修复。如此,尽管某些核酸材料可能丢失,从而导致缺失,但是没有新的核酸材料插入该位点。在同源介导的修复(homology-directed repair)中,与裂解的靶DNA序列具有同源性的供体多核苷酸可用作修复裂解的靶DNA序列的模板,导致遗传信息从供体多核苷酸转移至靶DNA。因此,新的核酸材料可被插入/复制到该位点中。NHEJ和/或同源介导的修复引起的对靶DNA的修饰可用于基因校正、基因置换、基因加标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。 在一个实施方案中,核酸酶是CRISPR相关的核酸酶。天然原核CRISPR相关的核酸酶系统包括具有恒定长度的间插可变序列的短重复序列的阵列(即,成簇的规律间隔的短回文重复序列),以及CRISPR相关(“Cas”)的核酸酶蛋白。转录的CRISPR阵列的RNA被一部分Cas蛋白加工成小向导RNA,其通常具有如下所讨论的两个组分。存在至少三种不同的系统:I型、II型和III型。在这3种系统中,参与将RNA加工成成熟crRNA的酶是不同的。在天然原核系统中,向导RNA(“gRNA”)包括两个短的、非编码的RNA种类,称为CRISPR RNA(“crRNA”)和反式作用RNA(“tracrRNA”)。在示例性系统中,gRNA与核酸酶(例如Cas核酸酶)形成复合物。gRNA:核酸酶复合物结合具有前间隔序列邻近基序(protospacer adjacent motif,“PAM”)和前间隔序列的靶多核苷酸序列,前间隔序列是与gRNA的一部分互补的序列。gRNA:核酸酶复合物对靶多核苷酸的识别和结合诱导靶多核苷酸的裂解。天然CRISPR相关的核酸酶系统在原核生物中起到免疫系统的作用,其中gRNA:核酸酶复合物以类似于真核生物体中RNAi的方式识别外源遗传因子并使之沉默,从而赋予对诸如质粒和噬菌体等外源遗传原件的抗性。已经证明,单一向导RNA(“sgRNA”)可以代替天然存在的crRNA和tracrRNA之间形成的复合物。 任何CRISPR相关的核酸酶可用于本发明的系统和方法中。CRISPR核酸酶系统是本领域技术人员已知的,例如,参见专利/申请8,993,233、US 2015/0291965、US 2016/0175462、US 2015/0020223、US 2014/0179770、8,697,359;8,771,945;8,795,965;WO2015/191693;US 8,889,418;WO 2015/089351;WO 2015/089486;WO 2016/028682;WO2016/049258;WO 2016/094867;WO 2016/094872;WO 2016/094874;WO 2016/112242;US2016/0153004;US 2015/0056705;US 2016/0090607;US 2016/0029604;8,865,406;8,871,445;其每一个均通过引用以其整体并入本文。 在一个实施方案中,核酸酶是大范围核酸酶。已基于保守序列基序,将大范围核酸酶分为4个家族,这些家族是LAGLIDADG(SEQ ID NO:153)、GIY-YIG、H-N-H和His-Cys盒子家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HEase以其长识别位点和耐受其DNA底物中的某些序列多态性而著称。大范围核酸酶的结构域、结构和功能是已知的,参见例如Guhan和Muniyappa(2003)Crit Rev Biochem Mol Biol 38:199-248;Lucas等人,(2001)Nucleic Acids Res 29:960-9;Jurica和Stoddard,(1999)Cell Mol Life Sci 55:1304-26;Stoddard,(2006)Q Rev Biophys 38:49-95;和Moure等人,(2002)Nat StructBiol 9:764。在一些实例中,使用了天然存在的变体和/或工程化的衍生性大范围核酸酶。用于修饰动力学、辅因子相互作用、表达、最佳条件和/或识别位点特异性以及筛选活性的方法是已知的,参见例如Epinat等人,(2003)Nucleic Acids Res 31:2952-62;Chevalier等人,(2002)Mol Cell 10:895-905;Gimble等人,(2003)Mol Biol 334:993-1008;Seligman等人,(2002)Nucleic Acids Res 30:3870-9;Sussman等人,(2004)J Mol Biol342:31-41;Rosen等人,(2006)Nucleic Acids Res 34:4791-800;Chames等人,(2005)Nucleic Acids Res 33:el78;Smith等人,(2006)Nucleic Acids Res 34:el49;Gruen等人,(2002)Nucleic Acids Res 30:e29;Chen和Zhao,(2005)Nucleic Acids Res 33:el54;W02005105989;W02003078619;W02006097854;W02006097853;W02006097784;和W02004031346,其通过引用以其整体并入本文。 本文可使用任何大范围核酸酶,包括但不限于I-Scel、I-SceII、1-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-Ceul、I-CeuAIIP、I-Crel、1-CrepsbIP、I-CrepsbIIP、1-CrepsbIIIP、1-CrepsbIVP、I-Tlil、I-Ppol、PI-PspI、F-Scel、F-Scell、F-Suvl、F-TevI、F-TevII、I-Amal、I-Anil、I-Chul、I-Cmoel、I-Cpal、I-CpaII、I-CsmI、I-Cvul、I-CvuAIP、I-DdiI、I-DdiII、I-Dirl、I-Dmol、I-HmuI、I-HmuII、I-HsNIP、I-Llal、I-Msol、I-Naal、I-NanI、I-NcIIP、I-NgrIP、I-Nitl、I-Njal、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrlP、I-PobIP、I-Porl、I-PorIIP、I-PbpIP、I-SpBetaIP、I-Scal、I-SexIP、I-SneIP、I-Spoml、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68O3I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-Tful、PI-TfuII、PI-Thyl、PI-Tlil、ΡΙ-TliII或其任何活性变体或片段。 在一个实施方案中,大范围核酸酶识别12至40个碱基对的双链DNA序列。在一个实施方案中,大范围核酸酶识别基因组中一个完全匹配的靶序列。在一个实施方案中,大范围核酸酶是归巢核酸酶(homing nuclease)。在一个实施方案中,归巢核酸酶是归巢核酸酶的LAGLIDADG(SEQ ID NO:153)家族。在一个实施方案中,归巢核酸酶的LAGLIDADG(SEQ IDNO:153)家族选自I-Scel、I-Crel和I-Dmol。 在一个实施方案中,核酸酶是锌指核酸酶(ZFN)。在一个实施方案中,ZFN的每个单体包含3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域结合3bp亚位点。在其他实施方案中,ZFN是嵌合蛋白,其包含与独立的核酸酶可操作地连接的基于锌指的DNA结合结构域。在一个实施方案中,该独立的核酸内切酶是FokI核酸内切酶。在一个实施方案中,核酸酶试剂包含第一ZFN和第二ZFN,其中第一ZFN和第二ZFN各自与FokI核酸酶亚基可操作地连接,其中第一ZFN和第二ZFN识别靶DNA序列的每条链中被约5-7bp间隔子隔开的两个连续的靶DNA序列,并且其中该FokI核酸酶亚基二聚化以创建产生双链断裂的活性核酸酶。参见,例如,US20060246567;US20080182332;US20020081614;US20030021776;WO 2002/057308A2;US20130123484;US20100291048;WO 2011/017293A2;和Gaj等人,(2013)Trends in Biotechnology,31(7):397-405,其每一个通过引用以其整体并入本文。 在一个实施方式中,核酸酶是转录激活因子样效应因子核酸酶(TALEN)。TAL效应TALEN核酸酶是一类序列特异性核酸酶,其可用于在原核或真核生物体的基因组中的特异性靶序列处产生双链断裂。TAL效应物核酸酶通过将天然的或工程化的转录激活因子样(TAL)效应因子或其功能部分融合到核酸内切酶(诸如例如FokI)的催化结构域而产生。独特的模块化TAL效应物DNA结合结构域允许设计具有潜在的任何给定DNA识别特异性的蛋白质。因此,TAL效应物核酸酶的DNA结合结构域可以被工程化以识别特异性DNA靶位点,并因此用于在期望的靶序列处产生双链断裂。参见,WO 2010/079430;Morbitzer等人,(2010)PNAS10.1073/pnas.1013133107;Scholze&Boch(2010)Virulence 1:428-43;Christian等人,Genetics(2010)186:757-761;Li等人,(2010)Nuc.Acids Res.(2010)doi:10.1093/nar/gkq704;和Miller等人,(2011)Nature Biotechnology 29:143-148;其全部内容通过引用以其整体并入本文。 合适的TAL核酸酶的实例和用于制备合适的TAL核酸酶的方法公开于例如美国专利申请第2011/0239315、2011/0269234、2011/0145940、2003/0232410、2005/0208489、2005/0026157、2005/0064474、2006/0188987和2006/0063231号(其每一个通过引用以其整体并入本文)。在多种实施方案中,TAL效应因子核酸酶被工程化,其在例如目的基因组基因座中的靶核酸序列中或其附近切割,其中靶核酸序列位于待被靶向载体修饰的序列处或其附近。适合用于与本文提供的各种方法和组合物的TAL核酸酶包括那些经特殊设计以在待被本文所述的靶向载体修饰的靶核酸序列处或其附近结合的核酸酶。 在一个实施方案中,TALEN的每个单体包括33-35个TAL重复,其这些TAL重复通过两个高变残基识别单个碱基对。在一个实施方案中,核酸酶试剂是包含与独立的核酸酶可操作地连接的基于TAL重复的DNA结合结构域的嵌合蛋白。在一个实施方案中,该独立的核酸酶是FokI核酸内切酶。在一个实施方案中,核酸酶试剂包含第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域,其中第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域各自与FokI核酸酶亚基可操作地连接,其中第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域识别靶DNA序列的每条链中被不同长度(12-20bp)的间隔子序列隔开的两个连续的靶DNA序列,并且其中FokI核酸酶亚基二聚化以创建在靶序列处产生双链断裂的活性核酸酶。 在一个实施方案中,核酸酶是例如催化RNA降解的核糖核酸酶。为了RNA编辑目的,核糖核酸酶可以与CRISPR-Cas激发的RNA靶向系统(CIRT)的其他组分(例如,RNA发夹结合蛋白、与发夹结合蛋白和互补靶RNA相互作用的gRNA以及结合并稳定gRNA的带电荷蛋白)协同使用。示例性核糖核酸酶包括:外切核糖核酸酶(例如,多核苷酸磷酸化酶(PNPase)、RNase PH、RNase R、RNase D、RNase T、寡核糖核酸酶、核糖核酸外切酶I和核糖核酸外切酶II)、核糖核酸内切酶(例如,RNase A、RNase H、RNase III、RNase L、RNase P、RNase PhyM、RNase T1、RNase T2、RNase U2和RNase V)、PIN结构域核酸酶、无活性PIN结构域核酸酶、YTHDF1、YTHDF2、hADAR2、突变体hADAR2(例如,E488W)。可用于用CIRT进行RNA编辑的核糖核酸酶进一步描述于,例如,Rauch,S.等人,Cell;178(122-134页),2019;Mali,P.Cell(Leading Edge Previews),2019;和Lerner,Louise.“Using human genome,scientistsbuild CRISPR for RNA to open pathways for medicine.”2019年6月20日UChicagoNews.Web.访问日期2019年7月3日;其内容通过引用以其整体并入本文。 在一个实施方案中,核酸酶是限制性核酸内切酶(即限制性酶),包括I型、II型、III型和IV型核酸内切酶。I型和III型限制性核酸内切酶识别特异性识别位点,但通常在距核酸酶结合位点的可变位置处裂解,该可变位置可能距离裂解位点(识别位点)数百个碱基对。在II型系统中,限制性活性不依赖于任何甲基化酶活性,并且裂解通常发生在结合位点内或其附近的特定位点。大多数II型酶切割回文序列,然而Ila型酶识别非回文识别位点并在识别位点外裂解,lib型酶切割序列两次,其中两个位点都位于识别位点外,且Ils型酶识别不对称识别位点并在一侧且在距离识别位点约1-20个核苷酸的特定距离处裂解。IV型限制性酶靶向甲基化DNA。限制性内切酶进一步描述并分类于例如REBASE数据库中(网页为rebase.neb.com);Roberts等人,(2003)Nucleic Acids Res 31:418-20),Roberts等人,(2003)Nucleic Acids Res 31:1805-12和Belfort等人,(2002)Mobile DNA II第761-783页,Craigie等人编辑(ASM Press,Washington,DC)。 在一个实施方案中,核酸酶是核酸外切酶。核酸外切酶是通过破坏多核苷酸链的5'或3'末端的磷酸二酯键的水解反应裂解多核苷酸链末端的核苷酸而起作用的酶。核酸外切酶可以是细胞内源性的或外源性的。天然核酸外切酶的非限制性实例包括核酸外切酶I,核酸外切酶II、核酸外切酶III、核酸外切酶IV、核酸外切酶V和核酸外切酶VIII。 在另一个实施方案中,核酸酶是格氏嗜盐碱杆菌(Natronobacterium gregoryi)Argonaute蛋白(NgAgo)。NgAgo是利用一对5'磷酸化的反向互补向导DNA或RNA(例如,siRNA)靶向并切割靶核酸(例如,基因组DNA)的核酸内切酶。重要的是,Argonaute蛋白不需要靶核酸序列中的基序(例如,PAM)。 用于NgAgo的序列是本领域已知的。例如,NgAgo可以具有SEQ ID NO:154的序列。 SEQ ID NO:154是编码NgAgo的氨基酸序列(NCBI登录号:ANC90309.1)。
NgAgo的表达和正确折叠对盐浓度等条件敏感。NgAgo可以在具有高浓度盐的细胞中表达。NgAgo可以在具有低或中等盐浓度的细胞中表达,并且所得到的表达的NgAgo蛋白可以分成可溶和不可溶的级分。在可溶部分中可以发现功能性NgAgo。 靶核酸的向导DNA序列可以是靶核酸中的任一具有20-30个碱基对(bp)例如,22bp、24bp、26bp、28bp或30bp的序列。 如实施例1所述的产生包含调控序列(β珠蛋白内含子区)的NgAgo。利用限制性消化将调控序列的内含子区(例如,SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)亚克隆到携带NgAgo的AAV载体质粒中。 在一个实施方案中,核酸酶是人工限制性DNA切割子(cutter)(ARCUT)。使用本文所述的材料和方法,可以使用称为人工限制性DNA切割子(ARCUT)的非限制性酶方法学来编辑细胞的染色体DNA。该方法使用假互补(pseudo-complementary)肽核酸(pcPNA)来指定染色体或端粒区域内的裂解位点。一旦pcPNA指定了位点,此处的切割就由执行剪接功能的铈(CE)和EDTA(化学混合物)进行。此外,该技术使用DNA连接酶,该DNA连接酶稍后可在剪接位点内连接任何所需的DNA(参见例如,Komiyama M,Chemical modifications ofartificial restriction DNA cutter(ARCUT)to promote its in vivo and in vitroapplications,Artif.DNA PNA XNA.2014;5:e1112457.)。 在一个实施方案中,待调控的基因是选自由以下组成的组的疾病的相关基因:肌萎缩性侧索硬化症;内毒素血症;动脉粥样硬化性血管疾病即冠状动脉疾病;支架再狭窄;颈动脉代谢性疾病;中风;急性心肌梗死;心力衰竭;外周动脉疾病;肢体缺血;静脉移植失败;AV内瘘失败;克罗恩病;溃疡性结肠炎;回肠炎和肠炎;阴道炎;银屑病和炎症性皮肤病如皮炎;湿疹;特应性皮炎;过敏性接触性皮炎;荨麻疹;血管炎;脊椎关节病;硬皮病;呼吸道过敏性疾病如哮喘;过敏性鼻炎;超敏性肺病;关节炎(例如,类风湿性关节炎和银屑病性关节炎);湿疹;牛皮癣;骨关节炎;多发性硬化;系统性红斑狼疮;糖尿病;肾小球肾炎;移植排斥(包括同种异体移植排斥和移植物抗宿主病)或工程化组织的排斥;传染病;肌炎;炎性CNS病症;中风;闭合性脑损伤;神经退行性疾病;阿尔茨海默病;脑炎;脑膜炎;骨质疏松;痛风;肝炎;肝静脉闭塞病(VOD);出血性膀胱炎;肾炎;脓毒症;结节病;结膜炎;耳炎;慢性阻塞性肺病;鼻窦炎;贝赫切特综合征;移植物抗肿瘤效应;粘膜炎;阑尾炎;阑尾破裂;腹膜炎;主动脉瓣疾病;二尖瓣疾病;雷特综合征;结节性硬化症;苯丙酮尿症;斯-李-奥综合征和脆性X综合征;帕金森病;Aicardi-Goutières综合征;亚历山大病;Allan-Hemdon-Dudley综合征;POLG相关病症;α-甘露糖苷贮积症(II型和III型); 在一个实施方案中,被调控的基因是肌营养不良蛋白基因。肌营养不良蛋白基因位于X染色体上,且该基因的突变可导致各种疾病状态,例如杜氏肌营养不良、Becker型肌营养不良、X连锁扩张型心肌病和家族性扩张型心肌病。在一个实施方案中,肌营养不良蛋白基因在通常带有导致所述疾病的突变(例如,1、6、7、8、23、43、44、45、46、50、51、52、53或55)的外显子处被靶向。 DMD的示例性向导RNA(gRNA)包括但不限于表1中所列的gRNA。 靶向DMD基因以使其沉默的方法进一步描述于,例如国际专利申请WO 2016/025469和WO 2016/161380,其通过引用以其整体并入本文。 在一个实施方案中,被调控的基因是UBE3A。UBE3A在某些组织中是双等位基因表达的(biallelically expressed),例如,神经元仅表达UBE3A的母系遗传拷贝。神经元中位于染色体15q11-q13中的母系UBE3A基因的失活或有害突变导致天使人综合征。在一个实施方案中,神经元的UBE3A被调控。在一个实施方案中,在神经元细胞中被印记即被沉默的父系UBE3A被调控。在例如以下文献中进一步描述了用于治疗Angelman综合征的UBE3A调节:Huang,HS.等人,Nature;第481卷,2012;Judson,MC等人,Neuron;第90卷,2016;和Judson,MC等人,Trends in Neurosciences;34(6),2011;其内容通过引用以其整体并入本文。 在另一个实施方案中,被调控的基因是选自以下的疾病基因: 1p36;18p;6p21.3;14q32;AAAS;FGD1;EDNRB;CP(3p26.3);LMBR1;COL2A1(12q13.11);4p16.3;HMBS;ADSL;ABCD1;JAG1;NOTCH2;TP63;TREX1;RNASEH2A;RNASEH2B;RNASEH2C;SAMHD1;ADAR;IFIH1;GFAP;HGD;10q26.13;ATP1A3;ALMS1;ALAD;FGFR2;VPS33B;ATM;PITX2;FOXO1A;FOXC1;PAX6;10q26;FGFR2;IGF-2;CDKN1C;H19;KCNQ1OT1;BTD;BCS1L;15q26.1;17FLCN;ATP2A1;MAOA;NOTCH3;HTRA1;X 17q24.3-q25.1;ASPA;RAB23;SNAP29;FTR(7q31.2);PMP22;MFN2;CHD7;LYST;RUNX2;ERCC6;ERCC8;X RPS6KA3;COH1;COL11A1;COL11A2;COL2A1;NTRK1;PTEN;CPOX;14q13-q21;5p;16q12;FGFR2;FGFR3;FGFR3;ATP2A2;Xp11.22CLCN5;OCRL;WT1;18q;22q11.2;HSPB8;HSPB1;HSPB3;GARS;REEP1;IGHMBP2;SLC5A7;DCTN1;TRPV4;SIGMAR1;COL1A1;COL1A2;COL3A1;COL5A1;COL5A2;TNXB;ADAMTS2;PLOD1;B4GALT7;DSE;EMD;LMNA;SYNE1;SYNE2;FHL1;TMEM43;FECH;FANCA;FANCB;FANCC;FANCD1;FANCD2;FANCE;FANCF;FANCG;FANCI;FANCJ;FANCL;FANCM;FANCN;FANCP;FANCS;RAD51C;XPF;GLA(Xq22.1);APC;IKBKAP;MYCN;MED12;FXN;GALT;GALK1;GALE;GBA(1);PAX6;GCDH;ETFA;ETFB;ETFDH;BCS1L;MYO5A;RAB27A;MLPH;ATP2C1(3);ABCA12;HFE;HAMP;HFE2B;TFR2;TF;CP;FVIII;UROD;3q12;ENG;ACVRL1;MADH4;GNE;MYHC2A;VCP;HNRPA2B1;HNRNPA1;EXT1;EXT2;EXT3;HPS1;HPS3;HPS4;HPS5;HPS6;HPS7;AP3B1;PMP22;NODAL;NKX2-5;ZIC3;CCDC11;CFC1;SESN1;CBS(gene);HD;IDS;IDUA;AASS;AGXT;GRHPR;DHDPSL;ABCA1;COL2A1;FGFR3(4p16.3);20q11.2;IKBKG(Xq28);TBX4;15q11-14;FGFR2;INNPP5E;TMEM216;AHI1;NPHP1;CEP290;TMEM67;RPGRIP1L;ARL13B;CC2D2A;OFD1;TMEM138;TCTN3;ZNF423;AMRC9;ALS2;COL2A1;PDGFRB;GAL;ATP13A2;LCAT;HPRT(X);TP53;MSH2;MLH1;MSH6;PMS2;PMS1;TGFBR2;MLH3;RYR1(19q13.2);BCKDHA;BCKDHB;DBT;DLD;ARSB;20q13.2-13.3;XK(X);AP1S1;MEFV;ATP7A(Xq21.1);MMAA;MMAB;MMACHC;MMADHC;LMBRD1;MUT;RAB3GAP(2q21.3);ASPM(1q31);GALNS;GLB1;ZEB2(2);FGFR3;MEN1;RET;MSTN;DMPK;CNBP;HYAL1;17q11.2;SMPD1;NPA;NPB;NPC1;NPC2;GLDC;AMT;GCSH;PTPN11;KRAS;SOS1RAF1;NRAS;HRAS;BRAF;SHOC2;MAP2K1;MAP2K2;CBL;RELN;RAG1;RAG2;COL1A1;COL1A2;IFITM5;PANK2(20p13-p12.3);UROD;PDS;STK11;FGFR1;FGFR2;PAH;AASDHPPT;TCF4(18);PKD1(16)or PKD2(4);DNAI1;DNAH5;TXNDC3;DNAH11;DNAI2;KTU;RSPH4A;RSPH9;LRRC50;PROC;PROS1;ABCC6;RP1;RP2;RPGR;PRPH2;IMPDH1;PRPF31;CRB1;PRPF8;TULP1;CA4;HPRPF3;ABCA4;EYS;CERKL;FSCN2;TOPORS;SNRNP200;PRCD;NR2E3;MERTK;USH2A;PROM1;KLHL7;CNGB1;TTC8;ARL6;DHDDS;BEST1;LRAT;SPARA7;CRX;MECP2;ESCO2;CREBBP;HEXB;SGSH;NAGLU;HGSNAT;GNS;HSPG2;COL2A1;FBN1;11p15;Xp11.22;PHF8;ABCB7;SLC25A38;GLRX5;GUSB;DHCR7;17p11.2;ATXN1;ATXN2;ATXN3;PLEKHG4;SPTBN2;CACNA1A;ATXN7;ATXN8OS;ATXN10;TTBK2;PPP2R2B;KCNC3;PRKCG;ITPR1;TBP;KCND3;FGF14;FGFR3;ABCA4;CNGB3;ELOVL4;PROM1;COL11A1;COL11A2;COL2A1;COL9A1;COL2A1;HEXA(15);GCH1;PCBD1;PTS;QDPR;MTHFR;DHFR;FGFR3;5q32-q33.1(TCOF1;POLR1C;or POLR1D);TSC1;TSC2;MYO7A;USH1C;CDH23;PCDH15;USH1G;USH2A;GPR98;DFNB31;CLRN1;PPOX;VHL;PAX3;MITF;WS2B;WS2C;SNAI2;EDNRB;EDN3;SOX10;COL11A2;ATP7B;C2ORF37(2q22.3-q35);4p16.3;15ERCC4;CENPVL1;CENPVL2;GSPT2;MAGED1;ALAS2(X);PEX1;PEX2;PEX3;PEX5;PEX6;PEX10;PEX12;PEX13;PEX14;PEX16;PEX19;和PEX26。 在一个实施方案中,被调控的基因是与神经性疼痛相关的基因。神经性疼痛的特征是自发的超敏疼痛反应,并且通常可以在原始神经损伤治愈后持续很长时间。这种异常升高的疼痛反应可被观察为痛觉过敏(对有害疼痛刺激的敏感性增加)或异常性疼痛(对非有害刺激如冷、热或触觉的异常疼痛反应)。神经性疼痛可以是急性的或慢性的。神经性疼痛的示例性类型包括疱疹后神经痛、HIV远端感觉性多发性神经病变、糖尿病神经性疼痛、与创伤性神经损伤相关的神经性疼痛、与中风相关的神经性疼痛、与多发性硬化相关的神经性疼痛、与脊髓空洞症相关的神经性疼痛、与癫痫相关的神经性疼痛、与脊髓损伤相关的神经性疼痛和与癌症相关的神经性疼痛。 本文所述的基因编辑系统可用于改变或调控与神经性疼痛(例如,与周围神经系统或中枢神经系统相关的疼痛)相关的基因。例如,可以使用本文所述的基因编辑系统抑制在疼痛患者的背根神经节中异常表达(例如,过表达、或低表达)的基因,或调控有害刺激转导、电压门控钠通道(例如,Ca2+通道、K+通道、Na+通道)、NMDA受体、配体门控离子通道、Mas相关G蛋白偶联受体(Mrgprs)的功能或为上述功能所需的基因以治疗、改善、抑制或减少神经性疼痛。可使用本文所述的基因编辑系统被抑制以治疗、改善、抑制或减轻神经性疼痛的示例性基因包括但不限于Navl.l、Nav1.2、Nav1.3、Nav1.4、Nav1.5、Nav1.6、Nav1.7、Nav1.8和Nav1.9、血管紧张素II 2型受体、辣椒素受体-1(VR-1)、酪氨酸受体激酶A(TrkA)、缓激肽受体、CSF1-DAP12途径成员(例如,CSF1、CSFR1或DAP12)。 在一个实施方案中,具有降低的脱靶效应的用于编辑与神经性疼痛相关的基因(例如,改变至少一种基因产物的表达)的系统包括向具有靶基因序列的细胞中导入:a)包含编码CRISPR相关的核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子从mRNA信息被剪接以产生编码无功能核酸酶的mRNA,该无功能性核酸酶包含由非天然存在的外显子编码的氨基酸序列;(b)结合神经性疼痛相关基因(例如,Nav 1.8)的gRNA;和(c)结合调控序列的寡核苷酸,其中在细胞内,所述寡核苷酸阻止第二组剪接元件从mRNA内剪接,从而产生缺少外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。 在一个实施方案中,gRNA针对Nav 1.8。用于靶向待抑制的Nav 1.8的示例性gRNA包括但不限于表2中列出的gRNA。 在某些实施方案中,例如,用于调控疼痛基因的CRISPR相关的核酸酶被连接至一个功能结构域,该功能结构域促进基因(例如,一种过表达的疾病基因)的阻遏,从而导致该基因的转录被阻遏。用来与DNA结合结构域(例如,失活Cas9)融合以用于阻遏基因(例如,Nav 1.8)表达的示例性功能域是来自人KOX-1蛋白的KOX阻遏结构域或KRAB阻遏结构域(参见,例如,Thiesen等人,New Biologist 2,363-374(1990);Margolin等人,Proc.Natl.Acad.Sci.USA 91,4509-4513(1994);Pengue等人,Nucl.Acids Res.22:2908-2914(1994);Witzgall等人,Proc.Natl.Acad.Sci.USA91,4514-4518(1994)。另一种合适的阻遏结构域是甲基结合结构域蛋白2B(MBD-2B)(还参见Hendrich等人,(1999)Mamm Genome10:906-912对MBD蛋白的描述。另一个示例性阻遏结构域是与v-ErbA蛋白相关的阻遏结构域。参见,例如,Damm等人(1989)Nature 339:593-597;Evans(1989)Int.J.Cancer增刊4:26-28;Pain等人(1990)New Biol.2:284-294;Sap等人,(1989)Nature 340:242-244;Zenke等人(1988)Cell 52:107-119;和Zenke等人(1990)Cell 61:1035-1049。另外的示例性阻遏结构域包括但不限于KRAB(也称为“KOX”)、SID、MBD2、MBD3、DNMT家族的成员(例如DNMT1、DNMT3A、DNMT3B)、Rb和MeCP2)。参见,例如Bird等人(1999)Cell 99:451-454;Tyler等人,(1999)Cell 99:443-446;Knoepfler等人(1999)Cell 99:447-450;和Robertson等人(2000)Nature Genet.25:338-342。另外的示例性阻遏结构域包括但不限于ROM2和AtHD2A。参见,例如,Chem等人(1996)Plant Cell 8:305-321;和Wu等人(2000)Plant J.22:19-27。 在一个实施方案中,所描述的发明的CRISPR相关的核酸酶(例如失活Cas9)被连接至KOX阻遏结构域。 在某些实施方案中,例如用于调节疾病相关基因或疼痛基因的CRISPR相关的核酸酶被连接至一个功能域,该功能域促进基因(例如,低表达疾病基因)的转录激活,从而导致该基因的转录被激活。用于实现这种激活的合适的结构域包括HSV VP16活化结构域(参见,例如,Hagmann等人,J.Virol.71,5952-5962(1997))、核激素受体(nuclear hormonereceptor)(参见,例如,Torchia等人,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚基(Bitko&Barik,J.Virol.72:5610-5618(1998)和Doyle&Hunt,Neuroreport 8:2937-2942(1997));Liu等人,Cancer Gene Ther.5:3-28(1998)),或人工嵌合功能结构域如VP64(Seifpal等人,EMBO J.11,4961-4968(1992))。另外的示例性激活结构域包括但不限于VP16、VP64、p300、CBP、PCAF、SRC1 PvALF、AtHD2A和ERF-2。参见,例如,Robyr等人(2000)Mol.Endocrinol.14:329-347;Collingwood等人(1999)J.Mol.Endocrinol.23:255-275;Leo等人(2000)Gene 245:1-11;Manteuffel-Cymborowska(1999)ActaBiochim.Pol.46:77-89;McKenna等人(1999)J.Steroid Biochem.Mol.Biol.69:3-12;Malik等人(2000)Trends Biochem.Sci.25:277-283;和Lemon等人(1999)Curr.Opin.Genet.Dev.9:499-504;OsGAI、HALF-1、Cl、AP1、ARF-5、ARF-6、ARF-7和ARF-8、CPRF1、CPRF4、MYC-RP/GP和TRABI。参见,例如,Ogawa等人(2000)Gene 245:21-29;Okanami等人(1996)Genes Cells 1:87-99;Goff等人(1991)Genes Dev.5:298-309;Cho等人(1999)Plant Mol.Biol.40:419-429;Ulmason等人(1999)Proc.Natl.Acad.Sci.USA 96:5844-5849;Sprenger-Haus-sels等人(2000)Plant J.22:1-8;Gong等人,(1999)PlantMol.Biol.41:33-44;和Hobo等人(1999)Proc.Natl.Acad.Sci.USA 96:15,348-15,353。 在一个实施方案中,本文所述的基因编辑系统用于激活被阻遏的基因(repressedgene)的转录。例如,本文所述的系统可以用于激活本文所述的基因(例如,疾病基因或与疼痛相关的基因(例如,被阻遏的Nav 1.8)的转录。 在一个实施方案中,gRNA被引导至Nav 1.8的转录起始位点(TSS)上游的前200bp,并导致稳健的转录激活。用于靶向待转录激活的Nav 1.8的示例性gRNA包括但不限于表3中所列的gRNA。 本发明实施方案中的调控序列可以是限定包含一个或多个突变的内含子的核苷酸序列,该突变的存在产生了第一组剪接元件和第二组剪接元件。在一些实施方案中,调控序列可以是定义内含子-外显子-内含子区的序列,其中内含子和/或外显子区中的突变导致了第一组剪接元件和第二组剪接元件的存在。在该后一实施方案中,当第二组剪接元件有活性时,结果是产生内含子-外显子-内含子区中的外显子的RNA。 本文还提供了筛选方法,例如鉴定阻断本文所述的基因编辑系统的调控核酸的第二组剪接元件的成员的寡核苷酸或其他化合物或复合物的方法,包括:(a)在允许剪接的条件下,使编码包含调控核酸序列的核酸酶的核酸(或者可替代地包含调控核酸的报告基因)与寡核苷酸/化合物在细胞内接触;和b)检测在调控核酸序列内缺乏非天然存在的外显子序列的mRNA的产生,通过产生这类mRNA鉴定了阻断第二组剪接元件的成员的寡核苷酸或化合物/复合物。可选地,检测到功能性蛋白质(例如报告蛋白)或核酸酶是抑制/阻断第二组剪接元件的寡核苷酸/化合物的标志(indicator)。 内含子是真核DNA或RNA的一部分,其介于该DNA或RNA的编码部分或“外显子”之间。内含子和外显子被从DNA转录成RNA,该RNA被称为“初级转录物,RNA前体”(或“前体mRNA(pre-mRNA)”)。内含子必须从前体mRNA中去除,从而可以产生由外显子编码的蛋白质。去除前体mRNA中的内含子并随后连接外显子是在剪接过程中进行的。 剪接过程是在转录后(即转录后地)但在翻译之前对RNA进行的并由剪接因子介导的一系列反应。因此,“前体mRNA”是既包含外显子又包含一个或多个内含子的RNA,并且“信使RNA(mRNA或RNA)”是已经从其中去除任何内含子并且其中外显子被顺序地连接在一起的RNA,从而可以通过用核糖体翻译成功能性蛋白质或者通过翻译成功能性RNA而由此产生基因产物。 内含子的特征是作为剪接机制的一部分并且是剪接所必需的一组“剪接元件”。内含子是相对短的、保守的核酸片段,其结合进行剪接反应的各种剪接因子。因此,每个内含子由5'剪接位点、3'剪接位点和位于其间的分支点限定。剪接元件还包含位于外显子中的外显子剪接增强子和沉默子,以及位于内含子中的与剪接位点和分支点相距一定距离的内含子剪接增强子和沉默子。除了剪接位点和分支点之外,这些元件还控制可变的、异常的和组成型剪接。 可以在本文所述的基因编辑系统中使用指导包含调控序列的核酸酶表达的各种启动子。实例包括但不限于组成型启动子、阻遏型启动子和/或诱导型启动子,它们的一些非限制性实例包括病毒启动子(例如,CMV、SV40)、组织特异性启动子(例如,肌肉(例如,MCK)、心脏(例如,NSE)、眼(例如,MSK)和合成型启动子(SP1元件)以及鸡β肌动蛋白启动子(CB或CBA)。启动子可以存在任何位置,在该位置其与核酸酶序列可操作地缔合。 此外,可以相同或不同的一个或多个启动子可以一起存在于同一核酸分子中,或者位于核酸分子上相对于彼此和/或相对于核酸内存在的核酸酶序列和/或调控序列的不同位置。此外,内部核糖体进入信号(IRES)和/或其他核糖体-通读元件可存在于该核酸分子上。可以相同或不同的一种或多种这样的IRES和/或核糖体通读元件可以一起存在于同一核酸分子中和/或在核酸分子上的不同位置存在于该同一核酸分子中。当多个核酸酶序列存在于核酸分子上时,这类IRES和核糖体通读元件可用于经由帽-非依赖性机制翻译信使RNA序列。 发现调控序列在核酸酶的编码区内,并且被放置成使得当调节序列的外显子被表达时,其具有符合读框的终止密码子。如下文所例示的,调控序列可以被被包括在核酸酶例如Cpf1或Cas9或其他核酸酶的编码区域内的任何地方。在一些实施方案中,调控序列位于核酸酶序列的5'核苷酸的三分之一内的任何位置、核酸酶序列的中间核苷酸的三分之一内的任何位置和/或核酸酶序列的3'核苷酸的三分之一内的任何位置。在一些实施方案中,调控序列位于核酸酶序列中的开放阅读框和多聚A位点之间的任何位置。优选地,调控序列位于核酸酶编码序列的5'端或其附近,例如距离5'末端5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸以内。调控核酸位于编码核酸酶的核酸序列内的任何位置,使得蛋白质中非天然存在的外显子被表达(具有符合读框的终止密码子)。 在其中本发明的基因编辑系统中存在两个或更多个调控序列的某些实施方案中,可以将两个或更多个调控序列定位为隔开至少约5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸,包括本文中没有具体叙述的5至1000之间的任何数量的核苷酸。 本发明的核酸分子的调控序列可以包含定义位于非天然存在的外显子侧翼的第一内含子序列和第二内含子序列的第一组剪接元件和第二组剪接元件、基本上由其组成和/或由其组成。本文所用的“非天然存在的外显子”是在正常情况下在待调控的野生型蛋白中不存在的外显子,并且其在编码序列中的存在导致缺乏野生型功能的蛋白质被表达。当第一内含子序列和第二内含子序列被逐个(individually)剪接时,产生编码无功能核酸酶的RNA分子,例如由于其包含具有终止密码子的非天然存在的外显子。可选地,在第二组剪接元件没有活性的情况下,外显子、第一和第二内含子全部被剪接以产生编码有功能的核酸酶的mRNA,该核酸酶对于基因编辑例如碱基编辑或核酸内切酶活性是有功能的,以便于基因置换/修复。在一些实施方案中,本发明的调控序列可以包含一个或多个突变,所述突变可以是取代、添加、缺失等。 基因编辑系统的组分可以存在于载体中,且这样的载体可以存在于细胞中。任何合适的载体都包括在本发明的实施方案中,包括但不限于非病毒载体(例如,核酸、微环(minicircle)、线性DNA、质粒、泊洛沙姆(poloxymer)、外来体和脂质体)、病毒载体和合成的生物纳米颗粒(BNP)(例如,由不同的腺相关病毒以及其他细小病毒合成设计)。 对于本领域技术人员显而易见的是,任何合适的载体都可以用于递送本发明的基因编辑系统。递送载体的选择可以根据本领域已知的多种因素进行,包括靶宿主的年龄和种类、体外与体内递送、期望的表达水平和持久性、预期目的(例如,用于治疗或多肽生产)、靶细胞或器官、递送途径、分离的核酸的尺寸、安全性考虑等。 合适的载体还包括病毒载体(例如,逆转录病毒、甲病毒;牛痘病毒;腺病毒、腺相关病毒或单纯疱疹病毒)、脂质载体、聚赖氨酸载体、与核酸分子一起使用的合成聚氨基聚合物载体,诸如质粒等。 本领域已知的任何病毒载体都可用于本发明。这类病毒载体的实例包括但不限于衍生自以下的载体:腺病毒科(Adenoviridae);双RNA病毒科(Birnaviridae);布尼亚病毒科(Bunyaviridae);杯状病毒科(Caliciviridae),毛发病毒组(Capillovirus group);香石竹潜病毒组(Carlavirus group);香石竹斑驳病毒组(Carmovirus virus group);花椰菜花叶病毒组(Group Caulimovirus);黄花丝状病毒组(Closterovirus Group);鸭跖草黄斑驳病毒组(Commelina yellow mottle virus group);豇豆花叶病毒组(Comovirusvirus group);冠状病毒科(Coronaviridae);PM2噬菌体组;环病毒科(Corcicoviridae);潜隐病毒组(Group Cryptic virus);隐病毒组(group Cryptovirus);黄瓜花叶病毒组家族([PHgr]6噬菌体组;囊状噬菌体科(Cysioviridae);香石竹环斑病组(Group Carnationringspot);香石竹病毒组(Dianthovirus virus group);蚕豆枯萎病组(Group Broadbean wilt);豆科病毒组(Fabavirus virus group);丝状病毒科(Filoviridae);黄病毒科(Flaviviridae);真菌传杆状病毒组;双生病毒组(Group Geminivirus);贾第鞭毛虫病毒组(Group Giardiavirus);肝DNA病毒科(Hepadnaviridae);疱疹病毒科(Herpesviridae);大麦病毒组(Hordeivirus virus group);Illar病毒组(Illarvirus virus group);丝状噬菌体科(Inoviridae);虹彩病毒科(Iridoviridae);光滑病毒科(Leviviridae);脂毛噬菌体科(Lipothrixviridae);黄矮病毒组(Luteovirus group);玉米雷亚朵非纳病毒组(Marafivirus virus group);玉米褪绿矮缩病毒组(Maize chlorotic dwarf virusgroup);微小噬菌体科;肌病毒科(Myoviridae);坏死病毒组(Necrovirus group);线虫传多角体病毒组(Nepovirus virus group);野田村病毒科(Nodaviridae);正粘病毒科(Orthomyxoviridae);乳多空病毒科(Papovaviridae);副粘病毒科(Paramyxoviridae);欧防风黄点病毒组(Parsnip yellow fleck virus group);分体病毒科(Partitiviridae);细小病毒科(Parvoviridae);豌豆耳突花叶病毒组(Peaenation mosaic virus group);藻类DNA病毒科(Phycodnaviridae);微小RNA病毒科(Picornaviridae);芽生噬菌体科(Plasmaviridae);短尾噬菌体科(Podoviridae);多DNA病毒科(Polydnaviridae);马铃薯X病毒组(Potexvirus group);马铃薯Y病毒属(Potyvirus);痘病毒科(Poxviridae);呼肠孤病毒科(Reoviridae);逆转录病毒科(Retroviridae);弹状病毒科(Rhabdoviridae);根前毛菌病毒组(Group Rhizidiovirus);长尾噬菌体科(Siphoviridae);南方菜豆花叶病毒组(Sobemovirus group);SSV 1型噬菌体;复层病毒科(Tectiviridae);纤细病毒属(Tenuivirus);四病毒科(Tetraviridae);烟草花叶病毒组(Group Tobamovirus);烟草脆裂病毒组(Group Tobravirus);披膜病毒科(Togaviridae);番茄丛矮病毒组(GroupTombusvirus);隆病毒组(Group Torovirus);全病毒科(Totiviridae);芜菁黄花叶病毒组(Group Tymovirus);和植物卫星病毒(Plant virus satellites)。 产生重组病毒载体和使用病毒载体进行核酸递送的方案可参见,例如,CurrentProtocols in Molecular Biology,Ausubel,F.M.等人(编辑)Greene PublishingAssociates,(1989)和其他标准实验室手册(例如,Vectors for Gene Therapy.In:Current Protocols in Human Genetics.John Wiley and Sons,Inc.:1997)。本发明的方法中采用的载体的非限制性实例包括用于将核酸递送到细胞中的任何核苷酸构建体,例如质粒、非病毒载体或病毒载体,例如可以包装重组逆转录病毒基因组的逆转录病毒载体(参见例如,Pastan等人,Proc.Natl.Acad.Sci.U.S.A.85:4486(1988);Miller等人,Mol.Cell.Biol.6:2895(1986))。例如,重组逆转录病毒然后可用于感染并由此将本发明的核酸递送至受感染的细胞。当然,将改变的核酸导入哺乳动物细胞的确切方法不限于使用逆转录病毒载体。其他技术可广泛用于该程序,包括使用腺病毒载体(Mitani等人,Hum.Gene Ther.5:941-948,1994)、腺相关病毒(AAV)载体(Goodman等人,Blood 84:1492-1500,1994)、慢病毒载体(Naldini等人,Science 272:263-267,1996)、假型逆转录病毒载体(Agrawal等人,Exper.Hematol.24:738-747,1996),和现在已知或以后鉴定的任何其他载体系统。还包括嵌合病毒颗粒,其是本领域熟知的并且可以包含两种或多种不同病毒的病毒蛋白和/或核酸的任意组合以产生功能性病毒载体。本发明的嵌合病毒颗粒还可以包含非病毒来源的氨基酸和/或核苷酸序列(例如,以促进载体靶向特定细胞或组织和/或诱导特异性免疫应答)。本发明还提供了“靶向”病毒颗粒(例如,包含细小病毒衣壳和重组AAV基因组的细小病毒载体,其中外源靶向序列已插入或替换到细小病毒衣壳中)。 也可以使用物理转导技术,例如脂质体递送和受体介导的胞吞机制以及其他胞吞机制(参见,例如,Schwartzenberger等人,Blood 87:472-478,1996)。本发明可结合这些和/或其他通常使用的核酸转移方法的任一种使用。包括病毒载体、化学转染子或物理-机械方法如电穿孔和DNA的直接扩散(direct diffusion)的合适转染方法由例如Wolff等人,Science 247:1465-1468(1990);和Wolff,Nature 352:815-818,(1991)描述。 因此,本发明的基因编辑系统的施用可以通过众多熟知方法中的任何一种来实现,例如但不限于在质粒或病毒载体中直接转移核酸,或通过在细胞中的转移,或与诸如阳离子脂质体等载体组合。这些方法是本领域熟知的并且容易适用于本文所述的方法。此外,这些方法可用于通过使用载体的靶向特性靶向某些疾病和组织、器官和/或细胞类型和/或细胞群体,这将是本领域技术人员所熟知的。还应充分理解,细胞和组织特异性启动子可用于本发明的基因编辑系统以靶向特定组织和细胞和/或以治疗特定疾病和病症。 如本领域所熟知的,包含本发明的基因编辑系统的细胞可以是任何细胞,包括但不限于来自肌肉细胞(例如,平滑肌细胞、骨骼肌细胞、心肌细胞)、肝脏细胞(例如,肝细胞)、心脏细胞、脑细胞(例如,神经元细胞)、眼细胞(例如,视网膜细胞;角膜细胞)、胰腺细胞、肾细胞、内皮细胞、上皮细胞、干细胞(例如,骨髓细胞;脐带血细胞)、组织培养细胞(例如,HeLa细胞等)。 在一个实施方案中,与不具有所要求保护的发明的组分的给定工程化基因编辑系统(例如,CRISPR/Cas、TALEN、锌指)的脱靶效应相比,本文所述的基因编辑系统可将(例如由诸如Cas3或Cas9等CRISPR/Cas基因编辑或TALEN基因编辑引起的)脱靶效应降低至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更多。如本文所用,“脱靶效应(off target effect)”是指,通过使用工程化核酸酶活性(例如基因编辑系统的核酸内切酶)而产生的非特异性或非想要的基因突变。未与其靶DNA结合的核酸酶可裂解脱靶双链断裂并在该位置产生基因突变。“脱靶效应”可以是非想要的点突变、缺失、插入、倒位、易位等。本领域技术人员可以通过例如在激活本文所述的基因编辑系统之前和之后的基因组测序来确定是否已经发生脱靶效应,以确定例如在基因编辑后是否在除靶序列以外的位置存在基因突变。评估基因编辑后脱靶效应的方法进一步综述于,例如,专利申请号WO 2015/113063;Slaymaker等人,Science,2016;351(6268):84-88;Morgens等人,Nature Communications.2017;8(15178);Koo等人,Mol Cells.205:38(6):475-481;和HHaeussler等人,Genome Biology.2016;17:148;其每一个通过引用以其整体并入本文。 在一些实施方案中,当与其他基因编辑系统相比时,本发明的核酸具有降低的“渗漏(leakiness)”水平。“渗漏”是指当系统处于“关闭(OFF)”位置时产生的基因产物或功能性RNA的量。例如,在本文所述的一些实施方案中,当本发明的基因编辑系统与结合调控序列的寡核苷酸、小分子和/或本发明的其他化合物不接触时,本发明的系统处于“关闭(OFF)”位置,且因此,第一内含子不被剪接。渗漏可能是这种调控系统中固有的问题,但是在本系统的一些实施方案中,渗漏水平可能低于本领域已知的系统中的渗漏水平。因此,本发明还提供了与其他基因表达调控系统相比具有降低的渗漏的基因表达调控系统,其中该系统包含本发明的基因编辑系统和/或本发明的载体。与其他系统相比,本系统中的渗漏降低的程度可以比在本领域已知的系统中观察到的渗漏量低5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。 作为一个实例,系统的渗漏量可以通过在系统中使用报告基因并检测当系统处于“关闭(OFF)”位置时产生的报告基因产物的量来确定。可以采用多种测定来检测报告基因产物,包括但不限于蛋白质检测测定如ELISA和蛋白印迹以及核酸检测测定如聚合酶链反应、DNA印迹和RNA印迹。用于检测基因产物的其他测定可以包括功能测定,例如,测量归因于基因产物的生物活性的量。本发明的核酸和方法可用于比较分析以证明渗漏水平与其他已知的基因调控表达系统和其中使用的核酸相比降低。 本文还提供了使用本发明的基因编辑系统的各种方法。在一个实施方案中,提供了用于编辑基因的方法。该方法包括向细胞施用基因编辑系统的以下三种组分:i)包含编码核酸酶的核酸序列的载体,其中编码核酸酶的核酸在其序列内包含调控核酸序列,该调控核酸序列具有定义第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中第一内含子和第二内含子被从mRNA信息剪接以产生编码无功能核酸酶的mRNA,该无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和ii)结合调控序列的寡核苷酸,其中在细胞内,寡核苷酸阻止第二组剪接元件从mRNA被剪接,从而产生缺少该外显子并编码对结合gRNA和对靶序列的基因编辑起作用的核酸酶的mRNA。 在一个实施方案中,该方法还包括将gRNA施用给细胞,如果该系统中使用的核酸酶是CRISPR相关的核酸酶的话。 在一个实施方案中,核酸酶是CRISPR相关的核酸酶,例如Cas蛋白。示例性的Cas蛋白包括但不限于Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。 在一个实施方案中,CRISPR相关的核酸酶是例如分离自细菌酿脓链球菌(Streptococcus pyogenes)的Cas9或Cas9变体(SpCas9)。该CRISPR相关的核酸酶为实现其裂解作用与向导RNA(gRNA)相关,该向导RNA将核酸酶引导至期望的靶序列,该靶序列例如具有前间隔序列邻近基序(PAM)序列(在靶序列的下游)。一旦Cas9识别出PAM序列(在SpCas9的情况下为5'-NGG-3,其中N为任何核苷酸),它就会在靶位置处产生双链断裂(DSB)。Cas9活性是蛋白质的两个部分的共同作用:感测gRNA互补序列的识别部分(recognition lobe)和裂解DNA的核酸酶部分(nuclease lobe)。 在一个实施方案中,CRISPR相关的核酸酶是一种增强的特异性spCas9(eSpCas9)变体,其进一步描述于Slaymaker等人,Science.2016;351(6268):84-88,其通过引用以其整体并入本文。 在一个实施方案中,CRISPR相关的核酸酶是Cas的天然变体。在CRISPR实验中,Cas9变体包括,例如,仅举几例,金黄色葡萄球菌(SaCas9)、嗜热链球菌(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、新杀手弗朗西丝菌(FnCas9)和空肠弯曲菌(CjCas9)。核酸酶可以基于优选的PAM序列或尺寸来确定。例如,在一个实施方案中,核酸酶是SaCas9核酸酶,其尺寸比SpCas9小约1kb,因此其可更容易地被包装到病毒载体中,并且例如,它们是两种最紧凑的天然CRISPR变体。SaCas9进一步以例如,CasX和CasY被描述(Burstein,David等人,New CRISPR–Cas systems from uncultivated microbes.Nature542.7640(2017):237;Ran,F.A.等人,In vivo genome editing using Staphylococcusaureus Cas9.Nature 520(186);2015;和Friedland,AE Characterization ofStaphylococcus aureus Cas9:a smaller Cas9 for all-in-one adeno-associatedvirus delivery and paired nickase application.Genome Biol.16:257;2015.;其内容通过引用以其整体并入本文。 各物种的Cas9序列是本领域已知的。例如,金黄色葡萄球菌(saCas9)具有SEQ IDNO:150的序列。 SEQ ID NO:150是编码金黄色葡萄球菌Cas9的氨基酸序列。
在一个实施方案中,CRISPR相关的核酸酶是衍生自空肠弯曲菌(C.jejuni)的Cas9。这种空肠弯曲菌Cas 9(CjCas9)进一步描述于例如,国际专利申请WO 2016/021973A1中,其通过引用以其整体并入本文。 SEQ ID NO:152是编码CjCas9的氨基酸序列。
在一个实施方案中,CRISPR相关的核酸酶是Cas12a(也称为Cpf1)。由于Cas9需要NGG的富含鸟嘌呤的PAM序列,因此它不太适合靶向富含AT的序列。Zetsche等人表征了一种核酸酶(参见例如,美国专利申请US 2016/0208243的序列和变体,通过引用以其整体并入本文),其来自普氏菌属(Prevotella)和弗朗西斯菌属(Francisella)1的CRISPR(Cfp1;现在被分类为Cas12a),可在靶向富含AT的DNA序列时使用。Cfp1在靶DNA中产生交错的双链切口,而不是SpCas9产生的平端切口,并且对于实验是有用的(凭借HDR修复结果)。此外,Cfp1比SpCas9小并且不需要示踪剂RNA。因此Cfp1所需的向导RNA长度更短,使其生产更为经济。 多个物种的Cfp1序列是本领域已知的。例如,氨基酸球菌属的种(Acidaminococcus sp.)Cfp1具有SEQ ID NO:151的序列。 SEQ ID NO:151是编码氨基酸球菌属的种的Cfp1的氨基酸序列。
在一个实施方案中,CRISPR相关的核酸酶是用于CRISPRi或CRISPRa系统的工程化的Cas9变体,例如,Cas9切口酶或失活Cas9。例如,在单链DNA链上产生切口而不是产生双链断裂的变体。(参见例如,Cong,Le等人,“Multiplex genome engineering using CRISPR/Cas systems”Science(2013):1231143;Mali,Prashant等人,“CAS9 transcriptionalactivators for target specificity screening and paired nickases forcooperative genome engineering.Nature biotechnology 31.9(2013):833;Ran,F.Ann等人Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editingspecificity.Cell 154.6(2013):1380-1389;Cho,Seung Woo等人Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickasesGenome research 24.1(2014):132-141,其每一个通过引用以其整体并入本文。在一些实施方案中,两种向导RNA与nCAS9一起使用。可选地,可以使用利用单一gRNA的eSpCas9。虽然切口酶显示了高特异性,但它们依赖两个向导RNA到达靶位点,从而减少了基因组中潜在靶位点的数量。Cas9的工程化版本创建了一个替代方案,该改进方案使用单一向导RNA提高了保真度;(参见例如,Qi,Lei S.等人,“Repurposing CRISPR as an RNA-guided platformfor sequence-specific control of gene expression.Cell 152.5(2013):1173-1183,其通过引用以其整体并入本文)。 在一个实施方案中,CRISPR相关的核酸酶是SpCas9-HF1或HypaCas9Kleinstiver(参见例如,Benjamin P.等人High-fidelity CRISPR–Cas9nucleases with nodetectable genome-wide off-target effects Nature 529.7587(2016):490;Chen,Janice S.等人,Enhanced proofreading governs CRISPR–Cas9 targeting accuracyNature 550.7676(2017):407,其每一个通过引用以其整体并入本文。 在一个实施方案中,CRISPR相关的核酸酶是识别广泛的PAM序列的xCas9核酸酶,从而将基因组中的靶位点增加到四分之一(参见例如,Hu,Johnny H.等人,Evolved Cas9variants with broad PAM compatibility and high DNA specificity Nature(2018),通过引用以其整体并入本文。 在一个实施方案中,CRISPR相关的核酸酶是分割型Cas9(split Cas9)。可进行与荧光蛋白如GFP的融合。这将允许对基因组位点进行成像(参见“Dynamic Imaging ofGenomic Loci in Living Human Cells by an Optimized CRISPR/Cas System”ChenB等人,Cell 2013),但是以可诱导的方式。如此,在一些实施方案中,一个或多个Cas9部分可以与荧光蛋白(例如GFP)缔合(并且特别是与之融合)。通常,使用分割型Case9方法可以对Case 9进行任意使用,无论是寻求野生型、切口酶还是失活Cas9(具有或不具有相关的功能域)。 在一个实施方案中,CRISPR相关的核酸酶是二聚体CRISPR RNA引导的Fokl核酸酶(参见,例如,Tsai SG等人,Nat Biotechnol.2014.32(6):569-576,其通过引用以其整体并入本文)。 在一个实施方案中,CRISPR相关的核酸酶是脑膜炎奈瑟球菌(NmCas9)。NmCas9不同于其他已知的Cas9核酸酶,例如,不同于SaCas9和StCas9,因为它识别5'-NNNNGATT-3'PAM序列;参见,例如,Esvelt,KM.等人,Nature Methods(2013);和Hou,Z.等人,PNAS(2013),其内容通过引用以其整体并入本文。 在一个实施方案中,CRISPR相关的核酸酶是截短的。如本文所用,“截短的(truncated)”是指一种核酸酶已被修饰以从野生型序列去除某些氨基酸。截短的核酸酶可以保留其功能,例如,DNA切割,或者它可以缺乏其功能(例如,无活性的核酸酶)。在一个实施方案中,CRISPR相关的核酸酶是截短的Cas9。在一个实施方案中,CRISPR相关的核酸酶是截短的NmCas9。截短的Cas9核酸酶例如,NmCas9的序列进一步描述于美国专利申请号2019/0040371,其通过引用以其整体并入本文。 在一个实施方案中,CRISPR相关的核酸酶是无活性Cas9、失活Cas9(也称为dCAS9)。失活Cas9(dCas9)CRISPR变体是通过简单地使核酸酶催化结构域失活同时保持识别结构域而制成的,识别结构域允许向导RNA介导的对特定DNA序列的靶向(Komor,AlexisC.等人Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage)”Nature 533.7603(2016):420,通过引用以其整体并入本文)。已知dCas9通过物理阻断转录使基因表达沉默。dCas9也已经与其他蛋白质融合并用于各种应用。例如,基因激活剂或抑制剂可以与dCas9融合以激活或阻遏基因表达(CRISPRa和CRISPRi)。此外,将荧光染料标记至dCas9能够使基因组中的特定DNA片段可视化(Gaudelli,Nicole M.等人,Programmable base editing of A·T to G·C in genomicDNA without DNA cleavage Nature 551.7681(2017):464,其通过引用以其整体并入本文)。在一个实施方案中,使用了FokI融合的dCas9(Abudayyeh,Omar O.等人,C2c2 is asingle-component programmable RNA-guided RNA-targeting CRISPReffector.Science353.6299(2016):aaf557314,通过引用以其整体并入本文)。 在一个实施方案中,失活的CRISPR相关的核酸酶因用作碱基编辑器而成为功能性基因编辑核酸酶。碱基编辑器酶由与将GC转化为AT的催化酶,胞苷氨酶融合的失活Cas9结构域组成或者由例如与Cas9融合的将AT转化为GC的tRNA腺苷脱氨酶组成,因此允许基因组中全范围的核苷酸交换:参见例如,Komor,Alexis C.等人,Programmable editing of atarget base in genomic DNA without double-stranded DNA cleavage.Nature533.7603(2016):420;Gaudelli,Nicole M.等人,Programmable base editing of A·Tto G·C in genomic DNA without DNA cleavage.Nature 551.7681(2017):464;通过引用以其整体并入本文。 在一个实施方案中,靶序列是RNA并且CRISPR相关的核酸酶是RNA编辑器例如Cas1391和Cas1392(参见例如,Abudayyeh,Omar 0.等人,RNA targeting with CRISPR—Cas13.Nature 550.7675(2017):280;Smargon,Aaron A.等人,Cas13b is a type VI-BCRISPR-associated RNA-guided RNase differentially regulated by accessoryproteins Csx27 and Csx28.”Molecular cell 65.4(2017):618-630;其每一个通过引用以其整体并入本文。在一个实施方案中,核酸酶是Cas13d。通过扫描原核生物序列获得类似于先前已知的Cas13酶的核酸酶,鉴定了Cas13d核糖核酸酶家族。这些RNA引导的RNA酶比Cas13a—Cas13c核酸酶小约20%,但显示出与先前已知的变体相当的靶向效率。这些酶的较小尺寸赋予它们若干优点,例如更便于包装和递送到细胞中(参见例如,Konermann,Silvana等人,“Transcriptome Engineering with RNA-Targeting Type VI-D CRISPREffectors.Cell(2018);Yan,Winston X.等人Cas13d Is a Compact RNA-Targeting TypeVI CRISPR Effector Positively Modulated by a WYL-Domain-Containing AccessoryProtein.Molecular cell(2018),其每一个通过引用以其整体并入本文)。 靶多核苷酸(例如,靶序列)包括本文所述的共定位复合物可用于调控或切割的任何多核苷酸序列。靶多核苷酸包括基因。出于本公开的目的,DNA(例如双链DNA)可包括靶多核苷酸,并且共定位复合物可在靶多核苷酸处或挨着靶多核苷酸或在靶多核苷酸附近与DNA结合或以其他方式与DNA共定位并且以共定位复合物可对靶多核苷酸发挥所需作用的方式。这样的靶多核苷酸可以包括内源性(或天然存在的)多核苷酸和外源性(或外来的)多核苷酸。基于本公开,本领域技术人员将能够容易地鉴定或设计共定位至包括靶核酸的DNA的向导RNA和Cas9蛋白。技术人员还能够鉴定同样共定位至包括靶核酸的DNA的转录调控蛋白或结构域。DNA包括基因组DNA、线粒体DNA、病毒DNA或外源DNA。 在一个实施方案中,靶多核苷酸是疾病基因。如本文所用,“疾病基因”是指具有导致给定疾病或引起给定疾病发作的遗传改变(例如,遗传突变)的基因。遗传改变可以是但不限于错义突变、无义突变、取代、插入、缺失、重复、移码突变、易位、倒位、重复扩增或编码的隐蔽(cryptic)起始位点或终止位点。遗传改变可导致例如基因或基因产物的活性增加、基因或基因产物的活性降低、基因的可变剪接、截短的基因或基因产物或延长的基因或基因产物。换句话说,疾病基因的遗传改变导致基因或基因产物的活性、功能和/或水平与野生型基因(例如,不具有基因突变的基因)相比被改变。下文进一步描述可以用本文所述的系统治疗的示例性疾病及其相应的疾病基因。给定疾病的疾病基因是本领域已知的。本领域技术人员可以使用标准技术确定受试者中给定基因的遗传改变的类型。例如,可对患有给定疾病的受试者进行基因组测序,并比较未患有该疾病的受试者的基因组序列。使用该技术,本领域技术人员可以评估受试者基因组中任何基因的序列,或者可以专门集中于推定的或已知的疾病基因。 如本文所用,术语“向导RNA”通常是指这样的RNA分子(或总的一组RNA分子),其可以结合CRISPR相关的核酸酶(例如,核酸内切酶,例如Cas蛋白)并且帮助将核酸内切酶靶向至靶多核苷酸(例如,DNA)内的特定位置。向导RNA可以包含crRNA片段和tracrRNA片段。如本文所用,术语“crRNA”或“crRNA片段”是指RNA分子或其部分,其包括多核苷酸靶向引导序列、茎序列和任选的5'突出端序列(5'-overhang sequence)。如本文所用,术语“tracrRNA”或“tracrRNA片段”是指包括蛋白结合片段的RNA分子或其部分(例如,蛋白结合片段能够与CRISPR相关蛋白如Cas9相互作用。术语“向导RNA”涵盖单一向导RNA(sgRNA),其中crRNA片段和tracrRNA片段位于同一RNA分子中。术语“向导RNA”还共同涵盖两种或更多种RNA分子的组,其中crRNA片段和tracrRNA片段位于不同的RNA分子中。 具有“gRNA功能”的合成向导RNA是这样一种向导RNA,其具有天然存在的向导RNA的一种或多种功能(例如与核酸内切酶缔合)或向导RNA与核酸内切酶联合所执行的功能。在某些实施方案中,功能性包括结合靶多核苷酸。在某些实施方案中,功能性包括将核酸内切酶或gRNA:核酸内切酶复合物靶向到靶多核苷酸。在某些实施方案中,功能性包括使靶多核苷酸产生切口。在某些实施方案中,功能性包括裂解靶多核苷酸。在某些实施方案中,功能性包括与核酸内切酶缔合或结合。在某些实施方案中,功能性是向导RNA在具有核酸内切酶的CRISPR相关的核酸酶系统(包括具有工程化核酸内切酶,例如,工程化Cas蛋白的人工CRISPR相关的核酸酶系统)中的任何其他已知功能。在某些实施方案中,功能性是天然向导RNA的任何其他功能。合成的向导RNA可以具有比天然存在的向导RNA更高或更低程度的gRNA功能。在某些实施方案中,与类似的天然存在的向导RNA相比,合成的向导RNA可能在一种性质方面具有较大的功能性,而在另一种性质方面具有较小的功能性。 例如,与本文所述系统一起使用的向导RNA是本领域已知的,并且进一步描述于美国专利第9,834,791号;和专利申请号US2013/0254304。例如,与ZFN系统一起使用的向导RNA是本领域已知的,并且进一步描述于国际专利申请号W02014/186,585。本文引用的专利通过引用以其整体并入本文。 可以使用例如以下的预测软件为给定的靶序列轻松生成向导RNA序列:CRISPRdirect(可在万维网上的crisper.dbels.jp/获得),参见Natio等人Bioinformatics(2015)4月1日;31(7):1120-1123;ATUM gRNA设计工具(可在万维网上的atum.bio:ecommerce/cas9/input获得);CRISPR-ERA(可在万维网上的crispr-era.stanford.eduu/indexjsp获得),参见Liu等人Bioinformatics,(2015)11月15日;31(22):3676-3678。本文引用的所有参考文献通过引用以其整体并入本文。公开可用的gRNA设计软件的非限制性实例包括:sgRNA Scorer 1.0、Quilt通用向导RNA设计器、Cas-OFFinder&Cas-Designer、CRISPR-ERA、CRISPR/Cas9靶标在线预测器、设计gRNA的Off-Spotter、CRISPRMultiTargeter、ZiFiT Targeter、CRISPRdirect、来自crispr.mit.edu/的CRISPR设计、E-CRISP等。 本文所述的向导RNA可以被修饰,例如,通过化学修饰。向导RNA的示例性化学修饰描述于例如专利申请W02016/089,433中,其通过引用以其整体并入本文。 在本文所述的任何方法中,可以将结合调控序列和/或小分子和/或其他化合物的寡核苷酸导入包含本文所述的基因编辑系统的组分的细胞中,并且这样的细胞可以位于动物中,所述动物可以是人、非人哺乳动物(狗、猫、马、牛等)或其他动物。 当编码一种或多种单一向导RNA的核酸和编码本文所述的CRISPR相关的核酸酶(RNA引导的核酸酶)的核酸各自需要在体内施用时,特别考虑使用腺病毒相关载体(AAV)。用于同时将核酸递送至基因组编辑/片段化系统的所有组分(例如,sgRNA、RNA-引导的核酸内切酶)的其他载体包括慢病毒载体,例如EB(Epstein Barr)病毒、人免疫缺陷病毒(HIV)和乙型肝炎病毒(HBV)。RNA引导的基因组编辑系统的每个组分(例如,sgRNA和核酸内切酶)可以在单独的载体(病毒或非病毒)中递送,如本领域已知的或如本文所述的。此外,与调控序列结合并阻止导致功能性核酸酶表达的剪接的基因编辑系统的寡核苷酸组分可以通过裸DNA、非病毒载体或通过使用病毒载体递送。 高剂量的核酸酶(例如Cas9)可以加剧显示与导引链极少错配的脱靶序列的插入缺失(indel)频率。如果错配是不连续的和/或在向导物的种子区之外,则这样的序列是特别敏感的。在本文中,我们描述了一种通过核酸酶活性的特异性调控(对CRISPR相关的核酸酶活性的时间控制和局部控制)来减轻脱靶效应的方法。本文所述的基因编辑系统可以用于在长期表达实验中降低剂量并且因此导致与组成型活性的CRISPR相关的核酸酶(例如,Cas9)相比降低的脱靶插入缺失。在一些实施方案中,使用了使毒性和脱靶效应的水平最小化的其他方法,并且包括例如使用Cas切口酶mRNA(例如,具有D10A突变的酿脓链球菌Cas9)和一对靶向目标位点的向导RNA,还参见WO 2014/093622(PCT/US2013/074667),其通过引用以其整体并入本文。 结合本发明的调控序列的寡核苷酸是阻止在特定剪接位点的剪接活性的寡核苷酸(例如,RNA或DNA或两者的组合)。结合调控序列的寡核苷酸结合的核苷酸序列是指导剪接事件的剪接元件组例如第二组剪接元件的成员,从而抑制剪接。因此,结合调控序列的寡核苷酸可以与剪接点、5'剪接元件、3'剪接元件、隐蔽剪接元件、分支点、隐蔽分支点、天然剪接元件、突变剪接元件等互补。本发明的结合调控序列的寡核苷酸的一些非限制性实例包括对珠蛋白内含子654T突变特异的GCTATTACCTTAACCCAG(SEQ ID NO:37);对珠蛋白内含子657GT突变特异的GCACTTACCTTAACCCAG(SEQ ID NO:38)。其他实例包括包含以下的核苷酸序列、主要由以下的核苷酸序列组成或由以下的核苷酸序列组成的寡核苷酸:SEQ IDNo:37、38、42、49、46、47、48、39、40、41、43、44、45、72、73、76、79和80。在这些寡核苷酸序列的上下文中,“主要由…组成”意指该寡核苷酸可以在寡核苷酸序列的3'端或5'端包括另外的核苷酸(例如,1、2、3、4、5、6、7、8、9或10个另外的核苷酸),这些另外的核苷酸实质上不影响寡核苷酸的功能或活性(例如,这些另外的核苷酸不与互补于原始寡核苷酸序列的序列杂交)。 在一个实施方案中,结合调控结构域的寡核苷酸具有选自表4的序列。 在一个实施方案中,具有SEQ ID NO:138的序列的寡核苷酸(例如,LNA-AON1)结合具有SEQ ID NO:143序列的调控序列。 在一个实施方案中,具有SEQ ID NO:139的序列的寡核苷酸(例如,LNA-AON2)结合具有SEQ ID NO:144的序列的调控序列。 在一个实施方案中,具有SEQ ID NO:140的序列的寡核苷酸(例如,LNA-AON3)结合具有SEQ ID NO:145的序列的调控序列。 在一个实施方案中,具有SEQ ID NO:141的序列的寡核苷酸(例如,LNA-AON4)结合具有SEQ ID NO:146的序列的调控序列。 在一个实施方案中,具有SEQ ID NO:142的序列的寡核苷酸(例如,LNA-654)结合具有SEQ ID NO:147的序列的调控序列。 在一个实施方案中,寡核苷酸结合的调控序列选自表5。 在一个实施方案中,调控序列野生型247aa:GGGTTAAG/GCAATAGC具有SEQ ID NO:148的核苷酸序列。
在一个实施方案中,结合野生型247aa调控序列的寡核苷酸(oligo)是寡核苷酸 在一个实施方案中,调控序列IVS2(S0)-654:GGGTTAAG/GTAATAGC具有SEQ ID NO:147的核苷酸序列。
在一个实施方案中,结合IVS2(S0)-654调控序列的寡核苷酸是寡核苷酸Oligo5'-GcTaTtAcCtTaAcCc-3'(SEQ ID NO:142)。 在一个实施方案中,调控序列LUC-AON1:GAGGGCAG/GTGAGTAC具有SEQ ID NO:143的核苷酸序列。
在一个实施方案中,结合LUC-AON1调控序列的寡核苷酸是寡核苷酸 在一个实施方案中,调控序列LUC-AON2:GTGCCGAG/GTAAGTTC具有SEQ ID NO:144的核苷酸序列。
在一个实施方案中,结合LUC-AON2调控序列的寡核苷酸是寡核苷酸 在一个实施方案中,调控序列LUC-AON3:CTGACTAG/GTGAGTCC具有SEQ ID NO:SEQID NO:145的核苷酸序列。
在一个实施方案中,结合LUC-AON3调控序列的寡核苷酸是寡核苷酸 在一个实施方案中,调控序列Luc-AON4:GCCAATAG/GTAAGTGC具有SEQ ID NO:146的核苷酸序列。
在一个实施方案中,结合LUC-AON4调控序列的寡核苷酸是寡核苷酸 在一些实施方案中,结合调控序列的寡核苷酸可以是不激活RNA酶H的寡核苷酸。不激活RNA酶H的寡核苷酸可以根据已知技术制备。参见,例如,Pederson等人的美国专利第5,149,797号。这种寡核苷酸可以是脱氧核糖核苷酸或核糖核苷酸序列,包含在空间上阻碍或阻止RNA酶H与包含该寡核苷酸作为其一个成员的双链体分子的结合的任何结构修饰,该结构修饰基本上不阻碍或破坏双链体的形成。因为参与双链体形成的寡核苷酸部分与参与RNA酶H结合的寡核苷酸部分有很大的不同,所以许多不激活RNA酶H的寡核苷酸是可用的。 本发明的寡核苷酸也可以是这样的寡核苷酸,其中至少一个或全部核苷酸间桥连的磷酸酯残基是修饰的磷酸酯,例如甲基膦酸酯、甲基硫代磷酸酯、磷酰吗啉酯(phosphoromorpholidate)、磷酰哌嗪酯(phosphoropiperazidate)和氨基磷酸酯(phosphoramidate)。作为另外的实例,核苷酸间桥连磷酸酯残基中的每隔一个可以如描述的那样进行修饰。在另一个非限制性实例中,这种寡核苷酸是其中至少一个或全部核苷酸含有2'低级烷基部分(例如,C1-C4、直链或支链的、饱和或不饱和的烷基,例如甲基、乙基、乙烯基、丙基、1-丙烯基、2-丙烯基和异丙基)的寡核苷酸。例如,核苷酸中每隔一个可以如描述的那样进行修饰。(还参见Furdon等人Nucleic Acids Res.17:9193-9204(1989);Agrawal等人,Proc.Natl.Acad.Sci.USA 87:1401-1405(1990);Baker等人Nucleic AcidsRes.18,3537-3543(1990);Sproat等人Nucleic Acids Res.17:3373-3386(1989);Walder和Walder,Proc.Natl.Acad.Sci.USA 85:5011-5015(1988))因此,在一些实施方案中,本发明的阻断核苷酸可以包含修饰的核苷酸间桥连磷酸酯残基,其可以是但不限于甲基硫代磷酸酯、磷酰吗啉酯、磷酰哌嗪酯和/或氨基磷酸酯的任意组合。在某些实施方案中,阻断可以包括在其2'位具有低级烷基取代基的核苷酸。 本文所述的调控序列的寡核苷酸可被例如小分子修饰以增加其在细胞中向RNA的募集。以这种方式修饰的寡核苷酸当在细胞中与小分子共表达时将具有增加的结合和裂解RNA的效率。对这种修饰的其他综述可见于,例如,Costales,MG等人,J.Am.Chem.Soc.2081,140;6741,-6744;美国专利申请号US2008/0227213A1;和国际专利号WO 2015/021415A1;其每一个通过引用以其整体并入本文。 可以修饰本文的结合调控序列的寡核苷酸,例如为了增加寡核苷酸的渗透性、亲和力、稳定性(例如,防止其降解)和药效学性质。这种修饰的实例包括但不限于肽核酸(PNA)和锁核酸(LNA)。这些修饰的进一步综述可见于,例如,Havens,MA等人Nucleic AcidsResearch 2016:44(14);6549-6563,其通过引用以其整体并入本文。 在PNA中,主链由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元构成。不同的碱基(嘌呤和嘧啶)通过亚甲基羰基键(methyl carbonyl linkage)与主链连接。不同于DNA或其他DNA类似物,PNA不含有任何戊糖部分或磷酸基团。PNA被描述得类似N末端在第一(左)位置且C末端在右的肽。PNA主链不带电荷,并且这为该聚合物提供的PNA/DNA链之间的结合比在PNA链和在DNA链之间强得多。这是由于PNA和DNA链之间缺乏电荷排斥。 与在低于10℃的温度下变性的DNA dT/DNA dA 6聚体双链体相比,使用同型嘧啶链的早期实验显示6聚体PNAT/DNA dA的Tm被确定为31℃。 其肽主链带有嘌呤和嘧啶碱基的PNA并不是容易被核酸酶或蛋白酶识别的分子种类。因此它们抗酶降解。PNA在宽pH范围内也是稳定的。因为它们不易被酶降解,这些聚合物的寿命在体外和体内都被延长。此外,它们不带电荷的事实有助于它们穿过细胞膜,并且它们更强的结合特性应减少调控基因表达所需的寡核苷酸的量。 LNA是一类含有核苷的核酸,其主要的区别特征是在核糖环的2'-O和4'-C原子之间存在亚甲基桥。该桥限制了核苷酸类似物的呋喃核糖环的柔性并将其锁定为刚性双环N-型构象。此外,LNA诱导相邻的DNA碱基采取这种构象,导致形成热力学上更稳定形式的A双链LNA核苷,其含有在DNA(A、T、G、C)中出现的四个常见核酸碱基,它们可以根据标准沃森-克里克法则与其互补核苷碱基配对。使用标准亚磷酰胺DNA合成化学可以将LNA与DNA或RNA以及其他核酸类似物混合。因此,LNA寡核苷酸可以容易地用例如氨基-接头、生物素、荧光团等加标签。因此,在引物和探针的设计中存在非常高的自由度。它们的锁定构象增加了对互补序列的结合亲和力,并提供了新的化学方法来优化和微调用于灵敏和特异地检测核酸的引物和探针。该差异在实验上可观察为LNA-NA异源双链体的增加的热稳定性,并且取决于序列中存在的LNA核苷的数目以及所使用的碱基的化学性质。这种实验差异可用于调控寡核苷酸探针的特异性,该探针被设计为通过标准杂交技术检测特定核酸靶标。 如本文所用,“第二组剪接元件的成员”包括参与激活来自前体mRNA的第二内含子剪接的任何元件。例如,第二组剪接元件的元件可以是天然DNA和/或前体mRNA中的突变的结果,该突变可以是产生新剪接元件的置换突变和/或添加突变和/或缺失突变。新剪接元件因此是限定第二内含子的第二组剪接元件的一个成员。第二组剪接元件的其余成员也可以是限定第一内含子的剪接元件组的成员。例如,如果突变产生了既在第一3'剪接位点上游(即在其5'端)又在第一分支点下游(即在其3'端)的新的第二3'剪接位点,那么第一5'剪接位点和第一分支点可作为第一组剪接元件和第二组剪接元件二者的成员。 在一些情况下,导入第二组剪接元件可导致正常休眠的或作为剪接元件不起作用的RNA的天然区域被激活并用作剪接元件。这些元件被称为“隐蔽(cryptic)”元件。例如,如果导入新的3'剪接位点,其位于第一3'剪接位点和第一分支点之间,则其可以激活新的3'剪接位点和第一分支点之间的隐蔽分支点。 在其他情况下,导入位于第一分支点和第一5'剪接位点之间的新的5'剪接位点可以进一步在该新的5'剪接位点的上游顺序地激活隐蔽3'剪接位点和隐蔽分支点。在这种情况下,第一内含子被分为两个异常内含子,其间有一个新的外显子。 此外,在第一剪接元件(特别是分支点)也是第二组剪接元件的成员的一些情况下,有可能会阻断第一元件并激活隐蔽元件(即,隐蔽分支点),该隐蔽元件将募集第一组剪接元件的其余成员相对于不正确的剪接强制正确的剪接。还要注意,当激活隐蔽剪接元件时,它可以位于内含子和/或相邻外显子中的一个外显子中。因此如上所述,根据构成“第二组剪接元件”的剪接元件组,本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物可以阻断各种不同的剪接元件以实施本发明。例如,它可以阻断突变元件、隐蔽元件、天然元件、5'剪接位点、3'剪接位点和/或分支点。通常,如上所述,它不会阻断也定义第一内含子的剪接元件,当然考虑了阻断第一内含子的剪接元件激活隐蔽元件的情况,该隐蔽元件随后充当第一组剪接元件的替代成员并参与正确剪接。 结合调节序列的寡核苷酸的长度(即其中的核苷酸数目)不是关键的,只要其选择性地结合期望的位置即可,并且可以根据常规程序确定。因此,在一些实施方案中,本发明的结合调控序列的寡核苷酸的长度可以为约5至约100个核苷酸。特别地,本发明的阻断核苷酸长度可以是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个核苷酸。在一些实施方案中,本发明的结合调控序列的寡核苷酸长度为8至50个核苷酸。又在本发明的其他实施方案中,结合调控序列的寡核苷酸的长度为15-25个核苷酸,并且长度也可以是18-20个核苷酸。结合调控序列的寡核苷酸可以作为相同寡核苷酸的群体和/或以任何组合和/或相对于彼此的任何比例存在的不同寡核苷酸的群体用在本文所述的方法中。 本发明的小分子是与其他小分子相比结构和/或功能不同并且具有低分子量(例如,小于5,000道尔顿)的活性化合物。小分子可以是天然或合成物质。它们可以通过有机化学方案合成和/或从天然来源如植物、真菌和微生物分离。小分子可以是“药物样的”(例如,阿斯匹林、青霉素、化疗药物)有毒的和/或天然的。小分子药物可以是一种或多种活性化合物,通常配制为可口服的丸剂,其与特定的生物靶标(例如受体、酶或离子通道)相互作用以提供治疗效果。本发明的小分子的具体但非限制性的实例包括抗生素、核苷类似物(例如,丰加霉素)和适体(例如,RNA适体;DNA适体)。 本发明的小分子可以是存在于任何数量的小分子文库中的小分子,其中一些可商购获得。可以含有本发明的小分子的文库的非限制性实例包括从各种商业实体例如SPECS和BioSPEC B.V.(Rijswijk荷兰)、Chembridge Corporation(San Diego,CA)、ComgenexUSA Inc.,(Princeton,NJ)、Maybridge Chemical Ltd.(Cornwall,UK)以及Asinex(Moscow,Russia)获得的小分子文库。一个典型实例称为DIVERSetTM,可从ChemBridgeCorporation,16981Via Tazon,Suite G,San Diego,Calif.92127获得。DIVERSetTM含有10,000至50,000个药物样、手工合成的小分子。预先选择化合物以形成“通用”库,该“通用”库涵盖具有最小数量的化合物的最大药效团多样性且适于高通量或低通量筛选。关于其他文库的描述,参见,例如Tan等人,“Stereoselective Synthesis of Over Two MillionCompounds Having Structural Features Both Reminiscent of Natural Products andCompatible with Miniaturized Cell-Based Assays 120,8565-8566,1998;Floyd等人,Prog Med Chem 36:91-168,1999。许多文库可从例如AnalytiCon USA Inc.,P.O.Box5926,Kingwood,Tex.77325;3D制药公司(3-Dimensional Pharmaceuticals,Inc.),665Stockton Drive,Suite 104,Exton,Pa.19341,-1151;Tripos Inc.,1699Hanley Rd.,St.Louis,Mo.,63144-2913等商购获得。 本发明的小分子和其他化合物可以通过多种机制起作用以改变本发明核酸中的剪接事件。例如,本发明的小分子和其他化合物可以干扰剪接复合物、剪接体及其组分例如hnRNP、snRNP、SR-蛋白和其他剪接因子或元件的形成和/或功能和/或其他性质,导致前体mRNA分子中的剪接事件被阻止和/或诱导。作为另一个实例,本发明的小分子和其他化合物可以防止和/或修饰基因产物的转录,该基因产物可以包括例如但不限于hnRNP、snRNP、SR蛋白和其他剪接因子,其随后参与特定剪接体的形成和/或功能。本发明的小分子和其他化合物还可以防止和/或改变基因产物的磷酸化、糖基化和/或其他修饰,该基因产物包括但不限于hnRNP、snRNP、SR蛋白和其他剪接因子,其随后参与特定剪接体的形成和/或功能。另外,本发明的小分子和其他化合物可以结合和/或以其他方式影响特异性前体mRNA,从而通过不涉及以序列特异性方式与RNA碱基配对的机制来阻止或诱导特定剪接事件。 本发明还提供了在受试者中进行基因编辑的方法,包括:a)将本发明的基因编辑系统导入受试者;和b)将本发明的结合调控序列的寡核苷酸和/或小分子和/或阻断第二组剪接元件的成员的其他化合物导入受试者,从而产生在受试者中赋予生物学功能的蛋白质和/或RNA。 可以根据领域已知的方法随时间监测受试者中发生的基因编辑的程度,并且当量降至期望的和/或治疗水平以下时,可以将结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者中以增加蛋白质和/或RNA的产量,从而调控产量。 在本文所述的方法中,其中在结合调控序列的寡核苷酸和/或小分子和/或其他化合物(它们的存在将导致第二组剪接元件中的成员被阻断)不存在或不存在其表达的情况下将本发明的基因编辑系统施用给受试者,该核酸、载体和/或细胞可能最初存在于受试者中。在这种状态下,第二组剪接元件是有活性的,并且受试者中不产生或极少(例如,微不足道)产生赋予生物学功能的如由核酸酶序列编码的外源蛋白、肽和/或RNA。当受试者中存在本发明的结合调控序的寡核苷酸、小分子和/或其他化合物时,核酸上的第二组剪接元件的成员被阻断,导致第一内含子通过剪接被去除并随后在受试者中产生由赋予生物学功能(例如,基因编辑)的核酸酶序列编码的蛋白质和/或RNA。 结合调控序列的寡核苷酸、小分子和/或其他化合物可以在相对于将本发明的基因编辑系统导入受试者的任何时间导入受试者。例如,可以在将核酸、载体和/或细胞导入受试者之前、同时和/或之后,将结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者。此外,结合调控序列的寡核苷酸、小分子和/或其他化合物可以在任何时间间隔内一次或多次施用,并且可以延长至贯穿受试者的寿命。 因此,在一些实施方案中,本发明提供了一种治疗受试者的疾病或病症的方法,包括:a)将有效量的本发明的基因编辑系统导入受试者;和b)将有效量的本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物导入受试者,从而治疗受试者中的病症。当核酸、载体和/或细胞以及结合调控序列的寡核苷酸、小分子和/或其他化合物在受试者中存在时,它们是在结合调控序列的寡核苷酸、小分子和/或其他化合物能够接触核酸并阻断第二组剪接元件的成员的条件下存在的,从而导致受试者中产生赋予生物学功能的蛋白质、肽和/或RNA。参见例如图11;当第二组剪接元件被结合调控序列(ASO(LNA544))的寡核苷酸阻断时,产生了编码正确蛋白质而没有非天然外显子的mRNA(CS)。然而,当缺少寡核苷酸时,第一内含子和第二内含子逐个地被从前体mRNA剪接,产生包含(例如,包含框内终止密码子的)非天然存在的外显子的mRNA,并且产生无功能蛋白质(AS)。 在另外的实施方案中,根据本发明的方法调控基因表达可以与本文所述系统相反地进行。具体地,在一些实施方案中,在存在结合调控序列的寡核苷酸、调控剪接介导的表达的小分子和/或其他化合物时,系统处于本文所述的“关闭(OFF)”位置。 在一个实施方案中,例如,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在空间控制下被选择性地控制。例如,系统的组分可以被局部递送/施用至期望的位点、位置、器官、细胞类型、组织类型等,以诱导基因编辑系统局部“打开(ON)”。不需要所有组分都被局部递送/施用。在一个实施方案中,组分(a)和(b)可以全身施用,而组分(c)可以局部施用,导致基因编辑系统的局部控制(例如,“打开(ON)”)。在一个实施方案中,组分(a)和(b)可以局部施用,而组分(c)可以全身施用。可以通过将组分直接递送至特定位置来实现基因编辑系统的组分的局部递送。可选地,可使用将组分驱动至特定位置的定位序列或允许所述组分在特定位置表达的特定启动子来实现局部递送。在一个实施方案中,通过直接注射(例如注射至肌肉、心脏或其他器官)来实现局部递送。 在另一个实施方案中,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在时间控制下被选择性地控制。例如,可以在给定的持续时间内施用基因编辑系统的组分,以控制系统“打开(ON)”或“关闭(OFF)”的时间。例如,组分(c)的脉冲施用(例如,间歇施用)可能导致基因编辑系统反复地“打开(ON)”和“关闭(OFF)”。 在一个实施方案中,本文所述的基因编辑系统的“打开(ON)”和“关闭(OFF)”控制在时间控制和空间控制下被选择性地控制。 治疗 本发明的基因编辑系统、结合调控序列的寡核苷酸、小分子和/或其他化合物的“有效量”是指无毒但足以提供期望效果(可能是有益效果和/或治疗效果)的量。如本领域所充分理解的,所需的确切量将随受试者而变化,这取决于受试者的年龄、性别、物种、一般情况、正在治疗的病况的严重程度、所施用的特定药剂等。在任何单独情况下,适当的“有效”量可以由本领域技术人员通过参考相关的教科书和文献(例如,Remington’sPharmaceutical Sciences(最新版本))和/或通过使用常规药理学程序来确定。 本文所用的“治疗(treat或treating)”是指任何类型的治疗,其对被诊断患有、有风险患有、怀疑患有和/或可能患有能够以有利方式对本发明的蛋白质和/或RNA作出响应的疾病或病症的受试者给予益处。益处可包括受试者的病况(例如,一种或多种症状)的改善、病况进展的延迟和/或逆转、疾病或病症发作的阻止或延迟等。 可以通过本发明的方法治疗的疾病和/或病症的非限制性实例和可以由本发明的核酸酶序列编码并且可以赋予治疗效果的基因产物的一些实例包括代谢疾病,例如糖尿病(胰岛素)、生长/发育障碍(生长激素;调控生长因子的锌指蛋白)、血液凝固障碍(例如,血友病A(因子VIII);血友病B(因子IX)、中枢神经系统疾病(例如,癫痫发作(seizure)、帕金森病(神经胶质衍生的神经营养因子(GDNF)和GDNF样生长因子)、阿尔茨海默病(神经生长因子、GDNF和GDNF样生长因子)、肌萎缩性侧索硬化、脱髓鞘疾病)、骨同种异体移植(骨形态发生蛋白2)(蛋白1-9,例如,MBP2)、炎性病症(例如,关节炎、自身免疫性疾病)、肥胖、癌症、心血管疾病(例如,充血性心力衰竭(磷蛋白和与Ca泵有关的基因)、黄斑变性(色素上皮衍生因子(PDEF)、13-地中海贫血、a-地中海贫血、泰-萨综合征(Tay-Sachssyndrome)、苯丙酮尿症、囊性纤维化和/或病毒感染)。 另外的实例包括编码可溶性CD4的核酸(用于治疗AIDS)和编码α-抗胰蛋白酶的核酸(用于治疗由α-抗胰蛋白酶缺乏引起的肺气肿)。可以通过本发明的方法和组合物治疗的其他疾病、综合征和病况包括,例如,腺苷脱氨酶缺乏症、镰状细胞缺乏症、脑病如亨廷顿氏病、溶酶体贮积病、戈谢病、赫尔勒氏综合征、克拉伯氏病、运动神经元疾病如显性脊髓小脑性共济失调(实例包括SCA1、SCA2和SCA3)、地中海贫血、血友病、苯丙酮尿症和心脏病,例如由胆固醇代谢改变和免疫系统缺陷引起的那些。可通过这些方法治疗的其他疾病包括代谢性疾病,例如肌肉骨骼疾病、心血管疾病和癌症。还可以将本发明的基因编辑系统递送至气道上皮细胞以治疗遗传疾病例如囊性纤维化、假性醛固酮减少症(pseudohypoaldosteronism)和纤毛不动综合征以及非遗传疾病(例如,支气管炎、哮喘)。还可以将本发明的基因编辑系统递送至肺泡上皮细胞以治疗遗传疾病如α-1-抗胰蛋白酶以及肺病(例如,治疗肺炎和肺气肿肺纤维化、肺水肿;将编码表面活性蛋白的核酸递送至早产婴儿或ARDS患者)。 通常,本发明的基因编辑系统可用于递送具有生物学功能的任何核酸,以治疗或改善与基因表达相关的任何疾病相关的症状。例证性的疾病状态包括但不限于:囊性纤维化(和其他肺部疾病)、血友病A、血友病B、地中海贫血、贫血和其他血液病、AIDS、癌症(例如,脑肿瘤)、糖尿病、肌肉萎缩症(例如,杜氏肌肉萎缩症、Becker型肌肉萎缩症)、戈谢病、赫尔勒氏综合征、腺苷脱氨酶缺乏症、糖原贮积病和其他代谢缺陷、粘多糖病以及实体器官(例如脑、肝、肾、心脏、肺、眼睛等)的疾病。 在某些实施方案中,可以施用本发明的递送载体以治疗CNS疾病,包括遗传疾病、神经变性疾病、精神障碍和/或肿瘤。示例性的CNS疾病包括但不限于阿尔茨海默病、帕金森病、亨廷顿病、雷特综合征、卡纳万病、雷氏病(Leigh's disease)、雷夫叙姆病、妥瑞综合征、原发性侧索硬化症、肌萎缩性侧索硬化症、进行性肌萎缩症、匹克氏病、肌肉萎缩症、多发性硬化症、重症肌无力、宾斯旺格病(Binswanger's disease)、脊髓或头部受伤引起的外伤、泰萨病(Tay Sachs disease)、Lesch-Nyhan综合征、癫痫、脑梗塞、精神疾病包括情绪障碍(例如抑郁症、双相情感障碍、持续性情感障碍、继发性情绪障碍)、精神分裂症、药物依赖(例如,酒精中毒和其他物质依赖)、神经症(例如,焦虑、强迫性障碍、躯体形式障碍、解离性障碍、忧郁、产后抑郁症)、精神病(例如,幻觉和妄想)、痴呆、妄想症、注意力缺陷障碍、性心理障碍、睡眠障碍、疼痛障碍、饮食或体重障碍(例如,肥胖、恶病质、神经性厌食症和贪食症)以及CNS的癌症和肿瘤(例如,垂体肿瘤)。 可根据本发明的方法治疗的CNS病症包括涉及视网膜、后束(posterior tract)和视神经的眼科病症(例如,色素性视网膜炎、糖尿病性视网膜病和其他视网膜变性疾病、葡萄膜炎、年龄相关性黄斑变性、青光眼)。 大多数(如果不是全部)眼科疾病和病症与以下三种类型的适应症状中的一种或多种相关:(1)血管生成、(2)炎症和(3)退化。本发明的递送载体可用于递送抗血管生成因子;抗炎因子;延缓细胞退化、促进细胞存留(cell sparing)或促进细胞生长的因子以及前述的组合。 例如,糖尿病性视网膜病的特征为血管生成。可通过眼内(例如,在玻璃体中)或眼周(例如,在眼球筋膜下区域中)递送一种或多种抗血管生成因子来治疗糖尿病性视网膜病。一种或多种神经营养因子也可通过眼内(例如,在玻璃体内)或眼周被共递送。葡萄膜炎涉及炎症。一种或多种抗炎因子可以通过眼内(例如,玻璃体或前房)施用本发明的核酸来施用。 相比之下,色素性视网膜炎的特征为视网膜变性。在代表性的实施方案中,色素性视网膜炎可以通过眼内(例如,玻璃体)施用编码一种或多种神经营养因子的递送载体来治疗。年龄相关性黄斑变性涉及血管生成和视网膜变性。这种疾病可通过眼内(例如,玻璃体)施用编码一种或多种神经营养因子的本发明的基因编辑系统和/或眼内或眼周(例如,在筋膜下区域(sub-Tenon’s region)中)施用编码一种或多种抗血管生成因子的本发明的基因编辑系统来治疗。 青光眼的特征为眼压升高和视网膜神经节细胞损失。青光眼的治疗包括使用本发明的递送载体施用一种或多种保护细胞免受兴奋毒性损伤的神经保护试剂。这类试剂包括经眼内递送,优选经玻璃体内递送的N-甲基-D-天冬氨酸(NMDA)拮抗剂、细胞因子和神经营养因子。 在其他实施方案中,本发明可用于治疗癫痫,以降低癫痫的发作、发病率和/或严重性。癫痫的治疗方法的疗效可以通过行为(例如,眼睛或嘴巴的抖动、声响(tick))和/或电记录方式(electrographic means)(大多数癫痫发作具有电记录异常的征象)来评估。因此,本发明还可以用于治疗癫痫,癫痫的标志是随着时间的推移多次发作。 作为另一实例,可以使用本发明的递送载体将生长抑素(或其活性片段)施用给脑,以治疗垂体肿瘤。根据该实施方案,编码生长抑素(或其活性片段)的递送载体可以通过微量注射施用给垂体。同样,这种治疗可用于治疗肢端肥大症(即,垂体生长激素分泌异常)。生长抑素的核酸(例如,GenBank登录号J00306)和氨基酸(例如,GenBank登录号P01166含有加工的活性肽,生长抑素-28和生长抑素-14)序列是本领域已知的。 在其他实施方案中,通过使用本发明的基因编辑系统可以调控可变剪接事件。例如,可以将本发明的基因编辑系统与本发明的结合调控序列的寡核苷酸、小分子和/或其他化合物一起导入受试者以产生第一蛋白和/或RNA,该第一蛋白和/或RNA由于激活剪接组的特定组而在受试者中提供了生物学功能。相同的核酸可被工程化为编码不同的蛋白、肽和/或RNA,该蛋白、肽和/或RNA通过激活剪接组中的不同组而在受试者中提供生物学功能。当将本发明的结合调控序列的不同寡核苷酸、小分子和/或化合物导入受试者时,产生了不同的蛋白和/或RNA。例如,当存在结合调控序列的第一寡核苷酸、小分子和/或其他化合物时,第一RNA可以产生第一目的蛋白;并且在添加本发明的结合调控序列的不同的第二寡核苷酸、小分子和/或化合物之后,第二RNA会导致产生第二目的蛋白或目的功能性RNA(例如,可以产生第一蛋白的同种型(例如,白介素(IL)-4)及其剪接变体IL-4A2)。(参见,例如,Fletcher等人“Increased expression of mRNA encoding interleukin(IL)-4and itssplice variant IL-4A2 in cells from contacts of Mycobacterium tuberculosis,inthe absence of in vitro stimulation”Immunology2004年8月;112(4):669-73;Minn等人,“Insulinomas and expression of an insulin splice variant”Lancet 2004年1月31日;363(9406):363-7;Schlueter等人“Tissue-specific expression patterns of theRAGE receptor and its soluble forms--a result of regulated alternativesplicing?”Biochim Biophys Acta 2003年10月20日;1630(1):1-6;Vegran等人“Implication of alternative splice transcripts of caspase-3and survivin inchemoresistance”Bull Cancer2005年3月;92(3):219-26;Ren等人,“Alternativesplicing of vitamin D-24-hydroxylase:A novel mechanism for the regulation ofextra-renal 1,25-dihydroxyvitamin D synthesis”JBiol Chem.2005年3月23日;“Mutant huntington protein:a substrate for transglutaminase 1,2,and 3”JNeuropathol Exp Neurol 2005年1月;64(1):58-65;Ding和Keller,“Splice variants ofthe receptor for advanced glycosylation end products(RAGE)in human brain”Neurosci Lett.2005年1月3日;373(1):67-72;“Transcript scanning reveals noveland extensive splice variations in human 1-type voltage-gated calciumchannel,Cav1.2 al subunit”J Biol Chem 2004年10月22日;279(43):44335-43,Epub200年8月6日。所有这些参考文献通过引用以其整体并入本文。 本发明还以组合物提供了本发明的基因编辑系统。因此,在另外的实施方案中,本发明提供了在药学上可接受的载体中包含本发明的基因编辑系统、本发明的载体和/或本发明的细胞的组合物。“药学上可接受的载体”是指与药物组合物中的其他成分相容并且对受试者无害或无毒的载体。特别地,期望药学上可接受的载体是一种无菌载体,其被配制用于施用至或递送至本发明的受试者。 还提供了包含本发明的组合物和药学上可接受的载体的药物组合物。本文所述的组合物可被配制以便根据已知技术在药物载体中施用。参见,例如Remington,The ScienceAnd Practice of Pharmacy(最新版本)。载体可以是固体或液体、或两者,并且优选与本发明的组合物一起配制为单位剂量制剂,例如片剂,其可以占组合物重量的约0.01%或0.5%至约95%或99%。药物组合物通过任何熟知的制药技术制备,包括但不限于混合任选地包含一种或多种辅助成分的组分。 本发明的药物组合物包括适合于口服、直肠、局部、吸入(例如,通过气雾剂)、含服(例如,舌下)、阴道、肠胃外(例如,皮下、肌内、皮内、关节内、胸膜内、腹膜内、脑内、动脉内或静脉内)、局部(即,皮肤和粘膜表面,包括气道表面)以及经皮施用的那些;但是如本领域众所周知的,在任何给定情况下最合适的途径都取决于此类因素如受试者的物种、年龄、性别和总体状况,所治疗病况的性质和严重程度和/或正在施用的特定组合物的性质(即,剂量、配方)。适于口服施用的药物组合物可以以离散单位存在,例如胶囊剂、扁囊剂、锭剂或片剂,其各自含有预定量的本发明的组合物;粉末或颗粒;水性或非水性液体中的溶液或悬浮液;或水包油或油包水乳液。可以通过将本发明的组合物复合到能够耐受动物肠道中的消化酶降解的载体上来进行口服递送。这类载体的实例包括本领域已知的塑料胶囊或片剂。这类制剂通过任何合适的制药方法制备,该方法包括使组合物与合适的载体(其可含有一种或多种如上所述的辅助成分)联合的步骤。通常,通过将组合物与液体或细碎的固体载体或两者均匀且紧密地混合,并且随后如果需要,使所得混合物成形来制备根据本发明的实施方案的药物组合物。例如,可通过压缩或模制含有组合物的粉末或颗粒,任选地与一种或多种辅助成分一起来制备片剂。通过在合适的机器中压缩自由流动形式的组合物,例如任选地与粘合剂、润滑剂、惰性稀释剂和/或表面活性剂/分散剂混合的粉末或颗粒来制备压缩片剂。通过在合适的机器中对用惰性液体粘合剂润湿的粉末状化合物进行摸制来制备模制片剂。 适于含服(舌下)施用的药物组合物包括:锭剂,其在调味基质(通常为蔗糖和阿拉伯胶或黄蓍胶)中包含本发明的组合物;以及软锭剂,其在惰性基质如明胶和甘油或蔗糖和阿拉伯胶中包含所述组合物。 适于肠胃外施用的本发明的药物组合物可以包含本发明组合物的无菌水性和非水性注射溶液,该制剂优选地与预期接受者的血液等渗。这些制剂可以含有抗氧化剂、缓冲剂、抑菌剂和溶质,其使得组合物与预期接受者的血液等渗。水性和非水性无菌悬浮液、溶液和乳液可包括悬浮剂和增稠剂。非水性溶剂的实例是丙二醇、聚乙二醇、植物油如橄榄油以及可注射的有机酯如油酸乙酯。水性载体包括水、醇/水溶液,乳液或悬浮液,包括盐水和缓冲介质。肠胃外载体包括氯化钠溶液、林格氏葡萄糖、葡萄糖和氯化钠、乳酸化林格氏溶液或不挥发性油。静脉内载体包括流体和营养补充剂、电解质补充剂(例如基于林格氏葡萄糖的那些)等。还可以存在防腐剂和其他添加剂,诸如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。 组合物可以存在于单位剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在使用前立即添加无菌液体载体,例如盐水或注射用水。临时注射溶液和悬浮液可以由前述种类的无菌粉末、颗粒和片剂制备。例如,可以提供在密封容器中的单位剂型的本发明的可注射的、稳定的、无菌的组合物。该组合物可以以冻干剂的形式提供,该冻干剂可以用合适的药学上可接受的载体重构以形成适于注射到受试者体内的液体组合物。该单位剂型可以是约1μg至约10g的本发明的组合物。当组合物基本上不溶于水时,可以包括足够量的生理学上可接受的乳化剂,以在水性载体中乳化该组合物。一种这样的有用的乳化剂是磷脂酰胆碱。 适于直肠施用的药物组合物优选作为单位剂量的栓剂存在。这些可以通过将组合物与一种或多种常规固体载体诸如例如可可脂混合,然后使所得混合物成形来制备。 适于局部施用给皮肤的本发明的药物组合物优选采取软膏剂、乳膏剂、洗剂、糊剂、凝胶剂、喷雾剂、气雾剂或油的形式。可使用的载体包括但不限于凡士林、羊毛脂、聚乙二醇、醇、透皮增强剂及其两种或更多种的组合。在一些实施方案中,例如,可以通过将本发明的药物组合物与能够进入皮肤的亲脂性试剂(例如,DMSO)混合来进行局部递送。 适于经皮施用的药物组合物可以是适于与受试者的表皮保持长时间紧密接触的离散贴剂的形式。适用于经皮施用的组合物也可通过离子电渗法递送(参见,例如,Pharmaceutical Research 3:318(1986)),并且通常采取本发明组合物的任选缓冲水溶液的形式。合适的制剂可以包含柠檬酸盐或bis\tris缓冲液(pH 6)或乙醇/水,并且可以含有0.1至0.1M的活性成分。 本发明的组合物的有效量将随组合物和受试者的不同而变化,并且将取决于多种因素,例如年龄、物种、性别、体重、受试者的总体状况和待治疗的具体疾病或病症。有效量可以根据本领域技术人员已知的常规药理学程序来确定。在一些实施方案中,从约0.1μg/kg至约1gm/kg的剂量将具有治疗功效。在使用病毒载体递送本发明的基因编辑系统的实施方案中,可以测量病毒剂量以包括特定数量的病毒颗粒或噬斑形成单位(pfu)或感染性颗粒,这取决于所使用的病毒。例如,在一些实施方案中,特定的单位剂量可以包括约10 本发明组合物的施用频率可以是赋予所需治疗效果必需的频率。例如,组合物可以每天施用一次、两次、三次、四次或更多次;每周施用一次、两次、三次、四次或更多次;每月施用一次、两次、三次、四次或更多次;每年施用一次、两次、三次或四次和/或根据控制特定病症和/或实现特定效果和/或益处的需要来施用。在一些实施方案中,在受试者的一生中,一剂、二剂、三剂或四剂可能足以实现所需的治疗效果。本发明组合物的施用量和施用频率将根据所治疗或待预防的具体病况和所需的治疗效果而变化。 在一个实施方案中,在给定的时间段(例如,受试者的终生或疾病的持续时间)内将结合调控序列的寡核苷酸重复施用给受试者。例如,结合调控序列的寡核苷酸可以每天施用一次、两次、三次、四次或更多次;每周施用一次、两次、三次、四次或更多次;每月施用一次、两次、三次、四次或更多次;每年施用一次、两次、三次或四次,和/或根据控制特定病况和/或实现特定效果和/或益处的需要来施用。 组合物的组分(例如,(a)包含编码核酸酶的核酸序列的载体;(b)结合调控序列的寡核苷酸)可以基本上同时施用给受试者。可选地,这些组分可以在不同的时间施用,例如,(a)可以在施用(b)之后或之前至少一小时、至少一天、至少一周、至少一个月、至少一年施用。 组合物的组分(例如,(a)包含编码CRISPR相关的核酸酶的核酸序列的载体;(b)结合靶基因序列的gRNA;和(c)结合调控序列的寡核苷酸)可以基本上同时施用给受试者。可选地,这些组分可以在不同的时间施用,例如,(a)和(b)可以基本上同时施用,并且(c)可以在(a)和(b)的施用之后至少一小时、至少一天、至少一周、至少一个月、至少一年施用。 本文所述的基因编辑系统的组分不需要以相同的频率、间隔和/或水平施用。本文特别考虑的是,各组分以产生所需治疗效果的频率、间隔和/或水平施用。 本发明的组合物可以在体内或体外施用给受试者的细胞。为了体内施用给受试者的细胞,以及为了施用给受试者,本发明的组合物可以例如如上所述通过口服、肠胃外(例如静脉内)、通过肌内注射、皮内(例如,通过基因枪)、腹膜内注射、皮下注射、透皮、体外、局部等进行施用。此外,可以根据本领域熟知的方法将本发明的组合物脉冲到从受试者的细胞分离或培养的树突细胞上,或者可以脉冲到大量PBMC或从受试者中消除的多种细胞上。 如果采用离体方法,则可根据本领域熟知的标准方案将细胞或组织移出并维持在体外,同时将本发明的组合物导入到细胞或组织中。例如,本发明的基因编辑系统可以通过任何基因转移机制(例如病毒介导的基因递送、磷酸钙介导的基因递送、电穿孔、显微注射或蛋白脂质体)导入细胞。然后根据针对细胞或组织类型的标准方法,将转导的和/或转染的细胞输注(例如,在药学上可接受的载体中)或移植回受试者。用于将各种细胞移植或输注到受试者中的标准方法是已知的。 本发明的制剂可以包含活性化合物的无菌水性和非水性注射溶液,该制剂优选与预期接受者的血液等渗并且基本上无热原。这些制剂可以含有抗氧化剂、缓冲剂、抑菌剂和溶质,其使得制剂与预期接受者的血液等渗。水性和非水性无菌悬浮液可包括悬浮剂和增稠剂。制剂可以存在于单位剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在使用前立即添加无菌液体载体,例如盐水或注射用水。 本文所述的组分(例如,(a)包含编码核酸酶的核酸序列的载体;(b)结合调控序列的寡核苷酸)可以配制到同一组合物(例如,一种组合物具有所有组分)中。可选地,这些组分可以配制到两种不同的组合物中。 本文所述的组分(例如,(a)包含编码CRISPR相关的核酸酶的核酸序列的载体;(b)结合靶基因序列的gRNA;和(c)结合调控序列的寡核苷酸)可以配制到同一组合物(例如,一种组合物具有所有组分)。可选地,这些组分可配制到不同的组合物中,例如,(a)和(b)配制到一种组合物中,并且(c)配制到不同的组合物中;或者(a)、(b)、(c)全部配制到不同的组合物中。 在一种制剂中,本发明的基因编辑系统的组分可以作为裸DNA递送或导入受试者。 在一种制剂中,本发明的基因编辑系统的组分可以包含在可能适合于肠胃外施用的脂质颗粒或囊泡中(例如脂质体或微晶)。只要化合物包含在其中,颗粒可以是任何合适的结构例如单层或多层。带正电荷的脂质如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”对于这类颗粒和囊泡是特别优选的。这类脂质颗粒的制备是熟知的。参见,例如,Janoff等人的美国专利第4,880,635号;Kurono等人的美国专利第4,906,477号;Wallach的美国专利第4,911,928号;Wallach的美国专利No.4,917,951;Allen等人的美国专利第4,920,016号;Wheatley等人的美国专利第4,921,757号等等。在一种制剂中,本发明的基因编辑系统可以包含在纳米颗粒内。在另一种制剂中,本发明的基因编辑系统可以包含在重组AAV衣壳内。 在一个实施方案中,经由裸DNA或在脂质颗粒、纳米颗粒或重组AAV衣壳内将组分(c)递送到受试者或导入受试者。 本发明的药物组合物可用于例如生产用于治疗本文所述的疾病和/或病症的药物。 本发明包括以下序列: SEQ ID NO:1.质粒TRCBA-int-luc mut。核苷酸163-2036:CBA启动子;核苷酸2739-4573:突变型内含子(654C-T);核苷酸4592-4813:polyA信号。 SEQ ID NO:2.质粒TRCBA-int-luc(wt)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:野生型内含子(654C);核苷酸2071-4573:荧光素酶中的内含子;核苷酸4592-4813:多聚A信号。 SEQ ID NO:3.质粒TRCBA-int-luc(657GT)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:突变型内含子(654C-T);657TA-GT);核苷酸2071-4573:荧光素酶中的内含子;核苷酸4592-4813:多聚A信号。 SEQ ID NO:4.质粒GL3-int-Luc(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797:突变型内含子(654C-T);核苷酸2814-3035:多聚A信号;核苷酸280-2782:具有突变型内含子的荧光素酶。WO 2006/119137PCT/US2006/016514 SEQ ID NO:5.质粒GL3-int-Luc(wt)。核苷酸48-250:SV40启动子;核苷酸948-1797:wt内含子(654C);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。 SEQ ID NO:6.质粒GL3-int-Luc(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1797:内含子(654C-T;657TA-GT);核苷酸280-2782:具有突变型内含子的荧光素酶;核苷酸2814-3035:多聚A信号。 SEQ ID NO:7.质粒GL3-2int-fron-sph(mut)。核苷酸48-250:SV40启动子;核苷酸251-1100;1771-2620:突变型内含子(654C-T);核苷酸1103-3635:具有突变型内含子的荧光素酶;核苷酸3637-3858:多聚A信号。 SEQ ID NO:8.质粒GL3-3int-2fron-sph(mut).核苷酸48-250:SV40启动子;核苷酸251-1100;1106-1965;2635-3484:突变型内含子(654C-T);核苷酸1967-4469:具有突变型内含子的荧光素酶;核苷酸4514-4735:多聚A信号。 SEQ ID NO:9.质粒GL3-int-luc A(mut)。核苷酸48-250:SV40启动子;核苷酸673-1522:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。 SEQ ID NO:10.质粒GL3-int-Luc B(mut)。核苷酸48-250:SV40启动子;核苷酸1440-2289:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。 SEQ ID NO:11.质粒GL3-int-Luc C(mut)。核苷酸48-250:SV40启动子;核苷酸1691-2540:内含子(654C-T);核苷酸280-2782:具有内含子的荧光素酶;核苷酸2814-3035:多聚A信号。 SEQ ID NO:12.质粒GL3-int-fron(mut)。核苷酸48-250:SV40启动子;核苷酸251-1100:内含子(654C-T);核苷酸1103-2755:具有内含子的荧光素酶;核苷酸2787-3008:多聚A信号。 SEQ ID NO:13.质粒GL3-2int-sph(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797;1798-2647:内含子(654C-T);核苷酸280-3632:具有内含子的荧光素酶;核苷酸3664-3885:多聚A信号。 SEQ ID NO:14.质粒GL3-2int-sph C(mut)。核苷酸48-250:SV40启动子;核苷酸948-1797;2541-3390:内含子(654C-T);核苷酸280-3632:具有内含子的荧光素酶;核苷酸3664-3885:多聚A信号。 SEQ ID NO:15.质粒GL3-sint200-sph(mut)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T);核苷酸280-2582:具有内含子的荧光素酶;核苷酸2794-2835:多聚A信号。 SEQ ID NO:16.质粒GL3-sint200-sph(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T;657TA-GT);核苷酸280-2582:具有内含子的荧光素酶;核苷酸2794-2835:多聚A信号。 SEQ ID NO:17.质粒GL3-sint425-sph。核苷酸48-250:SV40启动子;核苷酸948-1373:内含子(654C-T);核苷酸280-2358:具有内含子的荧光素酶;核苷酸2569-2615:多聚A信号。 SEQ ID NO:18.突变型内含子(654C-T). SEQ ID NO:19.野生型内含子(654C). SEQ ID NO:20.具有两个突变(654C-T;657TA-GT)的内含子。 SEQ ID NO:21.核苷酸669-1518处具有突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:22.核苷酸669-1518处具有野生型内含子的荧光素酶cDNA。 SEQ ID NO:23.核苷酸669-1518处具有双突变型内含子(C654 C-T;657TA-GT)的荧光素酶cDNA。 SEQ ID NO:24.核苷酸1-850处具有突变型内含子(654C-T)和核苷酸1521-2370处具有突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:25.核苷酸1-850处具有突变型内含子(654C-T)以及核苷酸861-1710和核苷酸2385-3234处具有两个突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:26.可选位置A(核苷酸394-1243)处具有突变型内含子(654 C-T)的荧光素酶cDNA。 SEQ ID NO:27.可选位置B(核苷酸1161-2010)处具有突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:28.可选位置C(核苷酸1412-2261)处具有突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:29.在翻译起始位点上游(核苷酸1-850)具有突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:30.核苷酸669-1518和核苷酸1519-2368处具有两个突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:31.核苷酸669-1518和核苷酸2262-3111处具有两个突变型内含子(654C-T)的荧光素酶cDNA。 SEQ ID NO:32.核苷酸669-1318处有突变型内含子(654C-T)和200个碱基对缺失的荧光素酶cDNA。 SEQ ID NO:33.核苷酸669-1318处有双突变型内含子(654C-T;657 TA-GT)和200个碱基对缺失的荧光素酶cDNA。 SEQ ID NO:34.核苷酸669-1094处有突变型内含子(654C-T)和425个碱基对缺失的荧光素酶cDNA。 SEQ ID NO:35.核苷酸2866-3715处具有α抗胰蛋白酶cDNA和突变型内含子(654C-T)的质粒TRCBA。 SEQ ID NO:36.核苷酸772-1621处具有突变型内含子(654C-T)的α抗胰蛋白酶cDNA。 SEQ ID NO:37.结合IVS2-654的调控序列的寡核苷酸GCT ATT ACC TTA ACC CAG。 SEQ ID NO:38.结合IVS2-654(具有657GT突变)的调控序列的寡核苷酸GCA CTTACC TTA ACC CAG。 SEQ ID NO:50(具有564CT突变的IVS2-654内含子)。 SEQ ID NO:51(具有657G突变的IVS2-654内含子)。 SEQ ID NO:52(具有658T突变的IVS2-654内含子)。 SEQ ID NO:20(具有657GT突变的IVS2-654内含子)。 SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)。 SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)。 SEQ ID NO:68(仅具有197bp的IVS2-654内含子)。 SEQ ID NO:69(仅具有247bp的IVS2-654内含子)。 SEQ IDNO:55(具有6A突变的IVS2-654内含子)。 SEQ ID NO:56(具有564C突变的IVS2-654内含子)。 SEQ IDNO:57(具有841A突变的IVS2-654内含子)。 SEQ ID NO:58(IVS2-705内含子)。 SEQ ID NO:59(具有564CT突变的IVS2-705内含子)。 SEQ ID NO:60(具有657G突变的I VS2-705内含子)。 SEQ ID NO:61(具有658T突变的IVS2-705内含子)。 SEQ ID NO:62(具有657GT突变的IVS2-705内含子)。 SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)。 SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)。 SEQ IDNO:65(具有6A突变的IVS2-705内含子)。 SEQ ID NO:66(具有564C突变的IVS2-705内含子)。 SEQ IDNO:67(具有841A突变的IVS2-705内含子)。 SEQ ID NO:70(CFTR外显子19野生型序列)。 SEQ ID NO:71(CFTR外显子19 3849+10kb C-T突变)。 SEQ ID NO:72(CFTR外显子19野生型寡核苷酸)。 SEQ ID NO:70(CFTR外显子19 3849+10kb C-T突变寡核苷酸)。 SEQ ID NO:74(小鼠肌营养不良蛋白内含子22、外显子23和内含子23野生型序列)。 SEQ ID NO:75(mdx小鼠肌营养不良蛋白内含子22、外显子23和内含子23无义突变)。 SEQ ID NO:76(诱导反义外显子23跳跃的寡核苷酸)。 SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)。 SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)。 SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)。 SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)。 SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)。 SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)。 SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)。 SEQ ID NO:49(针对IVS2-705的寡核苷酸)。 SEQ ID NO:46(针对IVS2-654的寡核苷酸)。 SEQ ID NO:47(针对IVS2-654的寡核苷酸)。 SEQ ID NO:48(针对IVS2-654的寡核苷酸)。 本文引用的所有出版物、专利申请、专利、专利出版物和其他参考文献通过引用以其整体并入本文,以获得与出现所述参考文献的句子和/或段落有关的教导。给出以下实例以例示本发明,而不应解释为对本发明的限制。 本发明可进一步描述于以下编号的段落中: 1.一种具有降低的脱靶效应的用于编辑基因(例如,改变至少一种基因产物的表达)的系统,包括向具有靶基因序列的细胞中导入: a)包含编码核酸酶的核酸序列的载体,其中编码所述核酸酶的所述核酸在其序列内包含调控核酸序列,所述调控核酸序列具有限定第一内含子和第二内含子的第一组剪接元件和第二组剪接元件,其中所述第一内含子和第二内含子在编码包含符合读框的终止密码子序列的非天然存在的外显子序列的序列的侧翼,并且其中所述第一内含子和第二内含子从前体mRNA信息中被剪接以产生编码无功能核酸酶的mRNA,所述无功能核酸酶包含由非天然存在的外显子编码的氨基酸序列;和 b)结合所述调控核酸序列的寡核苷酸, 其中在所述细胞内,所述寡核苷酸阻止所述第二组剪接元件从所述mRNA被剪接,从而产生缺少所述外显子并编码对靶基因的基因编辑起作用的核酸酶的mRNA。 2.根据段落1所述的系统,其中所述核酸酶选自由以下组成的组:CRISPR相关的核酸酶、大范围核酸酶、锌指核酸酶和转录激活因子样效应物核酸酶。 3.根据段落1所述的系统,其中所述核酸酶是核酸内切酶或核酸外切酶。 4.根据前述任一段落所述的系统,其中组分(a)还包含结合所述靶基因序列的gRNA。 5.根据前述任一段落所述的系统,其中所述调控核酸序列是β珠蛋白突变型内含子。 6.根据前述任一段落所述的系统,其包含至少两个调控核酸序列。 7.根据前述任一段落所述的系统,其中所述调控核酸序列包含选自由以下组成的组的序列:SEQ ID NO:18(IVS2-654内含子C-T)、SEQ ID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:51(具有657G突变的IVS2-654内含子)、SEQ ID NO:52(具有658T突变的IVS2-654内含子)、SEQ ID NO:20(具有657GT突变的IVS2-654内含子)、SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)、SEQ ID NO:68(仅具有197bp的IVS2-654内含子)、SEQ IDNO:55(具有6A突变的IVS2-654内含子)、SEQ ID NO:56(具有564C突变的IVS2-654内含子)、SEQ ID NO:57(具有841A突变的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ ID NO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ ID NO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148;及其任何组合,包括单一序列。 8.根据前述任一段落所述的系统,其中结合所述调控序列的所述寡核苷酸包含选自由以下组成的组的序列:SEQ ID NO:37(针对IVS2-654 CT的寡核苷酸)、SEQ ID NO:38(针对具有657GT突变的IVS2-654的寡核苷酸)、SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)、SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)、SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)、SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)、SEQID NO:44(针对IVS2-654中657G突变的寡核苷酸)、SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)、SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)、SEQ ID NO:49(针对IVS2-705的寡核苷酸)、SEQ ID NO:76(诱导反义外显子23跳跃是的寡核苷酸)以及SEQID NO138(针对LUC-AON1的寡核苷酸)、SEQ ID NO:139(针对LUC-AON2的寡核苷酸)、SEQ IDNO:140(针对LUC-AON3的寡核苷酸)、SEQ ID NO:141(针对LUC-AON4的寡核苷酸)、SEQ IDNO:142(针对IVS2(S0)-654,LUC-654的寡核苷酸)和SEQ ID NO:149(针对野生型调控序列的寡核苷酸)。 9.根据前述任一段落所述的系统,其中所述脱靶效应降低至少30%。 10.根据前述任一段落所述的系统,其中所述脱靶效应降低至少40%、至少50%、至少60%、至少70%、至少80%或至少90%或更多。 11.根据前述任一段落所述的系统,其中组分(a)和(b)位于相同或不同的载体上。 12.根据前述任一段落所述的系统,其中将组分(b)作为裸DNA导入细胞。 13.根据前述任一段落所述的系统,其中使用脂质制剂将组分(b)导入细胞。 14.根据前述任一段落所述的系统,其中使用纳米颗粒将组分(b)导入细胞。 15.根据前述任一段落所述的系统,其中在施用(a)之后的时间点施用组分(b)。 16.根据前述任一段落所述的系统,其中组分(a)和(b)基本上同时施用。 17.根据前述任一段落所述的系统,其中在缺少(b)或没有(b)表达的情况下,在细胞中检测不到(a)的表达。 18.根据前述任一段落所述的系统,其中(a)的表达依赖于(b)的表达。 19.根据前述任一段落所述的系统,其中组分(b)控制系统的“打开(ON)”和/或“关闭(OFF)”状态。 20.根据段落19述的系统,其中所述“打开(ON)”和/或“关闭(OFF)”状态处于选择性控制下。 21.根据段落20述的系统,其中所述选择性控制是空间控制和/或时间控制。 22.根据前述任一段落所述的系统,其中所述载体是病毒载体。 23.根据段落22述的系统,其中所述病毒载体选自由以下组成的组:AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。 24.根据前述任一段落所述的系统,其中所述载体是非病毒载体。 25.根据前述任一段落所述的系统,其中所述核酸酶是CRISPR相关的核酸酶。 26.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶为基因编辑创建双链断裂,并且其中所述CRISPR相关的核酸酶选自由以下组成的组:Cpf1、C2c1、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c3、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b和Cas13c。 27.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶是选自金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、嗜热链球菌(Streptococcusthermophilus)(StCas9)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)(NmCas9)、新杀手弗朗西丝菌(Francisella novicida)(FnCas9)和空肠弯曲菌(Campylobacter jejuni)(CjCas9)的Cas9变体。 28.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶已经被修饰用于基因编辑但不产生双链DNA断裂(例如,CRISPRi或CRISPRa),并且选自由dCas、nCas和Cas13组成的组。 29.根据前述任一段落所述的系统,其中所述CRISPR相关的核酸酶被密码子优化以在真核细胞中表达。 30.根据前述任一段落所述的系统,其中所述基因编辑是降低一种或多种基因产物的表达。 31.根据前述任一段落所述的系统,其中所述基因编辑是增加一种或多种基因产物的表达。 32.根据前述任一段落所述的系统,其中所述细胞是哺乳动物细胞或人类细胞。 33.根据前述任一段落所述的系统,其中所述细胞位于体内。 34.根据前述任一段落所述的系统,其中所述细胞位于体外。 35.根据前述任一段落所述的系统,其中所述靶基因是疾病基因。 36.一种用于编辑受试者中的基因的方法,所述方法包括向需要基因编辑的受试者施用段落1-35所述的系统。 实施例 实施例1.通过选择性剪接差异调控AAV载体中的多个转基因 介绍 野生型AAV是非致病性的、无包膜的、小的单链DNA病毒,其具有长4.7kb的基因组。重组AAV已被开发并用作基因治疗载体几十年。调控转基因表达的能力对于确保许多基因治疗策略的安全性是至关重要的。已针对AAV载体介导的基因转移测试了几种控制转基因表达的策略(如tet-on或雷帕霉素诱导型系统)。取决于待治疗的靶标,每种调控系统具有优点和缺点。作为开发转基因调控系统的策略,将IVS2-654内含子的剪接转换机制调整为AAV介导的基因递送,所述转基因调控系统简化基因递送系统、消除针对反式激活蛋白的免疫反应并单独诱导多个转基因、且更重要的是使AAV载体的包装能力最大化。 已知超过90%的包含多个外显子的转录物会经历选择性剪接。在这些条件下,剪接位点的选择是决定基因表达的关键因素之一。据报道,许多遗传性疾病的病例是由改变剪接模式的突变引起的。在过去的几十年中,反义寡核苷酸(AON)的用途已得到深入研究,并在体外和体内作为可通过恢复或改变剪接来控制基因表达的治疗剂被应用。通过使用AON进行剪接转换来恢复功能性基因表达的第一靶标之一是β珠蛋白基因的地中海贫血突变。β珠蛋白转录物的第二内含子IVS2含有共有的5'和3'剪接位点,且该内含子在正常条件下在剪接过程中被组成性去除以产生功能性蛋白。地中海贫血患者中经常发现的突变之一是IVS2的654位核苷酸C变为T,这种改变在653位产生异常的5'剪接位点,并带有一个隐蔽3'剪接位点,以及在上游选择性使用的外显子(AUE)(图1A)。这些隐蔽剪接位点是剪接机制优选使用的,随后将AUE保留在β珠蛋白mRNA中,这使开放阅读框向下游偏移并产生截短的蛋白质。通过施用AON可以恢复这种异常剪接,AON结合隐蔽5'剪接位点并阻断其使用(图1A)。在最近的出版物中,发明人使用IVS2-654突变型内含子和对应的AON表明该诱导型系统可用于在体外和体内控制AAV介导的转基因。 调控转基因表达的能力对于确保许多基因治疗策略的安全性是必要的。对于由于新生血管紊乱导致的眼部疾病的基因治疗尤其如此,其可能需要长期存在多种血管生成抑制蛋白(angiostatic protein),这些蛋白可能会抑制正常血管以及异常血管。理论上,可以联合多种电流调控系统来调控多种转基因。然而,由于这些系统的要求,这种方法会非常麻烦。因此,开发了选择性剪接作为独立控制多个转基因在相同生物体中表达的策略。在本文描述的基于选择性剪接的调控系统中,通过使用靶向5'选择性剪接位点的AON调控转基因信息的选择性剪接来控制转基因表达。在先前的研究中,本发明人成功地使用了LNA654(一种与5'选择性剪接位点及其侧翼序列互补的16聚体寡核苷酸)来诱导转基因表达。在该系统中,可以通过AON的特异性来决定剪接转换。修饰的AON、LNA对其靶标具有高度特异性。它们的特异性可以通过几个核苷酸差异来区分。这种能力对于多种基因调控是非常有利的。内含子中选择性使用的5'供体位点的侧翼区域中的仅仅几个改变的核苷酸就可以成为另一个可区分的靶标。因此,可应用它们因其靶区域的几个改变的核苷酸而单独控制多个基因的能力,而无需改变骨架。使用不同的靶向AON来独立控制同一生物体中多个转基因的表达将是可能的。这种想法将允许单个患者接受需要转基因表达差异调控的多基因疗法。 在本文中,报道了,通过优化内含子大小和剪接位点,这种诱导型系统被显著改善以获得紧密和有效的调控。这种优化的系统证明了在体外和体内显著改善的转基因诱导。此外,通过在小鼠眼中重新施用AON可以再诱导转基因表达。本文还显示了这种系统使用一组修饰的内含子及其对应的AON可用于差异化调控多种转基因。 结果 优化IVS2-654内含子的选择性5'剪接位点以有效调控。 为促进选择性剪接的优化以控制转基因表达,利用萤火虫的荧光素酶标记基因来插入850bp选择性剪接内含子IVS2-654。因此,在存在或不存在AON的情况下,通过测定包含AUE和跳过AUE两种条件下的荧光素酶表达水平,可以方便地确定转基因表达的控制。首先,通过修饰IVS2-654内含子的选择性剪接位点来优化选择性剪接以控制转基因表达。IVS2-654内含子在657和658处的核苷酸序列(即选择性5'剪接位点的第5个和第6个下游核苷酸)是T和A。与共有5'剪接位点的G和T相比,这些序列的共有性较低。核苷酸657处的T被转换为G,658处的A被转化为T,或TA被转化为GT。这些突变通过使剪接位点与共有序列更相似或相同来增加选择性5'剪接位点的强度(图1B)。使用PEI转染方法将得到的质粒和对应的AON转染到293细胞中。转染后24小时,收获细胞以对荧光素酶的表达定量。构建体658T在诱导水平上产生了与构建体IVS2-654相比大约两倍的提高。因此,构建体657G和657GT导致诱导水平提高190和250倍(图1C)。诱导水平的增加显然是由于转基因表达的背景水平比转基因表达的诱导水平更急剧的降低。这些结果表明,通过调节剪接位点的强度,可以优化选择性剪接以控制转基因表达。 优化IVS2-654内含子尺寸以将AAV的转基因能力最大化。 AAV具有4.7kb的包装限制,因为其根据启动子的尺寸、多聚A和ITR仅允许转基因编码区的最大尺寸为约3kb。原始IVS2-654内含子长度为850个核苷酸(nt)(图2A),将该内含子插入待调控的转基因的开放阅读框(ORF)进一步降低了转基因的克隆能力。因此,850nt IVS2-654被转化为称为S0的247nt的小内含子,其含有β珠蛋白mRNA的有效剪接所需的必需剪接位点和AUE以及5'端上的第32个核苷酸和3'端上的最后57个核苷酸(图2B)。将S0内含子插入到荧光素酶基因中,产生构建体IVS2(S0)-654,导致信息的选择性剪接。重要的是,AON对小内含子的诱导水平与对原始IVS2-654内含子的诱导水平相似(图2C)。 其对应的AON对含有修饰的内含子的构建体的荧光素酶表达的个体化调控。 产生了在5'选择性剪接位点IVS(S0)-654的5'选择性剪接位点的侧翼区含有不同序列的四种构建体(图3A)。保留了对于剪接是关键的5'选择性剪接位点651-658的8个核苷酸,并且剪接位点外部的突变核苷酸彼此具有至少5个核苷酸(nt)的差异。在HEK293细胞中测试每种构建体的表达以确定其转基因是否由其对应的AON诱导,并且是否受其他非对应的AON的影响。观察到对应的AON对报告基因表达的诱导,但没有被其他AON交叉调控(图3B)。尽管构建体之间的诱导效率是可变的,但与IVS(S0)-654相比,所有四种构建体都导致转基因诱导水平提高(图3C)。这些数据证实了转基因的剪接被AON以高度序列特异性的方式控制,从而允许多个转基因的差异化调控。 其对应的AON对多基因表达的差异调控 用其对应的AON测试了3种不同报告基因的差异表达。将修饰的内含子AON4导入荧光素酶,AON1导入绿色荧光蛋白(GFP),且AON 2导入红色荧光蛋白(RFP)。将那些报告基因分别亚克隆到CBh载体骨架中(Luc-AON 4、GFP-AON 1和RFP-AON 2)(图4A和4B)。在转染后的当天,将三种质粒的混合物转染到HEK293细胞中,并且用单独的AON、LNAAON4、LNAAON1和LNAAON2处理细胞。观察到每种AON特异性地诱导其对应的靶基因(图5B)。这些数据表明使用本文所述的诱导型载体及其对应的AON可以个体化调控多种转基因的表达。 AON对携带优化的IVS 2突变型内含子的AAV载体在小鼠肝脏中的荧光素酶表达的调控 为了证明含有优化的小内含子的调控系统也可起到控制动物中的转基因表达的功能,在6周龄雌性Balb/c小鼠中测试了AAV2.5-CBh-Luc-AON1载体。将AAV载体以1x10 通过在小鼠眼中施用AON可重新诱导AAV2.5-CBh-Luc-DGT1的荧光素酶表达。 我们在小鼠眼中测试了诱导型载体Luc-AON1,其在启动子CBh控制下使用修饰的AAV2衣壳AAV 2.5。在视网膜下注射病毒载体4周后,给予玻璃体内注射对应的AON、LNAAON1或错配的AON、LNA654。在注射AON后3周,注射LNAAONI的眼中的平均荧光素酶活性是注射LNAA654的眼中的平均荧光素酶活性的2.5倍高(P=0.0038,图6)。在注射LNAAON1后6周和9周,平均荧光素酶活性降低,但仍显著高于注射LNA654的眼中的荧光素酶活性。AON注射后13周不再有统计学显著性差异,因此在16周给予第二次AON玻璃体内注射。3周后,注射LNAAON1的眼的平均荧光素酶活性增加,并且是注射LNA654的眼的2倍高(P=0.017)。3周后,荧光素酶活性的差异不再显著(P=0.079)。在第23周进行AON的第三次玻璃体内注射。3周后,注射LNAAON1的眼和注射LNA654的眼之间的荧光素酶活性没有统计学显著差异。这些数据提供了在眼中使用诱导型系统的概念证明,并表明至少可以进行一次重新诱导,但是诱导的幅度可能会随时间降低。 讨论 本文提供的研究成功地证明了通过优化的诱导型载体AAV 2.5-CBh-Luc-AON 1介导的体外荧光素酶表达的诱导改善。还成功地证明了用相同载体对小鼠肝脏和眼中荧光素酶表达的诱导。与没有AON的情况相比,在IVS 2内含子657和658处将核苷酸T和A修改为G和T通过显著降低背景表达而使AON对荧光素酶的诱导增加超过100倍。这很可能是对剪接过程的紧密调控,该紧密调控通过使剪接位点更接近共有序列来增加选择性使用的5'剪接位点的强度。与长度为850nt的原始IVS 2-654相比诱导强度没有变化的小的长度为247nt的IVS 2-654内含子S0允许在AAV系统中更大的转基因克隆能力。同时,优化的诱导型系统可用于控制AAV介导的转基因表达。 血管生成是一个复杂的多步骤过程,涉及通过血管内皮细胞增殖、迁移、管形成和细胞外基质重塑而使血管内皮细胞从现有血管中萌发。该过程由生长因子、细胞外基质和细胞组分之间的复杂相互作用控制,最终结果由血管生成和血管生成抑制因子的平衡决定。许多生长因子分子参与控制血管生成,并且对它们中的一个或组合的治疗性操纵提供了控制眼中新血管形成的潜在手段。到目前为止,实验模型中使用基因治疗方法靶向的细胞因子和/或已被增强的血管生成抑制蛋白包括血管内皮生长因子(VEGF)、胰岛素样生长因子-1(IGF-1)、色素上皮衍生因子(PEDF)、基质金属蛋白酶(MMP)、血管抑素(angiostatin)、内皮抑素和整联蛋白。然而,没有一个能使新血管形成几乎完全消退。在患有视网膜新生血管性疾病的患者中有效控制血管生成可能需要在眼中长期存在血管生成抑制蛋白。对新生血管形成的不当抑制可能导致对正常眼部结构的损伤。因此,需要开发能够适当调控基因表达的策略以使局部毒性的可能性最小化。在本研究中,成功地证明了使用优化的诱导型系统可以控制小鼠眼中的转基因表达。在小鼠眼中,在用携带含有荧光素酶基因的DGT1内含子的AAV2.5载体转导后,通过施用AON证明了对荧光素酶活性的特异性诱导。还证明了通过在小鼠眼中重新施用AON可再诱导该系统。此外,成功地证明了用其对应的AON,3种不同的报告基因被个体化表达。AON4、AON1和AON2在没有任何交叉的情况下分别独立地调控荧光素酶、GFP和RFP的表达。对每个靶转基因使用与选择性使用的5'剪接位点及其侧翼序列互补的16聚体AON以个体化诱导表达。该16核苷酸区由剪接位点必需的8个核苷酸和对于侧翼区的8个核苷酸组成。在侧翼序列中有8个碱基可以突变而不影响选择性剪接位点的强度。结果表明,每个AON彼此之间存在6-7个错配,且不交叉调节靶基因的选择性剪接。因此,在5'剪接位点的靶区内,可突变比所需碱基更多的碱基(8>6)以创建不会被其他AON交叉调控的不同靶序列。这种转基因调控的能力对于通常使用的调控系统如tet-on和雷帕霉素诱导型系统是不可能的。实际上,这些系统中的每一个理论上只能独立地调控一个转基因。总之,这些数据表明该新型优化调控系统可能是一种非常有用的在临床上应用以差异化调控多种转基因表达以用于临床相关疾病如眼部新血管形成的基因治疗的策略。 材料和方法 细胞的维持。将人胚肾(HEK)293细胞维持在Dulbecco改良的Eagle培养基中,该培养基含有10%热灭活的胎牛血清和1X Penn/Strep(DMEM+,Sigma)。使细胞在37℃在5%CO AAV载体质粒。所有携带荧光素酶的AAV载体质粒均由pTR-CBh-LuciferaseGL3+NotI(Xiaohuai等人)产生。用SphI和XcmI限制性酶消化将内含子区亚克隆到该质粒中。使用标准PCR技术在IVS2-654的选择性使用的5'剪接位点处进行突变,并进行测序以确保它们与预期得一致。 pZsGreen 1-Dr(#632428)和pDsRed-Express-Dr(#632423)购自Clontech。使用AgeI和NotI从pTR-CBh-Luciferase GL3+NotI质粒取出荧光素酶编码区,并用ZsGreen1-Dr或DsRed-Express-Dr编码区替换,分别命名为pTR-CBh-ZsGreen1-Dr和pTR-CBh-DsRed-Express-Dr。然后,将突变的IVS(S0)-654内含子,AON1插入pTR-CBh-ZsGreen1-Dr的ZsGreen1-Dr编码区,并将其命名为pTR-CBh-ZsGreen1-Dr-AON1。同样将修饰的IVS(S0)-654内含子,AON2插入pTR-CBh-DsRed-Express-Dr的DsRed-Express-Dr编码区,并将其命名为pTR-CBh-RedDr-AON2。 反义寡核苷酸。修饰的反义寡核苷酸LNA购自Exiqon。LNA-DGT1由UNC的Juliano博士慷慨提供。在表4中,大写字母表示LNA碱基,且小写字母表示天然DNA碱基。 AAV载体产生和表征。如Grieger等人所述,使用在无血清悬浮条件下在摇瓶中生长的HEK293细胞产生重组AAV载体(手稿在准备中)。简而言之,使用聚乙烯亚胺(Polysciences)和以下质粒:pXX680、pXR2.5和pTR-CBh-Luc-AON1转染悬浮HEK293细胞,以产生携带CBh-Luc-AON1的AAV。转染后48小时,将细胞培养物离心并弃去上清液。将细胞重悬并通过超声裂解。向裂解液中加入550U单位的DNA酶,并在37℃孵育45分钟,接着在9400xg离心以沉淀细胞碎片,并将澄清的裂解液上样到改良的不连续碘克沙醇梯度中,接着进行柱层析。然后使用如前所述的QPCR测定确定每种AAV载体制备物的物理粒子滴度(physicalparticle titer)。 转基因表达的体外表征。使用三个标记基因(萤火虫荧光素酶、ZsGreen1-Dr和DsRed-Express-Dr)在24孔板中使用培养的细胞系在体外研究转基因表达的调控。为了测量荧光素酶活性,如使用PEI转染方法所示,用500ng对应的质粒和10pmol的AON转染每个24孔板中的细胞。在转染后24小时,用100μl的1x报告物裂解缓冲液(Promega,货号E 4030)裂解细胞。然后将20ul裂解液与100μl荧光素酶底物(Promega,货号E4030)混合以确定荧光素酶活性。 对于涉及ZsGreen1-Dr和DsRed-Express-Dr标记基因的研究,使用PEI转染法用含有10pmol的AON的500ng质粒转染细胞。转染后,将细胞再培养48小时并使用荧光显微镜成像。 转基因表达的体内表征。使用荧光素酶研究6周龄雌性Balb/c小鼠中的转基因表达调控。以1x10 为了测试眼中的诱导型AAV载体,严格按照视觉和眼科研究协会关于动物在研究中使用的声明对小鼠进行人道处理。如先前所述(Mori等人),用Harvard泵装置和拉伸式玻璃微量移液器(pulled glass micropipette)对4周龄Balb/c小鼠进行视网膜下注射含有10 参考文献 1.Mori K,Duh E,Gehlbach P,Ando A,Takahashi K,Pearlman J,Mori K,YangHS,Zack DJ,Ettyreddy D,Brough DE,Wei LL,Campochiaro PA:Pigment epithelium-derived factor inhibits retinal and choroidal neovascularization.J.Cell.Physiol.188:253-263,2001 实施例2.产生包含调控核酸序列的saCas9 如实施例1所述,产生包含调控序列(β珠蛋白内含子区)的saCas9。使用限制性消化将调控序列内含子区(例如,SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)亚克隆到携带saCas 9的AAV载体质粒中。 实施例3.基因编辑的脱靶效应测定 消化的基因组的测序(Digenome-seqover)是一种体外Cas9消化的全基因组测序,它是一种稳健、灵敏、无偏和成本有效的用于分析可编程核酸酶(例如Cas9)在哺乳动物(例如人细胞)中的全基因组脱靶效应的方法。 使用lipofectamine 2000(Life Technologies)将表达Nav 1.8定向性的gRNA的HeLa、HEK和CHO细胞用以下进行转染:(1)无核酸酶(例如,未转染群体);(2)组成型活性的Casp 9;(3)不含结合调控序列的寡核苷酸的本文所述的基因编辑系统,例如处于“关闭(OFF)”位置的核酸酶;以及(4)本文所述的基因编辑系统和结合调控序列的寡核苷酸,例如,处于“打开(ON)”位置的核酸酶。在含有10%FBS的DMEM培养基中培养HeLa细胞。将细胞培养48小时。 体外裂解基因组DNA。 然后,使用DNeasy Tissue试剂盒(Qiagen),从每个细胞群体中分离完整的基因组DNA。将分离自未转染细胞群的DNA独立地与且不与本文所述的组成型活性核酸酶一起孵育,以允许对分离的DNA的消化。从核酸酶表达群体中分离的DNA用它们所指示的核酸酶分离,以允许对分离的DNA进行酶切。该反应在37℃在反应缓冲液(100mM NaCl,50mM Tris–HCl,10mM MgCl 全基因组测序和Digenome-seq. 使用标准方法通过全基因组测序分析纯化的消化的DNA。用核酸酶消化产生具有相同5’末端的DNA片段,其产生在裂解位点垂直对齐的序列读段。相反,没有相同5'端的所有其他序列读段将以交错的方式排列。将序列读段映射到参照基因组,并使用整合基因组学查看器(IGV)观察中靶位点(on-target site)(例如,Nav 1.8序列)和脱靶位点(off-target site)(例如,非Nav 1.8序列)上的序列排列模式。IGV可在万维网(例如,softward.broadinstitute.org/software/igv/)上获得。Digenome-Seq进一步描述于,例如,国际专利申请号WO 2016/076672l;Kim等人Nat Methods,2015,12:237-243.;Mei等人,J Genet Genomics 2016;43:63-75;Hu等人,Nat Protoc.2016;11:853-871;其各自通过引用以其整体并入本文。分析Digenome-seq数据的其他程序可在万维网(例如,rgenome.net/digenome/portable)上获得。 将组成型活性的Cas 9的脱靶效应与在用组成型活性的Cas 9消化的未转染细胞群体中观察到的任何脱靶效应进行比较。鉴定常见的脱靶位点且不予考虑,如在核酸酶消化的和未进行核酸酶消化的未转染细胞群之间鉴定的任何常见的脱靶位点。将在“打开(ON)”核酸酶群体中鉴定的脱靶位点与“关闭(OFF)”核酸酶群体中的进行比较,且不予考虑。不予考虑这些位点(例如,鉴定为真正的脱靶效应)的原因是,它们不太可能是由核酸酶的脱靶编辑引起的。 Digenome-seq揭示了在HeLa细胞中,组成型活性的Cas9导致脱靶效应(例如,编辑)的发生率与本文所述的“打开(ON)”基因编辑系统相比增加,表明与常规CRISPR/Cas9基因编辑相比,本文所述的基因编辑系统提供显著降低的脱靶效应率。此外,脱靶编辑和中靶编辑揭示了例如,对Nav 1.8序列的编辑在表达“关闭(OFF)”基因编辑系统的细胞中不发生,表明本文所述的基因编辑系统提供了对基因编辑的时间和空间控制。此外,这些结果是在本文测试的所有细胞类型中总结的,表明降低的脱靶效应是该基因编辑系统的特征,而不是细胞类型特异性的。 序列表 北卡罗来纳大学查佩尔希尔分校 理查·J·萨谬斯基 调控的基因编辑系统 5470-858WO 62/870,427 2019-07-03 62/743,317 2018-10-09 154 PatentIn version 3.5 1 7713 DNA 人工的(Artificial) 质粒TRCBA-int-luc-mut(654 C-T) 内含子 (2739)..(3588) 1 gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120 cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180 attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240 tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300 atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540 acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600 cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780 agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840 gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960 ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200 gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380 gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440 ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500 gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560 ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620 gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680 agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740 cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800 ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860 tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920 cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980 cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040 tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100 ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160 aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220 atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280 gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340 ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400 gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460 aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520 atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580 catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640 acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700 cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760 gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820 gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880 gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940 tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000 acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060 cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120 tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180 taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240 taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300 taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360 aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca tataaatatt 3420 tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480 agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540 taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600 tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660 tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720 atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780 ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840 taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900 tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960 agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020 attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080 aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140 gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200 cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260 tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320 aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380 ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440 aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500 cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560 gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740 cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800 tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860 ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920 ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980 cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040 acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280 acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400 caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520 tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640 ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700 gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760 gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820 gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880 tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140 gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380 cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680 cgtattaccg cctttgagtg agctgatacc gct 7713 2 7713 DNA 人工的 质粒TRCBA-int-luc(wt) 内含子 (2739)..(3588) 2 gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120 cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180 attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240 tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300 atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540 acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600 cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780 agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840 gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960 ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200 gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380 gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440 ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500 gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560 ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620 gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680 agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740 cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800 ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860 tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920 cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980 cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040 tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100 ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160 aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220 atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280 gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340 ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400 gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460 aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520 atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580 catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640 acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700 cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760 gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820 gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880 gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940 tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000 acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060 cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120 tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180 taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240 taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300 taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360 aagaataaca gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt 3420 tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480 agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540 taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600 tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660 tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720 atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780 ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840 taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900 tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960 agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020 attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080 aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140 gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200 cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260 tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320 aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380 ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440 aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500 cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560 gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740 cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800 tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860 ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920 ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980 cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040 acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280 acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400 caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520 tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640 ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700 gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760 gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820 gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880 tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140 gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380 cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680 cgtattaccg cctttgagtg agctgatacc gct 7713 3 7713 DNA 人工的 质粒TRCBA-int-luc (654 C-T, 657 TA-GT) 内含子 (2739)..(3588) 3 gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120 cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180 attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240 tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300 atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540 acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600 cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780 agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840 gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960 ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200 gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380 gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440 ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500 gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560 ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620 gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680 agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740 cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800 ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860 tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920 cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980 cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040 tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100 ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160 aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220 atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280 gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340 ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400 gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460 aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520 atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580 catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640 acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700 cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760 gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820 gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880 gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940 tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000 acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060 cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120 tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180 taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240 taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300 taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360 aagaataaca gtgataattt ctgggttaag gcaagtgcaa tatttctgca tataaatatt 3420 tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480 agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540 taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600 tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660 tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720 atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780 ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840 taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900 tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960 agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020 attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080 aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140 gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200 cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260 tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320 aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380 ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440 aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500 cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560 gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740 cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800 tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860 ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920 ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980 cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040 acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280 acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400 caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520 tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640 ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700 gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760 gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820 gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880 tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140 gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380 cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680 cgtattaccg cctttgagtg agctgatacc gct 7713 4 5860 DNA 人工的 质粒GL3-int-Luc-mut(654 C-T) 内含子 (948)..(1797) 4 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140 ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200 ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260 cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320 tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380 gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440 ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560 accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620 ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680 ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740 agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800 tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860 tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920 aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980 tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040 cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100 ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160 gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220 agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280 taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 5 5860 DNA 人工的 质粒GL3-int-Luc(wt) 内含子 (948)..(1797) 5 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140 ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200 ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260 cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320 tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380 gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440 ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560 accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat 1620 ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680 ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740 agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800 tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860 tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920 aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980 tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040 cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100 ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160 gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220 agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280 taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 6 5860 DNA 人工的 质粒GL3-int-Luc(654 C-T, 657 TA-GT) 内含子 (48)..(1797) 6 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140 ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200 ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260 cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320 tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380 gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440 ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560 accattctaa agaataacag tgataatttc tgggttaagg taagtgcaat atttctgcat 1620 ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680 ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740 agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800 tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860 tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920 aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980 tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040 cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100 ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160 gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220 agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280 taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 7 6683 DNA 人工的 质粒GL3-2int-fron-sph-mut 内含子 (251)..(1100) 内含子 (1771)..(2620) 7 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300 aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360 aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420 aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480 ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540 aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600 tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660 ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720 accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780 ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840 tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900 aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960 aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020 tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080 ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140 attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200 cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260 cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320 tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380 gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440 attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500 gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560 ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620 tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680 actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740 aactgcctgc gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt 1800 tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1860 tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1920 ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1980 tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 2040 aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 2100 attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 2160 cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 2220 taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 2280 gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 2340 ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 2400 cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 2460 taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 2520 ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 2580 tttgctaatc atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc 2640 aaatcattcc ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt 2700 ttactacact cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag 2760 aagagctgtt tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa 2820 ccctattctc cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac 2880 acgaaattgc ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga 2940 ggttccatct gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc 3000 tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg 3060 aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac 3120 tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg 3180 ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg 3240 aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg 3300 ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg 3360 caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg 3420 gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga 3480 aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac 3540 tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg 3600 tgtaattcta gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg 3660 agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 3720 atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 3780 gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa 3840 acctctacaa atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc 3900 aacccagtca gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact 3960 gtcttcttta tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct 4020 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 4080 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4140 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4200 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4260 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4320 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4380 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4440 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4500 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4560 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4620 tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4680 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4740 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4800 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4860 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4920 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4980 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 5040 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 5100 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 5160 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 5220 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 5280 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 5340 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 5400 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 5460 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5520 atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5580 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 5640 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 5700 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 5760 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 5820 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 5880 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 5940 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 6000 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 6060 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 6120 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 6180 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 6240 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 6300 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 6360 gaattttaac aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg 6420 ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata 6480 agtaagtaat attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt 6540 tcattacatc tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat 6600 caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt 6660 gccagaacat ttctctatcg ata 6683 8 7547 DNA 人工的 质粒GL3-3int-2fron-sph(mut) 内含子 (251)..(1100) 内含子 (1111)..(1960) 内含子 (2635)..(3484) 8 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300 aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360 aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420 aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480 ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540 aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600 tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660 ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720 accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780 ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840 tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900 aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960 aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020 tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080 ctcttatctt cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt 1140 tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1200 tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1260 ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1320 tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 1380 aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 1440 attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 1500 cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 1560 taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 1620 gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 1680 ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 1740 cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 1800 taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 1860 ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 1920 tttgctaatc atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa 1980 aaacataaag aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca 2040 actgcataag gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc 2100 acatatcgag gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga 2160 agctatgaaa cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc 2220 tcttcaattc tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc 2280 gaacgacatt tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt 2340 ggtgttcgtt tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat 2400 catccaaaaa attattatca tggattctaa aacggattac cagggatttc agtcgatgta 2460 cacgttcgtc acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc 2520 cttcgatagg gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc 2580 taaaggtgtc gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt 2640 ctatgggacc cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg 2700 aaggggagaa gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg 2760 tggaagtctc aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt 2820 tgtttaattc ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc 2880 cttaacattg tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa 2940 aactttacac agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata 3000 ttcataatct ccctacttta ttttctttta tttttaattg atacataatc attatacata 3060 tttatgggtt aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat 3120 tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta 3180 tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc 3240 tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt 3300 tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt catattgcta 3360 atagcagcta caatccagct accattctgc ttttatttta tggttgggat aaggctggat 3420 tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc 3480 acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc 3540 cattccatca cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag 3600 tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga 3660 ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg 3720 acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg 3780 aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc 3840 tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg 3900 tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc 3960 tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg 4020 taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag 4080 acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga 4140 ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc 4200 ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg 4260 ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg 4320 tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag 4380 taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg 4440 ccaagaaggg cggaaagatc gccgtgtaat tctagagtcg gggcggccgg ccgcttcgag 4500 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 4560 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 4620 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 4680 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatcgat aaggatccgt 4740 cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4800 actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 4860 gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4920 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4980 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5040 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5100 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5160 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5220 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5280 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5340 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5400 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5460 gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5520 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5580 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5640 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5700 gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5760 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5820 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5880 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5940 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6000 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6060 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6120 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6180 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6240 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6300 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6360 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6420 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6480 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6540 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6600 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6660 aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6720 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6780 tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 6840 ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 6900 cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 6960 ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 7020 tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 7080 gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 7140 ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 7200 gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 7260 ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7320 acgccagccc aagctaccat gataagtaag taatattaag gtacgggagg tacttggagc 7380 ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt gtgtgaatcg 7440 atagtactaa catacgctct ccatcaaaac aaaacgaaac aaaacaaact agcaaaatag 7500 gctgtcccca gtgcaagtgc aggtgccaga acatttctct atcgata 7547 9 5860 DNA 人工的 质粒GL3-int-luc A(mut) 内含子 (673)..(1522) 9 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggtgagtct atgggaccct tgatgttttc tttccccttc ttttctatgg 720 ttaagttcat gtcataggaa ggggagaagt aacagggtac agtttagaat gggaaacaga 780 cgaatgattg catcagtgtg gaagtctcag gatcgtttta gtttctttta tttgctgttc 840 ataacaattg ttttcttttg tttaattctt gctttctttt tttttcttct ccgcaatttt 900 tactattata cttaatgcct taacattgtg tataacaaaa ggaaatatct ctgagataca 960 ttaagtaact taaaaaaaaa ctttacacag tctgcctagt acattactat ttggaatata 1020 tgtgtgctta tttgcatatt cataatctcc ctactttatt ttcttttatt tttaattgat 1080 acataatcat tatacatatt tatgggttaa agtgtaatgt tttaatatgt gtacacatat 1140 tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 1200 acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 1260 gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1320 taaggtaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1380 agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttatg 1440 gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcatgttcat 1500 acctcttatc ttcctcccac aggggttgca aaaaattttg aacgtgcaaa aaaagctccc 1560 aatcatccaa aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 1620 gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga 1680 gtccttcgat agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct 1740 gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga 1800 tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860 tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920 aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980 tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040 cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100 ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160 gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220 agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280 taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 10 5860 DNA 人工的 质粒GL3-int-Luc B 内含子 (1440)..(2289) 10 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960 ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020 ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080 tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140 gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200 aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260 gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320 gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380 ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaagg 1440 tgagtctatg ggacccttga tgttttcttt ccccttcttt tctatggtta agttcatgtc 1500 ataggaaggg gagaagtaac agggtacagt ttagaatggg aaacagacga atgattgcat 1560 cagtgtggaa gtctcaggat cgttttagtt tcttttattt gctgttcata acaattgttt 1620 tcttttgttt aattcttgct ttcttttttt ttcttctccg caatttttac tattatactt 1680 aatgccttaa cattgtgtat aacaaaagga aatatctctg agatacatta agtaacttaa 1740 aaaaaaactt tacacagtct gcctagtaca ttactatttg gaatatatgt gtgcttattt 1800 gcatattcat aatctcccta ctttattttc ttttattttt aattgataca taatcattat 1860 acatatttat gggttaaagt gtaatgtttt aatatgtgta cacatattga ccaaatcagg 1920 gtaattttgc atttgtaatt ttaaaaaatg ctttcttctt ttaatatact tttttgttta 1980 tcttatttct aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc 2040 atgcctcttt gcaccattct aaagaataac agtgataatt tctgggttaa ggtaatagca 2100 atatttctgc atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat 2160 tgctaatagc agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc 2220 tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc 2280 ctcccacaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 11 5860 DNA 人工的 质粒GL3-int-Luc C 内含子 (1691)..(2540) 11 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960 ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020 ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080 tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140 gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200 aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260 gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320 gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380 ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga 1440 ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg 1500 accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 1560 gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat 1620 caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca 1680 ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 1740 aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 1800 aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 1860 aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 1920 ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 1980 aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 2040 tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 2100 ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 2160 accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 2220 ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 2280 tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 2340 aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 2400 aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 2460 tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 2520 ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580 tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640 tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700 aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760 gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060 tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120 tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100 aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160 cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220 tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280 gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340 tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400 ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640 cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700 ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760 taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820 ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860 12 5833 DNA 人工的 质粒GL3-int-fron(mut) 内含子 (251)..(1100) 12 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300 aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360 aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420 aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480 ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540 aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600 tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660 ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720 accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780 ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840 tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900 aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960 aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020 tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080 ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140 attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200 cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260 cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320 tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380 gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440 attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500 gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560 ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620 tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680 actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740 aactgcctgc gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc 1800 ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 1860 cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 1920 tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 1980 cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2040 ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2100 gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2160 cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2220 tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2280 aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2340 caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 2400 catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 2460 attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 2520 cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 2580 gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 2640 cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 2700 aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaattcta 2760 gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca 2820 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2880 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2940 tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa 3000 atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc aacccagtca 3060 gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta 3120 tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct cactgactcg 3180 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3240 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3300 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3360 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3420 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3480 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3540 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3600 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3660 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3720 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 3780 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3840 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3900 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3960 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4020 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4080 acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 4140 tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 4200 ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 4260 ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 4320 tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 4380 aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 4440 ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 4500 ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 4560 gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 4620 gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 4680 cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 4740 actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 4800 ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 4860 tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 4920 ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4980 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5040 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc gccctgtagc 5100 ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 5160 gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 5220 ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 5280 ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 5340 acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 5400 actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 5460 atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 5520 aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg 5580 cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata agtaagtaat 5640 attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt tcattacatc 5700 tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat caaaacaaaa 5760 cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt gccagaacat 5820 ttctctatcg ata 5833 13 6710 DNA 人工的 质粒GL3-2int-sph(mut) 内含子 (948)..(1797) 内含子 (1798)..(2647) 13 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140 ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200 ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260 cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320 tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380 gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440 ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560 accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620 ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680 ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740 agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacaggtg 1800 agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1860 aggaagggga gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1920 gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1980 ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 2040 tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 2100 aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 2160 atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 2220 atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 2280 aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 2340 ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 2400 gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg taatagcaat 2460 atttctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 2520 ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2580 gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2640 cccacagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg 2700 ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc 2760 gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca 2820 agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga 2880 ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta 2940 aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg 3000 ggctcactga gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg 3060 cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa 3120 cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt 3180 atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg 3240 gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc 3300 tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac 3360 accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc 3420 ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480 acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540 aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600 aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660 gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840 tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900 cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960 atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020 ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940 atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000 ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060 tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120 gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180 gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240 ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300 ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360 tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420 ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480 attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540 agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600 tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660 taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710 14 6710 DNA 人工的 质粒GL3-2int-Sph-C 内含子 (948)..(1797) 内含子 (2541)..(3390) 14 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140 ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200 ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260 cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320 tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380 gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440 ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560 accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620 ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680 ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740 agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800 tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860 tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920 aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980 tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040 cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100 ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160 gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220 agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280 taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340 tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400 ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460 caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520 cttcgacgca ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt 2580 ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 2640 gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 2700 tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 2760 gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 2820 gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 2880 ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 2940 taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 3000 acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 3060 tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 3120 gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 3180 ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 3240 ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 3300 attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 3360 atgttcatac ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc 3420 ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480 acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540 aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600 aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660 gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840 tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900 cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960 atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020 ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940 atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000 ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060 tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120 gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180 gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240 ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300 ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360 tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420 ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480 attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540 agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600 tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660 taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710 15 5660 DNA 人工的 质粒GL3-sint200-sph(mut) 内含子 (948)..(1597) 15 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140 ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200 tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260 ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320 tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380 tgataatttc tgggttaagg taatagcaat atttctgcat ataaatattt ctgcatataa 1440 attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500 tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560 gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620 tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680 ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740 agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800 tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860 aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920 tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980 ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040 cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100 gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160 tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220 acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280 ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340 gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400 agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460 agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520 acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580 aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820 tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880 ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940 ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340 ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400 ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460 aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520 ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580 aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640 agaacatttc tctatcgata 5660 16 5660 DNA 人工的 质粒GL3-sint200-sph(657 GT) 内含子 (948)..(1597) 16 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020 gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080 ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140 ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200 tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260 ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320 tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380 tgataatttc tgggttaagg taagtgcaat atttctgcat ataaatattt ctgcatataa 1440 attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500 tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560 gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620 tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680 ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740 agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800 tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860 aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920 tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980 ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040 cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100 gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160 tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220 acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280 ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340 gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400 agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460 agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520 acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580 aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820 tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880 ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940 ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340 ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400 ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460 aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520 ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580 aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640 agaacatttc tctatcgata 5660 17 5436 DNA 人工的 质粒GL3-sint425-sph 内含子 (948)..(1373) 17 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300 aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360 aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420 gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480 aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540 ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600 atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660 gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720 aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780 gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840 agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900 gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960 acccttgatg ttttctttcc tgtacacata ttgaccaaat cagggtaatt ttgcatttgt 1020 aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact 1080 ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca 1140 ttctaaagaa taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa 1200 atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac 1260 aatccagcta ccattctgct tttattttat ggttgggata aggctggatt attctgagtc 1320 caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca cagagatcct 1380 atttttggca atcaaatcat tccggatact gcgattttaa gtgttgttcc attccatcac 1440 ggttttggaa tgtttactac actcggatat ttgatatgtg gatttcgagt cgtcttaatg 1500 tatagatttg aagaagagct gtttctgagg agccttcagg attacaagat tcaaagtgcg 1560 ctgctggtgc caaccctatt ctccttcttc gccaaaagca ctctgattga caaatacgat 1620 ttatctaatt tacacgaaat tgcttctggt ggcgctcccc tctctaagga agtcggggaa 1680 gcggttgcca agaggttcca tctgccaggt atcaggcaag gatatgggct cactgagact 1740 acatcagcta ttctgattac acccgagggg gatgataaac cgggcgcggt cggtaaagtt 1800 gttccatttt ttgaagcgaa ggttgtggat ctggataccg ggaaaacgct gggcgttaat 1860 caaagaggcg aactgtgtgt gagaggtcct atgattatgt ccggttatgt aaacaatccg 1920 gaagcgacca acgccttgat tgacaaggat ggatggctac attctggaga catagcttac 1980 tgggacgaag acgaacactt cttcatcgtt gaccgcctga agtctctgat taagtacaaa 2040 ggctatcagg tggctcccgc tgaattggaa tccatcttgc tccaacaccc caacatcttc 2100 gacgcaggtg tcgcaggtct tcccgacgat gacgccggtg aacttcccgc cgccgttgtt 2160 gttttggagc acggaaagac gatgacggaa aaagagatcg tggattacgt cgccagtcaa 2220 gtaacaaccg cgaaaaagtt gcgcggagga gttgtgtttg tggacgaagt accgaaaggt 2280 cttaccggaa aactcgacgc aagaaaaatc agagagatcc tcataaaggc caagaagggc 2340 ggaaagatcg ccgtgtaatt ctagagtcgg ggcggccggc cgcttcgagc agacatgata 2400 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2460 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2520 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2580 taaagcaagt aaaacctcta caaatgtggt aaaatcgata aggatccgtc gaccgatgcc 2640 cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc 2700 cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctt 2760 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 2820 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 2880 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2940 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 3000 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 3060 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 3120 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 3180 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 3240 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 3300 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 3360 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 3420 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 3480 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3540 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3600 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 3660 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 3720 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 3780 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 3840 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 3900 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 3960 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 4020 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 4080 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 4140 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 4200 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 4260 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 4320 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 4380 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 4440 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 4500 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 4560 tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 4620 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 4680 tgccacctga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 4740 gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 4800 ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 4860 tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 4920 gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 4980 ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 5040 ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 5100 aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttgccat tcgccattca 5160 ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccca 5220 agctaccatg ataagtaagt aatattaagg tacgggaggt acttggagcg gccgcaataa 5280 aatatcttta ttttcattac atctgtgtgt tggttttttg tgtgaatcga tagtactaac 5340 atacgctctc catcaaaaca aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag 5400 tgcaagtgca ggtgccagaa catttctcta tcgata 5436 18 850 DNA 人工的 突变型内含子(654 C-T) misc_feature (654)..(654) β-珠蛋白内含子654 C-T突变 18 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 19 850 DNA 智人(Homo sapiens) misc_feature (1)..(850) 野生型β-珠蛋白内含子 19 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 20 850 DNA 人工的 具有两个突变(654 C-T;657 TA-GT)的内含子 misc_feature (654)..(654) β-珠蛋白内含子654 C-T突变 misc_feature (657)..(658) β-珠蛋白内含子657 TA-GT突变 20 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagtgc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 21 2503 DNA 人工的 具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (669)..(1518) 21 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840 caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900 attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960 gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020 tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080 aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140 caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200 ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260 caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320 gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380 gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440 ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500 cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560 tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620 atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680 tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740 aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800 tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860 gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920 taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980 taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 22 2503 DNA 人工的 具有野生型内含子的荧光素酶cDNA 内含子 (669)..(1518) 22 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840 caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900 attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960 gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020 tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080 aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140 caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200 ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260 caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320 gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380 gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440 ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500 cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560 tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620 atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680 tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740 aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800 tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860 gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920 taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980 taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 23 2503 DNA 人工的 具有双突变型内含子(C654 C-T;657 TA-GT)的荧光素酶cDNA 内含子 (669)..(1518) 23 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840 caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900 attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960 gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020 tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080 aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140 caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200 ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260 caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320 gtaagtgcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380 gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440 ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500 cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560 tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620 atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680 tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740 aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800 tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860 gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920 taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980 taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 24 3355 DNA 人工的 具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (1)..(850) 内含子 (1521)..(2370) 24 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900 ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960 cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020 ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080 agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140 tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200 agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260 ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320 gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380 aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440 aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500 gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt tccccttctt 1560 ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1620 gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1680 tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1740 gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1800 gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1860 ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1920 taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1980 acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 2040 tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 2100 gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 2160 ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 2220 ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 2280 attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 2340 atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc aaatcattcc 2400 ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 2460 cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 2520 tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 2580 cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2640 ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2700 gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2760 cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2820 tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2880 aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2940 caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 3000 catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 3060 attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 3120 cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 3180 gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 3240 cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 3300 aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 3355 25 4219 DNA 人工的 具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (1)..(850) 内含子 (861)..(1710) 内含子 (2385)..(3234) 25 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt tccccttctt 900 ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 960 gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1020 tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1080 gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1140 gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1200 ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1260 taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1320 acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1380 tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1440 gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1500 ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1560 ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1620 attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1680 atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa aaacataaag 1740 aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca actgcataag 1800 gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc acatatcgag 1860 gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga agctatgaaa 1920 cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc tcttcaattc 1980 tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc gaacgacatt 2040 tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt ggtgttcgtt 2100 tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat catccaaaaa 2160 attattatca tggattctaa aacggattac cagggatttc agtcgatgta cacgttcgtc 2220 acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc cttcgatagg 2280 gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc taaaggtgtc 2340 gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt ctatgggacc 2400 cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg aaggggagaa 2460 gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg tggaagtctc 2520 aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt tgtttaattc 2580 ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc cttaacattg 2640 tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa aactttacac 2700 agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata ttcataatct 2760 ccctacttta ttttctttta tttttaattg atacataatc attatacata tttatgggtt 2820 aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat tttgcatttg 2880 taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta tttctaatac 2940 tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc tctttgcacc 3000 attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt tctgcatata 3060 aatatttctg catataaatt gtaactgatg taagaggttt catattgcta atagcagcta 3120 caatccagct accattctgc ttttatttta tggttgggat aaggctggat tattctgagt 3180 ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc acagagatcc 3240 tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc cattccatca 3300 cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag tcgtcttaat 3360 gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga ttcaaagtgc 3420 gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg acaaatacga 3480 tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg aagtcgggga 3540 agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc tcactgagac 3600 tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt 3660 tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa 3720 tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc 3780 ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag acatagctta 3840 ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa 3900 aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt 3960 cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt 4020 tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca 4080 agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg 4140 tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg 4200 cggaaagatc gccgtgtaa 4219 26 2503 DNA 人工的 在可变位置A处具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (394)..(1243) 26 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggtgagtc tatgggaccc ttgatgtttt 420 ctttcccctt cttttctatg gttaagttca tgtcatagga aggggagaag taacagggta 480 cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt 540 agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt 600 ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa 660 aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag 720 tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat 780 tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg 840 ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa 900 aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc 960 tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa 1020 taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa atatttctgc 1080 atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1140 ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1200 ccttttgcta atcatgttca tacctcttat cttcctccca caggggttgc aaaaaatttt 1260 gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga 1320 ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa 1380 tgaatacgat tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa 1440 ctcctctgga tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt 1500 gagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560 tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620 atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680 tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740 aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800 tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860 gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920 taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980 taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 27 2503 DNA 人工的 在可变位置B处具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (1161)..(2010) 27 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020 gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080 gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140 acgctgggcg ttaatcaaag gtgagtctat gggacccttg atgttttctt tccccttctt 1200 ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1260 gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1320 tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1380 gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1440 gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1500 ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1560 taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1620 acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1680 tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1740 gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1800 ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1860 ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1920 attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1980 atgttcatac ctcttatctt cctcccacag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 28 2503 DNA 人工的 在可变位置C处具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (1412)..(2261) 28 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020 gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080 gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140 acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200 tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260 ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320 ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380 caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt gatgttttct 1440 ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta acagggtaca 1500 gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag 1560 tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt 1620 ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag 1680 gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta 1740 cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt 1800 tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt 1860 ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa 1920 tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc 1980 tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata 2040 acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat atttctgcat 2100 ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc 2160 attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 2220 ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg acgatgacgc 2280 cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340 gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400 gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460 gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503 29 2505 DNA 人工的 在翻译起始位点上游具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (1)..(850) 29 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900 ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960 cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020 ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080 agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140 tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200 agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260 ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320 gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380 aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440 aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500 gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg 1560 attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg 1620 atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tctgaggagc 1680 cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc 1740 aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctggtggc 1800 gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct gccaggtatc 1860 aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat 1920 gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg 1980 gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg 2040 attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga 2100 tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catcgttgac 2160 cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga attggaatcc 2220 atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc cgacgatgac 2280 gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa 2340 gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt 2400 gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga 2460 gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 2505 30 3353 DNA 人工的 具有两个突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (669)..(1518) 内含子 (1519)..(2368) 30 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840 caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900 attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960 gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020 tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080 aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140 caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200 ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260 caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320 gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380 gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440 ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500 cttatcttcc tcccacaggt gagtctatgg gacccttgat gttttctttc cccttctttt 1560 ctatggttaa gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga 1620 aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg 1680 ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc 1740 aatttttact attatactta atgccttaac attgtgtata acaaaaggaa atatctctga 1800 gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg 1860 aatatatgtg tgcttatttg catattcata atctccctac tttattttct tttattttta 1920 attgatacat aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac 1980 acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt 2040 taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 2100 aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 2160 ctgggttaag gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 2220 gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 2280 tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat 2340 gttcatacct cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg 2400 atactgcgat tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg 2460 gatatttgat atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc 2520 tgaggagcct tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct 2580 tcttcgccaa aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt 2640 ctggtggcgc tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc 2700 caggtatcag gcaaggatat gggctcactg agactacatc agctattctg attacacccg 2760 agggggatga taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg 2820 tggatctgga taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag 2880 gtcctatgat tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca 2940 aggatggatg gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca 3000 tcgttgaccg cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat 3060 tggaatccat cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg 3120 acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180 cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240 gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300 aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353 31 3353 DNA 人工的 具有两个突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (669)..(1518) 内含子 (2262)..(3111) 31 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840 caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900 attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960 gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020 tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080 aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140 caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200 ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260 caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320 gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380 gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440 ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500 cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560 tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620 atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680 tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740 aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800 tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860 gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920 taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980 taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040 tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100 gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160 cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220 cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt 2280 gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta 2340 acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg 2400 atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg 2460 ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt 2520 ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt 2580 ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc 2640 tactttattt tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa 2700 gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 2760 ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 2820 ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 2880 ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat 2940 atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 3000 tccagctacc attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca 3060 agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg 3120 acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180 cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240 gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300 aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353 32 2303 DNA 人工的 具有突变型内含子的荧光素酶cDNA 内含子 (669)..(1318) 32 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840 atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900 ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960 tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020 atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080 caccattcta aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca 1140 tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200 gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260 gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320 atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380 atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440 taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500 gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560 acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620 gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680 agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740 aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800 ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860 atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920 cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980 acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040 tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100 ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160 gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220 aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280 agggcggaaa gatcgccgtg taa 2303 33 2303 DNA 人工的 具有双突变型内含子(654 C-T;657 TA-GT)的荧光素酶cDNA 内含子 (669)..(1318) 33 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720 gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780 tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840 atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900 ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960 tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020 atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080 caccattcta aagaataaca gtgataattt ctgggttaag gtaagtgcaa tatttctgca 1140 tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200 gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260 gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320 atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380 atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440 taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500 gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560 acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620 gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680 agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740 aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800 ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860 atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920 cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980 acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040 tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100 ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160 gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220 aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280 agggcggaaa gatcgccgtg taa 2303 34 2079 DNA 人工的 具有突变型内含子(654 C-T)的荧光素酶cDNA 内含子 (669)..(1094) 34 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccaggt gagtctatgg gacccttgat gttttctttc ctgtacacat attgaccaaa 720 tcagggtaat tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt 780 gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat 840 gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa 900 tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt 960 catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat 1020 aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta 1080 tcttcctccc acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta 1140 agtgttgttc cattccatca cggttttgga atgtttacta cactcggata tttgatatgt 1200 ggatttcgag tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag 1260 gattacaaga ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc 1320 actctgattg acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc 1380 ctctctaagg aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa 1440 ggatatgggc tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa 1500 ccgggcgcgg tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc 1560 gggaaaacgc tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg 1620 tccggttatg taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta 1680 cattctggag acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg 1740 aagtctctga ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg 1800 ctccaacacc ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt 1860 gaacttcccg ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc 1920 gtggattacg tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt 1980 gtggacgaag taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc 2040 ctcataaagg ccaagaaggg cggaaagatc gccgtgtaa 2079 35 7449 DNA 人工的 具有α抗胰蛋白酶cDNA和突变型内含子(654 C-T)的质粒TRCBA 内含子 (2866)..(3715) 突变型β-珠蛋白内含子(654C-T) 35 gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120 cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180 attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240 tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300 atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360 tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420 gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480 agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540 acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600 cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660 cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720 catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780 agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840 gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900 gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960 ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200 gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380 gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440 ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500 gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560 ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620 gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680 agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740 cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800 ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860 tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920 cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980 cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcgat 2040 atcaagcttg gggattttca ggcaccacca ctgacctggg acagtgaatc gacaatgccg 2100 tcttctgtct cgtggggcat cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc 2160 ctggctgagg atccccaggg agatgctgcc cagaagacag atacatccca ccatgatcag 2220 gatcacccaa ccttcaacaa gatcaccccc aacctggctg agttcgcctt cagcctatac 2280 cgccagctgg cacaccagtc caacagcacc aatatcttct tctccccagt gagcatcgct 2340 acagcctttg caatgctctc cctggggacc aaggctgaca ctcacgatga aatcctggag 2400 ggcctgaatt tcaacctcac ggagattccg gaggctcaga gccatgaagg ctgccaggaa 2460 ctcctccgta ccctcaacca gccagacagc cagctccagc tgaccaccgg caatggcctg 2520 tgcctcagcg agggcctgaa gcaagtggat aagtttttgg aggatgttaa aaagttgtac 2580 cactcataag ccttcactgt caacttcggg gacaccgaag aggccaagaa acagatcaac 2640 gattacgttg agaagggtac tcaagggaaa atggtggatg tggtcaagga gcttgacaga 2700 gacacagttt ttgctctggt gaattacatc ttctttaaag gcaaatggga gagacccttt 2760 gaagtcaagg acaccgagga agaggacttc cacgtggacc aggtgaccac cgtgaaggtg 2820 cctatgatga agcgtttagt catgtttaac atccagcact gtaaggtgag tctatgggac 2880 ccttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggaga 2940 agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 3000 caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 3060 cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 3120 gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 3180 cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 3240 tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 3300 taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 3360 gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 3420 ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 3480 cattctaaag aataacagtg ataatttctg ggttaaggta atagcaatat ttctgcatat 3540 aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 3600 acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 3660 tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagaagct 3720 ttccagctgg gtgctgctga tgaaatacct gggcaatgcc accgccatct tcttcctgcc 3780 tgatgagggg aaactacagc acctggaaaa tgaactcacc cacgatatca tcaccaagtt 3840 cctggaaaat gaagacagaa ggtctgccag cttacattta cccaaactgt ccattactgg 3900 aacctatgat ctgaagagcg tcctgggtca actgggcatc actaaggtct tcagcaatgg 3960 ggctgacctc tccgtggtca cagaggaggc acccctgaag ctctccaatg ccgtgcataa 4020 ggctgtgctg accatcgacg agaaagggac tgaagctgct ggggccatgt ttttagaggc 4080 catacccatg tctatccccc ccgaggtcaa ggtcaacaaa ccctttgtct tcttaatgat 4140 tgaacaaaat accaagtctc ccctcttcat gggaaaagtg gtgaatccca cccaaaaata 4200 actgcctctc gctcctcaac ccctcccctc catccctggc cccctccctg gatgacatta 4260 aagaagggtt gagctggtaa cccccccccc ccctgcaggg gccctcgacc cgggcggccg 4320 cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4380 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4440 agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4500 gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4560 gatctaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4620 tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 4680 cgagcgagcg cgcagagagg gagtggccaa cccccccccc cccccccctg cagcctggcg 4740 taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgtagcc tgaatggcga 4800 atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 4860 cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 4920 tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 4980 ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 5040 tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 5100 taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 5160 tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 5220 aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttcctgat gcgctatttt 5280 ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc 5340 tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 5400 cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 5460 atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata 5520 cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 5580 tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaatact ttcaaatatg 5640 tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 5700 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 5760 gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 5820 cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 5880 gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 5940 cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 6000 gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 6060 tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 6120 ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 6180 gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 6240 cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 6300 tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 6360 tcggcccttc cggctggctg gtttattgcg gataaatctg gagccggtga gcgtgggtct 6420 cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 6480 acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 6540 tcactgatta agcattggta actgtcagac caagtttact catatatact ttagattgat 6600 ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg 6660 accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 6720 aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 6780 ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 6840 gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 6900 ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 6960 ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 7020 ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 7080 gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg 7140 cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 7200 cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 7260 cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 7320 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 7380 ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 7440 gataccgct 7449 36 2107 DNA 人工的 具有突变型内含子(654 C-T)的α抗胰蛋白酶cDNA 内含子 (772)..(1621) 突变型β-珠蛋白内含子(654C-T) 36 atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct 60 gtctccctgg ctgaggatcc ccagggagat gctgcccaga agacagatac atcccaccat 120 gatcaggatc acccaacctt caacaagatc acccccaacc tggctgagtt cgccttcagc 180 ctataccgcc agctggcaca ccagtccaac agcaccaata tcttcttctc cccagtgagc 240 atcgctacag cctttgcaat gctctccctg gggaccaagg ctgacactca cgatgaaatc 300 ctggagggcc tgaatttcaa cctcacggag attccggagg ctcagagcca tgaaggctgc 360 caggaactcc tccgtaccct caaccagcca gacagccagc tccagctgac caccggcaat 420 ggcctgtgcc tcagcgaggg cctgaagcaa gtggataagt ttttggagga tgttaaaaag 480 ttgtaccact cataagcctt cactgtcaac ttcggggaca ccgaagaggc caagaaacag 540 atcaacgatt acgttgagaa gggtactcaa gggaaaatgg tggatgtggt caaggagctt 600 gacagagaca cagtttttgc tctggtgaat tacatcttct ttaaaggcaa atgggagaga 660 ccctttgaag tcaaggacac cgaggaagag gacttccacg tggaccaggt gaccaccgtg 720 aaggtgccta tgatgaagcg tttagtcatg tttaacatcc agcactgtaa ggtgagtcta 780 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 840 gggagaagta acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg 900 aagtctcagg atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt 960 ttaattcttg ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt 1020 aacattgtgt ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac 1080 tttacacagt ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc 1140 ataatctccc tactttattt tcttttattt ttaattgata cataatcatt atacatattt 1200 atgggttaaa gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt 1260 gcatttgtaa ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt 1320 ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct 1380 ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct 1440 gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata 1500 gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1560 tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1620 gaagctttcc agctgggtgc tgctgatgaa atacctgggc aatgccaccg ccatcttctt 1680 cctgcctgat gaggggaaac tacagcacct ggaaaatgaa ctcacccacg atatcatcac 1740 caagttcctg gaaaatgaag acagaaggtc tgccagctta catttaccca aactgtccat 1800 tactggaacc tatgatctga agagcgtcct gggtcaactg ggcatcacta aggtcttcag 1860 caatggggct gacctctccg tggtcacaga ggaggcaccc ctgaagctct ccaatgccgt 1920 gcataaggct gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt 1980 agaggccata cccatgtcta tcccccccga ggtcaaggtc aacaaaccct ttgtcttctt 2040 aatgattgaa caaaatacca agtctcccct cttcatggga aaagtggtga atcccaccca 2100 aaaataa 2107 37 18 DNA 人工的 结合调控序列的寡核苷酸 37 gctattacct taacccag 18 38 18 DNA 人工的 结合调控序列的寡核苷酸 38 gcacttacct taacccag 18 39 18 DNA 人工的 针对IVS2-654中6A突变的寡核苷酸 39 caagggtccc atagtctc 18 40 18 DNA 人工的 针对IVS2-654中564C突变的寡核苷酸 40 gaaagagatg agggaaag 18 41 18 DNA 人工的 针对IVS2-654中564CT突变的寡核苷酸 41 gaaagagaag agggaaag 18 42 18 DNA 人工的 针对IVS2-705中705G突变的寡核苷酸 42 cctcttacct cagttaca 18 43 18 DNA 人工的 针对IVS2-654中841A突变的寡核苷酸 43 ctgtgggagt aagataag 18 44 18 DNA 人工的 针对IVS2-654中657G突变的寡核苷酸 44 gctcttacct taacccag 18 45 18 DNA 人工的 针对IVS2-654中658T突变的寡核苷酸 45 gcaattacct taacccag 18 46 18 DNA 人工的 针对IVS2-654的寡核苷酸 46 caagggtccc atagactc 18 47 18 DNA 人工的 针对IVS2-654的寡核苷酸 47 gaaagagatt agggaaag 18 48 18 DNA 人工的 针对IVS2-654的寡核苷酸 48 ctgtgggagg aagataag 18 49 18 DNA 人工的 针对IVS2-705的寡核苷酸 49 cctcttacat cagttaca 18 50 850 DNA 人工的 具有564CT突变的IVS2-654内含子 misc_feature (564)..(565) 564CT突变 misc_feature (654)..(654) 654T突变 50 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 51 850 DNA 人工的 具有657G突变的IVS2-654内含子 misc_feature (654)..(654) 654T突变 misc_feature (657)..(657) 657G突变 51 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 52 850 DNA 人工的 具有658T突变的IVS2-654内含子 misc_feature (654)..(654) 654T突变 misc_feature (658)..(658) 658T突变 52 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaattgc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 53 650 DNA 人工的 具有200 bp缺失的IVS2-654内含子 misc_feature (454)..(454) C-T突变 53 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180 actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240 tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300 tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360 cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420 taaagaataa cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata 480 tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat 540 ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600 gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650 54 426 DNA 人工的 具有425 bp缺失的IVS2-654内含子 misc_feature (230)..(230) C-T突变 54 gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60 attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120 tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180 cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggt aatagcaata 240 tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 300 taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360 attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420 ccacag 426 55 850 DNA 人工的 具有6A突变的IVS2-654内含子 misc_feature (6)..(6) 6A突变 misc_feature (654)..(654) 654T突变 55 gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 56 850 DNA 人工的 具有564C突变的IVS2-654内含子 misc_feature (564)..(564) 564C突变 misc_feature (654)..(654) 654T突变 56 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 57 850 DNA 人工的 具有841A突变的IVS2-654内含子 misc_feature (654)..(654) 654T突变 misc_feature (841)..(841) 841A突变 57 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 actcccacag 850 58 850 DNA 人工的 IVS2-705内含子 misc_feature (705)..(705) 705G突变 58 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 59 850 DNA 人工的 具有564CT突变的IVS2-705内含子 misc_feature (564)..(565) 564CT突变 misc_feature (705)..(705) 705G突变 59 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 60 850 DNA 人工的 具有657G突变的IVS2-705内含子 misc_feature (657)..(657) 657G突变 misc_feature (705)..(705) 705G突变 60 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 61 850 DNA 人工的 具有658T突变的IVS2-705内含子 misc_feature (658)..(658) 658T突变 misc_feature (705)..(705) 705G突变 61 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaattgc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 62 850 DNA 人工的 具有657GT突变的IVS2-705内含子 misc_feature (657)..(658) 657GT突变 misc_feature (705)..(705) 705G突变 62 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagtgc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 63 650 DNA 人工的 具有200 bp缺失的IVS2-705内含子 misc_feature (505)..(505) T-G突变 63 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180 actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240 tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300 tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360 cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420 taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata 480 tttctgcata taaattgtaa ctgaggtaag aggtttcata ttgctaatag cagctacaat 540 ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600 gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650 64 426 DNA 人工的 具有425 bp缺失的IVS2-705内含子 misc_feature (281)..(281) T-G突变 64 gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60 attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120 tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180 cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 240 tttctgcata taaatatttc tgcatataaa ttgtaactga ggtaagaggt ttcatattgc 300 taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360 attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420 ccacag 426 65 850 DNA 人工的 具有6A突变的IVS2-705内含子 misc_feature (6)..(6) 6A突变 misc_feature (705)..(705) 705G突变 65 gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 66 850 DNA 人工的 具有564C突变的IVS2-705内含子 misc_feature (564)..(564) 564C突变 misc_feature (705)..(705) 705G突变 66 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 cctcccacag 850 67 850 DNA 人工的 具有841A突变的IVS2-705内含子 misc_feature (705)..(705) 705G突变 misc_feature (841)..(841) 841A突变 67 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120 tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180 ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240 taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300 aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360 tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420 tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480 ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540 atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600 catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660 aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720 ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780 ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840 actcccacag 850 68 196 DNA 人工的 IVS2-654内含子197 bp 68 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct cttctctttc tttcaggtga ttgactgact gggttaaggt aatagcgccg 120 ttgaaaacct cagccgtata gtccaagcta ggcccttttg ctaatcatgt tcatacctct 180 tatcttcctc ccacag 196 69 247 DNA 人工的 IVS-654内含子247 bp 69 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 240 cccacag 247 70 14667 DNA 智人 misc_feature (1)..(14667) CFTR基因外显子19 misc_feature (12191)..(12191) 3849 + 10 kb C-T突变位点 70 gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60 tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120 taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180 gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240 aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300 atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360 aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420 tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480 atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540 ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600 ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660 gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720 attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780 aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840 gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900 gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960 atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020 catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080 gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140 aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200 tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260 aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320 ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380 agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440 ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500 tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560 agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620 ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680 gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740 caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800 agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860 ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920 tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980 tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040 ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100 aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160 taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220 aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280 taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340 gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400 tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460 tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520 ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580 gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640 aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700 cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760 attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820 tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880 aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940 gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000 acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060 atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120 agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180 tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240 atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300 caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360 cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420 caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480 tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540 tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600 atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660 gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720 ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780 accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840 caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900 ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960 gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020 ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080 agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140 agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200 cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260 aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320 aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380 tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440 acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500 gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560 tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620 ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680 tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740 tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800 aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860 atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920 gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980 gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040 caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100 aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160 tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220 attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280 taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340 gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400 gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460 gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520 ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580 tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640 tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700 ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760 atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820 cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880 tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940 aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000 tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060 ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120 tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180 gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240 tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300 aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360 ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420 ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480 atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540 gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600 tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660 aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720 attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780 atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840 ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900 aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960 tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020 attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080 gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140 gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200 attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260 cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320 tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380 tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440 atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500 ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560 ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620 tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680 gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740 ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800 ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860 tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920 taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980 ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040 ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100 ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160 ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220 acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280 tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340 ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400 ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460 ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520 ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580 gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640 tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700 aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760 gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820 ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880 ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940 atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000 ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060 tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120 cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180 ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240 tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300 cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360 catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420 ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480 ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540 ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600 tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660 tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720 ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780 tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840 tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900 gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960 gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020 tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080 tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140 ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200 gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260 ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320 ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380 tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440 cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500 tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560 tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620 agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680 tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740 ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800 gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860 gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920 gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980 aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040 cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100 aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160 atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220 gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280 atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340 gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400 aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460 actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520 ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580 ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640 cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700 ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760 tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820 taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880 gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940 acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000 ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060 acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120 gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180 attaaaatgg cgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240 acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300 tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360 ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420 aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480 actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540 ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600 ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660 aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720 agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780 atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840 acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900 aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960 gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020 ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080 ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140 ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200 gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260 ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320 attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380 ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440 accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500 acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560 agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620 tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680 aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740 aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800 gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860 tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920 tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980 ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040 aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100 ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160 tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220 tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280 ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340 gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400 taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460 tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520 aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580 ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640 agtgatccca tcacttttac cttatag 14667 71 14667 DNA 智人 misc_feature (1)..(14667) 含有3849 + 10 kb C-T突变的CFTR外显子19 misc_feature (12191)..(12191) 3849 + 10 kb C-T突变 71 gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60 tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120 taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180 gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240 aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300 atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360 aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420 tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480 atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540 ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600 ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660 gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720 attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780 aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840 gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900 gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960 atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020 catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080 gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140 aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200 tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260 aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320 ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380 agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440 ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500 tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560 agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620 ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680 gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740 caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800 agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860 ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920 tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980 tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040 ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100 aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160 taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220 aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280 taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340 gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400 tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460 tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520 ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580 gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640 aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700 cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760 attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820 tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880 aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940 gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000 acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060 atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120 agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180 tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240 atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300 caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360 cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420 caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480 tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540 tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600 atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660 gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720 ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780 accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840 caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900 ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960 gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020 ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080 agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140 agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200 cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260 aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320 aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380 tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440 acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500 gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560 tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620 ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680 tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740 tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800 aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860 atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920 gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980 gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040 caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100 aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160 tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220 attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280 taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340 gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400 gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460 gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520 ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580 tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640 tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700 ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760 atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820 cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880 tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940 aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000 tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060 ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120 tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180 gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240 tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300 aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360 ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420 ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480 atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540 gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600 tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660 aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720 attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780 atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840 ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900 aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960 tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020 attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080 gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140 gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200 attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260 cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320 tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380 tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440 atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500 ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560 ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620 tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680 gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740 ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800 ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860 tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920 taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980 ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040 ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100 ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160 ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220 acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280 tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340 ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400 ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460 ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520 ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580 gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640 tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700 aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760 gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820 ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880 ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940 atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000 ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060 tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120 cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180 ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240 tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300 cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360 catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420 ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480 ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540 ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600 tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660 tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720 ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780 tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840 tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900 gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960 gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020 tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080 tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140 ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200 gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260 ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320 ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380 tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440 cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500 tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560 tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620 agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680 tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740 ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800 gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860 gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920 gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980 aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040 cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100 aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160 atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220 gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280 atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340 gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400 aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460 actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520 ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580 ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640 cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700 ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760 tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820 taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880 gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940 acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000 ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060 acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120 gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180 attaaaatgg tgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240 acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300 tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360 ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420 aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480 actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540 ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600 ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660 aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720 agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780 atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840 acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900 aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960 gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020 ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080 ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140 ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200 gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260 ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320 attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380 ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440 accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500 acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560 agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620 tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680 aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740 aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800 gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860 tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920 tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980 ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040 aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100 ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160 tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220 tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280 ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340 gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400 taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460 tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520 aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580 ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640 agtgatccca tcacttttac cttatag 14667 72 18 DNA 人工的 CFTR外显子19野生型的寡核苷酸 72 gtcttactcg ccatttta 18 73 18 DNA 人工的 CFTR外显子19 3849 + 10 kb C-T突变的寡核苷酸 misc_feature (10)..(10) 3849 + 10 kb C-T突变 73 gtcttactca ccatttta 18 74 3733 DNA 小鼠 misc_feature (1)..(3733) 野生型小鼠肌营养不良蛋白内含子22、外显子23和内含子 23序列 内含子 (1)..(913) 内含子 22 外显子 (914)..(1126) 外显子 23 内含子 (1127)..(3733) 内含子 23 74 gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60 tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120 gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180 ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240 agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300 tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360 tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420 caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480 tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540 ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600 taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660 acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720 tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780 atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840 accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900 atttaatttt gag gct ctg caa agt tct ttg aaa gag caa caa aat ggc 949 Ala Leu Gln Ser Ser Leu Lys Glu Gln Gln Asn Gly 1 5 10 ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997 Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro 15 20 25 tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045 Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly 30 35 40 cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093 His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu 45 50 55 60 gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146 Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln 65 70 taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206 cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266 acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326 aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386 aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446 tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506 actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566 ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626 actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686 taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746 caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806 atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866 ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926 taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986 tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046 ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106 aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166 ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226 ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286 ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346 gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406 acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466 atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526 ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586 tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646 tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706 tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766 ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826 agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886 ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946 ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006 atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066 atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126 aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186 ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246 taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306 tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366 agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426 ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486 aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546 gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606 aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666 atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726 attccag 3733 75 3733 DNA 小鼠 misc_feature (1)..(3733) mdx小鼠肌营养不良蛋白内含子22、外显子23和内含子 23序列 内含子 (1)..(913) 内含子 22 外显子 (914)..(1126) 外显子 23 misc_feature (941)..(941) mdx C-T 无义突变 内含子 (1127)..(3733) 内含子 23 75 gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60 tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120 gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180 ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240 agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300 tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360 tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420 caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480 tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540 ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600 taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660 acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720 tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780 atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840 accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900 atttaatttt gag gct ctg caa agt tct ttg aaa gag caa taa aat ggc 949 Ala Leu Gln Ser Ser Leu Lys Glu Gln Asn Gly 1 5 10 ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997 Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro 15 20 25 tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045 Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly 30 35 40 cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093 His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu 45 50 55 gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146 Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln 60 65 70 taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206 cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266 acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326 aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386 aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446 tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506 actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566 ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626 actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686 taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746 caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806 atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866 ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926 taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986 tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046 ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106 aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166 ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226 ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286 ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346 gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406 acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466 atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526 ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586 tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646 tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706 tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766 ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826 agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886 ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946 ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006 atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066 atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126 aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186 ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246 taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306 tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366 agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426 ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486 aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546 gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606 aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666 atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726 attccag 3733 76 25 DNA 人工的 诱导反义外显子23跳跃的寡核苷酸 misc_feature (1)..(25) 诱导外显子23跳跃的寡核苷酸 76 aacctcggct tacctgaaat tttcg 25 77 1653 DNA Hotaria parvula 77 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020 gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080 gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140 acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200 tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260 ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320 ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380 caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt 1440 cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500 tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560 gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620 aaggccaaga agggcggaaa gatcgccgtg taa 1653 78 17578 DNA 智人 内含子 (1)..(13645) 内含子 9 外显子 (13646)..(13738) 内含子 9 内含子 (13739)..(17578) 内含子 10 78 gtgagagtgg ctggctgcgc gtggaggtgt ggggggctgc gcctggaggg gtagggctgt 60 gcctggaagg gtagggctgc gcctggaggt gcgcggttga gcgtggagtc gtgggactgt 120 gcatggaggt gtggggctcc ccgcacctga gcacccccgc ataacacccc agtcccctct 180 ggaccctctt caaggaagtt cagttcttta ttgggctctc cactacactg tgagtgccct 240 cctcaggcga gagaacgttc tggctcttct cttgcccctt cagcccctgt taatcggaca 300 gagatggcag ggctgtgtct ccacggccgg aggctctcat agtcagggca cccacagcgg 360 ttccccacct gccttctggg cagaatacac tgccacccat aggtcagcat ctccactcgt 420 gggccatctg cttaggttgg gttcctctgg attctgggga gattgggggt tctgttttga 480 tcagctgatt cttctgggag caagtgggtg ctcgcgagct ctccagcttc ctaaaggtgg 540 agaagcacag acttcggggg cctggcctgg atccctttcc ccattcctgt ccctgtgccc 600 ctcgtctggg tgcgttaggg ctgacataca aagcaccaca gtgaaagaac agcagtatgc 660 ctcctcacta gccaggtgtg ggcgggtggg tttcttccaa ggcctctctg tggccgtggg 720 tagccacctc tgtcctgcac cgctgcagtc ttccctctgt gtgtgctcct ggtagctctg 780 cgcatgctca tcttcttata agaacaccat ggcagctggg cgtagtggct cacgcctata 840 atcccagcac tttgggaggc tgaggcaggc agatcacgag gtcaggagtt cgagaccaac 900 ctgaccaaca gggtgaaacc tcgtctctac taaaaataca aaaatacctg ggcgtggtgg 960 tggtgcgcgc ctataatccc agctactcag gaggctgagg caggagaatc gcttgaaccc 1020 aggaggcaga ggttgcagtg agccgagata gtgccactgc actccagttt gagcaacaga 1080 gcgagactct gtctcaaaac aaaataaaac aaaccaaaaa aacccaccat ggcttagggc 1140 ccagcctgat gacctcattt ttcacttagt cacctctcta aaggccctgt ctccaaatag 1200 agtcacattc taaggtacgg gggtgttggg gaggggggtt agggcttcaa catgtgaatt 1260 tgcggggacc acaattcagc ccaggacccc gctcccgcca cccagcactg gggagctggg 1320 gaagggtgaa gaggaggctg ggggtgagaa ggaccacagc tcactctgag gctgcagatg 1380 tgctgggcct tctgggcact gggcctcggg gagctagggg gctttctgga accctgggcc 1440 tgcgtgtcag cttgcctccc ccacgcaggc gctctccaca ccattgaagt tcttatcact 1500 tgggtctgag cctggggcat ttggacggag ggtggccacc agtgcacatg ggcaccttgc 1560 ctcaaaccct gccacctccc cccacccagg atcccccctg cccccgaaca agcttgtgag 1620 tgcagtgtca catcccatcg ggatggaaat ggacggtcgg gttaaaaggg acgcatgtgt 1680 agaccctgcc tctgtgcatc aggcctcttt tgagagtccc tgcgtgccag gcggtgcaca 1740 gaggtggaga agactcggct gtgccccaga gcacctcctc tcatcgagga aaggacagac 1800 agtggctccc ctgtggctgt ggggacaagg gcagagctcc ctggaacaca ggagggaggg 1860 aaggaagaga acatctcaga atctccctcc tgatggcaaa cgatccgggt taaattaagg 1920 tccggccttt tcctgctcag gcatgtggag cttgtagtgg aagaggctct ctggaccctc 1980 atccaccaca gtggcctggt tagagacctt ggggaaataa ctcacaggtg acccagggcc 2040 tctgtcctgt accgcagctg agggaaactg tcctgcgctt ccactgggga caatgcgctc 2100 cctcgtctcc agactttcca gtcctcattc ggttctcgaa agtcgcctcc agaagcccca 2160 tcttgggacc accgtgactt tcattctcca gggtgcctgg ccttggtgct gcccaagacc 2220 ccagaggggc cctcactggc ctttcctgcc ttttctccca ttgcccaccc atgcaccccc 2280 atcctgctcc agcacccaga ctgccatcca ggatctcctc aagtcacata acaagcagca 2340 cccacaaggt gctcccttcc ccctagcctg aatctgctgc tccccgtctg gggttccccg 2400 cccatgcacc tctgggggcc cctgggttct gccataccct gccctgtgtc ccatggtggg 2460 gaatgtcctt ctctccttat ctcttccctt cccttaaatc caagttcagt tgccatctcc 2520 tccaggaagt cttcctggat tcccctctct cttcttaaag cccctgtaaa ctctgaccac 2580 actgagcatg tgtctgctgc tccctagtct gggccatgag tgagggtgga ggccaagtct 2640 catgcatttt tgcagccccc acaagactgt gcaggtggcc ggccctcatt gaatgcgggg 2700 ttaatttaac tcagcctctg tgtgagtgga tgattcaggt tgccagagac agaaccctca 2760 gcttagcatg ggaagtagct tccctgttga ccctgagttc atctgaggtt ggcttggaag 2820 gtgtgggcac catttggccc agttcttaca gctctgaaga gagcagcagg aatggggctg 2880 agcagggaag acaactttcc attgaaggcc cctttcaggg ccagaactgt ccctcccacc 2940 ctgcagctgc cctgcctctg cccatgaggg gtgagagtca ggcgacctca tgccaagtgt 3000 agaaaggggc agacgggagc cccaggttat gacgtcacca tgctgggtgg aggcagcacg 3060 tccaaatcta ctaaagggtt aaaggagaaa gggtgacttg acttttcttg agatattttg 3120 ggggacgaag tgtggaaaag tggcagagga cacagtcaca gcctccctta aatgccagga 3180 aagcctagaa aaattgtctg aaactaaacc tcagccataa caaagaccaa cacatgaatc 3240 tccaggaaaa aagaaaaaga aaaatgtcat acagggtcca tgcacaagag cctttaaaat 3300 gacccgctga agggtgtcag gcctcctcct cctggactgg cctgaaggct ccacgagctt 3360 ttgctgagac ctttgggtcc ctgtggcctc atgtagtacc cagtatgcag taagtgctca 3420 ataaatgttt ggctacaaaa gaggcaaagc tggcggagtc tgaagaatcc ctcaaccgtg 3480 ccggaacaga tgctaacacc aaagggaaaa gagcaggagc caagtcacgt ttgggaacct 3540 gcagaggctg aaaactgccg cagattgctg caaatcattg ggggaaaaac ggaaaacgtc 3600 tgttttcccc tttgtgcttt tctctgtttt cttctttgtg cttttctctg ttttcaggat 3660 ttgctacagt gaacatagat tgctttgggg ccccaaatgg aattattttg aaaggaaaat 3720 gcagataatc aggtggccgc actggagcac cagctgggta ggggtagaga ttgcaggcaa 3780 ggaggaggag ctgggtgggg tgccaggcag gaagagcccg taggccccgc cgatcttgtg 3840 ggagtcgtgg gtggcagtgt tccctccaga ctgtaaaagg gagcacctgg cgggaagagg 3900 gaattctttt aaacatcatt ccagtgcccg agcctcctgg acctgttgtc atcttgaggt 3960 gggcctcccc tgggtgactc tagtgtgcag cctggctgag actcagtggc cctgggttct 4020 tactgctgac acctaccctc aacctcaacc actgcggcct cctgtgcacc ctgatccagt 4080 ggctcatttt ccactttcag tcccagctct atccctattt gcagtttcca agtgcctggt 4140 cctcagtcag ctcagaccca gccaggccag cccctggttc ccacatcccc tttgccaagc 4200 tcatccccgc cctgtttggc ctgcgggagt gggagtgtgt ccagacacag agacaaagga 4260 ccagctttta aaacattttg ttggggccag gtgtggtggc tcacacctaa tcccaacacc 4320 tggggaggcc aaggcagaag gatcacttga gtccaggagt tcaagaccag cctgggcaac 4380 atagggagac cctgtctcta caattttttt tttaattagc tgggcctgtt ggcactctcc 4440 tgtagttcca gctactctag aggctgaggt gggaggactg cttgagcctg ggaggtcagg 4500 gctgcaatga gccatgttca caccactgaa cgccagcctg ggcgagaccc tgtatcaaaa 4560 aagtaaagta aaatgaatcc tgtacgttat attaaggtgc cccaaattgt acttagaagg 4620 atttcatagt tttaaatact tttgttattt aaaaaattaa atgactgcag catataaatt 4680 aggttcttaa tggaggggaa aaagagtaca agaaaagaaa taagaatcta gaaacaaaga 4740 taagagcaga aataaaccag aaaacacaac cttgcactcc taacttaaaa aaaaaaatga 4800 agaaaacaca accagtaaaa caacatataa cagcattaag agctggctcc tggctgggcg 4860 cggtggcgca tgcctgtaat cccaacactt tgggaggccg atgctggagg atcacttgag 4920 accaggagtt caaggttgca gtgagctatg atcataccac tacaccctag cctgggcaac 4980 acagtgagac tgagactcta ttaaaaaaaa aatgctggtt ccttccttat ttcattcctt 5040 tattcattca ttcagacaac atttatgggg cacttctgag caccaggctc tgtgctaaga 5100 gcttttgccc ccagggtcca ggccagggga caggggcagg tgagcagaga aacagggcca 5160 gtcacagcag caggaggaat gtaggatgga gagcttggcc aggcaaggac atgcaggggg 5220 agcagcctgc acaagtcagc aagccagaga agacaggcag acccttgttt gggacctgtt 5280 cagtggcctt tgaaaggaca gcccccaccc ggagtgctgg gtgcaggagc tgaaggagga 5340 tagtggaaca ctgcaacgtg gagctcttca gagcaaaagc aaaataaaca actggaggca 5400 gctggggcag cagagggtgt gtgttcagca ctaaggggtg tgaagcttga gcgctaggag 5460 agttcacact ggcagaagag aggttggggc agctgcaagc ctctggacat cgcccgacag 5520 gacagagggt ggtggacggt ggccctgaag agaggctcag ttcagctggc agtggccgtg 5580 ggagtgctga agcaggcagg ctgtcggcat ctgctgggga cggttaagca ggggtgaggg 5640 cccagcctca gcagcccttc ttggggggtc gctgggaaac atagaggaga actgaagaag 5700 cagggagtcc cagggtccat gcagggcgag agagaagttg ctcatgtggg gcccaggctg 5760 caggatcagg agaactgggg accctgtgac tgccagcggg gagaaggggg tgtgcaggat 5820 catgcccagg gaagggccca ggggcccaag catggggggg cctggttggc tctgagaaga 5880 tggagctaaa gtcactttct cggaggatgt ccaggccaat agttgggatg tgaagacgtg 5940 aagcagcaca gagcctggaa gcccaggatg gacagaaacc tacctgagca gtggggcttt 6000 gaaagccttg gggcgggggg tgcaatattc aagatggcca caagatggca atagaatgct 6060 gtaactttct tggttctggg ccgcagcctg ggtggctgct tccttccctg tgtgtattga 6120 tttgtttctc ttttttgaga cagagtcttg ctgggttgcc caggctggag tgcagtggtg 6180 cgatcatagc tcactgcagc cttgaagtcc tgagctcaag agatccttcc acctcagcct 6240 cctgagtagt tgggaccaca ggcttgcacc acagtgccca actaatttct tatatttttt 6300 gtagagatgg ggtttcactg tgtcgcccag gatggtcttg aactcctggg ctcaagtgat 6360 cctcctgcct cagcctcgca aattgctggg attacaggtg tgagccacca tgcccgacct 6420 tctcttttta agggcgtgtg tgtgtgtgtg tgtgtgtggg cgcactctcg tcttcacctt 6480 cccccagcct tgctctgtct ctacccagtc acctctgccc atctctccga tctgtttctc 6540 tctcctttta cccctctttc ctccctcctc atacaccact gaccattata gagaactgag 6600 tattctaaaa atacatttta tttatttatt ttgagacaga gtctcactct gtcacccagg 6660 ctggagtgca gtggtgcaat ctcggctcac tgcaacctcc gcctcccagg ttgaagcaac 6720 tctcctgcct cagcctccct agtagctggg attacaagca cacaccacca tgcctagcaa 6780 atttttatat ttttagtaga ggaggagtgt caccatgttt gccaagctgg tctcaaactc 6840 ctggcctcag gtgatctgcc taccttggtc tcccaaagtg ctgggattac aggtgtgagc 6900 caccacgcct gcccttaaaa atacattata tttaatagca aagccccagt tgtcacttta 6960 aaaagcatct atgtagaaca tttatgtgga ataaatacag tgaatttgta cgtggaatcg 7020 tttgcctctc ctcaatcagg gccagggatg caggtgagct tgggctgaga tgtcagaccc 7080 cacagtaagt ggggggcaga gccaggctgg gaccctcctc taggacagct ctgtaactct 7140 gagaccctcc aggcatcttt tcctgtacct cagtgcttct gaaaaatctg tgtgaatcaa 7200 atcattttaa aggagcttgg gttcatcact gtttaaagga cagtgtaaat aattctgaag 7260 gtgactctac cctgttattt gatctcttct ttggccagct gacttaacag gacatagaca 7320 ggttttcctg tgtcagttcc taagctgatc accttggact tgaagaggag gcttgtgtgg 7380 gcatccagtg cccaccccgg gttaaactcc cagcagagta ttgcactggg cttgctgagc 7440 ctggtgaggc aaagcacagc acagcgagca ccaggcagtg ctggagacag gccaagtctg 7500 ggccagcctg ggagccaact gtgaggcacg gacggggctg tggggctgtg gggctgcagg 7560 cttggggcca gggagggagg gctgggctct ttggaacagc cttgagagaa ctgaacccaa 7620 acaaaaccag atcaaggtct agtgagagct tagggctgct ttgggtgctc caggaaattg 7680 attaaaccaa gtggacacac acccccagcc ccacctcacc acagcctctc cttcagggtc 7740 aaactctgac cacagacatt tctcccctga ctaggagttc cctggatcaa aattgggagc 7800 ttgcaacaca tcgttctctc ccttgatggt ttttgtcagt gtctatccag agctgaagtg 7860 taatatatat gttactgtag ctgagaaatt aaatttcagg attctgattt cataatgaca 7920 accattcctc ttttctctcc cttctgtaaa tctaagattc tataaacggt gttgacttaa 7980 tgtgacaatt ggcagtagtt caggtctgct ttgtaaatac ccttgtgtct attgtaaaat 8040 ctcacaaagg cttgttgcct tttttgtggg gttagaacaa gaaaaagcca catggaaaaa 8100 aaatttcttt tttgtttttt tgtttgcttg tttttttgag acagagtttc actctgtcgc 8160 ccaggctgga gtgcagtggt gcgatctccg cccactgcaa gctccacctc ccgggttcat 8220 gctattctcc tgtctcagcc tcccaagtag ctgggactgc aggtgcccgc caccacacct 8280 ggctaatttt tttgtatttt tagtagagac ggggtttcac cgtgttagcc aggatggtct 8340 caatctcctg acctcgtcat ctgcctgcct cggcctccca aagtgctgag attacaggcg 8400 tgagccaccg tgcccggcca gaaaaaaaca tttctaagta tgtggcagat actgaattat 8460 tgcttaatgt cctttgattc atttgtttaa tttctttaat ggattagtac agaaaacaaa 8520 gttctcttcc ttgaaaaact ggtaagtttt ctttgtcaga taaggagagt taaataaccc 8580 atgacatttc cctttttgcc tcggcttcca ggaagctcaa agttaaatgt aatgatcact 8640 cttgtaatta tcagtgttga tgcccttccc ttcttctaat gttactcttt acattttcct 8700 gctttattat tgtgtgtgtt ttctaattct aagctgttcc cactcctttc tgaaagcagg 8760 caaatcttct aagccttatc cactgaaaag ttatgaataa aaaatgatcg tcaagcctac 8820 aggtgctgag gctactccag aggctgaggc cagaggacca cttgagccca ggaatttgag 8880 acctgggctg ggcagcatag caagactcta tctccattaa aactattttt ttttatttaa 8940 aaaataatcc gcaaagaagg agtttatgtg ggattcctta aaatcggagg gtggcatgaa 9000 ttgattcaaa gacttgtgca gagggcgaca gtgactcctt gagaagcagt gtgagaaagc 9060 ctgtcccacc tccttccgca gctccagcct gggctgaggc actgtcacag tgtctccttg 9120 ctggcaggag agaatttcaa cattcaccaa aaagtagtat tgtttttatt aggtttatga 9180 ggctgtagcc ttgaggacag cccaggacaa ctttgttgtc acatagatag cctgtggcta 9240 caaactctga gatctagatt cttctgcggc tgcttctgac ctgagaaagt tgcggaacct 9300 cagcgagcct cacatggcct ccttgtcctt aacgtgggga cggtgggcaa gaaaggtgat 9360 gtggcactag agatttatcc atctctaaag gaggagtgga ttgtacattg aaacaccaga 9420 gaaggaatta caaaggaaga atttgagtat ctaaaaatgt aggtcaggcg ctcctgtgtt 9480 gattgcaggg ctattcacaa tagccaagat ttggaagcaa cccaagtgtc catcaacaga 9540 caaatggata aagaaaatgt ggtgcatata cacaatggaa tactattcag ccatgaaaaa 9600 gaatgagaat ctgtcatttg aaacaacatg gatggaactg gaggacatta tgttaagtga 9660 aataagccag acagaaggac agacttcaca tgttctcaca catttgtggg agctaaaaat 9720 taaactcatg gagatagaga gtagaaggat ggttaccaga ggctgaggag ggtggagggg 9780 agcagggaga aagtagggat ggttaatggg tacaaaaacg tagttagcat gcatagatct 9840 agtattggat agcacagcag ggtgacgaca gccaacagta atttatagta catttaaaaa 9900 caactaaaag agtgtaactg gactggctaa catggtgaaa ccccgtctct actaaaaata 9960 caaaaattag ctgggcacgg tggctcacgc ctgtaatccc agcactttgg gaggccgagg 10020 cgggccgatc acgaggtcag gagatcgaga ccatcctagc taacatggtg aaaccccgtc 10080 tctactacaa atacaaaaaa aagaaaaaat tagccgggca tggtggtggg cgcctgtagt 10140 cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc ggagcttgca 10200 gtgagccgag atcgcgccac tgcactccag cctgggcgac aaggcaagat tctatctcaa 10260 aaaaataaaa ataaaataaa ataaaataat aaaataaaat aaaataaaat aaaataaaat 10320 aaataaaata aaatgtataa ttggaatgtt tataacacaa gaaatgataa atgcttgagg 10380 tgatagatac cccattcacc gtgatgtgat tattgcacaa tgtatgtctg tatctaaata 10440 tctcatgtac cccacaagta tatacaccta ctatgtaccc atataaattt aaaattaaaa 10500 aattataaaa caaaaataaa taagtaaatt aaaatgtagg ctggacaccg tggttcacgc 10560 ctgtaatccc agtgctttgt gaggctgagg tgagagaatc acttgagccc aggagtttga 10620 gaccggcctg ggtgacatag cgagacccca tcatcacaaa gaatttttaa aaattagctg 10680 ggcgtggtag cacataccgg tagttccagc tacttgggag accgaggcag gaggattgct 10740 tgagcccagg agtttaaggc tgcagtgagc tacgatggcg ccactgcatt ccagcctggg 10800 tgacagagtg agagcttgtc tctattttaa aaataataaa aagaataaat aaaaataaat 10860 taaaatgtaa atatgtgcat gttagaaaaa atacacccat cagcaaaaag ggggtaaagg 10920 agcgatttca gtcataattg gagagatgca gaataagcca gcaatgcagt ttcttttatt 10980 ttggtcaaaa aaaataagca aaacaatgtt gtaaacaccc agtgctggca gcaatgtggt 11040 gaggctggct ctctcaccag ggctcacagg gaaaactcat gcaacccttt tagaaagcca 11100 tgtggagagt tgtaccgaga ggttttagaa tatttataac tttgacccag aaattctatt 11160 ctaggactct gtgttatgaa aataacccat catatggaaa aagctccttt cagaaagagg 11220 ttcatgggag gctgtttgta tttttttttt ctttgcatca aatccagctc ctgcaggact 11280 gtttgtatta ttgaagtaca aagtggaatc aatacaaatg ttggatagca ggggaacaat 11340 attcacaaaa tggaatggga catagtatta aacatagtgc ttctgatgac cgtagaccat 11400 agacaatgct taggatatga tatcacttct tttgttgttt tttgtatttt gagacgaagt 11460 ctcattctgt cacccaggct ggagttcagt ggcgccatct cagctcactg caacctccat 11520 ctcccgggtt caagctattc tccttcctca acctcccgag tagctgggtt gcgcaccacc 11580 atgcctggct aacttttgta tttttagtac agacggggtt tcaccacgtt ggccaggctg 11640 ctcttgaact cctgacgtca ggtgatccac cagccttgac ctcccaaagt gctaggatta 11700 caggagccac tgtacccagc ctaggatatg atatcacttc ttagagcaag atacaaaatt 11760 gcatgtgcac aataattcta ccaagtatag gtatacaggg gtagttatat ataaatgaga 11820 cttcaaggaa atacaacaaa atgcaatcgt gattgtgtta gggtggtaag aaaacggttt 11880 ttgctttgat gagctctgtt ttttaaaatc gttatatttt ctaataaaaa tacatagtct 11940 tttgaaggaa cataaaagat tatgaagaaa tgagttagat attgattcct attgaagatt 12000 cagacaagta aaattaaggg gaaaaaaaac gggatgaacc agaagtcagg ctggagttcc 12060 aaccccagat ccgacagccc aggctgatgg ggcctccagg gcagtggttt ccacccagca 12120 ttctcaaaag agccactgag gtctcagtgc cattttcaag atttcggaag cggcctgggc 12180 acggctggtc cttcactggg atcaccactt ggcaattatt tacacctgag acgaatgaaa 12240 accagagtgc tgagattaca ggcatggtgg cttacgcttg taatcggctt tgggaagccg 12300 aggtgggctg attgcttgag cccaggagtt tcaaactatc ctggacaaca tagcatgacc 12360 tcgtctctac aaaaaataca aaaaatttgc caggtgtggt ggcatgtgcc tgtggtccca 12420 gctacttggg aggctgaagt aggagaatcc cctgagccct gggaagtcga ggctgcactg 12480 agccgtgatg gtgtcactgc actccagcct gggtgacaaa gtgagaccct atctcacaaa 12540 gaaaaaaaac aaaacaaaaa acccaaagca cactgtttcc actgtttcca gagttcctga 12600 gaggaaaggt caccgggtga ggaagacgtt ctcactgatc tggcagagaa aatgtccagt 12660 ttttccaact ccctaaacca tggttttcta tttcatagtt cttaggcaaa ttggtaaaaa 12720 tcatttctca tcaaaacgct gatattttca cacctccctg gtgtctgcag aaagaacctt 12780 ccagaaatgc agtcgtggga gacccatcca ggccacccct gcttatggaa gagctgagaa 12840 aaagccccac gggagcattt gctcagcttc cgttacgcac ctagtggcat tgtgggtggg 12900 agagggctgg tgggtggatg gaaggagaag gcacagcccc cccttgcagg gacagagccc 12960 tcgtacagaa gggacacccc acatttgtct tccccacaaa gcggcctgtg tcctgcctac 13020 ggggtcaggg cttctcaaac ctggctgtgt gtcagaatca ccaggggaac ttttcaaaac 13080 tagagagact gaagccagac tcctagattc taattctagg tcagggctag gggctgagat 13140 tgtaaaaatc cacaggtgat tctgatgccc ggcaggcttg agaacagccg cagggagttc 13200 tctgggaatg tgccggtggg tctagccagg tgtgagtgga gatgccgggg aacttcctat 13260 tactcactcg tcagtgtggc cgaacacatt tttcacttga cctcaggctg gtgaacgctc 13320 ccctctgggg ttcaggcctc acgatgccat ccttttgtga agtgaggacc tgcaatccca 13380 gcttcgtaaa gcccgctgga aatcactcac acttctggga tgccttcaga gcagccctct 13440 atcccttcag ctcccctggg atgtgactcg acctcccgtc actccccaga ctgcctctgc 13500 caagtccgaa agtggaggca tccttgcgag caagtaggcg ggtccagggt ggcgcatgtc 13560 actcatcgaa agtggaggcg tccttgcgag caagcaggcg ggtccagggt ggcgtgtcac 13620 tcatcctttt ttctggctac caaag gtg cag ata att aat aag aag ctg gat 13672 Val Gln Ile Ile Asn Lys Lys Leu Asp 1 5 ctt agc aac gtc cag tcc aag tgt ggc tca aag gat aat atc aaa cac 13720 Leu Ser Asn Val Gln Ser Lys Cys Gly Ser Lys Asp Asn Ile Lys His 10 15 20 25 gtc ccg gga ggc ggc agt gtgagtacct tcacacgtcc catgcgccgt 13768 Val Pro Gly Gly Gly Ser 30 gctgtggctt gaattattag gaagtggtgt gagtgcgtac acttgcgaga cactgcatag 13828 aataaatcct tcttgggctc tcaggatctg gctgcgacct ctgggtgaat gtagcccggc 13888 tccccacatt cccccacacg gtccactgtt cccagaagcc ccttcctcat attctaggag 13948 ggggtgtccc agcatttctg ggtcccccag cctgcgcagg ctgtgtggac agaatagggc 14008 agatgacgga ccctctctcc ggaccctgcc tgggaagctg agaataccca tcaaagtctc 14068 cttccactca tgcccagccc tgtccccagg agccccatag cccattggaa gttgggctga 14128 aggtggtggc acctgagact gggctgccgc ctcctccccc gacacctggg caggttgacg 14188 ttgagtggct ccactgtgga caggtgaccc gtttgttctg atgagcggac accaaggtct 14248 tactgtcctg ctcagctgct gctcctacac gttcaaggca ggagccgatt cctaagcctc 14308 cagcttatgc ttagcctgcg ccaccctctg gcagagactc cagatgcaaa gagccaaacc 14368 aaagtgcgac aggtccctct gcccagcgtt gaggtgtggc agagaaatgc tgcttttggc 14428 ccttttagat ttggctgcct cttgccagga gtggtggctc gtgcctgtaa ttccagcact 14488 ttgggagact aaggcgggag gttcgcttga gcccaggagt tcaagaccag cctgggcaac 14548 aatgagaccc ctgtgtctac aaaaagaatt aaaattagcc aggtgtggtg gcacgcacct 14608 gtagtcccag ctacttggga ggctgaggtg ggaggattgc ctgagtccgg gaggcggaag 14668 ttgcaaggag ccatgatcgc gccactgcac ttcaacctag gcaacagagt gagactttgt 14728 ctcaaaaaac aatcatataa taattttaaa ataaatagat ttggcttcct ctaaatgtcc 14788 ccggggactc cgtgcatctt ctgtggagtg tctccgtgag attcgggact cagatcctca 14848 agtgcaactg acccacccga taagctgagg cttcatcatc ccctggccgg tctatgtcga 14908 ctgggcaccc gaggctcctc tcccaccagc tctcttggtc agctgaaagc aaactgttaa 14968 caccctgggg agctggacgt atgagaccct tggggtggga ggcgttgatt tttgagagca 15028 atcacctggc cctggctggc agtaccggga cactgctgtg gctccggggt gggctgtctc 15088 cagaaaatgc ctggcctgag gcagccaccc gcatccagcc cagagggttt attcttgcaa 15148 tgtgctgctg cttcctgccc tgagcacctg gatcccggct tctgccctga ggccccttga 15208 gtcccacagg tagcaagcgc ttgccctgcg gctgctgcat ggggctaact aacgcttcct 15268 caccagtgtc tgctaagtgt ctcctctgtc tcccacgccc tgctctcctg tccccccagt 15328 ttgtctgctg tgaggggaca gaagaggtgt gtgccgcccc cacccctgcc cgggcccttg 15388 ttcctgggat tgctgttttc agctgtttga gctttgatcc tggttctctg gcttcctcaa 15448 agtgagctcg gccagaggag gaaggccatg tgctttctgg ttgaagtcaa gtctggtgcc 15508 ctggtggagg ctgtgctgct gaggcggagc tggggagaga gtgcacacgg gctgcgtggc 15568 caacccctct gggtagctga tgcccaaaga cgctgcagtg cccaggacat ctgggacctc 15628 cctggggccc gcccgtgtgt cccgcgctgt gttcatctgc gggctagcct gtgacccgcg 15688 ctgtgctcgt ctgcgggcta gcctgtgtcc cgcgctctgc ttgtctgcgg tctagcctgt 15748 gacctggcag agagccacca gatgtcccgg gctgagcact gccctctgag caccttcaca 15808 ggaagccctt ctcctggtga gaagagatgc cagcccctgg catctggggg cactggatcc 15868 ctggcctgag ccctagcctc tccccagcct gggggcccct tcccagcagg ctggccctgc 15928 tccttctcta cctgggaccc ttctgcctcc tggctggacc ctggaagctc tgcagggcct 15988 gctgtccccc tccctgccct ccaggtatcc tgaccaccgg ccctggctcc cactgccatc 16048 cactcctctc ctttctggcc gttccctggt ccctgtccca gcccccctcc ccctctcacg 16108 agttacctca cccaggccag agggaagagg gaaggaggcc ctggtcatac cagcacgtcc 16168 tcccacctcc ctcggccctg gtccaccccc tcagtgctgg cctcagagca cagctctctc 16228 caagccaggc cgcgcgccat ccatcctccc tgtcccccaa cgtccttgcc acagatcatg 16288 tccgccctga cacacatggg tctcagccat ctctgcccca gttaactccc catccataaa 16348 gagcacatgc cagccgacac caaaataatt cgggatggtt ccagtttaga cctaagtgga 16408 aggagaaacc accacctgcc ctgcaccttg ttttttggtg accttgataa accatcttca 16468 gccatgaagc cagctgtctc ccaggaagct ccagggcggt gcttcctcgg gagctgactg 16528 ataggtggga ggtggctgcc cccttgcacc ctcaggtgac cccacacaag gccactgctg 16588 gaggccctgg ggactccagg aatgtcaatc agtgacctgc cccccaggcc ccacacagcc 16648 atggctgcat agaggcctgc ctccaaggga cctgtctgtc tgccactgtg gagtccctac 16708 agcgtgcccc ccacagggga gctggttctt tgactgagat cagctggcag ctcagggtca 16768 tcattcccag agggagcggt gccctggagg ccacaggcct cctcatgtgt gtctgcgtcc 16828 gctcgagctt actgagacac taaatctgtt ggtttctgct gtgccaccta cccaccctgt 16888 tggtgttgct ttgttcctat tgctaaagac aggaatgtcc aggacactga gtgtgcaggt 16948 gcctgctggt tctcacgtcc gagctgctga actccgctgg gtcctgctta ctgatggtct 17008 ttgctctagt gctttccagg gtccgtggaa gcttttcctg gaataaagcc cacgcatcga 17068 ccctcacagc gcctcccctc tttgaggccc agcagatacc ccactcctgc ctttccagca 17128 agatttttca gatgctgtgc atactcatca tattgatcac ttttttcttc atgcctgatt 17188 gtgatctgtc aatttcatgt caggaaaggg agtgacattt ttacacttaa gcgtttgctg 17248 agcaaatgtc tgggtcttgc acaatgacaa tgggtccctg tttttcccag aggctctttt 17308 gttctgcagg gattgaagac actccagtcc cacagtcccc agctcccctg gggcagggtt 17368 ggcagaattt cgacaacaca tttttccacc ctgactagga tgtgctcctc atggcagctg 17428 ggaaccactg tccaataagg gcctgggctt acacagctgc ttctcattga gttacaccct 17488 taataaaata atcccatttt atcctttttg tctctctgtc ttcctctctc tctgcctttc 17548 ctcttctctc tcctcctctc tcatctccag 17578 79 18 DNA 人工的 合成寡核苷酸 79 tatctgcacc tttggtag 18 80 21 DNA 人工的 合成寡核苷酸 80 tgaaggtact cacactgccg c 21 81 20 DNA 人工的 向导RNA 81 tgcaaaaacc caaaatattt 20 82 20 DNA 人工的 向导RNA 82 aaaatatttt agctcctact 20 83 20 DNA 人工的 向导RNA 83 cagagtaaca gtctgagtag 20 84 20 DNA 人工的 向导RNA 84 taagggatat ttgttcttac 20 85 20 DNA 人工的 向导RNA 85 ctaagggata tttgttctta 20 86 20 DNA 人工的 向导RNA 86 tgttcttaca ggcaacaatg 20 87 20 DNA 人工的 向导RNA 87 tgtatgcttt tctgttaaag 20 88 20 DNA 人工的 向导RNA 88 atgtgtatgc ttttctgtta 20 89 20 DNA 人工的 向导RNA 89 gtgtatgctt ttctgttaaa 20 90 20 DNA 人工的 向导RNA 90 ttgccttttt ggtatcttac 20 91 20 DNA 人工的 向导RNA 91 tttgcctttt tggtatctta 20 92 20 DNA 人工的 向导RNA 92 cgctgcccaa tgccatcctg 20 93 20 DNA 人工的 向导RNA 93 atttattttt ccttttattc 20 94 20 DNA 人工的 向导RNA 94 tttcctttta ttctagttga 20 95 20 DNA 人工的 向导RNA 95 tgattctgaa ttctttcaac 20 96 20 DNA 人工的 向导RNA 96 atccatatgc ttttacctgc 20 97 20 DNA 人工的 向导RNA 97 gatccatatg cttttacctg 20 98 20 DNA 人工的 向导RNA 98 cagatctgtc aaatcgcctg 20 99 20 DNA 人工的 向导RNA 99 ttattcttct ttctccaggc 20 100 20 DNA 人工的 向导RNA 100 aattttattc ttctttctcc 20 101 20 DNA 人工的 向导RNA 101 caattttatt cttctttctc 20 102 20 DNA 人工的 向导RNA 102 gttttaaaat ttttatatta 20 103 20 DNA 人工的 向导RNA 103 ttttatatta cagaatataa 20 104 20 DNA 人工的 向导RNA 104 atattacaga atataaaaga 20 105 20 DNA 人工的 向导RNA 105 tgtgtatgtg tatgtgtttt 20 106 20 DNA 人工的 向导RNA 106 tatgtgtatg tgttttaggc 20 107 20 DNA 人工的 向导RNA 107 ctattccagt caaataggtc 20 108 20 DNA 人工的 向导RNA 108 gtgtagtgtt aatgtgctta 20 109 20 DNA 人工的 向导RNA 109 ggacttctta tctggatagg 20 110 20 DNA 人工的 向导RNA 110 taggtggtat caacatctgt 20 111 20 DNA 人工的 向导RNA 111 tgaaaattta tttccacatg 20 112 20 DNA 人工的 向导RNA 112 gaaaatttat ttccacatgt 20 113 20 DNA 人工的 向导RNA 113 ttacattttt gacctacatg 20 114 20 DNA 人工的 向导RNA 114 aaagaaaatc acagaaacca 20 115 20 DNA 人工的 向导RNA 115 aaaatcacag aaaccaaggt 20 116 20 DNA 人工的 向导RNA 116 ggtatctttg atactaacct 20 117 20 DNA 人工的 向导RNA 117 tatgtgttac ctacccttgt 20 118 20 DNA 人工的 向导RNA 118 aaatgtacaa ggaccgacaa 20 119 20 DNA 人工的 向导RNA 119 gtacaaggac cgacaagggt 20 120 20 DNA 人工的 向导RNA 120 tgcactattc tcaacaggta 20 121 20 DNA 人工的 向导RNA 121 tcaaatgcac tattctcaac 20 122 20 DNA 人工的 向导RNA 122 ctttacacac tttacctgtt 20 123 20 DNA 人工的 向导RNA 123 atgctctcat ccatagtcat 20 124 20 DNA 人工的 向导RNA 124 tctcatccat agtcataggt 20 125 20 DNA 人工的 向导RNA 125 catccatagt cataggtaag 20 126 20 DNA 人工的 向导RNA 126 tgaacatttg gtcctttgca 20 127 20 DNA 人工的 向导RNA 127 tctgaacatt tggtcctttg 20 128 20 DNA 人工的 向导RNA 128 tctcgctcac tcaccctgca 20 129 20 DNA 人工的 向导RNA 129 ggcacagcaa tagatctccg 20 130 20 DNA 人工的 向导RNA 130 taagaactct gaatgtccgc 20 131 20 DNA 人工的 向导RNA 131 gttcttctga tcaggttgaa 20 132 20 DNA 人工的 向导RNA 132 tcacgtacct gagagatcct 20 133 20 DNA 人工的 向导RNA 133 gaatagccac agggcccgag 20 134 20 DNA 人工的 向导RNA 134 tgaagccttg ataaagatac 20 135 20 DNA 人工的 向导RNA 135 cagatatgag ggtgggagaa 20 136 20 DNA 人工的 向导RNA 136 caggggaatg ggttcctggg 20 137 20 DNA 人工的 向导RNA 137 cccctccctg aactcacact 20 138 16 DNA 人工的 结合调控序列的寡核苷酸 138 gtactcacct gccctc 16 139 16 DNA 人工的 结合调控序列的寡核苷酸 139 gaacttacct cggcac 16 140 16 DNA 人工的 结合调控序列的寡核苷酸 140 ggactcacct agtcag 16 141 16 DNA 人工的 结合调控序列的寡核苷酸 141 gcacttacct attggc 16 142 16 DNA 人工的 结合调控序列的寡核苷酸 142 gctattacct taaccc 16 143 247 DNA 人工的 调控序列 143 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgagggcagg tgagtacaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 144 247 DNA 人工的 调控序列 144 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgtgccgagg taagttcaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 145 247 DNA 人工的 调控序列 145 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tctgactagg tgagtccaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 146 247 DNA 人工的 调控序列 146 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgccaatagg taagtgcaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 147 247 DNA 人工的 调控序列 147 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 148 247 DNA 人工的 调控序列 148 gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60 tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120 accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat 180 ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcctcct 240 cccacag 247 149 16 DNA 人工的 结合调控序列的寡核苷酸 149 gctattgcct taaccc 16 150 1053 PRT 金黄色葡萄球菌 150 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 151 1307 PRT 发酵氨基酸球菌(Acidaminococcus fermentans) 151 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 152 984 PRT 空肠弯曲菌 152 Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15 Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe 20 25 30 Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg 35 40 45 Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg 50 55 60 Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 80 Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95 Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu 100 105 110 Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg 115 120 125 Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140 Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln 145 150 155 160 Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu 165 170 175 Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190 Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205 Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220 Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser 225 230 235 240 His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro 245 250 255 Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270 Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285 Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300 Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu 305 310 315 320 Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys 325 330 335 Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu 340 345 350 Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365 Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser 370 375 380 Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala 385 390 395 400 Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415 Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys 420 425 430 Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr 435 440 445 Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460 Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu 465 470 475 480 Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495 Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys 500 505 510 Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg 515 520 525 Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile 530 535 540 Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile 545 550 555 560 Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu 565 570 575 Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590 Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605 Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr 610 615 620 Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr 625 630 635 640 Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp 645 650 655 Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670 Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser 675 680 685 Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His 690 695 700 Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser 705 710 715 720 Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser 725 730 735 Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 740 745 750 Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp 755 760 765 Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser 770 775 780 Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln 785 790 795 800 Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys 805 810 815 Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg 820 825 830 Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro 835 840 845 Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val 850 855 860 Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu 865 870 875 880 Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile 885 890 895 Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe 900 905 910 Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe 915 920 925 Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu 930 935 940 Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe 945 950 955 960 Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe 965 970 975 Arg Gln Arg Glu Asp Phe Lys Lys 980 153 9 PRT 人工的 结构基序 153 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 154 887 PRT 格氏嗜盐碱杆菌 154 Met Thr Val Ile Asp Leu Asp Ser Thr Thr Thr Ala Asp Glu Leu Thr 1 5 10 15 Ser Gly His Thr Tyr Asp Ile Ser Val Thr Leu Thr Gly Val Tyr Asp 20 25 30 Asn Thr Asp Glu Gln His Pro Arg Met Ser Leu Ala Phe Glu Gln Asp 35 40 45 Asn Gly Glu Arg Arg Tyr Ile Thr Leu Trp Lys Asn Thr Thr Pro Lys 50 55 60 Asp Val Phe Thr Tyr Asp Tyr Ala Thr Gly Ser Thr Tyr Ile Phe Thr 65 70 75 80 Asn Ile Asp Tyr Glu Val Lys Asp Gly Tyr Glu Asn Leu Thr Ala Thr 85 90 95 Tyr Gln Thr Thr Val Glu Asn Ala Thr Ala Gln Glu Val Gly Thr Thr 100 105 110 Asp Glu Asp Glu Thr Phe Ala Gly Gly Glu Pro Leu Asp His His Leu 115 120 125 Asp Asp Ala Leu Asn Glu Thr Pro Asp Asp Ala Glu Thr Glu Ser Asp 130 135 140 Ser Gly His Val Met Thr Ser Phe Ala Ser Arg Asp Gln Leu Pro Glu 145 150 155 160 Trp Thr Leu His Thr Tyr Thr Leu Thr Ala Thr Asp Gly Ala Lys Thr 165 170 175 Asp Thr Glu Tyr Ala Arg Arg Thr Leu Ala Tyr Thr Val Arg Gln Glu 180 185 190 Leu Tyr Thr Asp His Asp Ala Ala Pro Val Ala Thr Asp Gly Leu Met 195 200 205 Leu Leu Thr Pro Glu Pro Leu Gly Glu Thr Pro Leu Asp Leu Asp Cys 210 215 220 Gly Val Arg Val Glu Ala Asp Glu Thr Arg Thr Leu Asp Tyr Thr Thr 225 230 235 240 Ala Lys Asp Arg Leu Leu Ala Arg Glu Leu Val Glu Glu Gly Leu Lys 245 250 255 Arg Ser Leu Trp Asp Asp Tyr Leu Val Arg Gly Ile Asp Glu Val Leu 260 265 270 Ser Lys Glu Pro Val Leu Thr Cys Asp Glu Phe Asp Leu His Glu Arg 275 280 285 Tyr Asp Leu Ser Val Glu Val Gly His Ser Gly Arg Ala Tyr Leu His 290 295 300 Ile Asn Phe Arg His Arg Phe Val Pro Lys Leu Thr Leu Ala Asp Ile 305 310 315 320 Asp Asp Asp Asn Ile Tyr Pro Gly Leu Arg Val Lys Thr Thr Tyr Arg 325 330 335 Pro Arg Arg Gly His Ile Val Trp Gly Leu Arg Asp Glu Cys Ala Thr 340 345 350 Asp Ser Leu Asn Thr Leu Gly Asn Gln Ser Val Val Ala Tyr His Arg 355 360 365 Asn Asn Gln Thr Pro Ile Asn Thr Asp Leu Leu Asp Ala Ile Glu Ala 370 375 380 Ala Asp Arg Arg Val Val Glu Thr Arg Arg Gln Gly His Gly Asp Asp 385 390 395 400 Ala Val Ser Phe Pro Gln Glu Leu Leu Ala Val Glu Pro Asn Thr His 405 410 415 Gln Ile Lys Gln Phe Ala Ser Asp Gly Phe His Gln Gln Ala Arg Ser 420 425 430 Lys Thr Arg Leu Ser Ala Ser Arg Cys Ser Glu Lys Ala Gln Ala Phe 435 440 445 Ala Glu Arg Leu Asp Pro Val Arg Leu Asn Gly Ser Thr Val Glu Phe 450 455 460 Ser Ser Glu Phe Phe Thr Gly Asn Asn Glu Gln Gln Leu Arg Leu Leu 465 470 475 480 Tyr Glu Asn Gly Glu Ser Val Leu Thr Phe Arg Asp Gly Ala Arg Gly 485 490 495 Ala His Pro Asp Glu Thr Phe Ser Lys Gly Ile Val Asn Pro Pro Glu 500 505 510 Ser Phe Glu Val Ala Val Val Leu Pro Glu Gln Gln Ala Asp Thr Cys 515 520 525 Lys Ala Gln Trp Asp Thr Met Ala Asp Leu Leu Asn Gln Ala Gly Ala 530 535 540 Pro Pro Thr Arg Ser Glu Thr Val Gln Tyr Asp Ala Phe Ser Ser Pro 545 550 555 560 Glu Ser Ile Ser Leu Asn Val Ala Gly Ala Ile Asp Pro Ser Glu Val 565 570 575 Asp Ala Ala Phe Val Val Leu Pro Pro Asp Gln Glu Gly Phe Ala Asp 580 585 590 Leu Ala Ser Pro Thr Glu Thr Tyr Asp Glu Leu Lys Lys Ala Leu Ala 595 600 605 Asn Met Gly Ile Tyr Ser Gln Met Ala Tyr Phe Asp Arg Phe Arg Asp 610 615 620 Ala Lys Ile Phe Tyr Thr Arg Asn Val Ala Leu Gly Leu Leu Ala Ala 625 630 635 640 Ala Gly Gly Val Ala Phe Thr Thr Glu His Ala Met Pro Gly Asp Ala 645 650 655 Asp Met Phe Ile Gly Ile Asp Val Ser Arg Ser Tyr Pro Glu Asp Gly 660 665 670 Ala Ser Gly Gln Ile Asn Ile Ala Ala Thr Ala Thr Ala Val Tyr Lys 675 680 685 Asp Gly Thr Ile Leu Gly His Ser Ser Thr Arg Pro Gln Leu Gly Glu 690 695 700 Lys Leu Gln Ser Thr Asp Val Arg Asp Ile Met Lys Asn Ala Ile Leu 705 710 715 720 Gly Tyr Gln Gln Val Thr Gly Glu Ser Pro Thr His Ile Val Ile His 725 730 735 Arg Asp Gly Phe Met Asn Glu Asp Leu Asp Pro Ala Thr Glu Phe Leu 740 745 750 Asn Glu Gln Gly Val Glu Tyr Asp Ile Val Glu Ile Arg Lys Gln Pro 755 760 765 Gln Thr Arg Leu Leu Ala Val Ser Asp Val Gln Tyr Asp Thr Pro Val 770 775 780 Lys Ser Ile Ala Ala Ile Asn Gln Asn Glu Pro Arg Ala Thr Val Ala 785 790 795 800 Thr Phe Gly Ala Pro Glu Tyr Leu Ala Thr Arg Asp Gly Gly Gly Leu 805 810 815 Pro Arg Pro Ile Gln Ile Glu Arg Val Ala Gly Glu Thr Asp Ile Glu 820 825 830 Thr Leu Thr Arg Gln Val Tyr Leu Leu Ser Gln Ser His Ile Gln Val 835 840 845 His Asn Ser Thr Ala Arg Leu Pro Ile Thr Thr Ala Tyr Ala Asp Gln 850 855 860 Ala Ser Thr His Ala Thr Lys Gly Tyr Leu Val Gln Thr Gly Ala Phe 865 870 875 880 Glu Ser Asn Val Gly Phe Leu 885 |
CopyRight 2018-2019 实验室设备网 版权所有 |