首页 > 化学装置 专利正文
非靶脱氨反应减低的核碱基编辑器和用于定性核碱基编辑器的测定的制作方法

时间:2022-02-17 阅读: 作者:专利查询

1.相关申请的交叉引用2.本技术要求于2019年1月31日所提交的美国临时专利申请第62/799,702号的权益,其全部内容通过引用并入本文。
背景技术
::3.结合了crispr-cas蛋白的精确靶向的脱氨酶,称为核碱基编辑器,能够将特定的点突变引入靶多核苷酸内。核碱基编辑器在不引入双-股dna断裂的情况下诱导碱基变化,且包含将靶a·t转换为g·c的腺苷碱基编辑器和将靶c·g转换为t·a的胞苷碱基编辑器。然而,在细胞中引入核碱基编辑器有潜力生成不希望得到的碱基编辑器-相关联的编辑,其包含全基因组的假性脱氨反应、旁观者突变和靶近端编辑。假性脱氨反应事件可能发生在整个基因组中,其经由向导rna对crispr-cas结构域进行编程而被所述碱基编辑器脱氨反应结构域所催化,且独立于靶向的碱基编辑而起作用。不受理论束缚,全基因组的假性脱氨反应事件有潜力发生在单股dna底物形成之处,例如由于“dna呼吸”或在dna复制叉处。靶近端编辑是发生于在靶序列之外的碱基编辑事件,但是在被靶向的区域的上游或下游约200bp以内。旁观者突变是发生于在靶的、cas9/sgrna所导向的碱基编辑窗口(其非所期望的靶核碱基)之内的突变。旁观者突变可能导致沉默突变(无氨基酸变化)或非-同义突变(氨基酸变化)二者之一。因此,需要具有减低的非靶脱氨反应的碱基编辑器。技术实现要素:4.如下所述,本发明的特征在于核碱基编辑器组合物和方法,以及用于定性具有降低的非靶脱氨反应(例如,与程式化的,在靶脱氨反应相比)的核碱基编辑器的测定。5.本发明所定义的组合物和制品是结合以下所提供的实施例而被分离或以其他方式被制造。从详细描述和权利要求中,将显见本发明的其他特色和优势。6.一方面本文提供了融合蛋白,其包括插入cas9多肽的柔性环内的脱氨酶,其中该融合蛋白包括以下结构:7.nh2-[cas9的n末端片段]-[脱氨酶]-[cas9的c末端片段]-cooh,其中“]-[“的每个实例是可选的连接子。[0008]一方面本文提供了融合蛋白,其包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中该n末端片段的c端或该c末端片段的n端包括cas9多肽的柔性环的一部分。[0009]在一些实施方式中,该融合蛋白的脱氨酶使靶多核苷酸序列中的靶核碱基脱氨基。在一些实施方式中,当该融合蛋白使靶核碱基脱氨基时,柔性环包括靠近该靶核碱基的氨基酸。在一些实施方式中,该柔性环包括cas9多肽的α-螺旋结构的一部分。在一些实施方式中,该靶核碱基,与末端融合蛋白(其包括与seqidno:1的n端或c端融合的脱氨酶)相比,以较低的脱靶脱氨反应被脱氨基。[0010]在一些实施方式中,所述靶核碱基与靶多核苷酸序列中的原间隔序列临近基序(pam)序列相距1至20个核碱基。在一些实施方式中,所述靶核碱基在pam序列上游2至12个核碱基处。在一些实施方式中,所述柔性环包括一区域,其选自于由位于以下位置的氨基酸残基所组成的群组:530至537,569至579,686至691,768至793,943至947,1002至1040,1052至1077,1232至1248,和1298至1300(如seqidno:1中所编号的),抑或其相应的区域。在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:768至769,791至792,792至793,1015至1016,1022至1023,1026至1027,1029至1030,1040至1041,1052至1053,1054至1055,1067至1068,1068至1069,1247至1248,或1248至1249(如seqidno:1中所编号的)抑或其相应的氨基酸位置。[0011]在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:768至769,792至793,1022至1023,1026至1027,1040至1041,1068至1069,或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:1016至1017,1023至1024,1029至1030,1040至1041,1069至1070或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。[0012]在一些实施方式中,所述n末端片段包括cas9多肽的氨基酸残基1至529,538至568,580至685,692至942,948至1001,1026至1051,1078至1231,和/或1248至1297(如seqidno:1中所编号的),抑或其相应的残基。在一些实施方式中,所述c末端片段包括cas9多肽的氨基酸残基1301至1368,1248至1297,1078至1231,1026至1051,948至1001,692至942,580至685,和/或538至568(如seqidno:1中所编号的),抑或其相应的残基。在一些实施方式中,所述cas9多肽的n末端片段或c末端片段结合靶多核苷酸序列。[0013]在一些实施方式中,所述cas9多肽的n末端片段或c末端片段包括dna结合结构域。在一些实施方式中,该n末端片段或该c末端片段包括ruvc结构域。在一些实施方式中,该n末端片段或该c末端片段包括hnh结构域。在一些实施方式中,该n末端片段和该c末端片段均不包括hnh结构域。在一些实施方式中,该n末端片段和该c末端片段均不包括ruvc结构域。在一些实施方式中,所述cas9多肽在一个或多个结构性的结构域中包括部分或完全的缺失。在一些实施方式中,所述脱氨酶插入到cas9多肽的部分或完全缺失的位置处。[0014]在一些实施方式中,该缺失是在ruvc结构域内。在一些实施方式中,该缺失是在hnh结构域内。在一些实施方式中,该缺失桥接ruvc结构域和c末端结构域,l-i结构域和hnh结构域,或ruvc结构域和l-i结构域。在一些实施方式中,所述cas9多肽包括氨基酸的缺失1017至1069(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,所述cas9多肽包括氨基酸792至872的缺失(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,所述cas9多肽包括氨基酸792至906的缺失(如seqidno:1中所编号的)抑或其相应的氨基酸。[0015]一方面,本文提供了融合蛋白,其包括插入cas9多肽内的脱氨酶,其中该融合蛋白包括以下结构:[0016]nh2-[cas9的n末端片段]-[脱氨酶]-[cas9的c末端片段]-cooh,其中“]-[“的每个实例是可选的连接子,其中该cas9多肽包括hnh结构域的完全缺失,并且其中脱氨酶是插入到缺失的位置处。[0017]在一些实施方式中,所述n末端片段的c末端氨基酸是氨基酸791(如seqidno:1中所编号的)。在一些实施方式中,所述c末端片段的n末端氨基酸是氨基酸907(如seqidno:1中所编号的)。在一些实施方式中,所述c末端片段的n末端氨基酸是氨基酸873(如seqidno:1中所编号的)。[0018]一方面本文提供了融合蛋白,其包括插入cas9多肽内的脱氨酶,其中该融合蛋白包括以下结构:[0019]nh2-[cas9的n末端片段]-[脱氨酶]-[cas9的c末端片段]-cooh,其中“]-[“的每个实例是可选的连接子,而其中该cas9包括ruvc结构域的完全缺失,并且其中脱氨酶是插入到缺失的位置处。[0020]在一些实施方式中,该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方式中,该胞苷脱氨酶是apobec胞苷脱氨酶,活化诱导的胞苷脱氨酶(aid)或cda。在一些实施方式中,该apobec脱氨酶是apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d、apobec3e、apobec3f、apobec3g、apobec3h或apobec4。在一些实施方式中,该apobec脱氨酶是rapobec1。在一些实施方式中,上述任一方面的融合蛋白还包括ugi结构域。[0021]在一些实施方式中,该腺苷脱氨酶是tada脱氨酶。在一些实施方式中,该tada脱氨酶是经修饰的tada。在一些实施方式中,该tada脱氨酶是tada7.10。在一些实施方式中,该腺苷脱氨酶是tada二聚体。在一些实施方式中,该tada二聚体包括tada7.10和野生型tada。在一些实施方式中,所述可选的连接子包括(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes或(xp)n基序,或其组合,其中n独立地是1和30之间的整数。[0022]在一些实施方式中,所述cas9多肽的n末端片段在没有连接子的情况下与脱氨酶融合。在一些实施方式中,所述cas9多肽的c末端片段在没有连接子的情况下与脱氨酶融合。在一些实施方式中,上述任一方面的融合蛋白,还包括额外的催化结构域。[0023]在一些实施方式中,该额外的催化结构域是第二脱氨酶。在一些实施方式中,该第二脱氨酶与融合蛋白的n端或c端融合。在一些实施方式中,所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方式中,上述任一方面的融合蛋白还包括核定位信号。在一些实施方式中,该核定位信号是双分型核定位信号。在一些实施方式中,该cas9多肽是化脓性链球菌cas9(spcas9),金黄色葡萄球菌cas9(sacas9),嗜热链球菌1cas9(st1cas9),或其变体。在一些实施方式中,该cas9多肽是经修饰的cas9并且对改变过的pam有特异性。在一些实施方式中,该cas9多肽是切口酶。在一些实施方式中,该cas9多肽是核酸酶无活性的。在一些实施方式中,上述任一方面的融合蛋白与向导核酸序列复合以达成靶核碱基的脱氨反应。在一些实施方式中,该融合蛋白还与所述靶多核苷酸复合。[0024]本文提供了编码上述任一方面的融合蛋白的多核苷酸。[0025]本文提供了包括上述多核苷酸的表达载体。[0026]在一些实施方式中,该表达载体是哺乳动物表达载体。在一些实施方式中,该载体是病毒载体,其选自于由以下所组成的群组:腺-相关病毒(aav)、逆转录病毒载体、腺病毒载体、慢病毒载体、仙台病毒载体和疱疹病毒载体。在一些实施方式中,该载体包括启动子。[0027]本文提供了细胞,其包括上述任一方面的融合蛋白,上述多核苷酸,或上述载体。[0028]在一些实施方式中,该细胞是细菌细胞,植物细胞,昆虫细胞,人类细胞,或哺乳动物细胞。no:1中所编号的),抑或其相应的残基。在一些实施方式中,该c末端片段包括cas9多肽的氨基酸残基1301至1368、1248至1297、1078至1231、1026至1051、948至1001、692至942、580至685,和/或538至568(如seqidno:1中所编号的),抑或其相应的残基。在一些实施方式中,所述cas9多肽的n末端片段或c末端片段结合靶多核苷酸序列。在一些实施方式中,该n末端片段或该c末端片段包括ruvc结构域。在一些实施方式中,该n末端片段或该c末端片段包括hnh结构域。在一些实施方式中,该n末端片段和该c末端片段均不包括hnh结构域。在一些实施方式中,该n末端片段和该c末端片段均不包括ruvc结构域。[0037]在一些实施方式中,所述cas9多肽在一个或多个结构性的结构域中包括部分或完全的缺失。在一些实施方式中,所述脱氨酶插入到cas9多肽的部分或完全缺失的位置处。在一些实施方式中,该缺失是在ruvc结构域内。在一些实施方式中,该缺失是在hnh结构域内。在一些实施方式中,该缺失桥接ruvc结构域和c末端结构域,l-i结构域和hnh结构域,或ruvc结构域和l-i结构域。在一些实施方式中,所述cas9多肽包括氨基酸的缺失1017至1069(如seqidno:1中所编号的)抑或其相应的氨基酸。[0038]在一些实施方式中,所述cas9多肽包括氨基酸的缺失792至872(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,所述cas9多肽包括氨基酸的缺失792至906(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,该脱氨酶是胞苷脱氨酶。在一些实施方式中,该脱氨酶是腺苷脱氨酶。在一些实施方式中,该cas9多肽是经修饰的cas9并且对改变过的原间隔序列临近基序(pam)有特异性。在一些实施方式中,该cas9多肽是切口酶。在一些实施方式中,该cas9多肽是核酸酶无活性的。[0039]在一些实施方式中,所述接触是在细胞中执行。在一些实施方式中,该细胞是哺乳动物细胞或人类细胞。在一些实施方式中,该细胞是分化多能的细胞。在一些实施方式中,该细胞是在体内的(invivo)或离体的(exvivo)。在一些实施方式中,所述接触是在细胞的群体中执行。在一些实施方式中,该细胞的群体是哺乳动物细胞或人类细胞。[0040]一方面本文提供了一种用于治疗受试者体内的遗传病况的方法,该方法包括:向该受试者施用融合蛋白,该融合蛋白包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶或者编码该融合蛋白的多核苷酸,以及向导核酸序列或者编码该向导核酸序列的多核苷酸,其中该向导核酸序列导引该融合蛋白使受试者的靶多核苷酸序列中的靶核碱基脱氨基,从而治疗所述遗传病况。[0041]本文提供了一种用于治疗受试者体内的遗传病况的方法,该方法包括:向该受试者施用融合蛋白,该融合蛋白包括插入cas9多肽的柔性环内的脱氨酶,其中该融合蛋白包括结构nh2-[cas9的n末端片段]-[脱氨酶]-[cas9的c末端片段]-cooh,其中“]-[“的每个实例是可选的连接子,其中该融合蛋白的脱氨酶使受试者的靶多核苷酸序列中的靶核碱基脱氨基,从而治疗所述遗传病况。[0042]在一些实施方式中,该n末端片段的c端或该c末端片段的n端包括所述cas9多肽的柔性环的一部分。在一些实施方式中,该方法还包括向该受试者施用向导核酸序列以达成靶核碱基的脱氨反应。在一些实施方式中,该靶核碱基包括与该遗传病况相关联的突变。在一些实施方式中,靶核碱基的脱氨反应用野生型核碱基取代了该靶核碱基。在一些实施方式中,靶核碱基的脱氨反应用非-野生型核碱基取代了该靶核碱基,并且其中所述靶核碱基的脱氨反应改善了所述遗传病况的症状。[0043]在一些实施方式中,该靶多核苷酸序列在靶核碱基以外的核碱基处包括与所述遗传病况相关联的突变。在一些实施方式中,靶核碱基的脱氨反应改善了所述遗传病况的症状。在一些实施方式中,该靶核碱基与靶多核苷酸序列中的pam序列相距1至20个核碱基。在一些实施方式中,该靶核碱基在pam序列上游2至12个核碱基处。在一些实施方式中,当该融合蛋白的脱氨酶使靶核碱基脱氨基时,柔性环包括靠近该靶核碱基的氨基酸。[0044]在一些实施方式中,所述柔性环包括一区域,其选自于由位于以下位置的氨基酸残基所组成的群组:530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248和1298至1300(如seqidno:1中所编号的),抑或其相应的区域。[0045]在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:768至769、791至792、792至793、1015至1016、1022至1023、1026至1027、1029至1030、1040至1041、1052至1053、1054至1055、1067至1068、1068至1069、1247至1248或1248至1249(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:768至769、792至793、1022至1023、1026至1027、1040至1041、1068至1069或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,所述脱氨酶是插入到以下氨基酸位置之间:1016至1017、1023至1024、1029至1030、1040至1041、1069至1070或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。[0046]在一些实施方式中,所述n末端片段包括cas9多肽的氨基酸残基1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231和/或1248至1297(如seqidno:1中所编号的),抑或其相应的残基。在一些实施方式中,所述c末端片段包括cas9多肽的氨基酸残基1301至1368、1248至1297、1078至1231、1026至1051、948至1001、692至942、580至685和/或538至568(如seqidno:1中所编号的),抑或其相应的残基。在一些实施方式中,cas9多肽的n末端片段或c末端片段结合靶多核苷酸序列。在一些实施方式中,该n末端片段或该c末端片段包括ruvc结构域。在一些实施方式中,该n末端片段或该c末端片段包括hnh结构域。[0047]在一些实施方式中,该n末端片段和该c末端片段均不包括hnh结构域。在一些实施方式中,该n末端片段和该c末端片段均不包括ruvc结构域。在一些实施方式中,所述cas9多肽在一个或多个结构性的结构域中包括部分或完全的缺失。在一些实施方式中,所述脱氨酶插入到cas9多肽的部分或完全缺失的位置处。在一些实施方式中,该缺失是在ruvc结构域内。在一些实施方式中,该缺失是在hnh结构域内。在一些实施方式中,该缺失桥接ruvc结构域和c末端结构域,l-i结构域和hnh结构域,或ruvc结构域和l-i结构域。在一些实施方式中,所述cas9多肽包括氨基酸的缺失1017至1069(如seqidno:1中所编号的)抑或其相应的氨基酸。[0048]在一些实施方式中,所述cas9多肽包括氨基酸的缺失792至872(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,所述cas9多肽包括氨基酸的缺失792至906(如seqidno:1中所编号的)抑或其相应的氨基酸。在一些实施方式中,该脱氨酶是胞苷脱氨酶。在一些实施方式中,该脱氨酶是腺苷脱氨酶。在一些实施方式中,该cas9多肽是经修饰的cas9并且对改变过的pam有特异性。在一些实施方式中,该cas9多肽是切口酶。在一些实施方式中,该cas9多肽是核酸酶无活性的。在一些实施方式中,该受试者是哺乳动物。在一些实施方式中,该受试者是人。[0049]本文提供了用于最优化的碱基编辑的蛋白质文库,其包括复数个融合蛋白,其中该复数个融合蛋白中的每一个都包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中所述融合蛋白中的每一个的n末端片段都不同于该复数个融合蛋白中其余蛋白的n末端片段或者其中所述融合蛋白中的每一个的c末端片段都不同于该复数个融合蛋白中其余蛋白的c末端片段,其中所述融合蛋白中的每一个的脱氨酶使靶多核苷酸序列中靠近原间隔序列相邻基序(pam)序列的靶核碱基脱氨基,并且其中该n末端片段或该c末端片段结合该靶多核苷酸序列。[0050]在一些实施方式中,对于与pam序列相距1到20个核碱基的每个核碱基,所述复数个融合蛋白中的至少一个使该核碱基脱氨基。在一些实施方式中,所述复数个融合蛋白中的每一个的cas9多肽的n末端片段的c端或c末端片段的n端包括cas9多肽的柔性环的一部分。在一些实施方式中,与末端融合蛋白(其包括与seqidno:1的n端或c端融合的脱氨酶)相比,所述复数个融合蛋白中的至少一个以较低的脱靶脱氨反应使靶核碱基脱氨基。在一些实施方式中,所述复数个融合蛋白中的至少一个使在pam序列上游2至12个核碱基处的靶核碱基脱氨基。在一些实施方式中,当该融合蛋白使靶核碱基脱氨基时,所述复数个融合蛋白其中一个的n端片段的c端或c端片段的n端包括靠近靶核碱基的氨基酸。[0051]在一些实施方式中,该融合蛋白中的至少一个的脱氨酶是在以下氨基酸位置之间:768至769、791至792、792至793、1015至1016、1022至1023、1026至1027、1029至1030、1040至1041、1052至1053、1054至1055、1067至1068、1068至1069、1247至1248或1248至1249(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该融合蛋白中的至少一个的脱氨酶是在以下氨基酸位置之间:768至769、792至793、1022至1023、1026至1027、1040至1041、1068至1069或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该融合蛋白中的至少一个的脱氨酶是在以下氨基酸位置之间:1016至1017、1023至1024、1029至1030、1040至1041、1069至1070或1247至1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该脱氨酶是腺苷脱氨酶。在一些实施方式中,该脱氨酶是胞苷脱氨酶。[0052]在一些实施方式中,该cas9多肽是化脓性链球菌cas9(spcas9),金黄色葡萄球菌cas9(sacas9),嗜热链球菌1cas9(st1cas9),或其变体。在一些实施方式中,该cas9多肽是经修饰的cas9并且对改变过的原间隔序列临近基序(pam)有特异性。在一些实施方式中,该cas9多肽是切口酶。在一些实施方式中,该cas9多肽是核酸酶无活性的。[0053]定义[0054]除非另做界定,否则本文所使用的所有技术和科学术语具有本发明所属领域技术人员一般理解的意义。以下参考文献向技术人员提供本发明中所用的许多术语的通常定义:singleton等人,dictionaryofmicrobiologyandmolecularbiology(第二版,1994);thecambridgedictionaryofscienceandtechnology(walker编,1988);theglossaryofgenetics,第五版,r.rieger等人(编),springerverlag(1991);以及hale&marham,theharpercollinsdictionaryofbiology(1991)。如本文所用,除非另有说明,否则以下术语具有以下所赋予它们的含义。[0055]除非另做界定,否则本文所使用的所有技术和科学术语具有本发明所属领域技术人员一般理解的意义。以下参考文献向技术人员提供本发明中所用的许多术语的通常定义:singleton等人,dictionaryofmicrobiologyandmolecularbiology(第二版,1994);thecambridgedictionaryofscienceandtechnology(walker编,1988);theglossaryofgenetics,第五版,r.rieger等人(编),springerverlag(1991);以及hale&marham,theharpercollinsdictionaryofbiology(1991)。如本文所用,除非另有说明,否则以下术语具有以下所赋予它们的含义。[0056]“腺苷脱氨酶”意为能够催化腺嘌呤或腺苷的水解脱氨反应的多肽或其片段。在一些实施方式中,该脱氨酶或脱氨酶结构域是催化腺苷为肌苷或脱氧腺苷为脱氧肌苷的水解脱氨反应的腺苷脱氨酶。在一些实施方式中,该腺苷脱氨酶催化脱氧核糖核酸(dna)中的腺嘌呤或腺苷的水解脱氨反应。本文所提供的腺苷脱氨酶(例如,工程化的腺苷脱氨酶,进化版的腺苷脱氨酶)可来自任何生物体,诸如细菌。在一些实施方式中,该脱氨酶或脱氨酶结构域是来自生物体的天然-存在的脱氨酶的变体。在一些实施方式中,该脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方式中,该脱氨酶或脱氨酶结构域是至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%与天然-存在的脱氨酶相同。在一些实施方式中,该腺苷脱氨酶来自细菌,诸如,大肠杆菌(e.coli),金黄色葡萄球菌(s.aureus),伤寒沙门菌(s.typhi),腐烂希瓦氏菌(s.putrefaciens),流感嗜血杆菌(h.influenzae),或新月柄杆菌(c.crescentus)。在一些实施方式中,该腺苷脱氨酶是tada脱氨酶。在一些实施方式中,该tada脱氨酶是大肠杆菌tada(ectada)脱氨酶或其片段。[0057]例如,相对于全长ectada,该截短的ectada可能缺少一个或多个n末端氨基酸。在一些实施方式中,相对于全长ectada,该截短的ectada可能缺少1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20个n末端氨基酸残基。在一些实施方式中,相对于全长ectada,该截短的ectada可能缺少1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20个c末端氨基酸残基。在一些实施方式中,该ectada脱氨酶不包括n末端的蛋氨酸。在一些实施方式中,该tada脱氨酶是n末端截短的tada。在特定的实施方式中,该tada是pct/us2017/045381中所述的tada中的任何一个,其全部内容通过引用并入本文。[0058]在一些实施方式中,该腺苷脱氨酶包括氨基酸序列:[0059]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd,其称为“tada参考序列”。[0060]在一些实施方式中,所述tada脱氨酶是全长的大肠杆菌tada脱氨酶。例如,在某些实施方式中,该腺苷脱氨酶包括氨基酸序列:[0061]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd。[0062]然而,应当理解,可用于本技术中的额外的腺苷脱氨酶对熟练技术人员是显而易见的,并且是在本公开揭露的范围内。例如,该腺苷脱氨酶可能是作用在trna上的腺苷脱氨酶(adat)的同源物。示例性的adat同源物包含但不限于:[0063]金黄色葡萄球菌(staphylococcusaureus)tada:[0064]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0065]枯草芽孢杆菌(bacillussubtilis)tada:[0066]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0067]鼠伤寒沙门菌(s.typhimurium)tada:[0068]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0069]腐败希瓦氏菌(s.putrefaciens)tada:[0070]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0071]流感嗜血杆菌f3031(h.influenzae)tada:[0072]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptahaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0073]新月柄杆菌(c.crescentus)tada:[0074]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0075]硫还原地杆菌(g.sulfurreducens)tada:[0076]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0077]tada7.10[0078]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0079]含有tada7.10或tada7.10变体的示例性序列包含[0080]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0081]tada7.10cp65[0082]tahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdp[0083]tada7.10cp83[0084]yrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqn[0085]tada7.10cp136[0086]mnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypg[0087]tada7.10c-截短[0088]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0089]tada7.10c-截短2[0090]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprq[0091]tada7.10δ59-66+c-截短[0092]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0093]tada7.10δ59-66[0094]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvg[0095]avlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvm[0096]cagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegilad[0097]ecaallcyffrmprqvfnaqkkaqsstd[0098]“剂”意为任何小分子化学化合物,抗体,核酸分子,或多肽,或其片段。[0099]“改变一突变”意为通过标准的本领域已知的分子生物学方法或遗传学方法等,诸如pcr定点诱变或同源重组,对多核苷酸序列中已知的一突变进行操作并使其产生变化。[0100]“改变”意为通过标准的本领域已知的方法,诸如本文所述的方法,所检测到的基因或多肽的结构、表达水平或活性的变化。如本文所用,改变(例如,增加或减少)包含表达水平的10%变化,25%变化,40%变化和表达水平的50%或更大的变化。[0101]“类似物”意为不相同但具有类似的功能性或结构性特征的分子。例如,多核苷酸类似物保留了相应的天然-存在的多核苷酸的生物学活性,同时具有某些修饰,该修饰相对于天然-存在的多核苷酸增强了类似物的功能。此种修饰可以增加该多核苷酸对dna的亲和力,半衰期和/或核酸酶抗性。类似物可能包含非天然的核苷酸或氨基酸。[0102]在本公开揭露中,“包括(comprises)”、“包括(comprising)”、“含有(containing)”和“具有(having)”等可以具有美国专利法中赋予它们的含义,并且可以表示“包含(includes)”、“包含(including)”等;“基本上由…组成(consistingessentiallyof)”或“基本上包括(consistsessentially)”同样具有美国专利法中赋予的含义,并且该术语是开放式的,允许存在多于所列举出的内容,只要所列举出的内容的基本的或新颖的特征不被多于所列举出的内容的存在所变更,但排除现有技术的实施方式。[0103]“碱基编辑器(be)”或“核碱基编辑器(nbe)”意为结合多核苷酸并且具有核碱基修饰活性的剂。在一个实施方式中,该剂是融合蛋白,其包括具有碱基编辑活性的结构域,即,能够修饰核酸分子(例如dna)内的碱基(例如a,t,c,g,或u)的结构域。在一些实施方式中,具有碱基编辑活性的该结构域能够使核酸分子内的碱基脱氨基。在一些实施方式中,该碱基编辑器能够使dna分子内的碱基脱氨基。在一些实施方式中,该碱基编辑器能够使dna内的胞嘧啶(c)或腺苷脱氨基。在一些实施方式中,该碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施方式中,该碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方式中,该碱基编辑器是腺苷碱基编辑器(abe)和胞苷碱基编辑器(cbe)。在一些实施方式中,该碱基编辑器是与腺苷脱氨酶融合的核酸酶-无活性的cas9(dcas9)。在一些实施方式中,该cas9是环状变换排列体cas9(例如spcas9或sacas9)。环状变换排列体cas9是本领域已知的,并在例如oakes等,cell176,254–267,2019中进行了描述。在一些实施方式中,该碱基编辑器是融合到碱基切除修复的抑制剂上,例如,ugi结构域。在一些实施方式中,该融合蛋白包括融合到脱氨酶上的cas9切口酶以及碱基切除修复的抑制剂,诸如ugi结构域。在其他实施方式中,该碱基编辑器是无碱基碱基编辑器。[0104]在一些实施方式中,腺苷脱氨酶是由tada进化而来。在一些实施方式中,该多核苷酸可编程的dna结合结构域是crispr相关联的(例如,cas或cpf1)酶。在一些实施方式中,该碱基编辑器是与脱氨酶结构域融合的催化失活的cas9(dcas9)。在一些实施方式中,该碱基编辑器是与脱氨酶结构域融合的cas9切口酶(ncas9)。在一些实施方式中,该脱氨酶结构域是多核苷酸可编程的dna结合结构域的n末端或c末端片段。在一些实施方式中,该脱氨酶的两侧翼为多核苷酸可编程的dna结合结构域的n末端和c末端片段。在一些实施方式中,该脱氨酶结构域是插入到多核苷酸可编程的dna结合结构域的位点中。在一些实施方式中,该碱基编辑器与碱基切除修复的抑制剂(ber)融合。在一些实施方式中,该碱基切除修复的抑制剂是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方式中,该碱基切除修复的抑制剂是肌苷碱基切除修复抑制剂。碱基编辑器的细节在国际pct申请编号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中被描述,其每个的全部内容通过引用并入本文。亦请参见komor,a.c.等,“无需双-股dna切开的基因组dna中靶碱基的可编程的编辑”nature533,420-424(2016);gaudelli,n.m.等,“无需dna切开的基因组dna中a·t到g·c的可编程的碱基编辑”nature551,464-471(2017);komor,a.c.等,“改良过的碱基切除修复抑制合并噬菌体mugam蛋白所产生的c:g-到-t:a碱基编辑器具有更高的效率和更高的产品纯度”scienceadvances3:eaao4774(2017),和rees,h.a.等,“碱基编辑:活体细胞的基因组和转录组上的精密化学”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其全部内容在此通过引用并入。[0105]在一些实施方式中,所述脱氨酶结构域是插入到多核苷酸可编程的dna结合结构域的区域中。在一些实施方式中,该插入位点是通过napdnabp的结构性分析而确定的。在一些实施方式中,该插入位点是柔性环。在一些实施方式中,所述脱氨酶结构域是插入到多核苷酸可编程的dna结合结构域中的位点中,其中该位点是选自于由以下氨基酸位置所组成的群组中的至少一个:1029,1026,1054,1022,1015,1068,1247,1040,1248,和768。在一些实施方式中,插入的脱氨酶结构域代替了多核苷酸可编程的dna结合结构域的结构域的位置。在一些实施方式中,该结构域是选自于由以下所组成的群组:ruvc,rec1,rec2,和hnh。在一些实施方式中,插入的脱氨酶结构域代替了多核苷酸可编程的dna结合结构域中一氨基酸残基范围,其中该氨基酸残基范围是选自于由以下cas9残基所组成的群组:530至537,569至579,686至691,768至793,943至947,1002至1040,1052至1077,1232至1248,和1298至1300(如seqidno:1中所编号的)抑或其相应的位置。如何通过比较cas9氨基酸序列而在不同的多核苷酸可编程的dna结合结构域中鉴别出同源区域,对熟练技术人员将是显而易见的。在一些实施方式中,该碱基编辑器包括插入到多核苷酸可编程的dna结合结构域的多于一个位点中的多于一个的脱氨酶结构域,其中该位点如上所述。[0106]在一些实施方式中,通过将腺苷脱氨酶变体(例如tada*7.10)克隆进入支架中生成碱基编辑器,该支架包含环状变换排列体cas9(例如spcas9)和双分型核定位序列。环状变换排列体cas9是本领域已知的,并在例如oakes等,cell176,254–267,2019中进行了描述。示例性的环状变换排列体如下所示,其中粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,而底线序列表示双分型核定位序列。[0107]cp5(具有msp“ngc=带有突变的pam变体正常cas9样ngg”pid=蛋白相互作用结构域和“d10a”切口酶):[0108][0109][0110]碱基编辑器系统的核碱基组分与多核苷酸可编程的核苷酸结合组分可共价地或非共价地彼此相联。例如,在一些实施方式中,可以通过多核苷酸可编程的核苷酸结合结构域而将所述脱氨酶结构域靶向至靶核苷酸序列。在一些实施方式中,多核苷酸可编程的核苷酸结合结构域可以融合到或链接到脱氨酶结构域上。在一些实施方式中,多核苷酸可编程的核苷酸结合结构域可以通过与脱氨酶结构域的非共价相互作用或与其相联而将该脱氨酶结构域靶向到靶核苷酸序列。例如,在一些实施方式中,该核碱基编辑组分,例如该脱氨酶组分,可以包括能够与身为多核苷酸可编程的核苷酸结合结构域的一部分的额外的异源部分或结构域相互作用、相联或形成复合体的另外的异源部分或结构域。在一些实施方式中,该额外的异源部分可能能够与多肽结合、相互作用、相联或形成复合体。在一些实施方式中,该额外的异源部分可能能够与多核苷酸结合、相互作用、相联或形成复合体。在一些实施方式中,该额外的异源部分可能能够与向导多核苷酸结合。在一些实施方式中,该额外的异源部分可能能够与多肽连接子结合。在一些实施方式中,该额外的异源部分可能能够与多核苷酸连接子结合。该额外的异源部分可能是蛋白结构域。在一些实施方式中,该额外的异源部分可能是k同源(kh)结构域,ms2外壳蛋白结构域,pp7外壳蛋白结构域,sfmucom外壳蛋白结构域,不育α基序,端粒酶ku结合基序和ku蛋白,端粒酶sm7结合基序和sm7蛋白,或rna识别基序。[0111]碱基编辑器系统可能还包括向导多核苷酸组分。应当理解,该碱基编辑器系统的各组分可以经由共价键、非共价相互作用或其相联和相互作用的任何组合而彼此相联。在一些实施方式中,可以通过向导多核苷酸将脱氨酶结构域靶向至靶核苷酸序列。例如,在一些实施方式中,该碱基编辑器系统的核碱基编辑组分,例如脱氨酶组分,可以包括额外的异源部分或结构域(例如多核苷酸结合结构域,诸如rna或dna结合蛋白),其能够与向导多核苷酸的部分或节段(例如,多核苷酸基序)相互作用、相联或形成复合体。在一些实施方式中,该额外的异源部分或结构域(例如多核苷酸结合结构域,诸如rna或dna结合蛋白)可以融合到或链接到该脱氨酶结构域上。在一些实施方式中,该额外的异源部分可能能够与多肽结合、相互作用、相联或形成复合体。在一些实施方式中,该额外的异源部分可能能够与多核苷酸结合、相互作用、相联或形成复合体。在一些实施方式中,该额外的异源部分可能能够与向导多核苷酸结合。在一些实施方式中,该额外的异源部分可能能够与多肽连接子结合。在一些实施方式中,该额外的异源部分可能能够与多核苷酸连接子结合。该额外的异源部分可能是蛋白结构域。在一些实施方式中,该额外的异源部分可能是k同源(kh)结构域,ms2外壳蛋白结构域,pp7外壳蛋白结构域,sfmucom外壳蛋白结构域,不育α基序,端粒酶ku结合基序和ku蛋白,端粒酶sm7结合基序和sm7蛋白,或rna识别基序。[0112]在一些实施方式中,碱基编辑器系统可以还包括碱基切除修复(ber)的抑制剂组分。应该理解,该碱基编辑器系统的各组分可经由共价键、非共价相互作用或其相联和相互作用的任何组合而彼此相联。该ber的抑制剂组分可能包括碱基切除修复抑制剂。在一些实施方式中,该碱基切除修复的抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方式中,该碱基切除修复的抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方式中,可以通过所述多核苷酸可编程的核苷酸结合结构域将该碱基切除修复的抑制剂靶向到靶核苷酸序列。在一些实施方式中,多核苷酸可编程的核苷酸结合结构域可以融合到或链接到碱基切除修复的抑制剂上。在一些实施方式中,多核苷酸可编程的核苷酸结合结构域可以融合到或链接到脱氨酶结构域和碱基切除修复的抑制剂上。在一些实施方式中,多核苷酸s.p.,qiany.,jiah.g.,najarf.z.,renq.,zhuh.,songl.,whitej.,yuanx.,cliftons.w.,roeb.a.,mclaughlinr.e.,proc.natl.acad.sci.美国98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,chylinskik.,sharmac.m.,gonzalesk.,chaoy.,pirzadaz.a.,eckertm.r.,vogelj.,charpentiere.,nature471:602-607(2011);以及“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.,chylinskik.,fonfarai.,hauerm.,doudnaj.a.,charpentiere.science337:816-821(2012),其每个的全部内容通过引用并入本文)。已在好几种物种中描述了cas9的异种同源物,包含但不限于化脓性链球菌和嗜热链球菌。基于本公开揭露,额外的适合的cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此种cas9核酸酶和序列包含来自chylinski,rhun,和charpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737中所揭露的生物体和基因座的cas9序列;其全部内容通过引用并入本文。[0115]核酸酶-灭活的cas9蛋白可互换地称为“dcas9”蛋白(核酸酶‑“死(dead)”cas9)或催化无活性的cas9。生成具有无活性的dna切开结构域的cas9蛋白(或其片段)的方法是已知的(参见例如jinek等,science.337:816-821(2012);qi等,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,其每个的全部内容通过引用并入本文)。例如,已知cas9的dna切开结构域包含两个亚结构域,hnh核酸酶亚结构域和ruvc1亚结构域。该hnh亚结构域切开与grna互补的股,而该ruvc1亚结构域切开非-互补的股。这些亚结构域内的突变可以沉默化cas9的核酸酶活性。例如,突变d10a和h840a完全灭活化脓性链球菌cas9的核酸酶活性(jinek等,science.337:816-821(2012);qi等,cell.28;152(5):1173-83(2013))。在一些实施方式中,cas9核酸酶具有无活性的(例如灭活的)dna切开结构域,即是说,该cas9为切口酶,被称为“ncas9”蛋白(出于“切口酶(nickase)”cas9)。在一些实施方式中,提供了包括cas9的片段的蛋白。例如,在一些实施方式中,蛋白包括两个cas9结构域之一:(1)cas9的grna结合结构域;或(2)cas9的dna切开结构域。在一些实施方式中,包括cas9或其片段的蛋白被称为“cas9变体”。cas9变体与cas9或其片段共享同源性。例如,cas9变体与野生型cas9是至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方式中,与野生型cas9相比,该cas9变体可能具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸的变化。在一些实施方式中,该cas9变体包括cas9的片段(例如grna结合结构域或dna-切开结构域),使得该片段与野生型cas9的相应片段是至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方式中,该片段是相应的野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%。[0116]在一些实施方式中,该片段的长度是至少100个氨基酸。在一些实施方式中,该片段的长度是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或至少1300个氨基酸。[0117]在一些实施方式中,野生型cas9对应于来自化脓性链球菌的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下)[0118]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0119][0120][0121](单底线:hnh结构域;双底线:ruvc结构域)[0122]在一些实施方式中,野生型cas9对应于,或包括以下的核苷酸和/或氨基酸序列:[0123]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0124][0125][0126](单底线:hnh结构域;双底线:ruvc结构域)[0127]在一些实施方式中,野生型cas9对应于来自化脓性链球菌的cas9(ncbi参考序列:nc_002737.2)(核苷酸序列如下);和uniprot参考序列:q99zw2(氨基酸序列如下)。[0128]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0129][0130][0130](seqidno:1。单底线:hnh结构域;双底线:ruvc结构域)。[0131]在一些实施方式中,cas9是指来自以下的cas9:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);栖蚜蝇螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺原体(spiroplasmataiwanense,china)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);波罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌i(psychroflexustorquisi)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1),无害李斯特菌(listeriainnocua)(ncbiref:np_472073.1),空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1)或脑膜炎双球菌(neisseria.meningitidis)(ncbiref:yp_002342100.1)或来自任何其他生物体的cas9。[0132]在一些实施方式中,dcas9对应于,或包括cas9氨基酸序列的一部分或全部,该序列具有一个或多个灭活cas9核酸酶活性的突变。例如,在一些实施方式中,dcas9结构域包括d10a和h840a突变,或另一个cas9中的相应突变。在一些实施方式中,该dcas9包括dcas9(d10a和h840a)的氨基酸序列:[0133][0134](单底线:hnh结构域;双底线:ruvc结构域)。[0135]在一些实施方式中,该cas9结构域包括d10a突变,而在上面所提供的氨基酸序列中位置840的残基,或在任何本文所提供的氨基酸序列的相应位置上的残基,仍然是组氨酸。[0136]在其他实施方式中,提供了具有除了d10a和h840a以外突变的dcas9变体,所述突变,例如,导致了核酸酶灭活的cas9(dcas9)。此种突变,举例来说,包含在d10和h840处其他的氨基酸替换,或在cas9的核酸酶结构域内的其他替换(例如,在hnh核酸酶亚结构域和/或ruvc1亚结构域内的替换)。在一些实施方式中,提供了dcas9的变体或同源物,其为至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方式中,提供了dcas9的变体,其所具有的氨基酸序列的较短或较长的程度为约5个氨基酸,约10个氨基酸,约15个氨基酸,约20个氨基酸,约25个氨基酸,约30个氨基酸,约40个氨基酸,约50个氨基酸,约75个氨基酸,约100个氨基酸或更多。[0137]在一些实施方式中,如本文所提供的cas9融合蛋白包括cas9蛋白的全长氨基酸序列,例如,本文所提供的cas9序列之一。然而,在其他实施方式中,如本文所提供的融合蛋白不包括全长cas9序列,而是仅包含其一个或多个片段。本文提供了适合的cas9结构域和cas9片段的示例性氨基酸序列,而额外的适合的cas9结构域和片段的序列对本领域技术人员而言将是显而易见的。[0138]在一些实施方式中,cas9是指来自以下的cas9:溃疡棒状杆菌(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(ncbirefs:nc_016782.1,nc_016786.1);栖蚜蝇螺原体(ncbiref:nc_021284.1);中间普雷沃菌(ncbiref:nc_017861.1);中国台湾螺原体(ncbiref:nc_021846.1);海豚链球菌(ncbiref:nc_021314.1);波罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌i(ncbiref:nc_018721.1);嗜热链球菌(ncbiref:yp_820832.1);无害李斯特菌(ncbiref:np_472073.1);空肠弯曲菌(ncbiref:yp_002344900.1);或脑膜炎双球菌(ncbiref:yp_002342100.1)。[0139]应当理解,额外的cas9蛋白(例如核酸酶失活的cas9(dcas9),cas9切口酶(ncas9),或核酸酶有活性的cas9),包含其变体和同源物,是在本公开揭露的范围之内。示例性的cas9蛋白包含但不限于以下所提供的那些。在一些实施方式中,该cas9蛋白是核酸酶失活的cas9(dcas9)。在一些实施方式中,该cas9蛋白是cas9切口酶(ncas9)。在一些实施方式中,该cas9蛋白是核酸酶有活性的cas9。[0140]示例性的催化无活性的cas9(dcas9):[0141]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0142]示例性的催化的cas9切口酶(ncas9):[0143]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0144]示例性的催化有活性的cas9:[0145]dkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0146]在一些实施方式中,cas9是指来自古菌(例如,纳古菌门)的cas9,而古菌构成了单-细胞原核微生物的一个域和界。在一些实施方式中,cas是指casx或casy,其已被描述过,例如,在burstein等,“来自未培育的微生物的新crispr-cas系统”cellres.2017feb21.doi:10.1038/cr.2017.21中,其全部内容在此通过引用并入。使用基因组-分辨的宏基因组学,识别出了一些crispr-cas系统,包含在生命的古菌域中首次被报道的cas9。这种相异的cas9蛋白是在很少-被研究的纳古菌属中作为有活性的crispr-cas的一部分而被发现的。在细菌中,发现了两个之前未知的系统,crispr-casx和crispr-casy,其为迄今为止所发现的最致密紧凑的系统之一。在一些实施方式中,cas9是指casx,或casx的变体。在一些实施方式中,cas9是指casy,或casy的变体。应该理解,其他rna-导向的dna结合蛋白可能被用作核酸可编程的dna结合蛋白(napdnabp),并且是在本公开揭露的范围内。[0147]在一些实施方式中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可能是casx或casy蛋白。在一些实施方式中,该napdnabp是casx蛋白。在一些实施方式中,该napdnabp是casy蛋白。在一些实施方式中,该napdnabp所包括的氨基酸序列与天然-存在的casx或casy蛋白是至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%相同。在一些实施方式中,该napdnabp是天然-存在的casx或casy蛋白。在一些实施方式中,该napdnabp所包括的氨基酸序列与本文所描述的任何casx或casy蛋白是至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%相同。应该理解,来自其他细菌种类的casx和casy也可根据本公开揭露而被使用。[0148]casx[0149](uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)》tr|f0nn87|f0nn87_sulihcrispr-关联的casx蛋白os=冰岛硫化叶菌(sulfolobusislandicus)(菌株hve10/4)gn=sih_0402pe=4sv=1[0150]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0151]》tr|f0nh53|f0nh53_sulircrispr-关联的蛋白,casxos[0152]=冰岛硫化叶菌(菌株rey15a)gn=sire_0771pe=4sv=1[0153]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0154]casy(ncbi.nlm.nih.gov/protein/apg80656.1)[0155]》apg80656.1crispr-关联的蛋白casy[未培养的俭菌(parcubacteria)菌群细菌][0156]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki[0157]“胞苷脱氨酶”意为能够催化将氨基基团转换为羰基基团的脱氨反应的多肽或其片段。在一个实施方式中,该胞苷脱氨酶将胞嘧啶转换为尿嘧啶,或将5-甲基胞嘧啶转换为胸腺嘧啶。pmcda1,其衍生自海七鳃鳗(海七鳃鳗胞嘧啶脱氨酶1,“pmcda1”),aid(活化-诱导的胞苷脱氨酶;aicda),其衍生自哺乳动物(例如,人类,猪,牛,马,猴等),以及apobec是示例性的胞苷脱氨酶。[0158]pmcda1的碱基序列和氨基酸序列,以及人类aid的cds的碱基序列和氨基酸序列如本文下面所示:[0159]》tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗ox=7757pe=2sv=1[0160]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsimiqvkilhttkspav[0161]》ef094822.1海七鳃鳗分离的pmcda.21胞嘧啶脱氨酶mrna,完整的cds[0162]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacactttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[0163]》tr|q6qj80|q6qj80_human活化-诱导的胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1[0164]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvell[0165]flryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrk[0166]aepeglrrlhragvqiaimtfkapv[0167]》ng_011588.1:5001-15681智人活化诱导的胞苷脱氨酶(aicda),refseqgene(lrg_17)在染色体12上[0168]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgat[0169]caatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctt[0170]tagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactat[0171]gattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtat[0172]tcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[0173]载脂蛋白bmrna编辑酶,催化多肽-样(apobec)是进化上保守的胞苷脱氨酶的家族。这个家族的成员是c-至-u编辑酶。apobec样蛋白的n末端结构域是催化结构域,而c末端结构域是假催化结构域。更具体地,该催化结构域是锌依赖性胞苷脱氨酶结构域,且对于胞苷脱氨反应是重要的。apobec家族成员包含apobec1,apobec2,apobec3a,apobec3b,apobec3c,apobec3d("apobec3e"现在是指这个),apobec3f,apobec3g,apobec3h,apobec4,以及活化-诱导的(胞苷)脱氨酶。一些经修饰的胞苷脱氨酶是市售的,包含但不限于:sabe3,sakkh-be3,vqr-be3,eqr-be3,vrer-be3,ye1-be3,ee-be3,ye2-be3,和yee-be3,其可从addgene获得(质粒85169,85170,85171,85172,85173,85174,85175,85176,85177)。[0174]下面提供了根据本公开揭露的各方面可以与cas9融合的其他示例性脱氨酶。应当清楚,在一些实施方式中,可以使用各个序列的活性结构域,例如,没有定位信号(核定位序列,没有核输出信号,细胞质定位信号)的结构域。[0175]人类aid:[0176]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl(单底线:核定位序列;双底线:核输出信号)[0177]小鼠aid:[0178]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[0179](单底线:核定位序列;双底线:核输出信号)[0180]犬aid:[0181]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl(单底线:核定位序列;双底线:核输出信号)[0182]牛aid:[0183]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl(单底线:核定位序列;双底线:核输出信号)[0184]大鼠aid[0185][0186][0187](单底线:核定位序列;双底线:核输出信号)[0188]小鼠apobec-3[0189]mgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyipvpssssstlsnicltkglpetrfcvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms(斜体:核酸编辑结构域)[0190]大鼠apobec-3:[0191]mgpfclgcshrkcyspirnlisqetfkfhfknrlryaidrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqvlrflathhnlsldifssrlynirdpenqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkklltnfryqdsklqeilrpcyipvpssssstlsnicltkglpetrfcverrrvhllseeefysqfynqrvkhlcyyhgvkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqviitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlhrikeswglqdlvndfgnlqlgppms(斜体:核酸编辑结构域)[0192]恒河猴(rhesusmacaque)apobec-3g:[0193]mvepmdprtfvsnfnnrpilsglntvwlccevktkdpsgppldakifqgkvyskakyhpemrflrwfhkwrqlhhdqeykvtwyvswspctrcansvatflakdpkvtltifvarlyyfwkpdyqqalrilcqkrggphatmkimnynefqdcwnkfvdgrgkpfkprnnlpkhytllqatlgellrhlmdpgtftsnfnnkpwvsgqhetylcykverlhndtwvplnqhrgflrnqapnihgfpkgrhaelcfldlipfwkldgqqyrvtcftswspcfscaqemakfisnnehvslcifaariyddqgryqeglralhrdgakiammnysefeycwdtfvdrqgrpfqpwdgldehsqalsgrlrai(斜体:核酸编辑结构域;单底线:细胞质定位信号)[0194]黑猩猩apobec-3g:[0195]mkphfrnpvermyqdtfsdnfynrpilshrntvwlcyevktkgpsrppldakifrgqvysklkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdvatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftsnfnnelwvrgrhetylcyeverlhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldlhqdyrvtcftswspcfscaqemakfisnnkhvslcifaariyddqgrcqeglrtlakagakisimtysefkhcwdtfvdhqgcpfqpwdgleehsqalsgrlrailqnqgn[0196](斜体:核酸编辑结构域;单底线:细胞质定位信号)[0197]绿猴apobec-3g:[0198]mnpqirnmveqmepdifvyyfnnrpilsgrntvwlcyevktkdpsgppldanifqgklypeakdhpemkflhwfrkwrqlhrdqeyevtwyvswspctrcansvatflaedpkvtltifvarlyyfwkpdyqqalrilcqerggphatmkimnynefqhcwnefvdgqgkpfkprknlpkhytllhatlgellrhvmdpgtftsnfnnkpwvsgqretylcykvershndtwvllnqhrgflrnqapdrhgfpkgrhaelcfldlipfwklddqqyrvtcftswspcfscaqkmakfisnnkhvslcifaariyddqgrcqeglrtlhrdgakiavmnysefeycwdtfvdrqgrpfqpwdgldehsqalsgrlrai[0199](斜体:核酸编辑结构域;单底线:细胞质定位信号)[0200]人类apobec-3g:[0201]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[0202](斜体:核酸编辑结构域;单底线:细胞质定位信号)[0203]人类apobec-3f:[0204]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[0205](斜体:核酸编辑结构域)[0206]人类apobec-3b:[0207]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgqvyfkpqyhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflsehpnvtltisaarlyyywerdyrralcrlsqagarvtimdyeefaycwenfvynegqqfmpwykfdenyaflhrtlkeilrylmdpdtftfnfnn[0208]dplvlrrrqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqnqgn[0209](斜体:核酸编辑结构域)[0210]大鼠apobec-3b:[0211]mqpqglgpnagmgpvclgcshrrpyspirnplkklyqqtfyfhfknvryawgrknnflcyevngmdcalpvplrqgvfrkqghihaelcfiywfhdkvlrvlspmeefkvtwymswspcskcaeqvarflaahrnlslaifssrlyyylrnpnyqqklcrliqegvhvaamdlpefkkcwnkfvdndgqpfrpwmrlrinfsfydcklqeifsrmnllredvfylqfnnshrvkpvqnryyrrksylcyqlerangqeplkgyllykkgeqhveilflekmrsmelsqvritcyltwspcpncarqlaafkkdhpdlilriytsrlyfwrkkfqkglctlwrsgihvdvmdlpqfadcwtnfvnpqrpfrpwneleknswriqrrlrrikeswgl[0212]牛apobec-3b:[0213]dgwevafrsgtvlkagvlgvsmtegwagsghpgqgacvwtpgtrntmnllrevlfkqqfgnqprvpapyyrrktylcyqlkqrndltldrgcfrnkkqrhaerfidkinsldlnpsqsykiicyitwspcpncanelvnfitrnnhlkleifasrlyfhwiksfkmglqdlqnagisvavmthtefedcweqfvdnqsrpfqpwdkleqysasirrrlqriltapi[0214]黑猩猩apobec-3b:[0215]mnpqirnpmewmyqrtfyynfenepilygrsytwlcyevkirrghsnllwdtgvfrgqmysqpehhaemcflswfcgnqlsaykcfqitwfvswtpcpdcvaklakflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvynegqpfmpwykfddnyaflhrtlkeiirhlmdpdtftfnfnndplvlrrhqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagqvraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqvrasslcmvphrpppppqspgpclplcsepplgsllptgrpapslpflltasfsfpppaslpplpslslspghlpvpsfhsltscsiqppcssriretegwasvskegrdlg[0216]人类apobec-3c:[0217]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswfcddilspntkyqvtwytswspcpdcagevaeflarhsnvnltiftarlyyfqypcyqeglrslsqegvaveimdyedfkycwenfvyndnepfkpwkglktnfrllkrrlreslq[0218]大猩猩apobec3c[0219]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswecddilspntnyqvtwytswspcpecagevaeflarhsnvnltiftarlyyfqdtdyqeglrslsqegvavkimdykdfkycwenfvynddepfkpwkglkynfrflkrrlqeile[0220](斜体:核酸编辑结构域)[0221]人类apobec-3a:[0222]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[0223](斜体:核酸编辑结构域)[0224]恒河猴apobec-3a:[0225]mdgspasrprhlmdpntftfnfnndlsvrgrhqtylcyeverldngtwvpmderrgflcnkaknvpcgdygchvelrflcevpswqldpaqtyrvtwfiswspcfrrgcagqvrvflqenkhvrlrifaariydydplyqealrtlrdagaqvsimtyeefkhcwdtfvdrqgrpfqpwdgldehsqalsgrlrailqnqgn[0226](斜体:核酸编辑结构域)[0227]牛apobec-3a:[0228]mdeytftenfnnqgwpsktylcyemerldgdatipldeykgfvrnkgldqpekpchaelyflgkihswnldrnqhyrltcfiswspcydcaqklttflkenhhislhilasriythnrfgchqsglcelqaagaritimtfedfkhcwetfvdhkgkpfqpweglnvksqalctelqailktqqn[0229](斜体:核酸编辑结构域)[0230]人类apobec-3h:[0231]malltaetfrlqfnnkrrlrrpyyprkallcyqltpqngstptrgyfenkkkchaeicfineiksmgldetqcyqvtcyltwspcsscawelvdfikahdhlnlgifasrlyyhwckpqqkglrllcgsqvpvevmgfpkfadcwenfvdhekplsfnpykmleeldknsraikrrlerikipgvraqgrymdilcdaev[0232](斜体:核酸编辑结构域)[0233]恒河猴apobec-3h:[0234]malltaktfslqfnnkrrvnkpyyprkallcyqltpqngstptrghlknkkkdhaeirfinkiksmgldetqcyqvtcyltwspcpscagelvdfikahrhlnlrifasrlyyhwrpnyqegllllcgsqvpvevmglpeftdcwenfvdhkeppsfnpsekleeldknsqaikrrleriksrsvdvlenglrslqlgpvtpsssirnsr[0235]人类apobec-3d:[0236]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgpvlpkrqsnhrqevyfrfenhaemcflswfcgnrlpanrrfqitwfvswnpclpcvvkvtkflaehpnvtltisaarlyyyrdrdwrwvllrlhkagarvkimdyedfaycwenfvcnegqpfmpwykfddnyaslhrtlkeilrnpmeamyphifyfhfknllkacgrneswlcftmevtkhhsavfrkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlcyfwdtdyqeglcslsqegasvkimgykdfvscwknfvysddepfkpwkglqtnfrllkrrlreilq[0237](斜体:核酸编辑结构域)[0238]人类apobec-1:[0239]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr小鼠apobec-1:[0240]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[0241]大鼠apobec-1:[0242]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[0243]人类apobec-2:[0244]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[0245]小鼠apobec-2:[0246]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0247]大鼠apobec-2:[0248]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvveaqskggqvqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeylwqnfveqeegeskafepwediqenflyyeekladilk[0249]牛apobec-2:[0250]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0251]海七鳃鳗cda1(pmcdal)[0252]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsfmiqvkilhttkspav[0253]人类apobec3gd316rd317r[0254]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkfnydefqhcwskfvysqrelfepwnnlpkyyillhfmlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfiskkhvslciftariyrrqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[0255]人类apobec3g链a[0256]mdpptftfnfnnepwwgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[0257]人类apobec3g链ad120rd121r[0258]mdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyrrqgrcqeglrtlaeagakisfmtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[0259]术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或其片段。[0260]“检测”是指鉴别待检测的分析物的存在、不存在或其数量。在一个实施方式中,多核苷酸或多肽中的序列改变被检测到。在另一个实施方式中,插入/缺失的存在被检测到。[0261]“可检测标记”意为当链接到目标分子上时,使得该目标分子可经由分光的、光化学的,生物化学的,免疫化学的,或化学的手段而被检测到的组合物。例如,有用的标记包含放射性同位素、磁珠、金属珠、胶体颗粒、荧光染料、电子-致密试剂、酶(例如,像elisa(酶联免疫吸附测定)中常用的)、生物素、地高辛或半抗原。[0262]“片段”意为多肽或核酸分子的一部分。这部分含有,该参考核酸分子或多肽的全长的至少约10%,20%,30%,40%,50%,60%,70%,80%,或90%。片段可能含有10,20,30,40,50,60,70,80,90,或100,200,300,400,500,600,700,800,900,或1000个核苷酸或氨基酸。[0263]“杂交(hybridization)”意为互补核碱基之间的氢键键结,其可以是沃森-克里克,hoogsteen或反向hoogsteen氢键键结。例如,腺嘌呤和胸腺嘧啶是通过氢键的形成而配对的互补核碱基。[0264]术语“碱基修复的抑制剂”或“ibr”是指能够抑制核酸修复酶(例如碱基切除修复酶)的活性的蛋白。在一些实施方式中,该ibr是肌苷碱基切除修复的抑制剂。示例性的碱基修复的抑制剂包含ape1,endoiii,endoiv,endov,endoviii,fpg,hoggl,hneill,t7endol,t4pdg,udg,hsmugl,和haag的抑制剂。在一些实施方式中,该ibr是endov或haag的抑制剂。在一些实施方式中,该ibr是催化无活性的endov或催化无活性的haag。[0265]术语“分离的”,“纯化的”,或“生物学纯的”是指材料和天然状态下通常与其相伴的组分的分离的不同程度。“分离”表示与原始来源或周围环境的一种分离程度。“纯化”表示高于分离的一种分离程度。“纯化的”或“生物学纯的”蛋白质充分地不含其他材料,使得任何杂质不会实质地影响蛋白质的生物学特性或造成其他不利后果。也就是说,本发明的核酸或肽,如果以重组dna技法生产而基本地不含细胞材料、病毒材料或培养介质;或,如果以化学合成而基本地不含化学前体或其他化学品,则本发明的核酸或肽即视为纯化的。纯度和同质性通常用分析化学技法确定,例如,聚丙烯酰胺凝胶电泳或高效液相色谱。术语“纯化的”可表示核酸或蛋白质在电泳凝胶中基本上产生一条带。对于可以被修饰(例如磷酸化或糖基化)的蛋白质,不同的修饰可能产生不同的分离的蛋白质,其可以被各自纯化。[0266]“分离的多核苷酸”意为核酸(例如dna),其不含在本发明的核酸分子所来源生物体的天然-存在的基因组中位于该核酸两侧翼的基因。该术语因此包含,例如,并入载体内的重组dna;并入自主复制的质粒内或病毒内的重组dna;或并入原核生物或真核生物的基因组dna内的重组dna;或作为独立于其他序列的单独的分子(例如,通过pcr或限制性核酸内切酶消化所产生的cdna或基因组片段或cdna片段)存在的重组dna。另外,该术语包含从dna分子转录而来的rna分子,以及编码额外的多肽序列的作为杂合基因一部分的重组dna。[0267]“分离的多肽”意为已同与其天然相伴的组分分离的本发明的多肽。通常,以重量计,当多肽至少60%不含与其天然伴随的蛋白质和天然-存在的有机分子时,该多肽即视为分离的。优选地,以重量计,制备为至少75%,更优选至少90%,最优选至少99%,本发明的多肽。可获得分离的本发明的多肽,例如,通过从天然来源提取,通过表达编码此多肽的重组核酸;或通过化学合成该蛋白质。纯度可以通过任何适当的方法测量,例如柱色谱,聚丙烯酰胺凝胶电泳,或通过hplc(高效液相色谱)分析。[0268]术语“连接子”,如本文所用,是指链接两个分子或部分体(例如融合蛋白的两个结构域)的键(例如共价键)、化学基团或分子。在一些实施方式中,连接子连接rna-可编程的核酸酶的grna结合结构域(其包括cas9核酸酶结构域)和核-酸编辑蛋白(例如,胞苷或腺苷脱氨酶)的催化结构域。在一些实施方式中,连接子连接dcas9和核酸编辑蛋白。通常,连接子是就定位于两个基团、分子或其他部分体的之间或两侧,并经由共价键与两个中的每个都连结,从而将两个连结起来。在一些实施方式中,该连接子是氨基酸或复数个氨基酸(例如,肽或蛋白)。在一些实施方式中,该连接子是有机分子、基团、聚合物或化学部分体。在一些实施方式中,该连接子是5-200个氨基酸的长度,例如,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,35,45,50,55,60,65,70,75,80,85,90,95,100,101,102,103,104,105,110,120,130,140,150,160,175,180,190,或200个氨基酸的长度。较长或较短的连接子也是预期中的。在一些实施方式中,连接子包括氨基酸序列sgsetpgtsesatpes,其也称为xten连接子。在一些实施方式中,连接子包括氨基酸序列sggs。在一些实施方式中,连接子包括(sggs)n,(gggs)n,(ggggs)n,(g)n,(eaaak)n,(ggs)n,sgsetpgtsesatpes,或(xp)n基序,或这些中任何的组合,其中n独立地是1和30之间的整数,且其中x是任何氨基酸。在一些实施方式中,n是1,2,3,4,5,6,7,8,9,10,11,12,13,14,或15。[0269]在一些实施方式中,所述核碱基编辑器的各结构域是经由包括以下氨基酸序列的连接子而融合的:sggssgsetpgtsesatpessggs,sggssggssgsetpgtsesatpessggssggs或ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs。在一些实施方式中,所述核碱基编辑器的各结构域是经由包括氨基酸序列sgsetpgtsesatpes(其也可被称为xten连接子)的连接子而融合的。在一些实施方式中,该连接子是24个氨基酸的长度。在一些实施方式中,该连接子包括氨基酸序列sggssggssgsetpgtsesatpes。在一些实施方式中,该连接子是40个氨基酸的长度。在一些实施方式中,该连接子包括氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggs。在一些实施方式中,该连接子是64个氨基酸的长度。在一些实施方式中,该连接子包括氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs。在一些实施方式中,该连接子是92个氨基酸的长度。在一些实施方式中,该连接子包括氨基酸序列pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats。[0270]术语“突变”,如本文所用,是指序列(例如核酸或氨基酸序列)中的一残基被另一残基替换,或序列中一个或多个残基的缺失或插入。在本文中,突变的描述通常是通过首先指出原始的残基,随后指出该序列中该残基的位置,然后再指出新替换的残基的身份。制造出本文所提供的氨基酸替换(突变)的各种方法在本领域中是众所周知的,例如由green和sambrook,molecularcloning:alaboratorymanual(第4版,coldspringharborlaboratorypress,冷泉港,纽约(2012))所提供。[0271]术语“核酸”和“核酸分子”,如本文所用,是指化合物,其包括核碱基和酸性部分体,例如核苷、核苷酸或核苷酸的聚合物。通常,聚合的核酸,例如包括三个或更多个核苷酸的核酸分子,是线性分子,其中相邻的核苷酸经由磷酸二酯键合彼此链接。在一些实施方式中,“核酸”是指单个的核酸残基(例如,核苷酸和/或核苷)。在一些实施方式中,“核酸”是指包括三个或更多个单个核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可以互换使用以指代核苷酸的聚合物(例如,至少三个核苷酸的一串)。在一些实施方式中,“核酸”涵盖了rna以及单股和/或双-股dna。核酸可以是天然存在的,例如在如下情况中:基因组、转录本、mrna、trna、rrna、sirna、snrna、质粒、黏粒、染色体、染色单体或其他天然存在的核酸分子。另一方面,核酸分子可以是非-天然存在的分子,例如,重组dna或rna,人工染色体,工程化的基因组,或其片段,或合成的dna,rna,dna/rna杂合体,或包含非-天然存在的核苷酸或核苷。此外,术语“核酸”,“dna”,“rna”和/或类似术语包含核酸类似物,例如,具有非磷酸二酯主干的类似物。核酸可以从天然来源中被纯化,使用重组表达系统加以生产,并可选地被纯化、被化学合成等。在适当的情况下,例如,在化学合成的分子的情况下,核酸可以包括核苷类似物,诸如具有化学经修饰的碱基或糖,以及主干修饰的类似物。除非另有说明,否则核酸序列是以5′至3′方向呈现。在一些实施方式中,核酸是抑或包括天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);核苷类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯-嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟嘌呤和2-硫胞苷);化学经修饰的碱基;生物经修饰的碱基(例如,甲基化的碱基);嵌和的碱基;经修饰的糖(例如,2′‑氟核糖、核糖、2′‑脱氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸基团(例如,硫代磷酸和5′‑n-亚磷酰胺键合)。[0272]术语“核定位序列”,“核定位信号”或“nls”是指促进蛋白质导入细胞核的氨基酸序列。核定位序列在本领域中是已知的,并且描述于例如plank等,国际pct申请,pct/ep2000/011690,其提交于2000年11月23日,以wo/2001/038547公布于2001年5月31日,针对其示例性核定位序列的公开揭露,其内容在此通过引用并入本文。在其他实施方式中,nls是优化过的nls,其描述于例如koblan等,naturebiotech.2018doi:10.1038/nbt.4172。在一些实施方式中,nls包括氨基酸序列krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprk,pkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0273]本公开揭露提供了核酸可编程的核酸(例如,dna或rna)结合蛋白。该核酸可编程的核酸结合蛋白可以是,例如,“核酸可编程的dna结合蛋白”或“napdnabp”。术语“核酸可编程的dna结合蛋白”或“napdnabp”是指与核酸(例如dna或rna),诸如将napdnabp导向至特定核酸序列的向导核酸,相联的蛋白质。例如,cas9蛋白可以与向导rna相联,该向导rna将该cas9蛋白导向至与该向导rna互补的特定dna序列。在一些实施方式中,该napdnabp是cas9结构域,例如核酸酶有活性的cas9、cas9切口酶(ncas9),或核酸酶无活性的cas9(dcas9)。核酸可编程的dna结合蛋白的实例包含但不限于:cas9(例如,dcas9和ncas9)、casx、casy、cpfl、cas12b/c2c1和cas12c/c2c3。其他核酸可编程的dna结合蛋白也在此公开揭露的范围内,尽管它们在本公开揭露中可能未被明确列出。[0274]如本文所用,“获得”,正如“获得(一)剂”中那样,包含合成、购买或以其他方式取得该剂。[0275]术语“rna-可编程的核酸酶”和“rna-导向的核酸酶”与非切开的靶标的一种或多种rna一起使用(例如结合或相联)。在一些实施方式中,当rna-可编程的核酸酶与rna形成复合体时,可称其为核酸酶:rna复合体。通常,所结合的rna被称为向导rna(grna)。grna可以作为具有两个或多个rna的复合体存在,也可以作为单一rna分子存在。以单一rna分子存在的grna可被称为单-向导rna(sgrna),尽管“grna”可互换使用以指代以单个分子存在或以具有两个或多个分子的复合体存在的向导rna。通常,以单一rna种类存在的grna包括两个结构域:(1)与靶核酸共享同源性的结构域(例如,并且导引cas9复合体结合到靶上);(2)结合cas9蛋白的结构域。在一些实施方式中,结构域(2)对应于被称为tracrrna的序列,并包括茎-环结构。例如,在一些实施方式中,结构域(2)与jinek等,science337:816-821(2012)(其全部内容通过引用并入本文)中所提供的tracrrna是相同的或同源的。grna的其他实例(例如,包括结构域2的那些)可以在2013年9月6日提交的题为“switchablecas9nucleasesandusesthereof”的美国临时专利申请u.s.s.n.61/874,682中,以及在2013年9月6日提交的题为“deliverysystemforfunctionalnucleases”的美国临时专利申请u.s.s.n.61/874,746中找到,其每个的全部内容在此通过引用整体并入。在一些实施方式中,grna包括两个或更多个的结构域(1)和(2),并可被称为“延伸的grna”。如本文所述,延伸的grna将结合两个或更多个cas9蛋白并在两个或更多个独特的区域处结合靶核酸。该grna包括与靶位点互补的核苷酸序列,其介导该核酸酶/rna复合体结合到所述靶位点,并提供了该核酸酶:rna复合体的序列特异性。在一些实施方式中,该rna-可编程的核酸酶是(crispr-关联系统)cas9核酸内切酶,例如,来自化脓性链球菌的cas9(csnl)(参见例如“completegenomesequenceofanmlstrainofstreptococcuspyogenes.”ferrettij.j.,mcshanw.m.,ajdicd.j.,savicd.j.,savicg.,lyonk.,primeauxc,sezates.,suvorova.n.,kentons.,laih.s.,lins.p.,qiany.,jiah.g.,najarf.z.,renq.,zhuh.,songl.,whitej.,yuanx.,cliftons.w.,roeb.a.,mclaughlinr.e.,proc.natl.acad.sci.美国98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,chylinskik.,sharmacm.,gonzalesk.,chaoy.,pirzadaz.a.,eckertm.r.,vogelj.,charpentiere.,nature471:602-607(2011))。[0276]术语“重组”,如本文在蛋白质或核酸的情境中使用的,是指自然界中并不存在,而是人类工程学的产物的蛋白质或核酸。例如,在一些实施方式中,重组蛋白或重组核酸分子包括氨基酸或核苷酸序列,该氨基酸或核苷酸序列与任何天然存在的序列相比包括至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变。[0277]“减少”意为至少10%,25%,50%,75%,或100%的负向改变。[0278]“参考”意为一标准或对照条件。[0279]“参考序列”是用作序列比对的基准的界定的序列。参考序列可能是指定序列的子集或全部;例如,全长cdna或基因序列的一节段,或完整的cdna或基因序列。对多肽来说,参考多肽序列的长度将一般为至少约16个氨基酸,至少约20个氨基酸,至少约25个氨基酸,约35个氨基酸、约50个氨基酸或约100个氨基酸。对核酸来说,参考核酸序列的长度一般为至少约50个核苷酸、至少约60个核苷酸、至少约75个核苷酸、约100个核苷酸或约300个核苷酸或任何约等于它们或在它们之间的整数。[0280]“特异性结合”意为识别并结合本发明的多肽和/或核酸分子,但基本上不识别和结合样品(例如生物样品)中其他分子的核酸分子、多肽或其复合体(例如,核酸可编程的dna结合结构域和向导核酸)、化合物或分子。[0281]可用于本发明的方法的核酸分子包含任何编码本发明的多肽或该多肽片段的核酸分子。此种核酸分子不需要与内源性核酸序列100%相同,但通常将展现出实质的同一性。与内源性序列具有“实质的同一性”的多核苷酸通常能够与双-股核酸分子的至少一股杂交。可用于本发明的方法的核酸分子包含任何编码本发明的多肽或该多肽片段的核酸分子。此种核酸分子不需要与内源性核酸序列100%相同,但通常将展现出实质的同一性。与内源性序列具有“实质的同一性”的多核苷酸通常能够与双-股核酸分子的至少一股杂交。“杂交”意为在各种严格度的条件下,互补的多核苷酸序列(例如本文所述的基因)或其部分之间配对并且形成双股分子(参见例如,wahl,g.m.和s.l.berger(1987),methodsenzymol.152:399;kimmel,a.r.(1987),methodsenzymol.152:507)。[0282]例如,严格的盐浓度将一般小于约750mm氯化钠和75mm柠檬酸钠,优选小于约500mm氯化钠和50mm柠檬酸钠,更优选小于约250mm氯化钠和25mm柠檬酸钠。低严格度杂交可在无有机溶剂(例如甲酰胺)的情况下获得,而高严格度杂交可在至少约35%甲酰胺,和更优选至少约50%甲酰胺的存在下获得。严格的温度条件将一般包含至少约30℃,更优选至少约37℃,最优选至少约42℃的温度。变化其他参数,诸如杂交时间、洗涤剂(例如十二烷基硫酸钠(sds))的浓度、以及载具dna的包含或排除,是本领域技术人员熟知的。根据需要,通过合并这些不同的条件来实现严格度的各种层级。在一个实施方式中,杂交将发生在30℃下、750mm氯化钠,75mm柠檬酸钠和1%sds中。在另一个实施方式中,杂交将发生在37℃下、500mm氯化钠,50mm柠檬酸钠,1%sds,35%甲酰胺和100μg/ml变性的鲑鱼精子dna(ssdna)中。在另一个实施方式中,杂交将发生在42℃下、250mm氯化钠,25mm柠檬酸钠,1%sds,50%甲酰胺和200μg/mlssdna中。对于本领域技术人员来说,在这些条件上的有用的变化是显而易见的。[0283]对于大多数应用,杂交后的清洗步骤在严格度方面也将变化。清洗的严格度条件可以通过盐浓度和通过温度来定义。如上,可以通过降低盐浓度或通过升高温度而提高清洗的严格度。例如,用于清洗步骤的严格盐浓度将优选是小于约30mm氯化钠和3mm柠檬酸钠,最优选是小于约15mm氯化钠和1.5mm柠檬酸钠。用于清洗步骤的严格温度条件将一般包systems.naturebiotechnology31,233-239(2013);其每个的全部内容通过引用并入本文)。[0289]本文所提供的范围应被理解为该范围内所有数值的简略表达。例如,1到50的范围应被理解为包含任何数字、数字的组合或任何子-范围,其来自于由以下所组成的群组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50。[0290]如本文所用,除非特别说明或从上下文中显见,否则术语“或(or)”应被理解为包含在内。如本文所用,除非特别说明或从上下文中显见,否则术语“一(a)”,“一(an)”和“该(the)”应被理解为单数或复数。[0291]如本文所用,除非特别说明或从上下文中显见,否则术语“约(about)”应被理解为在本领域的正常允差范围内,例如在平均值的2个标准差内。“约”可以理解为给定数值的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%或0.01%以内。除非上下文另有明确说明,否则本文所提供的所有数字的数值均由术语“约”修饰。[0292]本文对变量的任何定义中的化学基团列表的列举,包含了将该变量定义为所列基团的任何单个基团或所列基团的组合。本文对变量或方面的实施方式的列举,包含了该实施方式作为任何单一实施方式或与任何其他实施方式或该任何其他实施方式的部分的组合。[0293]本文所提供的任何组合物和方法可以与本文所提供的任何其他组合物和方法组合。附图说明[0294]图1描绘腺苷核碱基编辑器的模型,并且部分地提供旁观者诱变的结构性基础。[0295]图2是描绘用于碱基编辑的靶dna区位的预测的模型。[0296]图3描绘显示图2中靠近靶dna区位的脱氨酶结构的位置的模型。[0297]图4是腺苷核碱基编辑器的模型,其描绘所鉴别出的一个或多个脱氨酶结构域可能插入到cas9中的区域。靠近脱氨酶结构域所在的环(黄色)可能靶向单股dna(洋红色)。感兴趣的区域包含标记为a、b、c、d、e、f、g和h的那些。[0298]图5是图4中模型的放大视图,其显示区域b、c、d、e和f中的残基。[0299]图6是图4中模型的放大视图,其显示区域f、g和h中的残基。[0300]图7是图4中模型的放大视图,其显示区域a、b、c、d和e中的残基。[0301]图8描绘一种高通量体外脱氨反应测定。通过比较含有核碱基编辑器且有在靶探针(其含有用于该碱基编辑器的底物)的反应和不含该碱基编辑器但有用于检测脱靶脱氨反应的探针的反应,可以将该探针的假性脱氨反应与在靶脱氨反应区分开来。[0302]图9是描绘用于脱靶脱氨反应的荧光测定的结果的图表。[0303]图10是描绘腺苷碱基编辑器(abe)与具有反式tada的abe系统的比较的图表。[0304]图11描绘用于假性脱靶碱基编辑的潜在的底物。[0305]图12描绘评估顺式和反式脱氨酶活性的测定。[0306]图13是描绘在所述顺式-反式测定中rapobec1的活性的图表。[0307]图14是描绘在所述顺式-反式测定中tada-tada7.10的活性的图表。[0308]图15描绘在碱基编辑器情境(反式abe)中对于tada-tada7.10观察到较低的反式活性。[0309]图16是描述gfp表达的剂量-反应的结果的图表。用空载体对pmaxgfp质粒的滴定导致gfp表达水平的降低。[0310]图17是描述腺苷核碱基编辑器abe的顺式和反式活性的剂量-反应的图表。[0311]图18是描述胞苷核碱基编辑器be4的顺式和反式活性的剂量-反应的图表。[0312]图19是显示以减低的假性脱氨反应为标准而筛选脱氨酶的结果的图表。脱氨酶ppapobec-2(10),mapobec-2(8),mapobec-3(12),和mfapobec-4(22)显示出高的顺式/反式活性。[0313]图20a至q描绘所检查的编辑器的碱基编辑活性。图20a是abe7.10的示意图,其tada经由xten连接子与cas9融合。图20b-q显示示例性的内部融合碱基编辑器在靶序列gaacacaaagcatagactgc(hek2)和ggacagcttttcctagacag(t39)的r-环范围内的靶向股上的a变g脱氨反应的百分比,即碱基编辑活性。图20b,abe7.10的编辑活性。图20c,islay008的编辑活性。图20d,islay003的编辑活性。图20e,islay002的编辑活性。图20f,islay007的编辑活性。图20g,islay001的编辑活性。图20h,islay005的编辑活性。图20i,islay006的编辑活性。图20j,islay004的编辑活性。图20k,islay021的编辑活性。图20l,islay031的编辑活性。图20m,islay020的编辑活性。图20n,islay036的编辑活性。图20o,islay035的编辑活性。图20p,islay028的编辑活性。图20q,islay009的编辑活性。[0314]图21a至b显示示例性的碱基编辑器的示意图。图21a显示示例性的碱基编辑器abe7.10和示例性的碱基编辑器(ibe002,ibe004、ibe005、ibe006、ibe008、ibe009和ibe020)的示意图。图21b显示上述碱基编辑的空间卡通图表征,其显示脱氨酶插入的区位。[0315]图22a-d描绘,与abe7.10相比,示例性的内部融合碱基编辑器在29个不同基因组靶标处的碱基编辑效率。图22a显示编辑效率被归一化到在最佳位置处的abe7.10编辑。图22b显示最大编辑效率的ibe,对其总结并将其与abe7.10比较。图22c显示每个碱基编辑器的峰值编辑位置的高斯平滑法表征。图22d显示来自所述29个被测试的靶标的归一化编辑的热度图。[0316]图23描绘通过反式编辑测定所测量的假性脱氨反应,正如29个不同的靶标归一化到在每个位点处的abe7.10。[0317]图24a至f显示a-碱基编辑器在6个基因组基因座处的编辑百分比:hek4(图24a),fancf(图24b),hek-3(图24c),hek2-yy(图24d),emx1(图24e),hek2(图24f)。x-轴:核碱基位置,1为距pam最远而20为pam近端(pam为位置21至23)。y轴:通过illumina测序而测量的a变g编辑的百分比。[0318]图25a至f显示c-碱基编辑器在6个基因组基因座处的编辑百分比:hek4(图25a),fancf(图25b),hek-3(图25c),hek2-yy(图25d),emx1(图25e),hek2(图25f)。x-轴:核碱基位置,1为距pam最远而20为pam近端(pam为位置21至23)。y轴:通过illumina测序而测量的a变g编辑的百分比。具体实施方式[0319]如下所述,本发明的特色为具有减低的非靶脱氨反应的碱基编辑器,使用所述碱基编辑器的方法,和用于定性具有降低的非靶脱氨反应(例如,与程式化的在靶脱氨反应相比)的碱基编辑器的测定。[0320]腺苷脱氨酶[0321]在一些实施方式中,本发明的核碱基编辑器包括腺苷脱氨酶结构域。在一些实施方式中,本文所提供的腺苷脱氨酶能够使腺嘌呤脱氨基。在一些实施方式中,本文所提供的腺苷脱氨酶能够使dna的脱氧腺苷残基中的腺嘌呤脱氨基。该腺苷脱氨酶可衍生自任何适合的生物体(例如,大肠杆菌)。在一些实施方式中,该腺嘌呤脱氨酶是天然-存在的腺苷脱氨酶,其包含一个或多个对应于本文所提供的任何突变(例如,ectada中的突变)的突变。本领域技术人员将能够,例如通过序列比对和同源残基的确定,鉴别出任何同源蛋白质中的相对应残基。因此,本领域技术人员将能够在任何天然-存在的腺苷脱氨酶(例如,与ectada具有同源性)中生成对应于本文所述的任何突变(例如,在ectada中鉴别出的任何突变)。在一些实施方式中,该腺苷脱氨酶来自原核生物。在一些实施方式中,该腺苷脱氨酶来自细菌。在一些实施方式中,该腺苷脱氨酶来自大肠杆菌,金黄色葡萄球菌,伤寒沙门菌,腐败希瓦氏菌,流感嗜血杆菌,新月柄杆菌,或枯草芽孢杆菌。在一些实施方式中,该腺苷脱氨酶来自大肠杆菌。[0322]在一个实施方式中,本发明的融合蛋白包括与tada7.10链接的野生型tada,而该tada7.10则链接到cas9切口酶上。在特定的实施方式中,该融合蛋白包括单一tada7.10结构域(例如,以单体提供)。在其他实施方式中,该abe7.10编辑器包括能够形成异二聚体的tada7.10和tada(wt)。其相关序列如下:[0323]tada(wt):[0324]sevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0325]tada7.10:[0326]sevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0327]在一些实施方式中,该腺苷脱氨酶包括的氨基酸序列,与本文所提供的任何腺苷脱氨酶中列出的任一氨基酸序列,是至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%相同的。应当理解,本文所提供的腺苷脱氨酶可包含一个或多个突变(例如,本文所提供的任何突变)。本公开揭露所提供的任何脱氨酶结构域,均具有一定百分比的同一性,再加上本文所述的任何突变或其组合。在一些实施方式中,该腺苷脱氨酶包括的氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,具有1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50个,或更多个突变。在一些实施方式中,该腺苷脱氨酶包括的氨基酸序列,与本领域已知或本文所述的任一氨基酸序列相比,具有至少5,至少10,至少15,至少20,至少25,至少30,至少35,至少40,至少45,至少50,至少60,至少70,至少80,至少90,至少100,至少110,至少120,至少130,至少140,至少150,至少160,或至少170个相同的接连的氨基酸残基。[0328]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d108x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d108g、d108n、d108v、d108a或d108y突变或在另一腺苷脱氨酶中的相应突变。然而,应当理解,可类似地比对额外的脱氨酶以鉴别出可以如本文所提供的那样被突变的同源氨基酸残基。[0329]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a106x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a106v突变,或在另一腺苷脱氨酶中的相应突变。[0330]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的e155x突变,或在另一腺苷脱氨酶中的相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的e155d、e155g或e155v突变,或在另一腺苷脱氨酶中的相应突变。[0331]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d147x突变,或在另一腺苷脱氨酶中的相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d147y突变,或在另一腺苷脱氨酶中的相应突变。[0332]应当理解,可将本文所提供的任何突变(例如,基于tada参考序列的ectada氨基酸序列)引入其他腺苷脱氨酶中,诸如金黄色葡萄球菌tada(satada),或其他腺苷脱氨酶(例如细菌的腺苷脱氨酶)。对于熟练技术人员而言显而易见的将是如何通过比对额外的脱氨酶以鉴别出那些与ectada中被突变的残基同源的氨基酸残基。因此,可在其他具有同源氨基酸残基的腺苷脱氨酶中制备从ectada中所鉴别出的任何突变。还应当理解,本文所提供的任何突变均可在ectada或另一腺苷脱氨酶中单独地或以任何组合制备。例如,腺苷脱氨酶可含有在tada参考序列中的d108n,a106v,e155v和/或d147y突变,或在另一腺苷脱氨酶中的相应突变。在一些实施方式中,腺苷脱氨酶包括在tada参考序列中的以下突变群组(各突变群组由“;”分开),或在另一腺苷脱氨酶中的相应突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n、a106v和e55v;d108n、a106v和d147y;d108n、e55v和d147y;a106v、e55v和d147y;和d108n、a106v、e55v和d147y。然而,应当理解,可以在腺苷脱氨酶(例如ectada)中制备本文所提供的相应突变的任何组合。[0333]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、kllox、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e或a56s,e59g,e85k或e85g、m94l、1951、v102a、f104l、a106v、r107c或r107h或r107p、d108g或d108n或d108v或d108a或d108y、kl101、ml18k、n127s、a138v、f149y、m151v、r153c、q154l、i156d和/或k157r突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0334]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8x,d108x和/或n127x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8y、d108n和/或n127s突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0335]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8x、r26x、m61x、l68x、m70x、a106x、d108x、a109x、n127x、d147x、r152x、q154x,e155x、k161x、q163x和/或t166x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h8y、r26w、m61i、l68q、m70v、a106t、d108n、a109t、n127s、d147y、r152c、q154h或q154r、e155g或e155v或e155d、k161q、q163h和/或t166p突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0336]在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:在tada参考序列中的h8x、d108x、n127x、d147x、r152x和q154x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六、七或八个突变,其选自于由以下所组成的群组:在tada参考序列中的h、155x和q163x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8x、d108x、n127x、e155x和t166x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:h8x、a106x、d108x、另一腺苷脱氨酶中的一个或多个突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六、七或八个突变,其选自于由以下所组成的群组:在tada参考序列中的h8x、r126x、l68x、d108x、n127x、d147x和e155x或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8x、d108x、a109x、n127x和e155x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。[0337]在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、d108n、n127s、d147y、r152c和q154h,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六、七或八个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、d108n、n127s、e155v和t166p,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、a106t、d108n、n127s、e155d和k161q,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六、七或八个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、r126w、l68q、d108n、n127s、d147y和e155v,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、d108n、a109t、n127s和e155g,或在另一腺苷脱氨酶中的一个或多个相应突变。[0338]在一些实施方式中,该腺苷脱氨酶包括在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d108n,d108g,或d108v突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a106v和d108n突变,或在另一腺苷脱氨酶中的多个相应突变。[0339]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r107c和d108n突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h8y、d108n、n127s、d147y和q154h突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h8y、r24w、d108n、n127s、d147y和e155v突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的d108n、d147y和e155v突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h8y、d108n和n127s突变,或在另一腺苷脱氨酶中的多个相应突变。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a106v、d108n、d147y和e155v突变,或在另一腺苷脱氨酶中的多个相应突变。[0340]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个s2x、h8x、i49x、l84x、h123x、n127x、i156x和/或k160x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个s2a、h8y、i49f、l84f、h123y、n127s、i156f和/或k160s突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0341]在一些实施方式中,该腺苷脱氨酶包括l84x突变腺苷脱氨酶,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的l84f突变,或在另一腺苷脱氨酶中的相应突变。[0342]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h123x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h123y突变,或在另一腺苷脱氨酶中的相应突变。[0343]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的i157x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的i157f突变,或在另一腺苷脱氨酶中的相应突变。[0344]在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六或七个突变,其选自于由以下所组成的群组:在tada参考序列中的l84x、a106x、d108x、h123x、d147x、e155x和i156x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:在tada参考序列中的s2x、i49x、a106x、d108x、d147x和e155x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8x、a106x、d108x、n127x和k160x,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x表示在该野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸的存在。[0345]在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五、六或七个突变,其选自于由以下所组成的群组:在tada参考序列中的l84f、a106v、d108n、h123y、d147y、e155v和i156f,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一、二、三、四、五或六个突变,其选自于由以下所组成的群组:在tada参考序列中的s2a、i49f、a106v、d108n、d147y和e155v。[0346]在一些实施方式中,该腺苷脱氨酶包括一、二、三、四或五个突变,其选自于由以下所组成的群组:在tada参考序列中的h8y、a106t、d108n、n127s和k160s,或在另一腺苷脱氨酶中的一个或多个相应突变。[0347]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个e25x、r26x、r107x、a142x和/或a143x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个e25m、e25d、e25a、e25r、e25v、e25s、e25y、r26g、r26n、r26q、r26c、r26l、r26k、r107p、r07k、r107a、r107n、r107w、r107h、r107s、a142n、a142d、a142g、a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或在另一腺苷脱氨酶中的一个或多个相应突变。在一些实施方式中,该腺苷脱氨酶包括一个或多个本文所述的相对应于tada参考序列的突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0348]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的e25x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s或e25y突变,或在另一腺苷脱氨酶中的相应突变。[0349]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r26x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r26g、r26n、r26q、r26c、r26l或r26k突变,或在另一腺苷脱氨酶中的相应突变。[0350]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r107x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r107p、r07k、r107a、r107n、r107w、r107h或r107s突变,或在另一腺苷脱氨酶中的相应突变。[0351]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a142x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a142n、a142d、a142g突变,或在另一腺苷脱氨酶中的相应突变。[0352]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a143x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或在另一腺苷脱氨酶中的相应突变。[0353]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h36x、n37x、p48x、i49x、r51x、m70x、n72x、d77x、e134x、s146x、q154x、k157x和/或k161x突变,或在另一腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的一个或多个h36l、n37t、n37s、p48t、p48l、i49v、r51h、r51l、m70l、n72s、d77g、e134g、s146r、s146c、q154h、k157n和/或k161t突变,或在另一腺苷脱氨酶中的一个或多个相应突变。[0354]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h36x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的h36l突变,或在另一腺苷脱氨酶中的相应突变。[0355]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的n37x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的n37t或n37s突变,或在另一腺苷脱氨酶中的相应突变。[0356]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的p48x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的p48t或p48l突变,或在另一腺苷脱氨酶中的相应突变。[0357]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r51x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的r51h,或r51l突变,或在另一腺苷脱氨酶中的相应突变。[0358]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的s146x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的s146r或s146c突变,或在另一腺苷脱氨酶中的相应突变。[0359]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的k157x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的k157n突变,或在另一腺苷脱氨酶中的相应突变。[0360]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的p48x突变,或在另一腺苷脱氨酶中的相应突变,其中x表示在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的p48s、p48t或p48a突变,或在另一腺苷脱氨酶中的相应突变。[0361]在一些实施方式中,该腺苷脱氨酶包括在tada参考序列中的a142x突变,或在另一146r_d147y_e155v_i156f)、(h36l_p48l_l84f_a106v_d108n_h123y_e134g_d147y_e155v_i156f)、57n)、(h36l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f)、(l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、(n37s_r51h_d77g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、(r51l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、(d24g_q71r_l84f_h96l_a106v_d108n_h123y_d147y_e155v_i156f_k160e),(h36l_g67v_l84f_a106v_d108n_h123y_s146t_d147y_e155v_i156f)、(q71l_l84f_a106v_d108n_h123y_l137m_a143e_d147y_e155v_i156f)、(e25g_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、(l84f_a91t_f104i_a106v_d108n_h123y_d147y_e155v_i156f)、(n72d_l84f_a106v_d108n_h123y_g125a_d147y_e155v_i156f)、(p48s_l84f_s97c_a106v_d108n_h123y_d147y_e155v_i156f)、(w23g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、(d24g_p48l_q71r_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l),(l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、(h36l_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、(n37s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_k161t),(l84f_a106v_d108n_d147y_e155v_i156f)、(r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k161t),(l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k161t)、(l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e_k161t),(l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e)、(r74ql84f_a106v_d108n_h123y_d147y_e155v_i156f)、(r74a_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、(l84f_a106v_d108n_h123y_d147y_e155v_i156f)、(r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、(l84f_r98q_a106v_d108n_h123y_d147y_e155v_i156f)、(l84f_a106v_d108n_h123y_r129q_d147y_e155v_i156f)、(p48s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、(p48s_a142n),(p48t_i49v_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_l157n),(p48t_i49v_a142n)、(h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f(h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152h_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_r152p_e155v_i156f_k157n)、(w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、(w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_r152p_e155v_i156f_k157n)。[0365]胞苷脱氨酶[0366]在一个实施方式中,本发明的融合蛋白包括胞苷脱氨酶。在一些实施方式中,本文所提供的胞苷脱氨酶能够将胞嘧啶或5-甲基胞嘧啶脱氨基为尿嘧啶或胸腺嘧啶。在一些实施方式中,本文所提供的胞苷脱氨酶能够使dna中的胞嘧啶脱氨基。该胞苷脱氨酶可衍生自任何适合的生物体。在一些实施方式中,该胞苷脱氨酶是天然-存在的胞苷脱氨酶,其包含一个或多个与本文所提供的任何突变相对应的突变。本领域技术人员将能够,例如通过序列比对和同源残基的确定,鉴别出任何同源蛋白质中的相应残基。因此,本领域技术人员将能够在任何天然-存在的胞苷脱氨酶中生成与本文所述的任何突变相对应的突变。在一些实施方式中,该胞苷脱氨酶来自原核生物。在一些实施方式中,该胞苷脱氨酶来自细菌。在一些实施方式中,该胞苷脱氨酶来自哺乳动物(例如人类)。[0367]在一些实施方式中,该胞苷脱氨酶包括的氨基酸序列,与本文所列出的任一胞苷脱氨酶氨基酸序列,是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。应当理解,本文所提供的胞苷脱氨酶可包含一个或多个突变(例如,本文所提供的任何突变)。本公开揭露所提供的任何脱氨酶结构域,均具有一定百分比的同一性,再加上本文所述的任何突变或其组合。在一些实施方式中,该胞苷脱氨酶包括的氨基酸序列,与参考序列或本文所提供的任何胞苷脱氨酶相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方式中,该胞苷脱氨酶包括的氨基酸序列,与本领域已知或本文所述的任一氨基酸序列相比,具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的接连的氨基酸残基。[0368]本发明的融合蛋白包括核酸编辑结构域。在一些实施方式中,该核酸编辑结构域可以催化c变u的碱基变化。在一些实施方式中,该核酸编辑结构域是脱氨酶结构域。在一些实施方式中,该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方式中,该脱氨酶是载脂蛋白bmrna-编辑复合体(apobec)家族脱氨酶。在一些实施方式中,该脱氨酶是apobecl脱氨酶。在一些实施方式中,该脱氨酶是apobec2脱氨酶。在一些实施方式中,该脱氨酶是apobec3脱氨酶。在一些实施方式中,该脱氨酶是apobec3a脱氨酶。在一些实施方式中,该脱氨酶是apobec3b脱氨酶。在一些实施方式中,该脱氨酶是apobec3c脱氨酶。在一些实施方式中,该脱氨酶是apobec3d脱氨酶。在一些实施方式中,该脱氨酶是apobec3e脱氨酶。在一些实施方式中,该脱氨酶是apobec3f脱氨酶。在一些实施方式中,该脱氨酶是apobec3g脱氨酶。在一些实施方式中,该脱氨酶是apobec3h脱氨酶。在一些实施方式中,该脱氨酶是apobec4脱氨酶。在一些实施方式中,该脱氨酶是活化-诱导的脱氨酶(aid)。在一些实施方式中,该脱氨酶是脊椎动物脱氨酶。在一些实施方式中,该脱氨酶是无脊椎动物脱氨酶。在一些实施方式中,该脱氨酶是人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方式中,该脱氨酶是人类脱氨酶。在一些实施方式中,该脱氨酶是大鼠脱氨酶,例如rapobecl。在一些实施方式中,该脱氨酶是海七鳃鳗胞苷脱氨酶1(pmcdal)。在一些实施方式中,该脱氨酶是人类apobec3g。在一些实施方式中,该脱氨酶是人类apobec3g的片段。在一些实施方式中,该脱氨酶是包括d316rd317r突变的人类apobec3g变体。在一些实施方式中,该脱氨酶是人类apobec3g的片段并且包括对应于所述d316rd317r突变的突变。在一些实施方式中,该核酸编辑结构域,与本文所述任何脱氨酶的脱氨酶结构域,是至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。[0369]在某些实施方式中,本文所提供的融合蛋白包括一个或多个改善该融合蛋白的碱基编辑活性的特性。例如,本文所提供的任何融合蛋白可能包括具有减低的核酸酶活性的cas9结构域。在一些实施方式中,本文所提供的任何融合蛋白可能具有无核酸酶活性的cas9结构域(dcas9),或切割双股螺旋dna分子其中一股的cas9结构域(称为cas9切口酶(ncas9))。[0370]核碱基编辑器的cas9结构域[0371]在某些方面,核酸可编程的dna结合蛋白(napdnabp)是cas9结构域。本文提供了非限制性的示例性cas9结构域。该cas9结构域可能是核酸酶活性cas9结构域、核酸酶无活性的cas9结构域(dcas9)或cas9切口酶(ncas9)。在一些实施方式中,该cas9结构域是核酸酶活性结构域。例如,该cas9结构域可能是切割双股螺旋核酸(例如,双股螺旋dna分子的两股)的两股的cas9结构域。在一些实施方式中,该cas9结构域包括本文所列出的任一氨基酸序列。在一些实施方式中,该cas9结构域包括的氨基酸序列,与本文所列出的任一氨基酸序列相比,为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方式中,该cas9结构域包括的氨基酸序列,与本文所列出的任一氨基酸序列相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方式中,该cas9结构域包括的氨基酸序列,与本文所列出的任一氨基酸序列相比,具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的接连的氨基酸残基。[0372]在一些实施方式中,该cas9结构域是核酸酶-无活性的cas9结构域(dcas9)。例如,该dcas9结构域可结合到双股螺旋核酸分子上(例如,经由grna分子),而不切开该双股螺旋核酸分子的任一股。在一些实施方式中,该核酸酶-无活性的dcas9结构域包括本文所列出的氨基酸序列的d10x突变和h840x突变,或本文所提供的任何氨基酸序列中的相应突变,其中x为任何氨基酸变化。在一些实施方式中,该核酸酶-无活性的dcas9结构域包括本文所列出的氨基酸序列的d10a突变和h840a突变,或本文所提供的任何氨基酸序列中的相应突变。作为一个实例,核酸酶-无活性的cas9结构域包括克隆载体pplattet-grna2(登录号bav54124)中所列出的氨基酸序列。[0373]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd(参见例如,qi等,“将crispr再利用为以供基因表达的序列-特异性控制的rna-导向的平台”cell.2013;152(5):1173-83,其全部内容通过引用并入本文)。[0374]基于本公开揭露和本领域的知识,额外的适合的核酸酶-无活性的dcas9结构域对本领域技术人员而言将是显而易见的,并且在本公开揭露的范围内。此类额外的示例性的适合的核酸酶-无活性的cas9结构域包含但不限于,d10a/h840a,d10a/d839a/h840a,以及d10a/d839a/h840a/n863a突变结构域(参见例如,prashant等,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.,naturebiotechnology.2013;31(9):833-838,其全部内容通过引用并入本文)。在一些实施方式中,该dcas9结构域包括的氨基酸序列,与本文所提供的任一dcas9结构域相比,是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方式中,该cas9结构域包括的氨基酸序列,与本文所列出的任一氨基酸序列相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方式中,该cas9结构域包括的氨基酸序列,与本文所列出的任一氨基酸序列相比,具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的接连的氨基酸残基。[0375]在一些实施方式中,该cas9结构域是cas9切口酶。该cas9切口酶可能是cas9蛋白,其能够仅切割双股螺旋核酸分子(例如,双股螺旋dna分子)的一股。在一些实施方式中,该cas9切口酶切开双股螺旋核酸分子的靶标股,这意味着该cas9切口酶切开了与grna(例如sgrna)碱基配对(与其互补)的那一股,而所述grna是与该cas9结合的。在一些实施方式中,cas9切口酶包括d10a突变,并在840位置处具有组氨酸。在一些实施方式中,该cas9切口酶切开双股螺旋核酸分子的非-靶标、非-碱基-被编辑的那一股,这意味着该cas9切口酶切开了未与grna(例如sgrna)碱基配对的那一股,而该grna是与cas9结合的。在一些实施方式中,cas9切口酶包括h840a突变并在位置10处具有天冬氨酸残基,或相应的突变。在一些实施方式中,该cas9切口酶包括的氨基酸序列,与本文所提供的任一cas9切口酶相比,为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。基于本公开揭露和本领域的知识,额外的适合的cas9切口酶对本领域技术人员而言将是显而易见的,并且在本公开揭露的范围内。[0376]pam排他性减低的cas9结构域[0377]通常,cas9蛋白,诸如来自化脓性链球菌的cas9(spcas9),需要正准的nggpam序列以结合特定的核酸区域,其中“ngg”中的“n”是腺苷(a),胸苷(t),或胞嘧啶(c),而所述g为鸟苷。这可能会限制在基因组中编辑目的碱基的能力。在一些实施方式中,可能需要将本文所提供的碱基编辑融合蛋白放置在精确的区位,例如包括pam上游的靶碱基的区域。参见例如,komor,a.c.等,“无双-股dna切开的基因组dna中的靶碱基的可编程的编辑”nature533,420-424(2016),其全部内容在此通过引用并入。因此,在一些实施方式中,本文所提供的任何融合蛋白都可能含有cas9结构域,该cas9结构域能够结合不含有正准的(例如ngg)pam序列的核苷酸序列。结合非-正准pam序列的cas9结构域已经在本领域中描述,并且对本领域熟练技术人员而言是显而易见的。例如,结合非-正准pam序列的cas9结构域已在如下文献中描述:kleinstiver,b.p.等,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);以及kleinstiver,b.p.等,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015);其每个的全部内容在此通过引用并入。如下的表1中描述了几种pam变体:[0378]表1.cas9蛋白和相应的pam序列[0379][0380][0381]在一些实施方式中,该cas9结构域是来自金黄色葡萄球菌的cas9结构域(sacas9)。在一些实施方式中,该sacas9结构域是核酸酶活性的sacas9,核酸酶无活性的sacas9(sacas9d),或sacas9切口酶(sacas9n)。在一些实施方式中,该sacas9包括n579a突变,或本文所提供的任一氨基酸序列中的相应突变。[0382]在一些实施方式中,该sacas9结构域,该sacas9d结构域,或该sacas9n结构域可以结合具有非-正准pam的核酸序列。在一些实施方式中,该sacas9结构域、该sacas9d结构域或该sacas9n结构域可以结合具有nngrrtpam序列的核酸序列。在一些实施方式中,该sacas9结构域包括e781x、n967x和r1014x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该sacas9结构域包括e781k,n967k和r1014h突变中的一个或多个,或者本文所提供的任何氨基酸序列中的一个或多个相应突变。在一些实施方式中,该sacas9结构域包括e781k,n967k或r1014h突变,或本文所提供的任何氨基酸序列中的相应突变。[0383]示例性的sacas9序列[0384][0385][0386]上方的残基n579,其带有底线和以粗体显示,可对其突变(例如,变为a579)以产生sacas9切口酶。[0387]示例性的sacas9n序列[0388][0389][0390]上方的残基a579,其可以由n579突变而来以产生sacas9切口酶,带有底线和以粗体显示。[0391]示例性的sakkhcas9[0392][0393]上方的残基a579,其可以由n579突变而来以产生sacas9切口酶,带有底线和以粗体显示。上方的残基k781,k967,和h1014,其可以由e781,n967,和r1014突变而来以产生sakkhcas9,带有底线和以斜体显示。[0394]在一些实施方式中,该cas9结构域是化脓性链球菌的cas9结构域(spcas9)。在一些实施方式中,该spcas9结构域是核酸酶活性的spcas9,核酸酶无活性的spcas9(spcas9d),或spcas9切口酶(spcas9n)。在一些实施方式中,该spcas9包括d9x突变,或本文所提供的任何氨基酸序列中的相应突变,其中x是除了d以外的任何氨基酸。在一些实施方式中,该spcas9包括d9a突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域、该spcas9d结构域或该spcas9n结构域可以结合具有非-正准pam的核酸序列。在一些实施方式中,该spcas9结构域、该spcas9d结构域或spcas9n结构域可以结合具有ngg、nga或ngcgpam序列的核酸序列结构域。在一些实施方式中,该spcas9结构域包括d1134x、r1334x和t1336x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括d1134e、r1334q和t1336r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1134e,r1334q和t1336r突变,或本文所提供的任何氨基酸序列中的相应的复数个突变。在一些实施方式中,该spcas9结构域包括d1134x,r1334x和t1336x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括d1134v、r1334q和t1336r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1134v、r1334q和t1336r突变,或本文所提供的任何氨基酸序列中的相应的复数个突变。在一些实施方式中,该spcas9结构域包括d1134x、g1217x、r1334x和t1336x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括d1134v、g1217r、r1334q和t1336r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1134v、g1217r、r1334q和t1336r突变,或本文所提供的任何氨基酸序列中的相应的复数个突变。[0395]在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域包括的氨基酸序列,与本文所述的cas9多肽相比,是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域包括本文所述的任何cas9多肽的氨基酸序列。在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域由本文所述的任何cas9多肽的氨基酸序列组成。[0396]示例性的spcas9[0397]dkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0398]示例性的spcas9n[0399]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0400]示例性的speqrcas9[0401][0402][0403]上述的残基e1134,q1334,和r1336,其可以由d1134、r1334和t1336突变而来以产生speqrcas9,带有底线和以粗体显示。[0404]示例性的spvqrcas9[0405][0406][0407]上述的残基v1134,q1334,和r1336,其可以由d1134,r1334,和t1336突变而来以产生spvqrcas9,带有底线和以粗体显示。[0408]示例性的spvrercas9[0409][0410][0411]上述的残基v1134,r1217,e1334,和r1336,其可以由d1134,g1217,r1334,和t1336突变而来以产生spvrercas9,带有底线和以粗体显示。[0412]该cas9核酸酶具有两个功能性核酸内切酶结构域:ruvc和hnh。一经与靶标结合,cas9经历构象变化,其使核酸酶结构域就定位以切开靶dna的相对股。cas9-介导的dna切开的最终结果是靶dna内(pam序列上游约3-4个核苷酸)的双股断裂(dsb)。然后通过两种一般修复途径之一修复所得的dsb:(1)有效率但容易出错的非同源末端连接(nhej)途径;或(2)效率较低但高保真的同源定向修复(hdr)途径。[0413]非同源末端连接(nhej)和/或同源定向修复(hdr)的“效率”可以通过任何方便的方法来计算。例如,在某些情况下,效率可以用成功的hdr的百分比来表示。例如,surveyor核酸酶测定法可用于生成切开产物,而产物与底物的比率可用于计算该百分比。例如,surveyor核酸酶可用于直接切开含有新整合的限制性内切酶识别序列(作为成功的hdr的成果)的dna。被切开的底物越多,表示hdr百分比越高(hdr的效率越高)。作为说明性的例子,可以使用以下等式[(切开产物)/(底物加上切开产物)]计算hdr的份额(百分比)(例如,(b+c)/(a+b+c),其中“a”是dna底物的条带强度,而“b”和“c”是切开产物)。[0414]在某些情况下,效率可以用成功的nhej的百分比来表示。例如,t7核酸内切酶i测定法可用于生成切开产物,而产物与底物的比率可用于计算nhej的百分比。t7核酸内切酶i切开错配的异源双股螺旋dna,其发生于野生和突变dna股的杂交(nhej在原始断裂位点生成小的随机插入或缺失(插入/缺失))。切开越多,表示nhej的百分比越高(nhej的效率越高)。作为说明性的例子,可以使用以下等式计算nhej的份额(百分比):(1-(1-(b+c)/(a+b+c))1/2)×100,其中“a”是dna底物的条带强度,而“b”和“c”是切开产物(ran等,cell.2013sep.12;154(6):1380-9;以及ran等,natprotoc.2013nov.;8(11):2281–2308)。[0415]所述nhej修复途径是最活跃的修复机制,而它经常在dsb位点引起小的核苷酸插入或缺失(插入/缺失)。nhej-介导的dsb修复的随机性具有重要的实际意义,因为表达cas9及grna或向导多核苷酸的细胞群体会导致多种多样的突变。在大多数情况下,nhej在dna中引起小的插入/缺失,其导致氨基酸的缺失、插入或移码突变,而这些突变导致被靶向的基因的开放阅读框(orf)内的提前的终止密码子。理想的最终结果是被靶向的基因内的丧失-功能型突变。[0416]nhej-介导的dsb修复经常中断基因的开放阅读框,而同源定向修复(hdr)可用于生成特定的核苷酸变化,其范围从单核苷酸的变化到大的插入,如添加荧光团或标签。[0417]为了将hdr用于基因编辑,可以将含有目标序列的dna修复模板与(单个或多个)grna和cas9或cas9切口酶一起递送到感兴趣的细胞类型中。该修复模板可以含有所期望的编排,以及紧接靶标的上游和下游的额外的同源序列(称为左&右同源臂)。每个同源臂的长度可以取决于将被引入的变化的大小,其中较大的插入需要更长的同源臂。该修复模板可以是单-股寡核苷酸,双-股寡核苷酸或双-股dna质粒。即使在表达cas9、grna和外源性修复模板的细胞中,hdr的效率通常也是低的(被修饰的等位基因《10%)。由于hdr发生在细胞周期的s和g2阶段,因此可以通过对细胞进行同步化来提高hdr的效率。化学性或遗传性地抑制涉及nhej的基因也可以增加hdr频率。[0418]在一些实施方式中,cas9是经修饰的cas9。给定的grna靶向序列可以在整个基因组中具有存在部分同源性的额外的位点。这些位点称为脱靶位点,并在设计grna时需要被考虑进去。除了优化grna设计外,还可以通过对cas9进行修饰来提高crispr特异性。cas9通过两个核酸酶结构域ruvc和hnh的合并的活性以生成双-股断裂(dsb)。cas9切口酶,spcas9的d10a突变,保留了一个核酸酶结构域并生成dna切口而非dsb。该切口酶系统也可以与hdr-介导的基因编辑合并以供特定的基因编排。[0419]在一些情况下,cas9是变体cas9蛋白。当与野生型cas9蛋白的氨基酸序列相比时,变体cas9多肽具有的氨基酸序列有一个氨基酸的不同(例如,具有缺失、插入、替换、融合)。在一些实例中,该变体cas9多肽具有减低该cas9多肽的核酸酶活性的氨基酸变化(例如,缺失、插入或替换)。例如,在一些实例中,该变体cas9多肽,具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的相应的野生型cas9蛋白的核酸酶活性。在一些情况下,该变体cas9蛋白没有实质上的核酸酶活性。当一受试cas9蛋白是不具有实质上的核酸酶活性的变体cas9蛋白时,其可以被称为“dcas9”。[0420]在一些情况下,变体cas9蛋白具有减低的核酸酶活性。例如,变体cas9蛋白展现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的野生型cas9蛋白(例如野生型cas9蛋白)的核酸内切酶活性。[0421]在一些情况下,变体cas9蛋白可以切开向导靶序列的互补股,但是其切开双股向导靶序列的非-互补股的能力是减低的。例如,该变体cas9蛋白可能具有减低ruvc结构域功能的突变(氨基酸替换)。作为非限制性的例子,在一些实施方式中,cas9变体蛋白具有d10a(在氨基酸位置10的天冬氨酸变为丙氨酸)突变,并因此可以切开双股向导靶序列的互补股,但是其切开双股向导靶序列的非-互补股的能力是减低的(因此,当该变体cas9蛋白切开双股靶核酸时,会得到单股断裂(ssb)而不是双股断裂(dsb))(参见例如jinek等,science.2012aug.17;337(6096):816-21)。[0422]在一些情况下,变体cas9蛋白可以切开双股向导靶序列的非-互补股,但是其切开向导靶序列的互补股的能力是减低的。例如,该变体cas9蛋白可能具有减低hnh结构域(ruvc/hnh/ruvc结构域基序)功能的突变(氨基酸替换)。作为非限制性的例子,在一些实施方式中,该变体cas9蛋白具有h840a(在氨基酸位置840处的组氨酸变为丙氨酸)突变,并因此可以切开向导靶序列的非-互补股,但是其切开向导靶序列的互补股的能力是减低的(因此,当该变体cas9蛋白切开双股靶核酸时,会得到ssb而不是dsb)。此种cas9蛋白切开向导靶序列(例如,单股向导靶序列)的能力是减低的,但是保留了结合向导靶序列(例如,单股向导靶序列)的能力。[0423]在一些情况下,变体cas9蛋白切开双股靶dna的互补股和非-互补股的能力均减低。作为非限制性的例子,在一些实施方式中,该变体cas9蛋白带有d10a和h840a两个突变,使得该多肽切开双股靶dna的互补股和非-互补股的能力均减低。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。[0424]作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有w476a和w1126a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。[0425]作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有p475a,w476a,n477a,d1125a,w1126a,和d1127a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。[0426]作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有h840a,w476a,和w1126a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有h840a,d10a,w476a,和w1126a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。在一些实施方式中,该变体cas9已在cas9hnh结构域的位置840处复原了催化性的his残基(a840h)。[0427]作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有h840a,p475a,w476a,n477a,d1125a,w1126a,和d1127a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有d10a,h840a,p475a,w476a,n477a,d1125a,w1126a,和d1127a突变,使得该多肽切开靶dna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。在一些情况下,当变体cas9蛋白带有w476a和w1126a两个突变时,或当该变体cas9蛋白带有p475a,w476a,n477a,d1125a,w1126a,和d1127a突变时,该变体cas9蛋白不能有效地结合到pam序列上。因此,在一些此类情况下,当在结合的方法中使用此种变体cas9蛋白时,该方法不需要pam序列。换句话说,在一些情况下,当在结合的方法中使用此种变体cas9蛋白时,该方法可以包含向导rna,但该方法可以在不存在pam序列的情况下执行(而结合的特异性因此是由向导rna的靶向节段所提供)。可以使其他残基突变以获得上述效果(即,灭活一个或另外一个核酸酶部分)。作为非限制性的例子,残基d10,g12,g17,e762,h840,n854,n863,h982,h983,a984,d986,和/或a987可以被改变(即,被替换)。同样地,除丙氨酸替换以外的突变也是适合的。[0428]在一些实施方式中,具有减低的催化活性的变体cas9蛋白(例如,当cas9蛋白具有d10,g12,g17,e762,h840,n854,n863,h982,h983,a984,d986,和/或a987突变时,例如d10a,g12a,g17a,e762a,h840a,n854a,n863a,h982a,h983a,a984a,和/或d986a),只要它保留与向导rna相互作用的能力,该变体cas9蛋白仍能以位点-特异性的方式与靶dna结合(因为它仍可通过向导rna被导向至靶dna序列)。[0429]在一些实施方式中,该变体cas蛋白可以是spcas9,spcas9-vrqr,spcas9-vrer,xcas9(sp),sacas9,sacas9-kkh,spcas9-mqkser,spcas9-lrkiqk,或spcas9-lrvsql。[0430]化脓性链球菌cas9的替代物可以包含来自cpf1家族的rna-导向的核酸内切酶,其在哺乳动物细胞中显示出切开活性。来自普雷沃氏菌(prevotella)和弗朗西斯菌1(francisella1)(crispr/cpf1)的crispr是一种类似于crispr/cas9系统的dna-编辑技术。cpf1是ii类crispr/cas系统的rna-导向的核酸内切酶。在普雷沃氏菌和弗朗西斯菌细菌中发现了这种获得性免疫机制。cpf1基因与crispr基因座相联,并编码一种核酸内切酶,该核酸内切酶使用向导rna找到并切开病毒dna。cpf1是一种比cas9小且简单的核酸内切酶,克服了crispr/cas9系统的一些局限性。与cas9核酸酶不同,cpf1-介导的dna切开的结果是带有短3'悬垂的双股断裂。cpf1的参差的切开模式开辟了定向基因移转(类似于传统的限制性内切酶克隆)的可能性,而定向基因移转可以提高基因编辑的效率。[0431]像上述的cas9变体和异种同源物一样,cpf1也可以将可被crispr靶向的位点(数目)扩展到缺乏spcas9所偏好的nggpam位点的at-富集区域或at-富集基因组。该cpf1基因座含有混合的α/β结构域,ruvc-i,其后为螺旋区域、ruvc-ii和锌指-样结构域。该cpf1蛋白具有ruvc-样核酸内切酶结构域,其与cas9的ruvc结构域相似。此外,cpf1不具有hnh核酸内切酶结构域,并且cpf1的n末端不具有cas9的α-螺旋识别叶。cpf1crispr-cas结构域的结构显示出cpf1有独特的功能,其被归类为2类v型crispr系统。该cpf1基因座编码的cas1,cas2和cas4蛋白与ii型系统相比更类似于i型和iii型。功能性的cpf1不需要反式-激活crisprrna(tracrrna),因此只需要crispr(crrna)。这有利于基因组编辑,不仅因为cpf1比cas9小,而且其具有较小的sgrna分子(约是cas9核苷酸数的一半)。与cas9所靶向的g-富集的pam相反,该cpf1-crrna复合体通过识别原间隔序列临近基序5'-ytn-3'而切开靶dna或rna。在识别pam之后,cpf1引入一个粘性-末端-样的dna双-股断裂,其具有4或5个核苷酸的悬垂。[0432]包括两个napdnabp和一个脱氨酶结构域的融合蛋白[0433]本公开揭露的一些方面提供了融合蛋白,其包括具有切口酶活性的napdnabp结构域(例如,ncas结构域)和催化无活性的napdnabp(例如,dcas结构域)以及核碱基编辑器(例如,腺苷脱氨酶结构域、胞苷脱氨酶结构域),其中至少所述两个napdnabp结构域是通过一个连接子连接的。应当理解,该cas结构域可能是本文所提供的任何cas结构域或cas蛋白(例如,dcas9和ncas9)。在一些实施方式中,任何cas结构域、dna结合蛋白结构域或cas蛋白包含但不限于cas9(例如,dcas9和ncas9)、cas12a/cpf1、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。具有与cas9不同的pam特异性的可编程的多核苷酸-结合蛋白的一个例子是来自普雷沃氏菌和弗朗西斯菌的规律成簇间隔短回文重复序列(cpf1)。与cas9类似,cpf1也是2类crispr效应器。例如,但不限于,在一些实施方式中,该融合蛋白包括以下结构,其中脱氨酶是腺苷脱氨酶或胞苷脱氨酶:[0434]nh2-[脱氨酶]-[ncas结构域]-[dcas结构域]-cooh;[0435]nh2-[脱氨酶]-[dcas结构域]-[ncas结构域]-cooh;[0436]nh2-[ncas结构域]-[dcas结构域]-[脱氨酶]-cooh;[0437]nh2-[dcas结构域]-[ncas结构域]-[脱氨酶]-cooh;[0438]nh2-[ncas结构域]-[脱氨酶]-[dcas结构域]-cooh;[0439]nh2-[dcas结构域]-[脱氨酶]-[ncas结构域]-cooh;[0440]在一些实施方式中,上述通用架构中使用的“‑”表示可选的连接子的存在。在一些实施方式中,脱氨酶和napdnabp(例如,cas结构域)不通过连接子序列连接,而是直接融合。在一些实施方式中,连接子存在于脱氨酶结构域和napdnabp之间。在一些实施方式中,脱氨酶或其他核碱基编辑器直接融合到dcas上并且连接子连接dcas和ncas9。在一些实施方式中,脱氨酶和napdnabp是经由本文所提供的任何连接子融合。例如,在一些实施方式中,脱氨酶和napdnabp是经由下文标题为“连接子”的部分中所提供的任何连接子融合。在一些实施方式中,dcas结构域和脱氨酶紧邻并且ncas结构域是经由连接子而连接到这些结构域上(5’或3’)。[0441]具有内部插入的融合蛋白[0442]本公开揭露提供了融合蛋白,其包括与核酸可编程的核酸结合蛋白(例如napdnabp)融合的异源性多肽。异源性多肽可以是在原生或野生型napdnabp多肽序列中未发现的多肽。该异源性多肽可以在napdnabp的c末端、n末端与napdnabp融合,或插入到napdnabp的一内部区位。在一些实施方式中,该异源性多肽插入到napdnabp的一内部区位。[0443]在一些实施方式中,该异源性多肽是脱氨酶或其功能性片段。例如,融合蛋白可以包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶。该融合蛋白中的脱氨酶可以是胞苷脱氨酶。该融合蛋白中的脱氨酶可以是腺苷脱氨酶。[0444]该脱氨酶可以是环状变换排列体脱氨酶。例如,该脱氨酶可以是环状变换排列体腺苷脱氨酶或环状变换排列体胞苷脱氨酶。在一些实施方式中,该脱氨酶是环状变换排列体tada,其环状重排是位于氨基酸残基116(如tada参考序列中所编号的)。在一些实施方式中,该脱氨酶是环状变换排列体tada,其环状重排是位于氨基酸残基136(如tada参考序列中所编号的)。在一些实施方式中,该脱氨酶是环状变换排列体tada,其环状重排是位于氨基酸残基65(如tada参考序列中所编号的)。[0445]该融合蛋白可以包括多于一个脱氨酶。该融合蛋白可以包括,例如,1、2、3、4、5或更多个脱氨酶。在一些实施方式中,该融合蛋白包括一个脱氨酶。在一些实施方式中,该融合蛋白包括两个脱氨酶。融合蛋白中的两个或更多个脱氨酶可以是腺苷脱氨酶、胞苷脱氨酶或其组合。该两个或更多个脱氨酶可以是同二聚体。该两个或更多个脱氨酶可以是异二聚体。该两个或更多个脱氨酶可以串联插入到napdnabp中。在一些实施方式中,该两个或更多个脱氨酶在napdnabp中可能不是串联的。[0446]在一些实施方式中,该融合蛋白中的napdnabp是cas9多肽或其片段。该cas9多肽可以是变体cas9多肽。在一些实施方式中,该cas9多肽是cas9切口酶(ncas9)多肽或其片段。在一些实施方式中,该cas9多肽是核酸酶无活性的cas9(dcas9)多肽或其片段。该融合蛋白中的cas9多肽可以是全长cas9多肽。在一些情况下,该融合蛋白中的cas9多肽可能不是全长cas9多肽。相对于天然存在的cas9蛋白,该cas9多肽可以是被截短的,例如在n末端或c末端。该cas9多肽可以是经环状重排的cas9蛋白。[0447]该cas9多肽可以是cas9多肽的片段、部分或结构域,其仍然能够结合靶多核苷酸和向导核酸序列。[0448]在一些实施方式中,该cas9多肽是化脓性链球菌cas9(spcas9),金黄色葡萄球菌cas9(sacas9),嗜热链球菌1cas9(st1cas9),或其片段或变体。[0449]融合蛋白的cas9多肽可以包括的氨基酸序列,与天然存在的cas9多肽相比,是至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。[0450]融合蛋白的cas9多肽可以包括的氨基酸序列,与seqidno:1中所列出的cas9氨基酸序列相比,是至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。[0451]所述异源性多肽(例如,脱氨酶)可以在适合的区位插入到napdnabp(例如,cas9)中,使得该napdnabp保留了其结合靶多核苷酸和向导核酸的能力。脱氨酶可以插入到napdnabp中,而不损害该脱氨酶(例如,碱基编辑活性)或该napdnabp(例如,结合靶核酸和向导核酸的能力)的功能。脱氨酶可以在例如无序区域或包括高温因子或b-因子的区域处(如晶体学研究所示)插入到napdnabp中。较不有序、无序或非结构性的蛋白质区域,例如溶剂曝露区域和环,可以用于插入而不损害结构或功能。脱氨酶可以插入到napdnabp的柔性环区域或溶剂-曝露区域中。在一些实施方式中,该脱氨酶插入到cas9多肽的柔性环区域中。[0452]在一些实施方式中,脱氨酶的插入区位是通过cas9多肽的晶体结构的b-因子分析来确定的。在一些实施方式中,该脱氨酶插入到包括高于平均b-因子的cas9多肽区域中(例如,与包括所述无序区域的总蛋白质或蛋白质结构域相比,更高的b-因子)。b因子或温度因子可以表示原子发自其平均位置的波动(例如,由于温度-依赖的原子振动或晶格中的静态无序)。主干原子的高b-因子(例如,高于平均b-因子)可以表示具有相对较高局部移动性的区域。此种区域可用于插入脱氨酶而不损害结构或功能。脱氨酶可以插入到具有cα原子的残基的区位中,其b-因子与总蛋白质的平均b-因子相比高出50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或大于200%。脱氨酶可以插入到具有cα原子的残基的区位中,其b-因子与包括该残基的cas9蛋白结构域的平均b-因子相比高出50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或大于200%。包括高于平均b-因子的cas9多肽位置可以包含,例如,残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247和1248(如seqidno:1中所编号的)。包括高于平均b-因子的cas9多肽区域可以包含,例如,残基792-872、792-906和2-791(如seqidno:1中所编号的)。[0453]异源性多肽(例如,脱氨酶)可以插入到napdnabp中的选自于由以下所组成的群组的氨基酸残基处:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该异源性多肽插入到以下氨基酸位置之间:768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248或1248-1249(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该异源性多肽插入到以下氨基酸位置之间:769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249,或1249-1250(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该异源性多肽替换了选自于由以下所组成的群组的氨基酸残基:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。应当理解,关于插入位置而对seqidno:1的参照是为了说明的目的。如本文所讨论的插入不限于seqidno:1的cas9多肽序列,而是包含在变体cas9多肽(例如cas9切口酶(ncas9)、核酸酶无活性的cas9(dcas9)、缺少核酸酶结构域的cas9变体、截短的cas9或缺少部分或全部hnh结构域的cas9结构域)中相应区位的插入。[0454]异源性多肽(例如,脱氨酶)可以插入到napdnabp中的选自于由以下所组成的群组的氨基酸残基处:768、792、1022、1026、1040、1068和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该异源性多肽插入到以下氨基酸位置之间:768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069或1247-1248(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该异源性多肽插入到以下氨基酸位置之间:769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070或1248-1249(如seqidno:1中所编号的)抑或其相应的氨基酸位置。在一些实施方式中,该异源性多肽替换了选自于由以下所组成的群组的氨基酸残基:768、792、1022、1026、1040、1068和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0455]异源性多肽(例如,脱氨酶)可以插入到napdnabp中的图4,图5,图6,或图7中所示的氨基酸残基处,抑或另一个cas9多肽中相应的氨基酸残基。异源性多肽(例如,脱氨酶)可以插入到napdnabp中的选自于由以下所组成的群组的氨基酸残基处:1002、1003、1025、1052-1056、1242-1247、1061-1077、943-947、686-691、569-578、530-539和1060-1077(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。该脱氨酶可以插入到该残基的n端或c端,抑或取代该残基。在一些实施方式中,该脱氨酶插入到该残基的c端。[0456]在一些实施方式中,abe(例如,tada)插入到选自于由以下所组成的群组的氨基酸处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,abe(例如,tada)插入以替代了残基792-872、792-906或2-791(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到选自于由以下所组成的群组的氨基酸的n端处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到选自于由以下所组成的群组的氨基酸的c端处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代了选自于由以下所组成的群组的氨基酸:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0457]在一些实施方式中,cbe(例如,apobec1)插入到选自于由以下所组成的群组的氨基酸处:1016、1023、1029、1040、1069和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到选自于由以下所组成的群组的氨基酸的n端处:1016、1023、1029、1040、1069和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到选自于由以下所组成的群组的氨基酸的c端处:1016、1023、1029、1040、1069和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代了选自于由以下所组成的群组的氨基酸:1016、1023、1029、1040、1069和1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0458]在一些实施方式中,该脱氨酶插入到氨基酸残基768处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸768的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸768的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸768(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0459]在一些实施方式中,该脱氨酶插入到氨基酸残基791处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸791的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸791的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸791(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0460]在一些实施方式中,该脱氨酶插入到氨基酸残基792处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸792的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸792的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸792(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0461]在一些实施方式中,该脱氨酶插入到氨基酸残基1016处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1016的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1016的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1016(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0462]在一些实施方式中,该脱氨酶插入到氨基酸残基1022处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1022的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1022的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1022(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0463]在一些实施方式中,该脱氨酶插入到氨基酸残基1023处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1023的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1023的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1023(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0464]在一些实施方式中,该脱氨酶插入到氨基酸残基1026处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1026的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1026的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1026(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0465]在一些实施方式中,该脱氨酶插入到氨基酸残基1029处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1029的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1029的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1029(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0466]在一些实施方式中,该脱氨酶插入到氨基酸残基1040处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1040的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1040的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1040(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0467]在一些实施方式中,该脱氨酶插入到氨基酸残基1052处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1052的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1052的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1052(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0468]在一些实施方式中,该脱氨酶插入到氨基酸残基1054处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1054的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1054的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1054(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0469]在一些实施方式中,该脱氨酶插入到氨基酸残基1067处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1067的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1067的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1067(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0470]在一些实施方式中,该脱氨酶插入到氨基酸残基1068处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1068的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1068的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1068(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0471]在一些实施方式中,该脱氨酶插入到氨基酸残基1069处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1069的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1069的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1069(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0472]在一些实施方式中,该脱氨酶插入到氨基酸残基1246处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1246的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1246的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1246(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0473]在一些实施方式中,该脱氨酶插入到氨基酸残基1247处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1247的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1247的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1247(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0474]在一些实施方式中,该脱氨酶插入到氨基酸残基1248处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1248的n端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入到氨基酸1248的c端处(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施方式中,该abe插入以替代氨基酸1248(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0475]在一些实施方式中,异源性多肽(例如,脱氨酶)插入到cas9多肽的柔性环中。该柔性环部分可以选自于由以下所组成的群组:530-537、569-570、686-691、943-947、1002-1025、1052-1077、1232-1247或1298-1300(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。该柔性环部分可以选自于由以下所组成的群组:1-529、538-568、580-685、692-942、948-1001、1026-1051、1078-1231或1248-1297(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0476]异源性多肽(例如,脱氨酶)可以插入到对应于如下氨基酸残基的cas9多肽区域中:1017-1069、1242-1247、1052-1056、1060-1077、1002–1003、943-947、530-537、568-579、686-691,1242-1247、1298–1300、1066-1077、1052-1056或1060-1077(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。[0477]异源性多肽(例如,脱氨酶)可以插入以替换cas9多肽的缺失区域。该缺失区域可以对应于cas9多肽的n末端或c末端部分。在一些实施方式中,该缺失区域对应于残基792-872(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。在一些实施400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。所述n末端cas9片段可以包括的序列,相对于氨基酸残基1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100(如seqidno:1中所编号的)抑或另一个cas9多肽中相应的氨基酸残基,包括至少:85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。[0484]所述融合蛋白的c末端cas9片段(即,在融合蛋白中位于脱氨酶侧翼的c末端cas9片段)可以包括cas9多肽的c端。所述融合蛋白的c末端cas9片段可以包括长度为至少约:100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸。所述融合蛋白的c末端cas9片段可以包括对应于以下氨基酸残基的序列:1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368(如seqidno:1中所编号的),抑或另一个cas9多肽中相应的氨基酸残基。所述c末端cas9片段可以包括的序列,相对于氨基酸残基1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368(如seqidno:1中所编号的)抑或另一个cas9多肽中相应的氨基酸残基,包括:至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。[0485]所述融合蛋白的n末端cas9片段和c末端cas9片段合在一起可能并不对应于全长的天然存在的cas9多肽序列,例如,如seqidno:1中所列出的。[0486]本文所述的融合蛋白可以凭藉在非靶位点(例如,脱靶的位点)处的减低的脱氨反应而实现靶向的脱氨反应,诸如减低的基因组范围的假性脱氨反应。本文所述的融合蛋白可以凭藉在非靶位点处的减低的旁观者脱氨反应而实现靶向的脱氨反应。所述不需要的脱氨反应或脱靶脱氨反应可以被减低的程度,与例如末端融合蛋白(其包括与cas9多肽的n端或c端融合的脱氨酶)相比,为至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。所述不需要的脱氨反应或脱靶脱氨反应可以被减低的程度,与例如末端融合蛋白(其包括与cas9多肽的n端或c端融合的脱氨酶)相比,为至少一倍、至少二倍、至少三倍、至少四倍、至少五倍、至少十倍、至少十五倍、至少二十倍、至少三十倍、至少四十倍、至少五十倍、至少六十倍、至少七十倍、至少八十倍、至少九十倍或至少一百倍。[0487]在一些实施方式中,该融合蛋白的脱氨酶在r-环范围内使不超过两个的核碱基脱氨基。在一些实施方式中,该融合蛋白的脱氨酶在r-环范围内使不超过三个的核碱基脱氨基。在一些实施方式中,该融合蛋白的脱氨酶在r-环范围内使不超过2、3、4、5、6、7、8、9或10个的核碱基脱氨基。r-环是三-股核酸结构,其包含dna:rna杂合体、dna:dna或rna:rna互补结构以及与单-股dna相联的结构。如本文所用,当靶多核苷酸与crispr复合体或碱基编辑复合体接触时,可能形成r-环,其中向导多核苷酸(例如向导rna)的一部分与靶多核苷酸(例如靶dna)的一部分杂交并置换。在一些实施方式中,r-环包括间隔序列的序列和靶dna互补序列的杂合区域。r-环区域可能是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核碱基对的长度。在一些实施方式中,该r-环区域的长度是约20个核碱基对。应当理解,如本文所用,r-环区域不限于与向导多核苷酸杂交的靶dna股。例如,r-环区域内的靶核碱基的编辑可能针对包括向导rna的互补股的dna股,或者可能针对作为向导rna的互补股的相对股的dna股。在一些实施方式中,在r-环区域中的编辑包括了将非-互补股(原间隔序列股)上的核碱基编辑为靶dna序列中的向导rna。[0488]本文所述的融合蛋白可以在不同于正准的碱基编辑的编辑窗口中实现靶向脱氨反应。在一些实施方式中,靶核碱基是在靶多核苷酸序列中的pam序列上游约1到约20个碱基处。在一些实施方式中,靶核碱基是在靶多核苷酸序列中的pam序列上游约2到约12个碱基处。在一些实施方式中,靶核碱基是相距pam序列或在pam序列上游:约1到9个碱基对、约2到10个碱基对、约3到11个碱基对、约4到12个碱基对、约5到13个碱基对、约6到14个碱基对、约7到15个碱基对、约8到16个碱基对、约9到17个碱基对、约10到18个碱基对、约11到19个碱基对、约12到20个碱基对、约1到7个碱基对、约2到8个碱基对、约3到9个碱基对、约4到10个碱基对、约5到11个碱基对、约6到12个碱基对、约7到13个碱基对、约8到14个碱基对、约9到15个碱基对、约10到16个碱基对、约11到17个碱基对、约12到18个碱基对、约13到19个碱基对、约14到20个碱基对、约1到5个碱基对、约2到6个碱基对、约3到7个碱基对、约4到8个碱基对、约5到9个碱基对、约6到10个碱基对、约7到11个碱基对、约8到12个碱基对、约9到13个碱基对、约10到14个碱基对、约11到15个碱基对、约12到16个碱基对、约13到17个碱基对、约14到18个碱基对、约15到19个碱基对、约16到20个碱基对、约1到3个碱基对、约2到4个碱基对、约3到5个碱基对、约4到6个碱基对、约5到7个碱基对、约6到8个碱基对、约7到9个碱基对、约8到10个碱基对、约9到11个碱基对、约10到12个碱基对、约11到13个碱基对、约12到14个碱基对、约13到15个碱基对、约14到16个碱基对、约15到17个碱基对、约16到18个碱基对、约17到19个碱基对、约18到20个碱基对。在一些实施方式中,靶核碱基是相距pam序列或在pam序列上游大约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个碱基对。在一些实施方式中,靶核碱基是在pam序列上游约1、2、3、4、5、6、7、8或9个碱基对。在一些实施方式中,靶核碱基是在pam序列上游约2、3、4或6个碱基对。[0489]因此,本文也提供了融合蛋白文库和使用其优化碱基编辑的方法,该经优化的碱基编辑,与正准的碱基编辑器(例如be4)相比,允许替代的优选碱基编辑窗口。在一些实施方式中,本公开揭露提供了用于优化碱基编辑的蛋白文库,其包括复数个融合蛋白,其中该复数个融合蛋白中的每一个都包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中每一个融合蛋白的n末端片段都不同于该复数个融合蛋白中其余蛋白的n末端片段,或者,其中每一个融合蛋白的c末端片段都不同于该复数个融合蛋白中其余蛋白的c末端片段,其中每一个融合蛋白的脱氨酶使靠近靶多核苷酸序列中的原间隔序列临近基序(pam)序列的靶核碱基脱氨基,并且其中所述n末端片段或所述c末端片段结合靶多核苷酸序列。在一些实施方式中,对于crisprr-环内的每个核碱基,该复数个融合蛋白中的至少一个使该核碱基脱氨基。在一些实施方式中,对于相距pam序列1到20个碱基对的靶多核苷酸内的每个核碱基,该复数个融合蛋白中的至少一个使该核碱基脱氨基。在一些实施方式中,本文提供了包括允许最优化的碱基编辑的融合蛋白文库的试剂盒。[0490]所述融合蛋白可以包括多于一个的异源性多肽。例如,所述融合蛋白可以额外地包括一个或多个ugi结构域和/或一个或多个核定位信号。所述两个或更多个异源性结构域可以串联插入。所述两个或更多个异源性结构域插入的区位可以使得它们在napdnab中不是串联的。[0491]融合蛋白可以包括脱氨酶和napdnabp多肽之间的连接子。该连接子可以是肽或非-肽连接子。例如,该连接子可以是xten,(gggs)n,(ggggs)n,(g)n,(eaaak)n,(ggs)n,sgsetpgtsesatpes。在一些实施方式中,所述融合蛋白包括n末端cas9片段和脱氨酶之间的连接子。在一些实施方式中,所述融合蛋白包括c末端cas9片段和脱氨酶之间的连接子。在一些实施方式中,napdnabp的n末端和c末端片段是通过连接子而与脱氨酶连结。在一些实施方式中,该n末端和c末端片段在没有连接子的情况下连接到脱氨酶结构域上。在一些实施方式中,所述融合蛋白包括n末端cas9片段和脱氨酶之间的连接子,但是不包括c末端cas9片段和脱氨酶之间的连接子。在一些实施方式中,所述融合蛋白包括c末端cas9片段和脱氨酶之间的连接子,但是不包括n末端cas9片段和脱氨酶之间的连接子。[0492]示例性的tada或tada7.10序列如下所列出:[0493]sevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0494]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0495]tahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdp[0496]yrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqn[0497]mnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypg[0498]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0499]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprq[0500]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0501]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0502]101cas9tadains1015[0503]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0504]102cas9tadains1022[0505]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0506]103cas9tadains1029[0507]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0508]103cas9tadains1040[0509]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0510]105cas9tadains1068[0511]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdtgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0512]106cas9tadains1247[0513]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0514]107cas9tadains1054[0515]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0516]108cas9tadains1026[0517]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaksegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0518]109cas9tadains768[0519]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0520]110.1cas9tadains1250[0521]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0522]110.2cas9tadains1250[0523]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0524]110.3cas9tadains1250[0525]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0526]110.4cas9tadains1250[0527]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0528]110.5cas9tadains1249[0529]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0530]110.5cas9tadainsδ59-661250[0531]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0532]110.6cas9tadains1251[0533]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspegssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrdneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0534]110.7cas9tadains1252[0535]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0536]110.8cas9tadainsδ59-66c-truncate1250[0537]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0538]111.1cas9tadains997[0539]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0540]111.2cas9tadains997[0541]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgssgsetpgtsesatpessggssikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0542]112δhnhtada[0543]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0544]113n末端单一tada螺旋截短(trunc)165-端[0545]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0546]114n末端单一tada螺旋截短165-端δ59-65[0547]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0548]115.1cas9tadains1004[0549]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypkgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0550]115.2cas9tadains1005[0551]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0552]115.3cas9tadains1006[0553]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0554]115.4cas9tadains1007[0555]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0556]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypkgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0557]115.2cas9tadains1005[0558]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0559]115.3cas9tadains1006[0560]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0561]115.4cas9tadains1007[0562]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0563]116.1cas9tadainsc末端截短2792[0564]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0565]116.2cas9tadainsc-末端截短2791[0566]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0567]116.3cas9tadainsc-末端截短2790[0568]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0569]117cas9δ1017-1069[0570]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvyssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0571]118cas9tada-cp116ins1067[0572]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietnmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypggetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0573]119cas9tadains701[0574]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0575]120cas9tadacp136ins1248[0576]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0577]121cas9tadacp136ins1052[0578]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlamnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgngeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0579]122cas9tadacp136ins1041[0580]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0581]123cas9tadacp139ins1299[0582]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0583]124cas9δ792-872tadains[0584]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdeevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0585]125cas9δ792-906tadains[0586]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0587]126tadacp65ins1003[0588]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypktahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdplesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0589]127tadacp65ins1016[0590]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0591]128tadacp65ins1022[0592]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0593]129tadacp65ins1029mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0594]130tadacp65ins1041[0595]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffystahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0596]131tadacp65ins1054[0597]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlantahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0598]132tadacp65ins1246[0599]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0600]原间隔序列临近基序[0601]术语“原间隔序列临近基序(pam)”或pam-样基序是指在crispr细菌适应性免疫系统中紧随被cas9核酸酶所靶向的dna序列后的2到6个碱基对的dna序列。在一些实施方式11llq12lll13fit14fir15fiq16fil17fgc18hln19fgca20hlnv21law22laf23lay24iaw25iaf26iay[0608]表3:在残基1135,1136,1218,1219,和1335处的ngtpam变体突变[0609][0610][0611]在一些实施方式中,该ngtpam变体选自表2和3中的变体5,7,28,31,或36。在一些实施方式中,所述这些变体具有改良的ngtpam识别能力。[0612]在一些实施方式中,所述这些ngtpam变体在残基1219,1335,1337,和/或1218处具有突变。在一些实施方式中,该ngtpam变体选自下表4中所提供的变体,以得到具有改良的识别能力的突变。[0613]表4:在残基1219,1335,1337,和1218处的ngtpam变体突变[0614]变体e1219vr1335qt1337g12181fvt2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr[0615]在一些实施方式中,该ngtpam选自下表5中所提供的变体。[0616]表5.ngtpam变体[0617][0618]在一些实施方式中,该cas9结构域是来自化脓性链球菌的cas9结构域(spcas9)。在一些实施方式中,该spcas9结构域是核酸酶活性的spcas9,核酸酶无活性的spcas9(spcas9d),或spcas9切口酶(spcas9n)。在一些实施方式中,该spcas9包括d9x突变,或本文所提供的任何氨基酸序列中的相应突变,其可能与本文所提供的任何胞苷脱氨酶或腺苷脱氨酶融合。[0619]在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135x、r1335x和t1336x突变,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135e、r1335q和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1135e、r1335q和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135x、r1335x和t1336x突变,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135v、r1335q和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1135v,r1335q,和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135x、g1217x、r1335x和t1336x突变,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,该spcas9结构域包括突变中的一个或多个d1135v、g1217r、r1335q和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该spcas9结构域包括d1135v、g1217r、r1335q和t1336r突变,或本文所提供的任何氨基酸序列中的相应突变。[0620]在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域包括的氨基酸序列,与本文所述的cas9多肽相比,是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域包括本文所述的任何cas9多肽的氨基酸序列。在一些实施方式中,本文所提供的任何融合蛋白的cas9结构域由本文所述的任何cas9多肽的氨基酸序列组成。[0621]在一些例子中,被本文所揭露的碱基编辑器的crispr蛋白-衍生的结构域所识别的pam可以提供给细胞,且该pam是在相对于编码该碱基编辑器的嵌入物(例如,aav嵌入物)而言分开的一寡核苷酸上。在此种实施方式中,在分开的寡核苷酸上提供pam可以允许靶序列的切开,否则其将不能被切开,因为在与该靶序列相同的多核苷酸上不存在临近的pam。[0622]在一实施方式中,化脓性链球菌cas9(spcas9)可用作适于基因组工程化的crispr核酸内切酶。然而,可以使用其他蛋白。在一些实施方式中,可以使用不同的核酸内切酶以靶向某些基因组靶标。在一些实施方式中,可以使用具有非-nggpam序列的合成的spcas9-衍生的变体。另外,已经鉴别了来自各种物种的其他cas9异种同源物,并且这些“非-spcas9”可以结合多种亦可用于本公开揭露的pam序列。例如,spcas9的相对较大的尺寸(大约4千碱基(kb)编码序列)可导致携带所述spcas9cdna的质粒不能在细胞中有效表达。相反地,金黄色葡萄球菌cas9(sacas9)的编码序列比spcas9短约1千碱基,可能允许其在细胞中有效表达。与spcas9相似,该sacas9核酸内切酶能够在体外情况下(哺乳动物细胞中)和在体内情况下(小鼠中)对靶基因进行修饰。在一些实施方式中,cas蛋白可以靶向不同的pam序列。在一些实施方式中,例如,靶基因可以与cas9pam(5’‑ngg,例如)临近。在其他实施方式中,其他cas9异种同源物可以具有不同的pam要求。例如,其他pam,诸如嗜热链球菌(对于crispr1为5’‑nnagaa,对于crispr3为5’‑nggng)和脑膜炎双球菌(5’‑nnnngatt)的那些pam,也可以在靶基因的临近处被找到。[0623]在一些实施方式中,对于化脓性链球菌系统,靶基因序列可以居先于(即,为5’于)5’‑nggpam,而20-nt的向导rna序列可以与相对股碱基配对以介导临近pam的cas9切开。在一些实施方式中,临近的切割可以是在pam上游3个碱基对或可以是在pam上游大约3个碱基对。在一些实施方式中,临近的切割可以是在pam上游10个碱基对或可以是在pam上游大约10个碱基对。在一些实施方式中,临近的切割可以是在pam上游0-20个碱基对或可以是在pam上游大约0至20个碱基对。例如,临近的切割可以是在紧邻pam上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基对。临近的切割也可以是在pam下游的1到30个碱基对。能够结合pam序列的示例性的spcas9蛋白的序列如下:[0624]示例性的pam-结合的spcas9的氨基酸序列如下:[0625]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0626]示例性的pam-结合的spcas9n的氨基酸序列如下:[0627]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0628]示例性的pam-结合的speqrcas9的氨基酸序列如下:[0629][0630][0630]在这个序列中,残基e1135,q1335和r1337,其可以由d1135,r1335,和t1337突变而来以产生speqrcas9,带有底线和以粗体显示。[0631]示例性的pam-结合的spvqrcas9的氨基酸序列如下:[0632][0633][0633]在这个序列中,残基v1135,q1335,和r1336,其可以由d1135,r1335,和t1336突变而来以产生spvqrcas9,带有底线和以粗体显示。[0634]示例性的pam-结合的spvrercas9的氨基酸序列如下:[0635][0636][0637]在一些实施方式中,该cas9结构域是重组cas9结构域。在一些实施方式中,该重组cas9结构域是spymaccas9结构域。在一些实施方式中,该spymaccas9结构域是核酸酶活性的spymaccas9,核酸酶无活性的spymaccas9(spymaccas9d),或spymaccas9切口酶(spymaccas9n)。在一些实施方式中,该sacas9结构域,该sacas9d结构域,或该sacas9n结构域可以结合具有非-正准的pam的核酸序列。在一些实施方式中,该spymaccas9结构域,该spcas9d结构域,或该spcas9n结构域可以结合具有naapam序列的核酸序列。[0638]示例性的spymaccas9[0639]mdkkysigldigtnsvgwavitddykvpskkfkvlgntdrhsikknligallfgsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkkladstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqiynqlfeenpinasrvdakailsarlsksrrlenliaqlpgekrnglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnseitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgayhdllkiikdkdfldneenediledivltltlfedrgmieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqghslheqianlagspaikkgilqtvkivdelvkvmghkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsfikddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkkteiqtvgqngglfddnpksplevtpsklvplkkelnpkkyggyqkpttaypvllitdtkqlipisvmnkkqfeqnpvkflrdrgyqqvgkndfiklpkytlvdigdgikrlwasskeihkgnqlvvskksqillyhahhldsdlsndylqnhnqqfdvlfneiisfskkcklgkehiqkienvysnkknsasieelaesfikllgftqlgatspfnflgvklnqkqykgkkdyilpctegtlirqsitglyetrvdlskiged.[0640]在一些情况下,变体cas9蛋白带有h840a,p475a,w476a,n477a,d1125a,w1126a,和d1218a突变,使得该多肽切开靶dna或rna的能力是减低的。此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。作为另一个非限制性的例子,在一些情况下,该变体cas9蛋白带有d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1218a突变,使得该多肽切开靶dna的能力是减低的。[0641]此种cas9蛋白切开靶dna(例如,单股靶dna)的能力是减低的,但是保留了结合靶dna(例如,单股靶dna)的能力。在一些情况下,当变体cas9蛋白带有w476a和w1126a突变时,或者当该变体cas9蛋白带有p475a、w476a、n477a、d1125a、w1126a和d1218a突变时,该变体cas9蛋白不能有效地结合pam序列。因此,在一些此类情况下,当在结合的方法中使用此种变体cas9蛋白时,该方法不需要pam序列。换句话说,在一些情况下,当在结合的方法中使用此种变体cas9蛋白时,该方法可以包含向导rna,但该方法可以在不存在pam序列的情况下被执行(而结合的特异性因此是由该向导rna的靶向节段所提供)。可以使其他残基突变以获得上述效果(即,灭活一个或另外一个核酸酶部分)。作为非限制性的例子,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987可以被改变(即,被替换)。同样地,除丙氨酸置换以外的突变也是适合的。[0642]在一些实施方式中,碱基编辑器的crispr蛋白-衍生结构域可以包括具有正准pam序列(ngg)的cas9蛋白的全部或部分。在其他实施方式中,碱基编辑器的cas9-衍生结构域可以采用非-正准的pam序列。此种序列已经在本领域中描述,并且对本领域熟练技术人员而言是显而易见的。例如,结合非-正准的pam序列的cas9结构域已在如下文献中描述:kleinstiver,b.p.等,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);以及kleinstiver,b.p.等,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015);其每个的全部内容在此通过引用并入。[0643]高保真的cas9结构域[0644]本公开揭露的一些方面提供了高保真的cas9结构域。在一些实施方式中,高保真的cas9结构域是工程化的cas9结构域,其包括一个或多个突变,与相应的野生型cas9结构域相比,该突变降低了该cas9结构域和dna的糖-磷酸主干的静电相互作用。不希望被任何特定理论束缚,具有降低的与dna的糖-磷酸主干的静电相互作用的高保真cas9结构域可能具有较少的脱靶效应。在一些实施方式中,cas9结构域(例如,野生型cas9结构域)包括一个或多个突变,该突变降低了该cas9结构域与dna的糖-磷酸主干之间的相联。在一些实施方式中,cas9结构域包括一个或多个突变,该突变使该cas9结构域与dna的糖-磷酸主干之间的相联降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%。[0645]在一些实施方式中,本文所提供的任何cas9融合蛋白包括n497x、r661x、q695x和/或q926x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变,其中x是任一氨基酸。在一些实施方式中,本文所提供的任何cas9融合蛋白包括n497a、r661a、q695a和/或q926a突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方式中,该cas9结构域包括d10a突变,或本文所提供的任何氨基酸序列中的相应突变。具有高保真度的cas9结构域是本领域已知的,且对熟练技术人员是显而易见的。例如,具有高保真度的cas9结构域已在如下文献中被描述:kleinstiver,b.p.等,“high-fidelitycrispr-cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.”nature529,490-495(2016);以及slaymaker,i.m.等,“rationallyengineeredcas9nucleaseswithimprovedspecificity.”science351,84-88(2015);其每个的全部内容通过引用并入本文。[0646]高保真cas9结构域突变(相对于cas9)以粗体和底线显示[0647]核酸可编程的dna结合蛋白[0648]本公开揭露的一些方面提供了融合蛋白,该融合蛋白包括充当核酸可编程的dna结合蛋白的结构域,其可被用于将蛋白,诸如碱基编辑器,导向至特定的核酸(例如dna或rna)序列。在特定的实施方式中,融合蛋白包括核酸可编程的dna结合蛋白结构域和脱氨酶结构域。dna结合蛋白包含但不限于:cas9(例如,dcas9和ncas9)、casx、casy、cpf1、cas12b/c2c1和cas12c/c2c3。具有与cas9不同的pam特异性的核酸可编程的dna-结合蛋白的一个例子是来自普雷沃氏菌和弗朗西斯菌1的规律成簇间隔短回文重复序列(cpf1)。与cas9类似,cpf1也是2类crispr效应器。已经表明,cpf1介导稳健的dna干扰,而其特征不同于cas9。cpf1是欠缺tracrrna的单一rna-导向的内切核酸酶,而它利用t-富集的原间隔序列临近基序(ttn、tttn或ytn)。此外,cpf1经由参差的dna双-股断裂来切开dna。在16种cpf1-家族蛋白中,来自氨基酸球菌属(acidaminococcus)和毛螺菌科(lachnospiraceae)的两种酶被证明在人类细胞中具有有效的基因组-编辑活性。cpf1蛋白是本领域已知的并且之前已经描述过,例如yamano等,“crystalstructureofcpf1incomplexwithguidernaandtargetdna.”cell(165)2016,p.949-96;其全部内容在此通过引入并入。[0649]亦可用于本发明组合物和方法的核酸酶-无活性的cpf1(dcpf1)变体可被用作向导核苷酸序列-可编程的dna-结合蛋白结构域。该cpf1蛋白具有与cas9的ruvc结构域相似的ruvc-样核酸内切酶结构域,但不具有hnh核酸内切酶结构域,并且cpf1的n末端不具有cas9的α-螺旋识别叶。已经表明,在zetsche等,cell,163,759-771,2015(其通过引用并入本文)中,cpf1的ruvc-样结构域负责切开两条dna股,并且该ruvc-样结构域的去活化会灭活cpf1核酸酶的活性。例如,与新凶手弗朗西斯菌(francisellanovicida)cpf1中的d917a、e1006a或d1255a对应的突变灭活cpf1核酸酶活性。在一些实施方式中,本公开揭露的dcpf1包括对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应当理解,可根据本公开揭露使用任何灭活cpf1的ruvc结构域的突变,例如替换突变、缺失或插入。[0650]在一些实施方式中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可能是cpf1蛋白。在一些实施方式中,该cpf1蛋白是cpf1切口酶(ncpf1)。在一些实施方式中,该cpf1蛋白是核酸酶无活性的cpf1(dcpf1)。在一些实施方式中,该cpf1,该ncpf1,或该dcpf1包括的氨基酸序列与本文所述的cpf1序列的同一性是至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%。在一些实施方式中,该dcpf1包括的氨基酸序列与本文所述的cpf1序列的同一性是至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%,并且包括对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应当理解,可根据本公开揭露使用来自其他细菌种类的cpf1。[0651]野生型新凶手弗朗西斯菌cpf1(d917,e1006,和d1255是粗体并有底线)[0652][0653]新凶手弗朗西斯菌cpf1d917a(a917,e1006,和d1255是粗体并有底线)[0654][0655]新凶手弗朗西斯菌cpf1e1006a(d917,a1006,和d1255是粗体并有底线)[0656][0657][0658]新凶手弗朗西斯菌cpf1d1255a(d917,e1006,和a1255是粗体并有底线)[0659][0660][0661]新凶手弗朗西斯菌cpf1d917a/e1006a(a917,a1006,和d1255是粗体并有底线)[0662][0663][0664]新凶手弗朗西斯菌cpf1d917a/d1255a(a917,e1006,和a1255是粗体并有底线)[0665][0666][0667]新凶手弗朗西斯菌cpf1e1006a/d1255a(d917,a1006,和a1255是粗体并有底线)[0668][0669]新凶手弗朗西斯菌cpf1d917a/e1006a/d1255a(a917,a1006,和a1255是粗体并有底线)[0670][0671][0672]在一些实施方式中,融合蛋白中存在的cas9结构域之一可被对pam序列没有要求的向导核苷酸序列-可编程的dna-结合蛋白结构域所取代。[0673]在一些实施方式中,该核酸可编程的dna结合蛋白(napdnabp)是微生物crispr-cas系统的单一效应器。微生物crispr-cas系统的单一效应器包含但不限于:cas9,cpf1,cas12b/c2c1,和cas12c/c2c3。通常,微生物crispr-cas系统分为1类和2类系统。1类系统具有多亚基效应器复合体,而2类系统具有单一蛋白效应器。例如,cas9和cpf1是2类效应器。除了cas9和cpf1,三个相异的2类crispr-cas系统(cas12b/c2c1,和cas12c/c2c3)已被如下文献描述:shmakov等,“多样的2类crisprcas系统的发现与功能性表征”,mol.cell,2015nov.5;60(3):385-397,其全部内容在此通过引用并入。其中两个系统cas12b/c2c1和cas12c/c2c3的效应器,含有与cpf1相关的ruvc-样核酸内切酶结构域。第三个系统含有具有两个预测的hepnrnase结构域的效应器。成熟crisprrna的生产不依赖于tracrrna,这不同于通过cas12b/c2c1生产的crisprrna。cas12b/c2c1对dna的切开依赖于crisprrna和tracrrna两者。[0674]酸土脂环酸芽孢杆菌(alicyclobaccillusacidoterrastris)cas12b/c2c1(aacc2c1)与嵌合的单-分子向导rna(sgrna)的复合体的晶体结构已被报道,参见例如liu等,“c2c1-sgrnacomplexstructurerevealsrna-guideddnacleavagemechanism”,mol.cell,2017jan.19;65(2):310-322,其全部内容在此通过引用并入。以三元复合体形式与靶dna结合的酸土脂环酸芽孢杆菌c2c1的晶体结构也被报道。参见例如yang等,“pam-dependenttargetdnarecognitionandcleavagebyc2c1crispr-casendonuclease”,cell,2016dec.15;167(7):1814-1828,其全部内容在此通过引用并入。aacc2c1的催化胜任的两个构象(带有靶和非靶dna股)已被独立地捕捉到,其就定位在单一ruvc催化口袋内,伴随着cas12b/c2c1-介导的切开导致靶dna的参差的七-核苷酸断裂。cas12b/c2c1三元复合体与先前鉴别的cas9和cpf1对应物之间的结构比较展示了crispr-cas9系统所用机制的多样性。[0675]在一些实施方式中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可能是cas12b/c2c1,或cas12c/c2c3蛋白。在一些实施方式中,该napdnabp是cas12b/c2c1蛋白。在一些实施方式中,该napdnabp是cas12c/c2c3蛋白。在一些实施方式中,该napdnabp包括的氨基酸序列,与天然-存在的cas12b/c2c1或cas12c/c2c3蛋白,是至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。在一些实施方式中,该napdnabp是天然-存在的cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方式中,该napdnabp包括的氨基酸序列,与本文所提供的任一napdnabp序列,是至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的。应该理解,来自其他细菌种类的cas12b/c2c1或cas12c/c2c3也可根据本公开揭露而被使用。[0676]cas12b/c2c1[0677](uniprot.org/uniprot/t0d7a2#2)sp|t0d7a2|c2c1_aliagcrispr-关联的核酸内切酶c2c1os[0678]=酸土脂环酸芽孢杆菌(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1[0679]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi[0680]包括核定位序列(nls)的融合蛋白[0681]在一些实施方式中,本文所提供的融合蛋白还包括一个或多个(例如,2,3,4,5个)核靶向序列,例如核定位序列(nls)。在一个实施方式中,使用了双分型nls。在一些实施方式中,nls包括氨基酸序列,其促进包括nls的蛋白质输入细胞核中(例如,通过核转运)。在一些实施方式中,本文所提供的任何融合蛋白还包括核定位序列(nls)。在一些实施方式中,该nls融合到该融合蛋白的n端。在一些实施方式中,该nls融合到该融合蛋白的c端。在一些实施方式中,该nls融合到cas9结构域的n端。在一些实施方式中,该nls融合到ncas9结构域或dcas9结构域的c端。在一些实施方式中,该nls融合到脱氨酶的n端。在一些实施方式中,该nls融合到脱氨酶的c端。在一些实施方式中,该nls经由一个或多个连接子融合到融合蛋白。[0682]在一些实施方式中,该nls在无连接子的情况下融合到融合蛋白。在一些实施方式中,nls包括本文所提供的或所引用的任一nls序列的氨基酸序列。额外的核定位序列在本领域中是已知的,并且对本领域熟练技术人员而言是显而易见的。例如,nls序列在plank等,pct/ep2000/011690中描述,其内容通过对其示例性核定位序列的公开揭露的引用而并入本文。在一些实施方式中,nls包括的氨基酸序列为:pkkkrkvegadkrtadgsefespkkkrkv,krtadgsefespkkkrkv,krpaatkkagqakkkk,kktelqttnaenktkkl,krgindrnfwrgengrktr,rksgkiaaivvkrprkpkkkrkv,或mdsllmnrrkflyqfknvrwakgrretylc。[0683]在一些实施方式中,该nls存在于连接子中,或连接子位于该nls的两侧翼,例如,本文所述的连接子。在一些实施方式中,该n端或c端nls是双分型nls。双分型nls包括两个碱性氨基酸簇,它们由相对较短的间隔序列所分开(故,双分型-2个部分,而单分型nls则不是)。核质蛋白的nls,kr[paatkkagqa]kkkk,是普遍存在的双分型信号的原型:2个碱性氨基酸的簇,其由约10个氨基酸的间隔序列所分开。示例性的双分型nls的序列如下:[0684]pkkkrkvegadkrtadgsefespkkkrkv[0685]在一些实施方式中,本发明的融合蛋白不包括连接子序列。在一些实施方式中,存在一个或多个所述结构域或蛋白之间的连接子序列。[0686]应当理解,本公开揭露的融合蛋白可能包括一个或多个附加的特色。例如,在一些实施方式中,该融合蛋白可能包括抑制剂,细胞质定位序列,输出序列,诸如核输出序列,或其他定位序列,以及可用于该融合蛋白的增溶、纯化或检测的序列标签。本文所提供的适合的蛋白质标签包含但不限于,生物素羧化酶载体蛋白(bccp)标签,myc-标签,钙调蛋白-标签,flag-标签,血凝素(ha)-标签,多组氨酸标签,也称为组氨酸标签或his-标签,麦芽糖结合蛋白(mbp)-标签,nus-标签,谷胱甘肽-硫-转移酶(gst)-标签,绿色荧光蛋白(gfp)-标签,硫氧还蛋白-标签,s-标签,softags(例如,softag1,softag3),链霉亲和素-标签,生物素连接酶标签,flash标签,v5标签和sbp-标签。额外的适合的序列对本领域技术人员而言将是显而易见的。在一些实施方式中,该融合蛋白包括一个或多个his标签。[0687]连接子[0688]在某些实施方式中,连接子可能用于链接本发明的任何肽或肽结构域。该连接子可能是简单如共价键,或它可能是许多个原子长度的聚合的连接子。在某些实施方式中,该连接子是多肽或基于氨基酸的。在其他实施方式中,该连接子不是肽-样的。在某些实施方式中,该连接子是共价键(例如,碳-碳键,二硫键,碳-杂原子键,等)。在某些实施方式中,该连接子是酰胺键合的碳-氮键。在某些实施方式中,该连接子是环状的或无环的,替换的或未替换的,分枝的或未分枝的,脂肪族的或杂脂肪族的连接子。在某些实施方式中,该连接子是聚合的(例如,聚乙烯,聚乙二醇,聚酰胺,聚酯等)。在某些实施方式中,该连接子包括氨基链烷酸的单体,二聚体或聚合物。在某些实施方式中,该连接子包括氨基链烷酸(例如,甘氨酸,乙酸,丙氨酸,β-丙氨酸,3-氨基丙酸,4-氨基丁酸,5-戊酸等)。在某些实施方式中,该连接子包括氨基己酸(ahx)的单体,二聚体或聚合物。在某些实施方式中,该连接子是基于碳环部分体(例如,环戊烷,环己烷)。在其他实施方式中,该连接子包括聚乙二醇部分体(peg)。在其他实施方式中,该连接子包括氨基酸。在某些实施方式中,该连接子包括肽。在某些实施方式中,该连接子包括芳基或杂芳基部分体。在某些实施方式中,该连接子是基于苯环的。该连接子可能包含官能化的部分体,以促进亲核基(例如,硫醇基,氨基)从肽到所述连接子的附接。任何亲电子试剂都可用作该连接子的一部分。示例性的亲电子试剂包含但不限于:活化的酯、活化的酰胺、michael接受体、烷基卤化物、芳基卤化物、酰基卤化物和异硫氰酸酯。[0689]在一些实施方式中,该连接子是一个氨基酸或复数个氨基酸(例如,肽或蛋白质)。在一些实施方式中,该连接子是键(例如共价键)、有机分子、基团、聚合物或化学部分体。在一些实施方式中,该连接子是约3到约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸的长度。[0690]具有向导rna的cas9复合体[0691]本公开揭露的一些方面提供了复合体,该复合体包括本文所提供的任何融合蛋白,以及向导rna。可以使用任何用于链接所述融合蛋白结构域的方法(例如,范围从(gggs)n、(ggggs)n和(g)n形式的非常柔性的连接子到(eaaak)n,(sggs)n,sgsetpgtsesatpes(参见例如guilingerjp,thompsondb,liudr.,fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.,nat.biotechnol.2014;32(6):577-82;其全部内容通过引用并入本文)和(xp)n形式的更刚性的连接子),以取得适于所述核碱基编辑器活性的最佳长度。在一些实施方式中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方式中,该连接子包括(ggs)n基序,其中n是1、3或7。在一些实施方式中,本文所提供的融合蛋白的cas9结构域是经由包括氨基酸序列sgsetpgtsesatpes的连接子所融合。[0692]在一些实施方式中,该向导核酸(例如向导rna)的长度是从15到100个核苷酸,并且包括与靶序列互补的至少10个接连的核苷酸的序列。在一些实施方式中,该向导rna是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的长度。在一些实施方式中,该向导rna包括与靶序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个接连的核苷酸的序列。在一些实施方式中,该靶序列是dna序列。在一些实施方式中,该靶序列是细菌、酵母、真菌、昆虫、植物或动物的基因组中的序列。在一些实施方式中,该靶序列是人类基因组中的序列。在一些实施方式中,该靶序列的3’端紧邻正准的pam序列(ngg)。在一些实施方式中,该靶序列的3’端紧邻非-正准的pam序列(例如表1中所列序列)。[0693]本公开揭露的一些方面提供了使用本文所提供的融合蛋白或复合体的方法。例如,本公开揭露的一些方面提供了方法,其包括使dna分子与本文所提供的任何融合蛋白和至少一种向导rna接触,其中该向导rna是约15-100个核苷酸的长度并且包括与靶序列互补的至少10个接连的核苷酸的序列。在一些实施方式中,该靶序列的3’端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方式中,该靶序列的3’端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5’(tttv)序列。[0694]应当理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如在成熟蛋白的前体和该成熟蛋白本身中,并且物种与物种之间序列的差异可能影响编号。本领域技术人员将能够通过本领域皆知的方法,例如通过序列比对和同源残基的确定,来鉴别任何同源蛋白以及各自编码核酸中的各自残基。[0695]对本领域技术人员而言将是显而易见的是,为了将本文所揭露的任何融合蛋白靶向到靶位点,例如包括待编辑的突变的位点,通常必要与向导rna一起共-表达该融合蛋白。如本文他处的详解,向导rna通常包括允许cas9结合的tracrrna框架,以及向导序列,其将序列特异性赋予cas9:核酸编辑酶/结构域融合蛋白。或者,该向导rna和tracrrna可作为两个核酸分子而分开提供。在一些实施方式中,该向导rna包括一种结构,其中该向导序列包括与该靶序列互补的序列。该向导序列通常为20个核苷酸的长度。基于本公开揭露,用于将cas9:核酸编辑酶/结构域融合蛋白靶向到特定基因组靶位点的适合的向导rnas的序列对本领域技术人员而言将是显而易见的。此种适合的向导rna序列通常包括与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供了一些适用于将任何所提供的融合蛋白靶向到特定靶序列的示例性的向导rna序列。[0696]使用包括胞苷脱氨酶,腺苷脱氨酶和cas9结构域的融合蛋白的方法[0697]本公开揭露的一些方面提供了使用本文所提供的融合蛋白或复合体的方法。例如,本公开揭露的一些方面提供了方法,其包括使编码突变的dna分子与本文所提供的任何融合蛋白以及与至少一个向导rna接触,其中该向导rna是约15到100个核苷酸的长度,并且包括与靶序列互补的至少10个接连核苷酸的序列。在一些实施方式中,该靶序列的3’末端紧邻正准的pam序列(ngg)。在一些实施方式中,该靶序列的3’末端并非紧邻正准的pam序列(ngg)。在一些实施方式中,该靶序列的3’末端紧邻agc,gag,ttt,gtg,或caa序列。在一些实施方式中,该靶序列的3’末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5’(tttv)序列。[0698]应当理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如在成熟蛋白的前体和成熟蛋白本身中,并且物种与物种之间序列的差异可能影响编号。本领域技术人员将能够通过本领域皆知的方法,例如通过序列比对和同源残基的确定,来鉴别任何同源蛋白以及各自编码核酸中的各自残基。[0699]对本领域技术人员而言将是显而易见的是,为了将如本文所揭露的包括cas9结构域和胞苷脱氨酶或腺苷脱氨酶的任何融合蛋白靶向到靶位点,例如包括待编辑的突变的位点,通常必要与向导rna(例如,sgrna)一起共-表达该融合蛋白。如本文他处的详解,向导rna通常包括允许cas9结合的tracrrna框架,以及向导序列,该向导序列将序列特异性赋予所述cas9:核酸编辑酶/结构域融合蛋白。或者,该向导rna和tracrrna可作为两个核酸分子而分开提供。在一些实施方式中,该向导rna包括一种结构,其中该向导序列包括与所述靶序列互补的序列。该向导序列通常为20个核苷酸的长度。基于本公开揭露,用于将cas9:核酸编辑酶/结构域融合蛋白靶向到特定基因组靶位点的适合的向导rna的序列对本领域技术人员而言将是显而易见的。此种适合的向导rna序列通常包括与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。[0700]本文提供了一些适合用于将任何所提供的融合蛋白靶向到特定靶序列的示例性的向导rna序列。[0701]碱基编辑器效率[0702]本发明的融合蛋白有利地修饰了编码包括突变的特定核苷酸碱基,而不生成显著比例的插入/缺失。“插入/缺失”,如本文所用,是指核酸内的核苷酸碱基的插入或缺失。此种插入或缺失可以导致在基因的编码区域内的移码突变。在一些实施方式中,期望生成有效修饰(例如,使突变)核酸内的特定核苷酸而不在该核酸内生成大量的插入或缺失(即,插入/缺失)的碱基编辑器。在某些实施方式中,本文所提供的任何碱基编辑器能够生成比插入/缺失更大比例的预期修饰(例如,突变)。[0703]在一些实施方式中,本文所提供的碱基编辑器能够生成的预期突变与插入/缺失的比率大于1:1。在一些实施方式中,本文所提供的碱基编辑器能够生成的预期突变与插入/缺失的比率是至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1或至少1000:1,或更高。预期突变和插入/缺失的数目可使用任何适合的方法来确定。[0704]在一些实施方式中,本文所提供的碱基编辑器能够限制在核酸区域内的插入/缺失的形成。在一些实施方式中,该区域位于被碱基编辑器所靶向的核苷酸处,或位于被碱基编辑器所靶向的核苷酸的2,3,4,5,6,7,8,9,或10个核苷酸内的区域。在一些实施方式中,本文所提供的任何碱基编辑器能够将在核酸区域的插入/缺失的形成限制为小于1%、小于1.5%、小于2%、小于2.5%、小于3%、小于3.5%、小于4%、小于4.5%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于12%、小于15%或小于20%。在核酸区域所形成的插入/缺失的数目可能取决于核酸(例如,细胞的基因组内的核酸)暴露于碱基编辑器的时长数。在一些实施方式中,在将核酸(例如,细胞的基因组内的核酸)暴露于碱基编辑器之后至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天,再确定插入/缺失的数目或比例。[0705]本公开揭露的一些方面基于以下认识:本文所提供的任何碱基编辑器能够有效地在核酸(例如受试者基因组内的核酸)中生成预期突变而不生成显著数目的非预期突变。在一些实施方式中,预期突变是由与grna结合的特定碱基编辑器所生成的突变,专门设计用于改变或更正突变。在一些实施方式中,本文所提供的任何碱基编辑器能够生成的预期突变与非预期突变的比率(例如预期突变:非预期突变)大于1:1。在一些实施方式中,本文所提供的任何碱基编辑器能够生成的预期突变与非预期突变的比率是至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1或至少1000:1或更高。应当理解,本文中“碱基编辑器”部分中所描述的碱基编辑器的特征可应用于任何融合蛋白,或应用于使用本文所提供的融合蛋白的方法。[0706]用于编辑核酸的方法[0707]本公开揭露的一些方面提供了用于编辑核酸的方法。在一些实施方式中,该方法是用于编辑编码目标多肽(例如,疾病基因的表达产物)的核酸分子的核碱基的方法。在一些实施方式中,该方法包括以下步骤:a)使核酸(例如,双股dna序列)的靶区域与包括碱基编辑器和向导核酸(例如,grna)的复合体接触,b)诱导所述靶区域的股分离,c)将该靶区域的单股中的所述靶核碱基对的第一核碱基转换为第二核碱基,以及d)使用所述ncas9切割所述靶区域且该切割不超过一股,其中与所述第一核碱基互补的第三核碱基被与所述第二核碱基互补的第四核碱基取代。在一些实施方式中,该方法造成所述核酸中少于20%的插入/缺失的形成。应当理解,在一些实施方式中,步骤b被省略。在一些实施方式中,该方法造成少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入/缺失的形成。在一些实施方式中,该方法还包括用与所述第四核碱基互补的第五核碱基取代所述第二核碱基,从而生成预期的被编辑的碱基对(例如,g·c至a·t)。在一些实施方式中,至少5%的预期的碱基对是被编辑的。在一些实施方式中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期的碱基对是被编辑的。[0708]在一些实施方式中,所述靶核苷酸中预期产物与非预期产物的比率是至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更大。在一些实施方式中,预期突变与所形成的插入/缺失的比率是大于1:1、10:1、50:1、100:1、500:1或1000:1或更大。在一些实施方式中,该被切割的单股(带切口的股)杂交到所述向导核酸上。在一些实施方式中,该被切割的单股与包括所述第一核碱基的股是相对的。在一些实施方式中,该碱基编辑器包括dcas9结构域。在一些实施方式中,该碱基编辑器保护或结合非-被编辑股。在一些实施方式中,该预期的被编辑的碱基对在pam位点的上游。在一些实施方式中,该预期的被编辑的碱基对在pam位点的上游的第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方式中,该预期的被编辑的碱基对在pam位点的下游。在一些实施方式中,该预期的被编辑的碱基对在所述pam位点的下游的第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方式中,该方法不需要正准的(例如,ngg)pam位点。在一些实施方式中,该核碱基编辑器包括连接子。在一些实施方式中,该连接子是1-25个氨基酸的长度。在一些实施方式中,该连接子是5-20个氨基酸的长度。在一些实施方式中,连接子是10、11、12、13、14、15、16、17、18,19或20个氨基酸的长度。在一个实施方式中,该连接子是32个氨基酸的长度。在另一个实施方式中,“长连接子”是至少约60个氨基酸的长度。在其他实施方式中,该连接子是约3至100个氨基酸之间的长度。在一些实施方式中,该靶区域包括靶标窗,其中该靶标窗包括所述靶核碱基对。在一些实施方式中,该靶标窗包括1至10个核苷酸。在一些实施方式中,该靶标窗是1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸的长度。在一些实施方式中该靶标窗是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方式中,该预期的被编辑的碱基对是在靶标窗内。在一些实施方式中,该靶标窗包括该预期的被编辑的碱基对。在一些实施方式中,使用本文所提供的任何碱基编辑器来执行该方法。[0709]在一些实施方式中,本公开揭露提供了用于编辑核苷酸(例如snp)的方法。在一些实施方式中,本公开揭露提供了用于编辑双-股dna序列的核碱基对的方法。在一些实施方式中,该方法包括a)使该双-股dna序列的靶区域与包括碱基编辑器和向导核酸(例如grna)的复合体接触,其中该靶区域包括靶核碱基对,b)诱导所述靶区域的股分离,c)将该靶区域的单股中的所述靶核碱基对的第一核碱基转换为第二核碱基,d)切割所述靶区域且该切割不超过一股,其中与所述第一核碱基互补的第三核碱基被与所述第二核碱基互补的第四核碱基取代,并且该第二核碱基被与该第四核碱基互补的第五核碱基取代,从而生成预期的被编辑的碱基对,其中生成该预期的被编辑的碱基对的效率是至少5%。应当理解,在一些实施方式中,步骤b被省略。在一些实施方式中,至少5%的预期的碱基对是被编辑的。在一些实施方式中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%预期的碱基对是被编辑的。在一些实施方式中,该方法造成少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入/缺失的形成。在一些实施方式中,在所述靶核苷酸处的预期产物与非预期产物的比率是至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1、或更大。在一些实施方式中,预期突变与所形成的插入/缺失的比率是大于1:1、10:1、50:1、100:1、500:1或1000:1或更大。在一些实施方式中,该被切割的单股杂交到所述向导核酸上。在一些实施方式中,该被切割的单股与包括所述第一核碱基的股是相对的。在一些实施方式中,该预期的被编辑的碱基对在pam位点的上游。在一些实施方式中,该预期的被编辑的碱基对在pam位点的上游的第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方式中,该预期的被编辑的碱基对在pam位点的下游。在一些实施方式中,该预期的被编辑的碱基对在pam位点的下游的第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方式中,该连接子是10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。在一些实施方式中,该靶区域包括靶标窗,其中该靶标窗包括该靶核碱基对。在一些实施方式中,该靶标窗包括1-10个核苷酸。在一些实施方式中,该靶标窗是1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸的长度。在一些实施方式中,该靶标窗是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方式中,该预期的被编辑的碱基对出现在靶标窗内。在一些实施方式中,该靶标窗包括该预期的被编辑的碱基对。在一些实施方式中,该核碱基编辑器是本文所提供的任一碱基编辑器。[0710]多重编辑[0711]在一些实施方式中,本文所提供的碱基编辑器系统能够对一个或多个基因中的复数个核碱基对进行多重编辑。在一些实施方式中,该复数个核碱基对定位于同一基因中。在一些实施方式中,该复数个核碱基对定位于一个或多个基因中,其中至少一个基因定位于不同的基因座。在一些实施方式中,该多重编辑可以包括一个或多个向导多核苷酸。在一些实施方式中,该多重编辑可以包括一个或多个碱基编辑器系统。在一些实施方式中,该多重编辑可以包括一个或多个碱基编辑器系统,其具有单一向导多核苷酸。在一些实施方式中,该多重编辑可以包括一个或多个碱基编辑器系统,其具有复数个向导多核苷酸。在一些实施方式中,该多重编辑可以包括一个或多个向导多核苷酸,其具有单一碱基编辑器系统。在一些实施方式中,该多重编辑可以包括至少一个向导多核苷酸,其不需要pam序列以靶向结合到靶多核苷酸序列。在一些实施方式中,该多重编辑可以包括至少一个向导多核苷酸,其需要pam序列以靶向结合到靶多核苷酸序列。在一些实施方式中,该多重编辑可以包括至少一个不需要pam序列以靶向结合到靶多核苷酸序列的向导多核苷酸和至少一个需要pam序列以靶向结合到靶多核苷酸序列的向导多核苷酸的混合物。应当理解,使用如本文所述的任何碱基编辑器的多重编辑的特征可以应用于使用本文所提供的任何碱基编辑器的方法的任何组合。也应当理解,使用如本文所述的任何碱基编辑器的多重编辑可以包括对复数个核碱基对的循序编辑。[0712]在一些实施方式中,该复数个核碱基对是在一个或多个基因中。在一些实施方式中,该复数个核碱基对是在同一个基因中。在一些实施方式中,所述一个或多个基因中的至少一个基因是定位于不同的基因座。[0713]在一些实施方式中,所述编辑是指,在至少一个蛋白质编码区域中的对所述复数个核碱基对的编辑。在一些实施方式中,所述编辑是指,在至少一个蛋白质非-编码区域中的对所述复数个核碱基对的编辑。在一些实施方式中,所述编辑是指,在至少一个蛋白质编码区域和在至少一个蛋白质非-编码区域中的对所述复数个核碱基对的编辑。[0714]在一些实施方式中,该编辑是连同一个或多个向导多核苷酸的。在一些实施方式中,该碱基编辑器系统可以包括一个或多个碱基编辑器系统。在一些实施方式中,该碱基编辑器系统可以包括一个或多个碱基编辑器系统,其与单一向导多核苷酸相连。在一些实施方式中,该碱基编辑器系统可以包括一个或多个碱基编辑器系统,其与复数个向导多核苷酸相连。在一些实施方式中,该编辑是连同一个或多个向导多核苷酸的,所述向导多核苷酸具有单一碱基编辑器系统。在一些实施方式中,该编辑是连同至少一个向导多核苷酸的,所述向导多核苷酸不需要pam序列以靶向结合到靶多核苷酸序列。在一些实施方式中,该编辑是连同至少一个向导多核苷酸的,所述向导多核苷酸需要pam序列以靶向结合到靶多核苷酸序列。在一些实施方式中,该编辑是连同至少一个不需要pam序列以靶向结合到靶多核苷酸序列的向导多核苷酸和至少一个需要pam序列以靶向结合到靶多核苷酸序列的向导多核苷酸的混合物。应当理解,使用如本文所述的任何碱基编辑器的多重编辑的特征可以应用于使用本文所提供的任何碱基编辑器的方法的任何组合。也应当理解,所述编辑可以包括对复数个核碱基对的循序编辑。[0715]宿主细胞中融合蛋白的表达[0716]使用本领域熟练技术人员已知的常规方法,本发明的融合蛋白可在几乎任何目标宿主细胞中表达,包含但不限于细菌,酵母,真菌,昆虫,植物和动物细胞。例如,可以用cdna序列为基础设计适于cds上游和下游的适合的引物来克隆编码本发明的融合蛋白的dna。所克隆的dna可直接或在需要时用限制性酶消化后或在附加适合的连接子和/或核定位信号后,与编码碱基编辑系统的一个或多个其他组分的dna相连接。该碱基编辑系统在宿主细胞中被翻译成以形成复合体。[0717]通过将编码具有核碱基修饰活性(例如,腺苷脱氨酶,胞苷脱氨酶,dna糖基化酶)的一个或多个结构域的一个或多个多核苷酸可操作地链接至编码napdnabp的多核苷酸,以制备编码本发明的融合蛋白的多核苷酸而生成融合蛋白。在一些实施方式中,编码napdnabp的多核苷酸,和编码具有核碱基修饰活性的结构域的dna可各自与编码结合结构域的dna或所述结合结构域结合伙伴的dna融合,抑或,两种dna均可与编码分离内含肽的dna融合,由此所述核酸序列-识别转换模块和所述核酸碱基转换酶在宿主细胞中被翻译以形成复合体。在这些情况下,当需要时,可以将连接子和/或核定位信号链接到所述两种dna之一或二者的适合位置。[0718]编码本文所述的蛋白结构域的dna可以通过化学合成该dna而获得,或者通过利用pcr法和gibson组装法连接合成的部分重叠的寡dna短链来构建编码其全长的dna。通过化学合成或通过pcr方法或gibson组装法的组合来构建全长dna的优势为,可以根据dna被导入的宿主设计用于全长cds的待用密码子。在表达异源dna时,通过将其蛋白的dna序列转换为所述宿主生物体中高频使用的密码子,该蛋白质的表达水平预计会增加。既然要使用宿主中密码子使用频率的数据,例如,可以使用在kazusadna研究院的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),也可以参考显示每个宿主中密码子使用频率的文件。通过参比已获得的数据和要引入的dna序列,可将用于该dna序列的在该宿主中显示低使用频率的密码子转换为编码相同氨基酸并显示出高使用频率的密码子。[0719]可以,例如,通过将所述dna链接到适合的表达载体中启动子的下游,而生产含有编码核酸序列-识别模块和/或核酸碱基转换酶dna的表达载体。[0720]作为表达载体,使用了:大肠杆菌-衍生的质粒(例如、pbr322、pbr325、puc12、puc13);枯草芽孢杆菌-衍生的质粒(例如、pub110、ptp5、pc194);酵母‑‑衍生的质粒(例如psh19、psh15);昆虫细胞表达质粒(例如pfast-bac);动物细胞表达质粒(例如pa1-11、pxt1、prc/cmv、prc/rsv、pcdnai/neo);噬菌体,诸如λ噬菌体等;昆虫病毒载体,诸如杆状病毒等(例如bmnpv、acnpv);动物病毒载体,诸如逆转录病毒,牛痘病毒,腺病毒等等。[0721]至于启动子,可以使用适合用于基因表达的宿主的任何启动子。在使用dsb的常规方法中,由于宿主细胞的存活率有时会因毒性而显著降低,因此期望通过使用诱导型启动子在诱导开始时增加细胞数目。然而,由于通过表达本发明的核酸-修饰酶复合体也可以提供足够的细胞增殖,因此也可以不受限地使用组成型启动子。[0722]例如,当该宿主是动物细胞时,使用了:srα启动子,sv40启动子,ltr启动子,cmv(巨细胞病毒)启动子,rsv(rous肉瘤病毒)启动子,momulv(moloney小鼠白血病病毒)ltr,hsv-tk(单纯疱疹病毒胸苷激酶)启动子等。这些之中,优选cmv启动子、srα启动子等。在一个实施方式中,该启动子是cmv启动子或srα启动子。当该宿主细胞是大肠杆菌时,可使用以下任何启动子:trp启动子,lac启动子,reca启动子,λpl启动子,lpp启动子,t7启动子等。当该宿主是芽孢杆菌属时,可使用以下任何启动子:spo1启动子,spo2启动子,penp启动子等。当该宿主是酵母时,可使用任何以下启动子:gal1/10启动子,pho5启动子,pgk启动子,gap启动子,adh启动子等。当该宿主是昆虫细胞时,可以使用任何以下启动子:多角体蛋白启动子,p10启动子等。当该宿主是植物细胞时,可以使用任何以下启动子:camv35s启动子,camv19s启动子,nos启动子等。[0723]在一些实施方式中,按照需要,该表达载体可能含有增强子,剪接信号,终止子,polya附加信号,选择标记物(诸如抗药性基因,营养缺陷型互补基因等),复制起点等。[0724]可以凭借在本身已知的体外转录系统中通过使用编码dna(该dna编码上述核酸序列-识别模块和/或核酸碱基转换酶)的载体作为模板转录为mrna,来制备编码如本文所述的蛋白结构域的rna。[0725]可以通过将编码融合蛋白的表达载体引入宿主细胞中并培养该宿主细胞来表达本发明的融合蛋白。可用于本发明的宿主细胞包含细菌细胞,酵母,昆虫细胞,哺乳动物细胞等。[0726]埃希氏菌属包含大肠杆菌k12.cndot.dh1[proc.natl.acad.sci.、美国、60、160(1968)],大肠杆菌jm103[nucleicacidsresearch、9、309(1981)],大肠杆菌ja221[journalofmolecularbiology、120、517(1978)],大肠杆菌hb101[journalofmolecularbiology、41、459(1969)],大肠杆菌c600[genetics、39、440(1954)]等。[0727]芽孢杆菌属包含枯草芽孢杆菌m1114[gene、24、255(1983)],枯草芽孢杆菌207-21[journalofbiochemistry、95、87(1984)]等。[0728]可用于表达本发明的融合蛋白的酵母包含酿酒酵母ah22,ah22r-,na87-11a,dkd-5d,20b-12,粟酒裂殖酵母ncyc1913,ncyc2036,巴斯德毕赤酵母(pichiapastoris)km71等。[0729]使用例如病毒载体,诸如acnpv,在昆虫细胞中表达融合蛋白。昆虫宿主细胞包含以下任何细胞系:甘蓝菜行军虫幼虫-衍生的确立细胞系(草地贪夜蛾细胞;sf细胞),衍生自粉纹夜蛾(trichoplusiani)的中-肠的mg1细胞,衍生自粉纹夜蛾的卵(巢)的“highfive(击掌相庆)tm.”细胞,甘蓝夜蛾(mamestrabrassicae)-衍生的细胞,盐泽灯蛾(estigmenaacrea)-衍生的细胞等。当病毒是bmnpv时,使用了家蚕-衍生的细胞系(家蚕n细胞;bmn细胞)等。sf细胞包含,例如,sf9细胞(atcccrl1711),sf21细胞[以上所有、invivo、13、213-217(1977)]等。[0730]至于昆虫,使用了例如家蚕、果蝇、蟋蟀等的幼虫来表达融合蛋白(nature、315、592(1985))。[0731]哺乳动物细胞系可用于表达融合蛋白。此种细胞系包含猴cos-7细胞,猴vero细胞,中华仓鼠卵巢(cho)细胞,dhfr基因-缺陷型cho细胞,小鼠l细胞,小鼠att-20细胞,小鼠骨髓瘤细胞,大鼠gh3细胞,人类fl细胞等,分化多能的干细胞(诸如人类和其他哺乳动物的ips细胞,es细胞等),以及从各种组织制备的原代培养细胞。此外,亦可以使用斑马鱼胚胎,爪蟾卵母细胞等。[0732]可使用熟练技术人员熟知的方法在培养物中维持植物细胞。植物细胞培养涉及悬浮培养的细胞,愈伤组织,原生质体,叶节段,根节段等,其是从各种植物(例如谷物,诸如水稻,小麦,玉米等,商品作物,诸如番茄,黄瓜,茄子,康乃馨,洋桔梗,烟草,拟南芥)中制备的。[0733]所有上述宿主细胞可能是单倍体(单套体),或多倍体(例如,二倍体,三倍体,四倍体等)。在传统的突变引入方法中,原则上仅将突变引入一个同源染色体以产生异种基因类型。因此,除非发生了显性突变,否则所期待的表型不会表达出来,而不幸的是纯合子需要人力和时间。相比之下,根据本发明,由于可以将突变引入基因组中所述同源染色体上的任何等位基因,即使在隐性突变的情况下也可以在仅一代中表达所期待的表型,这是极其有用的,因为其解决了传统方法的难题。[0734]使用任何转染方法(例如,溶菌酶方法,感受态方法,peg方法,cacl2共沉淀方法,电穿孔方法,显微注射方法,粒子枪方法,脂转染方法,农杆菌方法等)将编码本发明的融合蛋白的表达载体引入宿主细胞中。基于待转染的宿主细胞而选择转染方法。[0735]可以根据例如proc.natl.acad.sci.美国、69、2110(1972)和gene、17、107(1982)等中所述方法转化大肠杆菌。可以根据例如molecular&generalgenetics、168、111(1979)等中所述方法将载体引入芽孢杆菌属中。可以根据例如methodsinenzymology、194、182-187(1991),proc.natl.acad.sci.美国、75、1929(1978)等中所述方法将载体引入酵母细胞中。可以根据例如bio/technology、6、47-55(1988)等中所述方法将载体引入昆虫细胞中。可以根据例如《细胞工程增刊卷8、新细胞工程实验方案》、263-267(1995)(东京秀潤社出版)和virology、52、456(1973)中所述方法将载体引入哺乳动物细胞中。[0736]根据已知方法培养包括本发明的表达载体的细胞,所述方法根据宿主而变化。例如,当培养大肠杆菌或芽孢杆菌属细胞时,优选液体培养基作为用于培养的培养基。该培养基优选地含有碳源,氮源,无机物质和转化株生长所必需的其他组分。碳源的例子包含葡萄糖,糊精,可溶性淀粉,蔗糖等;氮源的例子包含无机或有机物质,诸如铵盐,硝酸盐,玉米浆,蛋白胨,酪蛋白,肉提取物,豆饼,马铃薯提取物等;而无机物质的例子包含氯化钙,磷酸二氢钠,氯化镁等。该培养基亦可含有酵母提取物,维生素,生长促进因子等。该培养基的ph优选地是在约5至约8之间。[0737]作为用于培养大肠杆菌的培养基,例如,优选的是含有葡萄糖,酪蛋白氨基酸的m9培养基[journalofexperimentsinmoleculargenetics、431-433、冷泉港实验室、纽约1972]。必要时,例如,剂诸如3β-吲哚丙烯酸可被加入该培养基中以确保启动子的有效功能。大肠杆菌通常在约15至约43℃下培养。必要时,可执行曝气和搅拌。[0738]芽孢杆菌属通常在约30至约40℃下培养。必要时,可执行曝气和搅拌。[0739]适于培养酵母的培养基的例子包含burkholder最低限度培养基[proc.natl.acad.sci.美国、77、4505(1980)],含有0.5%酪蛋白氨基酸的sd培养基[proc.natl.acad.sci.美国、81、5330(1984)]等。该培养基的ph优选地是约5至约8。该培养通常是在约20℃至约35℃下执行。必要时,可执行曝气和搅拌。[0740]作为用于培养昆虫细胞或昆虫的培养基,使用了含有添加剂,诸如去活化的10%牛血清等的grace's昆虫培养基[nature、195、788(1962)]。该培养基的ph优选地是约6.2至约6.4。细胞在约27℃下培养。必要时,可执行曝气和搅拌。[0741]作为用于培养哺乳动物细胞的培养基,使用了例如,含有约5%至约20%胎牛血清的最低必需培养基(mem)[science、122、501(1952)],dulbecco's改良eagle培养基(dmem)[virology、8、396(1959)],rpmi1640培养基[thejournaloftheamericanmedicalassociation、199、519(1967)],199培养基[proceedingofthesocietyforthebiologicalmedicine、73、1(1950)]等。该培养基的ph优选地是约6至约8。培养在约30℃至约40℃下进行。必要时,可执行曝气和搅拌。[0742]作为用于培养植物细胞的培养基,例如,使用了ms培养基,ls培养基,b5培养基等。该培养基的ph优选地是约5至约8。培养通常在约20℃至约30℃下进行。必要时,可执行曝气和搅拌。[0743]当以高等真核细胞(诸如动物细胞、昆虫细胞、植物细胞等)作为宿主细胞时,将编码本发明的碱基编辑系统的dna引入宿主细胞中,且所述dna是在诱导型启动子(例如,金属硫蛋白启动子(由重金属离子诱导),热休克蛋白启动子(由热休克诱导),tet-on/tet-off系统启动子(通过添加或去除四环素或其衍生物),类固醇-应答性启动子(由类固醇激素或其衍生物诱导)等)的调控下,在适当的阶段将诱导物质添加到培养基中(或从培养基中去除)以诱导表达所述核酸-修饰酶复合体,培养一定时间以完成碱基编辑并且,将突变引入靶标基因,可以实现所述碱基编辑系统的瞬时表达。[0744]原核细胞,诸如大肠杆菌等,可以利用诱导型启动子。诱导型启动子的例子包含但不限于lac启动子(由iptg诱导),cspa启动子(由冷休克诱导),arabad启动子(由阿拉伯糖诱导)等。[0745]或者,当以高等真核细胞(诸如动物细胞、昆虫细胞、植物细胞等)作为宿主细胞时,也可以利用上述的诱导型启动子作为载体去除机制。即,给载体安装了在宿主细胞中有功能的复制起点,以及编码复制所需蛋白质的核酸(例如,sv40ori和大t抗原,orip和ebna-1等,其用于动物细胞),而编码所述蛋白的核酸的表达是被上述诱导型启动子所调控。因此,虽然所述载体在诱导物质存在时是自主复制的,但当该诱导物质被去除时,就没有了自主复制,并且所述载体会随着细胞分裂而自然地掉队消失(在tet-off系统载体中,通过添加四环素和多西环素使自主复制变得不可能)。[0746]递送系统[0747]核碱基编辑器和grna的基于-核酸的递送[0748]可以通过本领域已知的方法或如本文所述,将根据本公开揭露的编码核碱基编辑器(例如多-效应器核碱基编辑器)的核酸在体外或在体内施用于受试者或递送进入细胞。在一个实施方式中,核碱基编辑器或多-效应器核碱基编辑器的递送是可以通过例如载体(例如病毒或非-病毒载体),基于非-载体的方法(例如使用裸dna,dna复合体,脂质纳米颗粒),或其组合。[0749]编码核碱基编辑器或多-效应器核碱基编辑器的核酸能以裸dna或rna的形式直接被递送进入细胞(例如造血细胞或它们的组细胞,造血干细胞和/或诱导的多能干细胞),例如通过转染或电穿孔的手段,或偶联到可促进所述靶细胞摄取的分子(例如,n-乙酰半乳糖胺)上。也可以使用核酸载体,诸如本文所述的载体。[0750]核酸载体可包括一个或多个编码本文所述融合蛋白的结构域的序列。载体亦可包括编码信号肽(例如,用于核定位,核仁定位或线粒体定位)的序列,该序列与编码蛋白质的一序列相关联(例如,插入进或融合到)。作为一个例子,核酸载体可以包含cas9编码序列,其包含一个或多个核定位序列(例如,来自sv40的核定位序列),以及脱氨酶(例如腺苷脱氨酶和/或胞苷脱氨酶)。[0751]所述核酸载体亦可包含任何适合数目的调节/控制元件,例如启动子,增强子,内含子,多腺苷酸化信号,kozak共有序列或内部核糖体进入位点(ires)。这些元件在本领域中是众所周知的。对于造血细胞,适合的启动子可以包含ifnbeta或cd45。[0752]根据本公开揭露的核酸载体包含重组病毒载体。示例性的病毒载体在本文中列出。也可以使用本领域已知的其他病毒载体。另外,病毒微粒可用于递送以核酸和/或肽形式存在的碱基编辑系统组分。例如,“空”病毒微粒可以被组装以容纳任何适合的货物。病毒载体和病毒微粒也可以被工程化以并入靶向配体以改变靶标的组织特异性。[0753]除病毒载体外,非-病毒载体可用于递送根据本公开揭露的编码基因组编辑系统的核酸。非-病毒核酸载体的一重要类别是纳米微粒,其可以是有机的或无机的。纳米微粒是本领域众所周知的。任何适合的纳米微粒设计均可以用于递送基因组编辑系统组分或编码此类组分的核酸。例如,有机的(例如脂质和/或聚合物)纳米微粒可适用于作为本公开揭露的某些实施方式中的递送载具。用于纳米微粒制剂和/或基因移转的示例性的脂质显示在下面的表6中。[0754]表6[0755][0756][0757][0758]表7列出了用于基因移转和/或纳米微粒制剂的示例性的聚合物。[0759]表7[0760][0761][0762]表8总结了以供编码本文所述融合蛋白的多核苷酸的递送方法。[0763]表8[0764][0765][0766][0767]在另一方面,基因组编辑系统各组分或编码该各组分的核酸(例如,核酸结合蛋白(诸如cas9或其变体),以及靶向基因组目标核酸序列的grna)的递送,可能是通过将核糖核蛋白(rnp)递送至细胞来实现。该rnp包括与所述靶向grna形成复合体的所述核酸结合蛋白(例如cas9)。可使用已知方法将rnp递送至细胞,诸如电穿孔、核转染或阳离子脂质-介导的方法,例如,如zuris、j.a.等、2015、nat.biotechnology、33(1):73-80所报道的。在crispr碱基编辑系统中使用rnp是有利的,特别是对于难以转染的细胞,诸如原代细胞。此外,rnp还可以缓和细胞中伴随蛋白质表达可能出现的困境,尤其是当真核启动子,例如crispr质粒中可能使用的cmv或ef1a,没有很好地表达时。有利的是,rnp的使用不需要将外源dna递送到细胞中。此外,由于包括核酸结合蛋白和grna复合体的rnp会随时间降解,因此rnp的使用有限制脱靶效应的潜力。以类似于基于质粒的技法的方式,rnp可用于递送结合蛋白(例如cas9变体)和导引同源定向修复(hdr)。[0768]用于驱动编码碱基编辑器的核酸分子的表达的启动子可以包含aavitr。这有利于消除对额外启动子元件的需要,该元件会占据所述载体中的空间。所释放的额外空间可用于驱动额外的元件的表达,诸如向导核酸或可筛选标记。itr活性是相对弱的,所以它可用于减低因所选核酸酶的过度表达而导致的潜在毒性。[0769]任何适合的启动子都可以用于驱动所述碱基编辑器的表达,以及适当时所述向导核酸的表达。对于普遍表达,可以使用的启动子包含cmv、cag、cbh、pgk、sv40、铁蛋白的重链或轻链等。对于脑或其他cns细胞表达,适合的启动子可以包含:用于所有神经元的synapsini,用于兴奋性神经元的camkiiα,用于gaba能神经元的gad67或gad65或vgat,等。对于肝脏细胞表达,适合的启动子包含白蛋白启动子。对于肺细胞表达,适合的启动子可以包含sp-b。对于内皮细胞,适合的启动子可以包含icam。对于造血细胞,适合的启动子可以包含ifnβ或cd45。对于成骨细胞,适合的启动子可以包含og-2。[0770]在一些实施方式中,本公开揭露的碱基编辑器具有足够小的尺寸以允许分开的多个启动子驱动所述碱基编辑器和相容的向导核酸在同一核酸分子内的表达。例如,载体或病毒载体可包括与编码所述碱基编辑器的核酸可操作地链接的第一启动子和与所述向导核酸可操作地链接的第二启动子。[0771]用于驱动向导核酸表达的启动子可以包含poliii启动子,诸如u6或h1。使用polii启动子和内含子框来表达grna腺相关病毒(aav)。[0772]病毒载体[0773]因此,本文所述的碱基编辑器可以凭借病毒载体递送。在一些实施方式中,本文所述的碱基编辑器可以在核酸上被编码,该核酸是被包含在病毒载体中。在一些实施方式中,所述碱基编辑器系统的一个或多个组分可以在一个或多个病毒载体上被编码。例如,碱基编辑器和向导核酸可以在单一病毒载体上被编码。在其他实施方式中,该碱基编辑器和向导核酸是在不同的病毒载体上被编码。在任一情形中,该碱基编辑器和向导核酸可以各自可操作地链接到启动子和终止子上。病毒载体上被编码的各个组分的组合可以通过所选病毒载体的基因容量大小限制来确定。[0774]使用基于rna或dna病毒的系统来递送碱基编辑器,利用了用于将病毒靶向到培养物中或宿主体内的特定细胞的和用于将病毒净载运送到细胞核或宿主细胞基因组的高度进化的过程。病毒载体可以直接施用于培养中的细胞,患者(体内),抑或它们可以用于在体外处理细胞,并且可以任选地将经修饰的细胞施用于患者(离体)。传统的基于病毒的系统可以包含用于基因移转的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。凭借所述逆转录病毒、慢病毒和腺相关病毒基因移转方法,整合到宿主基因组中是有可能的,通常导致插入的转基因的长期表达。此外,在许多不同的细胞类型和靶组织中都观察到了高转导效率。[0775]病毒载体可以包含慢病毒(例如基于hiv和fiv的载体)、腺病毒(例如ad100)、逆转录病毒(例如maloney鼠白血病病毒mml-v)、疱疹病毒载体(例如hsv-2)和腺相关病毒(aav)或其他质粒或病毒载体类型,特别是使用如下制剂和剂量的质粒或病毒载体类型,例如来自美国专利编号8,454,972(适于腺病毒的制剂、剂量)、美国专利编号8,404,658(适于aav的制剂、剂量)和美国专利编号5,846,946(适于dna质粒的制剂、剂量)以及来自临床试验和关于涉及慢病毒、aav和腺病毒的临床试验的出版物。例如,对于aav,给药途径、制剂和剂量可以如同美国专利编号8,454,972中的那些和如同涉及aav的临床试验中的那些。对于腺病毒,给药途径、制剂和剂量可以如同美国专利编号8,404,658中的那些和涉及腺病毒的临床试验中的那些。对于质粒递送,给药途径、制剂和剂量可以如同美国专利编号5,846,946中的那些和如同涉及质粒的临床研究中的那些。剂量可以基于或外推到平均70公斤的个体(例如男性成年人),并且可以针对不同重量和物种的患者、受试者、哺乳动物进行调整。给药频率在医学或兽医从业者(例如医师、兽医)的领域内,取决于通常的因子,包含患者或受试者的年龄、性别、一般健康状况、其他状况以及正在解决的特定病况或症状。该病毒载体可以被注射到目标组织中。对于细胞-类型特异性的碱基编辑,碱基编辑器和可选的向导核酸的表达可由细胞-类型特异性启动子驱动。[0776]逆转录病毒的向性可以通过掺入外来包膜蛋白来改变,其扩大了靶细胞的潜在靶群体。慢病毒载体是能够转导或感染非-分裂细胞并且通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因移转系统的选择将取决于所述靶组织。逆转录病毒载体由顺式-作用的长末端重复序列组成,其包装容量最高为6-10kb的外源序列。最小的顺式-作用ltr足以用于所述载体的复制和包装,然后用于将治疗性基因整合到靶细胞中以提供恒定的转基因表达。广泛使用的逆转录病毒载体包含基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人类免疫缺陷病毒(hiv)及其组合的那些载体(参见例如buchscher等、j.virol.66:2731-2739(1992);johann等、j.virol.66:1635-1640(1992);sommnerfelt等、virol.176:58-59(1990);wilson等、j.virol.63:2374-2378(1989);miller等、j.virol.65:2220-2224(1991);pct/us94/05700)。[0777]逆转录病毒载体,尤其是慢病毒载体,可能需要小于给定长度的多核苷酸序列以有效整合到靶细胞中。例如,长度大于9kb的逆转录病毒载体与较小的载体相比可导致低的病毒滴度。在一些实施方式中,本公开揭露的碱基编辑器具有足够的大小以使得其能够经由逆转录病毒载体有效地包装和递送到靶细胞中。在一些实施方式中,碱基编辑器的大小使得其即使在与向导核酸和/或可靶向核酸酶系统的其他组分一起表达时也允许有效包装和递送。[0778]在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率并且不需要细胞分裂。使用此种载体,人们已经获得了高滴度和高表达水平。这个载体可以在相对简单的系统中大量生产。腺相关病毒(“aav”)载体也可用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,以及用于体内和离体的基因治疗程序(参见例如,west等、virology160:38-47(1987);美国专利编号4,797,368;wo93/24641;kotin、humangenetherapy5:793-801(1994);muzyczka、j.clin.invest.94:1351(1994).重组aav载体的构建描述于一些出版物中,包含:美国专利编号5,173,414;tratschin等、mol.cell.biol.5:3251-3260(1985);tratschin等、mol.cell.biol.4:2072-2081(1984);hermonat&muzyczka、pnas81:6466-6470(1984);和samulski等、j.virol.63:03822-3828(1989)。[0779]aav是一种小的单股dna依赖病毒,其属于细小病毒家族。该4.7kb野生型(wt)aav基因组是由分别编码四个复制蛋白和三个衣壳蛋白的两个基因组成,并且该基因组的两侧翼都是145-bp的反向末端重复序列(itr)。所述病毒体由三种衣壳蛋白vp1、vp2和vp3组成,它们是来自同一开放阅读框但出自差异化剪接(vp1)以及选择性翻译起始位点(分别为vp2和vp3)而以1:1:10的比率生产出来。vp3是病毒体中最丰富的亚单元,并参与定义了该病毒向性的细胞表面的受体识别。在vp1独特的n末端内已鉴别出一在病毒感染力中起作用的磷脂酶结构域。[0780]与野生型aav相似,重组aav(raav)利用顺式-作用的145bpitr侧翼包围载体的转基因盒,而提供了最长为4.5kb可用于包装外源dna。感染之后,raav可以表达本发明的融合蛋白,并且不需整合到宿主基因组中仍可持久存在,其通过附加体的形式存在于环状的头尾相连的连环体中。尽管在体外和体内使用此系统而成功的raav的例子很多,但是当基因编码序列的长度等于或大于wtaav基因组时,有限的包装能力限制了aav-介导的基因递送的使用。[0781]可以根据应用选择病毒载体。例如,对于体内基因递送,aav可能优于其他病毒载体。在一些实施方式中,aav符合低毒性的要求,这可能是因为纯化方法不需要细胞颗粒的超速-离心,其可以激活免疫反应。在一些实施方式中,aav符合低概率造成插入诱变的要求,因为它不整合到宿主基因组中。腺病毒通常被用作疫苗,因为它们诱导强烈的免疫原应答。该病毒载体的包装容量可以限制可以被包装到该载体中的碱基编辑器的大小。[0782]aav的包装容量为约4.5kb或4.75kb(包含两个145碱基反向末端重复序列(itr)在内)。这意味着所揭露的碱基编辑器以及启动子和转录终止子可以适配到单一病毒载体中。大于4.5或4.75kb的构建体会导致病毒产量的显著降低。例如,spcas9是相当大的,其基因本身超过4.1kb,这使得其不易被装入aav。因此,本公开揭露的实施方式包含利用所揭露的碱基编辑器,其长度比传统的碱基编辑器短。在一些实例中,该碱基编辑器小于4kb。所揭露的碱基编辑器可小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在一些实施方式中,所揭露的碱基编辑器的长度是4.5kb或较短。[0783]aav可以是aav1、aav2、aav5或其任何组合。可以根据被靶向的细胞选择aav的类型;例如,对于靶向脑或神经元细胞,可以选择aav血清型1、2、5或是杂合衣壳aav1、aav2、aav5或其任何组合;对于靶向心脏组织,可以选择aav4。aav8可用于对肝脏的递送。关于这些细胞的确定aav血清型的表列目录可以在grimm、d.等、j.virol.82:5887-5911(2008)中找到。[0784]慢病毒是复杂的逆转录病毒,其在有丝分裂和有丝分裂后细胞中都具有感染和表达它们基因的能力。最广为人知的慢病毒是人类免疫缺陷病毒(hiv),其使用其他病毒的包膜糖蛋白来靶向广泛的细胞类型。[0785]可以如下制备慢病毒。克隆pcases10(其含有慢病毒移转质粒主干)后,将低传代(p=5)的hek293ft接种到t-75烧瓶中,在转染前一天在含10%胎牛血清不含抗生素的dmem中达到50%汇合。20小时后,将培养基更换为optimem(无血清)培养基,4小时后进行转染。细胞用10μg慢病毒移转质粒(pcases10)和以下包装质粒转染:5μgpmd2.g(vsv-g假型)和7.5μgpspax2(gag/pol/rev/tat)。转染可在4mloptimem中使用阳离子脂质递送剂(50μllipofectamine2000和100ulplus试剂)进行。6小时后,将该培养基更换为不含抗生素的含10%胎牛血清的dmem。这些方法在细胞培养过程中使用血清,但无血清的方法是优选的。[0786]可以如下纯化慢病毒。48小时后收获病毒上清液。上清液首先清除残渣并经0.45μm低蛋白结合(pvdf)过滤器过滤。然后将它们在超速离心机中以24,000rpm的速度旋转2小时。病毒沉淀物在50μldmem中重悬于4℃下过夜。然后将它们等分分装并立即在-80℃下冷冻。[0787]在另一个实施方式中,还检视了基于马传染性贫血病毒(eiav)的最小非-灵长类慢病毒载体。在另一个实施方式中,tm,一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达经由视网膜下注射而预期被递送的血管抑制素蛋白质内皮抑素和血管抑素。在另一个实施方式中,检视了使用自我-灭活的慢病毒载体。[0788]该系统的任何rna,例如向导rna或编码碱基编辑器的mrna,都能以rna的形式被递送。可以使用体外转录生成编码碱基编辑器的mrna。例如,可以使用含有以下元件的pcr框合成核酸酶mrna:t7启动子、可选的kozak序列(gccacc)、核酸酶序列和3’utr,诸如来自β珠蛋白-polya尾巴的3’utr。该框可用于经由t7聚合酶的转录。也可以使用体外转录从含有t7启动子的框中转录向导多核苷酸(例如grna),紧随该t7启动子的是序列“gg”和向导多核苷酸序列。[0789]为了增强表达并减低可能的毒性,可以修饰编码碱基编辑器的序列和/或向导核酸以包含一种或多种经修饰的核苷,例如,使用假-u或5-甲基-c的核苷。[0790]aav载体的小的包装能力使得超过该大小的一些基因的递送和/或大的生理调节元件的使用具有挑战性。这些挑战可以通过例如将待递送的一个(或多个)蛋白质分成两个或更多个片段来解决,其中n末端片段与断裂内含肽-n融合,而c末端片段与断裂内含肽-c融合。然后将这些片段包装到两个或多个aav载体中。在一个实施方式中,内含肽用于连接被嫁接到aav衣壳蛋白上的多效应器碱基编辑器蛋白的片段或部分。如本文所用,“内含肽”是指将其两侧翼的n末端和c末端的外显肽(例如,待连接的片段)连接起来的自-剪接的蛋白质内含子(例如,肽)。某些内含肽用于连接异源性蛋白片段是描述于例如wood等、j.biol.chem.289(21);14512-9(2014)中。例如,当被融合到分开的蛋白质片段时,内含肽intn和内含肽intc相互识别、剪接自身并同时将侧翼的与它们融合的蛋白质片段的n末端和c末端的外显肽连接起来,从而重构了来自两个蛋白质片段的全长蛋白质。其他适合的内含肽对于本领域技术人员将是显而易见的。[0791]本发明的融合蛋白的片段的长度可以变化。在一些实施方式中,蛋白质片段的长度范围为从2个氨基酸至约1000个氨基酸。在一些实施方式中,蛋白质片段的长度范围为从约5个氨基酸至约500个氨基酸。在一些实施方式中,蛋白质片段的长度范围为从约20个氨基酸至约200个氨基酸。在一些实施方式中,蛋白质片段的长度范围为从约10个氨基酸至约100个氨基酸。其他长度的适合的蛋白质片段对本领域技术人员将是显而易见的。[0792]在一个实施方式中,通过将大的转基因表达框断裂成两个分开的两半(5′和3′末端,或头和尾)来生成双重aav载体,其中该框的每一半被包装进单个aav载体中(其《5kb)。然后,通过两个双重aav载体共-感染同一细胞,然后进行以下操作即可实现全长转基因表达框的重新-组装:(1)5'和3'基因组(双重aav重叠载体)之间的同源重组(hr);(2)itr-介导的5'和3'基因组的尾对头的连环体化(双重aav反式-剪接载体);或(3)这两种机制的组合(双重aav杂合载体)。在体内使用双重aav载体导致全长蛋白质的表达。双重aav载体平台的使用代表了大于4.7kb大小的转基因的有效且可行的基因移转策略。[0793]内含肽[0794]在一些实施方式中,核酸酶的一部分或片段(例如cas9)与内含肽融合。该核酸酶可以被融合到该内含肽的n端或c端。在一些实施方式中,融合蛋白的一部分或片段融合到内含肽并且融合到aav衣壳蛋白。所述内含肽、核酸酶和衣壳蛋白能以任何排列被融合在一起(例如,核酸酶-内含肽-衣壳,内含肽-核酸酶-衣壳,衣壳-内含肽-核酸酶等)。在一些实施方式中,将内含肽的n端融合到融合蛋白的c端,并将内含肽的c端融合至aav衣壳蛋白的n端。[0795]内含肽(中介蛋白)是在多种生物体中发现的自动-加工结构域,其执行称为蛋白质剪接的过程。蛋白质剪接是一个多-步骤的生化反应,其包括切开和肽键的形成。尽管蛋白质剪接的内源性底物是在含有内含肽的生物体中发现的蛋白质,但内含肽也可被用于化学性操控几乎任何多肽主干。[0796]在蛋白质剪接中,所述内含肽通过切开两个肽键将自身从前体多肽中切除出来,从而经由新肽键的形成来连接两侧翼的外显肽(外部蛋白)序列。这种重排发生在翻译之后(或可能与翻译同步)。内含肽-介导的蛋白质剪接自发地发生,其只需要内含肽结构域的折叠。[0797]大约5%的内含肽是断裂内含肽,其被转录并翻译为两个单独的多肽,即n-内含肽和c-内含肽,其各自融合到一个外显肽上。一经翻译,所述内含肽片段自发地和非-共价地组装成正准的内含肽结构以进行反式的蛋白质剪接。蛋白质剪接的机制需要一系列酰基-转移反应,其导致在内含肽-外显肽接合处的两个肽键的切开,以及在n-外显肽和c-外显肽之间新肽键的形成。该过程的启动是通过活化连接n-外显肽和该内含肽n端的肽键。几乎所有内含肽在其n端均具有半胱氨酸或丝氨酸,其可攻击n-外显肽c末端残基的羰基碳。保守的苏氨酸和组氨酸(称为txxh基序)以及常见的天冬氨酸促进了这种n到o/s的酰基-移位,其导致线性(硫)酯中间体的形成。接下来,该中间体通过对第一个c-外显肽残基(+1)(该残基是半胱氨酸、丝氨酸或苏氨酸)的亲核攻击被反式-(硫)酯化。所得到的分枝(硫)酯中间体可通过独特的转型作用而被变形:内含肽的高度保守的c末端天冬酰胺的环化反应。(发现于高度保守的hnf基序中的)组氨酸和内含肽次末端的组氨酸可促进该过程,并且也可能涉及所述天冬氨酸。此琥珀酰亚胺的形成反应从反应复合体中切除所述内含肽,并留下通过非-肽键合附接的所述外显肽。此结构以独立于内含肽的方式迅速地重排成一稳定的肽键。[0798]在一些实施方式中,碱基编辑器(例如abe、cbe)的n末端片段融合到断裂内含肽-n上,并且c末端片段融合到断裂内含肽-c上。然后将这些片段包装到两个或多个aav载体中。某些内含肽用于连接异源性蛋白片段是描述于例如wood等、j.biol.chem.289(21);14512-9(2014)。例如,当被融合到分开的蛋白质片段时,内含肽intn和内含肽intc相互识别、剪接自身并同时将侧翼的与它们融合的蛋白质片段的n末端和c末端的外显肽连接起来,从而重构了来自两个蛋白质片段的全长蛋白质。其他适合的内含肽对于本领域技术人员将是显而易见的。[0799]在一些实施方式中,abe在spcas9的选定区域内的ala、ser、thr或cys残基处被断裂为n末端片段和c末端片段。这些区域对应于通过cas9晶体结构分析所鉴别出的环区域。每个片段的n端融合到内含肽-n,而每个片段的c端融合到内含肽c,且该融合是在s303、t310、t313、s355、a456、s460、a463、t466、s469、t472、t474、c574、s577、a589和s590氨基酸位置处,其在以下序列中以粗体大写字母示出。[0800][0801][0802]使用核碱基编辑器以靶向突变[0803]如本文所述,评估了靶向一个或多个突变的核碱基编辑器或多-效应器核碱基编辑器的适宜性。在一个实施方式中,用碱基编辑系统与少量的编码报告基因(例如gfp)的载体一起转导单个目标细胞。这些细胞可以是被本领域已知的任何细胞系,包含永生化的人类细胞系,诸如293t,k562或u20s。或者,可以使用原代(例如人类)细胞。此种细胞可能与最终的细胞靶标有关。[0804]可以使用病毒载体执行递送。在一个实施方式中,可使用脂质转染(例如lipofectamine试剂或fugene试剂)或通过电穿孔执行转染。转染后,可以通过荧光显微镜或流式细胞术确定gfp的表达,以确认一致且高水平的转染。这些初步的转染可以包括不同的核碱基编辑器,以确定哪些编辑器的组合给出最大的活性。[0805]如本文所述评估了所述核碱基编辑器的活性,即,通过对细胞的基因组测序以检测靶序列中的改变。为了sanger测序,将纯化的pcr扩增子克隆到质粒主干中、进行转化、使用miniprep小量制备并使用单个引物测序。测序也可使用下一代测序技法来进行。当使用下一代测序时,扩增子可能为300-500bp,而其预期的切割位点为不对称安插的。pcr之后,可将下一代测序的接头和索引序列条码(例如illumina多重接头和索引)添加至扩增子的末端,例如用于高通量测序(例如在illuminamiseq系统上)。[0806]可以选择在初始测试中诱导了最高水平的靶标特异性改变的融合蛋白,以供进一步评估。[0807]在特定实施方式中,所述核碱基编辑器或多-效应器碱基编辑器用于靶向目标多核苷酸。在一个实施方式中,将本发明的核碱基编辑器或多-效应器碱基编辑器与向导rna一起递送到细胞(例如,造血细胞或其祖细胞、造血干细胞和/或诱导的多能干细胞)中,该向导rna用于靶向细胞基因组内的目标突变,从而改变所述突变。在一些实施方式中,碱基编辑器被向导rna靶向以对目标基因的序列引入一个或多个编辑。[0808]在一个实施方式中,核碱基编辑器或多-效应器核碱基编辑器用于靶向调节序列,包含但不限于剪接位点、增强子和转录调节元件。然后使用本领域已知的任何方法测定所述改变对受该调节元件控制的基因的表达的影响。[0809]在其他实施方式中,本发明的核碱基编辑器或多-效应器核碱基编辑器用于靶向编码互补决定区(cdr)的多核苷酸,从而在表达出的cdr中产生改变。然后,例如通过测量cdr与其抗原的特异性结合,来测定这些改变对cdr功能的影响。[0810]在其他实施方式中,本发明的多-效应器核碱基编辑器用于靶向生物体的基因组内的目标多核苷酸。在一个实施方式中,将本发明的多-效应器核碱基编辑器与向导rna文库一起递送到细胞中,该向导rna文库用于铺到细胞基因组内的各种序列上,从而系统地改变整个基因组中的序列。[0811]该系统可以包括一个或多个不同的载体。在一个方面,该碱基编辑器是密码子优化过的以供在期望的细胞类型中表达,优选真核细胞,优选哺乳动物细胞或人类细胞。[0812]一般而言,密码子优化是指为了在目标宿主细胞中增强的表达而修饰核酸序列的过程,其通过用在该宿主细胞的各基因中更频繁或最频繁使用的密码子取代了所述原生序列的至少一个密码子(例如,约或多于约1、2、3、4、5、10、15、20、25、50个或更多个密码子)并且同时维持了原生的氨基酸序列。各种物种对特定氨基酸的某些密码子展现出特定的偏移。密码子偏倚(生物体之间密码子使用的差异)通常与信使rna(mrna)的翻译效率相关,而信使rna的翻译效率又被认为取决于被翻译密码子的特性和特定转移rna(trna)分子的可得性等。细胞中所选定的trna的优势通常反映了肽合成中最常用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中以供最佳的基因表达。密码子使用表很容易获得,例如,在www.kazusa.orjp/codon/(于2002年7月9日访问)上可得的“密码子使用数据库”,并且这些表格可以通过多种方式加以调整。参见nakamura、y.等,“源自国际dna序列数据库中的密码子使用列表:2000年的现况”nucl.acidsres.28:292(2000)。用于密码子优化特定序列以供在特定宿主细胞中表达的计算机算法也是可得的,诸如geneforge平台(aptagen公司;jacobus,宾夕法尼亚州)。在一些实施方式中,编码工程化的核酸酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个或更多个,或所有密码子)对应于特定氨基酸的最常用的密码子。[0813]包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。此种细胞包含:包装腺病毒的293细胞和包装逆转录病毒的psi.2细胞或pa317细胞。用于基因治疗的病毒载体通常是通过生产将核酸载体包装成病毒颗粒的细胞系来生成的。所述载体通常含有包装和后续整合到宿主中所需的最小限度的病毒序列,其他的病毒序列被以供待表达的一个或多个多核苷酸的表达框所取代。缺失的病毒功能通常由所述包装细胞系反式地提供。例如,用于基因治疗的aav载体通常仅持有来自aav基因组的itr序列,该序列是包装和整合到宿主基因组中所需的。病毒dna可以在细胞系中被包装,所述细胞系包含辅助者质粒,其编码其他aav基因,即rep和cap,但欠缺itr序列。该细胞系也可以用腺病毒作为辅助者而被感染。该辅助者病毒可以促进aav载体的复制和来自辅助者质粒中的aav基因的表达。在一些情况下,由于欠缺itr序列,所述辅助者质粒没有被大量包装。腺病毒的污染可以被减低,例如,通过热处理(腺病毒对其比aav更敏感)。[0814]多-效应器核碱基编辑器的应用[0815]所述多-效应器核碱基编辑器可用于靶向目标多核苷酸以产生修饰蛋白质表达的改变。在一个实施方式中,多-效应器核碱基编辑器用于修饰非-编码或调节序列,包含但不限于剪接位点、增强子和转录调节元件。然后使用本领域已知的任何方法测定所述改变对受该调节元件控制的基因的表达的影响。在一个特定的实施方式中,多-效应器核碱基编辑器能够实质上地改变调节序列,从而废除其调节基因表达的能力。有利地,不同于其他rna-可编程的核酸酶,这可以在基因组靶序列中不生成双-股断裂的情况下完成。[0816]所述多-效应器核碱基编辑器可用于靶向目标多核苷酸以产生可修饰蛋白质活性的改变。就诱变的情境而言,例如,与容易出错的pcr和其他基于聚合酶的方法相比,多-效应器核碱基编辑器具有一些优势。因为本发明的多-效应器核碱基编辑器在靶区域中的多个碱基处产生改变,所以相对于由容易出错的pcr引入的突变(不太可能在蛋白质水平表达),此类突变更有可能在蛋白质水平表达,考虑到密码子中的单个核苷酸变化可能仍编码相同的氨基酸(例如,密码子简并性)。不同于容易出错的pcr,其诱导整个多核苷酸的随机改变,本发明的多-效应器核碱基编辑器可用于靶向目标蛋白的小区域内或限定区域内的特定氨基酸。[0817]在其他实施方式中,本发明的多-效应器核碱基编辑器用于靶向生物体基因组内的目标多核苷酸。在一个实施方式中,该生物体是微生物组中的细菌(例如,拟杆菌门(bacteriodetes),疣微菌门(verrucomicrobia),厚壁菌门(firmicutes);γ-变形菌纲(gammaproteobacteria),α-变形菌纲(alphaproteobacteria),拟杆菌纲(bacteriodetes),梭菌纲(clostridia),丹毒丝菌纲(erysipelotrichia),芽孢杆菌纲(bacilli);肠杆菌目(enterobacteriales),拟杆菌目(bacteriodales),疣微菌目(verrucomicrobiales),梭菌目(clostridiales),丹毒丝菌目(erysiopelotrichales),乳杆菌目(lactobacillales);肠杆菌科(enterobacteriaceae),拟杆菌科(bacteroidaceae),丹毒丝菌科(erysiopelotrichaceae),普雷沃氏菌科(prevotellaceae),红蝽菌科(coriobacteriaceae),以及产碱菌科(alcaligenaceae);埃希氏菌属(escherichia),拟杆菌属(bacteroides),理研菌科的(另枝菌)属(alistipes),疣微菌科的(阿克曼)属(akkermansia),梭菌属(clostridium),乳杆菌属(lactobacillus))。在另一个实施方式中,该生物体是农业上重要的动物(例如奶牛,绵羊,山羊,马,鸡,火鸡)或植物(例如大豆,小麦,玉米,水稻,烟草,苹果,葡萄,桃子,李子,樱桃)。在一个实施方式中,将本发明的多-效应器核碱基编辑器与向导rna文库一起递送到细胞中,该向导rna文库用于铺到细胞的基因组内的各种序列上,从而系统地改变整个基因组中的序列。[0818]可在各种蛋白质的任何一个中制造突变,以促进结构功能分析或改变该蛋白质的内源活性。可在,例如酶(例如,激酶,磷酸酶,羧化酶,磷酸二酯酶)中或在酶底物中,在受体或其配体中,以及在抗体及其抗原中制造突变。在一个实施方式中,多-效应器核碱基编辑器靶向:编码该酶的活性位点的核酸分子,编码该受体的配体结合位点的核酸分子,或编码抗体的互补决定区(cdr)的核酸分子。对于酶而言,在活性位点诱导突变可能会增加、降低或废除该酶的活性。突变对酶的影响在酶活性测定中被定性,该测定包含本领域已知和/或对熟练技术人员显而易见的一些测定中的任何测定。对于受体而言,在配体结合位点制造的突变可能会增加、减少或废除受体对其配体的亲和力。此类突变的影响在受体/配体结合测定法中被测定,该测定法包含本领域已知和/或对熟练技术人员显而易见的一些测定法中的任何测定。对于cdr而言,在cdr内制造的突变可增加、减少或废除与抗原的结合。此外,在cdr内制造的突变可改变抗体对抗原的特异性。然后例如通过测量该cdr与其抗原的特异性结合或在任何其他类型的免疫测定中测定这些改变对cdr功能的影响。[0819]药物组合物[0820]本公开揭露的其他方面涉及药物组合物,其包括本文所述的任何碱基编辑器、融合蛋白或融合蛋白-向导多核苷酸复合体。在一些实施方式中,该药物组合物还包括药学上可接受的载体。在一些实施方式中,该药物组合物包括另外的剂(例如,用于特异性递送的、增加半衰期的或其他治疗性的化合物)。[0821]适合的药学上可接受的载体通常包括惰性物质,其有助于将药物组合物施用于受试者,有助于将药物组合物加工成可递送的制品,或有助于在给药前储存药物组合物。药学上可接受的载体可以包含能够稳定、优化或以其他方式改变制剂的形式、稠度、粘度、ph、药代动力学、溶解度的剂。[0822]可以充当药学上-可接受的载体的材料的一些非限制性例子包括:(1)糖,诸如乳糖,葡萄糖和蔗糖;(2)淀粉,诸如玉米淀粉和马铃薯淀粉;(3)纤维素,及其衍生物,诸如羧甲基纤维素钠,甲基纤维素,乙基纤维素,微晶纤维素和乙酸纤维素;(4)黄芪粉;(5)麦芽;(6)明胶;(7)润滑剂,诸如硬脂酸镁,月桂基硫酸钠和滑石;(8)赋形剂,诸如可可脂和栓剂蜡;(9)油,诸如花生油,棉籽油,红花油,芝麻油,橄榄油,玉米油,大豆油等;(10)二醇,诸如丙二醇;(11)多元醇,诸如甘油,山梨糖醇,甘露糖醇和聚乙二醇(peg);(12)酯,诸如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,诸如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗生理盐水;(18)林格式溶液;(19)乙醇;(20)ph缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酐;(22)填充剂,诸如多肽和氨基酸;(23)血清醇,诸如乙醇;以及(23)药物制剂中使用的其他无毒相容性物质。制剂中也可以存在:缓冲剂、润湿剂、乳化剂、稀释剂、包封剂、皮肤渗透促进剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、加香剂、防腐剂和抗氧化剂。例如,载体可包含但不限于:盐水、缓冲盐水、右旋葡萄糖、精氨酸、蔗糖、水、甘油、乙醇、山梨糖醇、葡聚糖、羧甲基纤维素钠及其组合。[0823]药物组合物可以包括一种或多种ph缓冲化合物,以将制剂的ph维持在反映生理ph的预定水平,诸如在约5.0至约8.0的范围内。用于水性液体制剂的ph缓冲化合物可以是氨基酸或氨基酸混合物,诸如组氨酸,或诸如组氨酸和甘氨酸的氨基酸混合物。或者,该ph缓冲化合物优选地是将制剂的ph维持在预定水平,诸如在约5.0至约8.0的范围内,并且不螯合钙离子的剂。此种ph缓冲化合物的说明性实例包含,但不限于,咪唑和乙酸根离子。该ph缓冲化合物能以适合将制剂的ph维持在预定水平的任何数量存在。[0824]药物组合物亦可含有一种或多种渗透调节剂,即,将该制剂的渗透特性(例如,张性,渗透度和/或渗透压)调节至接收者个体的血流和血细胞可接受的水平的化合物。该渗透调节剂可以是不螯合钙离子的剂。该渗透调节剂可以是本领域技术人员已知或可获得的可调节制剂的渗透特性的任何化合物。本领域技术人员可凭经验确定给定的渗透调节剂用于本发明制剂的适用性。适合类型的渗透调节剂的说明性实例包含但不限于:盐,诸如氯化钠和乙酸钠;糖,诸如蔗糖,右旋葡萄糖和甘露醇;氨基酸,诸如甘氨酸;以及这些剂和/或剂类型中的一种或多种的混合物。该一种或多种渗透调节剂能以足以调节制剂的渗透特性的任何浓度存在。[0825]在一些实施方式中,将药物组合物配制成用于递送至受试者,例如用于基因编辑。在一些实施方式中,本文所预期的药物组合物的施用可使用传统技法进行,包含但不限于输液、移注或非消化道给药。在一些实施方式中,非消化道给药包含:血管内、静脉内、肌肉内、动脉内、鞘内、肿瘤内、皮内、腹膜内、经气管、皮下、透皮、关节内、囊下、蛛网膜下和胸骨内的输液或注射。在一些实施方式中,施用本文所述药物组合物的适合途径包含但不限于:局部,皮下,穿皮,皮内,病灶内,关节内,腹膜内,膀胱内,经粘膜,牙龈,齿内,耳蜗内,鼓室内,器官内,硬脊膜外,鞘内,肌肉内,静脉内,血管内,骨内,眼周,肿瘤内,脑内和脑室内给药。[0826]在一些实施方式中,本文所述的药物组合物是局部施用于疾病位置(例如,肿瘤位置)。在一些实施方式中,本文所述的药物组合物是通过注射,通过导管的方法,通过栓剂的方法,或通过植入物的方法而施用于受试者,该植入物为多孔,无孔,或凝胶状的材料,其包含膜,诸如硅橡胶膜,或纤维。[0827]在其他实施方式中,本文所述的药物组合物以控释系统递送。在一个实施方式中,可以使用泵(参见例如,langer、1990、science249:1527-1533;sefton、1989、crccrit.ref.biomed.eng.14:201;buchwald等、1980、surgery88:507;saudek等、1989、n.engl.j.med.321:574)。在另一个实施方式中,可以使用聚合物材料(参见例如《控释的医学应用》(langer和wise编、crc出版社、bocaraton、佛罗里达州、1974);《可控药物的生物可利用度,药物产品设计和性能》(smolen和ball编、wiley、纽约、1984);ranger和peppas、1983、macromol.sci.rev.macromol.chem.23:61。亦参见levy等、1985、science228:190;during等、1989、ann.neurol.25:351;howard等、1989、j.neurosurg.71:105)。讨论了其他的控释系统,例如,在前述langer的论文中。[0828]在一些实施方式中,根据常规程序将该药物组合物配制为适于静脉内或皮下给药给受试者(例如人)的组合物。在一些实施方式中,用于注射给药的药物组合物是在溶液中,该溶液是无菌等渗的并用作增溶剂和局部麻醉剂(诸如利多卡因以减轻注射位置的疼痛)。通常,将各成分要么分开提供,要么以单位剂型混合在一起提供,例如,作为干燥的冻干粉或无水浓缩物,其在标示有活性剂数量的气密密封容器诸如安瓿瓶或小药囊中。如果通过输液方式给药,可以将其分装到含有无菌药物级水或生理盐水的输液瓶中。如果通过注射施用该药物组合物,可以提供一安瓿瓶的无菌注射用水或生理盐水,以便可以在施用之前将各成分混合。[0829]用于全身给药的药物组合物可以是液体,例如无菌生理盐水、乳酸林格氏液或hank's溶液。另外,该药物组合物可以是固体形式,并且在使用前立即重新溶解或重新悬浮。亦检视了冻干形式。该药物组合物可以被容纳在脂质颗粒或囊泡内,诸如脂质体或微晶,其也适合于非消化道给药。该微粒可以为任何适合的结构,诸如单层或多层,只要其中容纳组合物即可。可以将化合物截留到“稳定化的质粒-脂质微粒”(splp)中,该微粒含有致融类脂质二油酰基磷脂酰乙醇胺(dope),低水平(5-10摩尔百分比)的阳离子脂质,并由聚乙二醇(peg)涂层使其稳定化(zhangy.p.等、genether.1999、6:1438-47)。带正电荷的脂质,诸如n-[l-(2,3-二油酰基氧基)丙基]-n,n,n-三甲基-甲基硫酸铵,或“dotap”,对于此类微粒和囊泡是特别优选的。此种脂质微粒的制备是众所周知的。参见例如,美国专利号4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;和4,921,757;其每个都通过引用并入本文。[0830]例如,本文所述的药物组合物可以作为单位剂量予以施用或包装。当用于指代本公开揭露的药物组合物时,术语“单位剂量”是指适合作为受试者的统一单元剂量的物理上离散的单位,而每个单位含有经计算可产生期望的治疗效果的预定数量的活性物质与相关联的所需的稀释剂,即载体或媒介物。[0831]此外,可以将该药物组合物作为药物试剂盒提供,其包括(a)含有冻干形式的本发明的化合物的容器,和(b)含有药学上可接受的稀释剂(例如无菌的,用于重构或稀释冻干的本发明的化合物的)的第二容器。可选的伴随此种一个或多个容器的可以是由规范药品或生物产品的制造、使用或销售的政府机构所规定的形式的行政命令,该行政命令反映了该机构对此用于人体给药的试剂盒制造、使用或出售的批准。[0832]在另一方面,包含了一种制品,其含有可用于治疗上述疾病的材料。在一些实施方式中,该制品包括容器和标签。适合的容器包含例如瓶子,小药瓶,注射器和试管。该容器可以由各种材料形成,诸如玻璃或塑料。在一些实施方式中,该容器容纳有效治疗本文所述疾病的组合物,并且可以具有无菌的存取口。例如,该容器可以是静脉注射溶液袋或具有可被皮下注射针刺穿的塞子的小药瓶。该组合物中的活性剂是本发明的化合物。在一些实施方式中,容器上的或与容器相关联的标签表明了该组合物用于治疗所选的疾病。该制品可以进一步包括第二容器,其包括药学上-可接受的缓冲液,诸如磷酸盐-缓冲生理盐水,林格氏溶液,或右旋葡萄糖溶液。从商业和使用者的角度来看,它还可以进一步包含其他材料,包含其他缓冲液,稀释剂,过滤器,针头,注射器和带有使用说明的包装插页。[0833]在一些实施方式中,本文所述的任何融合蛋白、grna和/或复合体是作为药物组合物的一部分被提供。在一些实施方式中,该药物组合物包括本文所提供的任何融合蛋白。在一些实施方式中,该药物组合物包括本文提供的任何复合体。在一些实施方式中,该药物组合物包括核糖核蛋白复合体,其包括与grna和阳离子脂质形成复合体的rna-导向的核酸酶(例如,cas9)。在一些实施方式中,药物组合物包括grna,核酸可编程的dna结合蛋白,阳离子脂质,和药学上可接受的赋形剂。药物组合物可以任选地包括一种或多种另外的治疗活性物质。[0834]在一些实施方式中,将本文所提供的组合物施用给受试者,例如人类受试者,以在受试者体内实现靶向的基因组修饰。在一些实施方式中,细胞是获自于受试者,并与本文所提供的任何药物组合物接触。在一些实施方式中,将从受试者体内取出并与药物组合物离体接触过的细胞重新-引入到受试者体内,其可选地是在细胞中已经实现或检测到所期望的基因组修饰之后。递送包括核酸酶的药物组合物的方法是已知的,并且被描述,例如在美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824中,其公开揭露的全部内容通过引用并入本文。尽管本文所提供的药物组合物的描述主要针对适合于施用给人的药物组合物,但是熟练技术人员应理解,此类组合物通常适合于给各种动物或生物体施用,例如,供兽医使用。[0835]为了使该组合物适合于向各种动物给药,对适合于向人给药的药物组合物的修饰是众所周知的,并且一般技术的兽医药理学家可以仅通过普通的实验(如果有的话)来设计和/或执行此种修饰。预期被施用该药物组合物的受试者包含但不限于,人类和/或其他灵长类;哺乳动物,家养动物,宠物,和与商业有关的哺乳动物,诸如牛,猪,马,绵羊,猫,狗,小鼠和/或大鼠;和/或鸟类,包含商业相关的鸟类,诸如鸡,鸭,鹅和/或火鸡。[0836]本文所述的药物组合物的制剂可以通过药理学领域中已知的或以后开发的任何方法来制备。通常,此种制备方法包含以下步骤:使(一种或多种)活性成分与赋形剂和/或一种或多种其他辅助成分相结合,然后,如果必要和/或期望,将产品成型和/或包装成为所需的单-剂量或多-剂量单位。药物制剂可另外包括药学上可接受的赋形剂,其如本文所用包含适用于所需特定剂型的任何的和所有的:溶剂,分散介质,稀释剂,或其他液体媒介物,分散或悬浮助剂,表面活性剂,等渗剂,增稠剂或乳化剂,防腐剂,固体粘合剂,润滑剂等。《remington:药学的科学与实践》、第21版、a.r.gennaro(lippincott、williams&wilkins出版社、巴尔的摩、马里兰州、2006;其全部内容通过引用并入本文)揭露了用于配制药物组合物的各种赋形剂及其制备的已知技法。关于用于生产包括核酸酶的药物组合物的其他适合的方法、试剂、赋形剂和溶剂,亦请参见pct申请pct/us2010/055131(公开号wo2011/053982a8、2010年11月2日提交),其全部内容通过引用并入本文。[0837]除非任何传统的赋形剂介质与某种物质或其衍生物不相容,诸如通过产生任何不良的生物学影响或以有害的方式与该药物组合物的任何其他组分相互作用,否则预期其使用范围是在本公开揭露的范围之内。[0838]如上所述的组合物可以用有效量给药。该有效量将取决于给药方式、所治疗的特定病况,和所期望的结果。它还可能取决于所述病况的阶段、受试者的年龄和身体状况、并行治疗的性质(如果有的话),以及医师所熟知的类似因素。对于治疗性的应用,它是足以达到医学上所期望结果的那个数量。[0839]在一些实施方式中,依据本公开揭露的组合物可用于治疗各种疾病,病症和/或病况中的任何一种。[0840]试剂盒,载体,细胞[0841]本公开揭露的各个方面提供了包括碱基编辑器系统的试剂盒。在一个实施方式中,该试剂盒包括核酸构建体,该核酸构建体包括编码核碱基编辑器融合蛋白的核苷酸序列。该融合蛋白包括一个或多个脱氨酶结构域(例如胞苷脱氨酶和/或腺嘌呤脱氨酶)和核酸可编程的dna结合蛋白(napdnabp)。在一些实施方式中,该试剂盒包括至少一种能够靶向目标核酸分子的向导rna。在一些实施方式中,该试剂盒包括核酸构建体,该核酸构建体包括编码至少一种向导rna的核苷酸序列。在一些实施方式中,该试剂盒包括核酸构建体,其包括编码以下的核苷酸序列:(a)如本文所提供的与腺苷脱氨酶和/或胞苷脱氨酶融合的cas9结构域;以及(b)驱动(a)的序列表达的异源启动子。[0842]在一些实施方式中,所述试剂盒提供了使用该试剂盒编辑一个或多个突变的说明书。该说明书通常包含关于使用该试剂盒编辑核酸分子的信息。在其他实施方式中,该说明书包含以下至少一项:注意事项;警告;临床研究;和/或参考文献。该说明书可直接印在容器上(如果有),或者作为贴在容器上的标签,或者作为单独的纸张、小册子、卡片或文件夹提供在容器中或随容器提供。在进一步的实施方式中,试剂盒可以包括标签或单独插页(包装插页)形式的以供适合的操作参数的说明书。在又一个实施方式中,该试剂盒可以包括一个或多个容器,其具有合适的阳性和阴性对照或对照样品,以用作检测、校准或均一化的标准。该试剂盒可以进一步包括包括药学上-可接受的缓冲液的第二容器,诸如(无菌的)磷酸盐-缓冲盐水、林格氏溶液或右旋葡萄糖溶液。它可以进一步包含从商业和用户的角度来看所期待的其他材料,包含其他缓冲液、稀释剂、过滤器、针头、注射器和带有使用说明书的包装插页。[0843]本公开揭露的一些方面提供了包括本文所提供的任何核碱基编辑器或多-效应器核碱基编辑器或融合蛋白的细胞。在一些实施方式中,所述细胞包括本文所提供的任何核苷酸或载体。[0844]除非另有说明,本发明的实践使用分子生物学(包含重组技法)、微生物学、细胞生物学、生物化学和免疫学的常规技法,其完全在本领域熟练人员的知识范围内。这些技法在文献中有充分的解释,诸如《分子克隆:实验室手册》第二版(sambrook,1989);《寡核苷酸合成》(gait,1984);《动物细胞培养》(freshney,1987);《酶学方法》《实验免疫学手册》(weir,1996);《用于哺乳动物细胞的基因移转载体》(miller和calos,1987);《当代实验方案-分子生物学》(ausubel,1987);《pcr:聚合酶链式反应》(mullis,1994);《当代实验方案-免疫学》(coligan,1991)。这些技法适用于本发明的多核苷酸和多肽的生产,因此,可以在制备和实践本发明时考虑这些技法。用于特定实施方式的特别有用的技法将在后面部分中讨论。[0845]提出以下实施例以向本领域普通技术人员提供如何制备和使用本发明的测定、筛选和治疗方法的完整公开揭露和描述,并非意图限制发明人所视其发明的范围。[0846]实施例[0847]实施例1:非靶脱氨反应减低的核碱基编辑器的构建[0848]核碱基编辑器(例如,通过连接子连接的crispr-cas蛋白和脱氨酶的融合蛋白)可用于将特定的点突变引入到靶多核苷酸中。然而,核碱基编辑器本身具有不需要的全基因组假性脱氨反应、旁观者突变和靶近端编辑的潜力。不受理论的束缚,缩短或去除来自碱基编辑器的连接子将减低潜在的不需要的脱氨反应事件和/或促进所期望的靶脱氨反应(图1)。这可能部分是由于减低了核碱基编辑器的脱氨酶结构域的有效活性半径。尽管通过x-射线晶体学已经确定了与dna结合的cas9的结构,但却没有碱基编辑发生之处的dna部分的结构信息。cas9的建模预测了碱基编辑发生之处的dna可能是在靠近cas9的2个位置(图2)。基于这些预测,将脱氨酶或其片段就定位在这些位置中的一个或多个具有促进在靶碱基编辑的同时也减低不期望的脱氨反应事件的潜力(图3)。在所述腺苷碱基编辑器(例如与tada融合的cas9)中鉴定出的几个区域适合tada脱氨酶或其片段的插入(图4至7)。因此,生成了腺苷脱氨酶碱基编辑器以将tada或其变体插入到cas9多肽中所述鉴别出的位置处。[0849]实施例2:用于测量在靶和脱靶脱氨反应的高通量体外测定[0850]开发了一种体外测定来评估核碱基编辑器和用于定性候选构建体,该测定测量在靶脱氨反应与非靶脱氨反应,包含假性脱氨反应。该测定的基于fret的版本使用荧光报告基因用于检测,但该测定可改造以用于基于凝胶的结果输出(图8)。用于体外脱氨反应测定的探针包含用于脱氨反应的底物,以及特别以供核碱基编辑器的底物(图8)。除了含有可以被脱氨基的核苷酸外,探针还可能包含pam序列、靶特异性序列等,甚至随机序列。使用探针组的脱氨反应可以并行执行(例如,高通量的形式)。底物的脱氨反应(c→u或a→i)使得底物可被脱氨反应特异性核酸内切酶(分别为user/核酸内切酶v)切开(图8)。底物的切开使得荧光报告蛋白与淬灭剂分子解偶联,从而生成荧光信号(图8)。高的在靶的与脱靶的荧光比率表明碱基编辑器是有效的。可以使用本领域已知的任何相互作用的荧光团和淬灭剂对或fret供体-受体对。在某些实施方式中,荧光团是fam、tet、hex、tamra、joe或rox中的一种或多种。在各种实施方式中,该淬灭剂是dabcyl、dabsyl、黑洞淬灭剂染料(包含5'iowarq(5iabrq))中的一种或多种。通常,该淬灭染料是激发匹配的淬灭染料。荧光团-猝灭剂对及其选择在,例如marras的“分子生物学方法:荧光能量移转核酸探针:设计和实验方案中的《用于荧光核酸杂交探针的荧光团和猝灭剂对的选择》”(编辑:v.v.humana出版公司、托托瓦、新泽西州)中进行了描述。[0851]作为该测定的展示,通过将腺苷碱基编辑器的在靶脱氨反应与存在spcas9(无脱氨反应结构域)或无蛋白质时发生的脱氨反应进行比较,而测定了该腺苷碱基编辑器生成脱靶脱氨反应的潜力(图9)。腺苷碱基编辑器反应所生成的荧光信号高于spcas9和无蛋白质的反应所生成的,表明abe的在靶碱基编辑是有效的。在另一个例子中,将腺苷碱基编辑器与反式腺苷碱基编辑(abe-tada)(其中spcas9与tada反式存在)进行了比较(图10)。与abe-tada、spcas9和无蛋白质的反应相比,abe生成了更高的荧光,并且其在靶碱基编辑是有效的。可以在这个测定中测试用于假性脱靶碱基编辑的潜在底物,包含单-股结构和分枝的结构,其可能反映基因组中的其他结构(例如,dna“呼吸”,复制叉,转录活性dna等)(图11)。[0852]实施例3:评估顺式和反式的脱氨酶活性的测定[0853]开发了一种测定以区分顺式的(脱氨反应结构域与crispr-cas共价结合)和反式的(具有反式提供的脱氨反应结构域的crispr-cas蛋白)脱氨酶活性(图12)。顺式发生的脱氨反应表示通过靶向的碱基编辑的脱氨反应,而反式的脱氨反应表示假性脱氨反应。顺式活性与反式活性的高比率表示具有减低的假性脱氨反应的脱氨酶是是有效的碱基编辑器。[0854]在所述顺式-反式测定中测试了大鼠apobec1。简言之,用表达所述碱基编辑器be4(rapobec1-ncas9-ugi-ugi),rapobec1和ncas9,ncas9和向导rna,或rapobec1和向导rna的构建体转染了hek293t细胞。从该细胞中分离了基因组dna并获得了4个基因组靶位点处的测序。在所有位点处,与反式脱氨酶活性以及缺少至少一个靶向碱基编辑组分的其他对照反应相比,rapobec1显示出更高的顺式脱氨酶活性(图13)。同样地,与反式脱氨酶活性和其他脱氨反应事件相比,tada7.10也显示出更高的顺式脱氨酶活性(图14)。为了知晓独立于向导的腺苷碱基编辑器的反式影响,将sacas9-abe和sacas9向导,与spcas9-abe和sacas9向导,以及空间位阻的abe变体和sacas9向导结合进行了测试(图15)。在这种情境下,spcas9-abe对碱基编辑器情境中的tada-tada7.10显示出较低的反式活性。使用来自所述sacas9向导测定的反式测量以及abe及空间位阻abe变体的活性而估算了abe和空间位阻abe变体的顺式/反式活性比。abe和空间位阻abe变体的经估算的比率是相对高的。也进行了顺式和反式的剂量反应研究以确定是否可以通过剂量而调节高的顺式相对于反式的活性(例如,随着剂量增加,顺式活性比反式活性增加得更快)。在所测试的条件下,未观察到顺式相对于反式的活性的剂量反应(图16至18)。[0855]所述顺式-反式测定用于评估各种脱氨酶(于下表9中列出)以供减低的假性脱氨反应:[0856]表9.使用顺式-反式测定所筛选的脱氨酶[0857][0858]有趣的是,几种脱氨酶显示出高的顺式/反式活性,包含ppapobec-2、mapobec-2、mapobec-3和mfapobec-4。[0859]rapobec-1大鼠(rattusnorvegicus)[0860]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[0861]mapobec-1小鼠(musmusculus)[0862]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[0863]maapobec-1黄金仓鼠(mesocricetusauratus)[0864]mssetgpvvvdptlrrriephefdaffdqgelrketcllyeirwggrhniwrhtgqntsrhveinfiekftseryfypstrcsivwflswspcgecskaiteflsghpnvtlfiyaarlyhhtdqrnrqglrdlisrgvtirimteqeycycwrnfvnyppsnevywprypnlwmrlyalelycihlglppclkikrrhqypltffrlnlqschyqripphilwatgfi[0865]hapobec-1智人(homosapiens)[0866]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[0867]ppapobec-1婆罗洲猩猩(pongopygmaeus)[0868]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlfwhmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwr[0869]ocapobec1穴兔(oryctolaguscuniculus)[0870]masekgpsnkdytlrrriepwefevffdpqelrkeacllyeikwgassktwrssgknttnhvevnflekltsegrlgpstccsitwflswspcwecsmaireflsqhpgvtliifvarlfqhmdrrnrqglkdlvtsgvtvrvmsvseycycwenfvnyppgkaaqwprypprwmlmyalelyciilglppclkisrrhqkqltffsltpqychykmippyillatgllqpsvpwr[0871]mdapobec-1灰短尾负鼠(monodelphisdomestica)[0872]mnsktgpsvgdatlrrrikpwefvaffnpqelrketcllyeikwgnqniwrhsnqntsqhaeinfmekftaerhfnssvrcsitwflswspcwecskairkfldhypnvtlaifisrlywhmdqqhrqglkelvhsgvtiqimsyseyhycwrnfvdypqgeedywpkypylwimlyvlelhciilglppclkisgshsnqlalfsldlqdchyqkipynvlvatglvqpfvtwr[0873]mapobec-2小鼠(musmusculus)[0874]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0875]hapobec-2智人(homosapiens)[0876]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[0877]ppapobec-2婆罗洲猩猩(pongopygmaeus)[0878]maqkeeaaaateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweeleiqdalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[0879]btapobec-2牛(bostaurus)[0880]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0881]mapobec-3小鼠(musmusculus)[0882]mqpqrlgpragmgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyisvpssssstlsnicltkglpetrfwvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms[0883]hapobec-3a智人(homosapiens)[0884]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[0885]hapobec-3b智人(homosapiens)[0886]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgqvyfkpqyhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflsehpnvtltisaarlyyywerdyrralcrlsqagarvtimdyeefaycwenfvynegqqfmpwykfdenyaflhrtlkeilrylmdpdtftfnfnndplvlrrrqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqnqgn[0887]hapobec-3c智人(homosapiens)[0888]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswfcddilspntkyqvtwytswspcpdcagevaeflarhsnvnltiftarlyyfqypcyqeglrslsqegvaveimdyedfkycwenfvyndnepfkpwkglktnfrllkrrlreslq[0889]hapobec-3d智人(homosapiens)[0890]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgpvlpkrqsnhrqevyfrfenhaemcflswfcgnrlpanrrfqitwfvswnpclpcvvkvtkflaehpnvtltisaarlyyyrdrdwrwvllrlhkagarvkimdyedfaycwenfvcnegqpfmpwykfddnyaslhrtlkeilrnpmeamyphifyfhfknllkacgrneswlcftmevtkhhsavfrkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlcyfwdtdyqeglcslsqegasvkimgykdfvscwknfvysddepfkpwkglqtnfrllkrrlreilq[0891]hapobec-3f智人(homosapiens)[0892]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[0893]hapobec-3g智人(homosapiens)[0894]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[0895]hapobec-4智人(homosapiens)[0896]mepiyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttfpqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilysnnpcneanhcciskmynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfisgvsgshvfqpiltgraladrhnayeinaitgvkpyftdvllqtkrnpntkaqealesyplnnafpgqffqmpsgqlqpnlppdlrapvvfvlvplrdlppmhmgqnpnkprnivrhlnmpqmsfqetkdlgrlptgrsveiveiteqfasskeadekkkkkgkk[0897]mapobec-4小鼠(musmusculus)[0898]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[0899]rapobec-4大鼠(rattusnorvegicus)[0900]meplyeeylthsgtivkpyywlsvslnctncpyhirtgeearvpytefhqtfgfpwstypqtkhltfyelrsssgnliqkglasnctgshthpesmlferdgyldslifhdsnirhiilysnnspcdeanhcciskmynflmnypevtlsvffsqlyhtenqfptsawnrealrglaslwpqvtlsaisggiwqsiletfvsgisegltavrpftagrtltdrynayeincitevkpyftdalhswqkenqdqkvwaasenqplhnttpaqwqpdmsqdcrtpavfmlvpyrdlppihvnpspqkprtvvrhlntlqlsaskvkalrkspsgrpvkkeearkgstrsqeanetnkskwkkqtlfiksnichllereqkkigilsswsv[0901]mfapobec-4食蟹猕猴(macacafascicularis)[0902]meptyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttypqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilycnnspcneanhcciskvynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfvsgvsgshvfqpiltgraltdrynayeinaitgvkpfftdvllhtkrnpntkaqmalesyplnnafpgqsfqmtsgippdlrapvvfvllplrdlppmhmgqdpnkprniirhlnmpqmsfqetkdlerlptrrsvetveiterfasskqaeektkkkkgkk[0903]haid智人(homosapiens)[0904]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[0905]claid犬(canislupusfamiliaris)[0906]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[0907]btaid牛(bostaurus)[0908]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[0909]maid小鼠(musmusculus)[0910]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[0911]pmcda-1海七鳃鳗(petromyzonmarinus)[0912]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrv[0913]pmcda-2海七鳃鳗(petromyzonmarinus)[0914]melrevvdcalascvrheplsrvaflrcfaapsqkprgtvilfyvegagrgvtgghavnynkqgtsihaevlllsavraallrrrrcedgeeatrgctlhcystyspcrdcveyiqefgastgvrvvihccrlyeldvnrrrseaegvlrslsrlgrdfrlmgprdaialllggrlantadgesgasgnawvtetnvveplvdmtgfgdedlhaqvqrnkqireayanyasavslmlgelhvdpdkfpflaeflaqtsvepsgtpretrgrprgassrgpeigrqrpadferalgayglflhprivsreadreeikrdlivvmrkhnyqgp[0915]pmcda-5海七鳃鳗(petromyzonmarinus)[0916]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlft[0917]ycd酿酒酵母(saccharomycescerevisiae)[0918]mvtggmaskwdqkgmdiayeeaalgykeggvpiggclinnkdgsvlgrghnmrfqkgsatlhgeistlencgrlegkvykdttlyttlspcdmctgaiimygiprcvvgenvnfkskgekylqtrghevvvvdderckkimkqfiderpqdwfedige[0919]rapobec-1(δ177-186)[0920]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrglppclnilrrkqpqltfftialqschyqrlpphilwatglk[0921]rapobec-1(δ202-213)[0922]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqhyqrlpphilwatglk[0923]实施例4:cbe和abe内部融合的构建[0924]通过将脱氨酶克隆到spcas9或具有d10a突变的spcas9切口酶内的高b-因子位置中而生成cbe和abe内部融合构建体。在一些情况下,所述cas9的结构性或功能性结构域被部分地或全部地删除并被tada结构域所取代(ibe020)。cbe是以相同方式被插入,并且在其c末端上被尿嘧啶dna糖基化酶抑制剂(ugi)结构域所修饰。[0925]示例性的内部融合碱基编辑器在下表10中提供:表10:[0926][0927][0928]所述构建体的序列提供如下。[0929]cas9tadains1015[0930]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgactacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0931]cas9tadains1015[0932]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0933]cas9tadains1022[0934]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0935]cas9tadains1022[0936]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0937]ibe003_cas9:cas9tadains1029[0938]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0939]cas9tadains1029[0940]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0941]ibe004_cas9:cas9tadains1040[0942]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0943]cas9tadains1040[0944]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0945]ibe005_cas9:cas9tadains1068[0946]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0947]cas9tadains1068[0948]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdtgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0949]ibe006_cas9:cas9tadains1247[0950]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggcggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgactcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0951]cas9tadains1247[0952]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0953]ibe007_cas9:cas9tadains1054[0954]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0955]cas9tadains1054[0956]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0957]ibe008_cas9:cas9tadains1026[0958]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgaccaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0959]cas9tadains1026[0960]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaksegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0961]ibe009_cas9:cas9tadains768[0962]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0963]cas9tadains768[0964]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0965]ibe020_delt:δhnhtada792[0966]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggctccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0967]δhnhtada792[0968]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0969]ibe021_n-te:n末端融合单一tada螺旋截短的165-end[0970]atgtccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggtctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0971]ibe021_n-te:n末端融合单一tada螺旋截短的165-end[0972]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0973]ibe029_isla:tada-cp116ins1067[0974]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0975]ibe029_isla:tada-cp116ins1067[0976]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietnmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypggetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0977]ibe031_isla:tadacp136ins1248[0978]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctccatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0979]ibe031_isla:tadacp136ins1248[0980]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0981]ibe032_isla:tadacp136ins1052[0982]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0983]ibe032_isla:tadacp136ins1052[0984]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlamnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgngeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0985]ibe035_isla:δ792-872tadains[0986]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggctccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0987]ibe035_isla:δ792-872tadains[0988]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdeevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0989]ibe036_isla:δ792-906tadains[0990]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggctccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0991]ibe036_isla:δ792-906tadains[0992]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0993]ibe043_isla:tadacp65ins1246[0994]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggcactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcaggtctttaacgcccagaaaaaagcacaatcctctactgacggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgacccctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0995]ibe043_isla:tadacp65ins1246[0996]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0997]ibe044_isla:tadainsc末端截短2791tggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggttccgaagtcgagttttcccatgagtactggatgagacacgcattgactctcgcaaagagggctcgagatgaacgcgaggtgcccgtgggggcagtactcgtgctcaacaatcgcgtaatcggcgaaggttggaatagggcaatcggactccacgaccccactgcacatgcggaaatcatggcccttcgacagggagggcttgtgatgcagaattatcgacttatcgatgcgacgctgtacgtcacgtttgaaccttgcgtaatgtgcgcgggagctatgattcactcccgcattggacgagttgtattcggtgttcgcaacgccaagacgggtgccgcaggttcactgatggacgtgctgcattacccaggcatgaaccaccgggtagaaatcacagaaggcatattggcggacgaatgtgcggcgctgttgtgttacttttttcgcatgcccaggcagggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac[0998]ibe044_isla:tadainsc末端截短2791[0999]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1000]phrb-043_ggs-rap:rapobec1-xten-ins-位点[1001]1_y1016-d10a-ugix2[1002]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggcgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1003]phrb-043_ggs-rap:rapobec1-xten-ins-位点[1004]1_y1016-d10a-ugix2[1005]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvyggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessgdvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1006]phrb-044_ggs-rap:rapobec1-xtenins-位点[1007]2_a1023-d10a-ugix2[1008]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggcaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1009]phrb-044_ggs-rap:rapobec1-xtenins-位点[1010]2_a1023-d10a-ugix2[1011]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessgkseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1012]phrb-045_ggs-rap:rapobec1-xtenins-位点[1013]3_e1029-d10a-ugix2[1014]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1015]phrb-045_ggs-rap:rapobec1-xtenins-位点[1016]3_e1029-d10a-ugix2[1017]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeiggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessggkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1018]phrb-046_ggs-rap:rapobec1-xtenins-位点[1019]4_n1040-d10a-ugix2[1020]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggcatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1021]phrb-046_ggs-rap:rapobec1-xtenins-位点[1022]4_n1040-d10a-ugix2[1023]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessgimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1024]phrb-047_ggs-rap:rapobec1-xtenins-位点[1025]5-t1069-d10a-ugix2[1026]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggcggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1027]phrb-047_ggs-rap:rapobec1-xtenins-位点[1028]5-t1069-d10a-ugix2[1029]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessggeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1030]phrb-048_ggs-rap:rapobec1-xtenins-位点[1031]6-g1247-d10a-ugix2[1032]atggacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggcggaggctctggaggaagcagctctgagacaggacctgtggccgtggatcccacactgcggagaagaattgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggcctgcgcgacctgatcagcagcggagtgacaatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagggctcttctggatctgaaacacctggcacaagtgagagcgccacccctgagagctctggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccacc[1033]phrb-048_ggs-rap:rapobec1-xtenins-位点[1034]6-g1247-d10a-ugix2[1035]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgggsggsssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglkgssgsetpgtsesatpessgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv*[1036]实施例5:abe内部融合碱基编辑器[1037]为了评估细胞内的碱基编辑,使用lipofectamine2000(生命科技),用100ng编码sgrna的质粒和编码碱基编辑器的质粒共-转染hek293t细胞。4天后,分离基因组dna,并通过pcr扩增所述被靶向的基因组区域。加上了测序接头以生成pcr产物的文库。含有碱基-被编辑的区域的制备好的pcr文库在illuminamiseq上测序。[1038]ibe003、ibe008、ibe007、ibe002、ibe001、ibe005、ibe006、ibe004、ibe021、ibe031、ibe020、ibe036、ibe035、ibe028和ibe009用于确定在两个不同的靶序列,hek2(gaacacaaagcatagactgc)和t39(ggacagcttttcctagacag),中的编辑百分比(图20c至q)。[1039]实施例6:内部融合碱基编辑器的效率。[1040]使用lipofectamine2000(生命科技),用100ng编码sgrna的质粒和编码碱基编辑器的质粒共-转染hek293t细胞。4天后,分离基因组dna,并通过pcr扩增所述被靶向的基因组区域。加上了测序接头以生成pcr产物的文库。含有碱基-被编辑的区域的制备好的pcr文库在illuminamiseq上测序。用于这个实验的靶位点显示于下表11中。[1041]表11:[1042][1043][1044]将测序读数对齐到原始的靶序列,并测量了编辑百分比。参见图22a,其检视了在29个基因组靶标处的相对于abe7.10的内部融合的效率。以最佳位置(即位置14,在此图中20距pam最远而1距pam最近)的abe7.10编辑对编辑效率进行了归一化。以abe7.10的最大编辑效率对跨越所有位点的内部碱基编辑器的最大编辑效率进行了归一化(图22b)。基于最大编辑效率(其被归一化到abe7.10)的有效碱基编辑窗口表明,与abe7.10相比,内部融合a碱基编辑器中的最大编辑窗口有所改变(图22c、d)。[1045]实施例7:内部融合碱基编辑器的假性脱氨反应的评估[1046]碱基编辑器(其具有向导)与sacas9和靶向不同基因座的向导一起被转染。sacas9所生成的ssdna易受脱氨反应的影响,而该脱氨反应是通过假性的碱基编辑(假性的=非向导-靶向的)。对所述sacas9靶基因座测序以测量假性脱氨反应。在每个位点处,反式-编辑被归一化到abe7.10的反式编辑。通过反式-编辑测定测量了跨越29个不同ibe靶标的假性脱氨反应,该测定结果在每个位点处被归一化到abe7.10的反式编辑位点以进行比较。在归一化到某位点处的abe7.10的反式-编辑之前,对该位点的总的反式-编辑求和。所测试的内部碱基编辑器(ibe002、ibe004、ibe005、ibe006、ibe008、ibe009、ibe020)与abe7.10相比显示出减低的平均假性脱氨反应。[1047]实施例8:内部融合a碱基编辑器的碱基编辑的评估[1048]如实施例6(其使用高通量测序)中所述,使用hek293t细胞评估了使用abe内部融合的碱基编辑。在这个测定中,设计了向导以靶向6个不同位点:hek4、ggcactgcggctggaggtgg(图24a);fancf、gtagggccttcgcgcacctca(图24b);hek-3、lggcccagactgagcacgtga(图24c);hek2-yy、ggaaaccttgaataagaatgga(图24d);emx1、gagtccgagcagaagaagaa(图24e)和hek2、gaacacaaagcatagactgc(图24f)。[1049]每孔接种了10,000-20,000个hek293t细胞。将75ng的sgrna和175ng的碱基编辑器或cas9质粒用1μllipofectamine2000转染。转染四天后,分离了基因组dna,pcr扩增了所述靶位点并在illuminamiseq上对其测序。编辑百分比是通过计算40,000个illumina测序读数在指定位置具有a到g突变的百分比而得。与abe7.10相比,内部融合腺苷碱基编辑器展现出不同的最大编辑窗口和减低的脱靶编辑(图24a-f)。[1050]实施例9:内部融合c碱基编辑器的碱基编辑的评估[1051]如实施例6(其使用高通量测序)中所述,使用hek293t细胞评估了使用cbe内部融合的碱基编辑。在这个测定中,使用了如下的cbe碱基编辑器:be4、hr001、hr002、hr003、hr004、hr005。在这个测定中,设计了向导以靶向6个不同位点:hek4、ggcactgcggctggaggtgg(图25a);fancf、gtagggccttcgcgcacctca(图25b);hek-3、ggcccagactgagcacgtga(图25c);hek2-yy、ggaaaccttgaataagaatgga(图25d);emx1、gagtccgagcagaagaagaa(图25e)和hek2、gaacacaaagcatagactgc(图25f)。编辑百分比是通过计算40,000个illumina测序读数在指定位置具有c到t突变的百分比而得。与abe7.10相比,内部融合胞苷碱基编辑器展现出不同的最大编辑窗口和减低的脱靶编辑(图25a-f)。[1052]涵盖所述碱基编辑器系统的方法和组合物及其用途的以下编号的额外的实施方式在本文中展望如下:[1053]1.一种融合蛋白,其包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中该融合蛋白的脱氨酶使靶多核苷酸序列中的靶核碱基脱氨基,其中所述n末端片段或c末端片段结合靶多核苷酸序列,并且其中所述n末端片段的c端或c末端片段的n端包括cas9多肽的柔性环的一部分。[1054]2.如实施方式1所述的融合蛋白,其中该靶核碱基,与包括融合至seqidno:1的n端或c端的脱氨酶的末端融合蛋白相比,以较低的脱靶脱氨反应被脱氨基。[1055]3.如实施方式1或2所述的融合蛋白,其中该靶核碱基与靶多核苷酸序列中的原间隔序列临近基序(pam)序列相距1至20个核碱基。[1056]4.如实施方式3所述的融合蛋白,其中该靶核碱基在pam序列上游2-12个核碱基处。[1057]5.如实施方式1至4中任一项所述的融合蛋白,其中当该融合蛋白使靶核碱基脱氨基时,所述n末端片段的c端或c末端片段的n端包括靠近靶核碱基的氨基酸。[1058]6.如实施方式1至4中任一项所述的融合蛋白,其中该n末端片段的c端或该c末端片段的n端包括cas9多肽的α-螺旋结构的一部分。[1059]7.如实施方式1至4中任一项所述的融合蛋白,其中该n末端片段或该c末端片段包括dna结合结构域。[1060]8.如实施方式1至4中任一项所述的融合蛋白,其中该n末端片段或该c末端片段包括ruvc结构域。[1061]9.如实施方式1至-4中任一项所述的融合蛋白,其中该n末端片段和该c末端片段均不包括hnh结构域。[1062]10.如实施方式1至4中任一项所述的融合蛋白,其中该cas9多肽的柔性环包括seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的位置之间的氨基酸。[1063]11.如实施方式10所述的融合蛋白,其中该n末端片段起始于cas9多肽的n端并且是一接连的序列,其终止于seqidno:1中所编号的氨基酸1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231或1248至1297或其相应的位置之间的位置。[1064]12.如实施方式10所述的融合蛋白,其中该c末端片段起始于seqidno:1中所编号的位置1301至1368、1248至1297、1078至1231、1026至1051、948至1001、692至942、580至685或538至568并且是一接连的序列,其终止于cas9多肽的c端。[1065]13.如实施方式10所述的融合蛋白,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1016、1023、1029、1040、1069或1247或其相应的氨基酸。[1066]14.如实施方式10所述的融合蛋白,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1017、1024、1030、1041、1070、1248或其相应的氨基酸。[1067]15.如实施方式11至14中任一项所述的融合蛋白,其中该脱氨酶是胞苷脱氨酶。[1068]16.如实施方式10所述的融合蛋白,其中该n末端片段起始于cas9多肽的n端并且是一接连的序列,其终止于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的位置之间。[1069]17.如实施方式10所述的融合蛋白,其中该c末端片段起始于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300之间并且是一接连的序列,其终止于cas9多肽的c端。[1070]18.如实施方式10所述的融合蛋白,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1022、1029、1040、1068、1069、1247、1054、1026、768、791、792、1248、1052或1246或其相应的氨基酸。[1071]19.如实施方式10所述的融合蛋白,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1023、1030、1041、1069、1070、1248、1055、1026、769、792、793、873、907、1249、1053或1247抑或其相应的氨基酸。[1072]20.如实施方式16至19中任一项所述的融合蛋白,其中该脱氨酶是腺苷脱氨酶。[1073]21.如实施方式1至20中任一项所述的融合蛋白,还包括额外的催化结构域。[1074]22.如实施方式21所述的融合蛋白,其中该额外的催化结构域是胞苷脱氨酶或腺苷脱氨酶。[1075]23.如实施方式1至22中任一项所述的融合蛋白还包括该n末端片段和脱氨酶之间的连接子。[1076]24.如实施方式1至22中任一项所述的融合蛋白还包括该c末端片段和脱氨酶之间的连接子。[1077]25.如实施方式1至22中任一项所述的融合蛋白还包括核定位信号。[1078]26.如实施方式25所述的融合蛋白,其中该核定位信号是双分型核定位信号。[1079]27.如实施方式1至26中任一项所述的融合蛋白,其中该cas9多肽是化脓性链球菌cas9(spcas9)、金黄色葡萄球菌cas9(sacas9)、嗜热链球菌1cas9(st1cas9)或其变体。[1080]28.如实施方式1至27中任一项所述的融合蛋白,其中该cas9多肽是经修饰的cas9并且对改变过的pam有特异性。[1081]29.如实施方式1至28中任一项所述的融合蛋白,其中该cas9多肽是切口酶。[1082]30.如实施方式1至28中任一项所述的融合蛋白,其中该cas9多肽是核酸酶无活性的。[1083]31.如实施方式中1至30任一项所述的融合蛋白,其与向导核酸序列复合以达成靶核碱基的脱氨反应。[1084]32.用于优化碱基编辑的蛋白质文库,其包括复数个融合蛋白,其中该复数个融合蛋白中的每一个都包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中每一个融合蛋白的n末端片段都不同于该复数个融合蛋白中其余蛋白的n末端片段,或者,其中每一个融合蛋白的c末端片段都不同于该复数个融合蛋白中其余蛋白的c末端片段,其中每一个融合蛋白的脱氨酶使靠近靶多核苷酸序列中的原间隔序列临近基序(pam)序列的靶核碱基脱氨基,并且其中所述n末端片段或所述c末端片段结合靶多核苷酸序列。[1085]33.如实施方式32所述的蛋白质文库,其中对于与pam序列相距1到20个核碱基的每个核碱基,该复数个融合蛋白中的至少一个使该核碱基脱氨基。[1086]34.如实施方式32所述的蛋白质文库,其中该复数个融合蛋白中的每一个的cas9多肽的n末端片段的c端或c末端片段的n端包括cas9多肽的柔性环的一部分。[1087]35.如实施方式32至34中任一项所述的蛋白质文库,其中与包括融合至seqidno:1的n端或c端的脱氨酶的末端融合蛋白相比,所述复数个融合蛋白中的至少一个以较低的脱靶脱氨反应使核碱基脱氨基。[1088]36.如实施方式32至35中任一项所述的蛋白质文库,其中所述复数个融合蛋白中的至少一个使在pam序列上游2至12个核碱基处的靶核碱基脱氨基。[1089]37.如实施方式32至36中任一项所述的蛋白质文库,其中当该融合蛋白使靶核碱基脱氨基时,所述复数个融合蛋白其中一个的n端片段的c端或c端片段的n端包括靠近靶核碱基的氨基酸。[1090]38.如实施方式34至36中任一项所述的蛋白质文库,其中该cas9多肽的柔性环包括位于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300(如)抑或其相应的(多个)位置之间的氨基酸。[1091]39.如实施方式38所述的蛋白质文库,其中该复数个融合蛋白包括融合蛋白,该融合蛋白包括起始于cas9多肽的n端的n末端片段并且是终止于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的(多个)位置之间的接连序列。[1092]40.如实施方式38所述的蛋白质文库,其中该复数个融合蛋白包括融合蛋白,该融合蛋白包括c末端片段,其起始于如下氨基酸之间的一seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的(多个)位置,且是终止于cas9多肽的c端的接连序列。[1093]41.如实施方式38至40中任一项所述的蛋白质文库,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1022、1029、1040、1068、1069、1247、1054、1026、768、791、792、1248、1052或1246或其相应的氨基酸。[1094]42.如实施方式38至40中任一项所述的蛋白质文库,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1023、1030、1041、1069、1070、1248、1055、1026、769、792、793、873、907、1249、1053或1247或其相应的氨基酸。[1095]43.如实施方式32至42中任一项所述的蛋白质文库,其中该脱氨酶是腺苷脱氨酶。[1096]44.如实施方式32至42中任一项所述的蛋白质文库,其中该脱氨酶是胞苷脱氨酶。[1097]45.如实施方式32至44中任一项所述的蛋白质文库,其中该cas9多肽是化脓性链球菌cas9(spcas9)、金黄色葡萄球菌cas9(sacas9)、嗜热链球菌1cas9(st1cas9)或其变体。[1098]46.如实施方式32至45中任一项所述的蛋白质文库,其中该cas9多肽是经修饰的cas9并且对改变过的原间隔序列临近基序(pam)有特异性。[1099]47.如实施方式32至46中任一项所述的蛋白质文库,其中该cas9多肽是切口酶。[1100]48.如实施方式32至46中任一项所述的蛋白质文库,其中该cas9多肽是核酸酶无活性的。[1101]49.一种细胞,其包括如实施方式1至31中任一项所述的融合蛋白。[1102]50.如实施方式49所述的细胞,其中该细胞是哺乳动物细胞或人类细胞。[1103]51.一种用于编辑靶多核苷酸序列中的靶核碱基的方法,该方法包括:使该靶多核苷酸与融合蛋白接触,该融合蛋白包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶,其中该融合蛋白的脱氨酶使靶多核苷酸序列中的靶核碱基脱氨基,其中该n末端片段或c末端片段结合靶多核苷酸序列,并且其中所述n末端片段的c端或所述c末端片段的n端包括cas9多肽的柔性环的一部分。[1104]52.如实施方式51所述的方法,还包括使所述靶多核苷酸序列与向导核酸序列接触以达成靶核碱基的脱氨反应。[1105]53.如实施方式52所述的方法,其中该向导核酸序列包括一间隔序列,其序列与靶多核苷酸序列的原间隔序列互补,从而形成了r-环。[1106]54.如实施方式53所述的方法,其中该靶核碱基,与包括融合至seqidno:1的n端或c端的脱氨酶的末端方法相比,以较低的脱靶脱氨反应被脱氨基。[1107]55.如实施方式54所述的方法,其中该融合蛋白的脱氨酶在r-环范围内使不超过两个的核碱基脱氨基。[1108]56.如实施方式51至55中任一项所述的方法,其中该靶核碱基与靶多核苷酸序列中的pam序列相距1至20个核碱基。[1109]57.如实施方式55所述的方法,其中该靶核碱基在pam序列上游2-12个核碱基处。[1110]58.如实施方式51至57中任一项所述的方法,其中当该融合蛋白的脱氨酶使靶核碱基脱氨基时,该n端片段的c端或c端片段的n端包括靠近靶核碱基的氨基酸。[1111]59.如实施方式51至57中任一项所述的方法,其中该n末端片段或该c末端片段包括ruvc结构域。[1112]60.如实施方式51至57中任一项所述的方法,其中该n末端片段和该c末端片段均不包括hnh结构域。[1113]61.如实施方式51至57中任一项所述的方法,其中该cas9多肽的柔性环包括seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的位置之间的氨基酸。[1114]62.如实施方式61所述的方法,其中该n末端片段起始于cas9多肽的n端并且是终止于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300(如)抑或其相应的位置之间的接连序列。[1115]63.如实施方式61所述的方法,其中该c末端片段起始于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300(或其相应的(多个)位置,并且是终止于cas9多肽的c端的接连序列。[1116]64.如实施方式61所述的方法,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1016、1023、1029、1040、1069或1247或其相应的氨基酸。[1117]65.如实施方式61所述的方法,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1017、1024、1030、1041、1070、1248或其相应的氨基酸。[1118]66.如实施方式62至65中任一项所述的方法,其中该脱氨酶是胞苷脱氨酶。[1119]67.如实施方式61所述的方法,其中该n末端片段起始于cas9多肽的n端并且是终止于seqidno:1中所编号的位置1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231或1248至1297或其相应的位置之间的接连序列。[1120]68.如实施方式61所述的方法,其中该c末端片段起始于seqidno:1中所编号的位置1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231或1248至1297或其相应的(多个)位置之间并且是终止于cas9多肽的c端的接连序列。[1121]69.如实施方式61所述的方法,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1022、1029、1040、1068、1069、1247、1054、1026、768、791、792、1248、1052或1246或其相应的氨基酸。[1122]70.如实施方式61所述的方法,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1023、1030、1041、1069、1070、1248、1055、1026、769、792、793、873、907、1249、1053或1247或其相应的氨基酸。[1123]71.如实施方式67至70中任一项所述的方法,其中该脱氨酶是腺苷脱氨酶。[1124]72.如实施方式51至71中任一项所述的方法,其中该cas9多肽是经修饰的cas9并且对改变过的原间隔序列临近基序(pam)有特异性。[1125]73.如实施方式51至72中任一项所述的方法,其中该cas9多肽是切口酶。[1126]74.如实施方式51至72中任一项所述的方法,其中该cas9多肽是核酸酶无活性的。[1127]75.如实施方式51至74中任一项所述的方法,其中该接触是在细胞中执行。[1128]76.如实施方式75所述的方法,其中该细胞是哺乳动物细胞或人类细胞。[1129]77.如实施方式76所述的方法,其中该细胞是分化多能的细胞。[1130]78.如实施方式75至77中任一项所述的方法,其中该细胞是在体内的或离体的。[1131]79.如实施方式51至74中任一项所述的方法,其中该接触是在细胞的群体中执行。[1132]80.如实施方式79所述的方法,其中该细胞的群体是哺乳动物细胞或人类细胞。[1133]81.一种用于治疗受试者体内的遗传病况的方法,该方法包括:向该受试者施用融合蛋白,该融合蛋白包括两侧翼为cas9多肽的n末端片段和c末端片段的脱氨酶或者编码该融合蛋白的多核苷酸,以及向导核酸序列或者编码该向导核酸序列的多核苷酸,其中该向导核酸序列导引该融合蛋白使受试者的靶多核苷酸序列中的靶核碱基脱氨基,其中该n末端片段或该c末端片段结合靶多核苷酸序列,从而治疗所述遗传病况。[1134]82.如实施方式81所述的方法,其中该n末端片段的c端或该c末端片段的n端包括所述cas9多肽的柔性环的一部分。[1135]83.如实施方式81或82所述的方法,还包括向该受试者施用向导核酸序列以达成靶核碱基的脱氨反应。[1136]84.如实施方式81至83中任一项所述的方法,其中该靶核碱基包括与所述遗传病况相关联的突变。[1137]85.如实施方式84所述的方法,其中该靶核碱基的脱氨反应用野生型核碱基取代了该靶核碱基。[1138]86.如实施方式84所述的方法,其中该靶核碱基的脱氨反应用非-野生型核碱基取代了该靶核碱基,并且其中所述靶核碱基的脱氨反应改善了所述遗传病况的症状。[1139]87.如实施方式81至83中任一项所述的方法,其中该靶多核苷酸序列在靶核碱基以外的核碱基处包括与所述遗传病况相关联的突变。[1140]88.如实施方式87所述的方法,其中该靶核碱基的脱氨反应改善了所述遗传病况的症状。[1141]89.如实施方式81至88中任一项所述的方法,其中该靶核碱基与靶多核苷酸序列中的pam序列相距1至20个核碱基。[1142]90.如实施方式89所述的方法,其中该靶核碱基在pam序列上游2-12个核碱基处。[1143]91.如实施方式81至90中任一项所述的方法,其中当该融合蛋白的脱氨酶使靶核碱基脱氨基时,该n端片段的c端或c端片段的n端包括靠近靶核碱基的氨基酸。[1144]92.如实施方式81至90中任一项所述的方法,其中该n末端片段或该c末端片段包括ruvc结构域。[1145]93.如实施方式81至90中任一项所述的方法,其中该n末端片段和该c末端片段均不包括hnh结构域。[1146]94.如实施方式81至90中任一项所述的方法,其中该cas9多肽的柔性环包括位于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300或其相应的位置的之间氨基酸。[1147]95.如实施方式94所述的方法,其中该n末端片段起始于cas9多肽的n端并且是终止于如下氨基酸的一seqidno:1中所编号的位置v530至p537、f569至e579、d686至r691、y943至d947、l1052至e1077、p1002至s1025、y1232至g1247或r1298至k1300之间的接连序列。[1148]96.如实施方式94所述的方法,其中该c末端片段起始于seqidno:1中所编号的位置530至537、569至579、686至691、768至793、943至947、1002至1040、1052至1077、1232至1248或1298至1300(如)并且是终止于cas9多肽的c端的接连序列。[1149]97.如实施方式94所述的方法,其中该n末端片段的c末端氨基酸是seqidno:1中所编号的氨基酸1016、1023、1029、1040、1069、1022、1029、1040、1068、1069、1247、1054、1026、768、791、792、1246、1247、1248或1052或其相应的氨基酸。[1150]98.如实施方式94所述的方法,其中该c末端片段的n末端氨基酸是seqidno:1中所编号的氨基酸1017、1023、1024、1030、1041、1069、1070、1247、1248、1249、1055、1026、769、792、793、873、907或1053(或其相应的氨基酸。[1151]99.如实施方式81至98中任一项所述的方法,其中该脱氨酶是胞苷脱氨酶。[1152]100.如实施方式81至98中任一项所述的方法,其中该脱氨酶是腺苷脱氨酶。[1153]101.如实施方式81至100中任一项所述的方法,其中该cas9多肽是经修饰的cas9并且对改变过的pam有特异性。[1154]102.如实施方式81至101中任一项所述的方法,其中该cas9多肽是切口酶。[1155]103.如实施方式81至101中任一项所述的方法,其中该cas9多肽是核酸酶无活性的。[1156]104.如实施方式81至103中任一项所述的方法,其中该受试者是哺乳动物。[1157]105.如实施方式81至104中任一项所述的方法,其中该受试者是人类。[1158]其他实施方式[1159]从前面的描述中将显而易见的是,可对如本文所描述的发明进行变化和修改以将其适用于各种用途和条件。此类实施方式也在以下权利要求的范围内。[1160]本文对变量的任何定义中的元件列表的列举,包含了将该变量定义为所列元件的任何单个元件或组合(或子组合)。本文对实施方式的列举,包含了该实施方式作为任何单一实施方式或与任何其他实施方式或其部分的组合。[1161]本说明书中提及的所有专利和出版物通过引用并入本文,其范围如同明确地和个别地指出每个独立的专利和出版物通过引用并入。当前第1页12当前第1页12