首页 > 化学装置 专利正文
使用腺苷脱氨酶碱基编辑器编辑疾病相关基因的方法,包括遗传性疾病的治疗与流程

时间:2022-02-17 阅读: 作者:专利查询

使用腺苷脱氨酶碱基编辑器编辑疾病相关基因的方法,包括遗传性疾病的治疗1.相关申请的交叉引用2.本技术请求保护于2019年2月13日提交的美国临时申请第62/805,271号;2019年5月23日提交的美国临时申请第62/852,228号;2019年5月23日提交的美国临时申请第62/852,224号;2019年7月11日提交的美国临时申请第62/873,138号;2019年8月19日提交的美国临时申请第62/888,867号;2019年11月6日提交的美国临时申请第62/931,722号;2019年11月27日提交的美国临时申请第62/941,569号;2020年1月27日提交的美国临时申请第62/966,526号的权益,其公开内容特此通过引用方式整体并入本文。3.通过引用方式并入4.本说明书中提及的所有出版物、专利和专利申请均以引用方式并入本文,其程度就如同每个单独的出版物、专利或专利申请被具体地和单独地指示为以引用方式并入一样。除非另有说明,本说明书中提及的出版物、专利和专利申请通过引用方式整体并入本文。
背景技术
::5.核酸序列的靶向编辑,例如基因组dna的靶向切割或靶向修饰,是基因功能研究的一种很有前景的方法,也有为人类遗传性疾病提供新的治法的可能。当前可用的碱基编辑器包含将目标c·g碱基对转换为t·a的胞苷碱基编辑器(例如,be4)和将a·t转换为g·c的腺嘌呤碱基编辑器(例如,abe7.10)。本领域需要能够以更高的特异性和效率在目标序列内诱导修饰的改进的碱基编辑器。技术实现要素:6.本发明提供包括具有提高的效率的新颖腺嘌呤碱基编辑器(例如abe8)的组合物和使用包括腺苷脱氨酶变体的碱基编辑器来编辑目标序列的方法。7.在一些方面,本文提供一种治疗受试者的神经系统失调的方法,所述方法包括:向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在与受试者的神经系统失调相关的目标基因或其调控组件中实现a至g核碱基改变,从而治疗受试者的神经系统失调。在所述方面的另一个实施方案中,目标基因是α-l-艾杜糖醛酸酶(idua)基因并且神经系统疾病是贺勒氏症(hurlersyndrome)。在所述方面的一个实施方案中,目标基因是富含亮氨酸的重复激酶-2(leucine-richrepeatkinase-2,lrrk2)基因,并且神经系统疾病是帕金森氏病。在所述方面的一个实施方案中,目标基因是甲基cpg结合蛋白2(mecp2)基因并且神经系统疾病是蕾特氏症(rettsyndrome)。在所述方面的另一个实施方案中,目标基因是atp结合盒亚家族成员4(abca4)基因,并且神经疾病是斯塔加特氏病(stargardtdisease)。8.在一些方面,本文提供一种治疗受试者的贺勒氏症的方法,所述方法包括向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在受试者中实现α-l-艾杜糖醛酸酶(idua)基因或其调控组件中的a至g核碱基改变,从而治疗受试者的贺勒氏症(hurlersyndrome)。9.在一些实施方案中,给药改善与贺勒氏症相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与贺勒氏症相关的至少一种症状的更快改善。10.在一些实施方案中,idua基因或其调控组件包括与贺勒氏症相关的snp。在一些实施方案中,a至g核碱基改变在与贺勒氏症相关的snp处。在一些实施方案中,与贺勒氏症相关的snp导致idua基因编码的seqidno:4中编号为idua多肽或其变体中的w402x或w401x氨基酸突变,其中x是终止密码子。在一些实施方案中,a至g核碱基改变将与贺勒氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与贺勒氏症相关的snp改变为非野生型核碱基,导致贺勒氏症的一种或多种改善的症状。在一些实施方案中,与贺勒氏症相关的snp处的a至g改变将idua基因编码的idua多肽中的终止密码子改变为色氨酸。11.在一些实施方案中,向导多核苷酸包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,所述单个向导rna(sgrna)包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括选自由以下所组成的群组的核酸序列:5’‑gacucuaggcagaggucucaa-3’、5’‑acucuaggcagaggucucaa-3’、5’‑cucuaggccgaagugucgc-3’及5’‑gcucuaggccgaagugucgc-3’。12.在一些方面,本文提供一种治疗受试者的帕金森氏病的方法,所述方法包括:向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在受试者中实现富含亮氨酸的重复激酶-2(lrrk2)基因或其调控组件的a至g核碱基改变,从而治疗受试者的帕金森氏病。13.在一些实施方案中,给药改善与帕金森氏病相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与帕金森氏病相关的至少一种症状的更快改善。14.在一些实施方案中,lrrk2基因或其调控组件包括与帕金森氏病相关的snp。在一些实施方案中,a至g核碱基改变在与帕金森氏病相关的snp处。在一些实施方案中,与帕金森氏病相关的snp导致在由lrrk2基因编码的seqidno:3中编号的lrrk2多肽或其变体中的a419v、r1441c、r1441h或g2019s氨基酸突变。15.在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为非野生型核碱基,从而导致帕金森氏病的一种或多种改善的症状。在一些实施方案中,a至g核碱基改变将lrrk2基因编码的lrrk2多肽中的半胱氨酸或组氨酸改变为精氨酸。在一些实施方案中,a至g改变将lrrk2基因编码的lrrk2多肽中的丝氨酸改变为甘氨酸。在一些实施方案中,a至g改变在由lrrk2基因编码的seqidno:3中编号的lrrk2多肽或其变体的位置144用精氨酸(r)置换半胱氨酸(c)或组氨酸(h)或在位置144用用甘氨酸(g)置换丝氨酸。16.在一些方面,本文提供一种治疗受试者的帕金森氏病的方法,所述方法包括:向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,并且其中所述向导多核苷酸向导腺苷碱基编辑器在与帕金森氏病相关的lrrk2基因中在snp处实现a至g核碱基改变,其中所述snp不编码在seqidno:3中编号的lrrk2多肽或其变体中的g2019s突变。17.在一些实施方案中,腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166处或其相应位置的氨基酸取代。在一些实施方案中,向导多核苷酸包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,所述单个向导rna(sgrna)包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括核酸序列:5’‑aagcgcaagccuggagggaa-3’;或5’‑acuacagcauugcucaguac-3’。18.在一些方面,本文提供一种治疗受试者的蕾特氏症的方法,所述方法包括向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置的氨基酸取代:,并且其中所述向导多核苷酸向导腺苷碱基编辑器在受试者中实现甲基cpg结合蛋白2(mecp2)基因或其调控组件中的a至g核碱基改变,从而治疗受试者的蕾特氏症(rettsyndrome)。19.在一些实施方案中,给药改善与蕾特氏症相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与蕾特氏症相关的至少一种症状的更快改善。在一些实施方案中,mecp2基因或其调控组件包括与蕾特氏症相关的snp。在一些实施方案中,a至g核碱基改变发生在与蕾特氏症相关的snp处。在一些实施方案中,与蕾特氏症相关的snp导致所述mecp2基因所编码的在seqidno:5中编号的mecp2多肽或其变体中的r106w或t158m氨基酸突变。在一些实施方案中,与蕾特氏症相关的snp导致mecp2基因编码的mecp2多肽中的r255x或r270x氨基酸突变,其中x是终止密码子。20.在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为非野生型核碱基,导致蕾特氏症症状改善。在一些实施方案中,与蕾特氏症相关的snp处的a至g核碱基改变将mecp2多肽中的终止密码子改变为色氨酸。21.在一些实施方案中,向导多核苷酸包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列蕾特氏症。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列。在一些实施方案中,向导多核苷酸包括选自由以下所组成的群组的核酸序列:5’‑cuuuucacuuccugccgggg-3’,5’‑agcuuccauguccagccuuc-3’、5’‑accaugaagucaaaaucauu-3’及5’‑gcuuucagccccguuucuug-3’。22.在一些方面,本文提供一种治疗受试者的斯塔加特氏病的方法,所述方法包括向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在受试者的atp结合盒亚家族成员4(abca4)基因或其调控组件中实现a至g核碱基改变,从而治疗受试者的斯塔加特氏病。23.在一些实施方案中,给药改善与斯塔加特氏病相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与斯塔加特氏病相关的至少一种症状的更快改善。24.在一些实施方案中,abca4基因包括与斯塔加特氏病相关的snp。在一些实施方案中,a至g核碱基改变在与斯塔加特氏病相关的snp处。在一些实施方案中,与斯塔加特氏病相关的snp导致由abca4所述基因所编码的在seqidno:6中编号的abca4多肽或其变体中的a1038v或g1961e氨基酸突变。在一些实施方案中,与斯塔加特氏病相关的snp导致在seqidno:6中编号的abca4多肽或其变体中的g1961e氨基酸突变。25.在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为非野生型核碱基,其导致斯塔加特氏病的一种或多种改善的症状。在一些实施方案中,向导多核苷酸包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。26.在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括序列5'-cuccagggcgaacuucgacacacagc-3'。27.在各个方面,与使用包括没有氨基酸取代的腺苷脱氨酶结构域的碱基编辑器的治疗相比,本文所述治疗导致神经系统失调的症状改善。28.在一些方面,本文提供一种编辑与神经系统失调相关的目标基因或其调控组件的方法,所述方法包括使目标基因或其调控组件与(i)腺苷碱基编辑器和(ii)向导多核苷酸,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置的氨基酸取代,其中所述向导多核苷酸向导腺苷碱基编辑器在与神经系统失调相关的目标基因或其调控组件中实现a至g核碱基改变。在所述方面的一个实施方案中,目标基因是富含亮氨酸的重复激酶-2(lrrk2)基因,并且神经系统疾病是帕金森氏病。在所述方面的另一个实施方案中,目标基因是α-l-艾杜糖醛酸酶(idua)基因,并且神经系统疾病是贺勒氏症。在所述方面的一个实施方案中,目标基因是甲基cpg结合蛋白2(mecp2)基因,并且神经系统疾病是蕾特氏症。在所述方面的另一个实施方案中,目标基因是atp结合盒亚家族成员4(abca4)基因,并且神经系统疾病是斯塔加特氏病。29.在一些方面,本文提供一种编辑富含亮氨酸的重复激酶-2(lrrk2)基因或其调控组件的方法,所述方法包括将lrrk2基因或其调控组件与(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在lrrk基因其调控组件中中实现a至g核碱基改变。30.在一些实施方案中,a至g核碱基改变在与帕金森氏病相关的snp处。在一些实施方案中,与帕金森氏病相关的snp导致在由lrrk2基因编码的seqidno:3中编号的lrrk2多肽或其变体中的a419v、r1441c、r1441h或g2019s氨基酸突变。在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为非野生型核碱基,导致帕金森氏病的一种或多种改善的症状。31.在一些实施方案中,a至g核碱基改变将由lrrk2基因编码的lrrk2多肽中的半胱氨酸或组氨酸改变为精氨酸。在一些实施方案中,a至g的改变将由lrrk2基因编码的lrrk2多肽中的丝氨酸改变为甘氨酸。在一些实施方案中,a至g改变在由lrrk2基因编码的seqidno:3中编号为lrrk2多肽或其变体的位置144用精氨酸(r)置换半胱氨酸(c)或组氨酸(h)或在位置2019用甘氨酸(g)替换丝氨酸。32.在一些方面,本文提供一种编辑富含亮氨酸的重复激酶-2(lrrk2)基因或其调控组件的方法,所述方法包括将lrrk基因或其调控组件与(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,并且其中所述向导多核苷酸向导腺苷碱基编辑器在lrrk2基因中的snp处实现a至g核碱基改变,其中所述snp不编码在seqidno:3中编号的lrrk2多肽或其变体中的g2019s突变。33.在一些实施方案中,腺苷脱氨酶结构域包括在seqidno:2中编号的氨基酸位置82或166或其相应位置氨基酸取代。在一些实施方案中,向导多核苷酸包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。34.在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括核酸序列:5'-aagcgcaagccuggagggaa-3';或5'-acuacagcauugcucaguac-3'。35.在一些方面,本文提供一种编辑α-l-艾杜糖醛酸酶(idua)基因或其调控组件的方法,所述方法包括将idua基因或其调控组件与(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括氨基酸在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在idua基因或其调节组件中实现a至g核碱基改变。36.在一些实施方案中,idua基因或其调控组件包括与贺勒氏症相关的snp。在一些实施方案中,a至g核碱基改变在与贺勒氏症相关的snp处。在一些实施方案中,与贺勒氏症相关的snp导致由idua基因编码的在seqidno:4中编号为idua多肽或其变体中的w402x或w401x氨基酸突变,其中x是终止密码子。37.在一些实施方案中,a至g核碱基的改变将与贺勒氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与贺勒氏症相关的snp改变为非野生型核碱基,导致贺勒氏症的一种或多种改善的症状。在一些实施方案中,与贺勒氏症相关的snp处的a至g改变将由idua基因编码的idua多肽中的终止密码子改变为色氨酸。38.在一些实施方案中,向导多核苷酸包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,所述向导rna(sgrna)包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括选自由以下所组成的群组的核酸序列:5’‑gacucuaggcagaggucucaa-3’、5’‑acucuaggcagaggucucaa-3’、5’‑cucuaggccgaagugucgc-3’及5’‑gcucuaggccgaagugucgc-3’。39.在一些方面,本文提供一种编辑甲基cpg结合蛋白2(mecp2)基因或其调控组件的方法,所述方法包括向受试者给药(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在mecp2基因或其调控组件中实现a至g核碱基改变。40.在一些实施方案中,mecp2基因或其调控组件包括与蕾特氏症相关的snp。在一些实施方案中,a至g核碱基改变发生在与蕾特氏症相关的snp处。在一些实施方案中,与蕾特氏症相关的snp导致在由mecp2基因编码的seqidno:5中编号为mecp2多肽或其变体中的r106w或t158m氨基酸突变。在一些实施方案中,与蕾特氏症相关的snp导致由mecp2基因编码的mecp2多肽中的r255x或r270x氨基酸突变,其中x是终止密码子。41.在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为非野生型核碱基,导致蕾特氏症的一种或多种改善的症状。在一些实施方案中,与蕾特氏症相关的snp处的a至g核碱基改变将mecp2多肽中的终止密码子改变为色氨酸。42.在一些实施方案中,向导多核苷酸包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列。在一些实施方案中,向导多核苷酸包括选自由以下所组成的群组的核酸序列:5’‑cuuuucacuuccugccgggg-3’、5’‑agcuuccauguccagccuuc-3’,5’‑accaugaagucaaaaucauu-3’及5’‑gcuuucagccccguuucuug-3’。43.在一些方面,本文提供一种编辑atp结合盒亚家族成员4(abca4)基因或其调控组件的方法,所述方法包括使abca4基因或其调控组件与(i)腺苷碱基编辑器或核酸编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中腺苷脱氨酶结构域包括氨基酸在seqidno:2中编号的氨基酸位置82或166或其相应位置的取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在abca4基因或调控组件中实现a至g核碱基改变。44.在一些实施方案中,给药改善与斯塔加特氏病相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与斯塔加特氏病相关的至少一种症状的更快改善。45.在一些实施方案中,abca4基因包括与斯塔加特氏病相关的snp。在一些实施方案中,a至g核碱基改变在与斯塔加特氏病相关的snp处。在一些实施方案中,与斯塔加特氏病相关的snp导致在由abca4基因编码的seqidno:6中编号为abca4多肽或其变体中的a1038v或g1961e氨基酸突变。在一些实施方案中,与斯塔加特氏病相关的snp导致在seqidno:6中编号的abca4多肽或其变体中的g1961e氨基酸突变。46.在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为非野生型核碱基,导致斯塔加特氏病的一种或多种改善的症状。在一些实施方案中,向导多核苷酸包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。47.在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括序列5'-cuccagggcgaacuucgacacacagc-3'。48.在上述方面的各种实施方案中,接触是在细胞中。在一些实施方案中,接触导致细胞中基因组中小于10%的插入缺失,其中插入缺失率通过在单核苷酸修饰侧边的序列与未修饰序列之间的错配频率来测量。在一些实施方案中,接触导致细胞中基因组中小于5%的插入缺失,其中插入缺失率通过在单核苷酸修饰侧边的序列与未修饰序列之间的错配频率来测量。在一些实施方案中,接触导致细胞中基因组中小于1%的插入缺失,其中插入缺失率通过在单核苷酸修饰侧边的序列与未修饰序列之间的错配频率来测量。49.在上述方面的各种实施方案中,细胞是神经元。在一些实施方案中,接触是在细胞群中。在一些实施方案中,接触导致接触步骤后至少40%的细胞群中的a至g核碱基改变。在一些实施方案中,接触导致接触步骤后至少50%的细胞群中的a至g核碱基改变。在一些实施方案中,接触导致接触步骤后至少70%的细胞群中的a至g核碱基改变。在一些实施方案中,至少90%的细胞在接触步骤之后是存活的。在一些实施方案中,细胞群在接触步骤后没有富集。在一些实施方案中,细胞群是神经元。在一些实施方案中,接触是体内或离体的。50.在上述各个方面和实施方案中,多核苷酸可编程的dna结合结构域是cas9。在一些实施方案中,cas9是spcas9、sacas9或其变体。在一些实施方案中,多核苷酸可编程的dna结合结构域包括具有改变的前间隔邻近基序(protospacer-adjacentmotif,pam)特异性的修饰的spcas9。在一些实施方案中,cas9对选自由ngg、nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn及ngc所组成的群组的pam序列具有特异性;其中n是a、g、c或t;及其中r是a或g。在一些实施方案中,多核苷酸可编程的dna结合结构域是核酸酶失活变体。在一些实施方案中,多核苷酸可编程的dna结合结构域是切口酶变体。在一些实施方案中,切口酶变体包括氨基酸取代d10a或其相应的氨基酸取代。在本文所提供的各个方面和实施方案中,腺苷脱氨酶结构域包括tada结构域。在一些实施方案中,腺苷脱氨酶包括tada脱氨酶,其包括v82s改变和/或t166r改变。51.在上述各个方面和实施方案中,腺苷脱氨酶还包括一种或多种以下改变:y147t、y147r、q154s、y123h、q154r或其组合。在本文所提供的各个方面和实施方案中,腺苷脱氨酶包括选自由以下组成的群组的改变的组合:y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y147t+q154r;y147t+q154s;及y123h+y147r+q154r+i76y。在本文所提供的各个方面和实施方案中,腺苷碱基编辑器结构域包括腺苷脱氨酶单体。在本文所提供的各个方面和实施方案中,腺苷碱基编辑器包括腺苷脱氨酶二聚体。在一些实施方案中,tada脱氨酶是tada*8变体。在一些实施方案中,tada*8变体是选自:tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12及tada*8.13。在一些实施方案中,腺苷碱基编辑器是选自由以下组成的群组的abe8碱基编辑器:abe8.1、abe8.2、abe8.3、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12及abe8.13。52.在一些方面,本文提供通过本文公开的各个方面和实施方案中描述的方法产生的细胞。在一些方面,本文提供通过本文公开的各个方面和实施方案中描述的方法产生的细胞群。53.在一些方面,本文提供一种碱基编辑器系统,其包括(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域在seqidno:2中编号的氨基酸位置82或166或其相应位置包括氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在与神经系统失调相关的目标基因或其调控组件中实现a至g核碱基改变。在上述方面的一个实施方案中,目标基因是富含亮氨酸的重复激酶-2(lrrk2)基因,并且神经系统疾病是帕金森氏病。在所述方面的另一个实施方案中,目标基因是α-l-艾杜糖醛酸酶(idua)基因,并且神经系统疾病是贺勒氏症。在所述方面的一个实施方案中,目标基因是甲基cpg结合蛋白2(mecp2)基因,并且神经系统疾病是蕾特氏症。在所述方面的另一个实施方案中,目标基因是atp结合盒亚家族成员4(abca4)基因,并且神经系统疾病是斯塔加特氏病。54.在一些方面,本文提供一种碱基编辑器系统,其包括(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2编号的氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在lrrk基因及其调控组件中实现a至g核碱基的改变。55.在一些实施方案中,a至g核碱基改变位于lrrk2基因或其调控组件中与帕金森氏病相关的snp处。在一些实施方案中,与帕金森氏病相关的snp导致在由lrrk2基因编码的seqidno:3中编号的lrrk2多肽或其变体中的a419v、r1441c、r1441h或g2019s氨基酸突变。56.在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与帕金森氏病相关的snp改变为非野生型核碱基,导致帕金森症状的改善。在一些实施方案中,a至g核碱基改变将lrrk2基因编码的lrrk2多肽中的半胱氨酸或组氨酸改变为精氨酸。在一些实施方案中,a至g的改变将lrrk2基因编码的lrrk2多肽中的丝氨酸改变为甘氨酸。在一些实施方案中,a至g改变在由lrrk2基因编码的seqidno:3中编号为lrrk2多肽或其变体的位置144用精氨酸(r)置换半胱氨酸(c)或组氨酸(h)或在位置2019用用甘氨酸(g)置换丝氨酸。在一些实施方案中,腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代。57.在一些实施方案中,向导多核苷酸包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与帕金森氏病相关的snp的lrrk2基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括核酸序列:5’‑aagcgcaagccuggagggaa-3’;或5’‑acuacagcauugcucaguac-3’。58.在一些方面,本文提供一种碱基编辑器系统,其包括(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在α-l-艾杜糖醛酸酶(idua)基因或其调控组件中实现a至g核碱基的改变。59.在一些实施方案中,idua基因或其调控组件包括与贺勒氏症相关的snp。在一些实施方案中,a至g核碱基改变在与贺勒氏症相关的snp处。在一些实施方案中,与贺勒氏症相关的snp导致在由idua基因编码的seqidno:4中编号为idua多肽或其变体中的w402x或w401x氨基酸突变,其中x是终止密码子。60.在一些实施方案中,a至g核碱基的改变将与贺勒氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与贺勒氏症相关的snp改变为非野生型核碱基,导致贺勒氏症的一种或多种改善的症状。在一些实施方案中,与贺勒氏症相关的snp处的a至g改变将由idua基因编码的idua多肽中的终止密码子改变为色氨酸。61.在一些实施方案中,向导多核苷酸包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与贺勒氏症相关的snp的idua基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括选自由以下组成的群组的核酸序列:5’‑gacucuaggcagaggucucaa-3’,5’‑acucuaggcagaggucucaa-3’、5’‑cucuaggccgaagugucgc-3’及5’‑gcucuaggccgaagugucgc-3’。62.在一些方面,本文提供一种碱基编辑器系统,其包括(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在甲基cpg结合蛋白2(mecp2)基因或其调控组件中实现a至g核碱基的改变。63.在一些实施方案中,mecp2基因或其调控组件包括与蕾特氏症相关的snp。在一些实施方案中,a至g核碱基改变发生在与蕾特氏症相关的snp处。在一些实施方案中,与蕾特氏症相关的snp导致在由mecp2基因编码的seqidno:5中编号为mecp2多肽或其变体中的r106w或t158m氨基酸突变。在一些实施方案中,与蕾特氏症相关的snp导致在由mecp2基因编码的mecp2多肽中的r255x或r270x氨基酸突变,其中x是终止密码子。64.在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与蕾特氏症相关的snp改变为非野生型核碱基,导致蕾特氏症的一种或多种改善的症状。在一些实施方案中,与蕾特氏症相关的snp处的a至g核碱基改变将mecp2多肽中的终止密码子改变为色氨酸。65.在一些实施方案中,向导多核苷酸包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列。在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与蕾特氏症相关的snp的mecp2基因或其调控组件互补的核酸序列。在一些实施方案中,向导多核苷酸包括选自由以下所组成的群组的核酸序列:5’‑cuuuucacuuccugccgggg-3’、5’‑agcuuccauguccagccuuc-3’、5’‑accaugaagucaaaaucauu-3’及5’‑gcuuucagccccguuucuug-3’。66.在一些方面,本文提供一种碱基编辑器系统,其包括接触(i)腺苷碱基编辑器或编码所述腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码所述向导多核苷酸的核酸序列,其中所述腺苷碱基编辑器包括可编程的dna结合结构域和腺苷脱氨酶结构域,其中所述腺苷脱氨酶结构域包括在seqidno:2中编号为氨基酸位置82或166或其相应位置的氨基酸取代,并且其中所述向导多核苷酸向导腺苷碱基编辑器在atp结合盒亚家族成员4(abca4)基因或其调控组件中实现a至g核碱基的改变。67.在一些实施方案中,给药改善与斯塔加特氏病相关的至少一种症状。在一些实施方案中,相较于以所述腺苷脱氨酶中没有所述氨基酸取代的碱基编辑器的治疗,给药导致与斯塔加特氏病相关的至少一种症状的更快改善。在一些实施方案中,abca4基因包括与斯塔加特氏病相关的snp。在一些实施方案中,a至g核碱基改变在与斯塔加特氏病相关的snp处。在一些实施方案中,与斯塔加特氏病相关的snp导致在由abca4基因编码的seqidno:6中编号为abca4多肽或其变体中的a1038v或g1961e氨基酸突变。在一些实施方案中,与斯塔加特氏病相关的snp导致在seqidno:6中编号为abca4多肽或其变体中的g1961e氨基酸突变。68.在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为野生型核碱基。在一些实施方案中,a至g核碱基改变将与斯塔加特氏病相关的snp改变为非野生型核碱基,导致改善的斯塔加特氏病症状。在一些实施方案中,向导多核苷酸包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。69.在一些实施方案中,腺苷碱基编辑器与单个向导rna(sgrna)形成复合物,其包括与包括与斯塔加特氏病相关的snp的abca4基因或其调控组件互补的核酸序列。在一些实施方案中,sgrna包括序列5’‑cuccagggcgaacuucgacacacagc-3’。70.在本文所提供的各个方面和实施方案中,多核苷酸可编程的dna结合结构域是cas9。在一些实施方案中,cas9是spcas9、sacas9或其变体。在一些实施方案中,多核苷酸可编程的dna结合结构域包括具有改变的前间隔邻近基序(pam)特异性的修饰spcas9。在一些实施方案中,cas9对选自由ngg、nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn和ngc所组成的群组的pam序列具有特异性,其中n是a、g、c或t,且其中r是a或g。在一些实施方案中,多核苷酸可编程的dna结合结构域是核酸酶失活变体。在一些实施方案中,多核苷酸可编程的dna结合结构域是切口酶变体。在一些实施方案中,切口酶变体包括氨基酸取代d10a或其相应的氨基酸取代。71.在本文所提供的各个方面和实施方案中,腺苷脱氨酶结构域包括tada结构域。在一些实施方案中,腺苷脱氨酶包括tada脱氨酶,其包括v82s改变和/或t166r改变。72.在本文所提供的各个方面和实施方案中,腺苷脱氨酶进一步包括一种或多种以下改变:y147t、y147r、q154s、y123h、q154r或其组合。在本文所提供的各个方面和实施方案中,腺苷脱氨酶包括选自由以下所组成的群组的改变的组合:y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y147t+q154r;y147t+q154s;及y123h+y147r+q154r+i76y。在一些实施方案中,腺苷碱基编辑器结构域包括腺苷脱氨酶单体。在一些实施方案中,腺苷碱基编辑器包括腺苷脱氨酶二聚体。73.在本文所提供的各个方面和实施方案中,tada脱氨酶是tada*8变体。在一些实施方案中,tada*8变体是选自由以下所组成的群组:tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12及tada*8.13。在一些实施方案中,腺苷碱基编辑器是选自由以下所组成的群组的abe8碱基编辑器:abe8.1、abe8.2、abe8.3、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12及abe8.13。74.在一些方面,本文提供一种包括编码本文所述腺苷碱基编辑器的核酸序列的载体。在一些方面,本文提供一种包括编码本文所述腺苷碱基编辑器和向导多核苷酸的核酸序列的载体。在一些实施方案中,载体是病毒载体、慢病毒载体或aav载体。75.在一些方面,本文提供一种包括本文所述的碱基编辑器系统或载体的细胞。在一些实施方案中,细胞是中枢神经系统细胞。在一些实施方案中,细胞是神经元。在一些实施方案中,细胞是光感受器。在一些实施方案中,细胞是体外、体内或离体的。76.在一些方面,本文提供一种药物组合物,其包括本文所述碱基编辑器、载体或细胞以及药学上可接受的载体。在一个实施方案中,本文所述药物组合物进一步包括脂质。在另一个实施方案中,本文所述药物组合物进一步包括病毒。77.在一些方面,本文提供包括本文所述碱基编辑器或载体的试剂盒。78.在本文所述方法的各种实施方案中,向导多核苷酸的至少一个核苷酸包括非天然存在的修饰。在本文所述方法的各种实施方案中,核酸序列的至少一个核苷酸包括非天然存在的修饰。在各种实施方案中,碱基编辑器系统的核酸序列的至少一个核苷酸包括非天然存在的修饰。在一些实施方案中,非天然存在的修饰是化学修饰。在一些实施方案中,化学修饰是2'-o-甲基化。在一些实施方案中,核酸序列包括硫代磷酸酯。79.此处的描述和实施例详细说明了本公开的实施方案。应当理解,本公开不限于本文所述的特定实施方案并且因此可以变化。本领域技术人员将认识到本公开内容存在多种变化和修改,而这些变化和修改包括在其范畴内。80.除非另外指明,否则本文公开的一些实施方案的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术,这些技术在本领域技术范畴内。参见例如sambrookandgreen,molecularcloning:alaboratorymanual,4thedition(2012);theseriescurrentprotocolsinmolecularbiology(f.m.ausubel,etal.eds.);theseriesmethodsinenzymology(academicpress,inc.)、pcr2:apracticalapproach(m.j.macpherson,b.d.hamesandg.r.tayloreds.(1995))、harlowandlane,eds.(1988)antibodies,alaboratorymanual,andcultureofanimalcells:amanualofbasictechniqueandspecializedapplications,6thedition(r.i.freshney,ed.(2010))。81.此处使用的章节标题仅用于组织目的,不应被解释为限制所述主题。82.尽管可以在单个实施方案的上下文中描述本公开的各种特征,但是也可以单独地或以任何合适的组合来提供这些特征。相反,尽管为了清楚起见可以在单独的实施方案的上下文中在本文中描述本公开,本公开也可以在单个实施方案中实施。此处使用的章节标题仅用于组织目的,不应被解释为限制所述主题。83.本公开的特征在所附权利要求中特别阐述。通过参考以下阐述性实施方案的详细描述,其中利用了本公开的原理,并鉴于如下所述附图,将获得对本发明的特征和优点的更好的理解。84.定义85.以下定义补充了本领域中的定义,并且针对当前申请,并且不归咎于任何相关或不相关的案例,例如,任何共同拥有的专利或申请。尽管与本文所述那些相似或等效的任何方法和材料可用于测试本公开的实践,本文描述优选的材料和方法。因此,本文中使用的术语仅用于描述特定实施方案的目的,并不旨在进行限制。86.除非另有定义,否则本文使用的所有技术和科学术语均具有本领域技术人员通常理解的含义。以下参考文献为本领域技术人员提供本发明中使用的许多术语的一般定义:singletonetal.,dictionaryofmicrobiologyandmolecularbiology(2nded.1994);thecambridgedictionaryofscienceandtechnology(walkered.,1988);theglossaryofgenetics,5thed.,r.riegeretal.(eds.),springerverlag(1991);及hale&marham,theharpercollinsdictionaryofbiology(1991)。87.在本技术中,除非另有特别说明,否则单数的使用包括复数。必须注意,在说明书中使用的单数形式“一”、“一个”和“所述”包含复数参考,除非上下文另有明确规定。在本技术中,除非另有说明,否则“或”的使用是指“和/或”,并且被理解为包括在内。此外,术语“包含”以及诸如“包括”、“含有”和“所含(included)”等其他形式的使用不是限制性的。88.如在本说明书和权利要求中使用的,词语“包括”(以及任何形式的包括,例如“包括”和“包含”)、“具有”(以及任何形式的具有,例如“具有”和“有”)、“包含”(以及任何形式的包含,例如“包括”和“含”)或“含有”(以及任何形式的含有,例如“含”和“含有”)是包容性或开放式,并且不排除额外的、未提及的组件或方法步骤。预期本说明书中讨论的任何实施方案可关于本公开的任何方法或组合实施,反之亦然。此外,本公开的组合物可用于实现本公开的方法。89.术语“大约”或“约”是指在由本领域技术人员确定的特定值的可接受误差范围内,这将部分取决于如何测量或确定所述值,即测量系统。例如,根据本领域的实践,“大约”可以表示在1个标准偏差以内或超过1个标准偏差。或者,“大约”可以表示给定值的最多20%、最多10%、最多5%或最多1%的范围。或者,特别是对于生物系统或过程,所述术语可表示在一个数量级内,例如在值的5倍或2倍内。在申请和权利要求中描述特定值的情况下,除非另有说明,术语“大约”的含义应假定在特定值的可接受误差范围内。90.此处提供的范围应理解为所述范围内所有值的简写。例如,1至50的范围被理解为包含来自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50。91.说明书中对“一些实施方案”、“实施方案”、“一个实施方案”或“其他实施方案”的引用是指结合实施方案描述的特定特征、结构或特性包括在至少一些实施方案中,但不包括必须是本公开的所有实施方案。[0092]“无碱基编辑器”是指能够切除核碱基并插入dna核碱基(a、t、c或g)的试剂。无碱基编辑器包括核酸糖基化酶多肽或其片段。在一个实施方案中,核酸糖基化酶是突变的人类尿嘧啶dna糖基化酶,其包括以下序列中的氨基酸204处的asp(例如,置换氨基酸204处的asn),或尿嘧啶dna糖基化酶中的相应位置,并且具有胞嘧啶-dna糖基化酶活性或其活性片段。在一个实施方案中,核酸糖基化酶是突变的人类尿嘧啶dna糖基化酶,其包括以下序列中氨基酸147处的ala、gly、cys或ser(例如,置换氨基酸147处的tyr),或尿嘧啶dna糖基化酶中的相应位置,并具有胸腺嘧啶-dna糖基化酶活性或其活性片段。实施例性人类尿嘧啶-dna糖基化酶异形体1的序列如下:[0093][0094][0095]人类尿嘧啶-dna糖基化酶异形体2的序列如下:[0096][0097]在其他实施方案中,无碱基编辑器是pct/jp2015/080958和us20170321210中描述的任意一种无碱基编辑器,其通过引用方式并入本文。在特定实施方案中,无碱基编辑器包括在以上序列中以粗体显示的位置的突变并具有底线,或在本领域中已知的任何其他无碱基编辑器或尿嘧啶去糖基酶中的相应的氨基酸处。在一个实施方案中,无碱基编辑器包括在y147、n204、l272和/或r276或相应位置的突变。在另一个实施方案中,无碱基编辑器包括y147a或y147g突变或相应的突变。在另一个实施方案中,无碱基编辑器包括n204d突变或相应的突变。在另一个实施方案中,无碱基编辑器包括l272a突变或相应的突变。在另一个实施方案中,无碱基编辑器包括r276e或r276c突变或相应的突变。[0098]“腺苷脱氨酶”是指能够催化腺嘌呤或腺苷水解脱氨的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷水解脱氨为肌苷或脱氧腺苷水解脱氨为脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中腺嘌呤或腺苷的水解脱氨。本文所提供的腺苷脱氨酶(例如,工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体,例如细菌。[0099]在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*8。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体例如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%与天然存在的脱氨酶。例如,国际pct申请第pct/2017/045381号(wo2018/027078)和国际pct申请第pct/us2016/058344号(wo2017/070632)中描述了脱氨酶结构域,各自通过引用整体并入本文。另参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),以及rees,h.a.,etal.,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其全部内容通过引用方式并入本文。[0100]野生型tada(wt)腺苷脱氨酶具有以下序列(也称为tada参考序列):[0101]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd(seqidno:2)。[0102]在一些实施方案中,腺苷脱氨酶包括以下序列的改变:[0103][0104](也称为tada*7.10)。[0105]在一些实施方案中,tada*7.10包括至少一种改变。在一些实施方案中,tada*7.10包括氨基酸82和/或166处的改变。在特定实施方案中,上述序列的变体包括一个或多个以下改变:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。改变y123h在本文中也称为h123h(tada*7.10中的改变h123y回复为y123h(野生型))。在其他实施方案中,tada*7.10序列的变体包括选自由以下所组成的群组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[0106]在其他实施方案中,本发明提供包含缺失例如tada*8的腺苷脱氨酶变体,其包括从残基149、150、151、152、153、154、155、156或157开始的c端的缺失。在其他实施方案中,腺苷脱氨酶变体是包括一个或多个以下改变的tada(例如tada*8)单体:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体是tada(例如,tada*8),一种包括选自由以下所组成的群组的改变的组合的单体:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[0107]在其他实施方案中,腺苷脱氨酶变体是包括两个腺苷脱氨酶结构域(例如,tada*8)的同源二聚体,各个所述腺苷脱氨酶结构域具有一个或多个以下改变y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r。在其他实施方案中,腺苷脱氨酶变体是包括两个腺苷脱氨酶结构域(例如,tada*8)的同源二聚体,每个结构域具有选自由以下所组成的群组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[0108]在其他实施方案中,腺苷脱氨酶变体是包括野生型tada腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如tada*8)的异源二聚体,其包括一种或多种以下改变y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r。在其他实施方案中,腺苷脱氨酶变体是包括野生型tada腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如tada*8)的异源二聚体,所述腺苷脱氨酶变体结构域包括选自由以下所组成的群组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[0109]在其他实施方案中,腺苷脱氨酶变体是包括tada*7.10结构域和腺苷脱氨酶变体结构域(例如tada*8)的异源二聚体,所述腺苷脱氨酶变体结构域包括一种或多种以下改变y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r。在其他实施方案中,腺苷脱氨酶变体是包括tada*7.10结构域和腺苷脱氨酶变体结构域(例如tada*8)的异源二聚体,所述腺苷脱氨酶变体结构域包括一种或多种以下改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;或i76y+v82s+y123h+y147r+q154r。[0110]在一个实施方案中,腺苷脱氨酶是tada*8,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[0111]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd。[0112]在一些实施方案中,tada*8是截短的。在一些实施方案中,截短的tada*8相对于全长的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个n端氨基酸残基。在一些实施方案中,截短的tada*8相对于全长的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长的tada*8。[0113]在特定实施方案中,腺苷脱氨酶异源二聚体包括选自由以下之一者的tada*8结构域和腺苷脱氨酶结构域:[0114]在特定实施方案中,腺苷脱氨酶异源二聚体包括选自由以下之一者的tada*8结构域和腺苷脱氨酶结构域:[0115]大肠杆菌(escherichiacoli)tada:[0116]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0117]大肠杆菌(e.coli)tada(n端是截短的):[0118]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0119]金黄色葡萄球菌(staphylococcusaureus(s.aureus))tada:[0120]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0121]枯草芽孢杆菌(bacillussubtilis(b.subtilis))tada:[0122]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0123]鼠伤寒沙门氏菌(salmonellatyphimurium(s.typhimurium))tada:[0124]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0125]腐败希瓦氏菌(shewanellaputrefaciens(s.putrefaciens))tada:[0126]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0127]流感嗜血杆菌f3031(haemophilusinfluenzaef3031(h.influenzae))tada:[0128]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0129]新月柄杆菌(caulobactercrescentus(c.crescentus))tada:[0130]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0131]硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))tada:[0132]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0133]tada*7.10[0134]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0135]预期作为具有tada*8的异源二聚体组分的其他tada7.10或tada7.10变体包括:[0136]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0137]tada7.10cp65[0138]tahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdp[0139]tada7.10cp83[0140]yrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqn[0141]tada7.10cp136[0142]mnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypg[0143]tada7.10c-截短[0144]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0145]tada7.10c-截短2[0146]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprq[0147]tada7.10δ59-66+c-截短[0148]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0149]tada7.10δ59-66[0150]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd。[0151]在一些实施方案中,腺苷脱氨酶变体包括tada7.10的改变。在一些实施方案中,tada7.10包括在氨基酸82或166处的改变。在特定实施方案中,上述序列中的变体包括以下改变中的一个或多个:y147t、y147r、q154s、y123h、v82s、t166r、和q154r。在其他实施方案中,腺苷脱氨酶变体包括选自由y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y147t+q154r;y147t+q154s;和y123h+y147r+q154r+i76y所组成的群组的改变的组合。[0152]在其他实施方案中,本发明提供包含缺失的腺苷脱氨酶变体,例如包括从残基149、150、151、152、153、154、155、156或157处开始的c端缺失的tada7.10。在一些实施方案中,腺苷脱氨酶变体是包括一个或多个以下改变的tada单体:y147t、y147r、q154s、y123h、v82s、t166r、q154r。在其他实施方案中,腺苷脱氨酶变体是包括以下改变的单体:y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y147t+q154r;y147t+q154s;及y123h+y147r+q154r+i76y。在又其他实施方案中,腺苷脱氨酶变体是包括两个腺苷脱氨酶结构域的同源二聚体,各个所述腺苷脱氨酶结构域具有一个或多个以下改变y147t、y147r、q154s、y123h、v82s、t166r、q154r。在其他实施方案中,腺苷脱氨酶变体是包括野生型腺苷脱氨酶结构域或tada7.10结构域和腺苷脱氨酶变体结构域的异源二聚体,所述腺苷脱氨酶变体结构域包括一种或多种以下改变y147t、y147r、q154s、y123h、v82s、t166r,q154r。在其他实施方案中,腺苷脱氨酶变体是包括tada7.10结构域和tada7.10的腺苷脱氨酶变体的异源二聚体,该tada7.10的腺苷脱氨酶变体包括以下改变:y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y147t+q154r;y147t+q154s;及y123h+y147r+q154r+i76y。[0153]“给药”在本文中是指向患者或受试者提供本文所述一种或多种组合物。例如但不限于,组合物给药(例如注射),其可以通过静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹膜内(i.p.)注射或肌肉内(i.m.)注射进行。可以采用一种或多种这样的途径。肠胃外给药可以是,例如,通过推注或随时间逐渐灌注。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动脉内、鞘内、瘤内、皮内、腹膜内、经气管、皮下、胶质层下(subcuticularly)、关节内、囊下、蛛网膜下腔和胸骨内输注或注射。或者,或同时,可以通过口服途径给药。[0154]“药剂”是指任何小分子化合物、抗体、核酸分子或多肽,或其片段。[0155]“改变”是指基因或多肽的结构、表达水平或活性的变化(例如增加或减少),如通过标准本领域已知方法,诸如本文所述那些方法检测的。如本文所用,改变包括多核苷酸或多肽序列的变化或表达水平的变化,例如10%变化、25%变化、40%变化、50%变化或更大。[0156]“改善”是指减少、抑制、减弱、减少、阻止或稳定疾病的发展或进展。[0157]“类似物”是指不相同但具有类似功能或结构特征的分子。例如,多核苷酸或多肽类似物保留了相应的天然存在的多核苷酸或多肽的生物活性,同时具有相对于天然存在的多核苷酸或多肽增强类似物功能的某些修饰。这种修饰可以增加类似物对dna的亲和力、效率、特异性、蛋白酶或核酸酶抗性、膜渗透性、和/或半衰期,而不改变例如配体结合。类似物可包括非天然核苷酸或氨基酸。[0158]“碱基编辑器(be)”或“核碱基编辑器(nbe)”是指结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中,碱基编辑器包括核碱基修饰多肽(例如,脱氨酶)和与向导多核苷酸(例如,向导rna)结合的核酸可编程的核苷酸结合结构域。在各种实施方案中,所述药剂是包括具有碱基编辑活性的蛋白质结构域的生物分子复合物,即能够修饰核酸分子(例如,dna)内的碱基(例如,a、t、c、g或u)的结构域。在一些实施方案中,多核苷酸可编程的dna结合结构域与脱氨酶结构域融合或连接。在一个实施方案中,所述药剂是包括具有碱基编辑活性的结构域的融合蛋白。在另一个实施方案中,具有碱基编辑活性的蛋白质结构域与向导rna连接(例如,经由向导rna上的rna结合基序和与脱氨酶融合的rna结合结构域)。在一些实施方案中,具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨。在一些实施方案中,碱基编辑器能够使dna分子内的一个或多个碱基脱氨。在一些实施方案中,碱基编辑器能够使dna内的腺苷(a)脱氨。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)。[0159]“胞苷脱氨酶”是指能够催化将氨基转换为羰基的脱氨反应的多肽或其片段。在一些实施方案中,胞苷脱氨酶与apobec或aid具有至少约85%的同一性。在一个实施方案中,胞苷脱氨酶将胞嘧啶转换为尿嘧啶或将5-甲基胞嘧啶转换为胸腺嘧啶。pmcda1(衍生自海洋鳃鳗(petromyzonmarinus)(海七鳃鳗胞嘧啶脱氨酶1,“pmcda1”)、aid(激活诱导胞苷脱氨酶;(activation-inducedcytidinedeaminase,aicda))(衍生自哺乳动物(例如,人类、猪、牛、马、猴等)和apobec是实施例性的胞苷脱氨酶。[0160]在一些实施方案中,碱基编辑器是与脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)融合的可重编程的碱基编辑器。在一些实施方案中,碱基编辑器是与脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)融合的cas9。在一些实施方案中,碱基编辑器是与脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)融合的无核酸酶的cas9(dcas9)。在一些实施方案中,cas9是环状排列的cas9(例如,spcas9或sacas9)。环状排列的cas9是本领域已知的并且描述于例如oakesetal.,cell176,254-267,2019。在一些实施方案中,碱基编辑器与碱基切除修复抑制剂融合,例如,ugi结构域或disn结构域。在一些实施方案中,融合蛋白包括与脱氨酶和碱基切除修复抑制剂诸如ugi或disn结构域融合的cas9切口酶。在其他实施方案中,碱基编辑器是无碱基碱基编辑器。[0161]在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方案中,腺苷脱氨酶由tada进化而来。在一些实施方案中,本发明的碱基编辑器包括具有内部融合的催化性(例如脱氨酶)结构域的napdnabp结构域。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12a(cpf1)。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12b(c2c1)。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12c(c2c3)。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12d(casx)。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12e(casy)。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12g。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12h。在一些实施方案中,napdnabp是具有内部融合的脱氨酶结构域的cas12i。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的催化性死亡的cas12(dcas12)。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的cas12切口酶(ncas12)。[0162]在一些实施方案中,碱基编辑器是通过将腺苷脱氨酶变体(例如,tada*8)克隆到包括环状排列的cas9(例如,spcas9或sacas9)和二分核定位序列的支架中来产生(例如,abe8)。环状排列的cas9是本领域已知的并且描述于例如oakesetal.,cell176,254-267,2019。实施例性环状排列物如下,其中粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列。[0163]cp5(具有msp“ngc=具有突变的pam变体常规cas9如同ngg”pid=蛋白质相互作用结构域(proteininteractingdomain)和“d10a”切口酶):[0164][0165][0166]在一些实施方案中,abe8是选自下表6至9、13或14的碱基编辑器。在一些实施方案中,abe8含有从tada进化而来的腺苷脱氨酶变体。在一些实施方案中,abe8的腺苷脱氨酶变体是如下表7、9、13或14中所述tada*8变体。在一些实施方案中,腺苷脱氨酶变体是包括一个或多个选自y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r的改变的tada*7.10变体(例如tada*8)。在各种实施方案中,abe8包括具有选自由y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r所组成的群组的改变的组合的tada*7.10变体(例如tada*8)。在一些实施方案中,abe8是单体构建体。在一些实施方案中,abe8是异源二聚体构建体。在一些实施方案中,abe8碱基编辑器包括以下序列:[0167]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd。[0168]在一些实施方案中,多核苷酸可编程的dna结合结构域是crispr相关(例如,cas或cpf1)酶。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的催化性死亡的cas9(dcas9)。在一些实施方案中,碱基编辑器是与脱氨酶结构域融合的cas9切口酶(ncas9)。在一些实施方案中,碱基编辑器与碱基切除修复(baseexcisionrepair,ber)抑制剂融合。在一些实施方案中,碱基切除修复抑制剂是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复抑制剂是肌苷碱基切除修复抑制剂。[0169]碱基编辑器的细节在国际pct申请第pct/2017/045381(wo2018/027078)号和国际pct申请第pct/us2016/058344(wo2017/070632)号中进行了描述,它们各自通过引用整体并入本文。另参见komor,a.c.etal.,“无programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),以及rees,h.a.,etal.,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其全部内容特此引入作为参考。[0170]举例来说,本文所述的碱基编辑组合物、系统和方法中使用的胞苷碱基编辑器具有以下核酸序列(8877个碱基对),(addgene,watertown,ma.;komorac,etal.,2017,sciadv.,30;3(8):eaao4774.doi:10.1126/sciadv.aao4774)如下。还包括与be4核酸序列具有至少95%或更高同一性的多核苷酸序列。[0171][0172][0173][0174][0175][0176][0177][0178][0179][0180]be4氨基酸序列:[0181]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggspkkkrk[0182]举例来说,本文所述的碱基编辑组合物、系统和方法中使用的腺嘌呤碱基编辑器(abe)具有核酸序列(8877个碱基对),(addgene,watertown,ma.;gaudellinm,etal.,nature.2017nov23;551(7681):464-471.doi:10.1038/nature24644;koblanlw,etal.,natbiotechnol.2018oct;36(9):843-846.doi:10.1038/nbt.4172.)如下。还包括与abe核酸序列具有至少95%或更高同一性的多核苷酸序列。[0183]atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacat[0184]gaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg[0185]ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattg[0186]acgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgcccc[0187]attgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgt[0188]cagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggaca[0189]gccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaagtcgagtttagccacgagt[0190]attggatgaggcacgcactgaccctggcaaagcgagcatgggatgaaagagaagtccccgtgggcgccgt[0191]gctggtgcacaacaatagagtgatcggagagggatggaacaggccaatcggccgccacgaccctaccgca[0192]cacgcagagatcatggcactgaggcagggaggcctggtcatgcagaattaccgcctgatcgatgccaccc[0193]tgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacagcaggatcggaagagtggt[0194]gttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcaccaccccggcatg[0195]aaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatttcttta[0196]gaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcgg[0197]aggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctcc[0198]ggaggatcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagaggg[0199]cacgcgatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctg[0200]gaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctg[0201]gtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccg[0202]gcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaacgcaaaaaccggcgccgcagg[0203]ctccctgatggacgtgctgcactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggca[0204]gatgaatgtgccgccctgctgtgctatttctttcggatgcctagacaggtgttcaatgctcagaagaagg[0205]cccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcga[0206]gagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggcc[0207]atcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaagg[0208]tgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcga[0209]aacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgc[0210]tatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagt[0211]ccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggc[0212]ctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgac[0213]ctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacc[0214]tgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcga[0215]ggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcaga[0216]cggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccc[0217]tgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgag[0218]caaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgttt[0219]ctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcacca[0220]aggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagc[0221]tctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgcc[0222]ggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatgg[0223]acggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaa[0224]cggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttac[0225]ccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggcc[0226]ctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaa[0227]cttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataag[0228]aacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagc[0229]tgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggc[0230]catcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaag[0231]aaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacat[0232]accacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctgga[0233]agatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcc[0234]cacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagcc[0235]ggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacgg[0236]cttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaa[0237]gcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccatta[0238]agaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccga[0239]gaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagaga[0240]atgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaaca[0241]cccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccagga[0242]actggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgac[0243]tccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaag[0244]aggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagtt[0245]cgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacag[0246]ctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacg[0247]acgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccg[0248]gaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaac[0249]gccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactaca[0250]aggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtactt[0251]cttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcgg[0252]cctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgc[0253]ggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaa[0254]agagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaag[0255]tacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagt[0256]ccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaa[0257]tcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaag[0258]tactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaa[0259]acgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaaggg[0260]ctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatc[0261]gagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcct[0262]acaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaa[0263]tctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaa[0264]gaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctc[0265]agctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagag[0266]gaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgcctt[0267]ctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccac[0268]tgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggt[0269]ggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggct[0270]ctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgta[0271]atcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccgga[0272]agcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgc[0273]ccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcgg[0274]tttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcga[0275]gcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaaca[0276]tgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct[0277]ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataa[0278]agataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggat[0279]acctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttc[0280]ggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgcctta[0281]tccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggta[0282]acaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggcta[0283]cactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagc[0284]tcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgca[0285]gaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactc[0286]acgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatga[0287]agttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgagg[0288]cacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactac[0289]gatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctcca[0290]gatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcct[0291]ccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgt[0292]tgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcc[0293]caacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccga[0294]tcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttac[0295]tgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgt[0296]atgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaa[0297]aagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccag[0298]ttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtga[0299]gcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatac[0300]tcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatg[0301]tatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacgga[0302]tcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaa[0303]gccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaac[0304]aaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgat[0305]gtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcat[0306]tagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcc[0307]caacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccat[0308]tgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc[0309]“碱基编辑活性”是指用于化学改变多核苷酸内的碱基。在一个实施方案中,将第一个碱基转换为第二个碱基。在一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如将目标c·g转换为t·a。在另一个实施方案中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如将a·t转换为g·c。在另一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如将目标c·g转换为t·a和腺苷或腺嘌呤脱氨酶活性,例如将a·t转换为g·c。在一些实施方案中,碱基编辑活动通过编辑效率来评估。碱基编辑效率可以通过任何合适的方式来测量,例如,通过桑格测序或下一代测序。在一些实施方案中,碱基编辑效率通过具有受碱基编辑器影响的核碱基转换的总测序读数的百分比来测量,例如,具有转换为g.c碱基对的目标a.t碱基对的总测序读数的百分比。在一些实施方案中,当在细胞群中进行碱基编辑时,碱基编辑效率通过具有受碱基编辑器实现的核碱基转换的总细胞的百分比来测量。[0310]术语“碱基编辑器系统”是指用于编辑目标核苷酸序列的核碱基的系统。在各种实施方案中,碱基编辑器系统包括(1)多核苷酸可编程的核苷酸结合结构域(例如cas9);(2)用于使所述核碱基脱氨的脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶);(3)一种或多种向导多核苷酸(例如向导rna)。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的dna结合结构域。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(abe)。在一些实施方案中,碱基编辑器系统是abe8。[0311]在一些实施方案中,碱基编辑器系统可以包括超过一个碱基编辑组分。例如,碱基编辑器系统可包括超过一种脱氨酶。在一些实施方案中,碱基编辑器系统可包括一种或多种腺苷脱氨酶。在一些实施方案中,可利用单个向导多核苷酸将不同的脱氨酶靶向目标核酸序列。在一些实施方案中,单对向导多核苷酸可用于将不同脱氨酶靶向目标核酸序列。[0312]碱基编辑器系统的脱氨酶结构域和多核苷酸可编程的核苷酸结合组分可以共价或非共价地彼此连结,或其连结和相互作用的任何组合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程的核苷酸结合结构域靶向目标核苷酸序列。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以通过与脱氨酶结构域非共价相互作用或连结将脱氨酶结构域靶向目标核苷酸序列。例如,在一些实施方案中,脱氨酶结构域可包括额外的异源部分或结构域,其能够与作为多核苷酸可编程的核苷酸结合结构域的一部分的额外的异源部分或结构域相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0313]碱基编辑器系统可进一步包括向导多核苷酸组分。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其关联和相互作用的任何组合彼此关联。在一些实施方案中,脱氨酶结构域可以通过向导多核苷酸靶向目标核苷酸序列。例如,在一些实施方案中,脱氨酶结构域可包括能够与以下物质相互作用、连结或能够与向导多核苷酸的一部分或区段(例如,多核苷酸基序)形成复合物的另外的异源部分或结构域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白)。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如rna或dna结合蛋白)可以与脱氨酶结构域融合或连接。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0314]在一些实施方案中,碱基编辑器系统可进一步包括碱基切除修复(ber)组分的抑制剂。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其关联和相互作用的任何组合彼此关联。ber成分的抑制剂可以包括ber抑制剂。在一些实施方案中,ber抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,ber抑制剂可以是肌苷ber抑制剂。在一些实施方案中,ber抑制剂可以通过多核苷酸可编程的核苷酸结合结构域靶向目标核苷酸序列。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以与ber抑制剂融合或连接。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以与脱氨酶结构域和ber抑制剂融合或连接。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以通过与ber抑制剂非共价相互作用或连结来将ber抑制剂靶向目标核苷酸序列。例如,在一些实施方案中,ber组分的抑制剂可包括额外的异源部分或结构域,其能够与作为可编程的多核苷酸结合结构域一部分的额外的异源部分或结构域相互作用、连结或形成复合物。[0315]在一些实施方案中,ber抑制剂可以通过向导多核苷酸靶向目标核苷酸序列。例如,在一些实施方案中,ber抑制剂可以包括能够与具有向导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用、连结或能够形成复合物的另外的异源部分或结构域(例如,多核苷酸结合结构域,诸如rna或dna结合蛋白)。在一些实施方案中,向导多核苷酸的另外的异源部分或结构域(例如,多核苷酸结合结构域,诸如rna或dna结合蛋白)可以与ber抑制剂融合或连接。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0316]术语“cas9”或“cas9结构域”是指包括cas9蛋白或其片段(例如,包括cas9、和/或grna的活性、失活或部分活性的dna切割结构域的蛋白)的rna向导的核酸酶cas9的结合结构域)。cas9核酸酶有时也称为casnl核酸酶或crispr(成簇的规则间隔短回文重复序列)相关核酸酶。crispr是一种适应性免疫系统,其针对移动遗传组件(病毒、转座组件和接合质粒)提供保护。crispr簇包括间隔、与先行移动组件互补的序列和目标入侵核酸。crispr簇被转录并加工成crisprrna(crrna)。在ii类crispr系统中,正确处理pre-crrna需要转编码的小rna(tracrrna)、内源性核糖核酸酶3(rnc)和cas9蛋白。tracrrna作为核糖核酸酶3辅助处理pre-crrna的向导。随后,cas9/crrna/tracrrna核酸内切方式切割与间隔互补的线性或环状dsdna目标。与crrna不互补的目标链首先通过核酸内切方式切割,然后通过3'-5'核酸外切方式修剪。在自然界中,dna结合和切割通常需要蛋白质和两种rna。然而,可以对单个向导rna(“sgrna”,或简称为“gnra”)进行改造,以便将crrna和tracrrna的各个方面整合到单个rna种类中。参见,例如,jinekm.,etal.,science337:816-821(2012),其全部内容通过引用方式并入本文。cas9识别crispr重复序列(pam或前间隔邻近基序)中的短基序,以帮助区分自我与非自我。cas9核酸酶序列和结构是本领域技术人员众所周知的(参见,例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferrettietal.,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,etal.,nature471:602-607(2011);以及“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.,etal.,science337:816-821(2012),各个通过引用方式整体并入本文)。cas9直向同源物已在各种物种中得到描述,包括但不限于化脓链球菌和嗜热链球菌。基于本公开内容,其他合适的cas9核酸酶和序列对本领域技术人员来说是显而易见的,并且此类cas9核酸酶和序列包括来自chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737中公开的生物体和位点;其以引用方式整体并入本文。[0317]实施例性的cas9是化脓链球菌cas9(spcas9),其氨基酸序列提供如下:[0318][0319](单底线:hnh结构域;双底线:ruvc域)[0320]核酸酶失活的cas9蛋白可互换地称为“dcas9”蛋白(对于核酸酶而言‑“死”的cas9)或催化性失活的cas9。用于产生具有失活dna切割结构域的cas9蛋白(或其片段)的方法是已知的(参见,例如,jineketal.,science.337:816-821(2012);qietal.,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,各个以引用方式整体并入本文)。例如,已知cas9的dna切割域包括两个子域,hnh核酸酶子域和ruvc1子域。hnh子域切割与grna互补的链,而ruvc1子域切割非互补链。这些子域内的突变可以使cas9的核酸酶活性沉默。例如,突变的d10a和h840a完全使化脓链球菌cas的核酸酶活性失活(jineketal.,science.337:816-821(2012);qietal.,cell.28;152(5):1173-83(2013))。在一些实施方案中,cas9核酸酶具有失活(例如,失活的)的dna切割结构域,即,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。在一些实施方案中,提供包括cas9片段的蛋白质。例如,在一些实施方案中,蛋白质包括两个cas9结构域之一:(1)cas9的grna结合结构域;或(2)cas9的dna切割域。在一些实施方案中,包括cas9或其片段的蛋白质被称为“cas9变体”。cas9变体与cas9或其片段具有同源性。例如,cas9变体在与野生型cas9具有至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个的氨基酸变化。在一些实施方案中,cas9变体包括cas9的片段(例如,grna结合结构域或dna切割域),使得所述片段至少约70%相同,至少约80%相同,至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%与野生型cas9的相应片段相同。在一些实施方案中,所述片段是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与对应野生型cas9氨基酸长度相同。[0321]在一些实施方案中,所述片段的长度为至少100个氨基酸。在一些实施方案中,所述片段的长度是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1050、1100、1150、1200、1250或至少1300个氨基酸。[0322]在一些实施方案中,野生型cas9对应于来自化脓链球菌的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下)。[0323]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0324][0325][0326](单底线:hnh结构域;双底线:ruvc域)[0327]在一些实施方案中,野生型cas9对应于或包括以下核苷酸和/或氨基酸序列:[0328]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0329][0330][0331](单底线:hnh结构域;双底线:ruvc域)[0332]在一些实施方案中,野生型cas9对应于来自化脓链球菌的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下);和uniprot参考序列:q99zw2(氨基酸序列如下)。[0333]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0334][0335][0336](单底线:hnh结构域;双底线:ruvc域)[0337]在一些实施方案中,cas9是指来自:溃疡棒状杆菌(corynebacteriumulcerans)(ncbi参考序列:nc_015683.1、nc_017317.1)的cas9;白喉棒状杆菌(corynebacteriumdiphtheria)(ncbi参考序列:nc_016782.1、nc_016786.1);食蚜蝇(spiroplasmasyrphidicola)(ncbi参考序列:nc_021284.1);中间普氏菌(prevotellaintermedia)(ncbi参考序列:nc_017861.1);spiroplasmataiwanense(ncbi参考序列:nc_021846.1);鱼型链球菌(streptococcusiniae)(ncbi参考序列:nc_021314.1);波罗海贝尔氏菌(belliellabaltica)(ncbi参考序列:nc_018010.1);冷弯曲菌(psychroflexustorquisi)(ncbi参考序列:nc_018721.1);嗜热链球菌(ncbi参考序列:yp_820832.1)、无害李斯特菌(listeriainnocua)(ncbi参考序列:np_472073.1)、空肠弯曲菌(campylobacterjejuni)(ncbi参考序列:yp_002344900.1)或脑膜炎奈瑟菌(neisseriameningitidis)(ncbi参考序列:yp_002342100.1)或来自任何其他生物体的cas9。[0338]在一些实施方案中,dcas9对应于或部分或全部包括具有一个或多个使cas9核酸酶活性失活的突变的cas9氨基酸序列。例如,在一些实施方案中,dcas9结构域包括在seqidno:1中编号为d10a和h840a突变或另一个cas9中的相应的突变。在一些实施方案中,dcas9包括dcas9(d10a和h840a)的氨基酸序列:[0339][0340](单底线:hnh结构域;双底线:ruvc域)。[0341]在一些实施方案中,cas9结构域包括d10a突变,而位置840的残基在上文提供的氨基酸序列中或在本文所提供的任何氨基酸序列中的相应位置仍为组氨酸。[0342]在其他实施方案中,提供具有除d10a和h840a之外的突变的dcas9变体,其例如导致核酸酶失活的cas9(dcas9)。例如,此类突变包括在d10和h840处的其他氨基酸取代,或cas9核酸酶结构域内的其他取代(例如,hnh核酸酶子域和/或ruvc1子域中的取代)。在一些实施方案中,提供dcas9的变体或同源物,其至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供具有短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0343]在一些实施方案中,本文所提供的cas9融合蛋白包括cas9蛋白的全长氨基酸序列,例如本文所提供的cas9序列之一。然而,在其他实施方案中,本文所提供的融合蛋白不包括全长cas9序列,而仅包括其一个或多个片段。本文提供合适的cas9结构域和cas9片段的实施例性氨基酸序列,并且cas9结构域和片段的其他合适的序列对本领域技术人员来说是显而易见的。[0344]应当理解,额外的cas9蛋白(例如,核酸酶死亡cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性cas9),包括其变体和同系物,是在本公开的范围内。实施例性的cas9蛋白包括但不限于那些以下提供者。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0345]实施例性催化失活的cas9(dcas9):[0346]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0347]实施例性催化的cas9切口酶(ncas9):[0348]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0349]实施例性催化活性的cas9:[0350]dkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0351]在一些实施方案中,cas9是指来自古细菌(例如,纳米古细菌)的cas9,其构成单细胞原核微生物的域和界。在一些实施方案中,cas9是指casx或casy,其已描述在例如bursteinetal.,"newcrispr-cassystemsfromuncultivatedmicrobes."cellres.2017feb21.doi:10.1038/cr.2017.21,其特此以引入方式整体并入。使用基因组解析的宏基因组学,识别了许多crispr-cas系统,包括在古细菌领域首次报道的cas9。这种发散的cas9蛋白在很少被研究的纳米古细菌中发现,作为活性crispr-cas系统的一部分。在细菌中,发现了两个以前未知的系统crispr-casx和crispr-casy,它们是迄今为止发现的最紧凑的系统之一。在一些实施方案中,cas9是指casx或casx的变体。在一些实施方案中,cas9是指casy或casy的变体。应当理解,其他rna向导的dna结合蛋白可以用作核酸可编程的dna结合蛋白(napdnabp),并且在本公开的范围内。[0352]在特定实施方案中,可用于本发明的方法中的napdnabp包括本领域已知的并且例如由oakesetal.,cell176,254–267,2019描述的环状排列物。实施例性环状排列物如下粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列,cp5(具有msp“ngc=具有突变的pam变体常规cas9如同ngg”pid=蛋白质相互作用结构域和“d10a”切口酶):[0353][0354][0355]可并入碱基编辑器的多核苷酸可编程的核苷酸结合结构域的非限制性实例包括衍生自crispr蛋白结构域、限制性核酸酶、大范围核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。[0356]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与天然存在的casx或casy至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%蛋白相同。在一些实施方案中,napdnabp是天然存在的casx或casy蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与本文所述任何casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,根据本公开也可以使用来自其他细菌物种的cas12b/c2c1、casx和casy。[0357]cas12b/c2c1(uniprot.org/uniprot/t0d7a2#2)[0358]sp|t0d7a2|c2c1_aliagcrispr相关的内切核酸酶c2c1os=酸土脂环酸芽孢杆菌(alicyclobacillusacido-terrestris)(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1[0359]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi[0360]casx(uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)[0361]》tr|f0nn87|f0nn87_sulihcrispr相关的casx蛋白os=冰岛硫化叶菌(sulfolobusislandicus)(菌株hve10/4)gn=sih_0402pe=4sv=1[0362]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0363]》tr|f0nh53|f0nh53_sulircrispr相关的蛋白质,casxos=冰岛硫化叶菌(菌株rey15a)gn=sire_0771pe=4sv=1[0364]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0365]变形杆菌casx[0366]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0367]casy(ncbi.nlm.nih.gov/protein/apg80656.1)[0368]》apg80656.1crispr相关的蛋白casy[未培养的俭菌门(parcubacteria)细菌][0369]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki[0370]术语“cas12”或“cas12结构域”是指包括cas12蛋白或其片段(例如,包括cas12的活性、失活或部分活性的dna切割域的蛋白和/或cas12的grna结合结构域)的rna向导的核酸酶。cas12属于2类v型crispr/cas系统。cas12核酸酶有时也称为crispr(成簇的规则间隔短回文重复序列)相关的核酸酶。以下提供实施例性久氏芽孢杆菌(bacillushisashii)cas12b(bhcas12b)cas12结构域的序列:[0371]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk。[0372]与bhcas12b氨基酸序列具有至少85%或更高同一性的氨基酸序列也可用于本发明的方法。[0373]“胞苷脱氨酶”是指能够催化将氨基转换为羰基的脱氨反应的多肽或其片段。在一个实施方案中,胞苷脱氨酶将胞嘧啶转换为尿嘧啶或将5-甲基胞嘧啶转换为胸腺嘧啶。pmcda1(衍生自海七鳃鳗(海七鳃鳗胞嘧啶脱氨酶1,“pmcda1”))、aid(激活诱导胞苷脱氨酶;aicda)(衍生自哺乳动物(例如,人类、猪、牛、马、猴等))和apobec是实施例性的胞苷脱氨酶。[0374]术语“保守性氨基酸取代”或“保守性突变”是指一个氨基酸被具有共同特性的另一个氨基酸取代。定义个别氨基酸之间共同特性的一种功能方法是分析同源生物体的相应蛋白质之间氨基酸变化的标准化频率(schulz,g.e.andschirmer,r.h.,principlesofproteinstructure,springer-verlag,newyork(1979))。根据这样的分析,可以定义氨基酸群组为其中群组内的氨基酸优先相互交换,因此在它们对整体蛋白质结构的影响方面彼此最相似(schulz,g.e.andschirmer,r.h.,同上)。保守性突变的非限制性实例包括氨基酸的氨基酸取代,例如以赖氨酸取代精氨酸和反之亦然,从而可以保持正电荷;以谷氨酸取代天冬氨酸和反之亦然,以保持负电荷;以丝氨酸取代苏氨酸,使得可以保持一个游离的-oh;和以谷氨酰胺取代天冬酰胺,使得可以保持游离的-nh2。[0375]如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸片段。所述区域或序列在靠近5'端的地方有一个起始密码子,而在靠近3'端的地方有一个终止密码子。编码序列也可称为开放阅读框。[0376]如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤水解脱氨为次黄嘌呤。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(a)水解脱氨为肌苷(i)。在一些实施方案中,脱氨酶或脱氨酶结构域是分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中腺苷的水解脱氨。本文所提供的腺苷脱氨酶(例如,工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体,例如细菌。在一些实施方案中,腺苷脱氨酶来自细菌,例如大肠杆菌、金黄色葡萄球菌、鼠伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌或新月芽孢杆菌。[0377]在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*8。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体例如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然存在的脱氨酶至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%相同。例如,国际pct申请第pct/2017/045381(wo2018/027078)号和第pct/us2016/058344(wo2017/070632)号中描述了脱氨酶结构域,各自通过引用方式整体并入本文。另请参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),以及rees,h.a.,etal.,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其特此以引入方式整体并入。[0378]“检测”是指识别待检测分析物的存在、不存在或量。在一个实施方案中,检测多核苷酸或多肽中的序列改变。在另一个实施方案中,检测插入缺失的存在。[0379]“可检测标记”是指一种组合物,当与感兴趣的分子连接时,经由光谱、光化学、生物化学、免疫化学或化学手段使后者可检测。例如,有用的标记包括放射性同位素、磁珠、金属珠、胶体颗粒、荧光染料、电子致密试剂、酶(例如,通常用于酶联免疫吸附测定(elisa))、生物素、地高辛,或半抗原。[0380]“疾病”是指损害或干扰细胞、组织或器官的正常功能的任何病况或病症。[0381]如本文所用,术语“有效量”是指足以引发所需生物反应的生物活性剂的量。用于实施本发明以治疗疾病的活性剂的有效量取决于给药方式、受试者的年龄、体重和一般健康状况而变化。最终,主治医师或兽医将决定适当的量和剂量方案。这种量被称为“有效”量。在一个实施方案中,有效量是足以在细胞(例如,体外或体内细胞)中的感兴趣基因中引入改变的本发明的碱基编辑器(例如,包括可编程的dna结合蛋白、核碱基编辑器及grna的融合蛋白)的量。在一些实施方案中,本文所提供的融合蛋白,例如包括ncas9结构域和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)的核碱基编辑器的有效量可以指足以使诱导编辑由核碱基编辑器特异性地绑定和编辑的目标位点。在一个实施方案中,有效量是达成治疗效果(例如,减轻或控制疾病或其症状或病况)所需的碱基编辑器的量。这种治疗效果不需要足以改变受试者、组织或器官的所有细胞中的感兴趣基因,而仅改变约存在于受试者、组织或器官中的1%、5%、10%、25%、50%、75%或更多的感兴趣基因。[0382]在一些实施方案中,本文所提供的融合蛋白,例如包括ncas9结构域和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)的核碱基编辑器的有效量是指足以诱导由本文所述核碱基编辑器特异性地结合和编辑的目标位点的量。本领域技术人员将理解,有效量的药剂,例如融合蛋白、核酸酶、杂合蛋白、蛋白二聚体、蛋白(或蛋白二聚体)和多核苷酸的复合物,或多核苷酸,可能会因各种因素而异,例如,所需的生物反应,例如在欲编辑的特定等位基因、基因组或目标位点,欲靶向的细胞或组织、和/或所使用的药剂。[0383]“片段”是指多肽或核酸分子的一部分。所述部分包括参考核酸分子或多肽全长的至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可包括10、20、30、40、50、60、70、80、90或100、200、300、400、500、600、700、800、900或1000个核苷酸或氨基酸。[0384]“向导rna”或“grna”是指可以特异于目标序列并且可以与多核苷酸可编程的核苷酸结合结构域蛋白(例如cas9或cpf1)形成复合物的多核苷酸。在一个实施方案中,向导多核苷酸是向导rna(grna)。grna可以作为两个或多个rna的复合物存在,也可以作为单个rna分子存在。以单个rna分子形式存在的grna可称为单个向导rna(sgrna),但“grna”可互换使用以指以单个分子或两个或更多个分子的复合物形式存在的向导rna。通常,作为单个rna种类存在的grna包括两个结构域:(1)与目标核酸具有同源性的结构域(例如,向导cas9复合物与目标的结合);(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于称为tracrrna的序列,并且包括茎环结构。例如,在一些实施方案中,结构域(2)与jineketal.,science337:816-821(2012)中提供的tracrrna相同或同源,其通过引用方式整体内容并入本文。grna的其他实施例(例如,那些包括结构域2者)可以于2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,682(题为“可切换的cas9核酸酶及其用途(switchablecas9nucleasesandusesthereof)”)和于2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,746题为“功能性核酸酶递送系统(deliverysystemforfunctionalnucleases)”),各自特此通过引用方式整体内容并入本文。在一些实施方式中,grna包括结构域(1)和(2)中的两个或更多个,并且可以被称为“延伸的grna”。如本文所述,延伸的grna将结合两个或更多个cas9蛋白并在两个或更多个不同区域结合目标核酸。grna包括与目标位点互补的核苷酸序列,其介导核酸酶/rna复合物与所述目标位点的结合,提供核酸酶:rna复合物的序列特异性。[0385]“杂交”是指互补核碱基之间的氢键,其可以是沃森-克里克、胡斯坦或反向胡斯坦氢键。例如,腺嘌呤和胸腺嘧啶是通过形成氢键配对的互补的核碱基。[0386]术语“碱基修复抑制剂”或“ibr”是指能够抑制核酸修复酶(例如碱基切除修复(ber)酶)的活性的蛋白质。在一些实施方案中,ibr是肌苷碱基切除修复的抑制剂。碱基修复的实施例性抑制剂包括ape1、endoiii、endoiv、endov、endoviii、fpg、hogg1、hneil1、t7endol、t4pdg、udg、hsmug1及haag的抑制剂。在一些实施方案中,ibr是endov或haag的抑制剂。在一些实施方案中,ibr是催化失活的endov或催化失活的haag。在一些实施方案中,碱基修复抑制剂是endov或haag的抑制剂。在一些实施方案中,碱基修复抑制剂是催化失活的endov或催化失活的haag。[0387]在一些实施方案中,碱基修复抑制剂是尿嘧啶糖基化酶抑制剂(ugi)。ugi是指能够抑制尿嘧啶-dna糖基化酶碱基-切除修复酶的蛋白质。在一些实施方案中,ugi结构域包括野生型ugi或野生型ugi的片段。在一些实施方案中,本文所提供的ugi蛋白质包括ugi的片段和与ugi或ugi片段同源的蛋白质。在一些实施方案中,碱基修复抑制剂是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基修复抑制剂是“催化失活的肌苷特异性核酸酶”或“死亡的肌苷特异性核酸酶”。不希望受任何特定理论的束缚,催化失活的肌苷糖基化酶(例如,烷基腺嘌呤糖基化酶(aag))可以结合肌苷,但不能产生无碱基位点或去除肌苷,从而在空间上阻断新形成的肌苷部分免受dna损伤/修复机制。在一些实施方案中,催化失活的肌苷特异性核酸酶能够结合核酸中的肌苷,但不切割核酸。非限制性实施例性催化失活肌苷特异性核酸酶包括催化失活的烷基腺苷糖基化酶(aag核酸酶),例如来自人,和催化失活内切核酸酶v(endov核酸酶),例如来自大肠杆菌。在一些实施方案中,催化失活的aag核酸酶包括e125q突变或另一种aag核酸酶中的相应的突变。[0388]“增加”是指至少10%、25%、50%、75%或100%的正向变化。[0389]“内含肽”是一种蛋白质片段,它能够自我切除并在称为蛋白质剪接的过程中用肽键连接剩余的片段(外显肽)。内含子也称为“蛋白质内含子”。内含肽自身切除并连接蛋白质剩余部分的过程在本文中称为“蛋白质剪接”或“内含肽介导的蛋白质剪接”。在一些实施方案中,前体蛋白的内含肽(在内含肽介导的蛋白质剪接之前含有内含肽的蛋白质)来自两个基因。这种内含肽在本文中被称为分裂内含肽(例如,分裂内含肽-n和分裂内含肽-c)。例如,在蓝藻中,dna聚合酶iii的催化亚基a的dnae是由两个独立的基因dnae-n和dnae-c编码。由dnae-n基因编码的内含肽在本文中可称为“内含肽-n”。由dnae-c基因编码的内含肽在本文中可称为“内含肽-c”。[0390]还可以使用其他内含肽系统。例如,已经描述了基于dnae内含肽、cfa-n(例如,分裂的内含肽-n)和cfa-c(例如,分裂的内含肽-c)内含肽对的合成内含肽(例如,在stevensetal.,jamchemsoc.2016feb.24;138(7):2162-5,通过引用方式并入本文)。可根据本公开使用的内含肽对的非限制性实例包括:cfadnae内含肽、sspgyrb内含肽、sspdnax内含肽、terdnae3内含肽、terthyx内含肽、rmadnab内含肽和cneprp8内含肽(例如,于美国专利no.8,394,604中所述,其通过引用方式并入本文。[0391]提供内含肽的实施例性核苷酸和氨基酸序列。[0392]dnae内含肽-ndna:[0393]tgcctgtcatacgaaaccgagatactgacagtagaatatggccttctgccaatcgggaagattgtggagaaacggatagaatgcacagtttactctgtcgataacaatggtaacatttatactcagccagttgcccagtggcacgaccggggagagcaggaagtattcgaatactgtctggaggatggaagtctcattagggccactaaggaccacaaatttatgacagtcgatggccagatgctgcctatagacgaaatctttgagcgagagttggacctcatgcgagttgacaaccttcctaat[0394]dnae内含肽-n蛋白:[0395]clsyeteiltveygllpigkivekriectvysvdnngniytqpvaqwhdrgeqevfeycledgsliratkdhkfmtvdgqmlpideifereldlmrvdnlpn[0396]dnae内含肽-cdna:[0397]atgatcaagatagctacaaggaagtatcttggcaaacaaaacgtttatgatattggagtcgaaagagatcacaactttgctctgaagaacggattcatagcttctaat[0398]内含肽-c:[0399]mikiatrkylgkqnvydigverdhnfalkngfiasn[0400]cfa-ndna:[0401]tgcctgtcttatgataccgagatacttaccgttgaatatggcttcttgcctattggaaagattgtcgaagagagaattgaatgcacagtatatactgtagacaagaatggtttcgtttacacacagcccattgctcaatggcacaatcgcggcgaacaagaagtatttgagtactgtctcgaggatggaagcatcatacgagcaactaaagatcataaattcatgaccactgacgggcagatgttgccaatagatgagatattcgagcggggcttggatctcaaacaagtggatggattgcca[0402]cfa-n蛋白:[0403]clsydteiltveygflpigkiveeriectvytvdkngfvytqpiaqwhnrgeqevfeycledgsiiratkdhkfmttdgqmlpideifergldlkqvdglp[0404]cfa-cdna:[0405]atgaagaggactgccgatggatcagagtttgaatctcccaagaagaagaggaaagtaaagataatatctcgaaaaagtcttggtacccaaaatgtctatgatattggagtggagaaagatcacaacttccttctcaagaacggtctcgtagccagcaac[0406]cfa-c蛋白:[0407]mkrtadgsefespkkkrkvkiisrkslgtqnvydigvekdhnfllknglvasn[0408]内含肽-n和内含肽-c可以分别与分裂cas9的n端部分和分裂cas9的c端部分融合,以用于连接分裂cas9的n端部分和分裂cas9的c端部分。例如,在一些实施方案中,将内含肽-n与分裂cas9的n端部分的c端融合,即形成n‑‑[分裂cas9的n端部分的结构]-[内含肽-n]‑‑c。在一些实施方案中,内含肽-c与分裂的cas9的c端部分的n端融合,即形成n-[内含肽-c]‑‑[c端的结构cas9]-c的一部分。内含肽介导的蛋白质剪接用于连接与内含肽融合的蛋白质(例如,分裂cas9)的机制是本领域已知的,例如,在shahetal.,chemsci.2014;5(1):446-461中所述,其通过引用方式并入本文。用于设计和使用内含肽的方法在本领域中是已知的,并且描述于例如wo2014004336、wo2017132580、us20150344549和us20180127780中,各自通过引用方式整体并入本文。[0409]术语“单离的”、“纯化的”或“生物纯的”是指材料在不同程度上不含在其天然状态下通常伴随的组分。“单离”表示与原始来源或周围环境的分离程度。“纯化”表示高于单离程度的分离程度。“纯化的”或“生物纯的”蛋白质充分不含其他材料,使得任何杂质不会实质性地影响蛋白质的生物特性或引起其他不利后果。亦即,若本发明的核酸或肽在通过重组dna技术生产时实质上不含细胞材料、病毒材料或培养基,或者在化学合成时实质上不含化学前体或其他化学品,则所述核酸或肽被纯化。纯度和均一性通常使用分析化学技术确定,例如聚丙烯酰胺凝胶电泳或高效液相色谱。术语“纯化的”可以表示核酸或蛋白质在电泳凝胶中产生基本上一条带。对于可以进行修饰(例如磷酸化或糖基化)的蛋白质,不同的修饰可能会产生不同的分离蛋白质,这些蛋白质可以单独纯化。[0410]“单离的多核苷酸”是指在本发明的核酸分子所衍生自的生物体的天然存在的基因组中不含基因的核酸(例如,dna),所述基因在所述基因的侧边。因此,所述术语包括,例如,整合到载体中的重组dna;进入自主复制的质粒或病毒;或进入原核生物或真核生物的基因组dna;或作为与其他序列无关的个别分子(例如,通过pcr或限制性内切核酸酶酶切产生的cdna或基因组或cdna片段)存在。此外,所述术语包括从dna分子转录的rna分子,以及作为编码额外多肽序列的杂合基因的一部分的重组dna。[0411]“单离的多肽”是指已与天然伴随的组分分离的本发明的多肽。通常,当多肽至少60%(重量)不含蛋白质和天然存在的有机分子时,多肽就被单离出来。优选地,所述制剂是至少75重量%,更优选至少90重量%,并且最优选至少99重量%的本发明多肽。本发明的分离的多肽可以,例如,通过从天然来源中提取,通过编码这种多肽的重组核酸的表达;或通过化学合成蛋白质获得。纯度可以通过任何合适的方法测量,例如柱色谱、聚丙烯酰胺凝胶电泳或通过hplc分析。[0412]如本文所用,术语“连接子”可指共价连接子(例如,共价键)、非共价连接子、化学基团或连接两个分子或部分(例如,蛋白质复合物或核糖核复合物的两个组分或融合蛋白的两个结构域)的分子,例如多核苷酸可编程的dna结合结构域(例如dcas9)和脱氨酶结构域(例如腺苷脱氨酶、胞苷脱氨酶或腺苷脱氨酶和胞苷脱氨酶)或napdnabp结构域(例如cas12b)和脱氨酶结构域(例如腺苷脱氨酶或胞苷脱氨酶)。在特定实施方案中,连接子在插入cas蛋白或其片段内的脱氨酶结构域的侧边。连接子可以连接碱基编辑器系统的不同组分或组分的不同部分。例如,在一些实施方案中,连接子可以连接多核苷酸可编程的核苷酸结合结构域的向导多核苷酸结合结构域和脱氨酶的催化域。在一些实施方案中,连接子可以连接crispr多肽和脱氨酶。在一些实施方案中,连接子可以连接cas9和脱氨酶。在一些实施方案中,连接子可以连接dcas9和脱氨酶。在一些实施方案中,连接子可以连接ncas9和脱氨酶。例如,在一些实施方案中,连接子可以连接cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h或cas12i及脱氨酶。在一些实施方案中,连接子可以连接向导多核苷酸和脱氨酶。在一些实施方案中,连接子可以连接碱基编辑器系统的脱氨组分和多核苷酸可编程的核苷酸结合组分。在一些实施方案中,连接子可以连接碱基编辑器系统的脱氨组分和napdnabp组分的rna结合部分。在一些实施方案中,连接子可以连接碱基编辑器系统的脱氨组分和多核苷酸可编程的核苷酸结合组分的rna结合部分。在一些实施方案中,连接子可以连接碱基编辑器系统的脱氨组分的rna结合部分和多核苷酸可编程的核苷酸结合组分的rna结合部分。连接子可以位于两个基团、分子或其他部分之间或侧边,并经由共价键或非共价相互作用连接到各者,因此连接两者。在一些实施方案中,连接子可以是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子可以是多核苷酸。在一些实施方案中,连接子可以是dna连接子。在一些实施方案中,连接子可以是rna连接子。在一些实施方案中,连接子可包括能够结合配体的适体。在一些实施方案中,配体可以是碳水化合物、肽、蛋白质或核酸。在一些实施方案中,连接子可包括可衍生自核糖开关的适体。衍生自适体的核糖开关可以选自茶碱核糖开关、焦磷酸硫胺素(tpp)核糖开关、腺苷钴胺素(adocbl)核糖开关、s-腺苷甲硫氨酸(sam)核糖开关、sah核糖开关、黄素单核苷酸(fmn)核糖开关、四氢叶酸核糖开关、赖氨酸核糖开关、甘氨酸核糖开关、嘌呤核糖开关、glms核糖开关或q核昔1(pre-queosine1,preq1)核糖开关。在一些实施方案中,连接子可包括与多肽或蛋白质结构域诸如多肽配体结合的适体。在一些实施方案中,多肽配体可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。在一些实施方案中,多肽配体可以是碱基编辑器系统组分的一部分。例如,核碱基编辑组分可包括脱氨酶结构域和rna识别基序。[0413]在一些实施方案中,连接子可以是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子的长度可为约5至100个氨基酸,例如约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20至30、30至40、40至50、50至60、60至70、70至80、80至90、或90至100个氨基酸的长度。在一些实施方案中,连接子的长度可为约100至150、150至200、200至250、250至300、300至350、350至400、400至450或450至500个氨基酸。也可以考虑更长或更短的连接子。[0414]在一些实施方案中,连接子连接rna可编程的核酸酶的grna结合结构域,包括cas9核酸酶结构域和核酸编辑蛋白(例如,胞苷或腺苷脱氨酶)的催化域。在一些实施方案中,连接子连接dcas9和核酸编辑蛋白。例如,连接子位于两个基团、分子或其他部分之间或侧边,并经由共价键与各者连接,因此连接两者。在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子的长度为5至200个氨基酸,例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190或200个氨基酸的长度。也预期更长或更短的连接子。[0415]在一些实施方案中,核碱基编辑器的结构域通过包括sggssgsetpgtsesatpessggs、sggssggssgsetpgtsesatpessggssggs、或ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsgg的氨基酸序列的连接子融合。在一些实施方案中,核碱基编辑器的结构域经由包括氨基酸序列sgsetpgtsesatpes的连接子融合,其也可称为xten连接子。在一些实施方案中,连接子包括氨基酸序列sggs。在一些实施方案中,连接子包括(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes、或(xp)n基序或任何这些的组合,其中n独立地是1和30之间的整数,并且其中x是任何氨基酸。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。[0416]在一些实施方案中,连接子的长度为24个氨基酸。在一些实施方案中,连接子包括氨基酸序列sggssggssgsetpgtsesatpes。在一些实施方案中,连接子的长度为40个氨基酸。在一些实施方案中,连接子包括氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggs。在一些实施方案中,连接子的长度为64个氨基酸。在一些实施方案中,连接子包括氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs。在一些实施方案中,连接子的长度为92个氨基酸。在一些实施方案中,连接子包括氨基酸序列pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats。[0417]“标记”是指在与疾病或病症相关的表达水平或活性方面具有改变的任何蛋白质或多核苷酸。[0418]如本文所用,术语“突变”是指序列(例如核酸或氨基酸序列)内的残基被另一残基取代,或序列内一个或多个残基的缺失或插入。突变在本文中通常通过识别原始残基随后是所述残基在序列中的位置以及通过新取代残基的身份来描述。用于进行本文所提供的氨基酸取代(突变)的各种方法是本领域公知的,并且由例如greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012))提供。在一些实施方案中,当前公开的碱基编辑器可以有效地在核酸(例如,受试者基因组内的核酸)中产生“预期突变”,诸如点突变,而不会产生大量非预期突变,诸如意外的点突变。在一些实施方案中,预期突变是由特定碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)与向导多核苷酸(例如,grna)结合而产生的突变,特别设计用于产生预期突变。[0419]通常,在序列(例如,如本文所述氨基酸序列)中产生或识别的突变相对于参考(或野生型)序列(即不包括突变的序列)进行编号。本领域技术人员将容易理解如何确定氨基酸和核酸序列中相对于参考序列的突变位置。[0420]术语“非保守性突变”涉及不同群组之间的氨基酸取代,例如,以赖氨酸取代色氨酸,或以丝氨酸取代苯丙氨酸等。在这种情况下,非保守性氨基酸取代优选不干扰,或抑制功能性变体的生物活性。非保守性氨基酸取代可增强功能性变体的生物活性,使得与野生型蛋白质相比,功能性变体的生物活性增加。[0421]术语“核定位序列”、“核定位信号”或“nls”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的并且描述于例如于2000年11月23日提交的plank等人的国际pct申请pct/ep2000/011690,其在2001年5月31日公布为wo/2001/038547公布,其内容以引用方式并入本文以用于其对实施例性核定位序列的公开。在其他实施方案中,nls是优化的nls,例如由koblanetal.,naturebiotech.2018doi:10.1038/nbt.4172所述。在一些实施方案中,nls包括氨基酸序列krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprk、pkkkrkv、或mdsllmnrrkflyqfknvrwakgrretylc。[0422]如本文所用,术语“核酸”和“核酸分子”是指包括核碱基和酸性部分的化合物,例如核苷、核苷酸或核苷酸的聚合物。通常,聚合核酸,例如包括三个或更多个核苷酸的核酸分子是线性分子,其中相邻的核苷酸通过磷酸二酯键相互连接。在一些实施方案中,“核酸”是指个别核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包括三个或更多个个别核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如,至少三个核苷酸的串)。在一些实施方案中,“核酸”包括rna以及单链和/或双链dna。核酸可以是天然存在的,例如在基因组、转录物、mrna、trna、rrna、sirna、snrna、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子中。另一方面,核酸分子可以是非天然存在的分子,例如重组dna或rna、人工染色体、工程基因组或其片段,或合成的dna、rna、dna/rna杂交体、或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“dna”、“rna”和/或类似术语包括核酸类似物,例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下,例如在化学合成分子的情况下,核酸可以包括核苷类似物,诸如具有化学修饰碱基的类似物或糖和骨架修饰。除非另有说明,否则核酸序列以5'到3'方向呈现。在一些实施方案中,核酸是或包括天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷及脱氧胞苷);核苷类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟苷及2-硫代胞苷);化学修饰的碱基;生物修饰碱基(例如甲基化碱基);插入的碱基;修饰的糖(2'-例如氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖);和/或修饰的磷酸基团(例如,硫代磷酸酯和5'-n-亚磷酰胺键)。[0423]术语“核酸可编程的dna结合蛋白”或“napdnabp”可以与“多核苷酸可编程的核苷酸结合结构域”互换使用,以指与核酸(例如,dna或rna)连结的蛋白质,所述核酸是诸如将napdnabp向导至特定的核酸序列的向导核酸或向导多核苷酸(例如,grna)。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的dna结合结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的rna结合结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是cas9蛋白。cas9蛋白可以与向导rna连结,所述向导rna将cas9蛋白向导至与向导rna互补的特定dna序列。在一些实施方案中,napdnabp是cas9结构域,例如核酸酶活性cas9、cas9切口酶(ncas9)或核酸酶失活cas9(dcas9)。核酸可编程的dna结合蛋白的非限制性实例包括cas9(例如dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h及cas12i和。cas酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也以知为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii类cas效应蛋白、v型cas效应蛋白、vi类cas效应蛋白、carf、ding、其同源物,或其修饰或工程化版本。其他核酸可编程的dna结合蛋白也在本公开的范围内,尽管它们可能未在本公开中具体列出。参见,例如,makarovaetal.“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yanetal.,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,各自特此通过引用方式并入。[0424]术语“核碱基”、“含氮碱基”或“碱基”在本文中可互换使用,是指形成核苷的含氮生物化合物,而核苷是核苷酸的组分。核碱基形成碱基对并相互堆叠的能力直接导致长链螺旋结构,例如核糖核酸(rna)和脱氧核糖核酸(dna)。五种核碱基—腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)及尿嘧啶(u)—被称为原始(primary)或权威(canonical)。腺嘌呤和鸟嘌呤衍生自嘌呤,而胞嘧啶、尿嘧啶和胸腺嘧啶衍生自嘧啶。dna和rna还可以包括其他(非主要)修饰的碱基。非限制性实施例性修饰核碱基可包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶(m5c)及5-氢甲基胞嘧啶。次黄嘌呤和黄嘌呤可以通过诱变剂的存在产生,两者皆通过脱氨(用羰基置换胺基团)产生。次黄嘌呤可以由腺嘌呤修饰而成。黄嘌呤可以由鸟嘌呤修饰。尿嘧啶可由胞嘧啶脱氨产生。“核苷”是由核碱基和五碳糖(核糖或脱氧核糖)所组成。核苷的实例包括腺苷、鸟苷、尿苷、胞苷、5-甲基尿苷(m5u)、脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷及脱氧胞苷。具有修饰的核碱基的核苷的实例包括肌苷(i)、黄苷(x)、7-甲基鸟苷(m7g)、二氢尿苷(d)、5-甲基胞苷(m5c)及假尿苷(ψ)。“核苷酸”是由核碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团所组成。[0425]术语“核酸可编程的dna结合蛋白”或“napdnabp”是指与核酸(例如dna或rna)连结的蛋白质,例如向导napdnabp至特定核酸序列的向导核酸。例如,cas12蛋白可以与向导cas12蛋白连接与向导rna互补的特定dna序列的向导rna。在一些实施方案中,napdnabp是cas12结构域,例如核酸酶活性cas12结构域。napdnabps的例子包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h及cas12i。其他napdnabps也在本公开的范围内,尽管它们可能没有在本公开中具体列出。参见,例如,makarovaetal.“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yanetal.,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,各自特此通过引用方式全部内容并入。[0426]如本文所用,术语“核苷碱基编辑结构域”或“核苷碱基编辑蛋白”是指可催化rna或dna中的核苷碱基修饰的蛋白质或酶,诸如胞嘧啶(或胞苷)成尿嘧啶(或尿苷)或胸腺嘧啶(或胸苷)及腺嘌呤(或腺苷)成次黄嘌呤(或肌苷)脱氨,以及非模板化的核苷酸添加和插入。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶;或胞苷脱氨酶或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域是超过一个脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶和胞苷或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域可以是天然存在的核碱基编辑结构域。在一些实施方案中,核碱基编辑结构域可以是来自天然存在的核碱基编辑结构域的工程化或进化的核碱基编辑结构域。核碱基编辑结构域可以来自任何生物体,例如细菌、人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。例如,核碱基编辑蛋白在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中有所描述,各自通过引用整体并入本文。另参阅komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其全部内容特此通过引入方式并入。[0427]如本文所用,“获得药剂”中的“获得”包括合成、购买或以其他方式获得所述药剂。[0428]如本文所用,“患者”或“受试者”是指被诊断患有、有患有的风险或发展、或怀疑患有或发展疾病或病症的哺乳动物受试者或个体。在一些实施方案中,术语“患者”是指具有高于平均发展疾病或病症的可能性的哺乳动物受试者。实施例性患者可以是人类、非人类灵长类动物、猫、狗、猪、牛、猫、马、骆驼、美洲驼、山羊、绵羊、啮齿动物(例如小鼠、兔、大鼠或豚鼠)和其他可以受益于本文公开的疗法。实施例性的人类患者可以是男性和/或女性。[0429]“有需要的患者”或“有需要的受试者”在本文中是指被诊断患有、有风险或患有、预定患有或怀疑患有疾病或病症的患者。[0430]术语“致病突变”、“致病变异”、“疾病外壳突变”、“致病变异”、“致病突变”或“易感突变”是指增加个体对某种疾病或病症的易感性或素质。在一些实施方案中,致病性突变包括至少一种野生型氨基酸被基因编码的蛋白质中的至少一种致病性氨基酸取代。[0431]术语“药学上可接受的载体”是指药学上可接受的材料、组合物或赋形剂,诸如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石镁、硬脂酸钙或硬脂酸锌或硬脂酸)或溶剂包封材料,涉及将化合物从身体的一个部位(例如,递送部位)携带或运输到另一部位(例如,器官、组织或身体的一部分)。药学上可接受的载体在与制剂的其他成分兼容并且对受试者的组织没有伤害的意义上是“可接受的”(例如,生理兼容的、无菌的、生理ph等)。诸如“赋形剂”、“载体”、“药学上可接受的载体”、“载体”等术语在本文中可互换使用。[0432]术语“药物组合物”可以指配制用于药物用途的组合物。[0433]术语“蛋白质”、“肽”、“多肽”及其语法等价物在本文中可互换使用,是指通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。这些术语是指任何大小、结构或功能的蛋白质、肽或多肽。通常,蛋白质、肽或多肽的长度至少为三个氨基酸。蛋白质、肽或多肽可以指个别蛋白质或蛋白质的集合。蛋白质、肽或多肽中的一个或多个氨基酸可以被修饰,例如,通过添加化学实体,诸如碳水化合物基团、羟基、磷酸基、法呢基、异法呢基、脂肪酸基团、用于缀合、功能化或其他修饰的连接子等。蛋白质、肽或多肽也可以是单个分子或可以是多分子复合物。蛋白质、肽或多肽可以只是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的或合成的,或其任何组合。如本文所用,术语“融合蛋白”是指包括来自至少两种不同蛋白质的蛋白质结构域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基末端(n端)部分或羧基末端(c端)蛋白,因此分别形成氨基-末端融合蛋白或羧基-末端融合蛋白。蛋白质可以包括不同的结构域,例如,核酸结合结构域(例如,引导蛋白质与目标位点结合的cas9的grna结合结构域)和核酸切割域,或核酸编辑蛋白的催化域。在一些实施方案中,蛋白质包括蛋白质部分(例如构成核酸结合结构域的氨基酸序列)和有机化合物(例如可以作用为核酸切割剂的化合物)。在一些实施方案中,蛋白质与核酸例如rna或dna形成复合物或连结。本文所提供的任何蛋白质可以通过本领域已知的任何方法产生。例如,本文所提供的蛋白质可以经由重组蛋白质表达和纯化产生,这尤其适用于包括肽连接子的融合蛋白质。重组蛋白表达和纯化的方法是众所周知的,包括greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,ny(2012)),其全部内容其通过引用方式并入本文。[0434]本文公开的多肽和蛋白质(包括其功能性部分和功能性变体)可包括合成氨基酸代替一种或多种天然存在的氨基酸。此类合成氨基酸是本领域已知的,包括例如氨基环己烷羧酸、正亮氨酸、α-氨基正癸酸、高丝氨酸、s-乙酰氨基甲基-半胱氨酸、反式-3‑‑羟基脯氨酸和反式-4-羟基脯氨酸、4-氨基苯丙氨酸、4-硝基苯丙氨酸、4-氯苯丙氨酸、4-羧基苯丙氨酸、β-苯基丝氨酸、β-羟基苯丙氨酸、苯基甘氨酸、α-萘丙氨酸、环己基丙氨酸、环己基甘氨酸、二氢吲哚-2-羧酸、1,2,3,4-四氢异喹啉-3-羧酸、氨基丙二酸、氨基丙二酸单酰胺、n'-苄基-n'-甲基-赖氨酸、n',n'-二苄基-赖氨酸、6-羟基赖氨酸、鸟氨酸、α-氨基环戊烷羧酸、α-氨基环己烷羧酸、α-氨基环庚烷羧酸、α-(2-氨基-2-降冰片烷)-羧酸、α,γ-二氨基丁酸、α,β-二氨基丙酸、高苯丙氨酸及α-叔丁基甘氨酸。多肽和蛋白质可以与多肽构建体的一个或多个氨基酸的翻译后修饰相关。翻译后修饰的非限制性实例包括磷酸化、酰化(包括乙酰化和甲酰化)、糖基化(包括n-连接和o-连接)、酰胺化、羟基化、烷基化(包括甲基化和乙基化)、泛素化、添加吡咯烷酮羧酸、形成二硫键、硫酸化、肉豆蔻酰化、棕榈酰化、异戊二烯化、法呢基化、香叶基化、糖基磷脂酰肌醇化、脂酰化和碘化。[0435]术语“多核苷酸可编程的核苷酸结合结构域”或“核酸可编程的dna结合蛋白(napdnabp)”是指与核酸(例如dna或rna)连结的蛋白质,诸如将多核苷酸可编程的核苷酸结合结构域向导至特定核酸序列的向导多核苷酸(例如向导rna)。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的dna结合结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的rna结合结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是cas12蛋白。[0436]如本文在蛋白质或核酸的上下文中使用的术语“重组”是指在自然界中不存在但为人类工程产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白或核酸分子包括氨基酸或核苷酸序列,所述序列包括至少一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少与任何自然发生的序列相比,有七个突变。[0437]“减少”是指至少10%、25%、50%、75%或100%的负变化。[0438]“参考”是指标准或对照条件。在一个实施方案中,参考是野生型或健康细胞。在其他实施方案中且不限于,参照是未经受测试条件或经受安慰剂或生理盐水、培养基、缓冲液、和/或不包括感兴趣的多核苷酸的对照载体的未处理细胞。[0439]“参考序列”是用作序列比较基础的定义序列。参考序列可以是特定序列的子集或全部;例如,全长cdna或基因序列的片段,或完整的cdna或基因序列。对于多肽,参考多肽序列的长度将通常为至少约16个氨基酸、至少约20个氨基酸、至少约25个氨基酸、约35个氨基酸、约50个氨基酸或约100个氨基酸。对于核酸,参考核酸序列的长度通常为至少约50个核苷酸、至少约60个核苷酸、至少约75个核苷酸、约100个核苷酸或约300个核苷酸或其附近或之间的任何整数。在一些实施方案中,参考序列是目的蛋白质的野生型序列。在其他实施方案中,参考序列是编码野生型蛋白质的多核苷酸序列。[0440]术语“rna可编程的核酸酶”和“rna向导的核酸酶”与一种或多种不是切割目标的rna一起使用(例如,结合或连结)。在一些实施方案中,当与rna形成复合物时,rna可编程的核酸酶可被称为核酸酶:rna复合物。通常,结合的rna被称为向导rna(grna)。grna可以作为两个或更多个rna的复合物存在,也可以作为单个rna分子存在。以单个rna分子形式存在的grna可称为单个向导rna(sgrna),尽管“grna”可互换使用以指以单个分子或两个或更多个分子的复合物形式存在的向导rna。通常,作为单个rna种类存在的grna包括两个结构域:(1)与目标核酸具有同源性的结构域(例如,引导cas9复合物与目标的结合);和(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于已知为tracrrna的序列,并且包括茎环结构。例如,在一些实施方案中,结构域(2)与如jineketal.,science337:816-821(2012)中提供的tracrrna相同或同源,其全部内容通过引用方式并入本文。grna的其他实例(例如,那些包含结构域2者)可以在于2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,682(题为“可切换的cas9核酸酶及其用途(switchablecas9nucleasesandusesthereof”))以及于2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,746(题为“功能性核酸酶递送(deliverysystemforfunctionalnucleases”))中找到,各自的全部内容通过引用方式并入本文。在一些实施方案中,grna包括结构域(1)和(2)中的两个或更多个,并且可以被称为“延长的grna”。例如,如本文所述,延伸的grna将例如结合两个或更多个cas9蛋白并在两个或更多个不同区域结合目标核酸。grna包括与目标位点互补的核苷酸序列,其介导核酸酶/rna复合物与所述目标位点的结合,提供核酸酶:rna复合物的序列特异性。[0441]在一些实施方案中,rna可编程的核酸酶是(crispr相关的系统)cas9核酸内切酶,例如来自化脓链球菌的cas9(casnl)(参见,例如,“completegenomesequenceofanmlstrainofstreptococcuspyogenes.”ferrettij.j.,etal.,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,etal.,nature471:602-607(2011)。[0442]由于rna可编程的核酸酶(例如cas9)使用rna:dna杂交来靶向dna切割位点,这些蛋白质原则上能够靶向向导rna指定的任何序列。使用rna可编程的核酸酶(诸如cas9)进行位点特异性切割(例如,修饰基因组)的方法是本领域已知的(参见例如cong,l.etak,mmultiplexgenomeengineeringusingcrispr/cassystems.science339,819-823(2013);mali,p.etal.,rna-guidedhumangenomeengineeringviacas9.science339,823-826(2013);hwang,w.y.etal.,efficientgenomeeditinginzebrafishusingacrispr-cassystem.naturebiotechnology31,227-229(2013);jinek,m.etal.,rna-programmedgenomeeditinginhumancells.elife2,e00471(2013);dicarlo,j.e.etal.,genomeengineeringinsaccharomycescerevisiaeusingcrispr-cassystems.nucleicacidsresearch(2013);jiang,w.etal.,rna-guidededitingofbacterialgenomesusingcrispr-cassystems.naturebiotechnology31,233-239(2013);其全部内容通过引用方式并入本文)。[0443]术语“单核苷酸多态性(snp)”是发生在基因组中特定位置的单个核苷酸的变异,其中各变异在群体中都存在一定程度(例如,》1%)。例如,在人类基因组的特定碱基位置,c核苷酸可以出现在大多数个体中,但在少数个体中,所述位置被a占据。这意味着在所述特定位置存在snp,并且两个可能的核苷酸变异c或a被称为所述位置的等位基因。snp是疾病易感性差异的基础。疾病的严重程度和我们身体对治疗的反应方式也是遗传变异的表现。snp可以落入基因的编码区、基因的非编码区或基因间区(基因之间的区域)。在一些实施方案中,由于遗传密码的简并性,编码序列内的snp不一定改变所产生蛋白质的氨基酸序列。编码区的snp有两种类型:同义snp和非同义snp。同义snp不影响蛋白质序列,而非同义snp改变蛋白质的氨基酸序列。非同义snp有两种类型:错义和无义。不在蛋白质编码区的snp仍然可以影响基因剪接、转录因子结合、信使rna降解或非编码rna的序列。受此类snp影响的基因表达称为esnp(表达snp),可以位于基因的上游或下游。单核苷酸变异(singlenucleotidevariant,snv)是单个核苷酸的变异,没有任何频率限制,可以在体细胞中出现。体细胞单核苷酸变异也可称为单核苷酸改变。[0444]“特异性结合”是指识别并结合以下多肽和/或核酸分子的核酸分子、多肽或其复合物(例如,核酸可编程的dna结合结构域和向导核酸)、化合物或分子本发明,但基本上不识别和结合样本中的其他分子,例如生物样本。[0445]可用于本发明方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。这样的核酸分子不需要与内源核酸序列100%相同,但通常会表现出基本的同一性。与内源序列具有“实质同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。可用于本发明方法的核酸分子包括编码本发明多肽或其片段的任何核酸分子。这样的核酸分子不需要与内源核酸序列100%相同,但将通常会表现出基本的同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。“杂交”是指在各种严格条件下,在互补多核苷酸序列(例如,本文所述基因)或其部分之间配对以形成双链分子。(参见,例如wahl,g.m.ands.l.berger(1987)methodsenzymol.152:399;kimmel,a.r.(1987)methodsenzymol.152:507).[0446]例如,严格盐浓度通常低于约750mmnacl和75mm柠檬酸三钠,优选低于约500mmnacl和50mm柠檬酸三钠,更优选低于约250mmnacl和25mm柠檬酸三钠。可以在不存在有机溶剂例如甲酰胺的情况下获得低严格杂交,而可以在存在至少约35%甲酰胺,更优选至少约50%甲酰胺的情况下获得高严格杂交。严格的温度条件通常包括至少约30℃,更优选至少约37℃,最优选至少约42℃的温度。改变附加参数,例如杂交时间、去污剂浓度、例如,十二烷基硫酸钠(sds),以及载体dna的包括或排除是本领域技术人员公知的。通过根据需要组合这些不同的条件来实现不同程度的严格性。在一个实施方案中,杂交将在30℃在750mmnacl、75mm柠檬酸三钠和1%sds中发生。在另一个实施方案中,杂交将在37℃在500mmnacl、50mm柠檬酸三钠、1%sds、35%甲酰胺及100μg/ml变性鲑鱼精子dna(ssdna)中发生。在另一个实施方案中,杂交将在42℃在250mmnacl、25mm柠檬酸三钠、1%sds、50%甲酰胺及200μg/mlssdna中发生。对于本领域技术人员来说,这些条件的有用变化将是显而易见的。[0447]对于大多数应用,杂交后的洗涤步骤在严格性方面也将有所不同。洗涤严格条件可以通过盐浓度和温度来定义。如上,可以通过降低盐浓度或提高温度来增加洗涤严格性。例如,洗涤步骤的严格盐浓度优选小于约30mmnacl和3mm柠檬酸三钠,最优选小于约15mmnacl和1.5mm柠檬酸三钠。洗涤步骤的严格温度条件通常包括至少约25℃,更优选至少约42℃,甚至更优选至少约68℃的温度。在一个实施方案中,将发生洗涤步骤在25℃,在30mmnacl、3mm柠檬酸三钠及0.1%sds中。在更优选的实施方案中,洗涤步骤将在42℃在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中进行。在更优选的实施方案中,洗涤步骤将在68℃在15mmnacl、1.5mm柠檬酸三钠及0.1%sds中进行。这些条件的其他变化对于本领域技术人员来说将是显而易见的。杂交技术是本领域技术人员众所周知的,并且描述于例如bentonanddavis(science196:180,1977);grunsteinandhogness(proc.natl.acad.sci.,usa72:3961,1975);ausubeletal.(currentprotocolsinmolecularbiology,wileyinterscience,newyork,2001);bergerandkimmel(guidetomolecularcloningtechniques,1987,academicpress,newyork);及sambrooketal.,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork。[0448]“分裂”是指分成两个或更多个片段。[0449]“分裂cas9蛋白”或“分裂cas9”是指作为由两个单独的核苷酸序列编码的n端片段和c端片段提供的cas9蛋白。对应于cas9蛋白的n端部分和c端部分的多肽可以被剪接以形成“重建的”cas9蛋白。在特定实施方案中,cas9蛋白质在蛋白质的无序区域内被分成两个片段,例如,在nishimasuetal.,cell,volume156,issue5,pp.935-949,2014中所述,或如在jiangetal.(2016)science351:867-871.pdbfile:5f9r中所述,各自通过引用方式并入本文。在一些实施方案中,所述蛋白质在spcas9区域内约氨基酸a292至g364、f445至k483或e565至t637之间的任何c、t、a或s处,或在任何其他cas9、cas9变体(例如,ncas9、dcas9)或其他napdnabp处分成两个片段。在一些实施方案中,蛋白质在spcas9t310、t313、a456、s469或c574处被分成两个片段。在一些实施方案中,将蛋白质分成两个片段的过程称为“分裂”的蛋白质。[0450]在其他实施方案中,cas9蛋白的n端部分包括氨基酸1至573或1至637化脓链球菌cas9野生型(spcas9)(ncbi参考序列:nc_002737.2,uniprot参考序列:q99zw2)和cas9蛋白的c端部分包括spcas9野生型的氨基酸574至1368或638至1368的一部分。[0451]分裂的cas9的c端部分可以与分裂的cas9的n端部分连接以形成完整的cas9蛋白。在一些实施方案中,cas9蛋白的c端部分从cas9蛋白的n端部分结束的地方开始。因此,在一些实施方案中,分裂的cas9的c端部分包括spcas9的氨基酸(551-651)-1368的一部分。“(551-651)-1368”是指起始于氨基酸551至651(包含的)之间的氨基酸并终止于氨基酸1368。例如,分裂的cas9的c端部分可以包括spcas9之任何一个氨基酸551至1368、552至1368、553至1368、554至1368、555至1368、556至1368、557至1368、558至1368、559至1368、560至1368、561至1368、562至1368、563至1368、564至1368、565至1368、566至1368、567至1368、568至1368、569至1368、570至1368、571至1368、572至1368、573至1368、574至1368、575至1368、576至1368、577至1368、578至1368、579至1368、580至1368、581至1368、582至1368、583至1368、584至1368、585至1368、586至1368、587至1368、588至1368、589至1368、590至1368、591至1368、592至1368、593至1368、594至1368、595至1368、596至1368、597至1368、598至1368、599至1368、600至1368、601至1368、602至1368、603至1368、604至1368、605至1368、606至1368、607至1368、608至1368、609至1368、610至1368、611至1368、612至1368、613至1368、614至1368、615至1368、616至1368、617至1368、618至1368、619至1368、620至1368、621至1368、622至1368、623至1368、624至1368、625至1368、626至1368、627至1368、628至1368、629至1368、630至1368、631至1368、632至1368、633至1368、634至1368、635至1368、636至1368、637至1368、638至1368、639至1368、640至1368、641至1368、642至1368、643至1368、644至1368、645至1368、646至1368、647至1368、648至1368、649至1368、650至1368、或651至1368的一部分。在一些实施方案中,分裂的cas9蛋白的c端部分包括spcas9之氨基酸574至1368或638至1368。[0452]“受试者”是指哺乳动物,包括但不限于人类或非人类哺乳动物,例如牛、马、犬、绵羊或猫。受试者包括家畜、饲养以生产劳动和提供商品诸如食物的驯养动物,包括但不限于牛、山羊、鸡、马、猪、兔及绵羊。[0453]“实质上相同”是指多肽或核酸分子与参考氨基酸序列(例如,本文所载任一个氨基酸序列)或核酸序列(例如,本文所载任一个氨基酸序列)表现出至少50%的同一性。在一个实施方案中,这样的序列与用于比较的序列在氨基酸水平或核酸有至少60%、80%或85%、90%、95%或甚至99%相同。[0454]序列同一性通常使用序列分析软件(例如,遗传学计算机组的序列分析软件包(sequenceanalysissoftwarepackageofthegeneticscomputergroup),universityofwisconsinbiotechnologycenter,1710universityavenue,madison,wis.53705、序列相似性搜索、bestfit、gap或pileup/prettybox程序)。此类软件通过为各种取代、删除、和/或其他修饰分配同源性程度来匹配相同或相似的序列。保守取代通常包括以下群组内的取代:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。在确定同一性程度的实施例性方法中,可以使用序列相似性搜索程序,其中e-3和e-100之间的概率分数表示密切相关的序列。[0455]例如,cobalt与以下参数一起使用:[0456]a)对齐参数:间隙罚分-11、-1和端间隙罚分-5、-1,[0457]b)cdd参数:使用rps序列相似性搜索(blast);序列相似性搜索e-值0.003;查找保守列并重新计算,以及[0458]c)查询集群参数:使用查询集群;字号4;最大集群距离0.8;字母常规。[0459]例如,使用embossneedle时具有以下参数:[0460]a)矩阵:blosum62;[0461]b)缺口开放:10;[0462]c)缺口延长:0.5;[0463]d)输出格式:对;[0464]e)末端缺口罚分:错误;[0465]f)末端缺口开放:10;以及[0466]g)末端缺口延长:0.5。[0467]术语“目标位点”是指被核碱基编辑器修饰的核酸分子内的序列。在一个实施方案中,目标点被脱氨酶或包括脱氨酶(例如,胞苷或腺嘌呤脱氨酶)的融合蛋白脱氨。[0468]如本文所用,术语“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”等是指减少或改善病症和/或与其相关的症状或获得期望的药理效果和/或生理效果。将理解尽管不排除,治疗病症或病症并不要求完全消除病症、病况或与其相关的症状。在一些实施方案中,所述作用是治疗性的,即不限于所述作用部分或完全减少、减弱、消除、减缓、减轻、降低疾病和/或可归因于所述疾病的不利症状的强度或治愈所述疾病和/或不利症状。在一些实施方案中,该作用是预防性的,即所述作用保护或防止疾病或病况的发生或复发。为此,目前公开的方法包括给药治疗有效量的如本文所述组合物。[0469]“尿嘧啶糖基化酶抑制剂”或“ugi”是指抑制尿嘧啶-切除修复系统的药剂。在一个实施方案中,试剂是结合宿主尿嘧啶-dna糖基化酶并防止从dna去除尿嘧啶残基的蛋白质或其片段。在一个实施方案中,ugi是能够抑制尿嘧啶-dna糖基化酶碱基切除修复酶的蛋白质、其片段或结构域。在一些实施方案中,ugi结构域包括野生型ugi或其修饰形式。在一些实施方案中,ugi结构域包括下文阐述的实施例性氨基酸序列的片段。在一些实施方案中,ugi片段包括的氨基酸序列,其包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的至少下文提供的实施例性ugi序列。在一些实施方案中,ugi包括下述与实施例性ugi氨基酸序列或其片段同源的氨基酸序列。在一些实施方案中,ugi或其一部分为下述与野生型ugi或ugi序列或其部分至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%或100%相同。实施例性的ugi包括如下氨基酸序列:[0470]》splp14739iungi_bppb2尿嘧啶-dna糖基化酶抑制剂mtnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikml。[0471]术语“载体”是指将核酸序列引入细胞中而产生转换细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是包括待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可包括额外的核酸序列以促进和/或促进引入序列的表达,例如起始、终止、增强子、启动子和分泌序列。[0472]本文所提供的任何组合物或方法可以与本文所提供的任何其他组合物和方法中的一种或多种组合。[0473]dna编辑已成为通过在基因水平上校正致病突变来改变疾病状态的可行手段。直到最近,所有dna编辑平台的功能都是通过在特定基因组位点诱导dna双链断裂(dsb)并依靠内源性dna修复途径以半随机方式确定产品结果,产生复杂的遗传产品群体。虽然可以通过同源性定向修复(homologydirectedrepair,hdr)途径实现精确的、用户定义的修复结果,许多挑战阻碍了在治疗相关细胞类型中使用hdr进行高效修复。在实践中,所述途径相对于竞争性、易出错的非同源端连接途径而言效率低下。此外,hdr被严格限制在细胞周期的g1和s期,防止有丝分裂后细胞中dsb的精确修复。因此,已经证明很难或不可能以用户定义的、可编程的方式在这些群体中高效地改变基因组序列。[0474]本文所提供的任何组合物或方法可以与本文所提供的任何其他组合物和方法中的一种或多种组合。[0475]dna编辑已成为通过在基因水平上校正致病突变来改变疾病状态的可行手段。直到最近,所有dna编辑平台的功能都是通过在特定基因组位点诱导dna双链断裂(dsb)并依靠内源性dna修复途径以半随机方式确定产品结果,产生复杂的遗传产品群体。虽然可以通过同源性定向修复(hdr)途径实现精确的、用户定义的修复结果,许多挑战阻碍了在治疗相关细胞类型中使用hdr进行高效修复。在实践中,所述途径相对于竞争性、易出错的非同源端连接途径而言效率低下。此外,hdr被严格限制在细胞周期的g1和s期,防止有丝分裂后细胞中dsb的精确修复。因此,已经证明很难或不可能以用户定义的、可编程的方式在这些群体中高效地改变基因组序列。附图说明[0476]图1a-1c描绘了质粒。图1a是编码tada7.10-dcas9碱基编辑器的表达载体。图1b是包括编码赋予氯霉素抗性(camr)和奇霉素抗性(spectr)的蛋白质的核酸分子的质粒。所述质粒还包括被两个点突变不作用的卡那霉素抗性基因。图1c是包括编码赋予氯霉素抗性(camr)和奇霉素抗性(spectr)的蛋白质的核酸分子的质粒。所述质粒还包括被三点突变不作用的卡那霉素抗性基因。[0477]图2是用图1中描绘的表达载体转导的细菌菌落的影像,其中包括有缺陷的卡那霉素抗性基因。载体包括使用易错pcr产生的abe7.10变体。使用增加浓度的卡那霉素,选择表达这些“进化的”abe7.10变体的细菌细胞以获得卡那霉素抗性。表达具有腺苷脱氨酶活性的abe7.10变体的细菌能够校正引入卡那霉素抗性基因的突变,从而恢复卡那霉素抗性。选择卡那霉素抗性细胞用于进一步分析。[0478]图3a和3b图示了血红蛋白亚基γ(hgb1)基因座的调节区的编辑,其是胎儿血红蛋白上调的治疗相关位点。图3a是hgb1基因调节区的一部分的图。图3b量化了腺苷脱氨酶变体的效率和特异性。在hek293t细胞中的血红蛋白亚基γ1(hgb1)位点检测编辑,其为胎儿血红蛋白上调的治疗相关位点。上图描绘了hgb1基因调控序列目标区域中的核苷酸残基。a5、a8、a9和a11表示hgb1中经过编辑的腺苷残基。[0479]图4说明了包括识别非规范pam序列的dcas9的腺苷碱基编辑器的相对有效性。上图描述了血红蛋白亚基的编码序列。下图展示了腺苷脱氨酶变异碱基编辑器与不同长度的向导rna的效率。[0480]图5是说明abe8碱基编辑器的效率和特异性的图。对预期目标核苷酸和非预期目标核苷酸(旁观者)的编辑百分比进行量化。[0481]图6是说明abe8碱基编辑器的效率和特异性的图。对预期目标核苷酸和非预期目标核苷酸(旁观者)的编辑百分比进行量化。[0482]图7a-7d描绘了第八代腺嘌呤碱基编辑器在人类细胞中介导卓越的a·t至g·c的转换。图7a说明了腺嘌呤碱基编辑的概述:i)abe8在基因组中的sgrna靶向位点处创建r环;ii)tada*脱氨酶通过r环的ss-dna部分的水解脱氨将腺嘌呤化学转换为肌苷;iii)cas9的d10a切口酶切割与含有肌苷的链相反的链;iv)含有肌苷的链可用作dna复制过程中的模板;v)在dna聚合酶的背景下,肌苷优先与胞嘧啶碱基配对;及vi)复制后,肌苷可能被鸟苷替代。图7b图示abe8.x-m和abe8.x-d的架构。图7c图示与和trnaarg2复合的金黄色葡萄球菌tada(未显示)(pdb2b3j)对齐的大肠杆菌tada脱氨酶(pdb1z3a)的三个视角。在第八轮进化中确定的突变被突出显示。图7d是描绘横跨八个基因组位点的hek293t细胞中核心abe8构建体相对于abe7.10构建体的a·t至g·c碱基编辑效率的图。值和误差线反映在不同日期进行的三个独立的生物重复的平均值和标准差。[0483]图8a至8c描绘了cas9pam-变异abe8和催化性死亡的cas9abe8变体比人类细胞中的相应abe7.10变体介导更高的a·t至g·c转换。值和误差线反映在不同日期进行的三个独立的生物重复的平均值和标准差。图8a是描绘具有ng-cas9abe8(-ngpam)的hek293t细胞中a·t至g·c的转换的图。图8b是描绘具有sa-cas9abe8(-nngrrtpam)的hek293t细胞中a·t至g·c的转换的图。图8c是描绘具有催化性失活的dcas9-abe8(化脓链球菌cas9中的d10a、h840a)的hek293t细胞中a·t到g·c的转换的图。[0484]图9a至9e描绘了在hek293t细胞中abe7.10、abemax和abemax与一个bpnls之间的靶向和脱靶编辑频率之间的比较。显示了对于在不同的日子进行的n=3个独立的生物重复的个别数据点,误差线代表标准差。。图9a和9b是描绘在目标dna编辑频率的图。图9b和9c是描绘sgrna向导的dna脱靶编辑频率的图。图9e是描绘rna脱靶编辑频率的图。[0485]图10a至10b描绘hek293t细胞中tada、c端α-螺旋截断abe构建体的中值a·t至g·c转换和相应的indel形成。图10a是描绘横跨8个基因组位点的a·t至g·c中值编辑转换的热图。图10b是描绘indel形成的热图。δ残基值对应于tada中的缺失位置。从n=3个生物重复产生中值。[0486]图11是描绘横跨8个基因组位点的hek293t细胞中40个abe8构建体的中值a·t至g·c转换的热图。中值由两个或更多生物重复确定。[0487]图12是描绘横跨8个基因组位点的hek293t细胞中40个abe8构建体的中值indel%的热图。中值由两个或更多个生物重复确定。[0488]图13是描绘编辑中的倍数变化abe8:abe7的图。hek293t细胞中八个不同基因组位点目标内所有a位置的平均abe8:abe7a·t至g·c编辑的表示。位置2至12表示目标腺嘌呤在20核苷酸前间隔内的位置,位置20直接位于-nggpam的5'。[0489]图14描绘abe8的树状图。选择用于进一步研究的核心abe8构建体以黑色突出显示。[0490]图15是描绘横跨8个基因组位点的hek293t细胞中核心8个abe8构建体的中值a·t到g·c转换的热图。从三个或更多生物重复测定中值。[0491]图16是描绘在hek293t细胞中的8个基因组位点测试的核心8个abe8的中值indel频率的热图。[0492]图17是描绘在hek293t细胞中的六个基因组位点处核心ng-abe8构建体9(-ngpam)的中值a·t至g·c转换的热图。从n=3个生物重复产生中值。[0493]图18是描绘在hek293t细胞中的六个基因组位点测试的核心ng-abe8的中值indel频率的热图。从n=3个生物重复产生的中值。[0494]图19是描绘hek293t细胞中六个基因组位点处核心sa-abe8构建体(-nngrrtpam)的中值a·t至g·c转换的热图。位点位置在22核苷酸前间隔中编号为-2至20(5'到3')。位置20是位于nngrrtpam的5’。从n=3个生物重复产生中值。[0495]图20是描绘在hek293t细胞中的8个基因组位点测试的核心sa-abe8的中值indel频率的热图。从n=3个生物重复产生中值。[0496]图21是描绘hek293t细胞中八个基因组位点处核心dc9-abe8-m构建体的中值a·t至g·c转换的热图。死亡的cas9(dc9)被定义为化脓链球菌cas9中的d10a和h840a突变。n≥3个生物重复产生中值。[0497]图22是描绘hek293t细胞中八个基因组位点处核心dc9-abe8-d构建体的中值a·t至g·c转换的热图。死亡的cas9(dc9)被定义为化脓链球菌cas9中的d10a和h840a突变。n≥3个生物重复产生中值。[0498]图23a和23b描绘在hek293t细胞中的8个基因组位点测试的核心dc9-abe8的中值indel频率。n≥3个生物重复产生中值。图23a是描绘dc9-abe8-m变体相对于abe7.10的插入/缺失频率的热图。图23b是描绘dc9-abe8-d变体相对于abe7.10的插入/缺失频率的热图。[0499]图24是描绘用abe8和abe7.10处理的hek293t细胞进行c·g至t·a编辑的图。每个位点的编辑频率在目标内的所有c位置上平均。前间隔中的胞嘧啶用阴影表示。[0500]图25a至25h描绘通过abe8构建体和具有改善对dna的特异性的tada突变的abe8构建体进行靶上dna和sgrna依赖性dna脱靶编辑。显示了对于n=3个独立的在不同的日子进行单个数据点,误差线代表标准差生物重复。图25a和25b是描绘与abe7相比核心abe8构建体的靶上dna编辑频率的图。图25c和25d是描绘具有改善rna脱靶编辑的突变的abe8的靶上dna编辑频率的图。图25e和25f是描绘与abe7相比核心abe8构建体的sgrna向导的dna脱靶编辑频率的图。图25g和25h是描绘具有改善rna脱靶编辑的突变的abe8构建体的sgrna向导的dna脱靶编辑频率的图。[0501]图26是描绘人类细胞中12个先前识别的sgrna依赖性cas9脱靶基因座处的插入缺失频率的图。显示了对于在不同的日子进行的n=3个独立的生物重复的个别数据点且误差条代表标准偏差。,。[0502]图27a和27b描绘原代细胞中a·t到g·c的转换和表型结果。图27a是描绘用来自两个不同供体的abe处理的cd34+细胞中-198hbg1/2位点的a·t至g·c的转换的图。在处理后48和144小时进行ngs分析。-198hbg1/2目标序列,其中a7突出显示。绘制a7的a·t至g·c的百分比。图27b是描绘形成为α-球蛋白的分数的γ-球蛋白的百分比的图。显示来自两个不同供体的值,abe治疗后和红细胞分化。[0503]图28a和28b描绘在hbg1/2上游的-198启动子位点处用abe8处理的cd34+细胞从a·t至g·c的转换。图28a是描绘在编辑器处理后48和144小时来自两个供体的cd34+细胞中abe8的a至g编辑频率的热图,其中供体2对于镰状细胞病是杂合的。图28b是含有仅a7编辑或组合的(a7+a8)编辑的总测序读数分布的图形表示。[0504]图29是描绘在γ-球蛋白启动子的-198位点处用abe8处理的cd34+细胞的indel频率的热图。在48小时和144小时时间点显示来自两个供体的频率。[0505]图30描绘未处理的分化cd34+细胞(供体1)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0506]图31描绘用abe7.10-m(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0507]图32描绘用abe7.10-d(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0508]图33描绘用abe8.8-m(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0509]图34描绘用abe8.8-d(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0510]图35描绘用abe8.13-m(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0511]图36描绘用abe8.13-d(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0512]图37描绘用abe8.17-m(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0513]图38描绘用abe8.17-d(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0514]图39描绘用abe8.20-m(供体1)处理的分化的cd34+细胞的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0515]图40描绘用abe8.20-d处理的分化的cd34+细胞(供体1)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。[0516]图41描绘未处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2是镰状细胞病的杂合子。[0517]图42描绘用abe7.10-m处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0518]图43描绘用abe7.10-d处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0519]图44描绘用abe8.8-m处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0520]图45描绘用abe8.8-d处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0521]图46描绘用abe8.13-m处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0522]图47描绘用abe8.13-d处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于是镰状细胞病是杂合的。[0523]图48描绘用abe8.17-m处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于是镰状细胞病是杂合的。[0524]图49描绘了用abe8.17-d处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于是镰状细胞病是杂合的。[0525]图50描绘用abe8.20-m处理的分化的cd34+细胞(供体2)的uhplcuv-vis迹线(220nm)和球蛋白链水平的整合。注意:供体2对于镰状细胞病是杂合的。[0526]图51a至51e描绘在两个独立位点用abe8.8编辑在去核前在红细胞分化后第11天达到超过90%的编辑,在红细胞分化后第18天约60%的γ球蛋白超过α球蛋白或总β家族球蛋白。图51a是描绘2个独立实验中2个健康供体的abe8.8编辑平均值的图。使用区分hbg1和hbg2的引物测量编辑效率。图51b是描绘2个独立实验中1个健康供体的平均值的图。使用识别hbg1和hbg2的引物测量编辑效率。图51c是描绘具有杂合e6v突变的供体中abe8.8的编辑的图。图51d和51e是描绘abe8.8编辑细胞中γ球蛋白增加的图。[0527]图52a和52b描绘使用abe变体校正镰状细胞突变的百分比编辑。图52a是描绘在scd患者成纤维细胞中具有约70%编辑的不同编辑器变体的屏幕的图。图52b是描绘来自用先导abe变体编辑的健康供体的cd34细胞,以靶向位于编辑窗口内的相邻的脯氨酸中的同义突变a13并作为编辑scd突变的代理的图。abe8变体在代理a13上的平均编辑频率约为40%。[0528]图53a和53b描绘rna扩增子测序以检测与abe治疗相关的rna中的细胞a至i编辑。对于在不同的日子进行的n=3个独立的生物重复显示了单个数据点,误差线代表标准差。,。图53a是描绘与abe7和cas9(d10a)切口酶对照相比,核心abe8构建体的靶向rna扩增子中的a至i编辑频率的图。图53b是描绘具有已据报道改善rna脱靶编辑的突变的abe8的靶向rna扩增子中的a至i编辑频率的图。[0529]图54是说明由帕金森氏病中多巴胺能神经元损失引起的多巴胺损失的示意图。[0530]图55是显示用于校正与帕金森氏病相关的lrrk2中的r1441c和r1441h突变的向导rna和目标序列的示意图。[0531]图56是显示用于校正与帕金森氏病相关的lrrk2中的y1699c、g2019s和i2020突变的目标序列的示意图。[0532]图57a至57c提供图表、示意图和表格。图57a量化lrrk2目标序列的核酸位置7处a至g的转换百分比。所使用的编辑器被指定为pv1至pv14,以下提供对此的描述。pcmv表示cmv启动子;bpnls表示二分核定位信号;monoabe8.1表示abe8.1碱基编辑器的单体形式。图57b描绘用于校正与帕金森氏病相关的lrrk2中的r1441c突变的目标序列和向导rna。图57c显示lrrk2目标序列的核酸位置7处a至g的转换百分比。编辑器pv1至14用以编辑lrrkr1441c。编辑器(15至28)用以编辑g2109。用于校正lrrk突变的编辑器(pv1-28)如下:[0533]pv1(也称为pv15).pcmv_monoabe8.1_bpnls+y147t[0534]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[0535]pv2(也称为pv16).pcmv_monoabe8.1_bpnls+y147r[0536]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstd[0537]pv3(也称为pv17).pcmv_monoabe8.1_bpnls+q154s[0538]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstd[0539]pv4(也称为pv18).pcmv_monoabe8.1_bpnls+y123h[0540]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0541]pv5(也称为pv19).pcmv_monoabe8.1_bpnls+v82s[0542]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0543]pv6(也称为pv20).pcmv_monoabe8.1_bpnls+t166r[0544]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrd[0545]pv7(也称为pv21).pcmv_monoabe8.1_bpnls+q154r[0546]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstd[0547]pv8(也称为pv22).pcmv_monoabe8.1_bpnls+y147r_q154r_y123h[0548]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[0549]pv9(也称为pv23).pcmv_monoabe8.1_bpnls+y147r_q154r_i76y[0550]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[0551]pv10(也称为pv24).pcmv_monoabe8.1_bpnls+y147r_q154r_t166r[0552]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrd[0553]pv11(也称为pv25).pcmv_monoabe8.1_bpnls+y147t_q154r[0554]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstd[0555]pv12(也称为pv26).pcmv_monoabe8.1_bpnls+y147t_q154s[0556]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstd[0557]pv13(也称为pv27).pcmv_monoabe8.1_bpnls+h123y123h_y147r_q154r_i76y[0558]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[0559]pv14(也称为pv28).pcmv_monoabe8.1_bpnls+v82s+q154r[0560]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstd[0561]图58a至58c提供图表、示意图和表格。图58a量化lrrk2目标序列的核酸位置6处a至g的转换百分比。所使用的编辑器被指定为pv15至pv28,以上提供对此的描述。pcmv表示cmv启动子;bpnls表示二分核定位信号;monoabe8.1表示abe8.1碱基编辑器的单体形式。图58b描绘用于校正与帕金森氏病相关的lrrk2中的g2019s突变的目标序列和向导rna。图58c显示lrrk2目标序列的核酸位置4和6处a至g的转换百分比。位置4处的a至g转换是旁观者效应。[0562]图59a至59l描绘编码r1441c的lrrk2目标序列的位置7处的a至g转换的序列读数(参见图57a至57c)。显示编辑器(pv1至14)。在图56中提供pv1至28的描述。[0563]图60a至60w描绘编码g2019s的lrrk2目标序列的位置4和6处的a至g转换的序列读数(参见图58a至58c)。[0564]图61a提供描述用于校正lrrk2中的致病突变a419v的目标序列的示意图,其由反义链g》a突变编码。使用用对tggpam具有特异性的spcas9变体的向12位a的abe校正突变。[0565]图61b提供描绘用于校正lrrk2中与帕金森氏病相关的致病性突变l1114l的目标序列的示意图。所述突变是使用具有胞苷脱氨酶活性(cbe)的碱基编辑器进行校正的反义链t》c。[0566]图61c提供描绘用于校正lrrk2中与帕金森氏病相关的致病性突变i1122v的目标序列的示意图。所述突变是使用具有胞苷脱氨酶活性(cbe)的碱基编辑器进行校正的反义链t》c。[0567]图61d提供描述用于校正lrrk2中与帕金森氏病相关的致病性突变m1869v的目标序列的示意图。所述突变是使用具有胞苷脱氨酶活性(cbe)的碱基编辑器进行校正的反义链t》c。[0568]图62a和62b描绘在hek293t细胞中的小家鼠iduaw401x突变精确碱基编辑校正。图62a是描绘使用用21个核苷酸向导rna的abe8碱基编辑器变体对小家鼠iduaw401x突变进行碱基编辑的百分比的图。图62b是描绘使用21个核苷酸向导rna的abe8碱基编辑器变体的插入缺失百分比的图。[0569]图63是描绘使用用20个核苷酸向导rna或21个核苷酸向导rna的abe8碱基编辑器变体对小家鼠iduaw401x突变进行碱基编辑的百分比的图。[0570]图64描绘作为用以校正w402x突变的a至g核苷酸碱基编辑的目标的智人idua基因组核酸和氨基酸序列的图解说明。图中还显示了相应的向导rna(grna)的核酸序列。图中指出的是idua核酸序列中的目标腺苷(a)核碱基(框内)。[0571]图65a和65b描绘hek293t细胞中的智人iduaw402x突变的精确碱基编辑校正。图65a是描绘使用abe8碱基编辑器变体使用用20个核苷酸的向导rna对智人iduaw402x突变进行碱基编辑的百分比的图。图65b是描绘使用20个核苷酸的向导rna的abe8碱基编辑器变体的插入缺失百分比的图。[0572]图66a至66o是描述如在其中已发生碱基编辑的细胞中的基因组dna的pcr之后通过深度测序(myseq)所检测,使用abe8碱基编辑器变体的idua核酸序列中a至g核苷酸变化百分比的效率的表。图66a至66m分别描绘了使用各abe8碱基编辑器变体abe8.1至abe8.13的三个样本在idua核酸目标位点中的位置6处的a至g碱基编辑的百分比。图66n描绘使用阳性对照碱基编辑器abe7.10的三个样本在idua核酸目标位点中的位置6处的a至g碱基编辑的百分比。图66o描绘使用两个阴性对照样本在idua核酸目标位点中的位置6处a至g碱基编辑的百分比。[0573]图67图示rett/mecp2:突变校正。mecp2功能丧失—可能由许多不同的重新(denovo)突变引起。x连锁:xx患者因mecp2丢失而嵌合;xy通常会导致婴儿死亡。[0574]图68图示前3个向导序列的蕾特氏症r106w突变校正。[0575]图69图示使用具有ngttpam优化的编辑器的蕾特氏症r255x突变校正。[0576]图70a至70c:贺勒(hurler)/idua突变校正。图70a图示iduaw402x突变校正的实验设计。图70b图示各编辑器构造的编辑百分比。图70c图示编辑和未编辑的构建体的比活性(nmol/mg/h)。[0577]图71描绘使用abe8.8的体内碱基编辑。从左到右实施例个样本:向导11(aav9)、向导12(aav9)、向导11(php.eb)、向导12(php.eb)及控制。[0578]图72a至72b。模型细胞系中abca4g1961e等位基因上abe7.10和abe8变体的a·t至g·c转换。图72a:在21个核苷酸个核苷酸间隔sgrna和碱基编辑器变体的质粒脂质转染后,hek293t细胞中整合的疾病等位基因和abca4g1961e密码子摆动碱基处的a·t到g·c转换。细胞在脂质转染后培育5天,然后进行编辑评估。图72b:包含abca4g1961e疾病等位基因、密码子的摆动碱基和21个核苷酸间隔sgrna使用的-nggpam的感兴趣的位点的dna序列。误差棒代表三个重复标准差。。在每个数据集中,疾病等位基因在左侧,摆动碱基在右侧。[0579]图73.模型细胞系中abca4g1961e等位基因的sgrna间隔长度变体将a·t转换为g·c。在对不同间隔长度和abe7.10的sgrna进行质粒脂质转染后,hek293t细胞中整合疾病等位基因和abca4g1961e密码子摆动碱基处的a·t至g·c转换。细胞在脂质转染后培育5天,然后进行编辑评估。hrz=在sgrna的5'端包括自切割锤头核酶。误差棒代表三个重复的标准差。在每个数据集中,疾病等位基因在左侧,摆动碱基在右侧。[0580]图74.使用拆分内含肽重构的分裂碱基编辑器的双aav递送示意图。两个aav粒子与碱基编辑所需的组分分开包装。一种病毒编码碱基编辑器c端区域与n端分裂内含肽融合,且互补病毒编码碱基编辑器n端区域与c端分裂内含肽融合以及sgrna。在互补病毒共转导后,sgrna被转录,且碱基编辑器的各半通过经由分裂内含肽的蛋白质反式剪接表达和重组。[0581]图75a至75b。通过双aav递送在野生型细胞中abca4g1961处的分裂abe变体实现a·t至g·c的转换。图75a:野生型arpe-19细胞中野生型abca4g1961目标位点的a·t至g·c和c·g至t·a的转换,其中位置8a的编辑作为这些细胞中编辑的替代靶点。以每个细胞每个病毒5e+4个病毒基因组的moi感染的细胞。细胞在感染后培育2周,然后进行编辑评估。误差棒代表六个重复的标准差。对于每个数据点,用位置8(a》g)替代位点处理的样本显示在左侧,和位置5(c》t)替代位点处理的样本显示在右侧。[0582]图75b:野生型目标位点的dna序列,包含abca4g1961等位基因和靶向野生型序列的21个核苷酸间隔sgrna使用的-nggpam。[0583]图76a至76b。野生型arpe-19细胞中的脱靶碱基编辑感染表达分裂abe7.10的aav2和靶向abca4g1961e疾病等位基因的sgrna。图76a:与未处理的对照(灰色)相比,在与双aav(蓝绿色)共感染2周后,目标或脱靶前间隔的最大a·t到g·c转换。图76b:与未处理的对照(灰色)相比,在与双aav(蓝绿色)共感染2周后,靶或脱靶前间隔的最大非a·t到g·c转换。对于每个数据点,用野生型(wt)arpe-19细胞处理的样本显示在左侧,而未经处理的wtarpe-19细胞显示在右侧。[0584]如图77.由于野生型arpe-19细胞中的碱基编辑而形成的插入缺失,所述细胞被表达分裂abe7.10的aav2和靶向abca4g1961e的疾病等位基因的sgrna双重感染。与未处理的对照(灰色)相比,在与双aav(蓝绿色)共感染2周后,在目标或脱靶前间隔内或附近形成的插入缺失的百分比。对于每个数据点,用野生型(wt)arpe-19细胞处理的样本显示在左侧,而未经处理的wtarpe-19细胞显示在右侧。[0585]图78:灵长类动物视网膜完整性和gfp在培养后第22天的表达。切片在4℃用抗视紫红质、抗gfp和生物素化花生凝集素抗体免疫标记过夜。anc80l65.hgrk.egfp显示gfp仅在含有光感受器的外核层(onl)中观察到,证实了grk启动子的光感受器特异性活性。顶行是第0天,未转导。第二行是第22天,未转导。第三行是第22天,grk。第四行是第22天,cmb。列未染色(第1列)、dapi(第2列)、gfp(第3列)、pna(第4列)及视紫质(第5列)。[0586]图79:nhp中的cas9表达。早在培养后第6天就在灵长类动物视网膜中检测到cas9表达。结果显示为abe7.10(第1和第2列)、abe8.5(第2和第3列)和abe8.9(第3和第4列)。顶行:培养后第6天。底行:培养后第17天。结果表示aa系统递送表达cas9的分裂内含肽。比例尺:100μm。[0587]主要组件符号说明[0588]无。具体实施方式[0589]本发明提供包括具有提高的效率的新颖腺嘌呤碱基编辑器(例如abe8)的组合物和使用它们靶上核碱基序列中产生修饰的方法。[0590]核碱基编辑器[0591]本文公开了用于编辑、修饰或改变多核苷酸的目标核苷酸序列的碱基编辑器或核碱基编辑器。本文所述的是包括多核苷酸可编程的核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶)的核碱基编辑器或碱基编辑器。当多核苷酸可编程的核苷酸结合结构域(例如,cas9)与结合的向导多核苷酸(例如,grna)结合时,可以特异性地结合目标多核苷酸序列(即,经由结合的向导核酸和目标多核苷酸序列的碱基的互补碱基配对),且从而将碱基编辑器定位到需要编辑的目标核酸序列。在一些实施方案中,目标多核苷酸序列包括单链dna或双链dna。在一些实施方案中,目标多核苷酸序列包括rna。在一些实施方案中,目标多核苷酸序列包括dna-rna杂交体。[0592]多核苷酸可编程的核苷酸结合结构域[0593]应当理解,多核苷酸可编程的核苷酸结合结构域还可以包括结合rna的核酸可编程的蛋白质。例如,多核苷酸可编程的核苷酸结合结构域可以与将多核苷酸可编程的核苷酸结合结构域向导至rna的核酸相关联。其他核酸可编程的dna结合蛋白也在本公开的范围内,尽管它们没有在本公开中具体列出。[0594]碱基编辑器的多核苷酸可编程的核苷酸结合结构域本身可以包括一个或多个域。例如,多核苷酸可编程的核苷酸结合结构域可包括一个或多个核酸酶结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域的核酸酶结构域可包括核酸内切酶或核酸外切酶。在本文中,术语“外切核酸酶”是指能够从游离端酶切核酸(例如,rna或dna)的蛋白质或多肽,并且术语“内切核酸酶”是指能够催化(例如,切割)内部区域的蛋白质或多肽。在一些实施方案中,核酸内切酶可以切割双链核酸的单链。在一些实施方案中,内切核酸酶可以切割双链核酸分子的两条链。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以是脱氧核糖核酸酶。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以是核糖核酸酶。[0595]在一些实施方案中,多核苷酸可编程的核苷酸结合结构域的核酸酶结构域可以切割目标多核苷酸的零、一条或两条链。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可包括切口酶结构域。在本文中,术语“切口酶”是指包括核酸酶结构域的多核苷酸可编程的核苷酸结合结构域,其包括能够仅切割双链核酸分子(例如,dna)中的两条链中的一条链。在一些实施方案中,切口酶可以通过将一个或多个突变引入活性多核苷酸可编程的核苷酸结合结构域来衍生自完全催化活性(例如,天然)形式的多核苷酸可编程的核苷酸结合结构域。例如,当多核苷酸可编程的核苷酸结合结构域包括衍生自cas9的切口酶结构域时,衍生自cas9的切口酶结构域可包括d10a突变和位置840的组氨酸。特此类实施方案中,残基h840保留催化活性并从而可切割核酸双链体的单链。在另一个实施方案中,衍生自cas9的切口酶结构域可包括h840a突变,而位置10的氨基酸残基仍为d。在一些实施方案中,切口酶可通过去除切口酶活性不需要的全部或部分核酸酶结构域,衍生自完全催化活性(例如,天然)形式的多核苷酸可编程的核苷酸结合结构域。例如,在多核苷酸可编程的核苷酸结合结构域包括衍生自cas9的切口酶结构域的情况下,衍生自cas9的切口酶结构域可包括ruvc域或hnh结构域的全部或部分的缺失。[0596]实施例性催化活性cas9的氨基酸序列如下:[0597]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其全部内容通过引用方式并入本文)。[0601]可并入碱基编辑器的多核苷酸可编程的核苷酸结合结构域的非限制性实例包括衍生自crispr蛋白的结构域、限制性核酸酶、大范围核酸酶、tal核酸酶(talen)及锌指核酸酶(zfn)。在一些实施方案中,碱基编辑器包括多核苷酸可编程的核苷酸结合结构域,其包括天然或修饰的蛋白质或其部分,其经由结合的向导核酸能够在crispr(即,成簇的规则间隔的短回文重复序列)期间结合核酸序列介导的核酸修饰。这种蛋白质在本文中称为“crispr蛋白质”。因此,本文公开包括包含crispr蛋白的全部或部分的多核苷酸可编程的核苷酸结合结构域的碱基编辑器(即,包括crispr蛋白的全部或部分作为结构域的碱基编辑器,也称为“衍生自crispr蛋白的结构域”)。与crispr蛋白的野生型或天然版本相比,可以对掺入碱基编辑器的crispr蛋白源结构域进行修饰。例如,如下所述,衍生自crispr蛋白的结构域可包括一个或多个相对于crispr蛋白的野生型或天然形式的突变、插入、缺失、重排和/或重组。[0602]crispr是一种适应性免疫系统,其针对移动性遗传组件(病毒、转座组件及接合质粒)提供保护。crispr簇含有间隔、与先行移动性组件互补的序列及目标入侵核酸。crispr簇被转录并加工成crisprrna(crrna)。在ii类crispr系统中,正确处理pre-crrna需要转编码的小rna(tracrrna)、内源性核糖核酸酶3(rnc)及cas9蛋白。tracrrna作为核糖核酸酶3辅助处理的pre-crrna的向导。随后,cas9/crrna/tracrrna核酸内切切割与间隔互补的线性或环状dsdna目标。与crrna不互补的目标链首先被核酸内切切割,然后3'-5'核酸外切修剪。在自然界中,dna结合和切割通常需要蛋白质和两种rna。然而,可以对单向导rna(“sgrna”或简称为“gnra”)进行工程改造,以便将crrna和tracrrna的各个方面整合到单个rna种类中。参见,例如,jinekm.,etal.,science337:816-821(2012),其全部内容通过引用方式并入本文。cas9识别crispr重复序列(pam或前间隔邻近基序)中的短基序,以帮助区分自我与非自我。[0603]在一些实施方案中,本文所述方法可以利用工程化的cas蛋白。向导rna(grna)是一种短的合成rna,由cas结合所需的支架序列和用户定义的~20个核苷酸间隔所组成,所述间隔定义了欲修改的基因组目标。因此,本领域技术人员可以改变cas蛋白的基因组目标特异性部分取决于grna靶向序列与基因组其余部分相比对基因组目标的特异性。[0604]在一些实施方案中,grna支架序列如下:guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。[0605]在一些实施方案中,掺入碱基编辑器的衍生自crispr蛋白的结构域是当与结合的向导核酸结合时,能够结合目标多核苷酸的核酸内切酶(例如,脱氧核糖核酸酶或核糖核酸酶)。在一些实施方案中,掺入碱基编辑器的衍生自crispr蛋白的结构域是当与结合的向导核酸结合时,能够结合目标多核苷酸的切口酶。在一些实施方案中,掺入碱基编辑器的衍生自crispr蛋白的结构域是当与结合的向导核酸结合时,能够结合目标多核苷酸的催化性死亡结构域。在一些实施方案中,由碱基编辑器的衍生自crispr蛋白的结构域结合的目标多核苷酸是dna。在一些实施方案中,由碱基编辑器的衍生自crispr蛋白的结构域结合的目标多核苷酸是rna。[0606]可用于本文的cas蛋白包括第1类和第2类。cas蛋白的非限制性实例包括cas1、systems”(2013)rnabiology10:5,726-737中公开的生物体和基因座的cas9序列;其全部内容以引用方式并入本文。[0611]在一些实施方案中,核酸可编程的dna结合蛋白(napdnabp)是cas9结构域。本文提供非限制性的实施例性cas9域。cas9结构域可以是核酸酶活性cas9结构域、核酸酶失活cas9结构域(dcas9)或cas9切口酶(ncas9)。在一些实施方案中,cas9结构域是核酸酶活性结构域。例如,cas9结构域可以是切割双链核酸的两条链(例如双链dna分子的两条链)的cas9结构域。在一些实施方案中,cas9结构域包括如本文所载任一个氨基酸序列。在一些实施方案中,cas9结构域包括与本文所载的任一个氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,cas9结构域包括与具有本文所载任一个氨基酸序列相比1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个或更多个突变。在一些实施方案中,cas9结构域包括具有与本文所载任一个氨基酸序列相比至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。[0612]在一些实施方案中,提供包括cas9片段的蛋白质。例如,在一些实施方案中,蛋白质包括两个cas9结构域之一:(1)cas9的grna结合结构域;或(2)cas9的dna切割域。在一些实施方案中,包括cas9或其片段的蛋白质被称为“cas9变体”。cas9变体与cas9或其片段具有同源性。例如,cas9变体与野生型cas9至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、4546、47、48、49、50个或更多个氨基酸变化。在一些实施方案中,cas9变体包括cas9的片段(例如,grna结合结构域或dna切割域),使得所述片段与野生型cas9的相应片段至少约70%相同,至少约80%相同、至少约90%相同,至少约95%相同,至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,所述片段是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%或至少对应野生型cas9氨基酸长度的至少99.5%。在一些实施方案中,所述片段的长度为至少100个氨基酸。在一些实施方案中,所述片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1050、1100、1150、1200、1250或至少1300个氨基酸的长度。[0613]在一些实施方案中,本文所提供的cas9融合蛋白包括cas9蛋白的全长氨基酸序列,例如本文所提供的cas9序列之一。然而,在其他实施方案中,本文所提供的融合蛋白不包括全长cas9序列,而仅包括其一个或多个片段。本文提供合适的cas9结构域和cas9片段的实施例性氨基酸序列,并且cas9结构域和片段的其他合适的序列对本领域技术人员来说是显而易见的。[0614]cas9蛋白可以与向导rna相关联,所述向导rna将cas9蛋白向导至与向导rna互补的特定dna序列。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是cas9结构域,例如核酸酶活性cas9、cas9切口酶(ncas9)或核酸酶失活cas9(dcas9)。核酸可编程的dna结合蛋白的例子包括但不限于cas9(例如dcas9和ncas9)、casx、casy、cpf1、cas12b/c2c1及cas12c/c2c3。[0615]在一些实施方案中,野生型cas9对应于来自化脓链球菌的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下)。[0616]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0617][0618][0619](单底线:hnh结构域;双底线:ruvc域)[0620]在一些实施方案中,野生型cas9对应于或包括以下核苷酸和/或氨基酸序列:[0621]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0622][0623][0624](单底线:hnh结构域;双底线:ruvc域)。[0625]在一些实施方案中,野生型cas9对应于来自化脓链球菌的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下);和uniprot参考序列:q99zw2(氨基酸序列如下):[0626]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0627][0627][0627](单底线:hnh结构域;双底线:ruvc域)[0628]在一些实施方案中,cas9是指来自以下的cas9:溃疡棒状杆菌溃疡棒状杆菌(ncbi参考序列:nc_015683.1、nc_017317.1)的cas9;白喉棒状杆菌(ncbi参考序列:nc_016782.1、nc_016786.1);食蚜蝇(ncbi参考序列:nc_021284.1);中间普氏菌(ncbi参考序列:nc_017861.1);spiroplasmataiwanense(ncbi参考序列:nc_021846.1);鱼型链球菌(ncbi参考序列:nc_021314.1);波罗海贝尔氏菌(ncbi参考序列:nc_018010.1);冷弯曲菌(ncbi参考序列:nc_018721.1);嗜热链球菌(ncbi参考序列:yp_820832.1)、无害李斯特菌(ncbi参考序列:np_472073.1)、空肠弯曲菌(ncbi参考序列:yp_002344900.1)或脑膜炎奈瑟菌(ncbi参考序列:yp_002342100.1)、化脓链球菌或金黄色葡萄球菌。[0629]应当理解,额外的cas9蛋白(例如,核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性cas9)(包括其变体和同系物)在本公开的范围内。实施例性的cas9蛋白包括但不限于那些以下提供者。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0630]在一些实施方案中,cas9结构域是无核酸酶活性的cas9结构域(dcas9)。例如,dcas9结构域可以结合双链核酸分子(例如,经由grna分子),而不切割双链核酸分子的任何一条链。在一些实施方案中,核酸酶失活的dcas9结构域包括本文所列氨基酸序列的d10x突变和h840x突变,或本文所提供的任何氨基酸序列中的相应的突变,其中x是任何氨基酸变化。在一些实施方案中,核酸酶失活的dcas9结构域包括本文所述氨基酸序列的d10a突变和h840a突变,或本文所提供的任何氨基酸序列中的相应的突变。作为一个实例,无核酸酶活性的cas9结构域包括在克隆载体pplattet-grna2(登录号bav54124)中列出的氨基酸序列。[0631]实施例性催化失活的cas9(dcas9)的氨基酸序列如下:[0632]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0633](参见,例如,qietal.,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression.”cell.2013;152(5):1173-83,其全部内容通过引用方式并入本文)。[0634]基于本公开内容和本领域知识,其他合适的核酸酶失活的dcas9结构域对于本领域技术人员来说将是显而易见的,并且在本公开内容的范畴内。此类额外的实施例性合适的核酸酶失活的cas9结构域包括但不限于d10a/h840a、d10a/d839a/h840a和d10a/d839a/h840a/n863a突变域(参见,例如prashantetal.,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其全部内容通过引用方式并入本文)。[0635]在一些实施方案中,cas9核酸酶具有失活(例如,失活的)dna切割结构域,即,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。核酸酶失活的cas9蛋白可互换地称为“dcas9”蛋白(对于核酸酶‑“死亡”的cas9)或催化失活的cas9。用于产生具有失活dna切割结构域的cas9蛋白(或其片段)的方法是已知的(参见,例如,jineketal.,science.337:816-821(2012);qietal.,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,各自的全部内容通过引用方式并入本文)。例如,已知cas9的dna切割域包括两个子域,hnh核酸酶子域和ruvc1子域。hnh子域切割与grna互补链,而ruvc1子域切割非互补链。这些子域内的突变可以使cas9的核酸酶活性沉默。例如,突变d10a和h840a使化脓链球菌cas9的核酸酶活性完全失活(jineketal.,science.337:816-821(2012);qietal.,cell.28;152(5):1173-83(2013))。[0636]在一些实施方案中,dcas9结构域包括本文所提供的dcas9结构域的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少与至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中本文所载氨基酸序列中的任一个相比,cas9结构域包括具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个或更多个突变。在一些实施方案中,与本文所载氨基酸序列中的任一个相比,cas9结构域包括具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。[0637]在一些实施方案中,dcas9对应于或部分或全部包括具有一个或多个使cas9核酸酶活性失活的突变的cas9氨基酸序列。例如,在一些实施方案中,dcas9结构域包括d10a和h840a突变或另一个cas9中的相应的突变。[0638]在一些实施方案中,dcas9包括dcas9(d10a和h840a)的氨基酸序列:[0639][0639](单底线:hnh结构域;双底线:ruvc域)。[0640]在一些实施方案中,cas9结构域包括d10a突变,而位置840的残基在上文提供的氨基酸序列中或在本文所提供的任何氨基酸序列中的相应位置仍为组氨酸。[0641]在其他实施方案中,提供具有除d10a和h840a之外的突变的dcas9变体,其例如导致核酸酶失活的cas9(dcas9)。例如,此类突变包括在d10和h840处的其他氨基酸置换,或cas9核酸酶结构域内的其他置换(例如,hnh核酸酶子域和/或ruvc1子域中的置换)。在一些实施方案中,提供dcas9的变体或同源物,其至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供具有短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多的胺基酸序列的dcas9变体。[0642]在一些实施方案中,cas9结构域是cas9切口酶。cas9切口酶可以是仅能够切割双链核酸分子(例如双链dna分子)的一条链的cas9蛋白。在一些实施方案中,cas9切口酶切割双链核酸分子的目标链,表示cas9切口酶切割与结合cas9的grna(例如,sgrna)碱基配对(互补)的链。在一些实施方案中,cas9切口酶包括d10a突变并在位置840具有组氨酸。在一些实施方案中,cas9切口酶切割双链核酸分子的非目标、非碱基编辑链,表示cas9切口酶切割不与结合cas9的grna(例如,sgrna)碱基配对的链。在一些实施方案中,cas9切口酶包括h840a突变并且在位置10具有天冬氨酸残基,或相应的突变。在一些实施方案中,cas9切口酶包括与本文所提供的任何一种cas9切口酶至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所提供的任何一种cas9切口相同的氨基酸序列。基于本公开内容和本领域知识,其他合适的cas9切口酶对于本领域技术人员来说将是显而易见的,并且在本公开内容的范围内。[0643]实施例性催化cas9切口酶(ncas9)的氨基酸序列如下:[0644]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0645]在一些实施方案中,cas9是指来自古细菌(例如,纳米古细菌)的cas9,其构成单细胞原核微生物的域和界。在一些实施方案中,可编程的核苷酸结合蛋白可以是casx或casy蛋白,其已在例如bursteinetal.,"newcrispr-cassystemsfromuncultivatedmicrobes."cellres.2017feb21.doi:10.1038/cr.2017.21中描述,其全部内容特此通过引入方式作为参考。使用基因组解析的宏基因组学,识别许多crispr-cas系统,包括在古细菌领域首次报道的cas9。这种发散的cas9蛋白是在为活性crispr-cas系统的一部分的鲜为人知的纳米古细菌中发现的。在细菌中,发现了两个以前未知的系统crispr-casx和crispr-casy,其为目前为止发现的最紧凑的系统之一。在一些实施方案中,在本文所述碱基编辑器系统中,cas9被casx或casx的变体置换。在一些实施方案中,在本文所述碱基编辑器系统中,cas9被casy或casy的变体置换。应当理解,其他rna向导的dna结合蛋白可以用作核酸可编程的dna结合蛋白(napdnabp),并且在本公开的范畴内。[0646]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包括与天然存在的casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,可编程的核苷酸结合蛋白是天然存在的casx或casy蛋白。在一些实施方案中,可编程的核苷酸结合蛋白包括本文所述任何casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%的氨基酸序列、至少96%、至少97%、至少98%、至少99%或至少99.5%与相同。应当理解,根据本公开也可以使用来自其他细菌物种的casx和casy。[0647]在一些实施方案中,cas9是脑膜炎奈瑟菌cas9(nmecas9)或其变体。edrakietal.mol.cell.(2019)73(4):714-726中所述nmecas9特征和pam序列是通过引用方式整体并入本文。[0648]以下提供nme1cas9的实施例性氨基酸序列:[0649]ii类crisprrna向导的核酸内切酶cas9[脑膜炎奈瑟菌]wp_002235162.1[0650][0651]以下提供nme2cas9的实施例性氨基酸序列:[0652]ii类crisprrna向导的核酸内切酶cas9[脑膜炎奈瑟菌]wp_002230835.1[0653][0654][0655]在一些实施方案中,cas蛋白是casx或casy。一个规范的casx((uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)tr|f0nn87|f0nn87_sulihcrispr相关的casx蛋白os=冰岛硫化叶菌(菌株hve10/4)gn=sih_0402pe=4sv=1)氨基酸序列如下:[0656]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg.[0657]实施例性casx(》tr|f0nh53|f0nh53_sulircrispr相关的蛋白casxos=冰岛硫化叶菌(菌株rey15a)gn=sire_0771pe=4sv=1)氨基酸序列如下:[0658]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg。[0659]变形杆菌casx[0660]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdfayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0661]实施例性casy((ncbi.nlm.nih.gov/protein/apg80656.1)》apg80656.1crispr-相关的蛋白casy[未培养的俭菌门菌])氨基酸序列如下:[0662]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki。[0663]cas9核酸酶具有两个功能性核酸内切酶结构域:ruvc和hnh。cas9在目标结合后发生构象变化,定位核酸酶结构域以切割目标dna的相反链。cas9介导的dna切割的最终结果是目标dna(pam序列上游约3至4个核苷酸)内的双链断裂(dsb)。然后通过两种一般修复途径之一修复产生的dsb:(1)有效但容易出错的非同源端连接(non-homologousendjoining,nhej)途径;或(2)效率较低但保真度高的同源性定向修复(hdr)途径。[0664]非同源端连接(nhej)和/或同源性定向修复(hdr)的“效率”可以通过任何方便的方法计算。例如,在一些实施方案中,效率可以用成功hdr的百分比来表示。例如,测量员核酸酶测定可用于产生切割产物,并且产物与底物的比率可用于计算百分比。例如,可以使用测量员核酸酶直接切割含有作为成功hdr的结果的新整合的限制性序列的dna。更多裂解的底物表示更高的hdr百分比(更高的hdr效率)。作为说明性实例,可以使用以下等式[(裂解产物)/(底物加裂解产物)]计算hdr的分数(百分比)(例如,(b+c)/(a+b+c),其中“a”是dna底物的条带强度,“b”和“c”是切割产物)。[0665]在一些实施方案中,效率可以用成功nhej的百分比来表示。例如,t7核酸内切酶i测定可用于产生裂解产物,产物与底物的比率可用于计算nhej的百分比。t7核酸内切酶i切割由野生型和突变dna链杂交产生的错配异源双链dna(nhej在原始断裂位点产生小的随机插入或缺失(indel))。更多的切割表示更高的nhej百分比(更高的nhej效率)。作为说明性实施例,nhej的分数(百分比)可以使用以下等式计算:(1-(1-(b+c)/(a+b+c))1/2)×100,其中“a”是dna底物的条带强度,“b”和“c”是切割产物(ranet.al.,cell.2013sep.12;154(6):1380-9;以及ranetal.,natprotoc.2013nov.;8(11):2281–2308)。[0666]nhej修复途径是最活跃的修复机制,其经常导致dsb位点的小核苷酸插入或缺失(indel)。nhej介导的dsb修复的随机性具有重要的实际意义,因为表达cas9和grna或向导多核苷酸的细胞群会导致多种突变。在大多数实施方案中,nhej在目标dna中产生小的插入缺失,导致氨基酸缺失、插入或移码突变,导致目标基因的开放阅读框(orf)内的过早终止密码子。理想的最终结果是目标基因内的功能丧失突变。[0667]虽然nhej介导的dsb修复通常破坏基因的开放阅读框,同源性定向修复(hdr)可用于产生特定的核苷酸变化,范围从单个核苷酸变化到大插入,如添加荧光团或标签。[0668]为了利用hdr进行基因编辑,可以使用一个或多个grna和cas9或cas9切口酶将包括所需序列的dna修复模板递送到感兴趣的细胞类型中。修复模板可以包括所需的编辑以及紧邻目标上游和下游的其他同源序列(称为左右同源臂)。每个同源臂的长度取决于引入的变化的大小,其中更大的插入需要更长的同源臂。修复模板可以是单链寡核苷酸、双链寡核苷酸或双链dna质粒。即使在表达cas9、grna和外源修复模板的细胞中,hdr的效率通常也很低(《10%的修饰等位基因)。hdr的效率可以通过同步细胞来提高,因为hdr发生在细胞周期的s和g2阶段。涉及nhej的化学或基因抑制基因也可以增加hdr频率。[0669]在一些实施方案中,cas9是修饰的cas9。给定的grna靶向序列可以在整个基因组中具有其他存在部分同源性的位点。这些位点称为脱靶位点,在设计grna时需要加以考虑。除了优化grna设计,还可以通过对cas9的修改来提高crispr的特异性。cas9通过两个核酸酶结构域ruvc和hnh的联合活性产生双链断裂(dsb)。cas9切口酶是spcas9的d10a突变体,保留一个核酸酶结构域并产生dna切口而不是dsb。切口酶系统还可以与hdr介导的基因编辑相结合,以进行特定的基因编辑。[0670]在一些实施方案中,cas9是变体cas9蛋白。变体cas9多肽具有与野生型cas9蛋白的氨基酸序列相比,相差一个氨基酸的氨基酸序列(例如,具有缺失、插入、取代、融合)。在一些情况下,变体cas9多肽具有降低cas9多肽的核酸酶活性的氨基酸变化(例如,缺失、插入或取代)。例如,在一些情况下,变体cas9多肽具有少于50%、少于40%、少于30%、少于20%、少于10%、少于5%或少于1%的核酸酶相应的野生型cas9蛋白的活性。在一些实施方案中,变体cas9蛋白没有实质性的核酸酶活性。当主题cas9蛋白是没有实质性核酸酶活性的变体cas9蛋白时,它可以被称为“dcas9”。[0671]在一些实施方案中,变体cas9蛋白具有降低的核酸酶活性。例如,变体cas9蛋白表现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的野生型cas9蛋白(例如野生型cas9蛋白)的核酸内切酶活性。。[0672]在一些实施方案中,变体cas9蛋白可以切割向导目标序列的互补链,但切割双链向导目标序列的非互补链的能力降低。例如,变体cas9蛋白可以具有降低ruvc结构域功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体cas9蛋白具有d10a(在氨基酸位置10的天冬氨酸成丙氨酸),并且因此可切割双链向导目标序列的互补链,但切割非双链向导目标序列的互补链(因此当变体cas9蛋白切割双链目标核酸时,导致单链断裂(ssb)而不是双链断裂(dsb))(参见,例如,jineketal.,science.2012aug.17;337(6096):816-21)。[0673]在一些实施方案中,变体cas9蛋白可以切割双链向导目标序列的非互补链,但切割向导目标序列的互补链的能力降低。例如,变体cas9蛋白可以具有降低hnh结构域(ruvc/hnh/ruvc结构域基序)功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体cas9蛋白具有h840a(在氨基酸位置840的组氨酸成丙氨酸)突变,因此可切割向导目标序列的非互补链,但切割向导目标序列的互补链的能力降低(因此,当变体cas9蛋白切割双链向导目标序列时,产生ssb而不是dsb)。此类cas9蛋白具有切割向导目标序列(例如,单链向导目标序列)的能力降低,但保留结合向导目标序列(例如,单链向导目标序列)的能力。[0674]在一些实施方案中,变体cas9蛋白切割双链目标dna的互补链和非互补链的能力降低。作为非限制性实例,在一些实施方案中,变体cas9蛋白包括d10a和h840a突变两者,使得多肽切割双链目标dna的互补链和非互补链的能力降低。此类cas9蛋白切割目标dna(例如,单链标dna)的能力降低,但保留结合标dna(例如,单链目标dna)的能力。[0675]作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白含有w476a和w1126a突变,使得多肽切割目标dna的能力降低。此类cas9蛋白切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。[0676]作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白含有p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得多肽具有切割目标dna的能力降低。此类cas9蛋白具有切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。[0677]作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白包括h840a、w476a和w1126a突变,使得多肽切割目标dna的能力降低。此类cas9蛋白切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白含有h840a、d10a、w476a和w1126a突变,使得多肽具有切割目标dna的能力降低。此类cas9蛋白具有切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。在一些实施方案中,变体cas9在cas9hnh结构域(a840h)中的位置840恢复了催化性his残基。[0678]作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白包括h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得多肽切割目标dna的能力降低。此类cas9蛋白具有切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白含有d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得多肽切割目标dna的能力降低。此类cas9蛋白具有切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。在一些实施方案中,当变体cas9蛋白包括w476a和w1126a突变或当变体cas9蛋白包括p475a、w476a、n477a、d1125a、w1126a和d1127a突变时,变体cas9蛋白不与pam序列有效结合。因此,在一些此类实施方案中,当此类变体cas9蛋白用于结合方法时,所述方法不需要pam序列。换言之,在一些实施方案中,当这种变体cas9蛋白用于结合方法中时,所述方法可以包括向导rna,但是所述方法可以在不存在pam序列的情况下进行(并且结合的特异性是因此由向导rna的靶向片段提供)。其他残基可以突变以实现上述效果(即使一个或其他核酸酶部分失活)。作为非限制性实例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986、和/或a987可以被改变(即,被取代)。此外,丙氨酸取代science,2019jan.4;363:88-91;其各自全部内容特此通过引用方式并入。v型cas蛋白含有ruvc(或ruvc样)核酸内切酶结构域。虽然成熟crisprrna(crrna)的生产通常不依赖于tracrrna,例如cas12b/c2c1需要tracrrna来生产crrna。cas12b/c2c1依赖crrna和tracrrna进行dna切割。[0685]本发明中考虑的核酸可编程的dna结合蛋白包括归类为第2类v型(cas12蛋白)的cas蛋白。cas2类v型蛋白的非限制性实例包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h及cas12i、其同源物或其修饰形式。如本文所用,cas12蛋白也可称为cas12核酸酶、cas12结构域或cas12蛋白结构域。在一些实施方案中,本发明的cas12蛋白包括被内部融合蛋白结构域例如脱氨酶结构域中断的氨基酸序列。[0686]在一些实施方案中,cas12结构域是无核酸酶活性的cas12结构域或cas12切口酶。在一些实施方案中,cas12结构域是核酸酶活性结构域。例如,cas12结构域可以是在双链核酸(例如双链dna分子)的一条链上形成切口的cas12结构域。在一些实施方案中,cas12结构域包括如本文所载任一个氨基酸序列。在一些实施方案中,cas12结构域包括与本文所载任一个氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,cas12结构域包括与本文所载任一个氨基酸序列相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,cas12结构域包括与本文所载任一个氨基酸序列相比,具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。[0687]在一些实施方案中,提供包括cas12片段的蛋白质。例如,在一些实施方案中,蛋白质包括两个cas12域之一:(1)cas12的grna结合结构域;或(2)cas12的dna切割域。在一些实施方案中,包括cas12或其片段的蛋白质被称为“cas12变体”。cas12变体与cas12或其片段具有同源性。例如,cas12变体与野生型cas12至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、在至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,与野生型cas12相比,cas12变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、4546、47、48、49、50或更多的氨基酸变化。在一些实施方案中,cas12变体包括cas12的片段(例如,grna结合结构域或dna切割域),使得所述片段与野生型cas12的相应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,所述片段是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相应野生型cas12的氨基酸长度。在一些实施方案中,所述片段的长度为至少100个氨基酸。在一些实施方案中,所述片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1150、1200、1250或至少1300个氨基酸的长度。[0688]在一些实施方案中,cas12对应于或部分或全部包括具有一个或多个改变cas12核酸酶活性的突变的cas12氨基酸序列。举例来说,此类突变包括cas12的ruvc核酸酶结构域内的氨基酸取代。在一些实施方案中,提供cas12的变体或同源物与野生型cas12至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供具有短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多个氨基酸序列的cas12。[0689]在一些实施方案中,本文所提供的cas12融合蛋白包括cas12蛋白的全长氨基酸序列,例如本文所提供的cas12序列之一。然而,在其他实施方案中,本文所提供的融合蛋白不包括全长cas12序列,而仅包括其一个或多个片段。本文提供合适的cas12域的实施例性氨基酸序列,并且cas12域和片段的其他合适的序列对本领域技术人员来说是显而易见的。[0690]通常,2类v型cas蛋白具有单个功能性ruvc核酸内切酶结构域(参见,例如,chenetal.,“crispr-cas12atargetbindingunleashesindiscriminate-strandeddnaseactivity,”science360:436-439(2018)))。在某些情况下,cas12蛋白是cas12b蛋白的变体。(参见streckeretal.,naturecommunications,2019,10(1):art.no.:212)。在一个实施方案中,当与野生型cas12蛋白氨基酸序列相比时,变体cas12多肽具有相差1、2、3、4、5个或更多个氨基酸的氨基酸序列(例如,具有缺失、插入、取代、融合)。在一些情况下,变体cas12多肽具有降低cas12多肽活性的氨基酸变化(例如,缺失、插入或取代)。例如,在一些情况下,变体cas12是cas12b多肽,其具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的相应野生型cas12b蛋白的切口酶活性的百分比。在某些情况下,变体cas12b蛋白没有实质性的切口酶活性。[0691]在某些情况下,变体cas12b蛋白的切口酶活性降低。例如,变体cas12b蛋白表现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的野生型cas12b蛋白的切口酶活性。[0692]在一些实施方案中,cas12蛋白包括来自cas12a/cpf1家族的rna向导的核酸内切酶,其在哺乳动物细胞中表现出活性。普雷沃氏菌和弗朗西斯氏菌1(crispr/cpf1)的crispr是一种类似于crispr/cas9系统的dna编辑技术。cpf1是ii类crispr/cas系统的rna向导的核酸内切酶。这种获得性免疫机制存在普雷沃氏菌和弗朗西斯氏菌中。cpf1基因与crispr基因座相关,编码使用向导rna来寻找和切割病毒dna的内切核酸酶。cpf1是一种比cas9更小、更简单的核酸内切酶,克服了crispr/cas9系统的一些限制。与cas9核酸酶不同,cpf1介导的dna切割的结果是具有短3'突出端的双链断裂。cpf1的交错切割模式可以开辟定向基因转移的可能性,类似于传统的限制性酶克隆,可以提高基因编辑的效率。与上述cas9变体和直向同源物一样,cpf1还可以将crispr可靶向的位点数量扩大到缺乏spcas9青睐的nggpam位点的富含at的区域或富含at的基因组。cpf1基因座包括一个混合的α/β结构域、ruvc-i随后的螺旋区域、ruvc-ii及锌指样结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。此外,与cas9不同,cpf1没有hnh核酸内切酶结构域,并且cpf1的n端没有cas9的α螺旋识别叶。cpf1crispr-cas域架构表显示cpf1在功能上是独一无二的,被归类为2类v型crispr系统。cpf1基因座编码的cas1、cas2和cas4蛋白与i类和iii类系统相比与ii类系统更相似。功能性cpf1不需要反式激活crisprrna(tracrrna),因此,只需要crispr(crrna)。这有利于基因组编辑,因为cpf1不仅比cas9小,而且它的sgrna分子更小(大约是cas9的一半核苷酸)。与cas9靶向的富含g的pam相比,cpf1-crrna复合物通过识别邻近基序5'-ytn-3'或5'-tttn-3'来切割目标dna或rna。在识别pam后,cpf1引入了具有4或5个核苷酸的突出端的粘性端样dna双链断裂,。[0693]在本发明的一些方面,载体编码一种crispr酶,其相对于相应的野生型酶发生突变,使得突变的crispr酶缺乏切割含有目标序列的目标多核苷酸的一条或两条链的能力可以使用。cas12可指与野生型实施例性cas12多肽(例如,来自久氏芽孢杆菌的cas12)具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性和/或序列同源性。cas12可以指与野生型实施例性cas12多肽(例如,来自久氏芽孢杆菌(bhcas12b)、芽孢杆菌v3-13(bvcas12b)和嗜酸脂环杆菌(aacas12b))最多或最多约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas12可以指cas12蛋白的野生型或修饰形式,其可以包括氨基酸变化,例如缺失、插入、取代、变异、突变、融合、嵌合体或其任何组合。[0694]核酸可编程的dna结合蛋白[0695]本公开的一些方面提供包括作用为核酸可编程的dna结合蛋白的结构域的融合蛋白,其可用于将蛋白质(诸如碱基编辑器)向导至特定的核酸(例如,dna或rna)序列。在特定实施方案中,融合蛋白包括核酸可编程的dna结合蛋白结构域和脱氨酶结构域。核酸可编程的dna结合蛋白的非限制性实例包括cas9(例如dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h及cas12i。cas酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也已知为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、css1、css2、cse5e、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr2、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii类cas效应蛋白、v型cas效应蛋白、vi类蛋白质、carf、ding、其同源物或其修饰或工程化版本。其他核酸可编程的dna结合蛋白也在本公开的范围内,尽管它们可能未在本公开中具体列出。参见,例如,makarovaetal.“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yanetal.,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,各自的全部内容特此通过引用方式并入。[0696]具有与cas9不同的pam特异性的核酸可编程的dna结合蛋白的一个例子是来自普雷沃氏菌和弗朗西斯氏菌1(cpf1)的成簇规则间隔短回文重复序列。与cas9类似,cpf1也是2类crispr效应器。已经显示cpf1介导特征与cas9不同的强大的dna干扰。cpf1是缺乏tracrrna的单个rna向导的内切核酸酶,并且其利用富含t的前间隔邻近基序(ttn、tttn或ytn)。此外,cpf1经由交错的dna双链断裂来切割dna。在16个cpf1家族蛋白中,来自氨基酸球菌属(acidaminococcus)和毛螺菌科(lachnospiraceae)的两种酶被证明在人类细胞中具有有效的基因组编辑活性。cpf1蛋白是本领域已知的,并且之前已经在例如yamano等人,“cpf1与向导rna和靶dna复合的晶体结构”。细胞(165)2016,p.949-962;其全部内容特此通过引入方式作为参考。[0697]在本组合物和方法中有用的是核酸酶失活的cpf1(dcpf1)变体,其可用作向导核苷酸序列-可编程的dna结合蛋白结构域。cpf1蛋白具有与cas9的ruvc结构域相似,但不具有hnh核酸内切酶结构域的ruvc样核酸内切酶结构域,且cpf1的n端不具有cas9的α-螺旋识别叶。zetscheetal.,cell,163,759-771,2015(通过引用方式并入本文)显示cpf1的ruvc样结构域负责切割两条dna链并使ruvc样结构域失活让cpf1核酸酶活性失活。例如,与弗朗西斯氏菌cpf1中的d917a、e1006a或d1255a对应的突变会使cpf1核酸酶活性失活。在一些实施方案中,本公开的dcpf1包括对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d122的突变。应当理解,根据本公开可以使用使cpf的ruvc结构域失活的任何突变,例如取代突变、缺失或插入。[0698]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可以是cpf1蛋白。在一些实施方案中,cpf1蛋白是cpf1切口酶(ncpf1)。在一些实施方案中,cpf1蛋白是核酸酶失活的cpf1(dcpf1)。在一些实施方案中,cpfl、ncpfl或dcpfl包括与本文公开的cpf1序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,dcpfl包括与本文公开的cpf1序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同,并且包括对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应当理解根据本公开也可以使用来自其他细菌物种的cpf1。[0699]野生型弗朗西斯菌cpf1(d917、e1006和d1255以粗体和底线表示)[0700][0701][0702]弗朗西斯菌cpf1d917a(a917、e1006和d1255为粗体和底线)[0703][0704][0705]弗朗西斯菌cpf1e1006a(d917、a1006和d1255为粗体和底线)[0706][0707]弗朗西斯菌cpf1d1255a(d917、e1006和a1255为粗体和底线)[0708][0709]弗朗西斯菌cpf1d917a/e1006a(a917、a1006和d1255为粗体和底线)[0710][0711][0712]弗朗西斯菌cpf1d917a/d1255a(a917、e1006和a1255为粗体和底线)[0713][0714][0715]弗朗西斯菌cpf1e1006a/d1255a(d917、a1006和a1255为粗体和底线)[0716][0717][0718]弗朗西斯菌cpf1d917a/e1006a/d1255a(a917、a1006和a1255为粗体和底线)[0719][0720]在一些实施方案中,融合蛋白中存在的cas9结构域之一可以被对pam序列没有要求的向导核苷酸序列-可编程的dna结合蛋白结构域替换。[0721]在一些实施方案中,cas9结构域是来自金黄色葡萄球菌(sacas9)的2cas9结构域。在一些实施方案中,sacas9结构域是核酸酶活性sacas9、核酸酶失活的sacas9(sacas9d)或sacas9切口酶(sacas9n)。在一些实施方案中,sacas9包括n579a突变,或本文所提供的任何氨基酸序列中的相应的突变。[0722]在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可结合具有非规范pam的核酸序列。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合具有nngrrt或nngrrtpam序列的核酸序列。在一些实施方案中,sacas9结构域包括e781x、n967x和r1014x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变,其中x是任何氨基酸。在一些实施方案中,sacas9结构域包括e781k、n967k和r1014h突变中的一个或多个,或本文所提供的任何氨基酸序列中的一个或多个相应的突变。在一些实施方案中,sacas9结构域包括e781k、n967k或r1014h突变,或本文所提供的任何氨基酸序列中的相应的突变。[0723]实施例性sacas9序列[0724][0725]以上加底线和粗体的残基n579可以突变(例如,突变成a579)以产生sacas9切口酶。[0726]实施例性sacas9n序列[0727][0728][0729]以上的残基a579可以从n579突变以产生sacas9切口酶,用底线和粗体表示。[0730]实施例性sakkhcas9[0731][0732]以上可以从n579突变以产生sacas9切口酶的的残基a579用底线和粗体表示。以上可以从e781、n967和r1014突变以产生sakkhcas9的残基k781、k967和h1014用底线和斜体表示。[0733]在一些实施方案中,napdnabp是环状排列物。在以下序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列。recognitionandcleavagebyc2c1crispr-casendonuclease”,cell,2016dec.15;167(7):1814-1828,其全部内容特此通过引入方式并入。aacc2c1的具有催化能力的构象(具有目标dna链和非目标dna链)已独立地位于在单个ruvc催化口袋中,其中cas12b/c2c1介导的切割导致目标dna的七个核苷酸交错断裂。cas12b/c2c1三元复合物与先前识别的cas9和cpf1对应物之间的结构比较证明了crispr-cas9系统使用的机制的多样性。[0738]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程的dna结合蛋白(napdnabp)可以是cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp是cas12b/c2c1蛋白。在一些实施方案中,napdnabp是cas12c/c2c3蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与天然存在的cas12b/c2c1或cas12c/c2c3蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与本文所提供的任何一个napdnabp序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,根据本公开也可以使用来自其他细菌物种的cas12b/c2c1或cas12c/c2c3。[0739]cas12b/c2c1((uniprot.org/uniprot/t0d7a2#2)sp|t0d7a2|c2c1_aliagcrispr相关的核酸内切酶c2c1os=酸土脂环酸芽孢杆菌(atcc49025/dsm3922/cip31b3926/cip31b31g/cip3131b3100c2c1pe=1sv=1)氨基酸序列如下:[0740]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi。[0741]aaccas12b(嗜酸脂环杆菌)-wp_067623834[0742]mavksmkvklrldnmpeiraglwklhtevnagvryytewlsllrqenlyrrspngdgeqecyktaeeckaellerlrarqvenghcgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekakaearkstdrtadvlraladfglkplmrvytdsdmssvqwkplrkgqavrtwdrdmfqqaiermmsweswnqrvgeayaklveqksrfeqknfvgqehlvqlvnqlqqdmkeashgleskeqtahyltgralrgsdkvfekwekldpdapfdlydteiknvqrrntrrfgshdlfaklaepkyqalwredasfltryavynsivrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgegrhairfqklltvedgvakevddvtvpismsaqlddllprdphelvalyfqdygaeqhlagefggakiqyrrdqlnhlharrgardvylnlsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnsegrvpfcfpiegnenlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpmdanqmtpdwreafedelqklkslygicgdrewteavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyqkdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyalddergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqellnqaqvhdllvgtmyaafssrfdartgapgircrrvparcareqnpepfpwwlnkfvaehkldgcplraddliptgegeffvspfsaeegdfhqihadlnaaqnlqrrlwsdfdisqirlrcdwgevdgepvliprttgkrtadsygnkvfytktgvtyyerergkkrrkvfaqeelseeeaellveadeareksvvlmrdpsgiinrgdwtrqkefwsmvnqriegylvkqirsrvrlqesacentgdi[0743]bhcas12b(久石芽孢杆菌)ncbi参考序列:wp_095142515mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk[0744]bvcas12bv4(相对于野生型的变化s893r/k846r/e837g)是表达如下:5’mrnacap‑‑‑5’utr‑‑‑bhcas12b‑‑‑stop序列‑‑‑3’utr‑‑‑120多聚苷酸尾5’utr:gggaaataagagagaaaagaagagtaagaagaaatataagagccacc[0745]3’utr(trilink标准utr)[0746]gctggagcctcggtggccatgcttcttgccccttgggcctccccccagcccctcctccccttcctgcacccgtacccccgtggtctttgaataaagtctga[0747]bhcas12b(v4)的核酸序列[0748]atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgccaccagatccttcatcctgaagatcgagcccaacgaggaagtgaagaaaggcctctggaaaacccacgaggtgctgaaccacggaatcgcctactacatgaatatcctgaagctgatccggcaagaggccatctacgagcaccacgagcaggaccccaagaatcccaagaaggtgtccaaggccgagatccaggccgagctgtgggatttcgtgctgaagatgcagaagtgcaacagcttcacacacgaggtggacaaggacgaggtgttcaacatcctgagagagctgtacgaggaactggtgcccagcagcgtggaaaagaagggcgaagccaaccagctgagcaacaagtttctgtaccctctggtggaccccaacagccagtctggaaagggaacagccagcagcggcagaaagcccagatggtacaacctgaagattgccggcgatccctcctgggaagaagagaagaagaagtgggaagaagataagaaaaaggacccgctggccaagatcctgggcaagctggctgagtacggactgatccctctgttcatcccctacaccgacagcaacgagcccatcgtgaaagaaatcaagtggatggaaaagtcccggaaccagagcgtgcggcggctggataaggacatgttcattcaggccctggaacggttcctgagctgggagagctggaacctgaaagtgaaagaggaatacgagaaggtcgagaaagagtacaagaccctggaagagaggatcaaagaggacatccaggctctgaaggctctggaacagtatgagaaagagcggcaagaacagctgctgcgggacaccctgaacaccaacgagtaccggctgagcaagagaggccttagaggctggcgggaaatcatccagaaatggctgaaaatggacgagaacgagccctccgagaagtacctggaagtgttcaaggactaccagcggaagcaccctagagaggccggcgattacagcgtgtacgagttcctgtccaagaaagagaaccacttcatctggcggaatcaccctgagtacccctacctgtacgccaccttctgcgagatcgacaagaaaaagaaggacgccaagcagcaggccaccttcacactggccgatcctatcaatcaccctctgtgggtccgattcgaggaaagaagcggcagcaacctgaacaagtacagaatcctgaccgagcagctgcacaccgagaagctgaagaaaaagctgacagtgcagctggaccggctgatctaccctacagaatctggcggctgggaagagaagggcaaagtggacattgtgctgctgcccagccggcagttctacaaccagatcttcctggacatcgaggaaaagggcaagcacgccttcacctacaaggatgagagcatcaagttccctctgaagggcacactcggcggagccagagtgcagttcgacagagatcacctgagaagataccctcacaaggtggaaagcggcaacgtgggcagaatctacttcaacatgaccgtgaacatcgagcctacagagtccccagtgtccaagtctctgaagatccaccgggacgacttccccaaggtggtcaacttcaagcccaaagaactgaccgagtggatcaaggacagcaagggcaagaaactgaagtccggcatcgagtccctggaaatcggcctgagagtgatgagcatcgacctgggacagagacaggccgctgccgcctctattttcgaggtggtggatcagaagcccgacatcgaaggcaagctgtttttcccaatcaagggcaccgagctgtatgccgtgcacagagccagcttcaacatcaagctgcccggcgagacactggtcaagagcagagaagtgctgcggaaggccagagaggacaatctgaaactgatgaaccagaagctcaacttcctgcggaacgtgctgcacttccagcagttcgaggacatcaccgagagagagaagcgggtcaccaagtggatcagcagacaagagaacagcgacgtgcccctggtgtaccaggatgagctgatccagatccgcgagctgatgtacaagccttacaaggactgggtcgccttcctgaagcagctccacaagagactggaagtcgagatcggcaaagaagtgaagcactggcggaagtccctgagcgacggaagaaagggcctgtacggcatctccctgaagaacatcgacgagatcgatcggacccggaagttcctgctgagatggtccctgaggcctaccgaacctggcgaagtgcgtagactggaacccggccagagattcgccatcgaccagctgaatcacctgaacgccctgaaagaagatcggctgaagaagatggccaacaccatcatcatgcacgccctgggctactgctacgacgtgcggaagaagaaatggcaggctaagaaccccgcctgccagatcatcctgttcgaggatctgagcaactacaacccctacgaggaaaggtcccgcttcgagaacagcaagctcatgaagtggtccagacgcgagatccccagacaggttgcactgcagggcgagatctatggcctgcaagtgggagaagtgggcgctcagttcagcagcagattccacgccaagacaggcagccctggcatcagatgtagcgtcgtgaccaaagagaagctgcaggacaatcggttcttcaagaatctgcagagagagggcagactgaccctggacaaaatcgccgtgctgaaagagggcgatctgtacccagacaaaggcggcgagaagttcatcagcctgagcaaggatcggaagtgcgtgaccacacacgccgacatcaacgccgctcagaacctgcagaagcggttctggacaagaacccacggcttctacaaggtgtactgcaaggcctaccaggtggacggccagaccgtgtacatccctgagagcaaggaccagaagcagaagatcatcgaagagttcggcgagggctacttcattctgaaggacggggtgtacgaatgggtcaacgccggcaagctgaaaatcaagaagggcagctccaagcagagcagcagcgagctggtggatagcgacatcctgaaagacagcttcgacctggcctccgagctgaaaggcgaaaagctgatgctgtacagggaccccagcggcaatgtgttccccagcgacaaatggatggccgctggcgtgttcttcggaaagctggaacgcatcctgatcagcaagctgaccaaccagtactccatcagcaccatcgaggacgacagcagcaagcagtctatgaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaagcassystems,”science,2019jan.4;363:88-91中描述;其全部内容特此通过引入方式作为参考。在一些实施方案中,napdnabp包括的氨基酸序列为与天然存在的cas12c1、cas12c2或ospcas12c蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12c1、cas12c2或ospcas12c蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与本文所述任何cas12c1、cas12c2或ospcas12c蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,根据本公开也可以使用来自其他细菌物种的cas12c1、cas12c2或ospcas12c。[0755]cas12c1[0756]mqtkkthlhlisakasrkyrrtiaclsdtakkdlerrkqsgaadpaqelsclktikfklevpegsklpsfdrisqiynaletiekgslsyllfalilsgfrifpnssaaktfassscykndqfasqikeifgemvknfipselesilkkgrrknnkdwteenikrvlnsefgrknsegssalfdsflskfsqelfrkfdswnevnkkyleaaelldsmlasygpfdsvckmigdsdsrnslpdkstiaftnnaeitvdiessvmpymaiaallreyrqskskaapvayvqshltttngnglswffkfgldlirkapvsskqstsdgskslqelfsvpddkldglkfikeacealpeasllcgekgellgyqdfrtsfaghidswvanyvnrlfelielvnqlpesiklpsiltqknhnlvaslglqeaevshslelfeglvknvrqtlkklagidissspneqdikefyafsdvlnrlgsirnqienavqtakkdkidlesaiewkewkklkklpklnglgggvpkqqelldkalesvkqirhyqridferviqwavnehcletvpkflvdaekkkinkesstdfaakenavrfllegigaaargktdsvskaaynwfvvnnflakkdlnryfincqgciykppyskrrslafalrsdnkdtievvwekfetfykeiskeiekfnifsqefqtflhlenlrmklllrriqkpipaeiaffslpqeyydslppnvaflalnqeitpseyitqfnlyssflngnlillrrsrsylrakfswvgnskliyaakearlwkipnaywksdewkmildsnvlvfdkagnvlpaptlkkvceregdlrlfypllrqlphdwcyrnpfvksvgreknvievnkegepkvasalpgslfrligpapfksllddcffnpldkdlrecmlivdqeisqkveaqkveaslesctysiavpiryhleepkvsnqfenvlaidqgeaglayavfslksigeaetkpiavgtiripsirrlihsvstyrkkkqrlqnfkqnydstafimrenvtgdvcakivglmkefnafpvleydvknlesgsrqlsavykavnshflyfkepgrdalrkqlwyggdswtidgieivtrerkedgkegvekivplkvfpgrsvsarftsktcsccgrnvfdwlftekkaktnkkfnvnskgelttadgviqlfeadrskgpkfyarrkertpltkpiakgsysleeierrvrtnlrrapkskqsrdtsqsqyfcvykdcalhfsgmqadenaainigrrfltalrknrrsdfpsnvkisdrlldn[0757]cas12c2[0758]mtkhsiplhafrnsgadarkwkgriallakrgketmrtlqfplemsepeaaainttpfavaynaiegtgkgtlfdywaklhlagfrffpsggaatifrqqavfedaswnaafcqqsgkdwpwlvpsklyerftkaprevakkdgskksieftqenvaneshvslvgasitdktpedqkefflkmagalaekfdswksanedrivamkvideflkseglhlpsleniavkcsvetkpdnatvawhdapmsgvqnlaigvfatcasridniydlnggklskliqesattpnvtalswlfgkgleyfrttdidtimqdfnipasakesikplvesaqaiptmtvlgkknyapfrpnfggkidswianyasrlmllndileqiepgfelpqalldnetlmsgidmtgdelkelieavyawvdaakqglatllgrggnvddavqtfeqfsammdtlngtlntisaryvravemagkdearleklieckfdipkwcksvpklvgisgglpkveeeikvmnaafkdvrarmfvrfeeiaayvaskgagmdvydalekreleqikklksavperahiqayravlhrigravqncsektkqlfsskviemgvfknpshlnnfifnqkgaiyrspfdrsrhapyqlhadkllkndwlellaeisatlmasesteqmedalrlertrlqlqlsglpdweypaslakpdieveiqtalkmqlakdtvtsdvlqrafnlyssvlsgltfkllrrsfslkmrfsvadttqliyvpkvcdwaipkqylqaegeigiaarvvtesspakmvtevemkepkalghfmqqaphdwyfdaslggtqvagrivekgkevgkerklvgyrmrgnsayktvldkslvgntelsqcsmiieipytqtvdadfraqvqaglpkvsinlpvketitasnkdeqmlfdrfvaidlgerglgyavfdaktlelqesghrpikaitnllnrthhyeqrpnqrqkfqakfnvnlselrentvgdvchqinricayynafpvleymvpdrldkqlksvyesvtnryiwsstdahksarvqfwlggetwehpylksakdkkplvlspgrgasgkgtsqtcsccgrnpfdlikdmkprakiavvdgkaklenselklfernleskddmlarrhrneragmeqpltpgnytvdeikallranlrrapknrrtkdttvseyhcvfsdcgktmhadenaavniggkfiadiek[0759]ospcas12c[0760]mtklrhrqkklthdwagskkrevlgsngklqnpllmpvkkgqvtefrkafsayaratkgemtdgrknmfthsfepfktkpslhqceladkayqslhsylpgslahfllsahalgfrifsksgeatafqasskieayesklaselacvdlsiqnltistlfnalttsvrgkgeetsadpliarfytlltgkplsrdtqgperdlaevisrkiassfgtwkemtanplqslqffeeelhaldanvslspafdvlikmndlqgdlknrtivfdpdapvfeynaedpadiiikltaryakeaviknqnvgnyvknaitttnanglgwllnkglsllpvstddellefigvershpschalieliaqleapelfeknvfsdtrsevqgmidsavsnhiarlsssrnslsmdseelerliksfqihtphcslfigaqslsqqleslpealqsgvnsadillgstqymltnslveesiatyqrtlnrinylsgvagqingaikrkaidgekihlpaawselislpfigqpvidvesdlahlknqyqtlsnefdtlisalqknfdlnfnkallnrtqhfeamcrstkknalskpeivsyrdllarltsclyrgslvlrragievlkkhkifesnselrehvherkhfvfvspldrkakkllrltdsrpdllhvideilqhdnlenkdreslwlvrsgyllaglpdqlsssfinlpiitqkgdrrlidliqydqinrdafvmlvtsafksnlsglqyrankqsfvvtrtlspylgsklvyvpkdkdwlvpsqmfegrfadilqsdymvwkdagrlcvidtakhlsnikksvfsseevlaflrelphrtfiqtevrglgvnvdgiafnngdipslktfsncvqvkvsrtntslvqtlnrwfeggkvsppsiqferayykkddqihedaakrkirfqmpatelvhasddagwtpsyllgidpgeygmglslvsinngevldsgfihinslinfaskksnhqtkvvprqqykspyanyleqskdsaagdiahildrliyklnalpvfealsgnsqsaadqvwtkvlsfytwgdndaqnsirkqhwfgashwdikgmlrqpptekkpkpyiafpgsqvssygnsqrcsccgrnpieqlremakdtsikelkirnseiqlfdgtiklfnpdpstvierrrhnlgpsripvadrtfknispsslefkelitivsrsirhspefiakkrgigseyfcaysdcnsslnseanaaanvaqkfqkqlffel[0761]在一些实施方案中,napdnabp是指cas12g、cas12h或cas12i,其已在例如yanetal.,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91中描述;其各自的全部内容特此通过引用方式并入。通过聚合超过10tb的序列数据识别了v型cas蛋白的新分类,其与先前表征的v类蛋白(包括cas12g、cas12h和cas12i)表现出弱相似性。在一些实施方案中,cas12蛋白是cas12g或cas12g的变体。在一些实施方案中,cas12蛋白是cas12h或cas12h的变体。在一些实施方案中,cas12蛋白是cas12i或cas12i的变体。应当理解,其他rna向导的dna结合蛋白可以用作napdnabp,并且在本公开的范畴内。在一些实施方案中,napdnabp包括的氨基酸序列为与天然存在的cas12g、cas12h或cas12i蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12g、cas12h或cas12i蛋白。在一些实施方案中,napdnabp包括的氨基酸序列为与本文所述任何cas12g、cas12h或cas12i蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,根据本公开也可以使用来自其他细菌物种的cas12g、cas12h或cas12i。在一些实施方案中,cas12i是cas12i1或cas12i2。[0762]cas12g1[0763]maqasstpavsprprpryreertlvrkllprpgqskqefrenvkklrkaflqfnadvsgvcqwaiqfrprygkpaeptetfwkfflepetslppndsrspefrrlqafeaaagingaaalddpaftnelrdsilavasrpktkeaqrlfsrlkdyqpahrmilakvaaewiesryrrahqnwernyeewkkekqeweqnhpeltpeireafnqifqqlevkekrvricpaarllqnkdncqyagknkhsvlcnqfnefkknhlqgkaikffykdaekylrcglqslkpnvqgpfredwnkylrymnlkeetlrgknggrlphcknlgqecefnphtalckqyqqqlssrpdlvqhdelyrkwrreywreprkpvfrypsvkrhsiakifgenyfqadfknsvvglrldsmpagqylefafapwprnyrpqpgeteissvhlhfvgtrprigfrfrvphkrsrfdctqeeldelrsrtfprkaqdqkfleaarkrlletfpgnaeqelrllavdlgtdsaraaffigktfqqafplkivkieklyeqwpnqkqagdrrdasskqprpglsrdhvgrhlqkmraqaseiaqkrqeltgtpapetttdqaakkatlqpfdlrgltvhtarmirdwarlnarqiiqlaeenqvdlivleslrgfrppgyenldqekkrrvaffahgrirrkvtekavergmrvvtvpylasskvcaecrkkqkdnkqweknkkrglfkcegcgsqaqvdenaarvlgrvfwgeielptaip[0764]cas12h1[0765]mkvheiprsqllkikqyegsfvewyrdlqedrkkfasllfrwaafgyaareddgatyispsqallerrlllgdaedvaikfldvlfkggapssscyslfyedfalrdkakysgakrefieglatmpldkiierirqdeqlskipaeewlilgaeyspeeiweqvaprivnvdrslgkqlrerlgikcrrphdagyckilmevvarqlrshnetyheylnqthemktkvannltnefdlvcefaevleeknyglgwyvlwqgvkqalkeqkkptkiqiavdqlrqpkfaglltakwralkgaydtwklkkrlekrkafpympnwdndyqipvgltglgvftlevkrtevvvdlkehgklfcshshyfgdltaekhpsryhlkfrhklklrkrdsrveptigpwieaalreitiqkkpngvfylglpyalshgidnfqiakrffsaakpdkevinglpsemvvgaadlnlsnivapvkarigkglegplhaldygygelidgpkiltpdgprcgelislkrdiveiksaikefkacqregltmseetttwlsevespsdsprcmiqsriadtsrrlnsfkyqmnkegyqdlaealrlldamdsynsllesyqrmhlspgeqspkeakfdtkrasfrdllrrrvahtiveyfddcdivffedldgpsdsdsrnnalvkllsprtlllyirqalekrgigmvevakdgtsqnnpisghvgwrnkqnkseiyfyedkellvmdadevgamnilcrglnhsvcpysfvtkapekkndekkegdygkrvkrflkdrygssnvrflvasmgfvtvttkrpkdalvgkrlyyhggelvthdlhnrmkdeikylvekevlarrvslsdstiksyksfahv[0766]cas12i1[0767]msnkeknasetrkayttkmiprshdrmkllgnfmdylmdgtpiffelwnqfgggidrdiisgtankdkisddlllavnwfkvmpinskpqgvspsnlanlfqqysgsepdiqaqeyfasnfdtekhqwkdmrveyerllaelqlsrsdmhhdlklmykekciglslstahyitsvmfgtgaknnrqtkhqfyskviqlleestqinsveqlasiilkagdcdsyrklrircsrkgatpsilkivqdyelgtnhddevnvpslianlkeklgrfeyecewkcmekikaflaskvgpyylgsysamlenalspikgmttknckfvlkqidakndikyenepfgkivegffdspyfesdtnvkwvlhphhigesniktlwedlnaihskyeediaslsedkkekrikvyqgdvcqtintyceevgkeaktplvqllrylysrkddiavdkiidgitflskkhkvekqkinpviqkypsfnfgnnskllgkiispkdklkhnlkcnrnqvdnyiwieikvlntktmrwekhhyalsstrfleevyypatsenppdalaarfrtktngyegkpalsaeqieqirsapvglrkvkkrqmrleaarqqnllprytwgkdfninickrgnnfevtlatkvkkkkeknykvvlgydanivrkntyaaieahangdgvidyndlpvkpiesgfvtvesqvrdksydqlsyngvkllyckphvesrrsflekyrngtmkdnrgnniqidfmkdfeaiaddetslyyfnmkyckllqssirnhssqakeyreeifellrdgklsvlklsslsnlsfvmfkvaksligtyfghllkkpknsksdvkappitdedkqkadpemfalrlaleekrlnkvkskkeviankivakalelrdkygpvlikgenisdttkkgkksstnsflmdwlargvankvkemvmmhqglefvevnpnftshqdpfvhknpentfrarysrctpselteknrkeilsflsdkpskrptnayynegamaflatyglkkndvlgvslekfkqimanilhqrsedqllfpsrggmfylatykldadatsvnwngkqfwvcnadlvaaynvglvdiqkdfkkk[0768]cas12i2[0769]mssaiksyksvlrpnerknqllkstiqcledgsafffkmlqglfggitpeivrfsteqekqqqdialwcavnwfrpvsqdslthtiasdnlvekfeeyyggtasdaikqyfsasigesyywndcrqqyydlcrelgvevsdlthdleilcrekclavatesnqnnsiisvlfgtgekedrsvklritkkileaisnlkeipknvapiqeiilnvakatketfrqvyagnlgapstlekfiakdgqkefdlkklqtdlkkvirgkskerdwccqeelrsyveqntiqydlwawgemfnkahtalkikstrnynfakqrleqfkeiqslnnllvvkklndffdseffsgeetyticvhhlggkdlsklykaweddpadpenaivvlcddlknnfkkepirnilryiftirqecsaqdilaaakynqqldryksqkanpsvlgnqgftwtnavilpekaqrndrpnsldlriwlylklrhpdgrwkkhhipfydtrffqeiyaagnspvdtcqfrtprfgyhlpkltdqtairvnkkhvkaaktearirlaiqqgtlpvsnlkiteisatinskgqvripvkfdvgrqkgtlqigdrfcgydqnqtashayslwevvkegqyhkelgcfvrfissgdivsitenrgnqfdqlsyeglaypqyadwrkkaskfvslwqitkknkkkeivtveakekfdaickyqprlykfnkeyayllrdivrgkslvelqqirqeifrfieqdcgvtrlgslslstletvkavkgiiysyfstalnasknnpisdeqrkefdpelfalleklelirtrkkkqkveriansliqtclennikfirgegdlsttnnatkkkansrsmdwlargvfnkirqlapmhnitlfgcgslytshqdplvhrnpdkamkcrwaaipvkdigdwvlrklsqnlraknigtgeyyhqgvkeflshyelqdleeellkwrsdrksnipcwvlqnrlaeklgnkeavvyipvrggriyfathkvatgavsivfdqkqvwvcnadhvaaanialtvkgigeqssdeenpdgsriklqlts[0770]碱基编辑器的代表性核酸和蛋白质序列如下:[0771]在p153的bhcas12bggsggs-abe8-xten20[0772][0773][0774][0775]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0776]在k255的bhcas12bggsggs-abe8-xten20[0777][0778][0779]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0780]在d306的bhcas12bggsggs-abe8-xten20[0781][0782][0783]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0784]在d980的bhcas12bggsggs-abe8-xten20[0785][0786][0787]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessggqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0788]在k1019的bhcas12bggsggs-abe8-xten20[0789][0790]encodedsmallrnaandhostfactorrnaseiii.”deltchevae.etal.,nature471:602-607(2011);以及“programmabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.etal,science337:816-821(2012),各自的全部内容通过引用方式并入本文)。cas9直向同源物已在各种物种中得到描述,包括但不限于化脓链球菌和嗜热链球菌。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员来说是显而易见的,并且此类cas9核酸酶和序列包括来自thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737;其全部内容通过引用方式并入本文。在一些实施方案中,cas9核酸酶具有失活(inactive)(例如,失活(inactivated))的dna切割结构域,即cas9是切口酶。[0795]在一些实施方案中,向导多核苷酸是至少一种单个向导rna(“sgrna”或“gnra”)。在一些实施方案中,向导多核苷酸是至少一种tracrrna。在一些实施方案中,向导多核苷酸不需要pam序列来将多核苷酸-可编程的dna结合结构域(例如,cas9或cpf1)向导至目标核苷酸序列。[0796]本文公开的碱基编辑器的多核苷酸可编程的核苷酸结合结构域(例如,衍生自crispr的结构域)可以通过与向导多核苷酸关联来辨识目标多核苷酸序列。向导多核苷酸(例如,grna)通常是单链的,并且可以被编程为位点特异性地结合(即,经由互补碱基配对)多核苷酸的目标序列,从而引导与向导核酸结合的碱基编辑器核酸到目标序列。向导多核苷酸可以是dna。向导多核苷酸可以是rna。在一些实施方案中,向导多核苷酸包括天然核苷酸(例如,腺苷)。在一些实施方案中,向导多核苷酸包括非天然(或非天然)核苷酸(例如,肽核酸或核苷酸类似物)。在一些实施方案中,向导核酸序列的靶向区域可以长度为是至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。向导核酸的靶向区域的长度可以在10至30个核苷酸之间,或长度在15至25个核苷酸之间,或长度在15至20个核苷酸之间。[0797]在一些实施方案中,向导多核苷酸包括两个或更多个单独的多核苷酸,其可以经由例如互补碱基配对(例如,双向导多核苷酸)彼此相互作用。例如,向导多核苷酸可包括crisprrna(crrna)和反式激活crisprrna(tracrrna)。例如,向导多核苷酸可包括一种或多种反式激活crisprrna(tracrrna)。[0798]在ii类crispr系统中,crispr蛋白(例如,cas9)靶向核酸通常需要包括辨识目标序列的序列的第一个rna分子(crrna)和包括识别重复序列的第二个rna分子(trrna)之间的互补碱基配对,其形成稳定向导rna-crispr蛋白复合物的支架区域。此类双向导rna系统可用作向导多核苷酸以将本文公开的碱基编辑器向导至目标多核苷酸序列。[0799]在一些实施方案中,本文所提供的碱基编辑器利用单个向导多核苷酸(例如,grna)。在一些实施方案中,本文所提供的碱基编辑器利用双向导多核苷酸(例如,双grna)。在一些实施方案中,本文所提供的碱基编辑器利用一种或多种向导多核苷酸(例如,多个grna)。在一些实施方案中,单个向导多核苷酸用于本文所述不同碱基编辑器。例如,单个向导多核苷酸可用于胞苷碱基编辑器和腺苷碱基编辑器。[0800]在其他实施方案中,向导多核苷酸可在单个分子(即,单分子向导核酸)中包括核酸的多核苷酸靶向部分和核酸的支架部分。例如,单分子向导多核苷酸可以是单向导rna(sgrna或grna)。在本文中,术语向导多核苷酸序列涵盖能够与碱基编辑器相互作用并将碱基编辑器向导至目标多核苷酸序列的任何单、双或多分子核酸。[0801]通常,向导多核苷酸(例如,crrna/trrna复合物或grna)包括包含能够辨识和结合目标多核苷酸序列的序列的“多核苷酸-靶向区段”,以及稳定在碱基编辑器的多核苷酸可编程的核苷酸结合结构域组分内的向导多核苷酸的“蛋白质结合区段”。在一些实施方案中,向导多核苷酸的多核苷酸靶向区段识别并结合dna多核苷酸,从而促进dna中碱基的编辑。在其他实施方案中,向导多核苷酸的多核苷酸靶向区段辨识并结合rna多核苷酸,从而促进rna中碱基的编辑。在本文中,“区段”是指分子的段或区域,例如,向导多核苷酸中的一段连续核苷酸。区段也可指复合物的区域/段,使得区段可包括超过例如,当向导多核苷酸包括多个个别核酸分子时,蛋白质结合区段可包括例如沿着互补区域杂交的多个单独分子的全部或一部分。在一些实施方案中,-包括两个单独分子的靶向dna的rna的蛋白质结合区段可包括(i)长度为100个碱基对的第一个rna分子的40至75个碱基对;和(ii)长度为50个碱基对的第二个rna分子的10至25个碱基对。除非在特定上下文中另有明确定义,否则“区段”的定义不限于总碱基对的特定数目,不限于给定的rna分子的任何特定数目的碱基对,不限于复合物内特定数量的单独分子,并且可以包括具有任何总长度的rna分子区域,并且可以包括与其他分子互补的区域。[0802]向导rna或向导多核苷酸可包括两个或更多个rna,例如crisprrna(crrna)和反式激活crrna(tracrrna)。向导rna或向导多核苷酸有时可包括单链rna或通过crrna和tracrrna的一部分(例如,功能性部分)融合形成的单向导rna(sgrna)。向导rna或向导多核苷酸也可以是包括crrna和tracrrna的双rna。此外,crrna可以与目标dna杂交。[0803]如上所述,向导rna或向导多核苷酸可以是表达产物。例如,编码向导rna的dna可以是包括编码向导rna的序列的载体。通过用包括编码向导rna和启动子的序列的单离的向导rna或质粒dna转染细胞,可以将向导rna或向导多核苷酸转移到细胞中。向导rna或向导多核苷酸也可以以其他方式转移到细胞中,例如使用病毒介导的基因递送。[0804]可以单离向导rna或向导多核苷酸。例如,向导rna可以以单离的rna的形式转染到细胞或生物体中。可以通过使用本领域已知的任何体外转录系统体外转录来制备向导rna。向导rna可以以单离的rna的形式而不是以包括向导rna的编码序列的质粒的形式转移到细胞中。[0805]向导rna或向导多核苷酸可包括三个区域:5'端的可与染色体序列中的目标位点互补的第一区域、可形成茎环结构的第二内部区域以及'可以是单链的第三3区域。各向导rna的第一区域也可以不同,使得每个向导rna将融合蛋白向导至特定目标位点。此外,各向导rna的第二和第三区域在所有向导rna中可以相同。[0806]向导rna或向导多核苷酸的第一区域可与染色体序列中的目标位点的序列互补,使得向导rna的第一区域可与目标位点碱基配对。在一些实施方案中,向导rna的第一区域可包括或从约10个核苷酸到25个核苷酸(即,从10个核苷酸到约25个核苷酸;或从约10个核苷酸到约25个核苷酸;或从约10个核苷酸到约25个核苷酸;或约10个核苷酸至25个核苷酸)或更多。例如,向导rna的第一区域和染色体序列中的目标位点之间的碱基配对区域可以是或可以是长度为约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或更多个核苷酸。有时,向导rna的第一区域的长度可以是或可以是约19、20或21个核苷酸。[0807]向导rna或向导多核苷酸还可包括形成二级结构的第二区域。例如,由向导rna形成的二级结构可以包括茎(或发夹)和环。环和茎的长度可以变化。例如,环的长度范围可为约3至10个核苷酸,而茎的长度范围可为约6至20个碱基对。茎可包括一个或多个1至10个或约10个核苷酸的凸起物。第二区域的总长度可在约16至60个核苷酸的长度范围内。例如,环的长度可以是或可以是约4个核苷酸,茎可以是或可以是约12个碱基对。[0808]向导rna或向导多核苷酸还可以在3'端包括基本上可以是单链的第三区域。例如,第三个区域有时与感兴趣的细胞中的任何染色体序列不互补,有时与向导rna的其余部分不互补。此外,第三区域的长度可以变化。第三区域的长度可以多于或多于约4个核苷酸。例如,第三区域的长度可以在约5至60个核苷酸的长度范围内。[0809]向导rna或向导多核苷酸可以靶向基因目标的任何外显子或内含子。在一些实施方案中,向导可以靶向基因的外显子1或2;在其他实施方案中,向导可以靶向基因的外显子3或4。组合物可包括均靶向相同外显子的多个向导rna,或在一些实施方案中,可包括靶向不同外显子的多个向导rna。可以靶向基因的外显子和内含子。[0810]向导rna或向导多核苷酸可以靶向20个核苷酸或约20个核苷酸的核酸序列。目标核酸可以少于或少于约20个核苷酸。目标核酸的长度可为至少或至少约5、10、15、16、17、18、19、20、21、22、23、24、25、30或1至100个核苷酸之间的任何位置。目标核酸可以是至多或至多约5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50或1至100之间的任何位置核苷酸长度。目标核酸序列可以是或可以是紧邻pam的第一个核苷酸的5'处的约20个碱基。向导rna可以靶向核酸序列。目标核酸可以是至少或至少约1至10、1至20、1至30、1至40、1至50、1至60、1至70、1至80、1至90或1至100个核苷酸。[0811]向导多核苷酸(例如向导rna)可以指可以与另一种核酸杂交的核酸,例如细胞基因组中的目标核酸或前间隔。向导多核苷酸可以是rna。向导多核苷酸可以是dna。向导多核苷酸可以被编程或设计成位点特异性地结合核酸序列。向导多核苷酸可以包括多核苷酸链,并且可以称为单个向导多核苷酸。向导多核苷酸可以包括两条多核苷酸链,并且可以称为双向导多核苷酸。向导rna可以作为rna分子导入细胞或胚胎。例如,rna分子可以在体外转录和/或可以化学合成。rna可以从合成dna分子转录,例如基因片段。然后可以将向导rna作为rna分子导入细胞或胚胎中。向导rna也可以以非rna核酸分子(例如dna分子)的形式引入细胞或胚胎中。例如,编码向导rna的dna可以与启动子控制序列可操作地连接,以在感兴趣的细胞或胚胎中表达向导rna。rna编码序列可以与被rna聚合酶iii(poliii)辨识的启动子序列可操作地连接。可用于表达向导rna的质粒载体包括但不限于px330载体和px333载体。在一些实施方案中,质粒载体(例如,px333载体)可包括至少两个向导rna编码的dna序列。[0812]用于选择、设计和验证向导多核苷酸例如向导rna和靶向序列的方法在本文中描述,并且是本领域技术人员已知的。例如,为了使核碱基编辑器系统中脱氨酶结构域(例如aid结构域)的潜在底物混杂的影响最小化,可能无意中使成为脱氨目标的残基数量(例如,可能潜在驻留在目标核酸基因座内的ssdna上)可最小化。此外,软件工具可用于优化对应于目标核酸序列的grna,例如,使整个基因组的总脱靶活性最小化。例如,对于使用化脓链球菌cas9的各可能的靶向结构域选择,所有脱靶序列(在选定的pam之前,例如nag或ngg)都可以在基因组中被识别,其中包括多达特定数量(例如,1、2、3、4、5、6、7、8、9或10)个错配的碱基对。可以识别与目标位点互补的grna的第一个区域,并且可以根据其总预测的脱靶分数对所有第一个区域(例如,crrna)进行排序;排名靠前的目标域代表那些可能具有最大的目标和最少的脱靶活动的域。可以使用本领域已知的和/或如本文所载方法对候选靶向grna进行功能评估。[0813]作为非限制性实例,可使用dna序列搜索算法来识别与cas9一起使用的向导rna的crrna中的目标dna杂交序列。grna设计可以使用基于公共工具cas-offinder的定制grna设计软件进行,如baes.,parkj.,&kimj.-s.cas-offinder:afastandversatilealgorithmthatsearchesforpotentialoff-targetsitesofcas9rna-guidedendonucleases.bioinformatics30,1473-1475(2014)中所述。所述软件在计算其全基因组脱靶倾向后为向导评分。对于长度从17到24不等的向导,通常会考虑从完美匹配到7次错配的匹配。一旦通过计算确定了脱靶位点,就会为每次向导计算总分,并使用网络界面汇总在表格输出中。除了识别与pam序列相邻的潜在目标位点外,所述软件还可以识别与所选目标位点相差1、2、3或多于3个核苷酸的所有pam相邻序列。可以获得目标核酸序列(例如目标基因)的基因组dna序列,并且可以使用公开可用的工具例如repeatmasker程序筛选重复组件。repeatmasker搜索输入dna序列的重复组件和低复杂性区域。输出是给定查询序列中存在的重复的详细注释。[0814]在识别之后,向导rna的第一区域(例如crrna)可以根据其与目标位点的距离、其正交性和5'核苷酸的存在进行分级,以便与相关的pam序列(例如,基于含有相关pam的人类基因组中的紧密匹配的识别的5'g,例如,化脓链球菌的nggpam,金黄色葡萄球菌的nngrrt或nngrrvpam)。如本文所用,正交性是指人类基因组中包括最少数量的与目标序列的错配的序列的数量。例如,“高水平正交性”或“良好正交性”可以指在人类基因组中除了预期目标之外没有相同序列的20聚体靶向结构域,也没有在目标中含有一或两个错配的任何序列。可以选择具有良好正交性的靶向结构域,以使脱靶dna切割最小化。[0815]在一些实施方案中,报告系统可用于检测碱基编辑活性和测试候选向导多核苷酸。在一些实施方案中,报告系统可以包括基于报告基因的测定,其中碱基编辑活动导致报告基因的表达。例如,报告系统可包含包括去激活的起始密码子的报告基因,例如模板链上从3'-tac-5'至3'-cac-5'的突变。目标c成功脱氨后,相应的mrna将转录为5'-aug-3',而不是5'-gug-3',从而实现报告基因的翻译。合适的报告基因对本领域技术人员来说是显而易见的。报告基因的非限制性实例包括编码绿色荧光蛋白(greenfluorescenceprotein,gfp)、红色荧光蛋白(redfluorescenceprotein,rfp)、荧光素酶、分泌的碱性磷酸酶(secretedalkalinephosphate,seap)或其表达对本领域技术人员来说是可检测的和显而易见的任何其他基因的基因。报告系统可用于测试许多不同的grna,例如,以确定相应脱氨酶将针对目标dna序列的哪个或哪些残基。还可以测试靶向非模板链的sgrna,以评估特定碱基编辑蛋白(例如cas9脱氨酶融合蛋白)的脱靶效应。在一些实施方案中,此类grna可以被设计为使得突变的起始密码子将不与grna碱基配对。向导多核苷酸可包括标准核糖核苷酸、修饰的核糖核苷酸(例如假尿苷)、核糖核苷酸异构体、和/或核糖核苷酸类似物。在一些实施方案中,向导多核苷酸可包括至少一种可检测标记。可检测标记可以是荧光团(例如,fam、tmr、cy3、cy5、德克萨斯红(texasred)、俄勒冈绿(oregongreen)、alexafluors、halo标签或合适的荧光染料)、检测标签(例如,生物素、地高辛等)、量子点或金粒子。[0816]向导多核苷酸可以化学合成、酶促合成或其组合。例如,可以使用标准基于亚磷酰胺的固相合成方法合成向导rna。或者,可以通过将编码向导rna的dna与被噬菌体rna聚合酶识别的启动子控制序列可操作地连接来体外合成向导rna。合适的噬菌体启动子序列的例子包括t7、t3、sp6启动子序列或其变体。在其中向导rna包括两个单独的分子(例如,crrna和tracrrna)的实施方案中,crrna可以化学合成并且tracrrna可以酶促合成。[0817]在一些实施方案中,碱基编辑器系统可包括多个向导多核苷酸,例如grna。例如,grna可以靶向包括在碱基编辑器系统中的一个或多个目标基因座(例如,至少1个grna、至少2个grna、至少5个grna、至少10个grna、至少20个grna、至少30个grna、至少50grna)。多个grna序列可以串联排列并且优选地由同向重复分开。[0818]编码向导rna或向导多核苷酸的dna序列也可以是载体的一部分。此外,载体可以包括额外的表达控制序列(例如,增强子序列、kozak序列、聚腺苷酸化序列、转录终止序列等)、可选择的标记序列(例如,gfp或抗生素抗性基因,例如嘌呤霉素)、复制起点等。编码向导rna的dna分子也可以是线性的。编码向导rna或向导多核苷酸的dna分子也可以是环状的。[0819]在一些实施方案中,碱基编辑器系统的一个或多个组分可由dna序列编码。此类dna序列可以一起或单独引入表达系统,例如细胞。例如,可以将编码多核苷酸可编程的核苷酸结合结构域和向导rna的dna序列引入细胞,各dna序列可以是单独分子的一部分(例如,一个含有多核苷酸可编程的核苷酸结合结构域编码序列的载体和第二个含有向导rna编码序列的载体)或两者可以是同一分子的一部分(例如,一个含有多核苷酸可编程的核苷酸结合结构域和向导rna的编码(和调节)序列的载体)。[0820]向导多核苷酸可以包括一个或多个修饰以提供具有新的或增强的特征的核酸。向导多核苷酸可包括核酸亲和性标签。向导多核苷酸可包括合成核苷酸、合成核苷酸类似物、核苷酸源物、和/或修饰的核苷酸。[0821]在一些实施方案中,grna或向导多核苷酸可包括修饰。可以在grna或向导多核苷酸的任何位置进行修饰。可以对单个grna或向导多核苷酸进行不止一种修饰。grna或向导多核苷酸可以在修饰后进行质量控制。在一些实施方案中,质量控制可包含page、hplc、ms或其任何组合。[0822]grna或向导多核苷酸的修饰可以是取代、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任何组合。[0823]grna或向导多核苷酸也可以被5'腺苷酸、5'鸟苷-三磷酸帽、5'n7-甲基鸟苷-三磷酸帽、5'三磷酸帽、3'磷酸酯、3'硫代磷酸酯、5'磷酸酯、5'修饰硫代磷酸酯、cis-syn胸苷二聚体、三聚体、c12间隔、c3间隔、c6间隔、dspacer、pc间隔、rspacer、间隔18、间隔9、3'-3'修饰、5'-5'修饰、无碱基、吖啶、偶氮苯、生物素、生物素bb、生物素teg、胆固醇teg、脱硫生物素teg、dnpteg、dnp-x、dota、dt-生物素、双生物素、pc生物素、补骨脂素c2、补骨脂素c6、tina、3'dabcyl、黑洞猝灭剂1、黑洞猝灭剂2、dabcylse、dt-dabcyl、irdyeqc-1、qsy-21、qsy-35、qsy-7、qsy-9、羧基连接子、巯基连接子、2'-脱氧核糖核苷类似物嘌呤、2'-脱氧核糖核苷类似物嘧啶、核糖核苷类似物、2'-o-甲基核糖核苷类似物、糖修饰的类似物、摆动/通用碱基、荧光染料标记、2'-氟rna、2'-o-甲基rna、甲基膦酸酯、磷酸二酯dna、磷酸二酯rna、硫代磷酸酯dna、硫代磷酸酯rna、una、假尿苷-5'-三磷酸、5'-甲基胞苷-5'-三磷酸或其任何组合。[0824]在一些实施方案中,修改是永久性的。在其他实施方案中,修改是暂时的。在一些实施方案中,对grna或向导多核苷酸进行了多次修饰。grna或向导多核苷酸修饰可以改变核苷酸的理化特性,例如它们的构象、极性、疏水性、化学反应性、碱基配对相互作用或其任何组合。[0825]pam序列可以是本领域已知的任何pam序列。合适的pam序列包括但不限于ngg、nga、ngc、ngn、ngt、ngcg、ngag、ngan、ngng、ngcn、ngcg、ngtn、nngrrt、nnnrrt、nngrr(n)、tttv、tycv、tycv、tatv、nnnngatt、nnagaaw或naaaac。y是嘧啶;n是任何核苷酸碱基;w是a或t。[0826]修饰也可以是硫代磷酸酯替代物。在一些实施方案中,天然磷酸二酯键可易于被细胞核酸酶快速降解;使用硫代磷酸酯(ps)键替代物对核苷酸间键的修饰可以更稳定地通过细胞降解进行水解。修饰可以增加grna或向导多核苷酸的稳定性。修饰还可以增强生物活性。在一些实施方案中,硫代磷酸酯增强的rnagrna可以抑制rnasea、rnaset1、小牛血清核酸酶或其任何组合。这些特性可以使ps-rnagrna用于在体内或体外暴露于核酸酶的可能性很高的应用。例如,可以在grna的5'-或”‑端的最后3至5个核苷酸之间引入硫代磷酸酯(ps)键,其可以抑制外切核酸酶降解。在一些实施方案中,可以在整个grna中添加硫代磷酸酯键以减少核酸内切酶的攻击。[0827]不同的cas12b直向同源物(例如bhcas12b、bvcas12b和aacas12b)使用不同的支架序列(也称为tracrrna)。在一些实施方案中,支架序列被优化用于与bhcas12b蛋白一起使用,并且具有以下序列:(其中在实际grna中,t被尿苷(u)置换)。[0828]bhcas12bsgrna支架(底线)+20核苷酸至23核苷酸向导序列(用n表示)。[0829]5’gttctgtcttttggtcaggacaaccgtctagctataagtgctgcagggtgtgagaaactcctattgctggacgatgtctcttacgaggcattagcacnnnnnnnnnnnnnnnnnnnn-3’[0830]在一些实施方案中,支架序列被优化以与bvcas12b蛋白一起使用,并且具有以下序列:(其中在实际grna中t被尿苷(u)替代)。[0831]bvcas12bsgrna支架(底线)+20核苷酸到23核苷酸向导序列(用n表示)[0832]5’gacctatagggtcaatgaatctgtgcgtgtgccataagtaattaaaaattacccaccacaggagcacctgaaaacaggtgcttggcacnnnnnnnnnnnnnnnnnnnn-3’[0833]在一些实施方案中,支架序列被优化用于与aacas12b蛋白一起使用,并且具有以下序列:(其中在实际grna中,t被尿苷(u)置换)。[0834]aacas12bsgrna支架(底线)+20核苷酸至23核苷酸向导序列(用n表示)[0835]5’gtctaaaggacagaatttttcaacgggtgtgccaatggccactttccaggtggcaaagcccgttgaacttctcaaaaagaacgatctgagaagtggcacnnnnnnnnnnnnnnnnnnnn-3’[0836]因此,本领域技术人员可以改变cas蛋白的基因组目标特异性部分取决于grna靶向序列与基因组其余部分相比对基因组目标的特异性。[0837]前间隔序列邻近基序[0838]术语“前间隔邻近基序(pam)”或pam样基序是指紧邻在crispr细菌适应性免疫系统中cas9核酸酶靶向的dna序列之后的2至6个碱基对dna序列。在一些实施方案中,pam可以是5’pam(即,位于前间隔5’端的上游)。在其他实施方式中,pam可以是3’pam(即,位于前间隔5’端的下游)。2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr9llt10llr11llq12lll13fit14fir15fiq16fil17fgc18hln19fgca20hlnv21law22laf23lay24iaw25iaf26iay[0848]表3:在残基1135、1136、1218、1219和1335处的ngtpam变体突变[0849]变体d1135ls1136rg1218se1219vr1335q27gꢀꢀꢀꢀ28vꢀꢀꢀꢀ29iꢀꢀꢀꢀ30aꢀꢀꢀ31wꢀꢀꢀ32hꢀꢀꢀ33kꢀꢀꢀ34ꢀꢀkꢀꢀ35ꢀꢀrꢀꢀ36ꢀꢀqꢀꢀ37ꢀꢀtꢀꢀ38ꢀꢀnꢀꢀ39ꢀꢀꢀi40ꢀꢀꢀa41ꢀꢀꢀn42ꢀꢀꢀq43ꢀꢀꢀg44ꢀꢀꢀl45ꢀꢀꢀs46ꢀꢀꢀt47ꢀꢀꢀꢀl48ꢀꢀꢀꢀi49ꢀꢀꢀꢀv50ꢀꢀꢀꢀn51ꢀꢀꢀꢀs52ꢀꢀꢀꢀt53ꢀꢀꢀꢀf54ꢀꢀꢀꢀyꢀꢀꢀꢀꢀꢀ55n1286qi1331fꢀꢀꢀ[0850]在一些实施方案中,ngtpam变体选自表2和3中的变体5、7、28、31或36。在一些实施方案中,变体具有改进的ngtpam识别。[0851]在一些实施方案中,ngtpam变体在残基1219、1335、1337、和/或1218处具有突变。在一些实施方案中,从下表4中提供的变体中选择具有用于改进辨识的突变的ngtpam变体。[0852]表4:在残基1219、1335、1337和1218处的ngtpam变体突变[0853]变体e1219vr1335qt1337g12181fvt2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr[0854]在一些实施方案中,可以如下表5提供的产生具有ngtpam特异性的碱基编辑器。[0855]表5a.ngtpam变体[0856]ngtn变体d1135s1136g1218e1219a1322rr1335t1337变体1lrkiqklrki-qk变体2lrsvqklrsv-qk变体3lrsvqllrsv-ql变体4lrkirqklrkirqk变体5lrsvrqklrsvrqk变体6lrsvrqllrsvrql[0857]在一些实施方案中,ngtn变体是变体1。在一些实施方案中,ngtn变体是变体2。在一些实施方案中,ngtn变体是变体3。在一些实施方案中,ngtn变体是变体4。在一些实施方案中,ngtn变体是变体5。在一些实施方案中,ngtn变体是变体6。[0858]在一些实施方案中,cas9结构域是来自化脓链球菌(spcas9)的cas9结构域。在一些实施方案中,spcas9结构域是核酸酶活性spcas9、核酸酶失活的spcas9(spcas9d)或spcas9切口酶(spcas9n)。在一些实施方案中,spcas9包括d10x突变,或本文所提供的任何氨基酸序列中的相应的突变,如seqidno:1中编号者,其中x是除d之外的任何氨基酸。在一些实施方案中,spcas9包括在seqidno:1中编号为d10a突变,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可结合具有非规范pam的核酸序列。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可结合具有ngg、nga或ngcgpam序列的核酸序列。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135x、r1335x和t1337x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1136e、r1335q和t1337r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135e、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135x、r1335x和t1337x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135v、r1335q和t1337r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135v、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135x、g1218x、r1335x和t1337x突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135v、g1218r、r1335q和t1337r突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,spcas9结构域包括在seqidno:1中编号为d1135v、g1218r、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的相应的突变。[0859]在一些实施方案中,cas9是对改变的pam序列具有特异性的cas9变体。在一些实施方案中,额外的cas9变体和pam序列在milleretal.,continuousevolutionofspcas9variantscompatiblewithnon-gpams.natbiotechnol(2020).https://doi.org/10.1038/s41587-020-0412-8中描述,其全部内容通过引用方式并入本文。在一些实施方案中,cas9变体没有特定的pam要求。在一些实施方案中,cas9变体(例如spcas9变体)对nrnhpam具有特异性,其中r是a或g并且h是a、c或t。在一些实施方案中,spcas9变体对pam序列aaa、taa、caa、gaa、tat、gat或cac具有特异性。在一些实施方案中,spcas9变体包括在seqidno:1编号为位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337或1339如或其相应位置的氨基酸取代。在一些实施方案中,spcas9变体包括在seqidno:1中编号为1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335或1337位置或其相应位置的氨基酸取代。在一些实方案中,spcas9变体包括在seqidno:1编号为位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333或其相应位置的氨基酸取代。在一些实施方案中,spcas9变体包括在seqidno:1编号为位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339或其相应位置的氨基酸取代。在一些实施方案中,spcas9变体包括在seqidno:1编号为位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1398、1349或其对应位置编的氨基酸取代。spcas9变体的实施例性氨基酸取代和pam特异性显示在下表5b、5c、5d和5e。[0860]表5b.额外的变异突变和pam[0861][0862]表5c.额外的变异突变和pam[0863][0864]表5d.额外的变异突变和pam[0865][0866]表5e.额外的变异突变和pam。[0867][0868]在一些实施方案中,cas9是脑膜炎奈瑟菌cas9(nmecas9)或其变体。在一些实施方案中,nmecas9对nnnngaywpam具有特异性,其中y是c或t并且w是a或t。在一些实施方案中,nmecas9对nnnngyttpam具有特异性,其中y是c或t。在一些实施方案中,nmecas9对nnnngtctpam具有特异性。在一些实施方案中,nmecas9是nme1cas9。在一些实施方案中,nmecas9对nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam、nnnncctgpam、nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam具有特异性pam、nnnnccagpam、nnnnccatpam或nnngattpam。在一些实施方案中,nme1cas9对nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam或nnnncctgpam具有特异性。在一些实施方案中,nmecas9对caapam、caaapam或ccapam具有特异性。在一些实施方案中,nmecas9是nme2cas9。在一些实施方案中,nmecas9对nnnncc(n4cc)pam具有特异性,其中n是a、g、c或t中的任一个。在一些实施方案中,nmecas9对nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam具有特异性。在一些实施方案中,nmecas9是nme3cas9。在一些实施方案中,nmecas9对nnnncaaapam、nnnnccpam或nnnncnnnpam具有特异性。额外的nmecas9特征和pam序列,如edrakietal.mol.cell.(2019)73(4):714-726是通过引用方式整体并入本文。[0869]以下提供nme1cas9的实施例性氨基酸序列:[0870]ii类crisprrna向导的核酸内切酶cas9[脑膜炎奈瑟菌]wp_002235162.1[0871][0872]以下提供nme2cas9的实施例性氨基酸序列:[0873]ii类crisprrna向导的核酸内切酶cas9[脑膜炎奈瑟菌]wp_002230835.1[0874][0875]在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包括的氨基酸序列为与本文所述cas9多肽至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包括本文所述的任何cas9多肽的氨基酸序列。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域是由本文所述的任何cas9多肽的氨基酸序列组成。[0876]在一些实施方案中,可将本文公开的碱基编辑器的衍生自crispr蛋白的结构域辨识的pam提供给与编码碱基编辑器的插入物(例如,aav插入物)单独的寡核苷酸上的细胞。在这样的实施方案中,在单独的寡核苷酸上提供pam可以允许切割通常不能被切割的目标序列,因为在与目标序列相同的多核苷酸上不存在相邻的pam。[0877]在一个实施方案中,化脓链球菌cas9(spcas9)可用作基因组工程的crispr核酸内切酶。然而,也可以使用其他者。在一些实施方案中,不同的核酸内切酶可用以靶向某些基因组目标。在一些实施方案中,可以使用具有非nggpam序列的合成spcas9源变体。此外,已经识别来自不同物种的其他cas9直向同源物,并且这些“非spcas9”可以结合也可用于本公开的多种pam序列。例如,相对较大的spcas9(大约4kb编码序列)可导致携带spcas9cdna的质粒无法在细胞中有效表达。相反,金黄色葡萄球菌cas9(sacas9)的编码序列比spcas9短约1千碱基,可能使其在细胞中有效表达。与spcas9类似,sacas9核酸内切酶能够在哺乳动物细胞体外和小鼠体内修饰的目标基因。在一些实施方案中,cas蛋白可以靶向不同的pam序列。在一些实施方案中,目标基因可以与例如cas9pam、5’‑ngg相邻。在其他实施方案中,其他cas9直向同源物可具有不同的pam要求。例如,其他pam,诸如嗜热链球菌(crispr1为5'-nnagaa及crispr3为5'-nggng)和脑膜炎奈瑟菌(5'-nnnngatt)的pam也可以与目标基因相邻。[0878]在一些实施方案中,对于化脓链球菌系统,目标基因序列可以在(即,5'至)5'-nggpam之前,并且20个核苷酸向导rna序列可以与相反链碱基配对以介导与pam相邻的cas9裂解。在一些实施方案中,相邻切割可以是pam上游的3个碱基对或可以是pam上游的约3个碱基对。在一些实施方案中,相邻切割可以是或可以是pam上游的约10个碱基对。在一些实施方案中,相邻切割可以是pam上游的0至20个碱基对或可以是约pam上游的0至20个碱基对。例如,相邻切割可以紧挨着pam上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、2021、22、23、24、25、26、27、28、29或30个碱基对。相邻切割也可以在pam的下游1到30个碱基对。能够结合pam序列的实施例性spcas9蛋白的序列如下:[0879]实施例性结合pam的spcas9的氨基酸序列如下:[0880]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0881]实施例性的结合pam的spcas9n的氨基酸序列如下:[0882]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0883]实施例性的结合pam的speqrcas9的氨基酸序列如下:[0884][0885]在以上序列中,用底线和粗体表示可从d1134、r1334和t1336突变以产生speqrcas9的残基e1134、q1334和r1336。[0886]实施例性的结合pam的spvqrcas9的氨基酸序列如下:[0887][0888][0889]在以上序列中,用底线和粗体表示可以从d1134、r1334和t1336突变以产生spvqrcas9的残基v1134、q1334和r1336。[0890]实施例性的结合pam的spvrercas9的氨基酸序列如下:[0891][0891][0892]在以上序列中,用底线和粗体表示可以从d1134、g1217、r1334和t1336突变以产生spvrercas9的残基v1134、r1217、q1334和r1336。[0893]在一些实施方案中,cas9结构域是重组cas9结构域。在一些实施方案中,重组cas9结构域是spymaccas9结构域。在一些实施方案中,spymaccas9结构域是核酸酶活性的spymaccas9、核酸酶失活的spymaccas9(spymaccas9d)或spymaccas9切口酶(spymaccas9n)。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可结合具有非规范pam的核酸序列。在一些实施方案中,spymaccas9结构域、spcas9d结构域或spcas9n结构域可以结合具有naapam序列的核酸序列。[0894]具有天然5'-naan-3'pam特异性的猕猴链球菌中spycas9的实施例性cas9a同系物的序列是本领域已知的并且例如由jakimo等人描述,(www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf),并在以下提供。[0895]spymaccas9[0896]mdkkysigldigtnsvgwavitddykvpskkfkvlgntdrhsikknligallfgsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkkladstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqiynqlfeenpinasrvdakailsarlsksrrlenliaqlpgekrnglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnseitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgayhdllkiikdkdfldneenediledivltltlfedrgmieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqghslheqianlagspaikkgilqtvkivdelvkvmghkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsfikddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkkteiqtvgqngglfddnpksplevtpsklvplkkelnpkkyggyqkpttaypvllitdtkqlipisvmnkkqfeqnpvkflrdrgyqqvgkndfiklpkytlvdigdgikrlwasskeihkgnqlvvskksqillyhahhldsdlsndylqnhnqqfdvlfneiisfskkcklgkehiqkienvysnkknsasieelaesfikllgftqlgatspfnflgvklnqkqykgkkdyilpctegtlirqsitglyetrvdlskiged。[0897]在一些实施方案中,变体cas9蛋白包括h840a、p475a、w476a、n477a、d1125a、w1126a及d1218a突变,使得多肽切割目标dna或rna的能力降低。此类cas9蛋白切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。作为另一个非限制性实例,在一些实施方案中,变体cas9蛋白含有d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1218a突变,使得多肽切割目标dna的能力降低。此类cas9蛋白切割目标dna(例如,单链目标dna)的能力降低,但保留结合目标dna(例如,单链目标dna)的能力。在一些实施方案中,当变体cas9蛋白包括w476a和w1126a突变或当变体cas9蛋白包括p475a、w476a、n477a、d1125a、w1126a和d1218a突变时,变体cas9蛋白不与pam序列有效结合。因此,在一些此类情况下,当此类变体cas9蛋白用于结合方法时,所述方法不需要pam序列。换言之,在一些实施方案中,当这种变体cas9蛋白用于结合方法中时,所述方法可以包括向导rna,但是所述方法可以在不存在pam序列的情况下进行(并且结合的特异性是因此由向导rna的靶向片段提供)。可以使其他残基突变以实现上述效果(即使一个或其他核酸酶部分失活)。作为非限制性实例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986、和/或a987可以被改变(即,被取代)。此外,丙氨酸取代以外的突变也是合适的。[0898]在一些实施方案中,碱基编辑器的衍生自crispr蛋白的结构域可包括具有规范pam序列(ngg)的cas9蛋白的全部或部分。在其他实施方案中,碱基编辑器的cas9源结构域可采用非规范pam序列。此类序列已在本领域中描述并且对本领域技术人员来说是显而易见的。例如,结合非规范pam序列的cas9结构域已在kleinstiver,b.p.,etal.,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);以及kleinstiver,b.p.,etal.,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015)中描述;其各自的全部内容特此通过引用方式并入。[0899]降低pam排他性的cas9域[0900]通常,cas9蛋白,例如来自化脓链球菌(spcas9)的cas9,需要规范nggpam序列来结合特定的核酸区域,其中“ngg”中的“n”是腺苷(a)、胸苷(t)、或胞嘧啶(c),g是鸟苷。这可能会限制编辑基因组内所需碱基的能力。在一些实施方案中,本文所提供的碱基编辑融合蛋白可能需要放置在精确位置,例如包括位于pam上游的目标碱基的区域。参见例如komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016),其全部内容通过引用方式并入本文。因此,在一些实施方案中,本文所提供的任何融合蛋白可含有能够结合不含有规范(例如,ngg)pam序列的核苷酸序列的cas9结构域。结合非规范pam序列的cas9结构域已在本领域中描述并且对本领域技术人员来说是显而易见的。例如,结合非规范pam序列的cas9结构域已在kleinstiver,b.p.,etal.,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);及kleinstiver,b.p.,etal.,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015)中描述;其各自的全部内容特此通过引用方式并入。[0901]高保真的cas9结构域[0902]本公开的一些方面提供高保真的cas9结构域。在一些实施方案中,高保真cas9结构域是工程化的cas9结构域,其包括与相应的野生型cas9结构域相比减少cas9结构域和dna的糖-磷酸骨架之间的静电相互作用的一个或多个突变。不希望受任何特定理论的束缚,与dna的糖-磷酸酯骨架的静电相互作用减少的高保真cas9结构域可能具有较少的脱靶效应。在一些实施方案中,cas9结构域(例如,野生型cas9结构域)包括降低cas9结构域与dna的糖-磷酸酯骨架之间的关联的一种或多种突变。在一些实施方案中,cas9结构域包括将cas9结构域与dna的糖-磷酸酯骨架之间的关联降低至少1%、至少2%、至少3%、至少4%、至少5%,至少10%,至少15%,至少20%,至少25%,至少30%,至少35%,至少40%,至少45%,至少50%,至少55%、至少60%、至少65%或至少70%。[0903]在一些实施方案中,本文所提供的任何cas9融合蛋白包括n497x、r661x、q695x、和/或q926x突变或本文所提供的任何氨基酸序列中的相应的突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,本文所提供的任何cas9融合蛋白包括n497a、r661a、q695a、和/或q926a突变中的一个或多个,或本文所提供的任何氨基酸序列中的相应的突变。在一些实施方案中,cas9结构域包括d10a突变,或本文所提供的任何氨基酸序列中的相应的突变。具有高保真度的cas9域是本领域已知的并且对本领域技术人员来说是显而易见的。例如,kleinstiver,b.p.,etal.“high-fidelitycrispr-cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.”nature529,490-495(2016);以及slaymaker,i.m.,etal.“rationallyengineeredcas9nucleaseswithimprovedspecificity.”science351,84-88(2015);;其各自的全部内容通过引用方式并入本文。[0904]在一些实施方案中,修饰的cas9是高保真cas9酶。在一些实施方案中,高保真cas9酶是spcas9(k855a)、espcas9(1.1)、spcas9-hf1或超准确cas9变体(hypacas9)。改良的cas9espcas9(1.1)包括丙氨酸取代,其削弱hnh/ruvc凹槽与非目标dna链之间的相互作用,防止链分离和在脱靶位点切割。同样,spcas9-hf1通过破坏cas9与dna磷酸酯骨架相互作用的丙氨酸取代降低脱靶编辑。hypacas9在rec3结构域中包括可增加cas9校对和目标区分的突变(spcas9n692a/m694a/q695a/h698a)。与野生型cas9相比,所有三种高保真酶产生的脱靶编辑更少。[0905]以下提供实施例性高保真度cas9。[0906]相对于cas9的高保真cas9域突变以粗体和底线显示。[0907][0908]包括cas9结构域和胞苷脱氨酶和/或腺苷脱氨酶的融合蛋白[0909]本公开的一些方面提供包括napdnabp(例如,cas9结构域)和一个或多个腺苷脱氨酶、胞苷脱氨酶结构域、和/或dna糖基化酶结构域的融合蛋白。在一些实施方案中,融合蛋白包括cas9结构域和腺苷脱氨酶结构域(例如,tada*a)。应当理解,cas9结构域可以是本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)。在一些实施方案中,本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)可以与本文所提供的任何胞苷脱氨酶和/或腺苷脱氨酶(例如,tada*a)融合。例如但不限于,在一些实施方案中,融合蛋白包括以下结构:[0910]nh2-[胞苷脱氨酶]-[cas9结构域]-[腺苷脱氨酶]-cooh;[0911]nh2-[腺苷脱氨酶]-[cas9结构域]-[胞苷脱氨酶]-cooh;[0912]nh2-[腺苷脱氨酶]-[胞苷脱氨酶]-[cas9结构域]-cooh;[0913]nh2-[胞苷脱氨酶]-[腺苷脱氨酶]-[cas9结构域]-cooh;[0914]nh2-[cas9结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-cooh;[0915]nh2-[cas9结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-cooh;[0916]nh2-[腺苷脱氨酶]-[cas9结构域]-cooh;[0917]nh2-[cas9结构域]-[腺苷脱氨酶]-cooh;[0918]nh2-[胞苷脱氨酶]-[cas9结构域]-cooh;或[0919]nh2-[cas9结构域]-[胞苷脱氨酶]-cooh。[0920]在一些实施方案中,包括胞苷脱氨酶、无碱基编辑器和腺苷脱氨酶及napdnabp(例如cas9结构域)的融合蛋白不包括连接子序列。在一些实施方案中,在胞苷脱氨酶和/或腺苷脱氨酶结构域与napdnabp之间存在连接子。在一些实施方案中,以上通用架构中使用的“‑”表示可任选连接子的存在。在一些实施方案中,胞苷脱氨酶和腺苷脱氨酶及napdnabp经由本文所提供的任何连接子融合。例如,在一些实施方案中,胞苷脱氨酶和/或腺苷脱氨酶和napdnabp经由本文所提供的任何连接子融合。[0921]包括核定位序列的融合蛋白(nls)[0922]在一些实施方案中,本文所提供的融合蛋白进一步包括一个或多个(例如,2、3、4、5个)核靶向序列,例如核定位序列(nls)。在一个实施方案中,使用二分nls。在一些实施方案中,nls包括促进包括nls的蛋白质输入细胞核(例如,通过核转运)的氨基酸序列。在一些实施方案中,本文所提供的任何融合蛋白进一步包括核定位序列(nls)。在一些实施方案中,nls与融合蛋白的n端融合。在一些实施方案中,nls与融合蛋白的c端融合。在一些实施方案中,nls与cas9结构域的n端融合。在一些实施方案中,nls与ncas9结构域或dcas9结构域的c端融合。在一些实施方案中,nls与脱氨酶的n端融合。在一些实施方案中,nls与脱氨酶的c端融合。在一些实施方案中,nls经由一个或多个连接子与融合蛋白融合。在一些实施方案中,nls在没有连接子的情况下与融合蛋白融合。在一些实施方案中,nls包括本文所提供或提及的nls序列的任一个的氨基酸序列。额外的核定位序列是本领域已知的并且对本领域技术人员来说是显而易见的。例如,plank等人,pct/ep2000/011690中描述了nls序列,其内容通过引用方式并入本文中,因为它们公开了实施例性核定位序列。在一些实施方案中,nls包括氨基酸序列pkkkrkvegadkrtadgsefespkkkrkv、krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprkpkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0923]在一些实施方案中,nls存在于连接子中或连接子是在nls的侧边,例如本文所述连接子。在一些实施方案中,n端或c端nls是二分nls。二分nls包括两个基本氨基酸簇,其是由相对短的间隔序列分隔(因此二分-2部分,而单部分nls不是)。核质蛋白的nls、kr[paatkkagqa]kkkk是无处不在的二分信号的原型:由大约10个氨基酸的间隔隔开的两个碱性氨基酸簇。实施例性二分nls的序列如下:[0924]pkkkrkvegadkrtadgsefespkkkrkv[0925]在一些实施方案中,本发明的融合蛋白不包括连接子序列。在一些实施方案中,存在一个或多个结构域或蛋白质之间的连接子序列。在一些实施方案中,具有腺苷脱氨酶或胞苷脱氨酶和cas9结构域的实施例性cas9融合蛋白的一般结构包括以下结构中的任一种,其中nls是核定位序列(例如,本文所提供的任何nls),nh2是融合蛋白的n端,cooh是融合蛋白的c端:[0926]nh2-nls-[腺苷脱氨酶]-[cas9结构域]-cooh;[0927]nh2-nls[cas9结构域]-[腺苷脱氨酶]-cooh;[0928]nh2-[腺苷脱氨酶]-[cas9结构域]-nls-cooh;[0929]nh2-[cas9结构域]-[腺苷脱氨酶]-nls-cooh;[0930]nh2-nls-[胞苷脱氨酶]-[cas9结构域]-cooh;[0931]nh2-nls[cas9结构域]-[胞苷脱氨酶]-cooh;[0932]nh2-[胞苷脱氨酶]-[cas9结构域]-nls-cooh;或[0933]nh2-[cas9结构域]-[胞苷脱氨酶]-nls-cooh。[0934]应当理解,本公开的融合蛋白可以包括一个或多个附加特征。例如,在一些实施方案中,融合蛋白可包括抑制剂、细胞质定位序列、输出序列(诸如核输出序列)或其他定位序列,以及可用于溶解、纯化或检测融合蛋白的序列标签。本文所提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(biotincarboxylasecarrierprotein,bccp)标签、myc标签、钙调蛋白标签、flag标签、血凝素(ha)标签、多组氨酸标签(也称为组氨酸标签或his-标签)、麦芽糖结合蛋白(maltosebindingprotein,mbp)标签、nus标签、谷胱甘肽-s-转移酶(gst)-标签、绿色荧光蛋白(gfp)标签、硫氧还蛋白标签、s-标签、softag(例如,softag1、softag3)、链标签(strep-tag)、生物素连接酶标签、flash标签、v5标签和sbp标签。额外合适的序列对本领域技术人员来说是显而易见的。在一些实施方案中,融合蛋白包括一个或多个his标签。[0935]可以使用编码包括一个或多个核定位序列(nls)的crispr酶的载体。例如,可以使用或使用约1、2、3、4、5、6、7、8、9、10个nls。crispr酶可包括位于或靠近氨端的nls,约或多于约1、2、3、4、5、6、7、8、9、10个位于或靠近羧基端的nls,或任何这些的组合(例如,在氨基末端的一个或多个nls和在羧基端的一个或多个nls)。当存在超过一个的nls时,各nls可以独立于其他选择,使得单个nls可以存在于超过一个的副本中和/或与一个或多个其他nls存在于一个或多个副本中。[0936]方法中使用的crispr酶可包括约6个nls。当与nls最接近的氨基酸在沿着自n端或c端算起的多肽链约50个氨基酸内,例如在1、2、3、4、5、10、15、20、25、30、40或50个氨基酸内时,nls被认为接近n端或c端。[0937]核碱基编辑结构域[0938]本文描述包括融合蛋白的碱基编辑器,所述融合蛋白包括多核苷酸可编程的核苷酸结合结构域和核碱基编辑结构域(例如,脱氨酶结构域)。碱基编辑器可以被编程以通过与能够识别目标序列的向导多核苷酸相互作用来编辑目标多核苷酸序列中的一个或多个碱基。一旦识别了目标序列,碱基编辑器就锚定在要进行编辑的多核苷酸上,然后碱基编辑器的脱氨酶结构域组分可以编辑目标碱基。[0939]在一些实施方案中,核碱基编辑结构域包括脱氨酶结构域。如本文特别描述的,脱氨酶结构域包括胞嘧啶脱氨酶或腺苷脱氨酶。在一些实施方案中,术语“胞嘧啶脱氨酶”和“胞苷脱氨酶”可以互换使用。在一些实施方案中,术语“腺嘌呤脱氨酶”和“腺苷脱氨酶”可以互换使用。核碱基编辑蛋白的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中有描述,其各自通过引用方式整体并入本文。另参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用方式并入本文。[0940]a至g编辑[0941]在一些实施方案中,本文所述碱基编辑器可包括包含腺苷脱氨酶的脱氨酶结构域。碱基编辑器的这种腺苷脱氨酶结构域可以通过将a脱氨形成的具有g的碱基配对特性肌苷(i)来促进将腺嘌呤(a)核碱基编辑为鸟嘌呤(g)核碱基肌苷(i)。腺苷脱氨酶能够将脱氧核糖核酸(dna)中的脱氧腺苷残基的腺嘌呤脱氨(即,除去胺基团)。[0942]在一些实施方案中,本文所提供的核碱基编辑器可以通过将一个或多个蛋白质结构域融合在一起来制备,从而产生融合蛋白。在某些实施方案中,本文所提供的融合蛋白包括一种或多种改善融合蛋白的碱基编辑活性(例如,效率、选择性和特异性)的特征。例如,本文所提供的融合蛋白可包括核酸酶活性降低的cas9结构域。在一些实施方案中,本文所提供的融合蛋白可具有不具有核酸酶活性的cas9结构域(dcas9),或切割双链dna分子的一条链的cas9结构域(称为cas9切口酶(ncas9))。不希望受任何特定理论的束缚,催化残基(例如,h840)的存在保持了cas9切割含有与靶向的a相对的t的非编辑(例如,非脱氨)链的活性。cas9的催化残基(例如,d10至a10)的突变防止切割包括靶向的a残基的编辑链的切割。此类cas9变体能够基于grna定义的目标序列在特定位置产生单链dna断裂(缺口),导致修复未编辑的链,最终导致非编辑链上的t到c变化。在一些实施方案中,a至g碱基编辑器进一步包括肌苷碱基切除修复抑制剂,例如尿嘧啶糖基化酶抑制剂(ugi)结构域或催化失活的肌苷特异性核酸酶。不希望受任何特定理论的束缚,ugi结构域或催化失活的肌苷特异性核酸酶可以抑制或阻止脱氨腺苷残基(例如肌苷)的碱基切除修复,其可以提高碱基编辑器的活性或效率。[0943]包括腺苷脱氨酶的碱基编辑器可作用于任何多核苷酸,包括dna、rna及dna-rna杂交体。在某些实施方案中,包括腺苷脱氨酶的碱基编辑器可以使包括rna的多核苷酸的靶向的a脱氨。例如,碱基编辑器可以包括能够使rna多核苷酸和/或dna-rna杂合多核苷酸的靶向的a脱氨的腺苷脱氨酶结构域。在一个实施方案中,掺入碱基编辑器的腺苷脱氨酶包括作用于rna(adar,例如adar1或adar2)的全部或部分腺苷脱氨酶。在另一个实施方案中,掺入碱基编辑器的腺苷脱氨酶包括作用于trna(adat)的全部或部分腺苷脱氨酶。包括腺苷脱氨酶结构域的碱基编辑器也能够使dna多核苷酸的a核碱基脱氨。在一个实施方案中,碱基编辑器的腺苷脱氨酶结构域包括adat的全部或一部分,所述adat包括一个或多个允许使其对dna中的目标a脱氨的突变。例如,碱基编辑器可包括来自大肠杆菌的adat(ectada)的全部或部分,其包括一个或多个以下突变:d108n、a106v、d147y、e155v、l84f、h123y、i156f,或另一腺苷脱氨酶。[0944]腺苷脱氨酶可以衍生自任何合适的生物体(例如,大肠杆菌)。在一些实施方案中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括对应于本文所提供的任何突变(例如,ectada中的突变)的一个或多个突变。任何同源蛋白质中的相应残基可以通过例如序列比对和同源残基的测定来识别。可以相应地产生对应于本文所述的任何突变(例如,在ectada中识别的任何突变)的任何天然存在的腺苷脱氨酶(例如,与ectada具有同源性)中的突变。[0945]腺苷脱氨酶[0946]在一些实施方案中,本文所述碱基编辑器可包括脱氨酶结构域,其包括腺苷脱氨酶。碱基编辑器的这种腺苷脱氨酶结构域可以通过将a脱氨以形成显示g的碱基配对特性肌苷(i)来促进将腺嘌呤(a)核碱基编辑为鸟嘌呤(g)核碱基。腺苷脱氨酶能够将脱氧核糖核酸(dna)中的脱氧腺苷残基的腺嘌呤脱氨(即,除去胺基团)。[0947]在一些实施方案中,本文所提供的腺苷脱氨酶能够使腺嘌呤脱氨。在一些实施方案中,本文所提供的腺苷脱氨酶能够使dna脱氧腺苷残基中的腺嘌呤脱氨。在一些实施方案中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括对应于本文所提供的任何突变的一个或多个突变(例如,ectada中的突变)的突变。本领域技术人员将能够识别任何同源蛋白质中的相应残基,例如通过序列比对和同源残基的确定。因此,本领域技术人员将能够在任何天然存在的腺苷脱氨酶(例如,与ectada具有同源性)中产生对应于本文所述任何突变(例如,在ectada中识别的任何突变)的突变。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[0948]本发明提供具有提高的效率(》50至60%)和特异性的腺苷脱氨酶变体。特别地,本文所述腺苷脱氨酶变体更有可能编辑多核苷酸内的所需碱基,并且不太可能编辑不意欲改变的碱基(即,“旁观者”)。[0949]在特定实施方案中,tada是pct/us2017/045381(wo2018/027078)中描述的tada中的任一个,其通过引用方式整体并入本文。[0950]在一些实施方案中,本发明的核碱基编辑器是包括以下序列改变的腺苷脱氨酶变体:[0951]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd(也称为tada*7.10)。[0952]在特定实施方案中,融合蛋白包括单个(例如,作为单体提供)tada*8变体。在一些实施方案中,tada*8与cas9切口酶连接。在一些实施方案中,本发明的融合蛋白包括与tada*8变体连接的野生型tada(tada(wt))的异源二聚体。在其他实施方案中,本发明的融合蛋白包括与tada*8变体连接的tada*7.10的异源二聚体。在一些实施方案中,碱基编辑器是包括tada*8变体单体的abe8。在一些实施方案中,碱基编辑器是包括tada*8变体和tada(wt)的异源二聚体的abe8。在一些实施方案中,碱基编辑器是包括tada*8变体和tada*7.10的异源二聚体的abe8。在一些实施方案中,碱基编辑器是包括tada*8变体的异源二聚体的abe8。在一些实施方案中,tada*8变体是选自表7。在一些实施方案中,abe8是选自表7。相关序列如下:[0953]野生型tada(tada(wt))或“tada参考序列”[0954]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd(seqidno:2)[0955]tada*7.10:[0956]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0957]在一些实施方案中,腺苷脱氨酶包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与本文所提供的任何腺苷脱氨酶中所载的任一个氨基酸序列相同。应当理解,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供具有一定百分比同一性的任何脱氨酶结构域加上本文所述任何突变或其组合。在一些实施方案中,腺苷脱氨酶包括与参考序列或本文所提供的任何腺苷脱氨酶相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,与本领域已知或本文所述任一个氨基酸序列相比,腺苷脱氨酶包括具有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少有170个相同的连续氨基酸残基。[0958]在一些实施方案中,tada脱氨酶是全长大肠杆菌tada脱氨酶。例如,在某些实施方案中,腺苷脱氨酶包括氨基酸序列:[0959]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd.[0960]然而,应当理解,可用于本技术的额外腺苷脱氨酶对于本领域技术人员是显而易见的并且在本公开的范畴内。例如,腺苷脱氨酶可以是作用于trna的腺苷脱氨酶(adat)的同源物。非限制性地,实施例性adat同源物的氨基酸序列包括以下者:[0961]金黄色葡萄球菌tada:[0962]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0963]枯草芽孢杆菌tada:[0964]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0965]鼠伤寒沙门氏菌tada:[0966]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0967]腐败希瓦氏菌tada:[0968]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0969]流感嗜血杆菌f3031tada:[0970]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0971]新月柄杆菌tada:[0972]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0973]硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))tada:[0974]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0975]大肠杆菌tada(ectada)的一个实施方案包括以下者:[0976]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0977]在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[0978]在一个实施方案中,本发明的融合蛋白包括与tada7.10连接的野生型tada,其与cas9切口酶连接。在特定实施方案中,融合蛋白包括单个tada7.10结构域(例如,作为单体提供)。在其他实施方案中,abe7.10编辑器包括能够形成异源二聚体的tada7.10和tada(wt)。[0979]在一些实施方案中,腺苷脱氨酶包括本文所提供的任何腺苷脱氨酶中所载任一个氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与相同。应当理解,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供具有一定百分比同一性的任何脱氨酶结构域加上本文所述任何突变或其组合。在一些实施方案中,腺苷脱氨酶包括与参考序列或本文所提供的任何腺苷脱氨酶相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50有个或更多个突变。在一些实施方案中,腺苷脱氨酶包括与本领域已知或本文所述任一氨基酸序列相比,具有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少有170个相同的连续氨基酸残基。[0980]应当理解,本文所提供的任何突变(例如,基于tada参考序列)可以引入其他腺苷脱氨酶,诸如大肠杆菌tada(ectada)、金黄色葡萄球菌tada(satada)或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。对于本领域技术人员显而易见的是,可以类似地比对额外的脱氨酶以识别可以如本文所提供的突变的同源氨基酸残基。因此,可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如,ectada)中进行在tada参考序列中识别的任何突变。还应当理解,本文所提供的任何突变可以单独或以任何组合在tada参考序列或另一种腺苷脱氨酶中进行。应当理解,tada变体中的氨基酸取代是在tada参考序列(seqidno:2)中编号,并且可以是在具有同源氨基酸残基的任何其他tada变体中的相应的氨基酸取代或位置。应当理解,各别序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案;与tada参考序列共享同源性的tada变体中的编号可能不同,物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法(例如通过序列比对和同源残基的测定)识别任何同源蛋白质和各别编码核酸中的各别残基。[0981]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的d108x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括d108g、d108n、d108v、d108a或d108y突变,或另一腺苷脱氨酶中的相应的突变。[0982]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a106x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a106v突变,或另一种腺苷脱氨酶(例如,野生型tada或ectada)中的相应的突变。[0983]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e155x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x的存在表示除了野生型中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e155d、e155g或e155v突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[0984]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的d147x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x的存在表示除了野生型中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的d147y突变或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[0985]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a106x、e155x或d147x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括e155d、e155g或e155v突变。在一些实施方案中,腺苷脱氨酶包括d147y。[0986]例如,腺苷脱氨酶可以在tada参考序列中包括d108n、a106v、e155v、和/或d147y突变,或在另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的以下群组的突变(群组的突变“;”分隔),或另一种腺苷脱氨酶(例如,ectada)中的相应的突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n、a106v和e155v;d108n、a106v和d147y;d108n、e155v和d147y;a106v、e155v和d147y;和d108n、a106v、e155v及d147y。然而,应当理解,本文所提供的相应的突变的任何组合可以在腺苷脱氨酶(例如,ectada)中进行。[0987]在一些实施方案中,腺苷脱氨酶包括以下tada参考序列中的中的h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、k110x、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x突变中的一个或多个,或另一种腺苷脱氨酶(例如ectada)中的一个或多个相应的突变,其中x的存在表示除了野生型腺苷脱氨酶中的相应的氨基酸的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e或a56s、e59g、e85k或e85g、m94l、i95l、v102a、f104l、a106v、r107c或r107h、或r107p、d108g、或d108n、或d108v、或d108a、或d108y、k110i、m118k、n127s、a138v、f149y、m151v、r153c、q1565d和/或k157r突变中的一个或多个、或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[0988]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8x、d108x、和/或n127x突变中的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中x表示存在任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的一个或多个h8y、d108n、和/或n127s突变,或另一个腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[0989]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8x、r26x、m61x、l68x、m70x、a106x、d108x、a109x、n127x、d147x、r152x、q154x、e155x、k161x、q161x、q161x、q161x、q161x/t中的一个或多个突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中x表示除了存在除野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、r26w、m61i、l68q、m70v、a106t、d108n、a109t、n127s、d147y、r152c、q154h或q154r、e155g、或e155v、或e155d、k161q、q163h和/或t166p突变中的一个或多个,或另一种腺苷脱氨酶(例如ectada)中的一个或多个相应的突变。[0990]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8x、d108x、n127x、d147x、r152x及q154x组成的群组的一个、两个、三个、四个、五个或六个突变或在另一种腺苷脱氨酶(例如,ectada)中一个或多个相应的突变,其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括选自由tada参考序列中的h8x、m61x、m70x、d108x、n127x、q154x、e155x及q163x所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变是,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变或突变,其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶tada参考序列中包括一个、两个、三个、四个或五个选自由h8x、d108x、n127x、e155x和t166x所组成的群组的突变,或另一腺苷脱氨酶中的一个或多个相应的突变脱氨酶(例如,ectada),其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。[0991]在一些实施方案中,腺苷脱氨酶包括选自由h8x、a106x、d108x所组成的群组的一个、两个、三个、四个、五个或六个突变、另一种腺苷脱氨酶中的一个或多个突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括选自由h8x、r26x、l68x、d108x、n127x、d147x和e155x所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶中的一个或多个相应的突变,其中x表示存在除了野生型腺苷脱氨酶中相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8x、d108x、a109x、n127x和e155x所组成的群组的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶中的一个或多个相应的突变脱氨酶(例如,ectada),其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。[0992]在一些实施方案中,腺苷脱氨酶包括tada参考序列的选自由h8y、d108n、n127s、d147y、r152c和q154h所组成的组中的一个、两个、三个、四个、五个或六个突变,或在另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包括选自由h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8y、d108n、n127s、e155v和t166p所组成的群组的一个、两个、三个、四个或五个突变,或另一种脱氨酶腺苷(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8y、a106t、d108n、n127s、e155d和k161q所组成的群组中的一个、两个、三个、四个、五个或六个突变,或在另一种腺苷脱氨酶(例如,ectada)中的相应的一个或多个突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包括选自由h8y、r26w、l68q、d108n、n127s、d147y和e155v所组成的群组中的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8y、d108n、a109t、n127s和e155g所组成的群组中的一个、两个、三个、四个或五个突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[0993]本文所提供的任何突变和任何额外的突变(例如,基于ectada氨基酸序列)可以被引入到任何其他腺苷脱氨酶中。本文所提供的任何突变可以单独或以任何组合在tada参考序列或另一种腺苷脱氨酶(例如,ectada)中进行。[0994]a至g核碱基编辑蛋白的详细信息在国际pct申请号pct/2017/045381(wo2018/027078)和gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature,551,464-471(2017),其全部内容通过引用方式并入本文。[0995]在一些实施方案中,腺苷脱氨酶包括另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的d108n、d108g或d108v突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a106v和d108n突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r107c和d108n突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、d108n、n127s、d147y和q154h突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、d108n、n127s、d147y和e155v突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的d108n、d147y和e155v突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、d108n和n127s突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a106v、d108n、d147y和e155v突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[0996]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的s2x、h8x、i49x、l84x、h123x、n127x、i156x和/或k160x突变中的一个或多个,或另一种腺苷脱氨酶中的一个或多个相应的突变,其中存在x表示除了野生型腺苷脱氨酶中相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的s2a、h8y、i49f、l84f、h123y、n127s、i156f和/或k160s突变中的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[0997]在一些实施方案中,腺苷脱氨酶包括l84x突变腺苷脱氨酶,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的l84f突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[0998]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h123x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h123y突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[0999]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的i156x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的i156f突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1000]在一些实施方案中,腺苷脱氨酶在tada参考序列中包括选自由l84x、a106x、d108x、h123x、d147x、e155x和i156x组成的群组的一个、两个、三个、四个、五个、六个或七个突变,或另一种腺苷脱氨酶(例如ectada)中的一个或多个相应的突变,其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包括选自由s2x、i49x、a106x、d108x、d147x和e155x所组成的群组的一个、两个、三个、四个、五个或六个突变,或在另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8x、a106x、d108x、n127x及k160x所组成的群组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中x表示存在除野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。[1001]在一些实施方案中,腺苷脱氨酶在tada参考序列中包括选自由l84f、a106v、d108n、h123y、d147y、e155v及i156f所组成的群组中的一个、两个、三个、四个、五个、六个或七个突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由s2a、i49f、a106v、d108n、d147y和e155v所组成的群组中的一个、两个、三个、四个、五个或六个突变。[1002]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的选自由h8y、a106t、d108n、n127s和k160s所组成的群组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[1003]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e25x、r26x、r107x、a142x、和/或a143x突变中的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中存在x表示除了野生型腺苷脱氨酶中相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s、e25y、r26g、r26n、r26q、r26c、r26l、r26k、r107p、r107k、r107w、r107h、r107s、a142n、a142d、a142g、a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变中的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶包括一个或多个本文所述相应于tada参考序列的突变,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[1004]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e25x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s或e25y突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1005]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r26x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r26g、r26n、r26q、r26c、r26l或r26k突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1006]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r107x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r107p、r107k、r107a、r107n、r107w、r107h或r107s突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1007]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a142x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a142n、a142d、a142g突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1008]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a143x突变,或另一腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或另一种腺苷脱氨酶(例如ectada)中的相应的突变。[1009]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h36x、n37x、p48x、i49x、r51x、m70x、n72x、d77x、e134x、s146x、q154x、k157x、和/或k161x的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变,其中x表示存在除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h36l、n37t、n37s、p48t、p48l、i49v、r51h、r51l、m70l、n72s、d77g、e134g、s146r、s146c、q154h、、k157h、和/或k161t突变中的一个或多个,或另一种腺苷脱氨酶(例如,ectada)中的一个或多个相应的突变。[1010]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h36x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h36l突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1011]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的n37x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的n37t或n37s突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1012]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的p48x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的p48t或p48l突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1013]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r51x突变,或另一种腺苷脱氨酶中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r51h或r51l突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1014]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的s146x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的s146r或s146c突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1015]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的k157x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的k157n突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1016]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的p48x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的p48s、p48t或p48a突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1017]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a142x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的a142n突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1018]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的w23x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的w23r或w23l突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1019]在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r152x突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变,其中x表示除了野生型腺苷脱氨酶中的相应的氨基酸之外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的r152p或r52h突变,或另一种腺苷脱氨酶(例如,ectada)中的相应的突变。[1020]在一个实施方案中,腺苷脱氨酶可包括突变h36l、r51l、l84f、a106v、d108n、h123y、s146c、d147y、e155v、i156f和k157n。在一些实施方案中,腺苷脱氨酶包括以下相对于tada参考序列的突变组合,其中每个突变组合是由“_”分隔,并且每个突变组合在括号之间:[1021](a106v_d108n)、[1022](r107c_d108n)、[1023](h8y_d108n_n127s_d147y_q154h)、[1024](h8y_d108n_n127s_d147y_e155v)、[1025](d108n_d147y_e155v)、[1026](h8y_d108n_n127s)、[1027](h8y_d108n_n127s_d147y_q154h)、[1028](a106v_d108n_d147y_e155v),[1029](d108q_d147y_e155v),[1030](d108m_d147y_e155v)、[1031](d108l_d147y_e155v)、[1032](d108k_d147y_e155v)、[1033](d108i_d147y_e155v),[1034](d108f_d147y_e155v)、[1035](a106v_d108n_d147y)、[1036](a106v_d108m_d147y_e155v),[1037](e59a_a106v_d108n_d147y_e155v)、[1038](e59acatdead_a106v_d108n_d147y_e155v)、[1039](l84f_a106v_d108n_h123y_d147y_e155v_i156y)、[1040](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1041](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f),[1042](e25g_r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v[1043]_i156f)、(e25d_r26g_l84f_a106v_r107k_d108n_h123y_a142n_a143g_d147y_e155v_[1044]i156f)、[1045](r26q_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1046](e25m_r26g_l84f_a106v_r107p_d108n_h123y_a142n_a143d_d147y_e155v[1047]_i156f)、[1048](r26c_l84f_a106v_r107h_d108n_h123y_a142n_d147y_e155v_i156f)、(l84f_a106v_d108n_h123y_a142n_a143l_d147y_e155v_i156f)、[1049](r26g_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1050](e25a_r26g_l84f_a106v_r107n_d108n_h123y_a142n_a143e_d147y_e155v[1051]_i156f)、[1052](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[1053](a106v_d108n_a142n_d147y_e155v)、[1054](r26g_a106v_d108n_a142n_d147y_e155v)、[1055](e25d_r26g_a106v_r107k_d108n_a142n_a143g_d147y_e155v)、[1056](r26g_a106v_d108n_r107h_a142n_a143d_d147y_e155v)、[1057](e25d_r26g_a106v_d108n_a142n_d147y_e155v)、[1058](a106v_r107k_d108n_a142n_d147y_e155v)、[1059](a106v_d108n_a142n_a143g_d147y_e155v)、[1060](a106v_d108n_a142n_a143l_d147y_e155v)、[1061](h36l_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1062](n37t_p48t_m70l_l84f_a106v_d108n_h123y_d147y_i49v_e155v_i156f)、[1063](n37s_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k161t)、[1064](h36l_l84f_a106v_d108n_h123y_d147y_q154h_e155v_i156f)、[1065](n72s_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f)、[1066](h36l_p48l_l84f_a106v_d108n_h123y_e134g_d147y_e155v_i156f)、[1067](h36l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、(h36l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f)、[1068](l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1069](n37s_r51h_d77g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1070](r51l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、[1071](d24g_q71r_l84f_h96l_a106v_d108n_h123y_d147y_e155v_i156f_k160e)、[1072](h36l_g67v_l84f_a106v_d108n_h123y_s146t_d147y_e155v_i156f)、[1073](q71l_l84f_a106v_d108n_h123y_l137m_a143e_d147y_e155v_i156f)、[1074](e25g_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、[1075](l84f_a91t_f104i_a106v_d108n_h123y_d147y_e155v_i156f)、[1076](n72d_l84f_a106v_d108n_h123y_g125a_d147y_e155v_i156f)、[1077](p48s_l84f_s97c_a106v_d108n_h123y_d147y_e155v_i156f)、[1078](w23g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1079](d24g_p48l_q71r_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l),[1080](l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1081](h36l_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f[1082]_k157n)、(n37s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_k161t),[1083](l84f_a106v_d108n_d147y_e155v_i156f)、[1084](r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k161t),[1085](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k161t)、[1086](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e_k161t),[1087](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e)、[1088](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1089](r74a_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1090](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1091](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1092](l84f_r98q_a106v_d108n_h123y_d147y_e155v_i156f)、[1093](l84f_a106v_d108n_h123y_r129q_d147y_e155v_i156f)、[1094](p48s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1095](p48s_a142n)、[1096](p48t_i49v_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_l157n),[1097](p48t_i49v_a142n)、[1098](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1099](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f[1100](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1101](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[1102](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1103](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[1104](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f_k157n)、[1105](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1106](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1107](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1108](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152h_e155v_i156f_k157n)、[1109](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1110](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1111](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_e155v[1112]_i156f_k157n)、[1113](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_r152p_e155v_i156f_k157n)、[1114](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1115](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1116](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_r152p_e155v[1117]_i156f_k157n)。[1118]在某些实施方案中,本文所提供的融合蛋白包括一种或多种改善融合蛋白的碱基编辑活性的特征。例如,本文所提供的任何融合蛋白可以包括具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可具有不具有核酸酶活性的cas9结构域(dcas9),或切割双链dna分子的一条链的cas9结构域(称为cas9切口酶(ncas9))。[1119]在一些实施方案中,腺苷脱氨酶是tada*7.10。在一些实施方案中,tada*7.10包括至少一种改变。在特定实施方案中,tada*7.10包括对tada*7.10的以下一个或多个改变或额外改变:y147t、y147r、q154s、y123h、v82s、t166r及q154r。改变y123h在本文中也称为h123h(tada*7.10中的改变h123y回复成y123h(wt))。在其他实施方案中,tada*7.10包括选自由以下群组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。在特定实施方案中,腺苷脱氨酶变体包括从残基149、150、151、152、153、154、155、156和157开始的c端缺失。[1120]在一些实施方案中,tada变体包括至少一个相对于tada7.10的至少一个改变。在一些实施方案中,tada变体包括至少一个相对于野生型tada的至少一个改变。tada变体中的氨基酸改变可以是本文所述相对于tada7.10或野生型tada的任何一种氨基酸取代。在一些实施方案中,tada变体(例如tada8)在氨基酸位置23、26、36、37、48、49、51、72、84、87、105、108、123、125、142、145、147、152、152、116、157、161或其任何组合包括氨基酸改变。在一些实施方案中,tada变体包括相对于tada7.10的氨基酸改变v82x,其中x是除了v之外的任何氨基酸。在一些实施方案中,tada变体包括相对于tada7.10的v82s改变。在一些实施方案中,氨基酸x是酸性氨基酸、碱性氨基酸或中性氨基酸。在一些实施方案中,tada变体包括相对于tada7.10的氨基酸改变t166x,其中x是除了t之外的任何氨基酸。在一些实施方案中,氨基酸x是酸性氨基酸、碱性氨基酸或中性氨基酸酸。在一些实施方案中,tada变体包括相对于tada7.10氨基酸改变v82x、y147x、q154x、i76x、y123x、r23x、l36x、a48x、l51x、f84x、v106x、n108x、y123x、c146x、y147x、p152x、q154x、v155x、f156x、n157x、t166x或其任何组合,其中x是除了tada7.10中的氨基酸之外的任何氨基酸。在一些实施方案中,x是酸性氨基酸、碱性氨基酸或中性氨基酸。在一些实施方案中,x将tada参考序列中的氨基酸回复成野生型氨基酸。[1121]在其他实施方案中,本发明的碱基编辑器是包括腺苷脱氨酶变体(例如tada*8)的单体,所述腺苷脱氨酶变体包括与tada*7.10或参考tada序列相比一个或多个以下改变:y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r。在其他实施方案中,腺苷脱氨酶变体(tada*8)是包括选自由以下群组的改变的单体:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。在其他实施方案中,碱基编辑器是包括野生型腺苷脱氨酶和腺苷脱氨酶变体(例如,tada*8)的异源二聚体,所述腺苷脱氨酶变体包括一个或多个以下改变y147t、y147r、q154s、y123h、v82s、t166r、和/或q154r。在其他实施方案中,碱基编辑器是包括tada*7.10结构域和腺苷脱氨酶变体结构域(例如tada*8)的异源二聚体,所述腺苷脱氨酶变体包括选自由下组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[1122]在一个实施方案中,腺苷脱氨酶是tada*8,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1123]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[1124]在一些实施方案中,tada*8是截短的。在一些实施方案中,截短的tada*8相对于全长tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实方案中,截短的tada*8相对于全长tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长tada*8。[1125]在一些实施方案中,tada*8是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23、tada*8.24。[1126]在一个实施方案中,本发明的融合蛋白包括与与cas9切口酶连接的本文所述腺苷脱氨酶变体(例如,tada*8)连接的野生型tada。在特定实施方案中,融合蛋白包括单个tada*8结构域(例如,作为单体提供)。在其他实施方案中,碱基编辑器包括能够形成异源二聚体的tada*8和tada(wt)。实施例性序列如下:[1127]tada(野生型):[1128]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[1129]tada*7.10:[1130]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[1131]tada*8:[1132]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd.[1133]在一些实施方案中,腺苷脱氨酶包括与本文所提供的任何腺苷脱氨酶中所载的任何一个氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供具有一定百分比同一性的任何脱氨酶结构域加上本文所述任何突变或其组合。在一些实施方案中,腺苷脱氨酶包括具有与参考序列或本文所提供的任何腺苷脱氨酶相比1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,腺苷脱氨酶包括具有与本领域已知或本文所述任一氨基酸序列相比至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少有170个相同的连续氨基酸残基。[1134]在特定实施方案中,tada*8在以下以粗体显示的任何位置包括一个或多个突变。在其他实施方案中,tada*8在以底线所示的任何位置包括一个或多个突变:[1135][1136]例如,tada*8包括单独的氨基酸位置82和/或166(例如v82s、t166r)或其与以下y147t、y147r、q154s、y123h、和/或q154r中的任何一个或多个的组合的改变。在特定实施方案中,改变的组合是选自由以下所组成的群组:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;及i76y+v82s+y123h+y147r+q154r。[1137]在一些实施方案中,腺苷脱氨酶是tada*8,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1138][1139]在一些实施方案中,tada*8是截短的。在一些实施方案中,截短的tada*8相对于全长tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,截短的tada*8相对于全长tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或,20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长tada*8。[1140]在一个实施方案中,本发明的融合蛋白包括与与cas9切口酶连接的本文所述腺苷脱氨酶变体(例如,tada*8)连接的野生型tada。在特定实施方案中,融合蛋白包括单个tada*8结构域(例如,作为单体提供)。在其他实施方式中,碱基编辑器包括能够形成异源二聚体的tada*8和tada(wt)。[1141]在一些实施方案中,腺苷脱氨酶等位基因(例如tada等位基因)的合成库可用于产生具有修饰的碱基编辑效率和/或特异性的腺苷碱基编辑器。在一些实施方案中,从合成文库产生的腺苷碱基编辑器包括更高的碱基编辑效率和/或特异性。在一些实施方案中,与具有野生型tada腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器表现出增加的碱基编辑效率、增加的碱基编辑特异性、减少的脱靶编辑、减少的旁观者编辑、减少的插入缺失形成、和/或减少的虚假编辑。在一些实施方案中,与具有tada*7.10腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器表现出增加的碱基编辑效率、增加的碱基编辑特异性、减少的脱靶编辑、减少的旁观者编辑、减少的插入缺失形成、和/或减少的虚假编辑。在一些实施方案中,合成文库包括abe的随机化tada部分。在一些实施方案中,合成文库在tada的每个位置包括所有20个标准氨基酸取代。在一些实施方案中,合成文库包括每个文库成员1至2个核苷酸取代突变的平均频率。在一些实施方案中,合成文库包括在tada*7.10中发现的背景突变。[1142]在一些实施方案中,本文所述碱基编辑系统包括具有插入cas9中的tada的abe。提供具有插入cas9的tada的相关abe的序列。[1143]101cas9tadains1015[1144]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1145]102cas9tadains1022[1146]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1147]103cas9tadains1029[1148]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1149]103cas9tadains1040[1150]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1151]105cas9tadains1068[1152]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdtgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1153]106cas9tadains1247[1154]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1155]107cas9tadains1054[1156]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1157]108cas9tadains1026[1158]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaksegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1159]109cas9tadains768[1160]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1161]110.1cas9tadains1250[1162]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1163]110.2cas9tadains1250[1164]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1165]110.3cas9tadains1250[1166]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1167]110.4cas9tadains1250[1168]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1169]110.5cas9tadains1249[1170]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1171]110.5cas9tadainsδ59-661250[1172]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1173]110.6cas9tadains1251[1174]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspegssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrdneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1175]110.7cas9tadains1252[1176]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1177]110.8cas9tadainsδ59-66c-截短1250[1178]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1179]111.1cas9tadains997[1180]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1181]111.2cas9tadains997[1182]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgssgsetpgtsesatpessggssikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1183]112δhnhtada[1184]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1185]113n-终止的单tada螺旋截断165-端[1186]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1187]114n-终止的单tada螺旋截短的165-端δ59-65[1188]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1189]115.1cas9tadains1004[1190]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypkgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1191]115.2cas9tadains1005[1192]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1193]115.3cas9tadains1006[1194]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1195]115.4cas9tadains1007[1196]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1197]116.1cas9tadainsc端的截短2792[1198]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1199]116.2cas9tadainsc端的截短2791[1200]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1201]116.3cas9tadainsc端的截短2790[1202]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1203]117cas9δ1017-1069[1204]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvyssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1205]118cas9tada-cp116ins1067[1206]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietnmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypggetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1207]119cas9tadains701[1208]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1209]120cas9tadacp136ins1248[1210]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1211]121cas9tadacp136ins1052[1212]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlamnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgngeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1213]122cas9tadacp136ins1041[1214]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1215]123cas9tadacp139ins1299[1216]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1217]124cas9δ792-872tadains[1218]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdeevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1219]125cas9δ792-906tadains[1220]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1221]126tadacp65ins1003[1222]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypktahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdplesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1223]127tadacp65ins1016[1224]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1225]128tadacp65ins1022[1226]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1227]129tadacp65ins1029[1228]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1229]130tadacp65ins1041[1230]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffystahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1231]131tadacp65ins1054[1232]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlantahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1233]132tadacp65ins1246[1234]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1235]在一些实施方案中,相应地,产生腺苷脱氨酶碱基编辑器以将tada或其变体插入cas9多肽中所识别的位置。[1236]在一些实施方案中,腺苷脱氨酶等位基因(例如tada等位基因)的合成文库可用于产生具有修饰的碱基编辑效率和/或特异性的腺苷碱基编辑器。在一些实施方案中,从合成文库产生的腺苷碱基编辑器包括更高的碱基编辑效率和/或特异性。在一些实施方案中,与腺苷碱基编辑器相比,从合成文库产生的具有野生型tada的腺苷碱基编辑器表现出增加的的碱基编辑效率、增加的碱基编辑特异性、减少的脱靶编辑、减少的旁观者编辑、减少的插入缺失形成、和/或减少的虚假编辑。在一些实施方案中,与具有tada*7.10的腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器表现出增加的碱基编辑效率、增加的碱基编辑特异性、减少的脱靶编辑、减少的旁观者编辑、减少的插入缺失形成、和/或减少的虚假编辑。在一些实施方案中,合成文库包括abe的随机化tada部分。在一些实施方案中,合成文库在tada的每个位置包括所有20个标准氨基酸取代。在一些实施方案中,合成文库包括每个文库成员1-2个核苷酸取代突变的平均频率。在一些实施方案中,合成文库包括在tada*7.10中发现的背景突变。[1237]c至t编辑[1238]在一些实施方案中,本文公开的碱基编辑器包括融合蛋白,所述融合蛋白包括能够使多核苷酸的目标胞苷(c)碱基脱氨以产生有胸腺嘧啶的碱基配对特性的尿苷(u)的胞苷脱氨酶。在一些实施方案中,例如,当多核苷酸是双链(例如,dna)时,尿苷碱基经胸苷碱基(例如,通过细胞修复机制)取代以产生c:g至t:a转换。在其他实施方案中,碱基编辑器将核酸中的c脱氨为u无法伴随将u取代为t。[1239]多核苷酸中目标c的脱氨以产生u是可由本文所述碱基编辑器执行的碱基编辑类型的非限制性实例。在另一个实例中,包括胞苷脱氨酶结构域的碱基编辑器可以介导胞苷(c)碱基转换成鸟嘌呤(g)碱基。例如,可以通过碱基切除修复机制(例如,通过尿嘧啶dna糖基化酶(udg)结构域)从多核苷酸切除由碱基编辑器的胞苷脱氨酶结构域对胞苷脱氨而产生的多核苷酸的u,产生一个无碱基位点。然后与无碱基位点相对的核碱基可以被另一个碱基(例如c)取代(例如,通过碱基修复机制),例如通过跨损伤聚合酶。尽管与无碱基位点相对的核碱基通常被c取代,但其他取代(例如a、g或t)也可能发生。[1240]因此,在一些实施方案中,本文所述碱基编辑器包括能够将多核苷酸中的目标c脱氨成u的脱氨结构域(例如,胞苷脱氨酶结构域)。此外,如下所述,在一些实施方案中,碱基编辑器可包括促进由脱氨产生的u转换为t或g的额外结构域。例如,包括胞苷脱氨酶结构域的碱基编辑器可进一步包括尿嘧啶糖基化酶抑制剂(ugi)结构域以介导由t取代u,完成c至t碱基编辑事件。在另一个实例中,碱基编辑器可以掺入跨损伤聚合酶以提高c至g碱基编辑的效率,因为跨损伤聚合酶可以促进与无碱基位点相对的c的掺入(即,导致g在无碱基位点的掺入,并完成c至g基础编辑事件)。在一些实施方案中,附加结构域与脱氨酶结构域在内部融合。[1241]包括胞苷脱氨酶作为结构域的碱基编辑器可以使任何多核苷酸中的目标c脱氨,包括dna、rna和dna-rna杂交体。通常,胞苷脱氨酶催化位于多核苷酸单链部分上下文中的c核碱基。在一些实施方案中,包括目标c的完整多核苷酸可以是单链的。例如,掺入碱基编辑器的胞苷脱氨酶可以使单链rna多核苷酸中的目标c脱氨。在其他实施方案中,包括胞苷脱氨酶结构域的碱基编辑器可作用于双链多核苷酸,但目标c可位于多核苷酸的在脱氨反应时处于单链状态的部分。例如,在其中napdnabp结构域包括cas12结构域的实施方案中,在形成cas12-grna-目标dna复合物的过程中可以留下几个核苷酸不配对,导致形成cas12“r-环复合物”。这些未配对的核苷酸可形成单链dna气泡,可作为单链特异性核苷酸脱氨酶(例如胞苷脱氨酶)的底物。[1242]在一些实施方案中,碱基编辑器的胞苷脱氨酶可包括载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶的全部或部分。apobec家族包括进化上保守的胞苷脱氨酶。所述家族的成员是c至u编辑酶。apobec样蛋白的n端结构域是催化结构域,而c端结构域是假催化结构域。更具体地,催化结构域是锌依赖性胞苷脱氨酶结构域并且对于胞苷脱氨很重要。apobec家族成员包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d(现称为“apobec3e”)、apobec3f、apobec3g、apobec3h、apobec4及激活诱导(胞苷)脱氨酶(aid)。许多包括修饰的胞苷脱氨酶的碱基编辑器是可商购的,包括但不限于sabe3、sakkh-be3、vqr-be3、eqr-be3、vrer-be3、ye1-be3、ee-be3、ye2-be3及yee-be3,其可从addgene(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)获得。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec1脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec2脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3a脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3b脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3c脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3d脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3e脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3f脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3g脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec3h脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括apobec4脱氨酶的全部或部分。在一些实施方案中,掺入碱基编辑器的脱氨酶包括全部或部分激活诱导脱氨酶(aid)。[1243]在一些实施方案中,掺入碱基编辑器的脱氨酶包括全部或部分胞苷脱氨酶1(cda1)。应将理解,碱基编辑器可以包括来自任何合适的生物体(例如,人类或大鼠)的脱氨酶。在一些实施方案中,碱基编辑器的脱氨酶结构域来自人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。在一些实施方案中,碱基编辑器的脱氨酶结构域衍生自大鼠(例如,大鼠apobec1)。在一些实施方案中,碱基编辑器的脱氨酶结构域是人类apobec1。在一些实施方案中,碱基编辑器的脱氨酶结构域是pmcda1。[1244]pmcda1的碱基序列和氨基酸序列以及人类aid的cds的碱基序列和氨基酸序列如下所示。[1245]》tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗ox=7757pe=2sv=1[1246]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsimiqvkilhttkspav[1247]》ef094822.1海七鳃鳗单离物pmcda.21胞嘧啶脱氨酶mrna,完整cds[1248]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacactttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[1249]》tr|q6qj80|q6qj80_人类激活诱导的胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1[1250]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkapv[1251]》在12号染色体上的ng_011588.1:5001-15681智人激活诱导的胞苷脱氨酶(aicda),refseqgene(lrg_17)[1252]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgatcaatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctttagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactatgattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtattcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[1253]以下提供可用于本发明方法的其他胞苷脱氨酶。[1254]rapobec-1大鼠(rattusnorvegicus)[1255]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1256]mapobec-1小家鼠(musmusculus)[1257]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[1258]maapobec-1黄金仓鼠(mesocricetusauratus)[1259]mssetgpvvvdptlrrriephefdaffdqgelrketcllyeirwggrhniwrhtgqntsrhveinfiekftseryfypstrcsivwflswspcgecskaiteflsghpnvtlfiyaarlyhhtdqrnrqglrdlisrgvtirimteqeycycwrnfvnyppsnevywprypnlwmrlyalelycihlglppclkikrrhqypltffrlnlqschyqripphilwatgfi[1260]hapobec-1智人[1261]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[1262]ppapobec-1婆罗洲猩猩(pongopygmaeus)[1263]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlfwhmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwr[1264]ocapobec1穴兔(oryctolaguscuniculus)[1265]masekgpsnkdytlrrriepwefevffdpqelrkeacllyeikwgassktwrssgknttnhvevnflekltsegrlgpstccsitwflswspcwecsmaireflsqhpgvtliifvarlfqhmdrrnrqglkdlvtsgvtvrvmsvseycycwenfvnyppgkaaqwprypprwmlmyalelyciilglppclkisrrhqkqltffsltpqychykmippyillatgllqpsvpwr[1266]mdapobec-1灰短尾负鼠(monodelphisdomestica)[1267]mnsktgpsvgdatlrrrikpwefvaffnpqelrketcllyeikwgnqniwrhsnqntsqhaeinfmekftaerhfnssvrcsitwflswspcwecskairkfldhypnvtlaifisrlywhmdqqhrqglkelvhsgvtiqimsyseyhycwrnfvdypqgeedywpkypylwimlyvlelhciilglppclkisgshsnqlalfsldlqdchyqkipynvlvatglvqpfvtwr[1268]mapobec-2小家鼠[1269]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1270]hapobec-2智人[1271]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1272]ppapobec-2婆罗洲猩猩[1273]maqkeeaaaateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweeleiqdalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1274]btapobec-2牛(bostaurus)[1275]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1276]mapobec-3小家鼠[1277]mqpqrlgpragmgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyisvpssssstlsnicltkglpetrfwvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms[1278]hapobec-3a智人[1279]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[1280]hapobec-3b智人[1281]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgqvyfkpqyhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflsehpnvtltisaarlyyywerdyrralcrlsqagarvtimdyeefaycwenfvynegqqfmpwykfdenyaflhrtlkeilrylmdpdtftfnfnndplvlrrrqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqnqgn[1282]hapobec-3c智人[1283]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswfcddilspntkyqvtwytswspcpdcagevaeflarhsnvnltiftarlyyfqypcyqeglrslsqegvaveimdyedfkycwenfvyndnepfkpwkglktnfrllkrrlreslq[1284]hapobec-3d智人[1285]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgpvlpkrqsnhrqevyfrfenhaemcflswfcgnrlpanrrfqitwfvswnpclpcvvkvtkflaehpnvtltisaarlyyyrdrdwrwvllrlhkagarvkimdyedfaycwenfvcnegqpfmpwykfddnyaslhrtlkeilrnpmeamyphifyfhfknllkacgrneswlcftmevtkhhsavfrkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlcyfwdtdyqeglcslsqegasvkimgykdfvscwknfvysddepfkpwkglqtnfrllkrrlreilq[1286]hapobec-3f智人[1287]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[1288]hapobec-3g智人[1289]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[1290]hapobec-4智人[1291]mepiyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttfpqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilysnnspcneanhcciskmynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfisgvsgshvfqpiltgraladrhnayeinaitgvkpyftdvllqtkrnpntkaqealesyplnnafpgqffqmpsgqlqpnlppdlrapvvfvlvplrdlppmhmgqnpnkprnivrhlnmpqmsfqetkdlgrlptgrsveiveiteqfasskeadekkkkkgkk[1292]mapobec-4小家鼠[1293]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[1294]rapobec-4大鼠[1295]meplyeeylthsgtivkpyywlsvslnctncpyhirtgeearvpytefhqtfgfpwstypqtkhltfyelrsssgnliqkglasnctgshthpesmlferdgyldslifhdsnirhiilysnnspcdeanhcciskmynflmnypevtlsvffsqlyhtenqfptsawnrealrglaslwpqvtlsaisggiwqsiletfvsgisegltavrpftagrtltdrynayeincitevkpyftdalhswqkenqdqkvwaasenqplhnttpaqwqpdmsqdcrtpavfmlvpyrdlppihvnpspqkprtvvrhlntlqlsaskvkalrkspsgrpvkkeearkgstrsqeanetnkskwkkqtlfiksnichllereqkkigilsswsv[1296]mfapobec-4食蟹猕猴(macacafascicularis)[1297]meptyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttypqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilycnnspcneanhcciskvynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfvsgvsgshvfqpiltgraltdrynayeinaitgvkpfftdvllhtkrnpntkaqmalesyplnnafpgqsfqmtsgippdlrapvvfvllplrdlppmhmgqdpnkprniirhlnmpqmsfqetkdlerlptrrsvetveiterfasskqaeektkkkkgkkhaid智人[1298]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1299]claid家犬(canislupusfamiliaris)[1300]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1301]btaid牛[1302]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1303]maid小家鼠[1304]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1305]pmcda-1海七鳃鳗[1306]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrv[1307]pmcda-2海七鳃鳗[1308]melrevvdcalascvrheplsrvaflrcfaapsqkprgtvilfyvegagrgvtgghavnynkqgtsihaevlllsavraallrrrrcedgeeatrgctlhcystyspcrdcveyiqefgastgvrvvihccrlyeldvnrrrseaegvlrslsrlgrdfrlmgprdaialllggrlantadgesgasgnawvtetnvveplvdmtgfgdedlhaqvqrnkqireayanyasavslmlgelhvdpdkfpflaeflaqtsvepsgtpretrgrprgassrgpeigrqrpadferalgayglflhprivsreadreeikrdlivvmrkhnyqgp[1309]pmcda-5海七鳃鳗[1310]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlft[1311]ycd酿酒酵母菌(saccharomycescerevisiae)[1312]mvtggmaskwdqkgmdiayeeaalgykeggvpiggclinnkdgsvlgrghnmrfqkgsatlhgeistlencgrlegkvykdttlyttlspcdmctgaiimygiprcvvgenvnfkskgekylqtrghevvvvdderckkimkqfiderpqdwfedige[1313]rapobec-1(δ177-186)[1314]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1315]rapobec-1(δ202-213)[1316]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqhyqrlpphilwatglk[1317]人类aid:[1318][1319](底线:核定位序列;双底线:核输出信号)[1320]小鼠aid:[1321][1322](底线:核定位序列;双底线:核输出信号)[1323]犬aid:[1324][1325](底线:核定位序列;双底线:核输出信号)[1326]牛aid:[1327][1328](底线:核定位序列;双底线:核输出信号)[1329]大鼠aid[1330][1331][1332](底线:核定位序列;双底线:核输出信号)[1333]小鼠apobec-3[1334][1335](斜体:核酸编辑结构域)[1336]大鼠apobec-3:[1337][1338](斜体:核酸编辑结构域)[1339]猕猴apobec-3g:[1340][1341](斜体:核酸编辑结构域;底线:细胞质定位信号)[1342]黑猩猩apobec-3g:[1343][1344](斜体:核酸编辑结构域;底线:细胞质定位信号)[1345]绿猴apobec-3g:[1346][1347](斜体:核酸编辑结构域;底线:细胞质定位信号)[1348]人类apobec-3g:[1349][1350](斜体:核酸编辑结构域;底线:细胞质定位信号)[1351]人类apobec-3f:[1352][1353][1354](斜体:核酸编辑结构域)[1355]人类apobec-3b:[1356][1357](斜体:核酸编辑结构域)[1358]大鼠apobec-3b:[1359][1360]牛apobec-3b:[1361]dgwevafrsgtvlkagvlgvsmtegwagsghpgqgacvwtpgtrntmnllrevlfkqqfgnqprvpapyyrrktylcyqlkqrndltldrgcfrnkkqrhaerfidkinsldlnpsqsykiicyitwspcpncanelvnfitrnnhlkleifasrlyfhwiksfkmglqdlqnagisvavmthtefedcweqfvdnqsrpfqpwdkleqysasirrrlqriltapi[1362]黑猩猩apobec-3b:[1363]mnpqirnpmewmyqrtfyynfenepilygrsytwlcyevkirrghsnllwdtgvfrgqmysqpehhaemcflswfcgnqlsaykcfqitwfvswtpcpdcvaklakflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvynegqpfmpwykfddnyaflhrtlkeiirhlmdpdtftfnfnndplvlrrhqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagqvraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqvrasslcmvphrpppppqspgpclplcsepplgsllptgrpapslpflltasfsfpppaslpplpslslspghlpvpsfhsltscsiqppcssriretegwasvskegrdlg[1364]人类pobec-3c:[1365][1366](斜体:核酸编辑结构域)[1367]大猩猩apobec-3c3c[1368][1369]人类apobec-3a:[1370]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[1371](斜体:核酸编辑结构域)[1372]猕猴apobec-3a:[1373][1374](斜体:核酸编辑结构域)[1375]牛apobec-3a3a:[1376][1376][1377](斜体:核酸编辑结构域)[1378]人类apobec-3h:[1379][1380](斜体:核酸编辑结构域)[1381]猕猴apobec-3h:[1382][1383]人类apobec-3d:[1384][1385](斜体:核酸编辑结构域)[1386]人类apobec-1:[1387][1388]小鼠apobec-1:[1389]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[1390]大鼠apobec-1:[1391]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1392]人类apobec-2:[1393]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1394]小鼠apobec-2:[1395]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1396]大鼠apobec-2:[1397]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvveaqskggqvqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeylwqnfveqeegeskafepwediqenflyyeekladilk[1398]牛apobec-2:[1399]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1400]海七鳃鳗cda1(pmcdal)[1401]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsfmiqvkilhttkspav[1402]人类apobec3g链a[1403]mdpptftfnfnnepwwgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[1404]以下提供根据本公开内容的方面可以在cas12的氨基酸序列内内部融合的其他实施例性脱氨酶。应当理解,在一些实施方案中,可以使用相应序列的活性结构域,例如,没有定位信号(例如,核定位序列、核输出信号或细胞质定位信号)的结构域。[1405]c至t核碱基编辑蛋白的详细信息在国际pct申请号pct/us2016/058344(wo2017/070632)和komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016),其全部内容通过引用方式并入本文。[1406]胞苷脱氨酶[1407]在一个实施方案中,本发明的融合蛋白包括胞苷脱氨酶。在一些实施方案中,本文所提供的胞苷脱氨酶能够将胞嘧啶或5-甲基胞嘧啶脱氨为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文所提供的胞嘧啶脱氨酶能够使dna中的胞嘧啶脱氨。胞苷脱氨酶可以衍生自任何合适的生物体。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如人类)。[1408]在一些实施方案中,胞苷脱氨酶包括与本文所述任一胞苷脱氨酶氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。[1409]本发明的融合蛋白包括核酸编辑结构域。在一些实施方案中,核酸编辑结构域可以催化c至u碱基的变化。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna-编辑复合物(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobec1脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。在一些实施方案中,脱氨酶是激活诱导的脱氨酶(aid)。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人类脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如rapobecl。在一些实施方案中,脱氨酶是海七鳗胞苷脱氨酶1(pmcda1)。在一些实施方案中,脱氨酶是人apobec3g。在一些实施方案中,脱氨酶是人类apobec3g的片段。在一些实施方案中,核酸编辑结构域是与本文所述任何脱氨酶的脱氨酶结构域至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%,或至少99.5%相同。[1410]额外的结构域[1411]本文所述碱基编辑器可包括有助于促进多核苷酸的核碱基的核碱基编辑、修饰或改变的任何结构域。在一些实施方案中,碱基编辑器包括多核苷酸可编程的核苷酸结合结构域(例如,cas9)、核碱基编辑结构域(例如,脱氨酶结构域)和一个或多个额外的结构域。在一些实施方案中,额外的结构域可以促进碱基编辑器的酶促或催化功能、碱基编辑器的结合功能,或者是可能干扰所需碱基编辑结果的细胞机制(例如酶)的抑制剂。在一些实施方案中,碱基编辑器可包括核酸酶、切口酶、重组酶、脱氨酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活物或转录抑制结构域。[1412]在一些实施方案中,碱基编辑器可包括尿嘧啶糖基化酶抑制剂(ugi)结构域。ugi结构域可以例如通过抑制由c脱氨形成的u转换回到c核碱基来提高包括胞苷脱氨酶结构域的碱基编辑器的效率。在一些实施方案中,对u:g异源双链体dna的存在的细胞dna修复反应可能是细胞中核碱基编辑效率降低的原因。特此类实施方案中,尿嘧啶dna糖基化酶(udg)可催化从细胞中的dna去除u,这可启动碱基切除修复(ber),主要导致u:g对回复为c:g对。在这样的实施方案中,可以在碱基编辑器中抑制ber,所述碱基编辑器包括结合单链、阻断编辑碱基、抑制ugi、抑制ber、保护编辑碱基和/或促进非编辑链修复的一个或多个结构域。因此,本公开内容考虑包括ugi结构域的碱基编辑器融合蛋白。[1413]在一些实施方案中,碱基编辑器包括双链断裂(dsb)结合蛋白的全部或部分作为结构域。例如,dsb结合蛋白可以包含噬菌体mu的gam蛋白,其可以结合dsb的末端并且可以保护它们免于降解。参见komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其全部内容特此以参考方式并入。[1414]另外,在一些实施方案中,gam蛋白可以与碱基编辑器的n端融合。在一些实施方案中,gam蛋白可以与碱基编辑器的c端融合。噬菌体mu的gam蛋白可以与双链断裂(dsb)的末端结合并保护它们免于降解。在一些实施方式中,使用gam结合dsb的自由端可以减少碱基编辑过程中插入缺失的形成。在一些实施方案中,174个残基的gam蛋白与碱基编辑器的n端融合。参见,例如komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在一些实施方案中,一个或多个突变可以改变碱基编辑器域相对于野生型结构域的长度。例如,至少一个结构域中的至少一个氨基酸的缺失可以减少碱基编辑器的长度。在另一种情况下,一个或多个突变不会改变结构域相对于野生型结构域的长度。例如,任何结构域中的一个或多个取代都不会改变碱基编辑器的长度。[1415]在一些实施方案中,碱基编辑器可包括核酸聚合酶(nap)的全部或部分作为结构域。例如,碱基编辑器可以包括真核nap的全部或一部分。在一些实施方案中,并入碱基编辑器中的nap或其部分是dna聚合酶。在一些实施方案中,并入碱基编辑器中的nap或其部分具有跨损伤聚合酶活性。在一些实施方案中,并入碱基编辑器中的nap或其部分是跨损伤dna聚合酶。在一些实施方案中,并入碱基编辑器中的nap或其部分是rev7、rev1复合物、聚合酶ι、聚合酶κ或聚合酶η。在一些实施方案中,并入碱基编辑器中的nap或其部分是真核聚合酶α、β、γ、δ、ε、γ、η、ι、κ、λ、μ或ν组分。在一些实施方案中,并入碱基编辑器中的nap或其部分包括与核酸聚合酶(例如,跨损伤dna聚合酶)至少75%、80%、85%、90%、95%、96%、97%、98%、99%、或99.5%相同。[1416]其他核碱基编辑器[1417]本发明提供模块化多效应核碱基编辑器,其中本领域已知的几乎任何核碱基编辑器都可以插入本文所述融合蛋白中或替换为胞苷脱氨酶或腺苷脱氨酶。在一个实施方案中,本发明的特征在于包括无碱基核碱基编辑器结构域的多效应器核碱基编辑器。无碱基核碱基编辑器是本领域已知的并且描述于例如kavlietal.,emboj.15:3442-3447,1996,其通过引用方式并入本文。[1418]在一个实施方案中,多效应核碱基编辑器包括以下域a至c、a至d或a至e:[1419]nh2-[a-b-c]-cooh,[1420]nh2-[a-b-c-d]-cooh或[1421]nh2-[a-b-c-d-e]-cooh[1422]其中a和c或a、c和e各自包括以下一种或多种:腺苷脱氨酶结构域或其活性片段、胞苷脱氨酶结构域或其活性片段、dna糖基化酶结构域或其活性片段;并且其中b或b和d,各自包括一个或多个具有核酸序列特异性结合活性的结构域。[1423]在一个实施方案中,多效应核碱基编辑器包括nh2-[an-bo-cn]-cooh,[1424]nh2-[an-bo-cn-do]-cooh,或[1425]nh2-[an-bo-cp-do-eq]-cooh;[1426]其中a和c或a、c和e各自包括以下一种或多种:腺苷脱氨酶结构域或其活性片段、胞苷脱氨酶结构域或其活性片段和dna糖基化酶结构域或其活性片段;其中n为整数:1、2、3、4或5,且其中p为整数:0、1、2、3、4或5;b或b和d各自包括具有核酸序列特异性结合活性的结构域;其中o是整数:1、2、3、4或5。[1427]基础编辑器系统[1428]本文所提供的碱基编辑器系统的使用包括以下步骤:(a)将受试者的多核苷酸(例如,双链或单链dna或rna)的目标核苷酸序列与包括核碱基编辑器(例如,双链或单链dna或rna)的碱基编辑器系统接触,腺苷碱基编辑器)和向导多核酸(例如,grna),其中所述目标核苷酸序列包括靶核碱基对;(b)诱导所述目标区域的链分离;(c)将目标区域的单链中的所述目标核碱基对的第一个核碱基转换为第二个核碱基;(d)切割不超过所述目标区域的一条链,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基置换。应当理解,在一些实施方案中,省略了步骤(b)。在一些实施方案中,所述靶向的核碱基对是一种或多种基因中的多个核碱基对。在一些实施方案中,本文所提供的碱基编辑器系统能够多重编辑一个或多个基因中的多个核碱基对。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,多个核碱基对位于一个或多个基因中,其中至少一个基因位于不同的基因座中。[1429]在一些实施方案中,切割的单链(切口链)与向导核酸杂交。在一些实施方案中,切割的单链与包括第一核碱基的链相反。在一些实施方案中,碱基编辑器包括cas9结构域。在一些实施方案中,第一个碱基是腺嘌呤,而第二个碱基不是g、c、a或t。在一些实施方案中,第二个碱基是肌苷。[1430]本文所提供的碱基编辑系统提供一种基因组编辑的新方法,所述方法使用包括催化缺陷的化脓链球菌cas9、胞苷脱氨酶及碱基切除修复抑制剂的融合蛋白来诱导可编程的单核苷酸(c→t或a→g)改变dna不会产生双链dna断裂,不需要供体dna模板,也不会引起过量的随机插入和缺失。[1431]本文所提供用于使用碱基编辑器系统编辑核碱基的系统、组合物和方法。在一些实施方案中,碱基编辑器系统包括(1)碱基编辑器(be),其包括多核苷酸可编程的核苷酸结合结构域和用于编辑核碱基的核碱基编辑结构域(例如脱氨酶结构域);(2)与多核苷酸可编程的核苷酸结合结构域结合的向导多核苷酸(例如,向导rna)。在一些实施方案中,碱基编辑器系统包括腺苷碱基编辑器(abe)。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的dna结合结构域。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域是多核苷酸可编程的rna结合结构域。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,腺苷碱基编辑器可使dna中的腺嘌呤脱氨。在一些实施方案中,abe包括进化的tada变体。[1432]核碱基编辑蛋白的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中有所描述,它们各自通过引用方式整体并入本文。另参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其全部内容通过引用方式并入本文。[1433]在一些实施方案中,可利用单个向导多核苷酸将脱氨酶靶向目标核酸序列。在一些实施方案中,单对向导多核苷酸可用于将不同脱氨酶靶向目标核酸序列。[1434]碱基编辑器系统的核碱基成分和多核苷酸可编程的核苷酸结合成分可以共价或非共价地彼此连结。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程的核苷酸结合结构域靶向目标核苷酸序列。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以与脱氨酶结构域融合或连接。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以通过与脱氨酶结构域非共价相互作用或连结将脱氨酶结构域靶向目标核苷酸序列。例如,在一些实施方案中,核碱基编辑成分(例如脱氨酶成分)可以包括能够与另外的异源部分或结构域相互作用、连结或形成复合物的作为多核苷酸可编程的核苷酸结合结构域的一部分额外的异源部分或结构域。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1435]碱基编辑器系统可进一步包括向导多核苷酸组分。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其连结和相互作用的任何组合彼此关联。在一些实施方案中,脱氨酶结构域可以经由向导多核苷酸靶向目标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分(例如脱氨酶组分)可以包括额外的异源部分或结构域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白),其能够与向导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用、连结或能够与向导多核苷酸的部分或区段(例如,多核苷酸基序)形成复合物。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域,诸如rna或dna结合蛋白)可以与脱氨酶结构域融合或连接。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序及ku蛋白,端粒酶sm7结合基序和sm7蛋白,或rna识别基序。[1436]在一些实施方案中,碱基编辑器系统可进一步包括碱基切除修复(ber)组分的抑制剂。应当理解,碱基编辑器系统的组分可以经由共价键、非共价相互作用或其连结和相互作用的任何组合彼此连结。ber组分的抑制剂可以包括碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以通过多核苷酸可编程的核苷酸结合结构域靶向目标核苷酸序列。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以与碱基切除修复抑制剂融合或连接。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以与脱氨酶结构域和碱基切除修复抑制剂融合或连接。在一些实施方案中,多核苷酸可编程的核苷酸结合结构域可以通过与碱基切除修复抑制剂非共价相互作用或连结来将碱基切除修复抑制剂靶向目标核苷酸序列。例如,在一些实施方案中,碱基切除修复抑制剂组分可包括额外的异源部分或结构域,所述部分或结构域能够与作为多核苷酸可编程的核苷酸结合结构域一部分的额外异源部分或结构域相互作用、连结或形成复合物。在一些实施方案中,碱基切除修复抑制剂可以通过向导多核苷酸靶向目标核苷酸序列。例如,在一些实施方案中,碱基切除修复抑制剂可包括能够与相互作用、连结或能够形成的额外的异源部分或结构域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白)与向导多核苷酸的部分或区段(例如,多核苷酸基序)的复合物。在一些实施方案中,向导多核苷酸的额外异源部分或结构域(例如,多核苷酸结合结构域如rna或dna结合蛋白)可以与碱基切除修复抑制剂融合或连接。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、连结或形成复合物。在一些实施方案中,额外的异源部分可能能够结合向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合多肽连接子。在一些实施方案中,额外的异源部分能够结合多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白,端粒酶sm7结合基序和sm7蛋白,或rna识别基序。[1437]在一些实施方案中,碱基编辑器抑制编辑链的碱基切除修复(ber)。在一些实施方标签、绿色荧光蛋白(gfp)-标签、硫氧还蛋白-标签、s-标签、softags(例如,softag1、softag3)、链标签、生物素连接酶标签、flash标签、v5标签及sbp标签。其他合适的序列对本领域技术人员来说是显而易见的。在一些实施方案中,融合蛋白包括一个或多个his标签。[1443]可包括在融合蛋白中的蛋白质结构域的非限制性实例包括脱氨酶结构域(例如胞苷脱氨酶、腺苷脱氨酶)、尿嘧啶糖基化酶抑制剂(ugi)结构域、表位标签和报告基因序列。[1444]表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。报告基因的例子包括但不限于谷胱甘肽-5-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)β-半乳糖基化酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青色荧光蛋白(cfp)、黄色荧光蛋白(yfp)和自发荧光蛋白,包括蓝色荧光蛋白(bfp)。额外的蛋白质序列可以包括结合dna分子或结合其他细胞分子的氨基酸序列,包括但不限于麦芽糖结合蛋白(mbp)、s-标签、lexadna结合结构域(dbd)融合、gal4dna结合结构域融合和单纯疱疹病毒(hsv)bp16蛋白融合。[1445]碱基编辑器或碱基编辑器系统可以是本文所述任何碱基编辑器。在一些实施方案中,碱基编辑器包括如本文所述腺苷脱氨酶单体或腺苷脱氨酶二聚体。在一些实施方案中,碱基编辑器包括具有插入cas9多肽的柔性环中的脱氨酶(例如腺苷脱氨酶)的cas9。在一些实施方案中,碱基编辑器通过表达各自编码cas9-分裂内含肽融合蛋白的n端片段和c端片段的两个多核苷酸产生。碱基编辑器可经由rnp、载体、病毒载体或核酸如mrna递送至宿主细胞。在一些实施方案中,编码碱基编辑器的多核苷酸构建体包括结构pmrna-trilink-islay3-monotada-abe7.10(v82s)-mqkfraer120abbsi、pmrna-trilink-islay3-abe7.10(v82s、y147t、q154s)mqkfraer120abbsi、或pmrna-trilink-islay3-abe7.10(v82t、y147t、q154s)-mqkfraer120abbsi。向导rna可以被化学修饰。在一些实施方案中,向导rna包括一种或多种化学修饰的核碱基,诸如2'-o-甲基(2'-ome)、2'-脱氧(2'-h)、2'-oc1-3烷基-o-c1-3烷基,诸如2'-甲氧基乙基(“2'-moe”)、2'-氟(“2'-f”)、2'-氨基(“2'-nh2”)、2'-阿拉伯糖基(“2'-阿拉伯”)核苷酸、2'-f-阿拉伯糖基(“2'-f-阿拉伯”)核苷酸、2'-锁定的核酸(“lna”)核苷酸、2'-解锁的核酸(“ulna”)”)核苷酸、l形式的糖(“l-糖”)、4'-硫代核糖核苷酸或如本文所述任何化学修饰。在一些实施方案中,向导rna包括核苷酸间键修饰例如硫代磷酸酯“p(s)”(p(s))、膦酰基羧酸酯(p(ch2)ncoor)诸如膦酰基乙酸酯“pace”(p(ch2coo-))、硫代膦酸羧酸盐((s)p(ch2)ncoor)诸如硫代膦酰乙酸盐“thiopace”((s)p(ch2)ncoo-))、烷基膦酸盐(p(c1-3烷基)诸如甲基膦酸盐-p(ch3)、硼膦酸盐(p(bh3))及二硫代磷酸酯(p(s)2)。在一些实施方案中,向导rna包括核碱基化学修饰,诸如2-硫尿嘧啶(“2-硫代u”)、2-硫代胞嘧啶(“2-硫代c”)、4-硫尿嘧啶(“4-硫代u”)、6-硫鸟嘌呤(“6-硫代g”)、2-氨基腺嘌呤(“2-氨基a”)、2-氨基嘌呤、假尿嘧啶、次黄嘌呤、7-脱氮鸟嘌呤、7-脱氮杂-8-氮杂鸟嘌呤、7-脱氮杂腺嘌呤、7-脱氮-8-氮杂腺嘌呤、5-甲基胞嘧啶(“5-甲基c”)、5-甲基尿嘧啶(“5-甲基u”)、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5,6-脱氢尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、5-乙炔基胞嘧啶、5-乙炔基尿嘧啶、5-烯丙基尿嘧啶(“5-烯丙基u”)、5-烯丙基胞嘧啶(“5-烯丙基c”)、5-氨基烯丙基尿嘧啶(“5-氨基烯丙基u”)、5-氨基烯丙基-胞嘧啶(“5-氨基烯丙基c”)、无碱基核苷酸、z碱基、p碱基、非结构化核酸(“una”)、异鸟嘌呤(“异g”)、异胞嘧啶(“异c”)。在一些实施方案中,向导rna在核苷酸糖、核碱基、磷酸二酯键和/或核苷酸磷酸酯上包括一种或多种同位素修饰。此类修饰包括一个或多个15n、13c、14c、氘、3h、32p、125i、131i原子或其其他原子或元素的核苷酸。[1446]在一些实施方案中,腺苷碱基编辑器(abe)可使dna中的腺嘌呤脱氨。在一些实施方案中,abe是通过用天然的或工程化的大肠杆菌tada、人类adar2、小鼠ada或人类adat2替换be3的apobec组分而产生的。在一些实施方案中,abe包括进化的tada变体。在一些实施方案中,abe是abe1.2(tada*-xten-ncas9-nls)。在一些实施方案中,tada*包括a106v和d108n突变。[1447]在一些实施方案中,abe是第二代abe。在一些实施方案中,abe是abe2.1,其包括tada*(tada*2.1)中的额外突变d147y和e155v。在一些实施方案中,abe是与催化失活版本的人烷基腺嘌呤dna糖基化酶(具有e125q突变的aag)融合的abe2.2,abe2.1。在一些实施方案中,abe是与催化灭活版本的大肠杆菌endov(用d35a突变灭活)融合的abe2.3,abe2.1。在一些实施方案中,abe是abe2.6,其连接子长度(32个氨基酸,(sggs)2-xten-(sggs)2)是abe2.1中连接子的两倍。在一些实施方案中,abe是abe2.7,其是与额外的野生型tada单体相连的abe2.1。在一些实施方案中,abe是abe2.8,其是与额外的tada*2.1单体拴系的abe2.1。在一些实施方案中,abe是abe2.9,其是进化的tada(tada*2.1)与abe2.1的n端的直接融合。在一些实施方案中,abe是abe2.10,其是野生型tada与abe2.1的n端的直接融合。在一些实施方案中,abe是abe2.11,其是在tada*单体的n端具有失活的e59a突变的abe2.9。在一些实施方案中,abe是abe2.12,其是在内部tada*单体中具有失活的e59a突变的abe2.9。[1448]在一些实施例中,abe是第三代abe。在一些实施方案中,abe是abe3.1,其是具有三个额外的tada突变(l84f、h123y和i156f)的abe2.3。[1449]在一些实施例中,abe是第四代abe。在一些实施方案中,abe是abe4.3,其是具有额外tada突变a142n(tada*4.3)的abe3.1。[1450]在一些实施例中,abe是第五代abe。在一些实施方案中,abe是abe5.1,其通过将来自存活的克隆(h36l、r51l、s146c和k157n)的一组共有突变导入abe3.1而产生。在一些实施方案中,abe是abe5.3,其具有包括融合内部进化的tada*的野生型大肠杆菌tada的异源二聚体构建体。在一些实施例中,abe是abe5.2、abe5.4、abe5.5、abe5.6、abe5.7、abe5.8、abe5.9、abe5.10、abe5.11、abe5.12、abe5.13或abe5.14,如下表6所示。在一些实施例中,abe是第六代abe。在一些实施例中,abe是abe6.1、abe6.2、abe6.3、abe6.4、abe6.5或abe6.6,如下表6所示。在一些实施例中,abe是第七代abe。在一些实施例中,abe是abe7.1、abe7.2、abe7.3、abe7.4、abe7.5、abe7.6、abe7.7、abe7.8、abe7.9或abe7.10,如下表6所示。[1451]表6.abe的基因型[1452][1453][1454]在一些实施例中,碱基编辑器是腺苷碱基编辑器。在一些实施方案中,腺苷碱基编辑器是第八代abe(abe8)。在一些实施方案中,abe8包括tada*8变体。在一些实施例中,abe8具有包括tada*8变体(“abe8.x-m”)的单体构建体。在一些实施方案中,abe8是abe8.1-m,其具有含有y147t突变(tada*8.1)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.2-m,其具有含有y147r突变(tada*8.2)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.3-m,其具有含有q154s突变(tada*8.3)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.4-m,其具有含有y123h突变(tada*8.4)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.5-m,其具有含有v82s突变(tada*8.5)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.6-m,其具有含有t166r突变(tada*8.6)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.7-m,其具有含有q154r突变(tada*8.7)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.8-m,其具有含有y147r、q154r和y123h突变(tada*8.8)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.9-m,其具有含有y147r、q154r和i76y突变(tada*8.9)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.10-m,其具有含有y147r、q154r和t166r突变(tada*8.10)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.11-m,其具有含有y147t和q154r突变(tada*8.11)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.12-m,其具有含有y147t和q154s突变(tada*8.12)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.13-m,其具有含有tada*7.10和y123h(从h123y回复的y123h)、y147r、q154r和i76y突变(tada*8.13)的单体构建体。在一些实施方案中,abe8是abe8.14-m,其具有含有i76y和v82s突变(tada*8.14)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.15-m,其具有含有v82s和y147r突变(tada*8.15)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.16-m,其具有含有v82s、y123h(从h123y回复的y123h)和y147r突变(tada*8.16)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.17-m,其具有含有v82s和q154r突变(tada*8.17)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.18-m,其具有含有v82s、y123h(从h123y回复的y123h)和q154r突变(tada*8.18)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.19-m,其具有含有tada*7.10和v82s、y123h(从h123y回复的y123h)、y147r和q154r突变(tada*8.19)的单体构建体。在一些实施方案中,abe8是abe8.20-m,其具有含有tada*7.10和i76y、v82s、y123h(y123h从h123y回复)、y147r和q154r突变(tada*8.20)的单体构建体。在一些实施方案中,abe8是abe8.21-m,其具有含有y147r和q154s突变(tada*8.21)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.22-m,其具有含有v82s和q154s突变(tada*8.22)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.23-m,其具有含有v82s和y123h(从h123y恢复的y123h)突变(tada*8.23)的tada*7.10的单体构建体。在一些实施方案中,abe8是abe8.24-m,其具有含有tada*7.10和v82s、y123h(y123h从h123y回复)和y147t突变(tada*8.24)的单体构建体。[1455]在一些实施方案中,abe8具有含有与tada*8变体(“abe8.x-d”)融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.1-d,其具有含有与具有y147t突变(tada*8.1)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.2-d,其具有含有与具有y147r突变(tada*8.2)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.3-d,其具有含有与具有q154s突变(tada*8.3)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.4-d,其具有含有与具有y123h突变(tada*8.4)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.5-d,其具有含有与具有v82s突变(tada*8.5)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.6-d,其具有含有与具有t166r突变(tada*8.6)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.7-d,其具有含有与具有q154r突变(tada*8.7)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.8-d,其具有含有与具有y147r、q154r和y123h突变(tada*8.8)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.9-d,其具有含有与具有y147r、q154r和i76y突变(tada*8.9)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.10-d,其具有含有与具有y147r、q154r和t166r突变(tada*8.10)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.11-d,其具有含有与具有y147t和q154r突变(tada*8.11)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.12-d,其具有含有与具有y147t和q154s突变(tada*8.12)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.13-d,其具有含有与具有y123h(从h123y回复的y123h)、y147r、q154r和i76y突变(tada*8.13)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.14-d,其具有含有具有i76y和v82s突变的tada*7.10(tada*8.14)的野生型大肠杆菌tada融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.15-d,其具有含有具有v82s和y147r突变(tada*8.15)的tada*7.10的野生型大肠杆菌tada融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.16-d,其具有含有具有v82s、y123h(从h123y回复的y123h)和y147r突变(tada*8.16)的tada*7.10融合的野生型大肠杆菌tada融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.17-d,其具有含有具有v82s和q154r突变(tada*8.17)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.18-d,其具有含有具有v82s、y123h(从h123y回复的y123h)和q154r突变(tada*8.18)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.19-d,其具有含有具有v82s、y123h(从h123y回复的y123h)、y147r和q154r突变(tada*8.19)的tada*7.10融合的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.20-d,其具有含有具有i76y、v82s、y123h(从h123y恢复的y123h)、y147r和q154r突变(tada)融合tada*7.10的野生型大肠杆菌tada的异源二聚体构建体。在一些实施方案中,abe8是abe8.21-d,其具有含有具有y147r和q154s突变(tada*8.21)的tada*7.10融合的野生型大肠杆菌tada。在一些实施方案中,abe8是abe8.22-d,其具有含有具有v82s和q154s突变的tada*7.10(tada*8.22)的野生型大肠杆菌tada融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.23-d,其具有含有具有v82s和y123h(从h123y恢复的y123h)突变(tada*8.23)的tada*7.10融合的野生型大肠杆菌tada融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.24-d,其具有含有具有v82s、y123h(从h123y回复的y123h)和y147t突变(tada*8.24)的tada*7.10融合的野生型大肠杆菌tada融合的异源二聚体构建体。[1456]在一些实施方案中,abe8具有含有与tada*8变体(“abe8.x-7”)融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.1-7,其具有含有与具有y147t突变(tada*8.1)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.2-7,其具有含有与具有y147r突变(tada*8.2)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.3-7,其具有含有与具有q154s突变(tada*8.3)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.4-7,其具有含有与具有y123h突变(tada*8.4)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.5-7,其具有含有与具有v82s突变(tada*8.5)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.6-7,其具有含有与具有t166r突变(tada*8.6)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.7-7,其具有含有与具有q154r突变(tada*8.7)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.8-7,其具有含有与具有y147r、q154r和y123h突变(tada*8.8)的tada*7.10融合的tada*7.10融合的的异源二聚体构建体。在一些实施方案中,abe8是abe8.9-7,其具有含有与具有y147r、q154r和i76y突变(tada*8.9)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.10-7,其具有含有与具有y147r、q154r和t166r突变(tada*8.10)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.11-7,其具有含有与具有y147t和q154r突变(tada*8.11)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.12-7,其具有包括与具有y147t和q154s突变(tada*8.12)的tada*7.10融合的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.13-7,其具有包括与具有y123h(从h123y回复的y123h)、y147r、q154r和i76y突变(tada*8.13)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.14-7,其具有包括与具有i76y和v82s突变(tada*8.14)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.15-7,其具有包括与具有v82s和y147r突变(tada*8.15)的tada*7.10融合的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.16-7,其具有含有tada*7.10其具有包括与具有v82s、y123h(从h123y回复的y123h)和y147r突变(tada*8.16)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.17-7,其具有含有与具有v82s和q154r突变(tada*8.17)的tada*7.10融合的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.18-7,其具有含有与具有v82s、y123h(从h123y回复的y123h)和q154r突变(tada*8.18)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.19-7,其具有含有与具有v82s、y123h(从h123y回复的y123h)、y147r和q154r突变(tada*8.19)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.20-7,其具有含有与具有i76y、v82s、y123h(y123h从h123y回复)、y147r和q154r突变(tada*8.20)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.21-7,其具有含有与具有y147r和q154s突变(tada*8.21)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.22-7,其具有含有与具有v82s和q154s突变(tada*8.22)的tada*7.10融合的tada*7.10的异源二聚体构建体。在一些实施方案中,abe8是abe8.23-7,其具有含有与具有v82s和y123h(从h123y恢复的y123h)突变(tada*8.23)的tada*7.10融合的异源二聚体构建体。在一些实施方案中,abe8是abe8.24-7,其具有含有与具有v82s、y123h(从h123y回复的y123h)和y147t突变(tada*8.24)的tada*7.10融合的异源二聚体构建体。[1457]在一些实施方案中,abe是abe8.1-m、abe8.2-m、abe8.3-m、abe8.4-m、abe8.5-m、abe8.6-m、abe8.7-m、abe8.8-m、abe8.9-m、abe8.10-m、abe8.11-m、abe8.12-m、abe8.13-m、abe8.14-m、abe8.15-m、abe8.16-m、abe8.17-m、abe8.18-m、abe8.19-m、abe8.20-m、abe8.21-m、abe8.22-m、abe8.23-m、abe8.24-m、abe8.1-d、abe8.2-d、abe8.3-d、abe8.4-d、abe8.5-d、abe8.6-d、abe8.7-d、abe8.8-d、abe8.9-d、abe8.10-d、abe8.11-d、abe8.12-d、abe8.13-d、abe8.14-d、abe8.15-d、abe8.16-d、abe8.17-d、abe8.18-d、abe8.19-d、abe8.20-d、abe8.21-d、abe8.22-d、abe8.23-d或abe8.24-d,如下表7所示。[1458]表7:abe8碱基编辑器[1459][1460][1461]在一些实施方案中,碱基编辑器(例如,abe8)是通过将腺苷脱氨酶变体(例如,tada*8)克隆到包括环状置换的cas9(例如,cp5或cp6)和二分核定位序列的支架中来产生。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp5变体(化脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是agapamcp5变体(化脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp6变体(化脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如abe7.9、abe7.10或abe8)是agapamcp6变体(化脓链球菌cas9或spvrqrcas9)。[1462]在一些实施方案中,abe具有如下表8所示的基因型。[1463]表8.abe的基因型[1464]23263637484951728487105108123125142145147152155156157161abe7.9lrlnalnfsvnygncypvfnkabe7.10rrlnalnfsvnygacypvfnk[1465]如下表9所示,描述了40个abe8的基因型。指出了abe进化的大肠杆菌tada部分中的残留位置。当与abe7.10突变不同时,显示了abe8中的突变变化。在一些实施方案中,abe具有如下表9所示的abe之一的基因型。[1466]表9.进化的tada中的残基标识[1467][1468][1469]在一些实施方案中,碱基编辑器是abe8.1,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1470]abe8.1_y147t_cp5_ngcpam_单体[1471][1472][1473]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列。[1474]在一些实施方案中,碱基编辑器是abe8.1,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1475]pnmg-b335abe8.1_y147t_cp5_ngcpam_单体[1476][1477][1478]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列。[1479]在一些实施方案中,碱基编辑器是abe8.14,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1480]具有ngcpam的cp5pnmg-357_abe8.14[1481][1482]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分核定位序列。[1483]在一些实施方案中,碱基编辑器是abe8.8-m,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1484]abe8.8-m[1485][1486]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,及双底线序列表示突变。[1487]在一些实施方案中,碱基编辑器是abe8.8-d,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1488]abe8.8-d[1489][1490]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,及双底线序列表示突变。[1491]在一些实施方案中,碱基编辑器是abe8.13-m,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1492]abe8.13-m[1493][1494][1495]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1496]在一些实施方案中,碱基编辑器是abe8.13-d,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1497]abe8.13-d[1498][1499][1500]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1501]在一些实施方案中,碱基编辑器是abe8.17-m,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1502]abe8.17-m[1503][1504][1505]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1506]在一些实施方案中,碱基编辑器是abe8.17-d,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1507]abe8.17-d[1508][1509][1510]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1511]在一些实施方案中,碱基编辑器是abe8.20-m,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1512]abe8.20-m[1513][1514][1515]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1516]在一些实施方案中,碱基编辑器是abe8.20-d,其包括或基本上由以下具有腺苷脱氨酶活性的序列或其片段所组成:[1517]abe8.20-d[1518][1519][1520]以上序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,双底线序列表示突变。[1521]在一些实施方案中,本发明的abe8是选自由以下序列:[1522]01.monoabe8.1_bpnls+y147t[1523]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1524]02.monoabe8.1_bpnls+y147r[1525]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1526]03.monoabe8.1_bpnls+q154s[1527]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1528]04.monoabe8.1_bpnls+y123h[1529]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1530]05.monoabe8.1_bpnls+v82s[1531]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1532]06.monoabe8.1_bpnls+t166r[1533]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1534]07.monoabe8.1_bpnls+q154r[1535]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1536]08.monoabe8.1_bpnls+y147r_q154r_y123h[1537]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1538]09.monoabe8.1_bpnls+y147r_q154r_i76y[1539]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1540]10.monoabe8.1_bpnls+y147r_q154r_t166r[1541]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1542]11.monoabe8.1_bpnls+y147t_q154r[1543]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1544]12.monoabe8.1_bpnls+y147t_q154s[1545]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1546]13.monoabe8.1_bpnls+h123y123h_y147r_q154r_i76y[1547]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1548]14.monoabe8.1_bpnls+v82s+q154r[1549]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1550]在一些实施方案中,碱基编辑器是包括与核碱基编辑结构域(例如,脱氨酶结构域的全部或部分)融合的多核苷酸可编程的核苷酸结合结构域(例如,cas9源域)的融合蛋白。在某些实施方案中,本文所提供的融合蛋白包括一种或多种改善融合蛋白的碱基编辑活性的特征。例如,本文所提供的任何融合蛋白可以包括具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可具有不具有核酸酶活性的cas9结构域(dcas9)或切割双链dna分子的一条链的cas9结构域(称为cas9切口酶(ncas9))。[1551]在一些实施方案中,碱基编辑器进一步包括包含全部或部分尿嘧啶糖基化酶抑制剂(ugi)的结构域。在一些实施方案中,碱基编辑器包括包含尿嘧啶结合蛋白(ubp),诸如尿嘧啶dna糖基化酶(udg)的全部或部分的结构域。在一些实施方案中,碱基编辑器包括包含全部或部分核酸聚合酶的结构域。在一些实施方案中,掺入碱基编辑器的核酸聚合酶或其部分是跨损伤dna聚合酶。[1552]在一些实施方案中,碱基编辑器的域可以包括多个结构域。例如,包括衍生自cas9的多核苷酸可编程的核苷酸结合结构域的碱基编辑器可以包括对应于野生型或天然cas9的rec叶和nuc叶的rec叶和nuc叶。在另一个实例中,碱基编辑器可包括ruvci结构域、bh结构域、rec1结构域、rec2结构域、ruvcii结构域、l1结构域、hnh结构域、l2结构域、ruvciii结构域、wed结构域、topo结构域或ctd结构域中的一个或多个。在一些实施方案中,碱基编辑器的一个或多个结构域包括相对于包括所述结构域的多肽的野生型版本的突变(例如,取代、插入、缺失)。例如,多核苷酸可编程的dna结合结构域的hnh结构域可包括h840a取代。在另一个实例中,多核苷酸可编程的dna结合结构域的ruvci域可包括d10a取代。[1553]在使用或不使用一个或多个连接子结构域(例如,xten连接子结构域)的情况下,本文公开的碱基编辑器的不同结构域(例如,相邻结构域)可以彼此连接。在一些实施方案中,连接子结构域可以是键(例如共价键)、化学基团或连接两个分子或部分的分子,例如融合蛋白的两个结构域,例如第一结构域(例如,衍生自cas9的结构域)和第二结构域(例如,腺苷脱氨酶结构域)。在一些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺键的碳氮键。在某些实施方案中,连接子是环状或无环、经取代或未经取代、支链或无支链的脂族或杂脂族连接子。在某些实施方案中,连接子是聚合的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包括氨基链烷酸的单体、二聚体或聚合物。在一些实施方案中,连接子包括氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在一些实施方案中,连接子包括氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子是基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,连接子包括聚乙二醇部分(peg)。在某些实施方案中,连接子包括芳基或杂芳基部分。在某些实施方案中,连接子基于苯环。连接子可以包括功能化部分以促进亲核试剂(例如,硫醇、氨基)从肽连接到连接子。任何亲电子试剂都可以用作连接子的一部分。实施例性的亲电子试剂包括但不限于激活酯、激活酰胺、迈克尔受体(michaelreceptor)、卤代烷、芳基卤、酰基卤和异硫氰酸酯。在一些实施方案中,连接子连接rna可编程的核酸酶的grna结合结构域,包括cas9核酸酶结构域和核酸编辑蛋白的催化域。在一些实施方案中,连接子连接dcas9和第二结构域(例如,ugi等)。[1554]通常,连接子位于两个基团、分子或其他部分之间或侧边,并经由共价键与每个基团、分子或其他部分连接,从而将两者连接起来。在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子的长度为2至100个氨基酸,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30至35、35至40、40至45、45至50、50至60、60至70、70至80、80至90、90至100、100至150或150至200个氨基酸的长度。在一些实施方案中,连接子为约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸长度。更长或更短的连接子也被考虑。在一些实施方案中,连接子域包括氨基酸序列sgsetpgtsesatpes,其也可称为xten连接子。可以使用任何连接融合蛋白结构域的方法(例如,从柔性的(sggs)n、(gggs)n、(ggggs)n及(g)n形式的连接子到更刚性的连接子形式(eaaak)n、(ggs)n、sgsetpgtsesatpes(参见,例如guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;其全部内容通过引用方式并入本文)或(xp)n基序,以便实现核碱基编辑器活性的最佳长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包括(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的融合蛋白的cas9结构域经由包括氨基酸序列sgsetpgtsesatpes的连接子融合。在一些实施方案中,连接子包括多个脯氨酸残基并且长度是5至21、5至14、5至9、5至7种氨基酸,例如papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10(参见,例如tanj,zhangf,karcherd,bockr.engineeringofhigh-precisionbaseeditorsforsite-specificsinglenucleotidereplacement.natcommun.2019jan25;10(1):439;其全部内容通过引用方式并入本文)。这种富含脯氨酸的连接子也称为“刚性”连接子。[1555]本发明的融合蛋白包括核酸编辑结构域。在一些实施方案中,脱氨酶是腺苷脱氨酶。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人类脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶。[1556]如本文所用,“异源二聚体”可以指包括野生型tada结构域和变异tada*7.10结构域或两个变异tada结构域(例如,具有y147t和q154s改变的tada7.10和tada7.10)的融合蛋白改动。[1557]在一些实施方案中,碱基编辑器包括融合蛋白,所述融合蛋白包括内部融合或插入napdnabp的异源多肽。异源多肽(例如,脱氨酶)可以在合适的位置插入napdnabp(例如,cas9),例如,使得napdnabp保持其结合目标多核苷酸和向导核酸的能力。脱氨酶可以插入napdnabp而不损害脱氨酶的功能(例如碱基编辑活性)或napdnabp(例如结合目标核酸和向导核酸的能力)。如晶体学研究所示,脱氨酶可以插入napdnabp,例如无序区域或包括高温因子或b因子的区域。较不有序、无序或非结构化的蛋白质区域,例如溶剂暴露区域和环,可用于插入而不损害结构或功能。脱氨酶可以插入napdnabp的柔性环区域或溶剂暴露区域中。在一些实施方案中,将脱氨酶插入cas9多肽的柔性环。[1558]在一些实施方案中,脱氨酶的插入位置通过cas9多肽的晶体结构的b因子分析确定。在一些实施方案中,脱氨酶插入cas9多肽的包括高于平均b因子的区域中(例如,与包括无序区域的总蛋白质或蛋白质结构域相比,更高的b因子)。b因子或温度因子可以表示原子从其平均位置的波动(例如,由于温度相关的原子振动或晶格中的静态无序)。骨架原子的高b因子(例如,高于平均b因子)可以指示具有相对较高局部迁移率的区域。这样的区域可用于插入脱氨酶而不损害结构或功能。脱氨酶可以插入具有cα原子的的残基的位置,所述位置具有b因子比总蛋白质的平均b因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或大于200%。脱氨酶可以插入具有cα原子的残基的位置,所述位置具有b因子比包括残基的cas9蛋白结构域的平均b因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或超过200%。包括高于平均b因子的cas9多肽位置可以包括,例如,如编号为seqidno:1中编号为残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、12248。包括高于平均b因子的cas9多肽区域可包括例如seqidno:1中编号为残基792至872、792至906及2至791。[1559]异源多肽(例如脱氨酶)可以插入napdnabp的氨基酸残基处,所述氨基酸残基是选自由以下所组成的群组:在seqidno:1中编号为768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247及1248,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,异源多肽插入在seqidno:1中编号为氨基酸位置768至769、791至792、792至793、1015至1016、1022至1023、1026至1027、1029至1030、1040至1041、1052至1053、1067至1068、1068至1069、1247至1248或1248至1249如或其相应的氨基酸位置。在一些实施方案中,异源多肽插入在在seqidno:1中编号为氨基酸位置769至770、792至793、793至794、1016至1017、1023至1024、1027至1028、1030至1031、1041至1041、1052至1053、1055至1056、1068至1069、1069至1070、1248至1249、或1249至1250、1068至1069、1069至1070、1248至1249或1249至1250或其相应的氨基酸位置之间。在一些实施方案中,异源多肽置换选自由以下所组成的群组的氨基酸残基:在seqidno:1中编号为768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,或另一个cas9多肽中的相应的氨基酸残基。应当理解,关于插入位置对seqidno:1的引用是为了说明的目的。本文所讨论的插入不限于seqidno:1的cas9多肽序列,而是包括在变异cas9多肽中相应位置的插入,例如cas9切口酶(ncas9)、核酸酶死亡cas9(dcas9)、cas9变体缺少核酸酶结构域、截短的cas9或缺少部分或完整hnh结构域的cas9结构域。[1560]异源多肽(例如,脱氨酶)可以插入napdnabp中的氨基酸残基处,所述氨基酸残基选自以下所组成的群组:在seqidno:1中编号为768、792、1022、1026、1040、1068和1247,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,异源多肽插入在seqidno:1中编号为768至769、792至793、1022至1023、1026至1027、1029至1030、1040至1041、1068至1069或1248至1249或其相应的氨基酸位置之间。在一些实施方案中,异源多肽插入在seqidno:1编号为seq中的第769至770、793至794、1023至1024、1027至1028、1030至1031、1041至1042、1069至1070或1248至1249或其相应的氨基酸位置之间。在一些实施方案中,异源多肽置换选自由以下所组成的群组的氨基酸残基:在seqidno:1中编号为768、792、1022、1026、1040、1068和1247,或另一个cas9中的相应的氨基酸残基cas9。[1561]在一些实施方案中,abe(例如,tada)插入在选自由以下所组成的群组的氨基酸残基处:在seqidno:1中编号为1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052及1246,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe(例如,tada)被插入以代替在seqidno:1中编号为残基792至872、792至906或2至791,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在选自由以下所组成的群组的氨基酸的n端:在seqidno:1中编号为1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052及1246,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在选自由以下所组成的群组的氨基酸的c端:在seqidno:1中编号为1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052及1246,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以替换选自由以下所组成的群组的氨基酸:在seqidno:1中编号为1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052及1246,或另一个cas9多肽中的相应的氨基酸残基。[1562]在一些实施方案中,cbe(例如,apobec1)插入在选自由以下所组成的群组的氨基酸残基处:如在seqidno:1中编号为1016、1023、1029、1040、1069及1247,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在选自由以下所组成的群组的氨基酸的n端:在seqidno:1中编号为1016、1023、1029、1040、1069及1247,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在选自由以下所组成的群组的氨基酸的c端:如在seqidno:1中编号为1016、1023、1029、1040、1069和1247,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以替换选自由以下所组成的群组的氨基酸:如在seqidno:1中编号为1016、1023、1029、1040、1069及1247,或另一个cas9多肽中的相应的氨基酸残基。[1563]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基768处,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸768的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸768的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸768处,或另一个cas9多肽中的相应的氨基酸残基。[1564]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基791处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸791,或另一个cas9多肽中的相应的氨基酸残基的n端。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸791的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸791处,或另一个cas9多肽中的相应的氨基酸残基。[1565]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基792处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸792的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸792的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸792处,或另一个cas9多肽中的相应的氨基酸残基。[1566]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1016处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1016的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1016的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1016处,或另一个cas9多肽中的相应的氨基酸残基。[1567]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1022处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1022的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1022的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号的氨基酸1022,或另一个cas9多肽中的相应的氨基酸残基。[1568]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1023处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1023的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1023的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号的氨基酸1023处,或另一个cas9多肽中的相应的氨基酸残基。[1569]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1026处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1026的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1026的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1026处,或另一个cas9多肽中的相应的氨基酸残基。[1570]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1029处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1029的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1029的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1029处,或另一个cas9多肽中的相应的氨基酸残基。[1571]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1040处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸140的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1040的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1040处,或另一个cas9多肽中的相应的氨基酸残基。[1572]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1052处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1052的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1052的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1052处,或另一个cas9多肽中的相应的氨基酸残基。[1573]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1054处或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1054的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1054的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1054处,或另一个cas9多肽中的相应的氨基酸残基。[1574]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1067处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1067的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1067的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1067处,或另一个cas9多肽中的相应的氨基酸残基。[1575]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1068处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1068的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1068的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1068处,或另一个cas9多肽中的相应的氨基酸残基。[1576]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1069处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1069的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1069的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1069处,或另一个cas9多肽中的相应的氨基酸残基。[1577]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1246处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1246的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1246的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1246处,或另一个cas9多肽中的相应的氨基酸残基。[1578]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1247处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1247的n端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1247的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1247处,或另一个cas9多肽中的相应的氨基酸残基。[1579]在一些实施方案中,脱氨酶插入在seqidno:1中编号为氨基酸残基1248处,或另一个cas9多肽中的相应的氨基酸残基处。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1248或另一个cas9多肽中的相应的氨基酸残基的n端。在一些实施方案中,abe插入在seqidno:1中编号为氨基酸1248的c端,或另一个cas9多肽中的相应的氨基酸残基。在一些实施方案中,插入abe以置换在seqidno:1中编号为氨基酸1248处,或另一个cas9多肽中的相应的氨基酸残基。[1580]在一些实施方案中,异源多肽(例如,脱氨酶)被插入cas9多肽的柔性环中。柔性环部分可以选自如seqidno:1中编号为530至537、569至570、686至691、943至947、1002至1025、1052至1077、1232至1247、或1298至1300所组成的群组,或另一个cas9多肽中的相应的氨基酸残基。柔性环部分可以选自由以下所组成的群组:在seqidno:1中编号为1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231或1248至1297,或另一个cas9多肽中的相应的氨基酸残基。[1581]可以将异源多肽(例如脱氨酶)插入对应于以下氨基酸残基的cas9多肽区域:在seqidno:1中编号为1017至1069、1242至1247、1052至1056、1060至1077、1002至1003、943至947、530至537、568至579、686至691、1242至1247、1298至1300、1066至1077、1052至1056或1066至1077,或另一个cas9多肽中的相应的氨基酸残基。[1582]可以插入异源多肽(例如脱氨酶)代替cas9多肽的缺失区域。缺失区域可以对应于cas9多肽的n端或c端部分。在一些实施方案中,缺失区域对应于在seqidno:1中编号为残基792至872,或另一个cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区对应于在seqidno:1中编号为残基792至906,或另一个cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区域对应于在seqidno:1中编号为残基2至791,或另一个cas9多肽中的对应氨基酸残基。[1583]异源多肽(例如,脱氨酶)可以插入cas9多肽的结构域或功能域内。异源多肽(例如,脱氨酶)可以插入在cas9多肽的两个结构域或功能域之间。例如,在从cas9多肽删除结构域之后,可以插入异源多肽(例如,脱氨酶)代替cas9多肽的结构域或功能域。cas9多肽的结构域或功能域可以包括例如ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh。[1584]在一些实施方案中,cas9多肽缺乏一个或多个选自由以下所组成的群组的结构域:ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh结构域。在一些实施方案中,cas9多肽缺乏核酸酶结构域。在一些实施方案中,cas9多肽缺乏hnh结构域。在一些实施方案中,cas9多肽缺少hnh结构域的一部分,使得cas9多肽具有降低或消除的hnh活性。[1585]在一些实施方案中,cas9多肽包括核酸酶结构域的缺失并且插入脱氨酶以替代核酸酶结构域。在一些实施方案中,hnh结构域被删除并且脱氨酶被插入在其位置上。在一些实施方案中,删除一个或多个ruvc结构域,并且脱氨酶被插入在其位置上。[1586]napdnabp的n端和c端片段可在包括异源多肽的融合蛋白的侧边。在一些实施方案中,融合蛋白包括n端片段和c端片段在侧边脱氨酶的cas9多肽。n端片段或c端片段可以结合目标多核苷酸序列。n端片段的c端或c端片段的n端可包括cas9多肽的柔性环的一部分。n端片段的c端或c端片段的n端可包括cas9多肽的α-螺旋结构的一部分。n端片段或c端片段可包括dna结合结构域。n端片段或c端片段可包括ruvc结构域。n端片段或c端片段可包括hnh结构域。在一些实施方案中,n端片段和c端片段均不包括hnh结构域。[1587]在一些实施方案中,当融合蛋白使目标核碱基脱氨时,n端cas9片段的c端包括接近目标核碱基的氨基酸。在一些实施方案中,当融合蛋白使目标核碱基脱氨时,c端cas9片段的n端包括接近目标核碱基的氨基酸。不同脱氨酶的插入位置可以不同,以使目标核碱基与n端cas9片段的c端或c端cas9片段的n端的氨基酸接近。例如,abe的插入位置可以在选自由以下所组成的群组的氨基酸残基处:在seqidno:1中编号为1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、10546,或另一个cas9多肽中的相应的氨基酸残基。cbe的合适插入位置可以是选自由以下所组成的群组的氨基酸残基:在seqidno:1中编号为1016、1023、1029、1040、1069和1247,或另一个cas9中的相应的氨基酸残基多肽。在某些实施方案中,abe的插入可以插入以上列出的氨基酸残基中的任一个的n端或c端。在一些实施方案中,可以插入abe的插入以替换以上列出的氨基酸残基中的任何一个。[1588]融合蛋白的n端cas9片段(即在融合蛋白中的脱氨酶侧边n端cas9片段)可包括cas9多肽的n端。融合蛋白的n端cas9片段可包括至少约:100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的n端cas9片段可包括对应于以下氨基酸残基的序列:在seqidno:1中编号为1至56、1至95、1至200、1至300、1至400、1至500、1至600、1至700、1至718、1至765、1至780、1至906、1至918或1至1100,或另一个cas9多肽中的相应的氨基酸残基。n端cas9片段可包括的序列包括与在seqidno:1中编号为氨基酸残基:1至56、1至95、1至200、1至300、1至400、1至500、1至600、1至700、1至718、1至765、1至780、1至906、1至918或1至1100或在另一个cas9多肽中的相应的氨基酸残基至少:85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性与。[1589]融合蛋白的c端cas9片段(在融合蛋白中的脱氨酶侧边n端cas9片段)可包括cas9多肽的c端。融合蛋白的c端cas9片段可包括至少约:100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的c端cas9片段可包括对应于以下氨基酸残基的序列:在seqidno:1中编号为1099至1368、918至1368、906至1368、780至1368、765至1368、718至1368、94至1368或56至1368或另一个cas9多肽中的相应的氨基酸残基。n端cas9片段可包括的序列包括与在seqidno:1中编号为氨基酸残基:1099至1368、918至1368、906至1368、780至1368、765至1368、718至1368、94至1368或56至1368或另一个cas9多肽中的相应的氨基酸残基至少:85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。[1590]融合蛋白的n端cas9片段和c端cas9片段合在一起可能不对应于全长天然存在的cas9多肽序列,例如,在seqidno:1中所示者。[1591]本文所述融合蛋白可以通过减少非目标位点(例如,脱靶位点)的脱氨,例如减少全基因组的假脱氨来实现靶向脱氨。本文所述融合蛋白可以在非目标位点处以减少的旁观者脱氨实现靶向脱氨。不希望的脱氨或脱靶脱氨可以减少至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%与例如包括与cas9多肽的n端或c端融合的脱氨酶的末端融合蛋白相比。不需要的脱氨或脱靶脱氨可以减少至少一倍、至少两倍、至少三倍、至少四倍、至少五倍、至少十倍、至少十五倍、至少二十倍、至少三十倍、至少四十倍、至少五十倍、至少60倍、至少70倍、至少80倍、至少90倍或至少一百倍,相比之下,例如,包括与cas9多肽的n端或c端融合的脱氨酶的末端融合蛋白。[1592]在一些实施方案中,融合蛋白的脱氨酶使r环范围内不超过两个核碱基脱氨。在一些实施方案中,融合蛋白的脱氨酶使r环范围内不超过三个核碱基脱氨。在一些实施方案中,融合蛋白的脱氨酶使r环范围内不超过2、3、4、5、6、7、8、9或10个核碱基脱氨。r环是三链核酸结构,包含dna:rna杂交体、dna:dna或rna:rna互补结构以及与单链dna相关的结构。如本文所用,当目标多核苷酸与crispr复合物或碱基编辑复合物接触时,可以形成r环,其中向导多核苷酸的一部分(例如向导rna)与目标多核苷酸的一部分杂交并置换,例如,目标dna。在一些实施方案中,r-环包括间隔序列和目标dna互补序列的杂交区域。r环区可以是长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个碱基对。在一些实施方案中,r-环区的长度为约20个核碱基对。应当理解,如本文所用,r-环区不限于与向导多核苷酸杂交的目标dna链。例如,r-环区域内的目标核碱基的编辑可以针对包括与向导rna互补链的dna链,或者可以针对作为与向导rna互补的链的相反链的dna链。在一些实施方案中,在r环区域中编辑包括将非互补链(前间隔链)上的核碱基编辑为目标dna序列中的向导rna。[1593]本文所述融合蛋白可以在不同于规范碱基编辑的编辑窗口中实现目标脱氨。在一些实施方案中,目标核碱基在目标多核苷酸序列中pam序列上游约1至约20个碱基。在一些实施方案中,目标核碱基位于目标多核苷酸序列中pam序列上游的约2至约12个碱基。在一些实施方案中,目标核碱基远离在目标多核苷酸序列中pam序列上游为约1至9个碱基对、约2至10个碱基对、约3至11个碱基对、约4至12个碱基对、约5至13个碱基对、约6至14个碱基对、约7至15个碱基对、约8至16个碱基对、约9至17个碱基对、约10至18个碱基对、约11至19个碱基对、约12至20个碱基对、约1至7个碱基对、约2至8个碱基对、约3至9个碱基对、约4至10个碱基对、约5至11个碱基对、约6至12个碱基对、约7至13个碱基对、约8至14个碱基对、约9至15个碱基对、约10至16个碱基对、约11至17个碱基对、约12至18个碱基对、约13至19个碱基对、约14至20个碱基对、约1至5个碱基对、约2个至6个碱基对、约3至7个碱基对、约4至8个碱基对、约5至9个碱基对、约6至10个碱基对、约7至11个碱基对、约8至12个碱基对、约9至13个碱基对、大约10到14个碱基对、大约11至15个碱基对、约12至16个碱基对、约13至17个碱基对、约14至18个碱基对、约15至19个碱基对、约16至20个碱基对、约1至3个碱基对、约2至4个碱基对约3至5个碱基对、约4至6个碱基对、约5至7个碱基对、约6至8个碱基对、约7至9个碱基对、约8至10个碱基对、约9至11个碱基对、约10至12个碱基对、约11至13个碱基对、约12至14个碱基对、约13至15个碱基对、约14至16个碱基对、约15至17个碱基对、约16至18个碱基对、大约17至19个碱基对、约18到20个碱基对。在一些实施方案中,目标核碱基是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多碱基对远离或上游pam序列。在一些实施方案中,目标核碱基是pam序列上游的约1、2、3、4、5、6、7、8或9个碱基对。在一些实施方案中,目标核碱基是pam序列上游约2、3、4或6个碱基对。[1594]因此,本文还提供融合蛋白文库和使用其优化碱基编辑的方法,与经典碱基编辑器相比,允许替代的优选碱基编辑窗口,例如be4。在一些实施方案中,本公开提供用于优化碱基编辑的蛋白质文库,其包括多个融合蛋白,其中所述多个融合蛋白中的每一个都包括脱氨酶的n端片段和c端片段在侧边的cas9多肽,其中所述融合蛋白中的每一种的n端片段不同于多种融合蛋白的其余部分的n端片段,或者其中所述融合蛋白中的每一种的c端片段不同于c端多种融合蛋白的其余片段,其中每个融合蛋白的脱氨酶使目标核碱基在目标多核苷酸序列中的前间隔邻近基序(pam)序列附近脱氨,并且其中n端片段或c端片段结合目标多核苷酸序列。在一些实施方案中,对于crisprr环内的每个核碱基,多个融合蛋白中的至少一个使核碱基脱氨。在一些实施方案中,对于距离pam序列1至20个碱基对的目标多核苷酸内的每个核碱基,多个融合蛋白中的至少一个使核碱基脱氨。在一些实施方案中,本文所提供包括允许优化碱基编辑的融合蛋白文库的试剂盒。[1595]融合蛋白可包括多于一种异源多肽。例如,融合蛋白可以另外包括一个或多个ugi结构域和/或一个或多个核定位信号。两个或多个异源域可以串联插入。两个或更多个异源结构域可以插入在这样的位置,使得它们在napdnabp中不串联。[1596]在一些实施方案中,碱基编辑器包括融合蛋白,所述融合蛋白包括napdnabp结构域(例如cas12源结构域)和内部融合的核碱基编辑结构域(例如脱氨酶结构域的全部或部分)。在一些实施方案中,napdnabp是cas12b。在一些实施方案中,碱基编辑器包括具有插入在下表a中提供的基因座处的内部融合的tada*8结构域的bhcas12b结构域。[1597]表a:cas12b蛋白中的插入位点[1598][1599][1600]在一些实施方案中,碱基编辑器可以包括多个结构域。例如,包括衍生自cas12蛋白的napdnabp结构域的碱基编辑器可包括对应于野生型或天然cas12的rec叶和nuc叶的rec叶和nuc叶。在另一个实例中,碱基编辑器可以包括一个或多个ruvc结构域wed结构域。在一些实施方案中,碱基编辑器的一个或多个结构域包括相对于包括所述结构域的多肽的野生型版本的突变(例如,取代、插入、缺失)。[1601]本发明的融合蛋白包括核酸编辑结构域。在一些实施方案中,核酸编辑结构域可以催化c至u碱基的变化。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna-编辑复合物(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobec1脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。[1602]在一些实施方案中,脱氨酶是激活诱导的脱氨酶(aid)。[1603]在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人类脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如,rapobecl。在一些实施方案中,脱氨酶是海七鳗胞苷脱氨酶1(pmcda1)。在一些实施方案中,脱氨酶是人类apobec3g。在一些实施方案中,脱氨酶是人类apobec3g的片段。在一些实施方案中,脱氨酶是包括d316r和d317r突变的人类apobec3g变体。在一些实施方案中,脱氨酶是人类apobec3g的片段,并且包括对应于d316r和d317r突变的突变。在一些实施方案中,核酸编辑结构域是与本文所述任何脱氨酶的脱氨酶结构域至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%,或至少99.5%相同。[1604]连接子[1605]在某些实施方案中,连接子可用于连接本发明的任何肽或肽结构域。连接子可以像共价键一样简单,或者它可以是多个原子长度的聚合连接子。在某些实施方案中,连接子是多肽或基于氨基酸。在其他实施方案中,连接子不是肽样的。在某些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺键的碳-氮键。在某些实施方案中,连接子是环状或无环、取代或未取代、支链或未支链的脂族或杂脂族连接子。在某些实施方案中,连接子是聚合的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包括氨基链烷酸的单体、二聚体或聚合物。在某些实施方案中,连接子包括氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在某些实施方案中,连接子包括氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,连接子包括聚乙二醇部分(peg)。在其他实施方案中,连接子包括氨基酸。在某些实施方案中,连接子包括肽。在某些实施方案中,连接子包括芳基或杂芳基部分。在某些实施方案中,连接子基于苯环。连接子可以包括功能化部分以促进亲核试剂(例如,硫醇、氨基)从肽连接到连接子。任何亲电子试剂都可以用作连接子的一部分。实施例性的亲电子试剂包括但不限于激活酯、激活酰胺、迈克尔受体、卤代烷、芳基卤、酰基卤和异硫氰酸酯。[1606]在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是键(例如共价键)、有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子的长度为约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸。[1607]在一些实施方案中,腺苷脱氨酶和napdnabp通过长度为4、16、32或104个氨基酸的连接子融合。在一些实施方案中,连接子的长度为约3至约104个氨基酸。在一些实施方案中,本文所提供的任何融合蛋白包括经由连接子彼此融合的腺苷脱氨酶和cas9结构域。可以采用脱氨酶结构域(例如,工程化的ectada)和cas9结构域之间的各种连接子长度和灵活性(例如,范围是从(gggs)n、(ggggs)n及(g)n形式的非常灵活的连接子到(eaaak)n、(sggs)n、sgsetpgtsesatpes形式的更刚性连接子(参见,例如guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;其全部内容通过引用方式并入本文)和(xp)n)以实现核碱基编辑器活性的最佳长度。在一些实施例中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施例中,连接子包括(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的任何融合蛋白的腺苷脱氨酶和cas9结构域经由包括氨基酸序列sgsetpgtsesatpes的连接子(例如,xten连接子)融合。[1608]cas9与向导rna的复合物[1609]本公开的一些方面提供包括本文所提供的任何融合蛋白和结合融合蛋白的cas9结构域(例如,dcas9、核酸酶活性cas9或cas9切口酶)的向导rna(例如靶向a突变的向导)。这些复合物也称为核糖核蛋白(rnp)。可以使用任何连接融合蛋白结构域的方法(例如,范围是从非常灵活的(gggs)n、(ggggs)n和(g)n形式的连接子到更刚性的(eaaak)n、(sggs)n、sgsetpgtsesatpes形式的连接子(参见,例如guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;其全部内容以引用方式并入本文)和(xp)n)以实现核碱基编辑器活性的最佳长度。在一些实施例中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包括(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的融合蛋白的cas9结构域通过包括氨基酸序列的连接子融合sgsetpgtsesatpes。[1610]在一些实施方案中,向导核酸(例如向导rna)的长度为15至100个核苷酸并且包括与目标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,向导rna的长度是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中,向导rna包括与目标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸。在一些实施方案中,目标序列是dna序列。在一些实施方案中,目标序列是细菌、酵母、真菌、昆虫、植物或动物的基因组中的序列。在一些实施方案中,目标序列是人类基因组中的序列。在一些实施方案中,目标序列的3'端紧邻规范pam序列(ngg)。在一些实施方案中,目标序列的3'端紧邻非规规范pam序列(例如,表1列出的序列或5'-naa-3')。在一些实施方案中,向导核酸(例如,向导rna)与感兴趣的基因(例如,与疾病或病症相关的基因)中的序列互补。[1611]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括使dna分子与本文所提供的任何融合蛋白和至少一种向导rna接触的方法,其中所述向导rna约15至100个核苷酸长并且包括至少与目标序列互补的10个连续核苷酸。在一些实施方案中,目标序列的3'端紧邻规范pam序列(ngg)。在一些实施方案中,目标序列的3'端不与规范pam序列(ngg)紧邻。在一些实施方案中,目标序列的3'端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,目标序列的3'端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[1612]应当理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,成熟蛋白质的前体和成熟蛋白质本身,物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过序列比对和同源残基的测定,识别任何同源蛋白质和相应编码核酸中的相应残基。[1613]对于本领域技术人员将是显而易见的是,为了将本文公开的任何融合蛋白靶向目标位点,例如包括待编辑突变的位点,通常需要共表达融合蛋白和向导rna。如本文别处更详细解释的,向导rna通常包括允许cas9结合的tracrrna框架和赋予cas9:核酸编辑酶/结构域融合蛋白序列特异性的向导序列。或者,向导rna和tracrrna可以作为两个核酸分子分开提供。在一些实施方案中,向导rna包括一种结构,其中向导序列包括与目标序列互补的序列。向导序列的长度通常为20个核苷酸。基于本公开,用于将cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组目标位点的合适的向导rna的序列对于本领域技术人员来说将是显而易见的。此类合适的向导rna序列通常包括与待编辑的目标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供一些适用于将任何提供的融合蛋白靶向特定目标序列的实施例性向导rna序列。[1614]使用包括腺苷脱氨酶变体和cas9结构域的融合蛋白的方法[1615]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括使编码蛋白质的突变形式的dna分子与本文所提供的任何融合蛋白和至少一种向导rna接触的方法,其中所述向导rna约15至100个核苷酸长,并且包括与目标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,目标序列的3'端紧邻规范pam序列(ngg)。在一些实施方案中,目标序列的3'端不与规范pam序列(ngg)紧邻。在一些实施方案中,目标序列的3'端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,目标序列的3'端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[1616]应将理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,成熟蛋白质的前体和成熟蛋白质本身,物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过序列比对和同源残基的测定,识别任何同源蛋白质和相应编码核酸中的相应残基。[1617]对本领域技术人员来说将是显而易见的是,为了将如本文公开的包括cas9结构域和腺苷脱氨酶变体(例如,abe8)的任何融合蛋白靶向目标位点,例如,包括对于要编辑的突变,通常需要将融合蛋白与向导rna(例如sgrna)共表达。如本文别处更详细解释的,向导rna通常包括允许cas9结合的tracrrna框架和赋予cas9:核酸编辑酶/结构域融合蛋白序列特异性的向导序列。或者,向导rna和tracrrna可以作为两个核酸分子分开提供。在一些实施方案中,向导rna包括一种结构,其中向导序列包括与目标序列互补的序列。向导序列通常为20个核苷酸长。基于本公开,用于将cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组目标位点的合适的向导rna的序列对于本领域技术人员来说将是显而易见的。此类合适的向导rna序列通常包括与待编辑的目标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供一些适用于将任何提供的融合蛋白靶向特定目标序列的实施例性向导rna序列。[1618]cas12与向导rna的复合物[1619]本公开的一些方面提供包括本文所提供的任何融合蛋白和向导rna(例如,靶向用于编辑的目标多核苷酸的向导)的复合物。[1620]在一些实施方案中,向导核酸(例如向导rna)为15至100个核苷酸的长,并且包括与目标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,向导rna是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,向导rna包括与目标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸。在一些实施方案中,目标序列是dna序列。在一些实施方案中,目标序列是细菌、酵母、真菌、昆虫、植物或动物的基因组中的序列。在一些实施方案中,目标序列是人类基因组中的序列。在一些实施方案中,目标序列的3'端紧邻规范pam序列。在一些实施方案中,目标序列的3'端紧邻非规规范pam序列。[1621]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括使dna分子与本文所提供的任何融合蛋白和至少一种向导rna接触的方法,其中向导rna约15至100个核苷酸长,并且包括至少与目标序列互补的10个连续核苷酸。在一些实施方案中,目标序列的3'端紧邻例如ttn、dttn、gttn、attn、attc、dttnt、wttn、haty、tttn、tttv、tttc、tg、rtr或ytnpam位点。[1622]应将理解,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,成熟蛋白质的前体和成熟蛋白质本身,物种之间的序列差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过序列比对和同源残基的测定,识别任何同源蛋白质和相应编码核酸中的相应残基。[1623]对于本领域技术人员将是显而易见的是,为了将本文公开的任何融合蛋白靶向目标位点,例如包括待编辑突变的位点,通常需要共表达融合蛋白和向导rna。如本文别处更详细解释的,向导rna通常包括允许cas12结合的tracrrna框架和赋予cas12:核酸编辑酶/结构域融合蛋白序列特异性的向导序列。或者,向导rna和tracrrna可以作为两个核酸分子分开提供。在一些实施方案中,向导rna包括一种结构,其中向导序列包括与目标序列互补的序列。向导序列的长度通常为20个核苷酸。基于本公开,用于将cas12:核酸编辑酶/结构域融合蛋白靶向特定基因组目标位点的合适的向导rna的序列对于本领域技术人员来说将是显而易见的。此类合适的向导rna序列通常包括与待编辑的目标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供一些适用于将任何提供的融合蛋白靶向特定目标序列的实施例性向导rna序列。[1624]本文公开的碱基编辑器的结构域可以以任何顺序排列,只要脱氨酶结构域内化在cas12蛋白中即可。包括融合蛋白的碱基编辑器的非限制性实例可以排列如下:[1625]nh2-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12结构域]-cooh;[1626]nh2-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-cooh;[1627]nh2-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-cooh;[1628]nh2-[cas12结构域]-[abe8]-[cas12结构域]-cooh;[1629]nh2-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12域]-[肌苷ber抑制剂]-cooh;[1630]nh2-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1631]nh2-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1632]nh2-[cas12结构域]-[abe8]-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1633]nh2-[肌苷ber抑制剂]-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12结构域]-cooh;[1634]nh2-[肌苷ber抑制剂]-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-cooh;[1635]nh2-[肌苷ber抑制剂]-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-cooh;[1636]nh2-[肌苷ber抑制剂]nh2-[cas12结构域]-[abe8]-[cas12结构域]-cooh;[1637]此外,在某些情况下,gam蛋白可以与碱基编辑器的n端融合。在某些情况下,gam蛋白可以与碱基编辑器的c端融合。噬菌体mu的gam蛋白可以与双链断裂(dsb)的末端结合并保护它们免于降解。在一些实施方案中,使用gam结合dsb的自由端可以减少碱基编辑过程中插入缺失的形成。在一些实施方案中,174个残基的gam蛋白与碱基编辑器的n端融合。看。参见,komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在某些情况下,一个或多个突变可以改变碱基编辑器域相对于野生型结构域的长度。例如,在至少一个结构域中删除至少一个氨基酸可以减少碱基编辑器的长度。在另一种情况下,一个或多个突变不改变域相对于野生型结构域的长度。例如,任何结构域中的取代都不会改变碱基编辑器的长度。此类碱基编辑器的非限制性实例(其中所有结构域的长度与野生型结构域的长度相同)可包含:[1638]nh2-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12结构域]-cooh;[1639]nh2-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-cooh;[1640]nh2-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-cooh;[1641]nh2-[cas12结构域]-[apobec1]-[cas12结构域]-cooh;[1642]nh2-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12域]-[ugi]-cooh;[1643]nh2-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-[ugi]-cooh;[1644]nh2-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-[ugi]-cooh;[1645]nh2-[cas12结构域]-[apobec1]-[cas12结构域]-[ugi]-cooh;[1646]nh2-[ugi]-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12结构域]-cooh;[1647]nh2-[ugi]-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-cooh;[1648]nh2-[ugi]-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-cooh;[1649]nh2-[ugi]-[cas12结构域]-[apobec1]-[cas12结构域]-cooh;[1650]在一些实施方案中,本文所提供的碱基编辑融合蛋白需要位于精确位置,例如,目标碱基位于限定区域(例如,“脱氨窗口”)内的位置。在某些情况下,目标可以在4个碱基区域内。在某些情况下,这种定义的目标区域可以位于pam上游大约15个碱基处。参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其全部内容特此引入作为参考。[1651]定义的目标区域可以是脱氨窗口。脱氨窗口可以是其中碱基编辑器作用于目标核苷酸并使其脱氨的限定区域。在一些实施例中,脱氨窗口在2、3、4、5、6、7、8、9或10个碱基区域内。在一些实施例中,脱氨窗为pam上游的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基。[1652]本公开的碱基编辑器可以包括有助于编辑目标多核苷酸序列的任何结构域、特征或氨基酸序列。例如,在一些实施例中,碱基编辑器包括核定位序列(nls)。在一些实施方案中,碱基编辑器的nls位于脱氨酶结构域和napdnabp结构域之间。在一些实施方案中,碱基编辑器的nls位于napdnabp结构域的c端。[1653]融合蛋白中包括的蛋白质结构域可以是异源功能域。可包括在融合蛋白中的蛋白质结构域的非限制性实例包括脱氨酶结构域(例如胞苷脱氨酶和/或腺苷脱氨酶)、尿嘧啶糖基化酶抑制剂(ugi)结构域、表位标签和报告基因序列。蛋白质结构域可以是异源功能域,例如,具有一种或多种以下活性:转录激活活性、转录抑制活性、转录释放因子活性、基因沉默活性、染色质修饰活性、表观遗传修饰活性、组蛋白修饰活性,rna切割活性和核酸结合活性。此类异源功能域可赋予功能活性,例如修饰与目标dna(例如组蛋白、dna结合蛋白等)相关的目标多肽,导致例如组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。赋予的其他功能和/或活性可包括转座酶活性、整合酶活性、重组酶活性、连接酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、sumo化活性、去sumo化活性,或上述的任何组合。[1654]可以用表位标签、报告蛋白、其他结合结构域检测或标记结构域。表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。报告基因的例子包括但不限于谷胱甘肽-5-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)β-半乳糖基化酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青色荧光蛋白(cfp)、黄色荧光蛋白(yfp)及包括蓝色荧光蛋白(bfp)的自发荧光蛋白。额外的蛋白质序列可以包括结合dna分子或结合其他细胞分子的氨基酸序列,包括但不限于麦芽糖结合蛋白(mbp)、s-标签、lexadna结合结构域(dbd)融合、gal4dna结合结构域融合、和单纯疱疹病毒(hsv)bp16蛋白融合。[1655]在一些实施方案中,bhcas12b向导多核苷酸具有以下序列:[1656]bhcas12bsgrna支架(底线)+20核苷酸至23核苷酸向导序列(用nn表示)[1657]5’gttctgtcttttggtcaggacaaccgtctagctataagtgctgcagggtgtgagaaactcctattgctggacgatgtctcttacgaggcattagcacnnnnnnnnnnnnnnnnnnnn-3’[1658]在一些实施方案中,bvcas12b和aacas12b向导多核苷酸具有以下序列:[1659]bvcas12bsgrna支架(底线)+20核苷酸至23核苷酸向导序列(用nn表示)[1660]5’gacctatagggtcaatgaatctgtgcgtgtgccataagtaattaaaaattacccaccacaggagcacctgaaaacaggtgcttggcacnnnnnnnnnnnnnnnnnnnn-3’[1661]aacas12bsgrna支架(底线)+20核苷酸至23核苷酸向导序列(用nn表示)[1662]5’gtctaaaggacagaatttttcaacgggtgtgccaatggccactttccaggtggcaaagcccgttgaacttctcaaaaagaacgatctgagaagtggcacnnnnnnnnnnnnnnnnnnnn-3’[1663]碱基编辑器效率[1664]crispr-cas9核酸酶已被广泛用于介导靶向的基因组编辑。在大多数基因组编辑应用中,cas9与向导多核苷酸(例如单向导rna(sgrna))形成复合物,并在sgrna序列指定的目标位点诱导双链dna断裂(dsb)。细胞主要通过非同源末端连接(nhej)修复途径对这种dsb做出反应,这会导致随机插入或缺失(indel),从而导致移码突变破坏基因。在存在与dsb侧边序列高度同源的供体dna模板的情况下,可以通过称为同源性定向修复(hdr)的替代途径实现基因校正。不幸的是,在大多数非扰动条件下,hdr效率低下,取决于细胞状态和细胞类型,并且由更高频率的插入缺失主导。由于与人类疾病相关的大多数已知遗传变异都是点突变,因此需要能够更有效、更干净地进行精确点突变的方法。本文所提供的碱基编辑系统提供一种提供基因组编辑的新方法,所述方法无需产生双链dna断裂,无需供体dna模板,也无需诱导过量的随机插入和缺失。[1665]本发明的融合蛋白有利地修饰编码包括突变的蛋白质的特定核苷酸碱基,而不产生显着比例的插入缺失。如本文所用,“插入缺失”是指核酸内核苷酸碱基的插入或缺失。这种插入或缺失可导致基因编码区内的移码突变。在一些实施方案中,期望产生有效修饰(例如,突变或脱氨)核酸内的特定核苷酸而不在核酸中产生大量插入或缺失(即,插入缺失)的碱基编辑器。在某些实施方案中,本文所提供的任何碱基编辑器与插入缺失相比能够产生更大比例的预期修饰(例如,突变或脱氨)。[1666]在一些实施方案中,本文所提供的任何碱基编辑器系统导致在目标多核苷酸序列中形成小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失。[1667]在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的碱基编辑器系统中的任一个导致在目标多核苷酸序列中形成小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失。在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑器系统导致目标多核苷酸序列中小于0.8%的插入缺失形成。在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑器系统导致目标多核苷酸序列中至多0.8%的插入缺失形成。在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑器系统导致目标多核苷酸序列中小于0.3%的插入缺失形成。在一些实施方案中,与包括abe7碱基编辑器之一的碱基编辑器系统相比,包括所述abe8碱基编辑器变体之一的任何碱基编辑器系统导致目标多核苷酸序列中较低的插入缺失形成。在一些实施方案中,与包括abe7.10的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑器系统导致目标多核苷酸序列中较低的插入缺失形成。[1668]在一些实施方案中,与包括abe7碱基编辑器之一的碱基编辑器系统相比,包括本文所述的abe8碱基编辑器变体之一的任何碱基编辑器系统具有降低的插入/缺失频率。在一些实施方案中,与包括abe7碱基编辑器之一的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑器系统具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的插入缺失频率降低。在一些实施方案中,与包括abe7.10的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的碱基编辑器系统具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的插入/缺失频率降低。[1669]本发明提供具有增加的效率和特异性的腺苷脱氨酶变体(例如,abe8变体)。特别地,本文所述腺苷脱氨酶变体更有可能编辑多核苷酸内的所需碱基,并且不太可能编辑不打算在碱基编辑窗口中改变的碱基(例如,“旁观者”)。[1670]在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统具有减少的旁观者编辑或突变。在一些实施方案中,非预期编辑或突变是旁观者突变或旁观者编辑,例如目标核苷酸序列的靶窗口中非预期或非靶位置中的目标碱基(例如,a或c)的碱基编辑。在一些实施方案中,与包括abe7碱基编辑器(例如abe7.10)的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统具有减少的旁观者编辑或突变。在一些实施方案中,与包括abe7碱基编辑器(例如abe7.10)的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统已将旁观者编辑或突变减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一些实施方案中,与包括abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统已将旁观者编辑或突变减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍。[1671]在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统已减少了虚假编辑。在一些实施方案中,非预期编辑或突变是虚假突变或虚假编辑,例如,非特异性编辑或向导独立编辑基因组的非预期或非目标区域中的目标碱基(例如,a或c)。在一些实施方案中,与包括abe7碱基编辑器(例如abe7.10)的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统具有减少的虚假编辑。在一些实施方案中,与包括abe7碱基编辑器的系统(例如abe7.10)的碱基编辑器相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统已将虚假编辑减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一些实施方案中,与包括abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的任何碱基编辑系统已将虚假编辑减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍。[1672]本公开的一些方面基于以下认识:本文所提供的任何碱基编辑器能够有效地在核酸(例如,受试者基因组内的核酸)中产生预期突变,例如点突变不会产生大量意外突变,例如意外点突变(即旁观者的突变)。在一些实施方案中,本文所提供的任何碱基编辑器能够产生至少0.01%的预期突变(即,至少0.01%的碱基编辑效率)。在一些实施方案中,本文所提供的任何碱基编辑器能够产生至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。[1673]在一些实施方案中,本文所述任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的碱基编辑效率。在一些实施方案中,碱基编辑效率可以通过计算细胞群中编辑的核碱基的百分比来测量。在一些实施方案中,如通过细胞群中编辑的核碱基所测量,本文所述任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。[1674]在一些实施方案中,与abe7碱基编辑器(例如abe7.10)相比,本文所述任何abe8碱基编辑器变体具有更高的碱基编辑效率。在一些实施方案中,本文所述任何abe8碱基编辑器变体具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%,至少340%,至少350%,至少360%,至少370%,至少380%,至少390%、至少400%、至少450%或至少500%。[1675]在一些实施方案中,与abe7碱基编辑器例如abe7.10相比本文所述任何abe8碱基编辑器变体具有至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍高的碱基编辑效率。[1676]在一些实施方案中,本文所述任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的靶向碱基编辑效率。在一些实施方案中,如由细胞群中的编辑的目标核碱基所测量,本文所述任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的靶上碱基编辑效率。[1677]在一些实施方案中,与abe7碱基编辑器相比,本文所述任何abe8碱基编辑器变体具有更高的目标碱基编辑效率。在一些实施方案中,与abe7碱基编辑器(例如abe7.10)相比,本文所述任何abe8碱基编辑器变体具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%,至少340%,至少350%,至少360%,至少370%,至少380%,至少高390%、至少400%、至少450%、或至少500%的靶上碱基编辑效率。[1678]在一些实施方案中,与abe7碱基编辑器(例如abe7.10)相比,本文所述任何abe8碱基编辑器变体具有至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍高的靶上碱基编辑效率。[1679]本文所述abe8碱基编辑器变体可经由质粒、载体、lnp复合物或mrna递送至宿主细胞。在一些实施方案中,本文所述任何abe8碱基编辑器变体作为mrna递送至宿主细胞。在一些实施方案中,如由编辑的核碱基所测量,经由基于核酸的递送系统(例如mrna)递送的abe8碱基编辑器具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的靶上编辑效率。在一些实施方案中,与由质粒或载体系统递送的abe8碱基编辑器相比,由mrna系统递送的abe8碱基编辑器具有更高的碱基编辑效率。在一些实施方案中,与由质粒或载体系统递送时相比,本文所述任何abe8碱基编辑器变体当由mrna系统递送时具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%,至少240%,至少250%,至少260%,至少270%,至少280%,至少290%,至少300%,至少310%,至少320%,至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的靶上编辑效率。在一些实施方案中,与由质粒或载体系统递送时相比,本文所述任何abe8碱基编辑器变体当由mrna系统递送时具有至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍高的靶上编辑效率。[1680]在一些实施方案中,包括本文所述abe8碱基编辑器变体之一的碱基编辑器系统中的任一个导致在目标多核苷酸序列中的小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小withoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);其全部内容特此通过引用方式并入。[1685]在一些实施方案中,为了计算插入缺失频率,扫描测序读数以寻找与两个10个碱基序列的精确匹配,所述两个10个碱基序列在可以发生插入缺失的窗口侧边。若未找到完全匹配,则从分析中排除读取。如果此插入缺失窗口的长度与参考序列完全匹配,则读取被归类为不包括插入缺失。如果插入缺失窗口比参考序列长或短两个或更多个碱基,则测序读数分别被归类为插入或缺失。在一些实施方案中,本文所提供的碱基编辑器可以限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域位于碱基编辑器靶向的核苷酸处或碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。[1686]在目标核苷酸区域形成的插入缺失的数量可取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,在将目标核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天后测定插入缺失的数量或比例。应当理解,如本文所述碱基编辑器的特征可应用于任何融合蛋白或使用本文所提供的融合蛋白的方法。[1687]在一些实施方案中,本文所提供的碱基编辑器能够限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域位于碱基编辑器靶向的核苷酸处或碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。在一些实施方案中,本文所提供的任何碱基编辑器能够将核酸区域处插入缺失的形成限制为小于1%、小于1.5%、小于2%、小于2.5%、小于3%、小于3.5%、小于4%、小于4.5%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于12%、小于15%或小于20%。在核酸区域形成的插入缺失的数量可取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天后测定插入缺失的数量或比例。[1688]本公开的一些方面基于本文所提供的任何碱基编辑器能够有效地在核酸(例如,受试者基因组内的核酸)中产生预期突变而不产生大量非预期突变的认知。突变(例如,虚假的脱靶编辑或旁观者编辑)。在一些实施方案中,预期突变是由专门设计用于改变或校正目标基因中的突变的与grna结合的特定碱基编辑器产生的突变。在一些实施方案中,预期突变是由与grna结合的特定碱基编辑器产生的突变,专门设计用于改变或校正hbg突变。[1689]在一些实施方案中,本文所提供的任何碱基编辑器能够产生大于1:1的预期突变与非预期突变(例如,预期突变:非预期突变)的比率。在一些实施方案中,本文所提供的任何碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1,至少8:1,至少10:1,至少12:1,至少15:1,至少20:1,至少25:1,至少30:1,至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1或至少1000:1或更多的预期突变与非预期突变的比率。应当理解,本文所述的碱基编辑器的特征可以应用于任何融合蛋白,或使用本文所提供的融合蛋白的方法。[1690]多重编辑[1691]在一些实施方案中,本文所提供的碱基编辑器系统能够多重编辑一个或多个基因中的多个核碱基对。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,多个核碱基对位于一个或多个基因中,其中至少一个基因位于不同的基因座中。在一些实施方案中,多重编辑可包括一种或多种向导多核苷酸。在一些实施方案中,多重编辑可包括一个或多个碱基编辑器系统。在一些实施方案中,多重编辑可以包括一个或多个具有单个向导多核苷酸的碱基编辑器系统。在一些实施方案中,多重编辑可以包括一个或多个具有多个向导多核苷酸的碱基编辑器系统。在一些实施方案中,多重编辑可以包括一个或多个具有单碱基编辑器系统的向导多核苷酸。在一些实施方案中,多重编辑可包括至少一个不需要pam序列来靶向结合目标多核苷酸序列的向导多核苷酸。在一些实施方案中,多重编辑可包括至少一个向导多核苷酸,其需要pam序列靶向结合目标多核苷酸序列。在一些实施方案中,多重编辑可以包括至少一个不需要pam序列靶向结合目标多核苷酸序列的向导多核苷酸和至少一个需要pam序列靶向结合目标多核苷酸的向导多核苷酸的混合。应当理解,使用本文所述的任何碱基编辑器的多重编辑的特征可以应用于使用本文所提供的任何碱基编辑器的方法的任何组合。还应当理解,使用本文所述任何碱基编辑器的多重编辑可以包括多个核碱基对的顺序编辑。[1692]在一些实施方案中,多个核碱基对在一个或多个基因中。在一些实施方案中,多个核碱基对在同一基因中。在一些实施方案中,一个或多个基因中的至少一个基因位于不同基因座中。[1693]在一些实施方案中,编辑是编辑至少一个蛋白质编码区中的多个核碱基对。在一些实施方案中,编辑是编辑至少一个蛋白质非编码区中的多个核碱基对。在一些实施方案中,编辑是编辑至少一个蛋白质编码区和至少一个蛋白质非编码区中的多个核碱基对。[1694]在一些实施方案中,编辑与一个或多个向导多核苷酸结合。在一些实施方案中,碱基编辑器系统可以包括一个或多个碱基编辑器系统。在一些实施方案中,碱基编辑器系统可以包括一个或多个碱基编辑器系统与单个向导多核苷酸结合。在一些实施方案中,碱基编辑器系统可包括一个或多个碱基编辑器系统与多个向导多核苷酸结合。在一些实施方案中,编辑与具有单碱基编辑器系统的一种或多种向导多核苷酸结合。在一些实施方案中,编辑与不需要pam序列靶向结合目标多核苷酸序列的至少一个向导多核苷酸结合。在一些实施方案中,编辑与需要pam序列靶向结合目标多核苷酸序列的至少一种向导多核苷酸结合。在一些实施方案中,编辑与不需要pam序列靶向结合目标多核苷酸序列的至少一种向导多核苷酸和需要pam序列靶向结合目标多核苷酸序列的至少一种向导多核苷酸的混合结合。应当理解,使用本文所述任何碱基编辑器的多重编辑的特征可以应用于使用本文所提供的任何碱基编辑器的方法的任何组合。还应当理解,编辑可以包括多个核碱基对的顺序编辑。[1695]在一些实施方案中,能够对一种或多种基因中的多个核碱基对进行多重编辑的碱基编辑器系统包括本文所述abe8碱基编辑器变体之一。在一些实施方案中,能够多重编辑一个或多个基因中的多个核碱基对的碱基编辑器系统包括abe7碱基编辑器之一。在一些实施方案中,与包括abe7碱基编辑器之一的能够多重编辑的碱基编辑器系统相比,包括本文所述的abe8碱基编辑器变体之一的能够多重编辑的碱基编辑器系统具有更高的多重编辑效率。在一些实施方案中,与包括abe7碱基编辑器之一的能够多重编辑的碱基编辑器系统相比,能够进行多重编辑的碱基编辑器系统包括本文所述abe8碱基编辑器变体之一具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%,至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%更高的多重编辑效率。在一些实施方案中,与包括abe7碱基编辑器之一的能够进行多重编辑的碱基编辑器系统相比,包括本文所述abe8碱基编辑器变体之一的能够多重编辑的碱基编辑器系统具有至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少4.0倍、至少4.5倍、至少5.0倍、至少5.5倍或至少6.0倍高的多重编辑效率。[1696]编辑核酸的方法[1697]本公开的一些方面提供用于编辑核酸的方法。在一些实施方案中,所述方法是用于编辑编码蛋白质的核酸分子的核碱基(例如,双链dna序列的碱基对)的方法。在一些实施方案中,所述方法包括以下步骤:a)使核酸的目标区域(例如,双链dna序列)与包括碱基编辑器(例如,与腺苷脱氨酶融合的cas9结构域)的复合物接触和向导核酸(例如,grna),b)诱导所述靶区域的链分离,c)将目标区域的单链中的所述靶核碱基对的第一个核碱基转换为第二个核碱基,及d)使用ncas9切割不超过目标区域中的一个链中,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基替换。在一些实施方案中,所述方法导致核酸中少于20%的插入缺失形成。应当理解,在一些实施方案中,省略步骤b。在一些实施方案中,所述方法导致小于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或0.1%的插入缺失形成率。在一些实施方案中,所述方法进一步包括用与第四个核碱基互补的第五个核碱基置换第二个核碱基,从而产生预期的编辑碱基对(例如,g·c至a·t)。在一些实施方案中,编辑至少5%的预期碱基对。在一些实施方案中,编辑至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对。[1698]在一些实施方案中,目标核苷酸中的预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更高。在一些实施方案中,切割的单链(切口链)与向导核酸杂交。在一些实施方案中,切割的单链与包括第一核碱基的链相反。在一些实施方案中,碱基编辑器包括dcas9结构域。在一些实施方案中,碱基编辑器保护或结合非编辑链。在一些实施方案中,预期的编辑碱基对在pam位点的上游。在一些实施方案中,预期的编辑碱基对是pam位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在pam位点的下游。在一些实施方案中,预期的编辑碱基对是在pam位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,所述方法不需要规范的(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包括连接子。在一些实施方案中,连接子的长度为1至25个氨基酸。在一些实施方案中,连接子的长度为5至20个氨基酸。在一些实施方案中,连接子的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一个实施方案中,连接子的长度为32个氨基酸。在另一个实施方案中,“长连接子”的长度为至少约60个氨基酸。在其他实施方案中,连接子长度在约3至100个氨基酸之间。在一些实施方案中,目标区域包括目标窗口,其中所述目标窗口包括目标核碱基对。在一些实施方案中,目标窗口包括1至10个核苷酸。在一些实施方案中,目标窗口的长度为1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸。在一些实施方案中,目标窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在目标窗口内。在一些实施方案中,目标窗口包括预期的编辑碱基对。在一些实施方案中,使用本文所提供的任何碱基编辑器来执行所述方法。在一些实施方案中,目标窗口是甲基化窗口。[1699]在一些实施方案中,本公开提供用于编辑核苷酸(例如,编码蛋白质的基因中的snp)的方法。在一些实施方案中,本公开提供一种用于编辑双链dna序列的核碱基对的方法。在一些实施方案中,所述方法包括a)使双链dna序列的目标区域与包括碱基编辑器和向导核酸(例如grna)的复合物接触,其中所述目标区域包括目标核碱基对,b)诱导所述目标区域的链分离,c)将目标区域的单链中的所述目标核碱基对的第一个核碱基转换为第二个核碱基,d)切割不超过一条所述目标区域的链,其中与第一核碱基互补的第三个核碱基被与第二核碱基互补的第四核碱基置换,并且第二核碱基被与第四核碱基互补的第五核碱基替换,从而产生预期的编辑碱基对,其中产生预期的碱基对的效率编辑的碱基对至少为5%。应当理解,在一些实施方案中,省略步骤b。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。在一些实施方案中,所述方法导致小于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或更少0.1%插入缺失形成。在一些实施方案中,目标核苷酸处的预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更高。在一些实施方案中,切割的单链与向导核酸杂交。在一些实施方案中,切割的单链与包括第一核碱基的链相反。在一些实施方案中,预期的编辑碱基对在pam位点的上游。在一些实施方案中,预期的编辑碱基对是在pam位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在pam位点的下游。在一些实施方案中,预期的编辑碱基对是在pam位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,所述方法不需要规范的(例如,ngg)pam位点。在一些实施方案中,连接子的长度为1至25个氨基酸。在一些实施方案中,连接子的长度为5至20个氨基酸。在一些实施方案中,连接子的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,目标区域包括目标窗口,其中所述目标窗口包括目标核碱基对。在一些实施方案中,目标窗口包括1至10个核苷酸。在一些实施方案中,目标窗口的长度为1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸。在一些实施方案中,目标窗口的长度是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对出现在目标窗口内。在一些实施方案中,目标窗口包括预期的编辑碱基对。在一些实施方案中,核碱基编辑器是本文所提供的任何一种碱基编辑器。[1700]融合蛋白在宿主细胞中的表达[1701]本发明的包括腺苷脱氨酶变体的融合蛋白可以使用本领域技术人员已知的常规方法在实际上任何感兴趣的宿主细胞中表达,包括但不限于细菌、酵母、真菌、昆虫、植物和动物细胞。例如,可以通过基于cdna序列为cds的上游和下游设计合适的引物来克隆编码本发明的腺苷脱氨酶的dna。克隆的dna可以直接,或在需要时用限制性酶酶切后,或在添加合适的连接子和/或核定位信号后与编码碱基编辑系统的一种或多种额外组分的dna连接。碱基编辑系统在宿主细胞中被翻译以形成复合物。[1702]融合蛋白通过将编码一个或多个具有核碱基修饰活性的结构域(例如腺苷脱氨酶)的一个或多个多核苷酸可操作地连接到编码nadnabp的多核苷酸以制备编码本发明的融合蛋白的多核苷酸来产生。在一些实施方案中,编码napdnabp的多核苷酸和编码具有核碱基修饰活性的结构域的dna可以各自与编码结合结构域或其结合配偶体的dna融合,或者两种dna都可以与编码分离内含肽的dna融合,从而由此核酸序列识别转换模块和核酸碱基转换酶在宿主细胞中翻译形成复合物。在这些情况下,当需要时,连接子和/或核定位信号可连接至dna之一或两者的合适位置。[1703]编码本文所述蛋白质结构域的dna可以通过化学合成dna获得,或者通过利用pcr法和gibson组装法连接合成的部分重叠的寡聚dna短链构建编码其全长的dna。通过化学合成或pcr方法或gibson组装方法的组合构建全长dna的优点是可以根据引入dna的宿主以cds全长形式设计要使用的密码子。在异源dna的表达中,通过将其dna序列转换为宿主生物中频繁使用的密码子,而预计蛋白质表达水平会增加。可以使用作为待使用的宿主中密码子使用频率的数据,例如在kazusadnaresearchinstitute的主页中公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),也可以参考显示每个宿主中密码子使用频率的文件。参考获得的数据和待引入的dna序列,可以将用于dna序列的密码子中在宿主中显示低使用频率的密码子转换为编码相同氨基酸并显示高使用频率的密码子。[1704]包括编码核酸序列辨识模块和/或核酸碱基转换酶的dna的表达载体可以例如通过将dna连接到合适表达载体中的启动子的下游来产生。[1705]作为表达载体,来源于大肠杆菌的质粒(例如,pbr322、pbr325、puc12、puc13);枯草芽孢杆菌源的质粒(例如,pub110、ptp5、pc194);酵母来源的质粒(例如,psh19、psh15);昆虫细胞表达质粒(例如,pfast-bac);动物细胞表达质粒(例如,pa1-11、pxt1、prc/cmv、prc/rsv、pcdnai/neo);噬菌体诸如λ噬菌体等;昆虫病毒载体,例如杆状病毒等(例如,bmnpv、acnpv);使用动物病毒载体,例如逆转录病毒、痘苗病毒、腺病毒等。[1706]作为启动子,可以使用适合用于基因表达的宿主的任何启动子。在使用dsb的常规方法中,由于宿主细胞的存活率有时会因毒性而显着降低,期望通过使用诱导启动子在诱导开始时增加细胞数。然而,由于通过表达本发明的核酸修饰酶复合物也可以提供足够的细胞增殖,也可以没有限制地使用构成启动子。[1707]例如,当宿主是动物细胞时,可使用srα启动子、sv40启动子、ltr启动子、cmv(巨细胞病毒)启动子、rsv(劳斯肉瘤病毒)启动子、momulv(莫罗尼鼠白血病病毒)ltr、hsv-tk(单纯疱疹病毒胸苷激酶)启动子等。其中,cmv启动子、srα启动子等是优选的。当宿主为大肠杆菌时,trp启动子、lac启动子、reca启动子、λpl启动子、lpp启动子、t7启动子等是优选的。当宿主为芽孢杆菌属时,spo1启动子、spo2启动子、penp启动子等是优选的。当宿主为酵母时,gal1/10启动子、pho5启动子、pgk启动子、gap启动子、adh启动子等是优选的。当宿主是昆虫细胞时,多角体蛋白启动子、p10启动子等是优选的。当宿主是植物细胞时,camv35s启动子、camv19s启动子、nos启动子等是优选的。[1708]在一些实施方式中,表达载体可按需求括有增强子、剪接信号、终止子、多聚苷酸添加信号、选择标记如耐药基因、营养缺陷型互补基因、复制起点等。[1709]编码本文所述蛋白质结构域的rna可以通过例如在本身已知的体外转录系统中通过使用编码上述核酸序列辨识模块和/或核酸碱基转换酶为模板的编码dna的载体转录为mrna来制备。[1710]本发明的融合蛋白可以通过将含有编码核酸序列辨识模块和/或核酸碱基转换酶的dna的表达载体导入宿主细胞并培养宿主细胞而在细胞内表达。[1711]可用于本发明的宿主细胞包括细菌细胞、酵母、昆虫细胞、动物细胞等。[1712]大肠杆菌属包括大肠杆菌k12.cndot.dh1(proc.natl.acad.sci.usa,60,160(1968))、大肠杆菌jm103(nucleicacidsresearch,9,309(1981))、大肠杆菌(ja22journalofmolecularbiology,120,517(1978))、大肠杆菌hb101(journalofmolecularbiology,41,459(1969))、大肠杆菌c600(genetics,39,440(1954))等。[1713]芽孢杆菌属包括枯草芽孢杆菌m1114(gene,24,255(1983))、枯草芽孢杆菌207-21(journalofbiochemistry,95,87(1984))等。[1714]可用于表达本发明融合蛋白的酵母菌包括酿酒酵母菌ah22、ah22r-、na87-11a、dkd-5d、20b-12、粟酒裂殖酵母菌(saccharomycespombe)ncyc1913、ncyc2036、毕赤酵母菌(pichiapastoris)km71等。[1715]融合蛋白在昆虫细胞中表达,例如使用病毒载体,如acnpv。昆虫宿主细胞包括以下任何细胞系:衍生自甘蓝粘虫幼虫的已建立的细胞系(草地夜蛾细胞;sf细胞)、衍生自粉纹夜蛾(trichoplusiani)、highfive的中肠的mg1细胞。使用衍生自源粉纹夜蛾的卵的细胞、衍生自甘蓝夜蛾(mamestrabrasicae)的细胞、衍生自盐泽灯蛾(estigmenaacrea)的细胞等。当病毒为bmnpv时,衍生自家蚕的已建立的细胞系(家蚕n细胞;bmn细胞)等的细胞用作昆虫细胞。作为sf细胞,例如,sf9细胞(atcccrl1711)、sf21细胞(以上,invivo,13,213-217(1977))等。[1716]作为昆虫,例如家蚕、果蝇、蟋蟀等的幼虫用于表达本发明的融合蛋白(nature,315,592(1985))。[1717]哺乳动物细胞系可用于表达融合蛋白。此类细胞系包括猴cos-7细胞、猴vero细胞、中国仓鼠卵巢(cho)细胞、dhfr基因缺陷型cho细胞、小鼠l细胞、小鼠att-20细胞、小鼠骨髓瘤细胞、大鼠gh3细胞、人类fl细胞等及人类和其他哺乳动物的ips细胞、es细胞等多能干细胞,以及由各种组织制备的原代培养细胞。此外,还可以使用斑马鱼胚胎、非洲爪蟾卵母细胞等。[1718]可以使用本领域技术人员公知的方法将植物细胞保持在培养物中。植物细胞培养包括由各种植物(如水稻、小麦、玉米等谷物,西红柿、黄瓜、茄子、康乃馨、洋桔梗、烟草、拟南芥等产品作物)制备而成的悬浮培养的细胞、愈伤组织、原生质体、叶段、根段。[1719]上述所有宿主细胞都可以是单倍体(单倍体),也可以是多倍体(例如二倍体、三倍体、四倍体等)。在传统的突变引入方法中,突变原则上只引入一个同源染色体以产生异种基因类型。因此,除非发生显性突变,否则不会表达所需的表型,并且纯合子不方便地需要劳动和时间。相比之下,根据本发明,由于可以将突变引入基因组中同源染色体上的任何等位基因,因此即使在隐性突变的情况下也可以在一代中表达所需的表型,这是非常有用的,因为常规方法可以解决。[1720]使用任何转染方法(例如溶菌酶法、感受态法、peg法、cacl2共沉淀法、电穿孔法、显微注射法、粒子枪法、脂质转染法、农杆菌法)将编码本发明融合蛋白的表达载体导入宿主细胞方法)。根据要转染的宿主细胞选择转染方法。[1721]大肠杆菌可以根据,例如,proc.natl.acad.sci.usa,69,2110(1972),gene,17,107(1982)等中所述方法转换。[1722]芽孢杆菌属可以根据例如molecular&generalgenetics,168,111(1979)等中描述的方法引入载体中。[1723]酵母细胞可以根据,例如,methodsinenzymology,194,182-187(1991),proc.natl.acad.sci.usa,75,1929(1978)等中所述方法引入载体中。[1724]昆虫细胞可以根据例如在,bio/technology,6,47-55(1988)等中所述方法引入载体中。[1725]哺乳动物细胞可以根据例如cellengineeringadditionalvolume8,newcellengineeringexperimentprotocol,263-267(1995)(publishedbyshujunsha),以及virology,52,456(1973)中所述方法引入载体中。[1726]根据已知方法培养包括本发明表达载体的细胞,其根据宿主而变化。[1727]例如,当培养大肠杆菌或芽孢杆菌属时,优选液体培养基作为用于培养的培养基。培养基优选含有转换体生长所需的碳源、氮源、无机物等。碳源的例子包括葡萄糖、糊精、可溶性淀粉、蔗糖等;氮源的例子包括无机或有机物质,例如铵盐、硝酸盐、玉米浆、蛋白胨、酪蛋白、肉提取物、豆饼、马铃薯提取物等。无机物的例子包括氯化钙、磷酸二氢钠、氯化镁等。培养基可以含有酵母提取物、维生素、生长促进因子等。培养基的ph值优选为约5至约8。[1728]作为用于培养大肠杆菌的培养基,例如,含有葡萄糖、酪蛋白氨基酸的m9培养基(journalofexperimentsinmoleculargenetics,431-433,coldspringharborlaboratory,newyork1972)是优选的。必要时,例如,可以将诸如3β-吲哚基丙烯酸之类的试剂添加到培养基中以确保促进剂的有效功能。大肠杆菌通常在约15℃至约43℃下培养。必要时可进行曝气和搅拌。[1729]芽孢杆菌属通常在约30至约40℃培养。必要时可进行曝气和搅拌。[1730]用于培养酵母的培养基的例子包括伯克霍尔德最小培养基(proc.natl.acad.sci.usa,77,4505(1980)),含有0.5%酪蛋白氨基酸的sd培养基(proc.natl.acad.sci.usa,81,5330(1984))等。培养基的ph优选为约5至约8。培养通常在约20℃至约35℃下进行。必要时可进行曝气和搅拌。[1731]作为用于培养昆虫细胞或昆虫的培养基,例如,使用适当地含有诸如灭活的10%牛血清等添加剂的grace昆虫培养基(grace'sinsectmedium)(nature,195,788(1962))等。培养基的ph值优选为约6.2至约6.4。培养通常在约27℃进行。必要时可进行曝气和搅拌。[1732]使用作为用于培养动物细胞的培养基,例如,含有约5至约20%胎牛血清的最低必需培养基(mem)(science,122,501(1952))、改良伊格尔氏培养基(dulbecco'smodifiedeaglemedium(dmem))(virology,8,396(1959)),rpmi1640培养基(thejournaloftheamericanmedicalassociation,199,519(1967)),199培养基(proceedingofthesocietyforthebiologicalmedicine,73,1(1950))等。培养基的ph优选为约6至约8。培养通常在约30℃至约40℃进行。必要时可进行曝气和搅拌。[1733]作为培养植物细胞的培养基,例如使用ms培养基、ls培养基、b5培养基等。培养基的ph优选为约5至约8。培养通常在约20℃至约30℃进行。必要时可进行曝气和搅拌。[1734]当高等真核细胞,例如动物细胞、昆虫细胞、植物细胞等用作宿主细胞时,将编码本发明碱基编辑系统(例如,包括腺苷脱氨酶变体)的dna引入到在诱导型启动子(例如,金属硫蛋白启动子(由重金属离子诱导)、热休克蛋白启动子(由热休克诱导)、tet-on/tet-off系统启动子(通过添加或去除四环素诱导)、类固醇反应启动子(由类固醇激素或其源物诱导)等)调控下的宿主细胞或其源物,在适当的阶段将诱导物质加入培养基中(或从培养基中去除)以诱导核酸的表达-修饰酶复合物,培养一定时间进行碱基编辑,将突变引入目标基因,以实现碱基编辑系统的瞬时表达。[1735]原核细胞例如大肠杆菌等可以利用诱导型启动子。诱导型启动子的实例包括但不限于lac启动子(由iptg诱导)、cspa启动子(由冷休克诱导)、arabad启动子(由阿拉伯糖诱导)等。[1736]或者,当以动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时,也可以利用上述诱导性启动子作为载体去除机制。即,载体安装有在宿主细胞中起作用的复制起点和编码复制所必需的蛋白质的核酸(例如,sv40和大t抗原、orip和ebna-1等用于动物细胞),编码蛋白质的核酸的表达受上述诱导型启动子调控。因此,虽然载体在诱导物质存在的情况下可以自主复制,但当去除诱导物质时,自主复制不可用,载体自然随着细胞分裂而脱落(通过添加不能自主复制tet-off系统载体中的四环素和强力霉素)。[1737]使用基础编辑器的方法[1738]疾病相关基因和等位基因中点突变的校正为基因校正提供新的策略,并应用于治疗学和基础研究。[1739]本公开提供用于治疗被诊断患有与点突变相关或由其引起的疾病的受试者的方法,所述点突变可以由本文所提供的碱基编辑器系统校正。例如,在一些实施方案中,提供一种方法,其包括向患有此类疾病(例如由基因突变引起的疾病)的受试者给药有效量的核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器)以用于校正疾病相关基因中的点突变。本公开提供用于治疗与可以通过脱氨酶介导的基因编辑校正的点突变相关或由其引起的疾病的方法。基于本公开,可以用本文所提供的策略和融合蛋白治疗的合适疾病对于本领域技术人员来说将是显而易见的。本文提供使用碱基编辑器或碱基编辑器系统来编辑与疾病或病症相关的目标核苷酸序列中的核碱基的方法。在一些实施方案中,碱基编辑器(例如,包括腺苷脱氨酶和cas12结构域)的活性导致点突变的校正。在一些实施方案中,目标dna序列包括与疾病或病症相关的g→a点突变,并且突变体a碱基的脱氨产生与疾病或病症无关的序列。在一些实施方案中,目标dna序列包括与疾病或病症相关的t→c点突变,并且突变体c碱基的脱氨产生与疾病或病症无关的序列。[1740]在一些实施方案中,目标dna序列编码蛋白质,并且点突变在密码子中,并且导致突变密码子编码的氨基酸与野生型密码子相比发生变化。在一些实施方案中,突变体a的脱氨导致突变体密码子编码的氨基酸发生变化。在一些实施方案中,突变体a的脱氨产生编码野生型氨基酸的密码子。在一些实施方案中,突变体c的脱氨导致突变体密码子编码的氨基酸发生变化。在一些实施方案中,突变体c的脱氨产生编码野生型氨基酸的密码子。在一些实施方案中,受试者已经或已经被诊断患有疾病或病症。[1741]在一些实施方案中,本文所提供的腺苷脱氨酶能够使dna的脱氧腺苷残基脱氨。本公开的其他方面提供融合蛋白,其包括腺苷脱氨酶(例如,如本文所述使dna中的脱氧腺苷脱氨的腺苷脱氨酶)和能够结合特定核苷酸序列的结构域(例如,cas12)。例如,腺苷可以转换为肌苷残基,其通常与胞嘧啶残基碱基配对。此类融合蛋白尤其可用于核酸序列的靶向编辑。此类融合蛋白可用于体外的dna的靶向编辑,例如用于产生突变细胞或动物;用于引入靶向突变,例如用于校正离体细胞中的遗传缺陷,例如在从受试者获得的细胞中随后被重新引入相同或另一受试者中;以及对于体内靶向突变的引入,例如,可以使用本文所提供的核碱基编辑器处理遗传缺陷的校正或在疾病相关基因中g至a或t至c突变中失活突变的引入。本公开提供利用脱氨酶和核碱基编辑器的脱氨酶、融合蛋白、核酸、载体、细胞、组合物、方法、试剂盒、系统等。[1742]产生预期的突变[1743]在一些实施方案中,本文所提供的方法的目的是通过基因编辑恢复功能失调基因的功能。在一些实施方案中,功能障碍基因的功能通过引入预期突变来恢复。在一些实施方案中,本文所提供的方法可用于破坏基因产物的正常功能。本文所提供的核碱基编辑蛋白可以在体外验证基于基因编辑的人类治疗,例如,通过校正人类细胞培养物中的疾病相关突变。本领域技术人员将理解,本文所提供的核碱基编辑蛋白,例如包括napdnabp结构域(例如,cas12)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白可以是用于校正任何单个点a至g或c到t突变。在第一种情况下,突变体a至i的脱氨校正了突变,在后一种情况下,与突变体t碱基配对的a脱氨,然后进行一轮复制而校正了突变。[1744]在一些实施方案中,本公开提供在核酸(例如,受试者基因组内的核酸)中有效产生预期突变(例如点突变),而不产生大量非预期突变的碱基编辑器(例如作为意外的点突变)。在一些实施方案中,预期突变是由特定碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)与特别设计用于产生预期突变的向导多核苷酸(例如,grna)结合而产生的突变。在一些实施方案中,预期突变是与疾病或病症相关的突变。在一些实施方案中,预期突变是与疾病或病症相关的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是与疾病或病症相关的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是基因的编码区或非编码区内的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是基因的编码区或非编码区内的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是产生终止密码子的点突变,例如基因编码区内的提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。[1745]在一些实施方案中,本文所提供的任何碱基编辑器能够产生大于1:1的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。在一些实施方案中,任何碱基本文所提供的编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1,或至少1000:1,或更高的预期突变与非预期突变(例如,预期点突变:非预期点突变)的比率。[1746]碱基编辑器效率的细节在国际pct申请编号第pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中进行了描述,其各自的全部内容通过引用方式并入本文。另参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其全部内容通过引用方式并入本文。[1747]在一些实施方案中,使用本文所提供的方法编辑一种或多种基因中的多个核碱基对导致形成至少一种预期突变。在一些实施方案中,所述至少一种预期突变的所述形成导致致病突变的精确校正。应当理解,可以使用本文所提供的任何方法或方法的组合来实现多重编辑。[1748]输送系统[1749]基于核酸的核碱基编辑器和grna的递送[1750]可以通过本领域已知的方法或如本文所述,在体外或体内将编码根据本公开内容的碱基编辑系统的核酸给药于受试者或递送至细胞中。在一个实施方案中,核碱基编辑器可以通过例如载体(例如病毒或非病毒载体)、基于非载体的方法(例如,使用裸dna、dna复合物、mrna、脂质纳米颗粒)或其组合递送。[1751]编码核碱基编辑器的核酸可以以裸露的dna或rna,例如mrna,例如通过转染或电穿孔的方式直接递送至细胞(例如,造血细胞或其祖细胞、造血干细胞、和/或诱导多能干细胞),或者可以与促进目标细胞摄取的分子(例如,n-乙酰半乳糖胺)结合。也可以使用核酸载体,例如本文所述载体。[1752]核酸载体可包括编码本文所述融合蛋白的结构域的一个或多个序列。载体还可以包括编码信号肽的序列(例如,用于核定位、核仁定位或线粒体定位),与编码蛋白质的序列相关联(例如,插入或融合)。作为一个实例,核酸载体可以包括cas9编码序列,其包括一个或多个核定位序列(例如,来自sv40的核定位序列)和腺苷脱氨酶变体(例如,abe8)。[1753]核酸载体还可包括任何合适数量的调节/控制组件,例如启动子、增强子、内含子、聚腺苷酸化信号、kozak共有序列或内部核糖体进入位点(ires)。这些组件在本领域中是众所周知的。对于造血细胞,合适的启动子可以包括ifnβ或cd45。[1754]根据本公开的核酸载体包括重组病毒载体。实施例性病毒载体在本文中阐述。也可以使用本领域已知的其他病毒载体。此外,病毒颗粒可用于递送核酸和/或肽形式的碱基编辑系统组分。例如,“空”病毒颗粒可以组装成包括任何合适的货物。病毒载体和病毒颗粒也可以被设计成结合靶向配体来改变目标组织特异性。[1755]除了病毒载体,非病毒载体可用于递送编码根据本公开的基因组编辑系统的核酸。一类重要的非病毒核酸载体是纳米颗粒,它可以是有机的或无机的。纳米颗粒是本领域公知的。任何合适的纳米颗粒设计均可用于递送基因组编辑系统组分或编码此类组分的核酸。例如,有机(例如脂质和/或聚合物)纳米颗粒可适合用作本公开的某些实施方案中的递送载体。用于纳米颗粒制剂、和/或基因转移的实施例性脂质示于表10(以下)。[1756]表10[1757][1758][1759]表11列出用于基因转移和/或纳米颗粒制剂的实施例性聚合物。[1760]表11[1761][1762]表12总结编码本文所述融合蛋白的多核苷酸的递送方法。[1763]表12[1764][1765]在另一方面,基因组编辑系统组分或编码此类组分的核酸(例如核酸结合蛋白,诸如例如cas9或其变体),以及靶向感兴趣的基因组核酸序列的grna的递送,可以通过将核糖核蛋白(rnp)递送至细胞来实现。rnp包括与靶向grna形成复合物的核酸结合蛋白(例如cas9)。可以使用已知方法将rnp递送至细胞,例如电穿孔、核转染或阳离子脂质介导的方法,例如zuris,j.a.etal.,2015,nat.biotechnology,33(1):73-80中所报导者。rnp有利于在crispr基础编辑系统中使用,特别是对于难以转染的细胞,如原代细胞。此外,rnp还可以减轻细胞中蛋白质表达可能出现的困难,尤其是当真核启动子(例如crispr质粒中使用的cmv或ef1a)没有很好表达时。有利地,rnp的使用不需要将外源dna递送到细胞中。此外,由于包括核酸结合蛋白和grna复合物的rnp会随时间降解,因此使用rnp有可能限制脱靶效应。以类似于基于质粒的技术的方式,rnp可用于递送结合蛋白(例如,cas9变体)和向导同源性定向修复(hdr)。[1766]用于驱动碱基编辑器编码核酸分子表达的启动子可以包括aavitr。这有利于消除对额外启动子组件的需要,所述组件会占据载体中的空间。释放的额外空间可用于驱动额外组件的表达,例如向导核酸或选择标记。itr活性相对较弱,因此可用于降低因所选核酸酶过度表达而导致的潜在毒性。[1767]可以使用任何合适的启动子来驱动碱基编辑器和在适当情况下向导核酸的表达。对于无处不在的表达,可以使用的启动子包括cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链等。对于脑或其他cns细胞表达,合适的启动子可以包括:用于所有神经元的突触素i、用于兴奋性神经元的camkiialphagaba能神经元的gad67或gad65或vgat等。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于肺细胞表达,合适的启动子可以包括sp-b。对于内皮细胞,合适的启动子可以包括icam。对于造血细胞,合适的启动子可以包括ifnβ或cd45。对于成骨细胞,合适的启动子可以包括og-2。[1768]在一些实施方案中,本公开的碱基编辑器具有足够小的尺寸以允许单独的启动子驱动碱基编辑器和相容的向导核酸在同一核酸分子内的表达。例如,载体或病毒载体可包括与编码碱基编辑器的核酸可操作连接的第一启动子和与向导核酸可操作连接的第二启动子。[1769]用于驱动向导核酸表达的启动子可以包括:poliii启动子,诸如u6或h1使用polii启动子和内含子盒来表达grna腺相关病毒(aav)。[1770]病毒载体[1771]因此,本文所述碱基编辑器可以与病毒载体一起递送。在一些实施方案中,本文公开的碱基编辑器可以在病毒载体中包括的核酸上编码。在一些实施方案中,碱基编辑器系统的一种或多种组分可以在一种或多种病毒载体上编码。例如,碱基编辑器和向导核酸可以在单个病毒载体上编码。在其他实施方案中,碱基编辑器和向导核酸在不同的病毒载体上编码。在任一情况下,碱基编辑器和向导核酸均可与启动子和终止子可操作地连接。病毒载体上编码的组分的组合可以通过所选病毒载体的货物大小限制来确定。[1772]使用基于rna或dna病毒的系统来递送碱基编辑器,利用高度进化的过程将病毒靶向培养中或宿主中的特定细胞,并将病毒有效载荷运送到细胞核或宿主细胞基因组。病毒载体可以直接给药于培养中的细胞、患者(体内),或者可以用于体外处理细胞,并且可以任选地将修饰的细胞给药于患者(离体)。常规的基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。逆转录病毒、慢病毒和腺相关病毒基因转移方法可以整合到宿主基因组中,通常会导致插入的转基因长期表达。此外,在许多不同的细胞类型和目标组织中都观察到了高转导效率。[1773]病毒载体可包括慢病毒(例如基于hiv和fiv的载体)、腺病毒(例如ad100)、逆转录病毒(例如马洛尼鼠白血病病毒mml-v)、疱疹病毒载体(例如hsv-2)和腺病毒载体。相关病毒(aav)或其他质粒或病毒载体类型,特别是使用来自例如美国专利号8,454,972(腺病毒的制剂、剂量)、美国专利号8,404,658(aav的制剂、剂量)的制剂和剂量)和美国专利第5,846,946号(dna质粒的制剂、剂量)以及来自涉及慢病毒、aav和腺病毒的临床试验和出版物。例如,对于aav,给药途径、制剂和剂量可以如美国专利号8,454,972和涉及aav的临床试验。对于腺病毒,给药途径、制剂和剂量可以如美国专利号8,404,658和涉及腺病毒的临床试验。对于质粒递送,给药途径、制剂和剂量可以如美国专利号5,846,946和涉及质粒的临床研究。剂量可以基于或外推到平均70公斤的个体(例如人类成年男性),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。给药频率在医学或兽医从业者(例如,医师、兽医)的范围内,这取决于通常的因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及正在解决的特定状况或症状。病毒载体可以注射到感兴趣的组织中。对于细胞类型特异性碱基编辑,碱基编辑器和可选向导核酸的表达可由细胞类型特异性启动子驱动。[1774]逆转录病毒的趋向性可以通过掺入外来包膜蛋白来改变,扩大目标细胞的潜在目标群体。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于目标组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装容量高达6至10kb的外源序列。最小的顺式作用ltr足以复制和包装载体,然后用于将治疗基因整合到目标细胞中以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人类免疫缺陷病毒(hiv)及其组合的那些(参见,例如,buchscheretal.,j.virol.66:2731-2739(1992);johannetal.,j.virol.66:1635-1640(1992);sommnerfeltetal.,virol.176:58-59(1990);wilsonetal.,j.virol.63:2374-2378(1989);milleretal.,j.virol.65:2220-2224(1991);pct/us94/05700)。[1775]逆转录病毒载体,尤其是慢病毒载体,可能需要小于给定长度的多核苷酸序列以有效整合到目标细胞中。例如,长度大于9kb的逆转录病毒载体与较小的病毒载体相比,会导致病毒滴度较低。在一些方面,本公开内容的碱基编辑器具有足够的大小以使得能够通过逆转录病毒载体有效包装和递送到目标细胞中。在一些实施方案中,碱基编辑器的大小使得即使在与向导核酸和/或可靶向核酸酶系统的其他组分一起表达时也允许有效包装和递送。[1776]在首选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。所述载体可以在相对简单的系统中大量生产。腺相关病毒(“aav”)载体也可用于用目标核酸转导细胞,例如在核酸和肽的体外生产中,以及用于体内和离体基因治疗程序(参见,例如,westetal.,virology160:38-47(1987);u.s.patentno.4,797,368;wo93/24641;kotin,humangenetherapy5:793-801(1994);muzyczka,j.clin.invest.94:1351(1994)。重组aav载体的构建在许多出版物中有所描述,包括美国专利号5,173,414;tratschinetal.,mol.cell.biol.5:3251-3260(1985);tratschin,etal.,mol.cell.biol.4:2072-2081(1984);hermonat&muzyczka,pnas81:6466-6470(1984);以及samulskietal.,j.virol.63:03822-3828(1989)。[1777]aav是一种小型的单链dna依赖性病毒,属于细小病毒家族。4.7kb野生型(wt)aav基因组由两个基因组成,分别编码四种复制蛋白和三种衣壳蛋白,两侧各有145碱基对反向末端重复序列(itr)。病毒粒子由三种衣壳蛋白vp1、vp2和vp3所组成,它们以1:1:10的比率从相同的开放阅读框产生,但来自差异剪接(vp1)和替代翻译起始位点(分别为vp2和vp3)。vp3是病毒体中最丰富的亚基,并且参与定义病毒向性的细胞表面受体识别。已在vp1的独特n端识别出一个在病毒感染性中起作用的磷脂酶结构域。[1778]与野生型aav类似,重组aav(raav)利用顺式作用的145碱基对itr位于载体转基因盒的侧边,提供高达4.5kb的外源dna包装。感染后,raav可以表达本发明的融合蛋白,并且通过以环状头尾串联体的附加型存在而持续存在而不整合到宿主基因组中。尽管有许多使用所述系统在体外和体内成功的raav例子,但当基因编码序列的长度等于或大于aav介导的基因递送时,有限的包装能力限制了aav介导的基因递送的使用。wtaav基因组。[1779]可以根据应用选择病毒载体。例如,对于体内基因传递,aav可能优于其他病毒载体。在一些实施方案中,aav允许低毒性,这可能是由于纯化方法不需要可以激活免疫反应的细胞颗粒的超速离心。在一些实施方案中,aav允许引起插入诱变的可能性很低,因为它不整合到宿主基因组中。腺病毒通常用作疫苗,因为它们诱导强烈的免疫原性反应。病毒载体的包装容量会限制可以包装到载体中的碱基编辑器的大小。[1780]aav的包装容量约为4.5kb或4.75kb,包含两个145碱基反向末端重复序列(itr)。这意味着公开的碱基编辑器以及启动子和转录终止子可以适合单个病毒载体。大于4.5或4.75kb的构建体会导致病毒产量显着降低。比如spcas9很大,基因本身就超过4.1kb,很难包装成aav。因此,本公开的实施方案包括利用长度比常规碱基编辑器短的公开碱基编辑器。在一些实施例中,碱基编辑器小于4kb。公开的碱基编辑器可以小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3.0kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在一些实施方案中,所公开的碱基编辑器的长度为4.5kb或更小。[1781]aav可以是aav1、aav2、aav5或其任意组合。可以根据要靶向的细胞选择aav的类型;例如,可以选择aav血清型1、2、5或混合衣壳aav1、aav2、aav5或其任何组合用于靶向脑或神经元细胞;并且可以选择aav4来靶向心脏组织。aav8可用于递送至肝脏。关于这些细胞的某些aav血清型的列表可以在grimm,d.etal,j.virol.82:5887-5911(2008)中发现)。[1782]慢病毒是复杂的逆转录病毒,具有在有丝分裂和有丝分裂后细胞中感染和表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(hiv),它使用其他病毒的包膜糖蛋白来靶向广泛的细胞类型。[1783]慢病毒可以如下制备。克隆pcases10(其含有慢病毒转移质粒骨架)后,将低传代(p=5)的hek293ft接种到t-75烧瓶中至50%汇合,前一天在含有10%胎儿牛血清且不含抗生素的dmem中转染。20小时后,将培养基更换为optimem(无血清)培养基,4小时后进行转染。用10μg慢病毒转移质粒(pcases10)和以下包装质粒转染细胞:5μg的pmd2.g(vsv-g假型)和7.5μg的pspax2(gag/pol/rev/tat)。可以在4mloptimem中使用阳离子脂质递送剂(50μllipofectamine2000和100ulplus试剂)进行转染。6小时后,将培养基更换为含10%胎儿牛血清的不含抗生素的dmem。这些方法在细胞培养过程中使用血清,但优选无血清方法。[1784]慢病毒可以如下纯化。48小时后收获病毒上清液。上清液首先清除碎屑,然后通过0.45μm低蛋白结合(pvdf)过滤器过滤。然后将它们在超速离心机中以24,000rpm的速度旋转2小时。病毒颗粒在50μldmem中于4℃重悬过夜。然后等分并立即在-80℃下冷冻。[1785]在另一个实施方案中,还考虑了基于马传染性贫血病毒(eiav)的最小非灵长类慢病毒载体。在另一个实施方案中,retinostat.rtm.是一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达预期通过视网膜下注射递送的血管抑制蛋白内皮抑制素和血管抑制素。在另一个实施方案中,考虑使用自我失活的慢病毒载体。[1786]所述系统的任何rna,例如向导rna或碱基编辑器编码的mrna,都可以以rna的形式递送。可以使用体外转录产生碱基编辑器编码mrna。例如,可以使用包括以下组件的pcr盒合成核酸酶mrna:t7启动子、可选的kozak序列(gccacc)、核酸酶序列和3'utr(例如来自β球蛋白-多聚苷酸尾的3'utr)。所述盒可用于t7聚合酶的转录。向导多核苷酸(例如,grna)也可以使用体外转录从包括t7启动子的盒中转录,然后是序列“gg”和向导多核苷酸序列。[1787]为了增强表达并降低可能的毒性,可以修饰碱基编辑器编码序列和/或向导核酸以包括一种或多种修饰的核苷,例如使用伪u或5-甲基-c。[1788]aav载体的小包装容量使得大量基因的传递和/或大型生理调控组件的使用具有挑战性。例如,可以通过将一个或多个待递送的蛋白质分成两个或多个片段来解决这些挑战,其中所述n端片段与分裂的内含物肽-n融合,及所述c端片段与分裂的内含肽-c融合。然后将这些片段包装成两个或多个aav载体。如本文所用,“内含肽”是指连接侧边n端和c端外显子(例如,待连接的片段)的自剪接蛋白质内含子(例如,肽)。例如,woodetal.,j.biol.chem.289(21);14512-9(2014)中所述。例如,当与分离的蛋白质片段融合时,含内肽intn和intc相互识别,将自身剪接出来,同时连接它们所融合的蛋白质片段的侧边n端和c端外显肽,从而重新构建一个来自两个蛋白质片段的全长蛋白质。其他合适的内含肽对本领域技术人员来说将是显而易见的。[1789]本发明的融合蛋白片段的长度可以不同。在一些实施方案中,蛋白质片段的长度为2个氨基酸至约1000个氨基酸。在一些实施方案中,蛋白质片段的长度为约5个氨基酸至约500个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约20个氨基酸至约200个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约10个氨基酸至约100个氨基酸。其他长度的合适蛋白质片段对本领域技术人员来说是显而易见的。[1790]在一个实施方案中,双aav载体是通过将一个大的转基因表达盒分成两半(5'和3'端,或头和尾)而产生的,其中盒的每一半都被包装在一个aav载体(《5kb)。然后通过两种双aav载体共感染同一细胞,然后实现全长转基因表达盒的重新组装,随后:(1)5'和3'基因组之间的同源重组(hr)(双aav重叠载体);(2)itr介导的5'和3'基因组的尾对头串联(双aav反式剪接载体);或(3)这两种机制的组合(双aav混合载体)。在体内使用双aav载体导致全长蛋白质的表达。双aav载体平台的使用代表了一种有效且可行的基因转移策略,适用于大小大于4.7kb的转基因。[1791]内含肽[1792]在一些实施方案中,核酸酶(例如,cas9)的一部分或片段融合内含肽上。核酸酶可以与内含肽的n端或c端融合。在一些实施方案中,融合蛋白的一部分或片段与内含肽融合并与aav衣壳蛋白融合。内含肽、核酸酶和衣壳蛋白可以任意排列融合在一起(如核酸酶-内含袖-衣壳、内含袖-核酸酶-衣壳、衣壳-内含肽-核酸酶等)。在一些实施方案中,内含肽的n端与融合蛋白的c端融合,内含肽的c端与aav衣壳蛋白的n端融合。[1793]内含蛋白(interveningprotein)是存在于各种不同生物体中的自动加工结构域,它们进行称为蛋白质剪接的过程。蛋白质剪接是一个多步骤的生化反应,包括肽键的断裂和形成。虽然蛋白质剪接的内源性底物是在内含肽生物体中发现的蛋白质,但内含肽也可用于化学操作几乎任何多肽骨架。[1794]在蛋白质剪接中,内含肽通过切割两个肽键将自身从前体多肽中分离出来,从而通过形成新的肽键连接侧边外显肽(外部蛋白质)序列。这种重排发生在翻译后(或可能是共同翻译)。内含肽介导的蛋白质剪接是自发发生的,只需要内含肽结构域的折叠。[1795]约5%的内含肽是分裂的内含肽,它们被转录和翻译为两个独立的多肽(n-内含臂和c-内含臂),每一个都融合为一个外显肽。翻译时,内含袖片段自发地非共价组装成规范的内含袖结构,进行蛋白质反式剪接。蛋白质剪接的机制需要一系列酰基转移反应,导致在内含肽-外显肽连接处的两个肽键断裂,并且在n-和c-外显肽之间形成新的肽键。这个过程是通过激活连接内含肽的n-外显肽和n端的肽键启动的。几乎所有的内含含物在它们的n端都有一个半胱氨酸或丝氨酸,它们攻击c端n-外显肽残基的羰基碳。这种n到o/s酰基转移是由保守的苏氨酸和组氨酸(称为txxh基序)以及常见的天冬氨酸促进的,这导致形成线性(硫)酯中间体。接下来,所述中间体通过第一个c-外显肽残基(+1)的亲核攻击进行反式(硫)酯化,所述残基是半胱氨酸、丝氨酸或苏氨酸。由此产生的支化(硫)酯中间体通过独特的转换解析:内含酚的高度保守的c端天冬酰胺的环化。所述过程由组氨酸(在高度保守的hnf基序中发现)和倒数第二个组氨酸促进,也可能涉及天冬氨酸。这种琥珀酰亚胺形成反应从反应复合物中切除内含肽,留下通过非肽键连接的外肽。这种结构以不依赖于内含链的方式迅速重排成稳定的肽键。[1796]在一些实施方案中,碱基编辑器(例如,abe、cbe)的n端片段与分裂的内含肽-n融合,并且c端片段与内含肽-c融合。然后将这些片段包装成两个或多个aav载体。例如,woodetal.,j.biol.chem.289(21);14512-9(2014)中所述。例如,当与分离的蛋白质片段融合时,含内肽intn和intc相互识别,将自身剪接出来,同时连接它们所融合的蛋白质片段的侧边n端和c端外显肽,从而重新构建一个来自两个蛋白质片段的全长蛋白质。其他合适的内含含乳对本领域技术人员来说将是显而易见的。[1797]在一些实施方案中,abe在spcas9的选定区域内的ala、ser、thr或cys残基处分裂成n和c端片段。这些区域对应于由cas9晶体结构分析确定的环区域。每个片段的n端与一个内含肽-n融合,并且每个片段的c端与在氨基酸位置s303、t310、t313、s355、a456、s460、a463、t466、s469、t472、t474、c574、s577、a589及s590内含肽n融合,在以下的顺序中以粗体大写字母表示。[1798][1799][1800]使用核碱基编辑器靶向突变[1801]如本文所述评估靶向突变的核碱基编辑器的适用性。在一个实施方案中,用碱基编辑系统连同少量编码报告基因(例如,gfp)的载体转导单个感兴趣的细胞。这些细胞可以是本领域已知的任何细胞系,包括永生化人类细胞系,例如293t、k562或u20s。或者,可以使用原代细胞(例如,人类)。这样的细胞可能与最终的细胞目标相关。[1802]可以使用病毒载体进行递送。在一个实施方案中,转染可以使用脂质转染(例如lipofectamine或fugene)或通过电穿孔进行。转染后,可以通过荧光显微镜或流式细胞术确定gfp的表达,以确认一致和高水平的转染。这些初步转染可以包括不同的核碱基编辑器,以确定哪种编辑器组合具有最大的活性。[1803]如本文所述评估核碱基编辑器的活性,即通过对细胞基因组进行测序以检测目标序列中的改变。对于sanger测序,纯化的pcr扩增子被克隆到质粒骨架中,转换、小量制备并用单个引物测序。也可以使用下一代测序技术进行测序。使用下一代测序时,扩增子可能为300-500bp,预期切割位点不对称放置。pcr之后,可以将下一代测序连接子和条形码(例如illumina多重连接子和索引)添加到扩增子的末端,例如用于高通量测序(例如在illuminamiseq上)。[1804]可以选择在初始测试中诱导最大水平目标特异性改变的融合蛋白进行进一步评估。[1805]在特定实施方案中,核碱基编辑器用于靶向感兴趣的多核苷酸。在一个实施方案中,将本发明的核碱基编辑器连同用于靶向感兴趣突变的向导rna一起递送至细胞(例如,造血细胞或其祖细胞、造血干细胞、和/或诱导多能干细胞)在细胞的基因组内,从而改变突变。在一些实施方案中,碱基编辑器被向导rna靶向以向感兴趣基因的序列引入一个或多个编辑。[1806]在一个实施方案中,核碱基编辑器用于靶向调控序列,包括但不限于剪接位点、增强子和转录调控组件。然后使用本领域已知的任何方法测定改变对受调控组件控制的基因表达的影响。[1807]在又其他实施方案中,本发明的核碱基编辑器用于靶向生物体基因组内的感兴趣的多核苷酸。在一个实施方案中,将本发明的核碱基编辑器连同用于平铺细胞基因组内的多种序列的向导rna文库一起递送至细胞,从而系统地改变整个基因组中的序列。[1808]所述系统可以包括一种或多种不同的载体。在一个方面,碱基编辑器是密码子优化的以表达期望的细胞类型,优选真核细胞,优选哺乳动物细胞或人类细胞。[1809]一般而言,密码子优化是指通过替换至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50或更多密码子)与在所述宿主细胞的基因中更频繁或最频繁使用的密码子同时保持天然氨基酸序列。各种物种对特定氨基酸的某些密码子表现出特定的偏向性。密码子偏向性(生物体之间密码子使用的差异)通常与信使rna(mrna)的翻译效率相关,而信使rna(mrna)的翻译效率又被认为取决于被翻译密码子的特性和特定转移rna(trna)分子的可用性。细胞中所选trna的优势通常反映了肽合成中最常用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中进行最佳基因表达。密码子使用表很容易获得,例如,在www.kazusa.orjp/codon/上可用的“密码子使用数据库(codonusagedatabase)”(2002年7月9日浏览),这些表可以通过多种方式进行调整。参见nakamura,y.,etal."codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000"nucl.acidsres.28:292(2000)。用于密码子优化用于在特定宿主细胞中表达的特定序列的计算机算法也是可用的,例如geneforge(aptagen;jacobus,pa)也是可用的。在一些实施方案中,编码工程化核酸酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多或所有密码子)对应于最常使用的特定氨基酸的密码子。[1810]包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这些细胞包括包装腺病毒的293个细胞和包装逆转录病毒的psi.2细胞或pa317细胞。用于基因治疗的病毒载体通常是通过产生将核酸载体包装成病毒颗粒的细胞系来产生的。载体通常包括包装和随后整合到宿主中所需的最少病毒序列,其他病毒序列被用于要表达的多核苷酸的表达盒替换。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗的aav载体通常仅具有来自aav基因组的itr序列,这些序列是包装和整合到宿主基因组中所需的。病毒dna可以包装在细胞系中,所述细胞系包括编码其他aav基因(即rep和cap)的辅助质粒,但缺少itr序列。细胞系也可以用腺病毒作为辅助感染。辅助病毒可以促进aav载体的复制和辅助质粒中aav基因的表达。在某些情况下,由于缺乏itr序列,辅助质粒没有大量包装。腺病毒的污染可以通过,例如,腺病毒比aav更敏感的热处理来减少。[1811]多效应核碱基编辑器的应用[1812]多效应核碱基编辑器可用于靶向感兴趣的多核苷酸以产生改变蛋白质表达的改变。在一个实施方案中,多效应核碱基编辑器用于修饰非编码或调控序列,包括但不限于剪接位点、增强子及转录调控组件。然后使用本领域已知的任何方法测定改变对受调控组件控制的基因表达的影响。在一个特定实施方案中,多效应核碱基编辑器能够显着改变调节序列,从而消除其调节基因表达的能力。有利地,与其他rna可编程的核酸酶相比,这可以在基因组目标序列中不产生双链断裂的情况下完成。[1813]多效应核碱基编辑器可用于靶向感兴趣的多核苷酸以产生改变蛋白质活性的改变。例如,在诱变的背景下,多效应核碱基编辑器比容易出错的pcr和其他基于聚合酶的方法具有许多优势。因为本发明的多效应核碱基编辑器在目标区域的多个碱基处产生改变,所以相对于通过易错pcr引入的突变,此类突改变有可能在蛋白质水平表达,后者不太可能在蛋白质水平表达。考虑到密码子中的单个核苷酸变化可能仍编码相同的氨基酸(例如,密码子简并性)。与在整个多核苷酸中诱导随机改变的易错pcr不同,本发明的多效应核碱基编辑器可用于靶向感兴趣蛋白质的小区域或限定区域内的特定氨基酸。[1814]在其他实施方案中,本发明的多效应核碱基编辑器用于靶向生物体基因组内的感兴趣的多核苷酸。在一个实施方案中,生物体是微生物组(microbiome)的细菌(例如,拟杆菌门(bacteriodetes)、疣微菌门(verrucomicrobia)、厚壁菌门(firmicutes);γ-变形菌门(gammaproteobacteria)、α变形菌门(alphaproteobacteria)、拟杆菌门、梭状芽孢杆菌(clostridia)、红皮杆菌门(erysipelotrichia)、芽孢杆菌;肠杆菌门(enterobacteriales)、拟杆菌门、疣状微菌、梭菌目(clostridiales)、红皮杆菌门、乳杆菌门(lactobacillales)、肠杆菌科(enterobacteriaceae)、拟杆菌科(bacteriodacease)、红皮杆菌门、普雷沃氏菌属(prevotellaceae)、科里杆菌科(coriobacteriaceae)和产碱菌科(alcaligenaceae)、埃希氏菌属(escherichia)、拟杆菌属、另枝菌属(alistipes)、艾克曼菌(akkermansia)、杆菌属(clostridium)、乳杆菌属)。在另一个实施方案中,生物体是农业上重要的动物(例如,牛、绵羊、山羊、马、鸡、火鸡)或植物(例如,大豆、小麦、玉米、水稻、烟草、苹果、葡萄、桃子、李子、樱桃)。在一个实施方案中,将本发明的多效应核碱基编辑器连同用于平铺细胞基因组内的多种序列的向导rna文库一起递送至细胞,从而系统地改变整个基因组中的序列。[1815]可以在多种蛋白质中的任一种中进行突变以促进结构功能分析或改变蛋白质的内源活性。例如,可以在酶(例如激酶、磷酸酶、羧化酶、磷酸二酯酶)或酶底物、受体或其配体以及抗体及其抗原中进行突变。在一个实施方案中,多效应核碱基编辑器靶向编码酶活性位点、受体配体结合位点或抗体互补决定区(cdr)的核酸分子。在酶的情况下,在活性位点诱导突变可以增加、减少或消除酶的活性。突变对酶的影响在酶活性测定中表征,包括本领域技术人员已知和/或显而易见的多种测定中的任一种。在受体的情况下,在配体结合位点发生的突变可以增加、减少或消除受体对其配体的亲和力。在受体/配体结合测定法中测定此类突变的影响,包括本领域技术人员已知和/或显而易见的多种测定法中的任一种。[1816]药物组合物[1817]本公开的其他方面涉及包括本文所述任何碱基编辑器、融合蛋白或融合蛋白-向导多核苷酸复合物的药物组合物。在一些实施方案中,药物组合物进一步包括药学上可接受的载体。在一些实施方案中,药物组合物包括另外的药剂(例如,用于特异性递送、增加半衰期或其他治疗化合物)。[1818]合适的药学上可接受的载体通常包括惰性物质,这些惰性物质有助于将药物组合物给予受试者,有助于将药物组合物加工成可递送的制剂,或有助于在给药前储存药物组合物。药学上可接受的载体可以包括能够稳定、优化或以其他方式改变制剂的形式、稠度、粘度、ph、药代动力学、溶解度的试剂。[1819]可用作药学上可接受的载体的材料的一些非限制性实例包括:(1)糖类,诸如乳糖、葡萄糖及蔗糖;(2)淀粉,诸如玉米淀粉和马铃薯淀粉;(3)纤维素及其源物,诸如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素及醋酸纤维素;(4)黄蓍胶粉;(5)麦芽;(6)明胶;(7)润滑剂,诸如硬脂酸镁、十二烷基硫酸钠、及滑石粉;(8)赋形剂,诸如可可脂和栓剂蜡;(9)油类,诸如花生油、棉籽油、红花油、香油、橄榄油、玉米油及豆油;(10)二醇类,诸如丙二醇;(11)多元醇,诸如甘油、山梨糖醇、甘露糖醇及聚乙二醇(peg);(12)酯类,诸如油酸乙酯、月桂酸乙酯;(13)琼脂;(14)缓冲剂,诸如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格液;(19)乙醇;(20)ph缓冲溶液;(21)聚酯、聚碳酸酯和/或聚酐;(22)填充剂,诸如多肽和氨基酸;(23)血清醇,诸如乙醇;及(23)用于药物制剂的其他无毒兼容物质。缓冲剂、润湿剂、乳化剂、稀释剂、包封剂、皮肤渗透促进剂、着色剂、脱模剂、涂层剂、甜味剂、调味剂、加香剂、防腐剂和抗氧化剂也可以存在于制剂中。例如,载体可包含但不限于盐水、缓冲盐水、葡萄糖、精氨酸、蔗糖、水、甘油、乙醇、山梨糖醇、葡聚糖、羧甲基纤维素钠及其组合。[1820]药物组合物可包括一种或多种ph缓冲化合物以将制剂的ph维持在反映生理ph的预定水平,例如在约5.0至约8.0的范围内。水性液体制剂中使用的ph缓冲化合物可以是氨基酸或氨基酸混合物,例如组氨酸或氨基酸混合物,例如组氨酸和甘氨酸。或者,ph缓冲化合物优选是将制剂的ph维持在预定水平,例如在约5.0至约8.0的范围内并且不螯合钙离子的试剂。这种ph缓冲化合物的说明性实例包括但不限于咪唑和乙酸根离子。ph缓冲化合物可以以适合将制剂的ph维持在预定水平的任何量存在。[1821]药物组合物还可包括一种或多种渗透调节剂,即,将制剂的渗透特性(例如,渗透压、渗透压、和/或渗透压)调节至血流和血细胞可接受的水平的化合物接收个体。渗透调节剂可以是不螯合钙离子的试剂。渗透调节剂可以是本领域技术人员已知或可获得的调节制剂渗透特性的任何化合物。本领域技术人员可以凭经验确定给定渗透调节剂用于本发明制剂的适用性。合适类型的渗透调节剂的说明性实例包括但不限于:盐,诸如氯化钠和乙酸钠;糖类,诸如蔗糖、右旋糖和甘露醇;氨基酸,如甘氨酸;以及一种或多种这些药剂和/或药剂类型的混合物。一种或多种渗透调节剂可以以足以调节制剂渗透特性的任何浓度存在。[1822]在一些实施方案中,药物组合物被配制用于递送至受试者,例如用于基因编辑。在一些实施方案中,本文考虑的药物组合物的给药可以使用常规技术进行,包括但不限于输注、输注或肠胃外。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动脉内、鞘内、瘤内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下和胸骨内输注或注射。在一些实施方案中,本文所述药物组合物的合适给药途径包括但不限于:局部、皮下、经皮、皮内、病灶内、关节内、腹膜内、膀胱内、经粘膜、牙龈、齿内、耳蜗内、经鼓膜、器官内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、瘤内、脑内和脑室内给药。[1823]在一些实施方案中,将本文所述药物组合物局部给药至患病部位(例如,肿瘤部位)。在一些实施方案中,本文所述药物组合物通过注射、通过导管、通过栓剂或通过植入物给予受试者,植入物为多孔、无孔或凝胶状材料,包括膜,诸如唾液酸膜,或纤维。[1824]在其他实施方案中,本文所述药物组合物在控释系统中递送。在一个实施方案中,可以使用泵(参见,例如,langer,1990,science249:1527-1533;sefton,1989,crccrit.ref.biomed.eng.14:201;buchwaldetal.,1980,surgery88:507;saudeketal,1989,n.engl.j.med.321:574)。在另一个实施方案中,可以使用聚合材料。(参见,例如,medicalapplicationsofcontrolledrelease(langerandwiseeds.,crcpress,bocaraton,fla.,1974);controlleddrugbioavailability,drugproductdesignandperformance(smolenandballeds.,wiley,newyork,1984);rangerandpeppas,1983,macromol.sci.rev.macromol.chem.23:61.seealsolevyetal.,1985,science228:190;duringetal.,1989,ann.neurol.25:351;howardetah,1989,j.neurosurg.71:105。)其他控释系统在例如langer,supra中有讨论。[1825]在一些实施方案中,根据常规程序将药物组合物配制成适于静脉内或皮下给药至受试者例如人的组合物。在一些实施方案中,用于通过注射给药的药物组合物是无菌等渗用途的溶液,用作增溶剂和局部麻醉剂例如利多卡因以缓解注射部位的疼痛。通常,成分以单位剂型单独提供或混合在一起提供,例如,作为指示活性剂量的密封容器如安瓿或小袋中的干燥冻干粉或无水浓缩物。当药物通过输液给药时,可以用装有无菌药用级水或盐水的输液瓶进行分配。当药物组合物通过注射给药时,可以提供无菌注射用水或盐水的安瓿,以便在给药前可以混合成分。[1826]用于全身给药的药物组合物可以是液体,例如无菌盐水、乳酸林格氏液或汉克氏液。此外,药物组合物可以是固体形式并在使用前立即重新溶解或悬浮。还考虑了冻干形式。药物组合物可包括在脂质颗粒或囊泡中,例如脂质体或微晶,其也适用于肠胃外给药。颗粒可以具有任何合适的结构,例如单层或多层,只要其中包括组合物。化合物可以被包裹在含有融合脂质二油酰磷脂酰乙醇胺(dope)、低水平(5至10摩尔%)阳离子脂质的“稳定质粒-脂质颗粒”(stableplasmid-lipidparticle,splp)中,并通过聚乙二醇(peg)涂层稳定(zzhangy.p.etah,genether.1999,6:1438-47)。带正电荷的脂质如n-[1-(2,3-二油酰氧基)丙基]-n,n,n-三甲基-甲基硫酸铵或“dotap”特别优选用于此类颗粒和囊泡。这种脂质颗粒的制备是众所周知的。参见,例如,美国专利号4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;及4,921,757;其中各者通过引用方式并入本文。[1827]例如,本文所述药物组合物可以作为单位剂量给药或包装。当用于本公开的药物组合物时,术语“单位剂量”是指适合作为受试者的单位剂量的物理上离散的单位,每个单位包括经计算以产生期望的治疗效果的预定量的活性物质。所需的稀释剂;即,承运人或车辆。[1828]此外,药物组合物可以作为药物试剂盒提供,其包括(a)含有冻干形式的本发明化合物的容器和(b)含有药学上可接受的稀释剂(例如,用于重构或稀释所述稀释剂的无菌容器)的第二个容器。本发明的冻干化合物。任选地与此类容器相关联的可以是由管理药物或生物产品的制造、使用或销售的政府机构规定的形式的通知,所述通知反映了制造、使用机构的批准或出售用于人类管理。[1829]在另一方面,包括含有可用于治疗上述疾病的材料的制品。在一些实施方案中,制品包括容器和标签。合适的容器包括例如瓶子、小瓶、注射器和试管。容器可由多种材料制成,例如玻璃或塑料。在一些实施方案中,容器容纳有效治疗本文所述疾病的组合物并且可以具有无菌进入口。例如,容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。组合物中的活性剂是本发明的化合物。在一些实施方案中,容器上或与容器相关的标签表示组合物用于治疗选择的疾病。制品可进一步包括第二容器,其包括药学上可接受的缓冲液,例如磷酸盐缓冲盐水、林格氏液或葡萄糖溶液。它还可以包括从商业和用户的角度来看所需的其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器和带有使用说明的包装插页。[1830]在一些实施方案中,本文所述的任何融合蛋白、grna、和/或复合物作为药物组合物的一部分提供。在一些实施方案中,药物组合物包括本文所提供的任何融合蛋白。在一些实施方案中,药物组合物包括本文所提供的任何复合物。在一些实施方案中,药物组合物包括核糖核蛋白复合物,所述复合物包括与grna和阳离子脂质形成复合物的rna向导的核酸酶(例如cas9)。在一些实施方案中,药物组合物包括grna、核酸可编程的dna结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可任选地包括一种或多种额外的治疗活性物质。[1831]在一些实施方案中,将本文所提供的组合物给药于受试者,例如对人类给药类受试者,以在受试者内实现靶向基因组修饰。在一些实施方案中,细胞获自受试者并与本文所提供的任何药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需基因组修饰之后,从受试者取出并离体与药物组合物接触的细胞重新引入受试者。递送包括核酸酶的药物组合物的方法是已知的,并且描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;及7,163,824,其内容通过引用整体并入本文。尽管本文所提供的药物组合物的描述主要涉及适合于对人类给药的药物组合物,但本领域技术人员将理解此类组合物通常适合于给药于各种动物或生物体,例如,兽医用。[1832]为使组合物适合于对各种动物给药而对适合对人给药的药物组合物进行修饰是众所周知的,并且普通的兽医药理学家可以仅通过普通的实验(如果有的话)来设计和/或进行这种修饰。考虑给予药物组合物的受试者包括但不限于人类和/或其他灵长类动物;哺乳动物、驯养动物、宠物和商业相关的哺乳动物,诸如牛、猪、马、羊、猫、狗、小鼠、和/或大鼠;和/或鸟类,包括商业相关鸟类,诸如鸡、鸭、鹅、和/或火鸡。[1833]本文所述药物组合物的制剂可以通过药理学领域中已知或以后开发的任何方法来制备。通常,此类制备方法包括将活性成分与赋形剂和/或一种或多种其他辅助成分结合的步骤,然后,如果需要和/或需要,将产品成型和/或包装成所需的单剂量或多剂量单位。药物制剂可另外包括药学上可接受的赋形剂,如本文所用,其包括任何和所有溶剂、分散介质、稀释剂或其他液体载体、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等,适合于所需的特定剂型。remington’sthescienceandpracticeofpharmacy,21stedition,a.r.gennaro(lippincott,williams&wilkins,baltimore,md,2006;其全部内容通过引用方式并入本文)公开了用于配制药物组合物的各种赋形剂及其制备的已知技术。还参见pct申请pct/us2010/055131(公开号wo2011/053982a8,2010年11月2日提交),其整体内容通过引用并入本文,用于生产包括核酸酶的药物组合物的其他合适的方法、试剂、赋形剂和溶剂。[1834]除非任何常规赋形剂介质与物质或其源物不兼容,例如通过产生任何不希望的生物效应或以有害方式与药物组合物的任何其他成分相互作用,否则其用途被认为是在本公开的范围。[1835]如上所述组合物可以有效量给药。有效量将取决于给药方式、所治疗的特定病症和期望的结果。它还可能取决于病症的阶段、受试者的年龄和身体状况、同时治疗的性质(如果有的话)以及医师公知的类似因素。对于治疗应用,所述量足以达到医学上所需的结果。[1836]在一些实施方案中,根据本公开的组合物可用于治疗多种疾病、障碍、和/或病症中的任一种。[1837]治疗方法[1838]还提供治疗疾病或病症和/或引起疾病或病症的基因突变的方法。这些方法包括向受试者(例如,哺乳动物,诸如人类)给药治疗有效量的药物组合物,所述药物组合物包括编码本文所述碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是包括napdnabp结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域的融合蛋白。受试者的细胞用碱基编辑器和一种或多种靶向碱基编辑器的向导多核苷酸转导以实现a·t至g·c的改变(若细胞用腺苷脱氨酶结构域转导)或c·g至u·a改变(若细胞用胞苷脱氨酶结构域转导)含有感兴趣基因突变的核酸序列。[1839]本文的方法包括向受试者(包括识别为需要此类治疗的受试者,或怀疑处于疾病风险中并需要此类治疗的受试者)给药有效量的本文所述组合物。识别需要此类治疗的受试者可以由受试者或医疗保健专业人员判断并且可以是主观的(例如,意见)或客观的(例如,可通过测试或诊断方法测量)。[1840]治疗方法通常包括给药治疗有效量的药物组合物,所述药物组合物包括例如编码碱基编辑器的载体和靶向有需要的受试者(例如人类患者)的感兴趣基因的grna。其中。此类治疗将适当地给药于患有、患有、易患所述疾病或病症或处于所述疾病或病症风险中的受试者,特别是人类受试者。[1841]在一个实施方案中,本发明提供一种监测治疗进展的方法。所述方法包括确定患有或易患疾病、病症或病症的受试者中诊断标志物(marker)(例如,与疾病或病症相关的snp)或诊断测量(例如,筛选、测定)的水平的步骤。其中受试者已给予足以治疗疾病或其症状的治疗量的本文组合物。在所述方法中确定的标记水平可以与健康正常对照或其他患病患者中的已知标记水平进行比较,以确定受试者的疾病状态。在优选的实施方案中,在确定第一水平之后的时间点确定受试者中标志物的第二水平,并且将这两个水平进行比较以监测疾病的进程或治疗的功效。在某些优选的实施方案中,在开始根据本发明的治疗之前确定受试者的治疗前标志物水平;然后可以将这种治疗前的标志物水平与治疗开始后受试者中的标志物水平进行比较,以确定治疗的功效。[1842]在一些实施方案中,细胞获自受试者并与本文所提供的药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需基因组修饰之后,从受试者取出并离体与药物组合物接触的细胞重新引入受试者。递送包括核酸酶的药物组合物的方法描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;及7,163,824,其所有公开内容通过引用整体并入本文。尽管本文所提供的药物组合物的描述主要涉及适合于对人类给药的药物组合物,本领域技术人员将理解此类组合物通常适合于给药于各种动物或生物体,例如,兽医用途。[1843]本文提供用本文所述组合物或系统,例如碱基编辑器系统或碱基编辑器蛋白质治疗疾病或病症的方法。任选地,本文所述碱基编辑器系统可以与一种或多种其他处理组合。一方面,本文提供一种通过给药本文所述碱基编辑器来治疗有需要的受试者的斯塔加特氏病(sd)的方法。一方面,本文提供一种通过给药本文所述碱基编辑器来治疗有需要的受试者的帕金森氏病(pd)的方法。一方面,本文提供一种通过给药本文所述碱基编辑器来治疗有需要的受试者的蕾特氏症(rtt)的方法。一方面,本文提供一种通过给药本文所述碱基编辑器来治疗有需要的受试者的贺勒氏症(hs)的方法。[1844]个体受试者的反应可以表征为完全反应、部分反应或稳定的疾病。在一些实施方案中,响应是部分响应(partialresponse,pr)。在一些实施方案中,响应是完全响应(completeresponse,cr)。在一些实施方案中,响应导致受试者的无进展存活(例如,稳定的疾病)。[1845]在一些实施方案中,如果人类受试者没有用化合物治疗,例如,与人类受试者的预期存活时间相比,治疗导致人类受试者的存活时间增加。在一些实施方案中,与用包括abe7(例如,abe7.10)的碱基编辑器治疗的受试者相比,延长的存活时间包括疾病进展更慢。[1846]在一些实施方案中,待用所述方法治疗的人类受试者是儿童(例如,0至18岁)。在其他实施方案中,待用所述方法治疗的人类受试者是成年人(例如,18岁以上)。[1847]斯塔加特氏病(sd)[1848]斯塔加特氏病(也称为斯塔加特氏病黄斑营养不良、青少年黄斑变性或黄色斑点沉着(fundusflavimaculatus))是视网膜(即,眼睛后部感知光线的组织)的一种遗传性疾病。斯塔加特氏病是导致黄斑变性的几种遗传性疾病之一。这种疾病通常会导致儿童期或青春期视力下降;尽管在某些情况下可能直到成年后期才注意到视力丧失。这种疾病很少发展为完全失明。通常,随着时间的推移,随着黄斑的进行性损伤(退化),视力丧失会随着时间的推移缓慢进展至20/200或更糟。在一种情况下,要用本文所述方法治疗的斯塔加特氏病包括幼年斯塔加特氏病。在另一种情况下,要用本文所述方法治疗的斯塔加特氏病包括迟发的斯塔加特氏病。在另一种情况下,要用本文所述方法治疗的斯塔加特氏病包括斯塔加特型显性黄斑营养不良。在另一种情况下,待用本文所述方法治疗的斯塔加特氏病包括显性斯塔加特样黄斑营养不良。[1849]斯塔加特氏病的症状进展可能因每位患者而异。较早发病的患者通常会出现更快的视力丧失。视力丧失最初可能会缓慢下降,然后迅速恶化,直至趋于平稳。大多数斯塔加特氏病患者的视力最终将达到20/200或更差。随着年龄的增长,患有斯塔加特氏病的人也可能开始失去一些周边(侧面)视力。[1850]在一些实施方案中,致病性snp与斯塔加特氏病相关;任选地,致病性snp位于abca4基因中;任选地,致病突变包括a1038v、l541p、g1961e或其组合。在一些实施方案中,致病性snp与弹性假黄瘤(pseudoxanthomaelasticum)相关;任选地,致病性snp位于abcc6基因中;并且任选地,致病性突变包括r1141*(无义突变)。在一些实施方案中,致病性snp与中链酰基辅酶a脱氢酶缺乏症相关;任选地,致病性snp位于acadm基因中;并且任选地,致病突变包括k329e。在一些实施方案中,致病性snp与严重联合免疫缺陷相关;任选地,致病性snp位于ada基因中;并且任选地,致病突变包括g216r、q3*或其组合。[1851]abca4多肽的实施例性氨基酸序列提供如下:[1852]》sp|p78363|abca4_人类视网膜特异性磷脂转运atpaseabca4os=智人ox=9606gn=abca4pe=1sv=3[1853]mgfvrqiqlllwknwtlrkrqkirfvvelvwplslflvliwlrnanplyshhechfpnkampsagmlpwlqgifcnvnnpcfqsptpgespgivsnynnsilarvyrdfqellmnapesqhlgriwtelhilsqfmdtlrthperiagrgirirdilkdeetltlflikniglsdsvvyllinsqvrpeqfahgvpdlalkdiacseallerfiifsqrrgaktvryalcslsqgtlqwiedtlyanvdffklfrvlptlldsrsqginlrswggilsdmspriqefihrpsmqdllwvtrplmqnggpetftklmgilsdllcgypegggsrvlsfnwyednnykaflgidstrkdpiysydrrttsfcnaliqslesnpltkiawraakpllmgkilytpdspaarrilknanstfeelehvrklvkaweevgpqiwyffdnstqmnmirdtlgnptvkdflnrqlgeegitaeailnflykgpresqaddmanfdwrdifnitdrtlrlvnqyleclvldkfesyndetqltqralslleenmfwagvvfpdmypwtsslpphvkykirmdidvvektnkikdrywdsgpradpvedfryiwggfaylqdmveqgitrsqvqaeapvgiylqqmpypcfvddsfmiilnrcfpifmvlawiysvsmtvksivlekelrlketlknqgvsnaviwctwfldsfsimsmsiflltifimhgrilhysdpfilflfllafstatimlcfllstffskaslaaacsgviyftlylphilcfawqdrmtaelkkavsllspvafgfgteylvrfeeqglglqwsnignsptegdefsfllsmqmmlldaavygllawyldqvfpgdygtplpwyfllqesywlggegcstreeralekteplteetedpehpegihdsfferehpgwvpgvcvknlvkifepcgrpavdrlnitfyenqitaflghngagktttlsiltgllpptsgtvlvggrdietsldavrqslgmcpqhnilfhhltvaehmlfyaqlkgksqeeaqlemeamledtglhhkrneeaqdlsggmqrklsvaiafvgdakvvildeptsgvdpysrrsiwdlllkyrsgrtiimsthhmdeadllgdriaiiaqgrlycsgtplflkncfgtglyltlvrkmkniqsqrkgsegtcscsskgfsttcpahvddltpeqvldgdvnelmdvvlhhvpeaklvecigqelifllpnknfkhrayaslfreleetladlglssfgisdtpleeiflkvtedsdsgplfaggaqqkrenvnprhpclgprekagqtpqdsnvcspgapaahpegqpppepecpgpqlntgtqlvlqhvqallvkrfqhtirshkdflaqivlpatfvflalmlsivippfgeypaltlhpwiygqqytffsmdepgseqftvladvllnkpgfgnrclkegwlpeypcgnstpwktpsvspnitqlfqkqkwtqvnpspscrcstrekltmlpecpegagglpppqrtqrsteilqdltdrnisdflvktypalirsslkskfwvneqryggisiggklpvvpitgealvgflsdlgrimnvsggpitreaskeipdflkhletednikvwfnnkgwhalvsflnvahnailraslpkdrspeeygitvisqplnltkeqlseitvlttsvdavvaicvifsmsfvpasfvlyliqervnkskhlqfisgvspttywvtnflwdimnysvsaglvvgifigfqkkaytspenlpalvallllygwavipmmypasflfdvpstayvalscanlfiginssaitfilelfennrtllrfnavlrkllivfphfclgrglidlalsqavtdvyarfgeehsanpfhwdligknlfamvvegvvyflltllvqrhfflsqwiaeptkepivdedddvaeerqriitggnktdilrlheltkiypgtsspavdrlcvgvrpgecfgllgvngagktttfkmltgdttvtsgdatvagksiltnisevhqnmgycpqfdaidelltgrehlylyarlrgvpaeeiekvanwsikslgltvyadclagtysggnkrklstaialigcpplvlldepttgmdpqarrmlwnvivsiiregravvltshsmeecealctrlaimvkgafrcmgtiqhlkskfgdgyivtmkikspkddllpdlnpveqffqgnfpgsvqrerhynmlqfqvsssslarifqlllshkdsllieeysvtqttldqvfvnfakqqteshdlplhpraagasrqaqd(seqidno:6)靶向在gctgtgtgtcgaagttcgccctggagaggtg或gctgtgtgtcggagttcgccctggagaggtgabca4基因的序列的向导rna序列,其中pam序列带有底线。向导rna包括一个序列caccucuccagggcgaacuucgacacacagc或caccucuccagggcgaacuccgacacacagc。[1854]斯塔加特氏病的一种或多种症状包括但不限于双眼中心视力变化缓慢的灰色、黑色或朦胧斑点;从明暗环境移动时,眼睛需要比平时更长的时间来适应;眼睛可能对强光更敏感;疾病后期出现色盲、视网膜色素上皮(rpe)细胞中诸如a2e的有毒脂褐素的积累、光感受器死亡、11-顺式-视黄醛(11cral或视黄醛)的合成增加、视紫质再生增加、脂褐素积累、脂褐素色素的形成、视网膜变性、废物的产生、a2e(和a2e相关分子)的形成、a2e(和a2e相关分子)的积累、脉络膜新生血管形成、脉络膜视网膜萎缩或其组合。受试者可能表现出斯塔加特氏病的一种或多种症状的改善。在一个实施方案中,一种或多种症状的改善至少为5%。在另一个实施方案中,一种或多种症状的改善是至少10%。在另一个实施方案中,一种或多种症状的改善是至少15%。在另一个实施方案中,一种或多种症状的改善是至少20%。在另一个实施方案中,一种或多种症状的改善是至少25%。在另一个实施方案中,一种或多种症状的改善是至少30%。在另一个实施方案中,一种或多种症状的改善是至少35%。在另一个实施方案中,一种或多种症状的改善是至少40%。在另一个实施方案中,一种或多种症状的改善是至少50%。在另一个实施方案中,一种或多种症状的改善是至少60%。在另一个实施方案中,一种或多种症状的改善是至少70%。在另一个实施方案中,一种或多种症状的改善是至少75%。在另一个实施方案中,一种或多种症状的改善是至少80%。在另一个实施方案中,一种或多种症状的改善是至少85%。在另一个实施方案中,一种或多种症状的改善是至少90%。在另一个实施方案中,一种或多种症状的改善是至少95%。[1855]帕金森氏病(pd)[1856]帕金森氏病(pd)是最常见的运动障碍,影响全球超过600万人。pd可表现为幼年或早发,但主要累及55岁以上的个体,65岁以后发病率急剧上升。pd的临床特征包括运动迟缓、姿势不稳、静止性震颤和僵硬等。主要与黑质(substantianigra,sn)致密部中多巴胺能神经元的逐渐丧失有关。据信,在正常衰老过程中,所述区域每年大约有0.1至0.2%的多巴胺能神经元丢失,但这一速度在pd患者中会大大加快,并且当这些神经元丢失约70至80%时就会出现症状。pd的另一个病理特点是在剩余的多巴胺能神经元中存在α-突触核蛋白蛋白包涵体,已知为路易小体(lewisbody,lb)。[1857]尽管大多数pd病例是特发性的,但约有10%的病例报告有家族史,并且越来越多的突变与所述疾病的家族性和散发性形式有关。富含亮氨酸的重复激酶2(lrrk2)的常染色体显性g2019s突变是家族性和散发性pd患者最常见的已知原因。[1858]lrrk2多肽的实施例性氨基酸序列提供如下:[1859]》sp|q5s007|lrrk2_人类富含亮氨酸的重复丝氨酸/苏氨酸蛋白激酶2os=智人ox=9606gn=lrrk2pe=1sv=2[1860]masgscqgceedeetlkklivrlnnvqegkqietlvqiledllvftyserasklfqgknihvpllivldsymrvasvqqvgwsllcklievcpgtmqslmgpqdvgndwevlgvhqlilkmltvhnasvnlsviglktldllltsgkitllildeesdifmlifdamhsfpandevqklgckalhvlfervseeqltefvenkdymillsaltnfkdeeeivlhvlhclhslaipcnnvevlmsgnvrcynivveamkafpmseriqevsccllhrltlgnffnilvlnevhefvvkavqqypenaalqisalsclalltetiflnqdleeknenqenddegeedklfwleacykaltwhrknkhvqeaacwalnnllmyqnslhekigdedghfpahrevmlsmlmhssskevfqasanalstlleqnvnfrkillskgihlnvlelmqkhihspevaesgckmlnhlfegsntsldimaavvpkiltvmkrhetslpvqlealrailhfivpgmpeesredtefhhklnmvkkqcfkndihklvlaalnrfignpgiqkcglkvissivhfpdalemlslegamdsvlhtlqmypddqeiqclglsligylitkknvfigtghllakilvsslyrfkdvaeiqtkgfqtilailklsasfskllvhhsfdlvifhqmssnimeqkdqqflnlcckcfakvamddylknvmleracdqnnsimvecllllgadanqakegsslicqvcekesspklvelllnsgsreqdvrkaltisigkgdsqiislllrrlaldvannsiclggfcigkvepswlgplfpdktsnlrkqtniastlarmviryqmksaveegtasgsdgnfsedvlskfdewtfipdssmdsvfaqsddldsegsegsflvkkksnsisvgefyrdavlqrcspnlqrhsnslgpifdhedllkrkrkilssddslrssklqshmrhsdsisslasereyitsldlsanelrdidalsqkccisvhlehleklelhqnaltsfpqqlcetlkslthldlhsnkftsfpsyllkmscianldvsrndigpsvvldptvkcptlkqfnlsynqlsfvpenltdvvekleqlilegnkisgicsplrlkelkilnlsknhisslsenfleacpkvesfsarmnflaampflppsmtilklsqnkfscipeailnlphlrsldmssndiqylpgpahwkslnlrellfshnqisildlsekaylwsrveklhlshnklkeippeigclenltsldvsynlelrsfpnemgklskiwdlpldelhlnfdfkhigckakdiirflqqrlkkavpynrmklmivgntgsgkttllqqlmktkksdlgmqsatvgidvkdwpiqirdkrkrdlvlnvwdfagreefysthphfmtqralylavydlskgqaevdamkpwlfnikarassspvilvgthldvsdekqrkacmskitkellnkrgfpairdyhfvnateesdalaklrktiineslnfkirdqlvvgqlipdcyvelekiilserknvpiefpvidrkrllqlvrenqlqldenelphavhflnesgvllhfqdpalqlsdlyfvepkwlckimaqiltvkvegcpkhpkgiisrrdvekflskkrkfpknymsqyfkllekfqialpigeeyllvpsslsdhrpvielphcenseiiirlyempyfpmgfwsrlinrlleispymlsgreralrpnrmywrqgiylnwspeayclvgsevldnhpesflkitvpscrkgcillgqvvdhidslmeewfpglleidicgegetllkkwalysfndgeehqkillddlmkkaeegdllvnpdqprltipisqiapdliladlprnimlnndelefeqapefllgdgsfgsvyraayegeevavkifnkhtslrllrqelvvlchlhhpslisllaagirprmlvmelaskgsldrllqqdkasltrtlqhrialhvadglrylhsamiiyrdlkphnvllftlypnaaiiakiadygiaqyccrmgiktsegtpgfrapevargnviynqqadvysfglllydilttggriveglkfpnefdeleiqgklpdpvkeygcapwpmveklikqclkenpqerptsaqvfdilnsaelvcltrrillpknvivecmvathhnsrnasiwlgcghtdrgqlsfldlntegytseevadsrilclalvhlpvekeswivsgtqsgtllvintedgkkrhtlekmtdsvtclycnsfskqskqknfllvgtadgklaifedktvklkgaaplkilnignvstplmclsestnsternvmwggcgtkifsfsndftiqklietrtsqlfsyaafsdsniitvvvdtalyiakqnspvvevwdkkteklcglidcvhflrevmvkenkeskhkmsysgrvktlclqkntalwigtggghillldlstrrlirviynfcnsvrvmmtaqlgslknvmlvlgynrkntegtqkqkeiqscltvwdinlphevqnlekhievrkelaekmrrtsve(seqidno:3)帕金森氏病是一种影响运动的进行性神经系统疾病。症状通常是逐渐开始的,有时仅用一只手就开始几乎不明显的震颤。震颤可能很常见,但这种疾病也通常会导致僵硬或运动减慢。在帕金森氏病的早期阶段,受试者的面部可能很少或没有表情。行走时,患者的手臂不得摆动。言语可能会变得柔和或含糊不清。帕金森氏病的症状通常会随着时间的推移而恶化。[1861]帕金森氏病的体征和症状因患者而异。早期迹象可能是轻微的,不会引起注意。症状通常从身体的一侧开始,并且通常会在所述侧变得更糟,即使在症状开始影响两侧之后也是如此。帕金森氏病的体征和症状包括但不限于一种或多种震颤、运动缓慢(运动迟缓);僵硬的肌肉;姿势和平衡受损;失去自动运动(例如,进行无意识运动的能力下降,包含眨眼、微笑或走路时摆动手臂);说话的变化(例如,说话轻声、快速、含糊不清或在说话前犹豫;说话可能更单调,而不是通常的语调);书写变化(例如,书写可能变得困难,书写可能看起来很小);血压变化(例如,由于血压突然下降(直立性低血压),患者站立时可能会感到晕眩或头晕);嗅觉功能障碍(例如,患者可能会遇到嗅觉问题);疲劳(例如,许多帕金森氏病患者会失去精力并感到疲劳,尤其是在当天晚些时候);疼痛(例如,一些帕金森氏病患者会在身体的特定部位或整个身体部位出现疼痛);性功能障碍(例如,一些帕金森氏病患者会注意到性欲或性能力下降);或其组合。[1862]受试者可能表现出帕金森氏病的一种或多种症状的改善。在一个实施方案中,一种或多种症状的改善至少为5%。在另一个实施方案中,一种或多种症状的改善是至少10%。在另一个实施方案中,一种或多种症状的改善是至少15%。在另一个实施方案中,一种或多种症状的改善是至少20%。在另一个实施方案中,一种或多种症状的改善是至少25%。在另一个实施方案中,一种或多种症状的改善是至少30%。在另一个实施方案中,一种或多种症状的改善是至少35%。在另一个实施方案中,一种或多种症状的改善是至少40%。在另一个实施方案中,一种或多种症状的改善是至少50%。在另一个实施方案中,一种或多种症状的改善是至少60%。在另一个实施方案中,一种或多种症状的改善是至少70%。在另一个实施方案中,一种或多种症状的改善是至少75%。在另一个实施方案中,一种或多种症状的改善是至少80%。在另一个实施方案中,一种或多种症状的改善是至少85%。在另一个实施方案中,一种或多种症状的改善是至少90%。在另一个实施方案中,一种或多种症状的改善是至少95%。[1863]还提供治疗pd和/或lrrk中导致pd的基因突变的方法,包括向受试者(例如哺乳动物,例如人类)给药治疗有效量的药物组合物,所述药物组合物包括编码的多核苷酸本文所述的碱基编辑器系统(例如,碱基编辑器和grna)。在一些实施方案中,碱基编辑器是包括多核苷酸可编程的dna结合结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域的融合蛋白。受试者的细胞用碱基编辑器和一种或多种靶向碱基编辑器的向导多核苷酸转导以实现含有lrrk基因突变的核酸序列的a·t至g·c的改变(若细胞用腺苷脱氨酶结构域转导)或c·gu·a改变(细胞若用胞苷脱氨酶结构域转导)。[1864]本文的方法包括向受试者(包括识别为需要此类治疗的受试者,或怀疑处于疾病风险中并需要此类治疗的受试者)给药有效量的本文所述组合物。识别需要此类治疗的受试者可以由受试者或医疗保健专业人员判断并且可以是主观的(例如意见)或客观的(例如可通过测试或诊断方法测量)。[1865]治疗方法通常包括给药治疗有效量的药物组合物,所述药物组合物包括例如编码碱基编辑器的载体和靶向有需要的受试者(例如人类患者)的lrrk2基因的grna。此类治疗将适当地给药于患有、具有、易患或有患pd的风险的受试者,特别是人类受试者。本文的组合物还可用于治疗可能涉及pd的任何其他病症。[1866]在一些实施方案中,向导rna在目标序列处靶向lrrk基因gctcgcccttcttcttcccctgtga、gtctttccctccaggctcgcccttcttcttcccctgtga、tcacaggggaagaagaagggcgagc、或tcacaggggaagaagaagggcgagcctggagggaaagac。在一些实施方案中,向导rna包括序列gcucgcccuucuucuuccccuguga、gucuuucccuccaggcucgcccuucuucuuccccuguga、ucacaggggaagaagaagggcgagc、或ucacaggggaagaagaagggcgagccuggagggaaagac。在一些实施方案中,向导rna包括序列uccgacuauaugaaaugccuuauuuuccaaugggauuuugg或uugcaaagauugcugacuagggcauugcucaguacugcuguagaaugg。[1867]在一个实施方案中,提供一种监测治疗进展的方法。所述方法包含确定患有或易患与pd相关的病症或其症状的受试者的诊断标志物(例如,与pd相关的snp)或诊断测量(例如,筛选、测定)的水平的步骤。已向受试者给药足以治疗疾病或其症状的治疗量的本文组合物。在所述方法中确定的标记水平可以与健康正常对照或其他患病患者中的已知标记水平进行比较,以确定受试者的疾病状态。在优选的实施方案中,在确定第一水平之后的时间点确定受试者中标志物的第二水平,并且将这两个水平进行比较以监测疾病的进程或治疗的功效。在某些优选的实施方案中,在开始根据本发明的治疗之前确定受试者的治疗前标志物水平;然后可以将这种治疗前的标志物水平与治疗开始后受试者中的标志物水平进行比较,以确定治疗的功效。[1868]在一些实施方案中,将本文所提供的组合物给药于受试者,例如对人类给药类受试者,以在受试者内实现靶向基因组修饰。在一些实施方案中,细胞获自受试者并与本文所提供的任何药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需基因组修饰之后,从受试者取出并离体与药物组合物接触的细胞重新引入受试者。递送包括核酸酶的药物组合物的方法是已知的,并且描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;及7,163,824,其全部公开内容通过引用并入本文。尽管本文所提供的药物组合物的描述主要涉及适合于对人类给药类的药物组合物,但本领域技术人员将理解此类组合物通常适合于给药于各种动物或生物体,例如,兽医用途。[1869]贺勒氏症(hs)[1870]贺勒氏症是1型粘多糖贮积症(mps1)的最严重形式,这是一种罕见的常染色体隐性溶酶体贮积症,大约每200,000名新生儿中就有一人发生。mps1的特点是骨骼异常、认知障碍、心脏病、呼吸系统问题、肝脏和脾脏肿大以及预期寿命缩短。mps1是由α-l-艾杜糖醛酸酶(idua)基因突变引起的,导致对于溶酶体中的糖胺聚糖分解重要的α-l-艾杜糖醛酸酶的缺乏。贺勒氏症患者的标准治疗是骨髓移植,但这种治疗不能校正已经造成的任何损伤,尤其是中枢神经系统,并且存在与移植相关的死亡风险。因此,需要用于治疗贺勒氏症患者的新颖组合物和方法。[1871]本公开提供用于治疗与点突变相关或由其引起的贺勒氏症的方法,所述点突变可以通过碱基编辑器介导的基因编辑来校正和/或症状可以治疗或改善。[1872]还提供治疗贺勒氏症和/或导致贺勒氏症的idua基因中的基因突变的方法,包括向受试者(例如,哺乳动物,例如人类)给药治疗有效量的本文所述包括多核苷酸编码碱基编辑器系统(例如,abe8碱基编辑器和grna)的药物组合物。在一些实施方案中,碱基编辑器是包括多核苷酸可编程的dna结合结构域和腺苷脱氨酶结构域的融合蛋白。用碱基编辑器和一种或多种靶向碱基编辑器的向导多核苷酸转导受试者的细胞,以实现包括idua基因突变的核酸序列的a·t至g·c改变。[1873]idua多肽的实施例性氨基酸序列提供如下:[1874]》sp|p35475|idua_人类α-l-艾杜糖醛酸酶os=智人ox=9606gn=iduape=1sv=2[1875]mrplrpraallallasllaappvapaeaphlvhvdaaralwplrrfwrstgfcpplphsqadqyvlswdqqlnlayvgavphrgikqvrthwllelvttrgstgrglsynfthldgyldllrenqllpgfelmgsasghftdfedkqqvfewkdlvsslarryigryglahvskwnfetwnepdhhdfdnvsmtmqgflnyydacseglraaspalrlggpgdsfhtpprsplswgllrhchdgtnfftgeagvrldyislhrkgarssisileqekvvaqqirqlfpkfadtpiyndeadplvgwslpqpwradvtyaamvvkviaqhqnlllanttsafpyallsndnaflsyhphpfaqrtltarfqvnntrpphvqllrkpvltamgllalldeeqlwaevsqagtvldsnhtvgvlasahrpqgpadawraavliyasddtrahpnrsvavtlrlrgvppgpglvyvtryldnglcspdgewrrlgrpvfptaeqfrrmraaedpvaaaprplpaggrltlrpalrlpslllvhvcarpekppgqvtrlralpltqgqlvlvwsdehvgskclwtyeiqfsqdgkaytpvsrkpstfnlfvfspdtgavsgsyrvraldywarpgpfsdpvpylevpvprgppspgnp(seqidno:4)。[1876]本文的方法包括向受试者(包括识别为需要此类治疗的受试者,或怀疑处于疾病风险中并需要此类治疗的受试者)给药有效量的本文所述组合物。识别需要此类治疗的受试者可以由受试者或医疗保健专业人员判断并且可以是主观的(例如,意见)或客观的(例如,可通过测试或诊断方法测量)。[1877]治疗方法通常包括给药治疗有效量的药物组合物,所述药物组合物包括例如编码碱基编辑器的载体和靶向有需要的受试者(例如人类患者)的idua基因的grna。此类治疗将适当地给药于患有、具有、易患或处于贺勒氏症风险中的受试者,特别是人类受试者。本文的组合物也可用于治疗可能涉及贺勒氏症的任何其他疾病。向导rna序列可以包括间隔序列cttttcacttttcctgccgggg(r255x)、agcttccatgtccagccttc(r106w)、accatgaagtcaaaatcatt(t158m)或gctttcagccccgtttcttg(r270x)。[1878]在一个实施方案中,本发明提供一种监测治疗进展的方法。所述方法包括确定患有或易患与hurler相关的病症或其症状的受试者的诊断标志物(例如,与贺勒氏症相关的snp)或诊断测量(例如,筛选、测定)的水平的步骤。已向受试者给药足以治疗疾病或其症状的治疗量的本文组合物的综合征。在所述方法中确定的标记水平可以与健康正常对照或其他患病患者中的已知标记水平进行比较,以确定受试者的疾病状态。在优选的实施方案中,在确定第一水平之后的时间点确定受试者中标志物的第二水平,并且将这两个水平进行比较以监测疾病的进程或治疗的功效。在某些优选的实施方案中,在开始根据本发明的治疗之前确定受试者的治疗前标志物水平;然后可以将这种治疗前的标志物水平与治疗开始后受试者中的标志物水平进行比较,以确定治疗的功效。[1879]在一些实施方案中,细胞获自受试者并与本文所提供的药物组合物接触。在一些实施方案中,任选地在所需的基因组修饰已经在细胞中受到影响或检测到之后,从受试者取出并离体与药物组合物接触的细胞被重新引入受试者。递送包括核酸酶的药物组合物的方法描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,其公开内容通过引用整体并入本文。尽管本文所提供的药物组合物的描述主要涉及适合于对人类给药的药物组合物,但本领域技术人员应理解,此类组合物通常适合于给药于各种动物或生物体,例如,兽医用途。[1880]待治疗的贺勒氏症的一种或多种症状包括但不限于粗糙的面部特征、角膜混浊、肝肿大、后凸畸形/驼背、疝气、气道相关症状(诸如睡眠障碍/打鼾)、脾肿大、心脏瓣膜异常、认知障碍、多发性营养不良、舌头扩大、关节挛缩、扁桃体扩大或其组合。[1881]受试者可能表现出贺勒氏症的一种或多种症状的改善。在一个实施方案中,一种或多种症状的改善至少为5%。在另一个实施方案中,一种或多种症状的改善是至少10%。在另一个实施方案中,一种或多种症状的改善是至少15%。在另一个实施方案中,一种或多种症状的改善是至少20%。在另一个实施方案中,一种或多种症状的改善是至少25%。在另一个实施方案中,一种或多种症状的改善是至少30%。在另一个实施方案中,一种或多种症状的改善是至少35%。在另一个实施方案中,一种或多种症状的改善是至少40%。在另一个实施方案中,一种或多种症状的改善是至少50%。在另一个实施方案中,一种或多种症状的改善是至少60%。在另一个实施方案中,一种或多种症状的改善是至少70%。在另一个实施方案中,一种或多种症状的改善是至少75%。在另一个实施方案中,一种或多种症状的改善是至少80%。在另一个实施方案中,一种或多种症状的改善是至少85%。在另一个实施方案中,一种或多种症状的改善是至少90%。在另一个实施方案中,一种或多种症状的改善是至少95%。[1882]蕾特氏症(rtt)[1883]还提供治疗蕾特氏症(rtt)和/或导致rtt的mecp2基因突变的方法,包括向受试者(例如哺乳动物,例如人类)给药治疗有效量的药物组合物,所述药物组合物包括编码本文所述的碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是包括多核苷酸可编程的dna结合结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域的融合蛋白。受试者的细胞用碱基编辑器和一种或多种靶向碱基编辑器的向导多核苷酸转导以实现含有mecp2基因突变的核酸序列的a·t至g·c的改变(若细胞用腺苷脱氨酶结构域转导)或c·gu·a改变(若细胞用胞苷脱氨酶结构域转导)。[1884]mecp2多肽的实施例性氨基酸序列提供如下:[1885]》sp|p51608|mecp2_人类甲基cpg结合蛋白2os=智人ox=9606gn=mecp2pe=1sv=1[1886]mvagmlglreeksedqdlqglkdkplkfkkvkkdkkeekegkhepvqpsahhsaepaeagkaetsegsgsapavpeasaspkqrrsiirdrgpmyddptlpegwtrklkqrksgrsagkydvylinpqgkafrskveliayfekvgdtsldpndfdftvtgrgspsrreqkppkkpkspkapgtgrgrgrpkgsgttrpkaatsegvqvkrvlekspgkllvkmpfqtspggkaegggattstqvmvikrpgrkrkaeadpqaipkkrgrkpgsvvaaaaaeakkkavkessirsvqetvlpikkrktretvsievkevvkpllvstlgeksgkglktckspgrkskesspkgrsssassppkkehhhhhhhsespkapvpllpplpppppepessedptsppepqdlsssvckeekmprggslesdgcpkepaktqpavataataaekykhrgegerkdivsssmprpnreepvdsrtpvtervs(seqidno:5)。[1887]向导rna序列可以包括间隔[1888]cttttcacttttcctgccgggg(r255x、agcttccatgtccagccttc(r106w)、accatgaagtcaaaatcatt(t158m)、或gctttcagccccgtttcttg(r270x)。[1889]本文的方法包括向受试者(包括识别为需要此类治疗的受试者,或怀疑处于疾病风险中并需要此类治疗的受试者)给药有效量的本文所述组合物。识别需要此类治疗的受试者可以由受试者或医疗保健专业人员判断并且可以是主观的(例如意见)或客观的(例如可通过测试或诊断方法测量)。[1890]治疗方法通常包括给药治疗有效量的药物组合物,所述药物组合物包括例如编码碱基编辑器的载体和靶向有需要的受试者(例如人类患者)的mecp2基因的grna。此类治疗将适当地给药于患有、具有、易患rtt或处于rtt风险中的受试者,特别是人类受试者。本文的组合物还可用于治疗任何其他可能涉及rtt的疾病。[1891]在一个实施方案中,本发明提供一种监测治疗进展的方法。所述方法包括确定患有或易患与rtt相关的病症或其症状的受试者的诊断标志物(例如,与rtt相关的snp)或诊断测量(例如,筛选、测定)的水平的步骤。已向受试者给药足以治疗疾病或其症状的治疗量的本文组合物。在所述方法中确定的标记水平可以与健康正常对照或其他患病患者中的已知标记水平进行比较,以确定受试者的疾病状态。在优选的实施方案中,在确定第一水平之后的时间点确定受试者中标志物的第二水平,并且将这两个水平进行比较以监测疾病的进程或治疗的功效。在某些优选的实施方案中,在开始根据本发明的治疗之前确定受试者的治疗前标志物水平;然后可以将这种治疗前的标志物水平与治疗开始后受试者中的标志物水平进行比较,以确定治疗的功效。[1892]在一些实施方案中,细胞获自受试者并与本文所提供的药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需基因组修饰之后,从受试者取出并离体与药物组合物接触的细胞重新引入受试者。递送包括核酸酶的药物组合物的方法描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;及7,163,824,其公开内容通过引用整体并入本文。尽管本文所提供的药物组合物的描述主要涉及适合于对人类给药的药物组合物,但本领域技术人员应理解,此类组合物通常适合于给药于各种动物或生物体,例如,兽医用途。[1893]蕾特氏症的一种或多种症状包括但不限于就寝时间抵抗、入睡延迟、睡眠持续时间、睡眠焦虑、夜醒、异态睡眠、睡眠呼吸障碍、白天嗜睡、手部功能、行走、语言和非语言沟通、理解、注意力、行为问题、情绪、癫痫活动、行为和情绪特征,或其组合。[1894]受试者可能表现出蕾特氏症的一种或多种症状的改善。在一个实施方案中,一种或多种症状的改善至少为5%。在另一个实施方案中,一种或多种症状的改善是至少10%。在另一个实施方案中,一种或多种症状的改善是至少15%。在另一个实施方案中,一种或多种症状的改善是至少20%。在另一个实施方案中,一种或多种症状的改善是至少25%。在另一个实施方案中,一种或多种症状的改善是至少30%。在另一个实施方案中,一种或多种症状的改善是至少35%。在另一个实施方案中,一种或多种症状的改善是至少40%。在另一个实施方案中,一种或多种症状的改善是至少50%。在另一个实施方案中,一种或多种症状的改善是至少60%。在另一个实施方案中,一种或多种症状的改善是至少70%。在另一个实施方案中,一种或多种症状的改善是至少75%。在另一个实施方案中,一种或多种症状的改善是至少80%。在另一个实施方案中,一种或多种症状的改善是至少85%。在另一个实施方案中,一种或多种症状的改善是至少90%。在另一个实施方案中,一种或多种症状的改善是至少95%。[1895]试剂盒[1896]本公开的各个方面提供包括碱基编辑器系统的试剂盒。在一个实施方案中,所述试剂盒包括核酸构建体,所述核酸构建体包括编码核碱基编辑器融合蛋白的核苷酸序列。融合蛋白包括脱氨酶(例如胞苷脱氨酶或腺嘌呤脱氨酶)和核酸可编程的dna结合蛋白(napdnabp)。在一些实施方案中,试剂盒包括至少一种能够靶向感兴趣的核酸分子的向导rna。在一些实施方案中,所述试剂盒包括包含编码至少一种向导rna的核苷酸序列的核酸构建体。[1897]在一些实施方案中,所述试剂盒提供使用所述试剂盒编辑一个或多个突变的说明。说明书通常包括关于使用试剂盒编辑核酸分子的信息。在其他实施方案中,说明包括以下至少一项:注意事项;警告;临床研究;和/或参考。说明可以直接印在容器上(如果有),或者作为贴在容器上的标签,或者作为单独的纸张、小册子、卡片或文件夹提供在容器中或随容器一起提供。在进一步的实施方案中,试剂盒可以包括标签或单独的插页(包装插页)形式的用于合适的操作参数的说明。在又一个实施方案中,试剂盒可以包括具有合适的阳性和阴性对照或对照样本的一个或多个容器,以用作检测、校准或标准化的标准。所述试剂盒还可包括含有药学上可接受的缓冲液的第二容器,例如(无菌)磷酸盐缓冲盐水、林格氏液或葡萄糖溶液。它还可以包括从商业和用户的角度来看所需的其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器和带有使用说明的包装插页。[1898]除非另有说明,否则本发明的实施采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些都在本领域技术人员的能力范围内。此类技术在文献中得到充分解释,例如,本公开的各个方面提供包括碱基编辑器系统的试剂盒。在一个实施方案中,所述试剂盒包括核酸构建体,所述核酸构建体包括编码核碱基编辑器融合蛋白的核苷酸序列。融合蛋白包括脱氨酶(例如胞苷脱氨酶或腺嘌呤脱氨酶)和核酸可编程的dna结合蛋白(napdnabp)。在一些实施方案中,试剂盒包括至少一种能够靶向感兴趣的核酸分子的向导rna。在一些实施方案中,所述试剂盒包括包含编码至少一种向导rna的核苷酸序列的核酸构建体。[1899]在一些实施方案中,所述试剂盒提供使用所述试剂盒编辑一个或多个突变的说明。说明书通常包括关于使用试剂盒编辑核酸分子的信息。在其他实施方案中,说明包括以下至少一项:注意事项;警告;临床研究;和/或参考。说明可以直接印在容器上(如果有),或者作为贴在容器上的标签,或者作为单独的纸张、小册子、卡片或文件夹提供在容器中或随容器一起提供。在进一步的实施方案中,试剂盒可以包括标签或单独的插页(包装插页)形式的用于合适的操作参数的说明。在又一个实施方案中,试剂盒可以包括一个或多个容器,其中装有合适的阳性和阴性对照或对照样本,用作检测、校准或标准化的标准。所述试剂盒还可包括含有药学上可接受的缓冲液的第二容器,例如(无菌)磷酸盐缓冲盐水、林格氏液或葡萄糖溶液。它还可以包括从商业和用户的角度来看所需的其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器和带有使用说明的包装插页。[1900]除非另有说明,否则本发明的实施采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些都在本领域技术人员的能力范围内。这些技术在文献中得到了充分的解释,例如,“molecularcloning:alaboratorymanual”,secondedition(sambrook,1989);“oligonucleotidesynthesis”(gait,1984);“animalcellculture”(freshney,1987);“methodsinenzymology”“handbookofexperimentalimmunology”(weir,1996);“genetransfervectorsformammaliancells”(millerandcalos,1987);“currentprotocolsinmolecularbiology”(ausubel,1987);“pcr:thepolymerasechainreaction”,(mullis,1994);“currentprotocolsinimmunology”(coligan,1991)。这些技术适用于生产本发明的多核苷酸和多肽,因此,可以在制造和实践本发明时加以考虑。特定实施方案的特别有用的技术将在以下部分中讨论。[1901]提出以下实施例是为了向本领域技术人员提供如何进行和使用本发明的测定、筛选和治疗方法的完整公开和描述,并且不旨在限制本发明的范围发明者认为是他们的发明。[1902]实施例[1903]实施例1:具有增加的编辑效率的腺苷碱基编辑器[1904]包含tad7.10-dcas9融合蛋白的碱基编辑系统能够以大约10至20%的效率编辑目标多核苷酸,但对于需要更高效率的用途,其使用可能会受到限制。为了识别具有提高的效率和特异性的腺嘌呤碱基编辑器,包括腺苷脱氨酶tada7.10的构建体通过易错pcr进行诱变,随后克隆到与编码dcas9(一种核酸可编程的dna结合蛋白)的核酸序列相邻的表达载体中(图1a)。将包括腺苷脱氨酶变体的表达载体与编码氯霉素抗性(camr)和奇霉素抗性(spectr)的选择质粒共转换到感受态细菌细胞中,并具有通过两个点突变变得无功能的卡那霉素抗性基因(第7轮进化策略)(图1b)。选择细胞以恢复卡那霉素抗性,这是腺苷脱氨酶活性的读数。在随后的几轮选择中,将表达载体与编码氯霉素抗性(camr)和奇霉素抗性(spectr)的质粒共转换到感受态细胞中,并具有通过三点突变变得无功能的卡那霉素抗性基因(第8轮进化策略))(图1c)。灭活的卡那霉素抗性基因核酸序列提供如下:[1905]上述序列中,小写字母表示卡那霉素抗性启动子区,粗体序列表示靶向失活部分(q4*和w15*),斜体序列表示卡那霉素抗性基因(d208n)靶向失活位点,底线序列表示pam序列。[1906]再次将细胞接种到一系列卡那霉素浓度增加的琼脂糖板上。如图2所示,具有有效碱基编辑活性的腺苷脱氨酶变体能够校正卡那霉素抗性基因中存在的突变,并选择用于进一步分析。在表13中描述了在细菌细胞中显示有效碱基编辑的腺苷脱氨酶变体碱基编辑器。产生了编码包括所选腺苷脱氨酶变体的碱基编辑器的哺乳动物表达载体。[1907]表达与镰状细胞病相关的β-球蛋白的hek293t细胞含有e6v(也称为e7v)突变,用于测试腺苷脱氨酶变体的编辑效率(图3a和3b)。这些被称为“hek293t/hbbe6v”细胞的细胞使用表达碱基编辑系统的慢病毒载体转导,所述达碱基编辑系统包括包含表13中列出的abe8碱基编辑器的融合蛋白。abe8碱基编辑器是通过将腺苷脱氨酶变体克隆到支架中而产生的包括一个环状置换cas9和一个二分核定位序列。环状置换cas9是本领域已知的并且描述于例如oakesetal.,cell176,254-267,2019。这些序列在下文中提供。[1908]胎儿血红蛋白的上调是克服镰状细胞病的一种治疗方法。图3a显示了胎儿血红蛋白上调的治疗相关位点。编辑残基5和8的腺苷可以显着降低bcl11a结合,从而增加胎儿血红蛋白的表达。参考图3a,abe8碱基编辑器的碱基编辑活动比abe7.10碱基编辑器高约2至3倍。[1909]表13:新颖腺嘌呤碱基编辑器abe8[1910]质粒id描述功能280abe8.1单体_tada*7.10+y147t281abe8.2单体_tada*7.10+y147r282abe8.3单体_tada*7.10+q154s283abe8.4单体_tada*7.10+y123h284abe8.5单体_tada*7.10+v82s285abe8.6单体_tada*7.10+t166r286abe8.7单体_tada*7.10+q154r287abe8.8单体_y147r_q154r_y123h288abe8.9单体_y147r_q154r_i76y289abe8.10单体_y147r_q154r_t166r290abe8.11单体_y147t_q154r291abe8.12单体_y147t_q154s292abe8.13单体_h123y123h_y147r_q154r_i76y293abe8.14异源二聚体_tada*7.10+y147t294abe8.15异源二聚体_tada*7.10+y147r295abe8.16异源二聚体_tada*7.10+q154s296abe8.17异源二聚体_tada*7.10+y123h297abe8.18异源二聚体_tada*7.10+v82s298abe8.19异源二聚体_tada*7.10+t166r299abe8.20异源二聚体_tada*7.10+q154r300abe8.21异源二聚体_y147r_q154r_y123h301abe8.22异源二聚体_y147r_q154r_i76y302abe8.23异源二聚体_y147r_q154r_t166r303abe8.24异源二聚体_y147t_q154r304abe8.25异源二聚体_y147t_q154s[1911]参考图4所示,abe8碱基编辑器与靶向编码hbbe6v的多核苷酸的18、19、20、21或22个核苷酸向导rna一起被引入hek293t/hbbe6v细胞。当与循环置换(cp)-cas9融合时,abe8编辑器显示出更高的编辑效率。总共测试了40种不同的abe8构建体(表14)和三种abe7.10构建体在hek293t/hbbe6v细胞中的编辑活性。例示性构建体的序列如下。为了评估编辑的特异性,监测目标突变和非预期突变或旁观者突变(图5)。密码子5中腺苷的意外编辑是沉默的。然而,密码子9的非预期编辑导致丝氨酸到脯氨酸突变。再次参考图5,与abe7.10编辑器相比,多个abe8碱基编辑器显示出更高的编辑效率和特异性,并且没有一个编辑器具有导致丝氨酸至脯氨酸错义突变的显着旁观者编辑。[1912]在含有镰状细胞突变的成纤维细胞中对选定的abe8碱基编辑器和abe7.10碱基编辑器对照进行了进一步分析。如图6所示,与abe7.10相比,abe8编辑器增加了碱基编辑活动。abe8.18显示大约70%的效率。选定的abe8编辑器也显示出前所未有的特异性。重要的是,所有abe8编辑器的平均插入缺失形成低于0.1%。[1913]表14:[1914][1915]forefficienttargetedmutagenesisinrice.plantmolbiol88,561-572,doi:10.1007/s11103-015-0342-x(2015);jinek,m.etal.,rna-programmedgenomeeditinginhumancells.elife2,e00471,doi:10.7554/elife.00471(2013))。碱基编辑器的原始cas9n组分包括六个潜在的多聚腺苷酸化位点,导致在真核生物中的表达不佳(参见,例如,kim,s.etal.,rescueofhigh-specificitycas9variantsusingsgrnaswithmatched5'nucleotides.genomebiol18,218,doi:10.1186/s13059-017-1355-3(2017);komor,a.c.etal.,programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424,doi:10.1038/nature17946(2016);gaudelli,n.m.etal.programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。用广泛优化的密码子序列置换可以提高碱基编辑效率(参见,例如cong,l.etal.multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823,doi:10.1126/science.1231143(2013);koblan,l.w.etal.improvingcytidineandadeninebaseeditorsbyexpressionoptimizationandancestralreconstruction.natbiotechnol,doi:10.1038/nbt.4172(2018);zafra,m.p.etal.optimizedbaseeditorsenableefficienteditingincells,organoidsandmice.natbiotechnol,doi:10.1038/nbt.4194(2018))。[1919]评估了与四种abe构建体相关的dna靶上(图9a、9b)、dna脱靶(图9c、9d)和rna脱靶(图9e)碱基编辑频率,所有这些都含有密码子-优化的cas9(d10a):i)abe7.10,它具有单个c端bp-sv40nls;ii)缺少abe7.10的5'tada野生型部分的monoabe7.10;iii)abemax,其含有密码子优化的tada区域和两个bpnls序列;及iv)abemax(-bpnls),其具有作为abemax的tada密码子优化,但含有单个c端bp-sv40nls。[1920]所有四种构建体都显示出非常相似的靶向编辑效率,表示nls结构和tada密码子优化并不能决定靶向编辑效率(图9a、9b)。脱靶谱也高度相似,但与abe7.10(图9c、9d)相比,abemax在一个位点显示出显着更大的dna脱靶编辑(p=0.00027,学生的双尾t检验)。abemax(-nbpnls)显示出比abe7.10高1.6倍的rna脱靶编辑平均频率(图9e)。[1921]实施例3:具有扩展靶向范围的卓越腺嘌呤碱基编辑器[1922]abe是一种分子机器,包括进化的大肠杆菌trnaarg修饰酶tada,所述酶与催化受损的cas9蛋白(d10a切口酶cas9、ncas9)共价融合(图7a和7b)。为了克服先前腺嘌呤碱基编辑器的局限性,通过设计abe来提高细菌选择系统的严格性,所述abe必须进行三个并发的a·t至g·c回复编辑才能在抗生素选择中存活下来。在之前的abe进化中,tada文库是通过容易出错的pcr创建的。相比之下,使用的tada等位基因的合成文库在tada的每个位置包括所有20个规范氨基酸取代,每个文库成员的平均频率为1至2个核苷酸替换突变。所述化学文库能够进入比容易出错的pcr技术更大的序列空间。[1923]约300个克隆被分离出来并随后被测序。从得到的测序数据中,在tada*内识别了八个突变,这些突变以高频率富集(表7和9)。八个已识别的氨基酸突变中有六个需要每个密码子至少两个核碱基变化,这是以前的tada容易出错的文库未观察到的。两个富集的突变改变了靠近腺嘌呤脱氨活性位点的残基(i76和v82)(图7c)。除了先前报道的tada*7.10的c端α螺旋中的四个突变之外,在相同的α螺旋(y147r和q154r)内观察到了两个新的突变(图7c)。这种高度突变的α-螺旋对于强大的产品形成是必要的,因为在截断时碱基编辑效率显着降低(图10a和10b)。[1924]为了测试哺乳动物细胞中tada*变体的活性,be密码子优化和nls方向与最有利的靶上和脱靶特征一起使用(参见实施例2;图9a至9e)。8个富集的tada*突变以各种组合被整合到abe7.10中,产生了40个新的abe8变体(表7和9)。制作其中abe的tada区域是非活性(野生型)和活性(进化)tada*原体的异源二聚体融合或工程化tada*的单个原体的abe8构建体,产生约500个碱基-配对较小的编辑器。这些架构变体分别称为abe8.x-d和abe8.x-m(表7和9)。[1925]首先,评估了这40个构建体相对于abe7.10横跨8个基因组位点的靶向dna编辑效率,这些位点包括位于2到20位(其中nggpam=21、22、23位)的8个基因组位点。规范的20个核苷酸个核苷酸化脓链球菌前间隔(图11)。n端野生型tada构建体对于使用abe8进行稳健的dna编辑不是必需的。事实上,包括n端野生型tada(abe8.xd)的构建体在编辑窗口偏好、总dna编辑结果和相对于其经济化架构(abe8.xm)的插入缺失频率方面表现相似(图7d、图11、图12)。尽管构建体内tada(野生型):tada*8二聚化可能不是abe8活性所必需的,但并不排除在abe8表达的碱基编辑器之间发生反式tada*8:tada*8二聚化的可能性。[1926]在所有测试的位点中,与abe7.10相比,abe8在前间隔的规范位置(a5至a7)处的编辑率提高了约1.5倍,在非规范位点(a3至a4、a8至a10)处的编辑率提高了约3.2倍(图13)。目标序列、目标窗口内“a”的位置和abe8构建体身份之间的倍数差异不同(图7d、图11、图13)。总体而言,相对于abe7.10(范围1.34至4.49),所有测试位点中所有位置的编辑变化中位数是1.94倍。[1927]接下来,从四十个构建体的大型abe8池中,选择abe8构建体的子集(abe8.8-m、abe8.13-m、abe8.17-m、abe8.20-m、abe8.8-d、abe8.13-m、abe8.17-d和abe8.20-d)以进行更详细的评估。如通过分层聚类分析确定,这些构建体代表了在8个基因组位点之间在编辑性能方面具有明显差异的abe8的(图14)。这些abe8在所有测试的基因组位点都显着优于abe7.10(p值=0.0006871,双尾wilcoxon秩和检验),并且包括从abe8定向进化活动中识别的各种突变组合(图15和图16)。[1928]尽管已经描述了识别非nggpam的abe变体,与使用靶向nggpam序列的化脓链球菌cas9观察到的结果相比,这些构建体的编辑效率在许多情况下会降低(参见例如huang,t.p.etal.circularlypermutedandpam-modifiedcas9variantsbroadenthetargetingscopeofbaseeditors.natbiotechnol37,626-631,doi:10.1038/s41587-019-0134-y(2019);hua,k.etal.,expandingthebaseeditingscopeinricebyusingcas9variants.plantbiotechnolj,doi:10.1111/pbi.12993(2018);yang,l.etal.,increasingtargetingscopeofadenosinebaseeditorsinmouseandratembryosthroughfusionoftadadeaminasewithcas9variants.proteincell9,814-819,doi:10.1007/s13238-018-0568-x(2018))。为了确定进化的脱氨酶是否也提高了带有非nggpam的目标位点的编辑效率,创建了用工程化的化脓链球菌变体ng-cas9(pam:ng)(nishimasu,h.etal.engineeredcrispr-cas9nucleasewithexpandedtargetingspace.science(2018))或金黄色葡萄球菌cas9(sacas9,pam:nngrrt)(ran,f.a.etal.invivogenomeeditingusingstaphylococcusaureuscas9.nature520,186-191,doi:al.transcriptome-wideoff-targetrnaeditinginducedbycrispr-guideddnabaseeditors.nature569,433-437,doi:10.1038/s41586-019-1161-z(2019);zhou,c.etal.off-targetrnamutationinducedbydnabaseeditinganditseliminationbymutagenesis.nature571,275-278,doi:10.1038/s41586-019-1314-0(2019))将脱氨酶的tada部分安装到abe8.17-m,以评估脱靶编辑频率的降低。所有这些突变都不同程度地降低了abe8.17-m的靶上编辑频率,其中v106w和f148a对abe8的损害最小(图25c和25d)。其中,只有v106w能够显着降低脱靶rna和dna编辑的水平(图25b)。因此,将v106w突变包含在abe8中适用于必须避免细胞转录组瞬时扰动的情况,或与混杂的sgrna使用。[1936]实施例5:用于治疗血液病症的腺嘌呤碱基编辑器[1937]在人类造血干细胞(hsc)中评估了abe8构建体。在作为细胞疗法给予患者之前,对hsc进行体外操作和/或编辑是治疗血液病的一种很有前景的方法。之前已经证明abe可以在hbg1/2启动子区域的-198位置引入t至c的取代(gaudelli,n.m.etal.programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。这种自然发生的等位基因产生胎儿血红蛋白遗传性持久性(hereditarypersistenceoffealhemoglobin,hpfh),导致γ-球蛋白水平增加到成年期,这可以减轻镰状细胞病和β-地中海贫血中β-球蛋白的缺陷(wienert,b.etal.klf1drivestheexpressionoffetalhemoglobininbritishhpfh.blood130,803-807,doi:10.1182/blood-2017-02-767400(2017))。为了再现hpfh表型和评估abe8的临床相关性,从两个供体中单离出cd34+造血干细胞,并用编码abe8编辑器的mrna和将目标a置于前间隔的第7位的末端修饰的sgrna转染,。[1938]-198hbg1/2启动子目标位点的平均abe8编辑效率在早期时间点(48小时)比任一abe7.10构建体高2至3倍,在后期比任一abe7.10高1.3至2倍(144h)(图27a、图28、图29)。这些动力学差异对于离体疗法在临床上很重要,在这种疗法中,在给予细胞疗法之前必须将细胞培养保持在最低限度。[1939]接下来,通过uplc对abe处理和红细胞分化后产生的γ-球蛋白的量进行定量(图30至50)。当将abe8.13-d与使用abe7.10-m/d时,与模拟处理细胞相比,观察到来自abe8处理组的红细胞中%γ-球蛋白/α-球蛋白表达的平均增加3.5倍(图27b)。据预测,改善镰状细胞病的症状需要≥20%的hbf,而β-地中海贫血患者可能需要甚至更高的最低水平(参见例如,canver,m.c.&orkin,s.h.customizingthegenomeastherapyforthebeta-hemoglobinopathies.blood127,2536-2545,doi:10.1182/blood-2016-01-678128(2016);fitzhugh,c.d.etal.atleast20%donormyeloidchimerismisnecessarytoreversethesicklephenotypeafterallogeneichsct.blood130,1946-1948,doi:10.1182/blood-2017-03-772392(2017))。在abe8处理后观察到的γ-球蛋白水平超过了这个阈值。[1940]总体而言,abe8s在γ球蛋白基因hbg1和hbg2的启动子处重建了胎儿血红蛋白(hpfh)等位基因的天然遗传持久性,在人类cd34+细胞培养物中实现高达60%的编辑效率和在分化的红细胞中的相应的伽马球蛋白表达上调。[1941]实施例6:用于治疗镰状细胞病和β地中海贫血的互补碱基编辑方法[1942]镰状细胞病(scd)和β地中海贫血是β球蛋白产生和功能障碍,可导致严重贫血和多种器官系统的严重疾病并发症。通过上调胎儿血红蛋白(hbf)或校正β球蛋白基因而设计的造血干细胞的自体移植有可能减轻β血红蛋白病患者的疾病负担。碱基编辑是最近开发的一项技术,可以在不引入双链dna断裂的情况下精确修改基因组。[1943]用胞嘧啶和腺嘌呤碱基编辑器(abe)对γ球蛋白基因启动子进行了全面筛选,以识别会去抑制hbf的改变。确定了三个显着上调hbf的区域,并且最有效的核苷酸残基转换得到了遗传性胎儿血红蛋白(hpfh)持久性患者的自然变异的支持。已开发abe,其在hbg1和hbg2启动子内的关键调控基序的核苷酸转换后,可显着增加hbf的水平。cd34+造血干细胞和祖细胞(hspc)在临床规模上进行纯化,并使用旨在保持自我更新能力的过程进行编辑。在具有不同abe的两个独立位点的编辑达到94%,并通过uplc产生高达63%的γ球蛋白(图51a至51e)。根据hpfh的临床观察和将较高的hbf剂量与较轻的疾病联系起来的非干预治疗,观察到的hbf水平应该为大多数scd和β地中海贫血患者提供保护(ngoetal.,2011britjhem;musallametal.,2012blood)。[1944]直接校正scd的glu6val突变一直是为scd人群设计的基因疗法的近期目标。当前的碱基编辑技术还不能转换像镰状β球蛋白中的a至t颠换导致的突变;然而,abe变体已被设计为辨识和编辑缬氨酸的相反链腺嘌呤残基。这导致缬氨酸转换为丙氨酸,并产生一种称为hbg-望加锡(makassar)的天然变异体。在所述位置具有丙氨酸的β球蛋白无助于聚合物形成,并且hbg-望加锡患者的血液学参数和红细胞形态正常。用这些abe变体编辑的scd患者成纤维细胞实现了高达70%的靶腺嘌呤转换(图52a)。然后使用先导abe变体编辑来自健康供体的cd34细胞,针对位于编辑窗口内的相邻脯氨酸中的同义突变,并作为编辑scd突变的代理。平均编辑频率为40%(图52b)。在同种异体移植环境中记录的这些水平的供体骨髓嵌合现象超过了逆转镰状表型所需的20%(颠换导致的突变)。[1945]实施例7:材料和方法[1946]一般方法:[1947]所有克隆均通过user酶(newenglandbiolabs)克隆方法进行(参见geu-floresetal.,userfusion:arapidandefficientmethodforsimultaneousfusionandcloningofmultiplepcrproducts.nucleicacidsres35,e55,doi:10.1093/nar/gkm106(2007)),并且用于pcr扩增的模板是作为细菌或哺乳动物密码子优化的基因片段(geneart)购买的。将创建的载体转换到macht1r感受态细胞(thermofisherscientific)中并保持在-80℃长期储存。本工作中使用的所有引物均购自integrateddnatechnologies,并使用phusionudnapolymerasegreenmultiplexpcrmastermix(thermofisher)或q5hotstarthigh-fidelity2xmastermix(newenglandbiolabs)进行pcrs。这项工作中使用的所有质粒都是使用zymopureplasmidmidiprep(zymoresearchcorporation)从50ml的mach1培养物中新鲜制备的,其中涉及内毒素去除程序。分子生物学级hyclone水(gehealthcarelifesciences)用于所有分析、转染和pcr反应,以确保排除dnase活性。[1948]用于hek293t哺乳动物细胞转染的sgrna的氨基酸序列在下表15中提供。20个核苷酸个核苷酸目标前区隔以粗体显示。当目标dna序列不以“g”开头时,会在引物的5'端添加一个“g”,因为已经确定人类u6启动子在转录起始位点优选“g”(参见cong,l.etal.,multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823,doi:10.1126/science.1231143(2013))。前面描述的pfyfsgrna质粒用作pcr扩增的模板。[1949]表15:用于hek293t哺乳动物细胞转染的sgrna序列。[1950][1951]sgrna支架序列如下:[1952]化脓链球菌:[1953]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc[1954]金黄色葡萄球菌:[1955]guuuuaguacucuguaaugaaaauuacagaaucuacuaaaacaaggcaaaaugccguguuuaucucgucaacuuguuggcgaga[1956]产生用于定向进化的输入细菌tada*文库[1957]tada*8.0文库旨在编码tada*7.10开放阅读框中每个氨基酸位置的所有20个氨基酸(gaudelli,n.m.etal.,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。每个tada*8.0文库成员包括大约1至2个新的编码突变并且是化学合成的,购自ranomicsinc(加拿大多伦多)。tada*8.0文库使用phusionugreenmultiplexpcrmastermix进行buffer(lucigen)中裂解。对于rna收获,根据制造商的说明,将magmaxtmmirvanatmtotalrnaisolationkit(thermofisherscientific)与kingfishertmflex纯化系统一起使用。[1966]靶向的rna测序主要按照之前的描述进行(参见rees,h.a.etal.,analysisandminimizationofcellularrnaeditoringbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019))。根据制造商的说明,使用superscriptiv一步法rt-pcr系统和ezdnase(thermofisherscientific)从分离的rna中制备cdna。使用以下程序:58℃12分钟;98℃2分钟;随后进行pcr循环,其因扩增子而异:对于ctnnb1和ip90:32个循环[98℃持续10秒;60℃10秒;72℃持续30秒]和rsl1d135个循环[98℃持续10秒;58℃10秒;72℃30秒]。没有与样本同时运行rt对照。在组合的rt-pcr之后,使用如上所述illuminamiseq对扩增子进行条形码标记和测序。每个扩增子中的第一个125个核苷酸,从每个扩增子中正向引物末端后的第一个碱基开始,与参考序列比对并用于分析每个扩增子中的平均和最大a-to-i频率(图53a)和53b)。[1967]脱靶dna测序是使用列于下表16中先前发表的引物进行的(参见komor,a.c.etal.,programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424,doi:10.1038/nature17946(2016);rees,h.a.etal.,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019)),使用两步pcr和条形码方法以制备用于使用上述illuminamiseq测序仪测序的样本。[1968]表16:用于扩增基因组位点的hts引物:[1969][1970][1971][1972][1973][1974]cd34+细胞中使用的abe编辑器的mrna生产[1975]编辑器被克隆到编码dt7启动子的质粒中,然后是5'utr、kozak序列、orf和3'utr。dt7启动子在t7启动子内携带一个失活点突变,可防止从环状质粒转录。所述质粒以pcr反应(q5hotstart2xmastermix)为模板,其中正向引物校正t7启动子内的snp,并且反向引物将120a尾部附加到3'utr。所得pcr产物在zymoresearch25μgdcc柱上纯化,并用作后续体外转录中的mrna模板。按照说明手册使用nebhiscribehigh-yieldkit,但用n1-甲基-假尿苷完全取代尿苷,并用cleancapag(trilink)进行共转录加帽。通过氯化锂沉淀进行反应净化。用于扩增的引物见表17。[1976]表17:用于abe8t7体外转录反应的引物[1977][1978]cd34+细胞制备[1979]获得动员的外周血并富集人类cd34+hspc(hemacare,m001f-gcsf/moz-2)。在电穿孔前48小时,将cd34+细胞解冻并放入含有1%glutamax(gibco)、100ng/mltpo(peprotech)、scf(peprotech)和flt-3(peprotech)的x-vivo10(lonza)中[1980]cd34+细胞的电穿孔[1981]解冻后48小时,将细胞离心以去除x-vivo10培养基,并在含有0.1%hsa(akronbiotechnologies)的maxcyte缓冲液(hyclone)中洗涤。然后将细胞以每毫升1,250,000个细胞的浓度重新悬浮在冷的maxcyte缓冲液中,并分成多个20μl等分试样。然后根据实验条件将abemrna(0.15μm)和-198hbg1/2sgrna(4.05μm)等分,并在maxcyte缓冲液中升至5μl。将20μl细胞以3份为一组添加到5μlrna混合物中,并装入oc25x3maxcyte比色皿的每个室中进行电穿孔。接收电荷后,从腔室中收集25μl并放置在24孔未处理培养板的孔中心。细胞在培养箱(37℃,5%co2)中恢复20分钟。20分钟恢复后,将含有1%glutamax、100ng/mltpo、scf和flt-3的x-vivo10添加到细胞中,浓度为1,000,000个细胞/ml。然后将细胞留在培养箱(37℃,5%co2)中进一步恢复48小时。[1982]abe电穿孔后的红细胞分化[1983]电穿孔后静置48小时(培养第0天)后,将细胞离心并以每毫升20,000个细胞移至含有5%人类血清、330μg/ml转铁蛋白(sigma)、10μg/ml人类胰岛素(sigma)、2u/ml肝素钠(sigma)、3u/mlepo(peprotech)、100ng/mlscf(peprotech)、5μg/mlil3以及50μm氢化可的松(sigma)的“第1阶段”imdm培养基(atcc)。在培养的第4天,将细胞加入4倍体积的相同培养基。在第7天,将细胞离心并以200,000个细胞/ml移至含有5%人类血清(sigma)、330μg/ml转铁蛋白、10μg/ml人类胰岛素、2u/ml肝素钠、3u/mlepo及100ng/mlscf的“第2阶段”imdm培养基。在第11天,将细胞离心并以每毫升1,000,000个细胞移至含有5%人类血清、330μg/ml转铁蛋白、10μg/ml人类胰岛素、2u/ml肝素钠和3u/mlepo的“第3阶段”imdm培养基中。在第14天,将细胞离心并重新悬浮在与第11天相同的培养基中,但以每毫升5,000,000个细胞加入。在第18天,将分化的红细胞收集成500,000个细胞等分试样,在500μldpbs(gibco)中洗涤一次并在uhplc处理前在-80℃冷冻24小时。[1984]用于uhplc分析的红细胞样本的制备[1985]冷冻的红细胞沉淀在室温下解冻。使用ack裂解缓冲液将沉淀物稀释至5x104个细胞/μl的最终浓度。用移液管混合样本并在室温下培育5分钟。然后将样本在-80℃冷冻5分钟使其解冻,并在以6,700g离心10分钟之前用移液器混合。小心去除上清液(不干扰细胞碎片沉淀),转移到新板中并且用超纯水稀释至5x103个细胞/μl以用于uhplc分析。[1986]超高效液相色谱(uhplc)分析[1987]在配备二元泵和uv检测器(thermofisherscientific,vanquishhorizon)的uhplc系统上进行球蛋白链的反相分离。固定相是柱温均为60℃由acquitypeptidebehc18色谱柱(2.1x150mm,1.7m珠子,300a孔)和aquitypeptidebehc18vanguard预柱(2.1x5mm,1.7μm珠子,300a孔)(皆为waterscorp)后所组成。将0.1%三氟乙酸(tfa)水溶液(a)和0.08%tfa乙腈溶液(b)以0.25ml/min的流速用以进行洗脱。球蛋白链的分离是使用40至52%b的线性梯度0至10分钟;52至40%b的线性梯度10至10.5分钟;40%b12分钟实现的。进样量为10μl,在整个分析过程中收集波长为220nm和数据速率为5hz的紫外光谱。通过血红蛋白标准品的lc/ms分析确认了球蛋白链的身份。[1988]cd34+细胞的基因组dna提取[1989]abe电穿孔后(48小时后),将等分细胞培养在含有1%glutamax(gibco)、100ng/mltpo(peprotech)、scf(peprotech)及flt-3(peprotech))的x-vivo10培养基(lonza)中。在培养后48小时和144小时后,收集并离心100,000个细胞。将50μlquickextract(lucigen)添加到细胞沉淀中,并将细胞混合物转移到96孔pcr板(bio-rad)中。裂解物在65℃下加热15分钟,然后在98℃下加热10分钟。细胞裂解物储存在-20℃。[1990]序列[1991]在以下序列中,小写字母表示卡那霉素抗性启动子区域,粗体序列表示靶向失活部分(q4*和w15*),斜体序列表示卡那霉素抗性基因(d208n)靶向失活位点,及底线序列表示pam序列。[1992]失活的卡那霉素抗性基因:[1993][1994]在以下序列中,纯文本表示腺苷脱氨酶序列,粗体序列表示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示双核定位序列,及双底线序列表示突变。[1995]cp5(具有msp“ngc”pid和“d10a”切口酶):[1996][1997][1998]abe8.1_y147t_cp5_ngcpam_单体[1999][2000][2001]pnmg-b335abe8.1_y147t_cp5_ngcpam_单体[2002][2003]具有ngcpamcp5的pnmg-357_abe8.14[2004][2005][2006]abe8.8-m[2007][2008][2009]abe8.8-d[2010][2011]abe8.13-m[2012][2013]abe8.13-d[2014][2015][2016]abe8.17-m[2017][2018][2019]abe8.17-d[2020][2021]abe8.20-m[2022][2023][2024]abe8.20-d[2025][2026][2027]01.monoabe8.1_bpnls+y147t[2028]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2029]02.monoabe8.1_bpnls+y147r[2030]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2031]03.monoabe8.1_bpnls+q154s[2032]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2033]04.monoabe8.1_bpnls+y123h[2034]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2035]05.monoabe8.1_bpnls+v82s[2036]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2037]06.monoabe8.1_bpnls+t166r[2038]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2039]07.monoabe8.1_bpnls+q154r[2040]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2041]08.monoabe8.1_bpnls+y147r_q154r_y123h[2042]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2043]09.monoabe8.1_bpnls+y147r_q154r_i76y[2044]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2045]10.monoabe8.1_bpnls+y147r_q154r_t166r[2046]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2047]11.monoabe8.1_bpnls+y147t_q154r[2048]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2049]12.monoabe8.1_bpnls+y147t_q154s[2050]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2051]13.monoabe8.1_bpnls+h123y123h_y147r_q154r_i76y[2052]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2053]14.monoabe8.1_bpnls+v82s+q154r[2054]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2055]实施例8.帕金森氏病[2056]材料和方法[2057]本文所述实施例中提供的结果是使用以下材料和方法获得的。[2058]实施例中使用的abe序列如下:[2059]01.monoabe8.1_bpnls+y147t[2060]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2061]02.monoabe8.1_bpnls+y147r[2062]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2063]03.monoabe8.1_bpnls+q154s[2064]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2065]04.monoabe8.1_bpnls+y123h[2066]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2067]05.monoabe8.1_bpnls+v82s[2068]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2069]06.monoabe8.1_bpnls+t166r[2070]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2071]07.monoabe8.1_bpnls+q154r[2072]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2073]08.monoabe8.1_bpnls+y147r_q154r_y123h[2074]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2075]09.monoabe8.1_bpnls+y147r_q154r_i76y[2076]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2077]10.monoabe8.1_bpnls+y147r_q154r_t166r[2078]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2079]11.monoabe8.1_bpnls+y147t_q154r[2080]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2081]12.monoabe8.1_bpnls+y147t_q154s[2082]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2083]13.monoabe8.1_bpnls+h123y123h_y147r_q154r_i76y[2084]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2085]14.monoabe8.1_bpnls+v82s+q154r[2086]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseenglandbiolabs)在37℃培育1小时,在qiaprep离心柱(qiagen)上纯化,并根据制造商的说明使用quickligase(newenglandbiolabs)进行连接。使用mach1感受态细胞(thermofisherscientific)进行dna载体扩增。[2099]ssdna的体外脱氨酶测定。[2100]以下提供所有ssdna底物的序列。所有cy3标记的底物均从integrateddnatechnologies(idt)获得。使用tntt7快速偶联转录/翻译试剂盒(promega)根据制造商的说明使用1μg质粒在体外表达脱氨酶。蛋白质表达后,将5μl裂解物与35μlssdna(1.8μm)和user酶(1单位)在cutsmart缓冲液(新英格兰生物实验室)(50mm醋酸钾、29mmtris-醋酸盐、10mm醋酸镁)中混合,100μgml-1bsa,ph7.9)并在37℃下培育2小时。在10%tbe-尿素凝胶(bio-rad)上从全长未修饰的底物中分离出裂解的含u底物。[2101]his6–abe8/pv1-28-连接子–dcas9融合体的表达和纯化。[2102]用质粒(例如编码pet28b-his6-abe8/pv1-28-连接子-dcas9的质粒)转换大肠杆菌bl21star(de3)感受态细胞(thermofisherscientific)。所得表达菌株在含有100μgml-1卡那霉素的luria-bertani(lb)肉汤中在37℃下生长过夜。将细胞以1:100稀释到相同的生长培养基中,并在37℃生长至od600=~0.6。在2小时内将培养物冷却至4℃,并添加0.5mm异丙基-β-d-1-硫代吡喃半乳糖苷(iptg)以诱导蛋白质表达。约16小时后,通过以4,000g离心收集细胞并重悬于裂解缓冲液(50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.5)、1mnacl、20%甘油、10mm三(2-羧乙基)膦(tcep,soltecventures))。通过超声处理(20秒脉冲开启,20秒脉冲关闭,总共8分钟,输出功率为6瓦)裂解细胞,并在以25,000g离心15分钟后分离裂解液上清液。将裂解物与his-pur镍-氨基乙酸(镍-nta)树脂(thermofisherscientific)在4℃培育1小时以捕获带有his标签的融合蛋白。将树脂转移到柱上并用40ml裂解缓冲液洗涤。his标记的融合蛋白在补充有285mm咪唑的裂解缓冲液中洗脱,并通过超滤(amicon-millipore,100-kda分子量截止)浓缩至1ml总体积。将蛋白质在含有50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.0)、0.1mnacl、20%甘油、10mmtcep的低盐纯化缓冲液中稀释至20ml,并加载到spsepharosefastflow上树脂(gelifesciences)。用40ml这种低盐缓冲液洗涤树脂,然后用5ml活性缓冲液洗脱蛋白质,其中含有50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.0)、0.5mnacl、20%甘油、10mmtcep。洗脱的蛋白质通过sds-page进行定量。[2103]sgrna的体外转录.[2104]根据制造商的说明,使用transcriptaidt7高产量转录试剂盒(thermofisherscientific)在体外转录含有t7启动子和20个碱基对的sgrna目标序列的线性dna片段。根据制造商的说明使用megaclear试剂盒(thermofisherscientific)纯化sgrna产物,并通过紫外吸亮度进行定量。[2105]cy3偶联的dsdna底物的制备.[2106]通常,未标记的序列链(例如80个核苷酸未标记链的序列)订购为来自idt的page纯化的寡核苷酸。与每个80个核苷酸底物的3'端互补的25个核苷酸cy3标记引物订购自idt的hplc纯化的寡核苷酸。为了产生cy3标记的dsdna底物,将80nt链(5μl100μm溶液)与cy3标记的引物(5μl100μm溶液)在nebuffer2(38.25μl的50mmnacl、10mmtris-hcl、10mmmgcl2、1mmdtt、ph7.9溶液,newenglandbiolabs)和dntp(0.75μl的100mm溶液)并加热至95℃5分钟,然后以每秒0.1℃的速率逐渐冷却至45℃。在此退火期后,添加klenowexo-(5u,newenglandbiolabs)并将反应在37℃培育1小时。将溶液用缓冲液pb(250μl,qiagen)和异丙醇(50μl)稀释,并在qiaprep离心柱(qiagen)上纯化,及用50μltris缓冲液洗脱。在dsdna上的脱氨酶测定。将纯化的融合蛋白(20μl的活性缓冲液中的1.9μm)与1当量的适当sgrna混合,并在环境温度下培育5分钟。加入cy3标记的dsdna底物至终浓度为125nm,所得溶液在37℃培育2小时。通过添加缓冲液pb(100μl,qiagen)和异丙醇(25μl)将dsdna从融合体中分离出来,并在econospin微量离心柱(epochlifescience)上纯化,用20μlcutsmart缓冲液(newenglandbiolabs)。将user酶(1u,newenglandbiolabs)添加到纯化、编辑的dsdna中,并在37℃下培育1小时。通过将5μl反应溶液与15μl基于dmso的上样缓冲液(5mmtris、0.5mmedta、12.5%甘油、0.02%溴酚蓝、80%dmso)混合,cy3标记的链从其补体中完全变性。在10%tbe-尿素凝胶(bio-rad)上将全长含c底物与任何切割的含u编辑底物分离,并在geamershamtyphoon成像仪上成像。[2107]用于高通量测序的体外编辑dsdna的制备.[2108]寡核苷酸获自idt。互补序列在tris缓冲液中组合(5μl的100μm溶液)并通过加热至95℃5分钟进行退火,然后以每秒0.1℃的速率逐渐冷却至45℃以产生60碱基对的dsdna底物。将纯化的融合蛋白(20μl的1.9μm活性缓冲液)与1当量的适当sgrna混合,并在环境温度培育5分钟。加入60聚体dsdna底物至终浓度为125nm,所得溶液在37℃培育2小时。通过添加缓冲液pb(100μl,qiagen)和异丙醇(25μl)将dsdna与融合体分离,并在econospin微量离心柱(epochlifescience)上纯化,用20μltris缓冲液洗脱。根据制造商的说明,通过使用高通量测序引物对和verasequltra(enzymatics)的pcr扩增得到编辑的dna(1μl用作模板),进行13个扩增循环。pcr反应产物使用rapidtips(diffinitygenomics)纯化,纯化的dna使用含有测序连接子的引物通过pcr扩增,纯化,并如前所述在miseq高通量dna测序仪(illumina)上测序。[2109]细胞培养.[2110]hek293t(atcccrl-3216)和u2os(atcchtb-96)维持在dulbecco'smodifiedeagle'smediumplusglutamax(thermofisher)中,添加10%(v/v)胎儿牛血清(fbs),37℃,添加5%co2。hcc1954细胞(atcccrl-2338)维持在如上所述补充的rpmi-1640培养基(thermofisherscientific)中。含有lrrk2)(taconicbiosciences)的永生化细胞在补充有10%(v/v)胎儿牛血清(fbs)和200μgml-1遗传素(thermofisherscientific)的dulbecco'smodifiedeagle'smediumplusglutamax(thermofisherscientific)中培养。[2111]转染.[2112]hek293t细胞接种在48孔胶原包被的biocoat板(corning)上,并以大约85%的汇合度进行转染。简而言之,根据制造商的方案,每孔使用1.5μllipofectamine2000(thermofisherscientific)转染750ngbe和250ngsgrna表达质粒。根据制造商的说明,使用适当的amaxanucleofectorii程序(使用程序q-001用于hek293t细胞的v试剂盒)转染hek293t细胞。[2113]基因组dna样本的高通量dna测序.[2114]3天后收获转染细胞,并根据制造商的说明使用agencourtdnadvance基因组dna分离试剂盒(beckmancoulter)单离基因组dna。靶上和脱靶目标基因组区域通过pcr与侧边高通量测序引物对进行扩增。根据制造商的说明,使用5ng基因组dna作为模板,使用phusion高保真dna聚合酶(thermofisher)进行pcr扩增。对每个引物对分别确定循环数以确保反应在扩增的线性范围内停止。pcr产物使用rapidtips(diffinitygenomics)纯化。使用含有测序连接子的引物通过pcr扩增纯化的dna。将quant-itpicogreendsdnaassaykit(thermofisher)和kapalibraryquantificationkit-illumina(kapabiosystems)用以对产物进行凝胶纯化和定量。如前所述(pattanayak,naturebiotechnol.31,839–843(2013))在illuminamiseq上对样本进行测序。[2115]数据分析.[2116]将miseqreporter(illumina)自动解复(demultiplexed)用测序读数,并使用定制的matlab分析个别fastq档案。将smith-waterman算法用以将每个读数与适当的参考序列成对比对。q分数低于31的碱基频率用被n置换,因此在计算核苷酸频率时被排除在外。这种处理产生的miseq碱基识别错误率大约为千分之一。读数和参考序列不包括空位的比对序列存储在比对表中,从中可以为每个基因座列出碱基频率。插入缺失频率使用先前描述的标准(zuris,etal.,naturebiotechnol.33,73–80(2015))通过自定义matlab脚本进行量化。扫描测序读数是否与位于两侧的其中可能发生插入缺失的窗口的两个10碱基对序列完全匹配。若没有精确匹配,则读取被排除在分析之外。若这插入缺失窗口的长度与参考序列完全匹配,则读取被归类为不包括插入缺失。若插入缺失窗口是两个或更多个比参考序列更长或更短的碱基,则测序读数分别被归类为插入或缺失。[2117]碱基编辑器中的pam变体验证[2118]新颖crispr系统和pam变体使碱基编辑器(例如pv1至pv28)能够对lrrk多核苷酸中存在的目标snp进行精确校正。已经评估和验证了几种新的pam变体。pam评估和碱基编辑器的细节描述于例如国际pct申请号pct/2017/045381(wo2018/027078);pct/us2016/058344(wo2017/070632);kleinstiver,b.p.,etal.,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);以及kleinstiver,b.p.,etal.,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015),其各自通过引用方式整体并入本文。亦参见komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);及komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其各自全部内容通过引用方式并入本文。[2119]基因编辑校正帕金森氏病突变[2120]lrrk2中的致病突变r1441c和r1441h与帕金森氏病有关。如图55所示,r1441c突变与lrrk2基因反义链中的g》a突变相关,并且使用具有腺苷脱氨酶活性和agapam特异性的碱基编辑器校正。如图55l所示,rrk中的r1441h由lrrk2基因中的g》a突变编码,并且使用具有腺苷脱氨酶活性和对目标序列位置3具有tgapam特异性或位置5具有tgtpam特异性的碱基编辑器校正。[2121]图56是显示用于校正与帕金森氏病相关的lrrk2中的y1699c、g2019s及i2020t突变的目标序列的示意图。y1699c突变与lrrk2基因反义链上的t》c突变相关,所述突变使用具有胞苷脱氨酶活性的碱基编辑器进行校正。g2019s突变与lrrk2基因反义链上的g》a突变相关,所述突变使用具有腺苷脱氨酶活性的碱基编辑器进行校正。i2020t是由lrrk2基因中的t》c突变编码,所述突变使用具有胞苷脱氨酶活性和tgcpam特异性的碱基编辑器进行校正。[2122]如图57a至57c所示,编辑器pv1至14使用具有图57b所示序列的向导rna使用编辑器编辑lrrk2r1441c,但目标序列中的所有胸苷(t)都被尿苷(u)取代(向导rna1:5'-aagcgcaagccuggagggaa-3')。a至g的转换百分比示于图57a。例示性序列读数显示于图57。[2123]如图58a至58c中所示,编辑器pv15至28使用具有图58b所示序列的向导rna使用编辑器编辑lrrk2g2019s,但目标序列中的所有胸苷(t)都被尿苷(u)取代取代(向导rna2:5'-acuacagcauugcucaguac-3')。靶上位点和脱靶位点的a至g的转换百分比显示在图58c中。例示性序列读数显示于图58c。编辑器(pv15至28)用于编辑g2019s。[2124]用于校正lrrk突变的编辑器(pv15-28)的描述如下:[2125]pv1(也称为pv15).pcmv_monoabe8.1_bpnls+y147t[2126]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[2127]pv2(也称为pv16).pcmv_monoabe8.1_bpnls+y147r[2128]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstd[2129]pv3(也称为pv17).pcmv_monoabe8.1_bpnls+q154s[2130]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstd[2131]pv4(也称为pv18).pcmv_monoabe8.1_bpnls+y123h[2132]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[2133]pv5(也称为pv19).pcmv_monoabe8.1_bpnls+v82s[2134]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[2135]pv6(也称为pv20).pcmv_monoabe8.1_bpnls+t166r[2136]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrd[2137]pv7(也称为pv21).pcmv_monoabe8.1_bpnls+q154r[2138]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstd[2139]pv8(也称为pv22).pcmv_monoabe8.1_bpnls+y147r_q154r_y123h[2140]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[2141]pv9(也称为pv23).pcmv_monoabe8.1_bpnls+y147r_q154r_i76y[2142]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[2143]pv10(也称为pv24).pcmv_monoabe8.1_bpnls+y147r_q154r_t166r[2144]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrd[2145]pv11(也称为pv25).pcmv_monoabe8.1_bpnls+y147t_q154r[2146]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstd[2147]pv12(也称为pv26).pcmv_monoabe8.1_bpnls+y147t_q154s[2148]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstd[2149]pv13(也称为pv27).pcmv_monoabe8.1_bpnls+h123y123h_y147r_q154r_i76y[2150]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstd[2151]pv14(也称为pv28).pcmv_monoabe8.1_bpnls+v82s+q154r[2152]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstd[2153]图59a至59l提供编码r1441c的lrrk2目标序列的位置7处的a至g转变的实施例性序列读数。编辑器显示为(pv1至14)。[2154]图60a至60w描绘了编码g2019s的lrrk2目标序列的位置4和6处的a至g转变的序列读数。编辑器显示为(pv15至28)。[2155]使用类似策略校正lrrk2中与帕金森氏病相关的其他致病性突变(图61a至61d)。[2156]实施例9.用于校正小鼠α-l-艾杜糖基化酶(idua)基因中的w401x突变的贺勒氏病碱基编辑。[2157]贺勒氏症是1型粘多糖贮积症(mps1)中最严重的一种。mps1是由α-l-艾杜糖醛酸酶(idua)基因突变引起的。目前,还没有包括人类idua基因的转基因小鼠模型。然而,小家鼠idua蛋白质氨基酸序列和智人idua蛋白质氨基酸序列之间存在高度保守性。在人类中,与严重贺勒氏症表型相关的mps1的常见突变是w402x。所述突变是在idua蛋白的位置402(w402x)引入终止密码子的单碱基取代,并且与纯合子中极其严重的临床表型相关。在小鼠中,idua蛋白的等效突变是w401x。abe可用于通过在目标位点有效地转换a》g来校正w401x突变,而校正小家鼠idua基因。snp处的a》g校正将idua多肽中位置401(w401x)的终止密码子更改为色氨酸。[2158]w401x突变的目标是使用a·t至g·cdna碱基编辑器(abe)恢复为野生型序列,所述编辑器采用具有经过验证的前间隔邻近基序(pam)序列偏好的cas9部分。为了确定哪种向导rna(grna)和abe8-cas9平台能够最有效和精确地校正靶向idua突变,通过慢病毒转导将携带贺勒氏症w401x靶向突变的小家鼠idua等位基因基因组整合到hek293t细胞中。如上所述,使用opti-mem培养基和lipofectamine2000转染hek293t细胞,并以每孔30,000个细胞接种具有250nggrna和750ngabe8变异碱基编辑器表达质粒的48孔板。abe8碱基编辑器变体含有nggpam序列(即,spcas9)。细胞在转染后5天裂解并准备进行测序(在转染后第3天更换培养基),并通过miseq分析在所需位点分析碱基编辑。[2159]小家鼠idua的dna靶向/插入序列如下所示,对应于在ncbi参考序列号nm_008325.4发现的代表性小家鼠idua基因序列的核酸1077至1358。[2160][2161]上述w401x突变的小家鼠dna靶/插入序列包括一个“a”核碱基(以粗体和底线显示),而小家鼠idua基因序列在位置1202包括一个“g”核碱基。[2162]测试了两种向导rna对小家鼠iduaw401x突变的碱基编辑。grna涵盖如本文所提供的或基于熟练从业者的知识确定的以及如本领域熟练的从业者将理解的疾病相关基因的支架序列和间隔序列(目标序列)。(参见,例如,komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);及rees,h.a.,etal.,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1)。[2163]测试了靶向iduaw401x突变和abe8碱基编辑器变体的21个核苷酸向导rna(grna)(图62a和62b)。与上述dna目标序列的互补序列杂交的21个核苷酸的grna序列如下所示:gactctaggcagaggtctcaaagg.nggpam序列(即spcas9)在以上有底线。grna序列中的小写“g”表示其中聚合酶(例如poliii)必须启动转录的序列中的错配。向导rna包括序列uugagaccucugccuagagu。[2164]对于上述grna序列,支架序列如下:[2165]gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt。[2166]使用的abe碱基编辑器包括abe8单体变体:abe8.1、abe8.12、abe8.13、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12和abe8.13。阳性对照碱基编辑器abe7.10和阴性对照也用于比较。[2167]与abe7.10阳性对照相比,abe8碱基编辑器变体具有相当或增加的碱基编辑活性,其中w401x具有约40%的碱基编辑校正(图62a)。如图62b所示,插入缺失形成的百分比与约0.4至0.6%的abe7.10阳性对照相当。[2168]还测试了靶向具有abe8碱基编辑器变体的iduaw401x突变的20个核苷酸向导rna(grna),并与上述21个核苷酸grna进行比较(图63)。与上述dna目标序列的互补序列杂交的20个核苷酸的grna序列如下所示:actctaggcagaggtctcaaagg.nggpam序列(即spcas9)在以上有底线。[2169]对于上述grna序列,支架序列如下:[2170]gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt。[2171]使用的abe碱基编辑器包括abe8变体:abe8.1、abe8.12、abe8.13、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12及abe8.13。阳性对照碱基编辑器abe7.10和阴性对照也用于比较。[2172]abe8碱基编辑器变体使用20个核苷酸grna或21个核苷酸grna具有约w401x40%的碱基编辑校正(图63)。[2173]实施例10.用于校正人类α-l-艾杜糖基化酶(idua)基因中的w402x突变的贺勒氏症碱基编辑。[2174]贺勒氏症是1型粘多糖贮积症(mps1)中最严重的一种mps1是由α-l-艾杜糖醛酸酶(idua)基因突变引起的。在人类中,与严重贺勒氏症表型相关的mps1的常见突变是w402x。所述突变是单碱基替换,在idua蛋白的402位(w402x)引入终止密码子,并且与纯合子中极其严重的临床表型相关。abe可用于通过在目标位点有效地转换a》g来校正w402x突变以校正人idua基因。[2175]w402x突变的目标是使用a·t至g·cdna碱基编辑器(abe)恢复为野生型序列,所述编辑器采用具有经过验证的前间隔邻近基序(pam)序列偏好的cas9部分。如图64所示,abe碱基编辑器和向导rna(grna)可用于靶向智人idua核酸序列中的腺苷(a)核碱基(盒装)以校正w402x突变。snp处的a》g校正将idua多肽中位置402(w402x)的终止密码子更改为色氨酸。[2176]为了确定哪个abe8-cas9平台能够最有效和精确地校正靶向idua突变,通过慢病毒转导将带有贺勒氏症w402x可靶向突变的智人idua等位基因基因组整合到hek293t细胞中。如上所述,使用opti-mem培养基和lipofectamine2000转染hek293t细胞,并以每孔30,000个细胞接种具有250nggrna和750ngabe8变异碱基编辑器表达质粒的48孔板。abe8碱基编辑器变体含有nggpam序列(即spcas9)。细胞在转染后5天裂解并准备进行测序(在转染后第3天更换培养基),并通过miseq分析在所需位点分析碱基编辑。[2177]智人idua多核苷酸序列中的dna靶向/插入序列如下所示,对应于在ncbi参考序列号nm_000203.5发现的代表性智人idua基因序列的核酸1076至1358。[2178][2179]上述智人目标/插入序列包括“a”核碱基(以粗体和底线显示),而智人idua基因序列在idua序列的位置1205含有“g”核碱基。[2180]用abe8碱基编辑器变体测试了靶向w402x突变的20核苷酸向导rna(grna)(图65a)。grna涵盖如本文所提供的或基于熟练从业者的知识确定的以及如本领域熟练的从业者将理解的疾病相关基因的支架序列和间隔序列(目标序列)。(参见,komor,a.c.,etal.,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,etal.,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,etal.,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);及rees,h.a.,etal.,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1)。[2181]与上述dna目标序列的互补序列杂交的grna序列为:gctctaggccgaagtgtcgcagg.nggpam序列(即spcas9)以上有底线。[2182]对于上述grna序列,支架序列是如下:[2183]gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2184]使用的abe碱基编辑器包括abe8变体:abe8.1、abe8.2、abe8.3、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12及abe8.13。阳性对照碱基编辑器abe7.10和阴性对照也用于比较。[2185]与abe7.10阳性对照相比,abe8碱基编辑器变体具有相当或增加的碱基编辑活性,其中w402x具有约30至40%的碱基编辑校正(图65a)。如图65b所示,插入缺失形成的百分比与abe7.10阳性对照相当或低于约0.2至0.5%。[2186]通过pcr产物的深度测序检测到的idua核酸序列中位置6的目标“a”核碱基的a至g碱基编辑的效率呈现在图66a至66o。下表18总结了与abe7.10阳性对照(图66n)和阴性对照(图66o)相比,abe8碱基编辑器变体(图66a至66m)在idua核酸目标位点中的位置6处实现的a至g碱基编辑的百分比。[2187]表18.具有基础编辑器变体的idua目标位点基础编辑百分比。[2188][2189][2190]如表18和图66a至66m所示,使用abe8碱基编辑器变体在idua核酸序列的位置6(靶向的“a”核碱基位点)实现了平均约33.9%的a至g碱基编辑。这与阳性对照abe7.10(图66n)相当。[2191]a)实施例11.细胞培养和转染.[2192]hek293t(293t)细胞系获自美国组织培养物保藏中心(atcc)。293t细胞在补充有10%胎牛血清和1%青霉素/链霉素的dmem中,在37℃和5%co2条件下维持。按照制造商的说明,用lipofectamine2000(invitrogen)在24孔板中转染所有细胞系。用于脂质转染的dna量为每孔1μg。293t细胞的转染效率通常高于80%,这是在递送对照gfp表达质粒后通过荧光显微镜确定的。[2193]对于质粒转染,将hek293t细胞铺板,并用250ng含有u6启动子并编码grna的表达质粒,以及使用opti-mem培养基和lipofectamine2000的编码cas9/abe8变体碱基编辑器的750ng表达质粒转染。使用的abe8碱基编辑器变体包含nggpam序列。将细胞在37℃和5%co2中维持5天,在转染后第3天更换药物。此后,细胞裂解;分离基因组dna并使用标准程序进行pcr,通常使用20至100ng模板dna。添加连接子(illumina)后,对dna进行深度测序。所需位点的碱基编辑通过miseq分析进行分析。[2194]对来自从293t细胞重复转染中收获的基因组dna或rna的pcr扩增子进行深度测序。通过凝胶电泳验证pcr产物的质量后,通过凝胶提取分离pcr产物,例如,使用zymocleangeldnarecoverykit(zymoresearch)。鸟枪法(shotgun)文库是在没有剪切的情况下准备的。所述文库通过qpcr进行量化,并在一个miseqnano流通池上使用miseq500循环测序试剂盒版本2从片段的每一端测序251个循环。使用bcl2fastqv2.17.1.14转换软件产生和解复用fastq档案(illumina)。[2195]a)实施例12:蕾特氏症突变的碱基编辑校正[2196]产生了一个含有单拷贝mecp2的慢病毒hek系,其中包括6个蕾特(rett)突变,包括r106w和r255x,并用于筛选向导rna序列和abe变体。将用于向导和abe表达的质粒转染到慢病毒hek系中,并且收集基因组dna并通过nextgen测序分析目标位点的突变。参考图67和68,向导1显示出整体最高的编辑,其中abe8.8、abe8.9和abe8.13与向导1和向导2都能良好运作。向导rna序列包括一个间隔cttttcacttttcctgccgggg(r255x)、agcttccatgtccagccttc(r106w)、accatgaagtcaaaatcatt(t158m)、或gctttcagccccgtttcttg(r270x)。[2197]测试了具有不同pam识别特异性的碱基编辑器变体;对应于pam改变的cas9取代显示在表19中。*变体5对应于r255x的25%编辑。这些方法类似于上述r106w的方法,但据以其他组产生的abe突变。参考图69和下表19,促成变体5的突变在该特定基因座处显示出最高的编辑量。[2198]表19[2199][2200]实施例13:贺勒/idua突变校正[2201]产生了含有单拷贝mecp2和贺勒突变的慢病毒hek系,并用于筛选如上所述向导rna序列和变体。在图70a至70c中,使用碱基编辑器变体检查了遗传的idua功能丧失(w402x)突变的校正。来自两个w402x纯合勒氏症患者(gm06214和gm00798)以及未受影响的杂合亲本(gm00799)的成纤维细胞获自coriell。使用abe8.8的mrna和人类w402x向导对患者来源的和bj成纤维细胞进行电穿孔。使用quickexract裂解液提取基因组dna,并使用nextgen测序进行测序以评估a至g编辑。通过分光亮度法测定艾杜糖基化酶活性。裂解物在酸性缓冲液中与4-甲基伞形酮-艾杜糖醛酸一起培育2小时,然后用碱性溶液淬灭。4-甲基伞形酮裂解通过荧光(365nm激发,445nm发射)测量。在患者成纤维细胞中观察到高度编辑,这导致酶活性增加,与未受影响的杂合子gm00799中观察到的酶活性相当。[2202]实施例14:使用abe8.8进行体内碱基编辑[2203]参考图70,编码分裂内含肽abe8.8的病毒基因组和鼠rosa26基因座的grna被包装到aav9和php.eb衣壳中。向c57bl/6小鼠侧脑室注射9e11总vgaav9(每条内含含臂分裂4.5e11)和7.5e11总vgphp.eb(每条内含肽分裂3.75e11)。6周后,收获并解剖大脑和脊髓以进行基因组dna提取和测序。aav9转导在最接近侧脑室的结构海马体中最高,编辑率高达13%。[2204]实施例15:abe8变体碱基编辑[2205]为了确定在abca4中恢复g1961e突变的最佳碱基编辑器,将四十种独特的abe8变体与abe7.10进行比较,以使用具有我们之前证明所述序列是所述目标位点上的最佳间隔长度的具有21个核苷酸间隔序列(图73)的sgrna,在慢病毒敲入模型细胞系中进行疾病等位基因(图72a至72b)的a至g碱基转换。所有变体都在疾病等位基因和摆动碱基上提供可测量的a至g编辑。在摆动碱基处进行编辑会导致沉默突变并且无害。随后对六个表现最佳的变体进行了密码子优化,并将其整合到拆分aav系统中以进行进一步验证。由于编码碱基编辑器、sgrna和表达调控组件的dna序列的大小超过了单个aav颗粒的包装限制,可以将所需部分分成两个aav颗粒并共同递送。在所述递送方法中,编码碱基编辑器的基因在两种病毒之间分裂,并且在共感染后使用分裂的内含肽重构全长蛋白质(图74)。缺少野生型tada结构域(abe8-m)的分裂abe8变体被包装成成对的aav2载体,其中一个还编码靶向野生型abca4目标位点的sgrna的单个副本。在所述实验中,在abca4g1961密码子的摆动碱基处评估了编辑作为野生型细胞中不存在的疾病等位基因的替代物。野生型arpe-19细胞与双aav共转导,并对感兴趣的21个核苷酸目标序列(图75a至75b)评估碱基编辑率。abe变体7.9、7.10、8.5-m、8.8-m、8.9-m和8.18-m在转换替代位点8a方面同样有效,然而,变体8.8-m、8.9-m及8.18-m也催化了不良反应位置5c处的c至t转换。与亲本abe7.10变体相比,去除了野生型tada结构域的abe7.10变体(abe7.10-m)的活性明显降低了50%。这些结果表示变体abe8.5-m是也缺乏野生型tada结构域的目标位点上最有效的编辑器,这减少碱基编辑器的总尺寸594个碱基对的dna或198个氨基酸残基。[2206]向导rna序列靶向在序列gctgtgtgtcgaagttcgccctggagaggtg或gctgtgtgtcggagttcgccctggagaggtg的abca4基因,其中pam序列具有底线。向导rna包括一个序列caccucuccagggcgaacuucgacacacagc或caccucuccagggcgaacuccgacacacagc。[2207]评估了使用靶向abca4g1961e基因座的21个核苷酸间隔长度sgrna在人类基因组内进行脱靶碱基编辑的潜力。通过计算扫描人类参考基因组(grch38)中所有与abca4g1961egrna前间隔序列的不完美匹配,然后是与spcas9nggpam匹配的3'序列,以对基因组内潜在脱靶位点进行计算机模拟预测。评估了包括多达5个错配和单个rna或dna凸起的所有序列。潜在的脱靶位点优先用于实验评估,其是基于(a)错配数量少,以及(b)与编码外显子重叠(由gencode转录本注释确定)和癌症相关基因(如cosmic癌症基因普查中报告的)。通过计算机分析没有发现基因组中与21个核苷酸间隔序列有三个或更少错配的预测脱靶。我们使用双aav系统将abe7.10和靶向abca4g1961e疾病等位基因的21个核苷酸间隔sgrna共同递送到野生型arpe-19细胞中,并通过计算机预测的脱靶位点的28个靶向扩增子测序评估编辑。与未处理的细胞相比,在处理的细胞中没有预测的脱靶位点被显着碱基编辑(图76a至76b)并且在脱靶位点或在目标位点处没有发现显着的插入缺失(图77)。正如所预期,观察到的唯一显着编辑发生在处理细胞中的abca4g1961摆动碱基处,因为靶向abca4g1961e疾病等位基因的sgrna仅包括与这些细胞中存在的野生型等位基因的单个错配碱基对。这些结果表示sgrna不会在任何被评估的计算机预测脱靶位点促进脱靶dna编辑。[2208]实施例20:灵长类动物视网膜实施例[2209]非人灵长类动物的眼睛在死后1至2小时收获并在死后4至8小时之间进行培养。使用6mm活检穿孔器从整个神经视网膜上进行穿孔。将感光面朝下的视网膜置于6孔组织培养板中的核孔膜顶部。将载体(10ul,1.26e+12vg/ml)移液到神经视网膜和膜之间以在视网膜组织下形成一个小泡。每3天更换一次培养基,并将组织培育0至22天。在不同时间点收集组织,并固定在10%中性缓冲福尔马林中并进行组织学处理。[2210]‘灵长类动物视网膜完整性’[2211]切片在4℃下用抗视紫红质、抗gfp及生物素化花生凝集素抗体免疫标记过夜。在pbs中洗涤后,将样本与二抗在室温下培育1小时。载玻片在pbs中洗涤并用含有dapi的甘油基液体封固剂封固。[2212]在第0天(d)和第22天收获来自非人类灵长类动物的视网膜外植体。比较d0和d22未转导的视网膜外植体的组织学染色显示,当培养长达22天时,视网膜的细胞类型得以保留。在d22,与光感受器特异性gfp表达载体(anc80l65.hgrk.egfp)相比,暴露于anc80l65.cmv.egfp的视网膜培养物中的gfp表达定性更亮。用anc80l65.hgrk1.egfp转导视网膜外植体证明gfp仅存在于含光感受器的外核层(onl),证实了hgrk1启动子的光感受器特异性活性。参见图78。[2213]‘nhp中的cas9表达’[2214]切片在4℃下用小鼠和兔单克隆cas9抗体免疫标记过夜。在pbs中洗涤后,将样本与二抗在室温下培育1小时。载玻片在pbs中洗涤并用含有dapi的甘油基液体封固剂封固。[2215]在非人类灵长类动物视网膜外植体上测试了编码优化分裂abe(abe7.10、8.5、8.9)碱基编辑器的双aav2粒子。为了测试基于全长的编辑器的重建,在被表达每个碱基编辑器的aav颗粒共感染-分裂内含肽一半(half)后,在不同时间点收集组织并对cas9n端和c端进行染色。我们早在第6天就观察到cas9n(绿色染色)和c(红色染色)末端的表达,并在感染后保持到第17天,这暗示碱基编辑器可能存在编辑活动窗口。这些结果表示双aav分裂内含碱基编辑器在非人类灵长类动物视网膜外植体中表达cas9。参见图79。[2216]其他实施方案[2217]从前面的描述中,很明显可以对这里描述的本发明进行变化和修改以将其用于各种用途和条件。这样的实施方案也在所附权利要求的范畴内。[2218]在本文中对变量的任何定义中的组件列表的叙述包括将所述变量定义为任何单个组件或所列组件的组合(或子组合)。此处对实施方案的叙述包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。[2219]本说明书中提及的所有出版物、专利和专利申请均以引用方式并入本文,其程度就如同每个单独的出版物、专利或专利申请被具体地和单独地指示为以引用方式并入一样。除非另有说明,否则本说明书中提及的出版物、专利和专利申请通过引用整体并入本文。当前第1页12当前第1页12