1.本发明涉及基因编辑技术领域,尤其是涉及碱基编辑器及其构建方法。
背景技术:2.crispr/cas9为代表的新型基因编辑技术给生物医学研究带来了变革,这一技术让高效精准的基因编辑成为可能。2016年以来,研究者开发出多种dna碱基编辑工具可以在dna水平高效诱导精准的点突变,且此过程中不会产生dna双链断裂。目前已报道的碱基编辑器有很多种,其中最主要的是两种:胞嘧啶碱基编辑器(cbe,可介导c
·g‑‑
t
·
a突变)和腺嘌呤碱基编辑器(abe,可介导a
·
t
‑‑g·
c突变)。其中,cbe是将特定的胞嘧啶核苷脱氨酶(cytidine deaminase)与突变型核酸酶(如携带有d10a或突变的spcas9,称为nspcas9)以及尿嘧啶糖基化酶抑制因子(ugi)融合,得到的融合蛋白可在sgrna的引导下,介导c
·g‑‑
t
·
a突变。abe则是将定向演化后的大肠杆菌来源的腺苷脱氨酶(ectada*)二聚体或单体与突变型核酸酶(如携带有d10a或突变的spcas9,称为ncas9)融合,得到的融合蛋白可在sgrna的引导下,介导a
·
t
‑‑g·
c突变。在abe和cbe的基础上,研究者还将特定的胞嘧啶核苷脱氨酶(cytidine deaminase)、定向演化后的大肠杆菌来源的腺苷脱氨酶(ectada*)、突变型核酸酶(如携带有d10a或突变的spcas9,称为ncas9)以及尿嘧啶糖基化酶抑制因子(ugi)融合构建出acbe,得到的融合蛋白可在sgrna的引导下,可介导特定位点中c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的同时发生(nat biotechnol,2020.38(7):861-864;bmc biol,2020.18(1):131;nat biotechnol,2020.38(7):856-860;nat biotechnol,2020.38(7):865-869)。现有的abe、cbe和acbe工具依然存在不足,限制了其应用前景。
3.现有abe工具除能介导a
·
t
‑‑g·
c突变外,在一定程度上还能介导c
·g‑‑
t
·
a突变,这降低了abe工具编辑的特异性和精确度,不利于abe的应用(nat biotechnol,2021(https://doi.org/10.1038/s41587-021-00943-2);nat biotechnol,2019.37(10):1145-1148;nat commun,2020.11(1):5827)。虽然有研究者根据abe工具能介导c
·g‑‑
t
·
a突变的特性,通过点突变构建出能特异性介导tc-tt突变的cbe工具,但其活性非常低,应用场景有限(nat biotechnol,2021,https://doi.org/10.1038/s41587-021-00943-2)。此外,目前适用于abe构建的脱氨基酶均来自定向演化后的大肠杆菌来源的腺苷脱氨酶(ectada*),脱氨基酶种类非常局限,这也限制了abe碱基编辑特性的多样性,不利于工具的应用推广。此外,目前也缺少rna/dna脱靶效应以及编辑精度等多个方面进行协同优化的abe工具。
4.现有cbe工具中的脱氨酶均属于胞嘧啶核苷脱氨酶(cytidine deaminase)家族,这类工具目前在碱基编辑精度(活性窗口特异性)、rna脱靶效应以及dna脱靶效应中均存在一系列问题,目前依然缺少在rna/dna脱靶效应以及编辑精度等多个方面进行协同优化的cbe工具(nat biotechnol,2020.38(5):620-628;nat commun,2020.11(1):2052;nat methods,2020.17(6):600-604)。
5.现有acbe工具需要在ncas9上同时融合两种脱氨酶(胞嘧啶核苷脱氨酶(cytidine deaminase)、定向演化后的大肠杆菌来源的腺苷脱氨酶(ectada*)),这导致acbe工具的体
积过大,不利于应用(nat biotechnol,2020.38(7):861-864;bmc biol,2020.18(1):131;nat biotechnol,2020.38(7):856-860;nat biotechnol,2020.38(7):865-869)。
技术实现要素:6.为了对碱基编辑器abe、cbe和acbe的不足进行优化,以开发出编辑特异性更高且rna/dna脱靶风险低的abe,编辑精度高且rna/dna脱靶风险低的cbe以及体积更小的acbe工具,本发明的目的是提供新型碱基编辑器及其构建方法与应用,用于dna水平特定位点特定碱基的突变。
7.可实现dna水平特定位点c
·
g碱基对向t
·
a碱基对的转换(c
·g‑‑
t
·
a突变,cbe),实现a
·
t碱基对向g
·
c碱基对的突变(a
·
t
‑‑g·
c突变,abe),或同时实现特定位点c
·
g碱基对向t
·
a碱基对和a
·
t碱基对向g
·
c碱基对的转换(c
·g‑‑
t
·
a和a
·
t
‑‑g·
c同时突变,acbe)。
8.本发明提供一种新的腺嘌呤碱基编辑器(abe)、胞嘧啶碱基编辑器(cbe)和acbe的构建方法,以开发出编辑特异性更高且rna/dna脱靶风险低的abe,编辑精度高且rna/dna脱靶风险低的cbe以及体积更小的acbe工具。
9.本发明的基本原理是,针对定向演化后的大肠杆菌来源的腺苷脱氨酶(tada-8e)(nat biotechnol,2020.38(7):883-891),对其关键氨基酸位点进行饱和突变筛选。最终通过特定点突变或是点突变组合,实现abe、cbe和acbe的构建和各种碱基编辑器之间的转换;或针对自然界的多种腺苷脱氨酶(tada)进行突变和系统筛选,寻找新的功能性tada,构建多样化的abe、cbe和acbe。
10.大肠杆菌来源的腺苷脱氨酶(ectada)经蛋白定向演化后(演化后称为ectada*),已经具备对单链dna中腺嘌呤(a)进行脱氨基化,实现a
·
t
‑‑g·
c突变的能力。在此基础上构建的碱基编辑器abe可以实现基因组目标位点中的a
·
t
‑‑g·
c突变。研究者还发现,一定条件下,abe能对单链dna中胞嘧啶(c)进行脱氨基化,一定程度上还能介导c
·g‑‑
t
·
a突变,具有一定的cbe功能。这种介导c
·g‑‑
t
·
a突变的能力增加了abe工具的脱靶风险(nat biotechnol,2019.37(10):1145-1148;nat commun,2020.11(1):5827),因此,对腺苷脱氨酶(tada)的特定位点进行饱和突变筛选,或是对自然界存在的腺苷脱氨酶(tada)进行点突变和系统筛选,或能构建出新的abe、cbe和acbe。特定的点突变或点突变组合可以实现以下目的:
11.(1)降低或消除abe工具介导c
·g‑‑
t
·
a突变的能力,并改善rna脱靶效应以及dna脱靶效应等不足,增强其安全性;
12.(2)将abe转变为cbe,获得新的cbe工具,新工具在碱基编辑精度(活性窗口特异性)、rna脱靶效应以及dna脱靶效应等方面具有不同于已有工具的新特性;
13.(3)将abe转变为acbe,利用单一的脱氨酶构建出新型的acbe,减小acbe的体积,改善其碱基编辑精度(活性窗口特异性)、rna脱靶效应以及dna脱靶效应。
14.本发明人经过系统性的研究和饱和式筛选,首次发现,脱氨酶tada-8e中氨基酸位点为第28、30、46、48、49、82、84、108、110或111位的氨基酸中一个或几个突变后对tada-8e的脱氨基活性及碱基偏好性有显著影响。不同类型的点突变,或是多种点突变的组合,可以显著改变tada-8e为基础的abe工具的特性。通过特定氨基酸位点的不同点突变,或是多个
氨基酸位点点突变的组合,最终获得编辑特异性更高的abe,编辑精度高且rna/dna脱靶风险低的cbe以及体积更小的acbe工具,最终完成本发明。
15.本发明的目的可以通过以下技术方案来实现:
16.本发明的第一个目的是提供一种碱基编辑器,为突变型tada-8e置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
17.突变型tada-8e是指tada-8e中距离腺嘌呤(a)类似物8-azanebularine(8az)小于5埃的氨基酸中一个或几个突变后的脱氨酶,尤其是指tada-8e中氨基酸位点为第28、30、46、48、49、82、84、108、110或111位的氨基酸中一个或几个突变后的脱氨酶;
18.tada-8e的氨基酸序列如seq id no.1所示。
19.在本发明的一个实施方式中,所述cas核酸酶选自cas9、cas12、cas13蛋白家族;优选地,所述cas核酸酶选自nspcas9及其突变体、sacas9及其突变体、cas12a及其突变体或cas12f及其突变体,优选为nspcas9。
20.在本发明的一个实施方式中,突变型tada-8e是指tada-8e中氨基酸位点为第28、30、46、48、49、82、84、108、110或111位的氨基酸中一个突变为不同于所在位点自身原来氨基酸的另外19种氨基酸中的一种以后所得的脱氨酶;
21.优选地,突变型tada-8e是指tada-8e中氨基酸进行以下单点突变后所得的脱氨酶:v28w、v28g、n46l、n46p、n46c、a48c、a48g、a48n、a48s、i49d、i49e、i49h、i49n、i49p、i49q、i49v、i49w、i49y、i49r、i49a、i49t、i49g、i49l、i49s、i49m、i49c、i49f、i49k、v82g、v82a、v82t、v82c、v82s、v82d、f84m、n108h、n108m、n108c、n108d、n108f、n108q、n108s、n108y、v28a、v28d、v28e、v28k、v28m、v28r、v28l、v28q、v30a、v30d、v30g、v30w、v30e、v30n、v30q、v30y、v30t、v30s、n46h、n46k、n46y、n46f、n46e、n46q、n46d、n46g、n46m、n46v、n46s、n46t、a48d、a48e、a48y、a48w、a48f、a48q、v82f、f84d、f84r、f84a、f84e、f84p、f84k、f84c、f84h、f84i、f84s、f84t、f84v、f84q、f84n、f84g、f84y、n108v、n108i、n108l、n108a、n108t、n108r、k110d、k110w、k110e、r111p、r111e、r111t、r111a、r111v、r111g、r111i、r111w、r111l、r111d。
22.上述类似“v28w”的表述中,28表示tada-8e中第28位氨基酸位点,v表示tada-8e中第28位氨基酸位点突变前的氨基酸,w表示tada-8e中第28位氨基酸位点突变后的氨基酸,v、w均为氨基酸的缩写表达方式,即v28w表示第28位氨基酸位点由缬氨酸突变为色氨酸;上文或下文中其他类似“v28w”的表达方式均做与此相似的解释,即n46l表示第46位氨基酸位点由天冬酰胺突变为亮氨酸。
23.通过上述单点突变得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
24.在本发明的一个实施方式中,突变型tada-8e是指tada-8e中氨基酸进行以下双点突变后所得的脱氨酶:
25.(1)氨基酸位点第28位的氨基酸突变的同时,第46、48、49、82、84、108、110或111位的氨基酸中一个突变后的脱氨酶,或,
26.(2)氨基酸位点第46位的氨基酸突变的同时,第28、82、84、108位的氨基酸中一个突变后的脱氨酶,或,
27.(3)氨基酸位点第48、108位的氨基酸同时突变后的脱氨酶,或,
28.(4)氨基酸位点第49位的氨基酸突变的同时,第82、84、108位的氨基酸中一个突变
后的脱氨酶,或,
29.(5)氨基酸位点第108位的氨基酸突变的同时,第82或84位的氨基酸中一个突变后的脱氨酶。
30.优选地,突变型tada-8e是指tada-8e中氨基酸进行以下双点突变后所得的脱氨酶:
31.v28g-n108y,v28g-n108c,v28g-n108h,v28g-n46l,v28g-n46c,v28g-n46p,v28w-n46l,v28w-n46c,v28w-n46p,n46p-n108y,n46p-n108s,n46p-n108q,n46p-n108d,n46p-n108c,n46p-n108h,n46p-f84m,n46p-i49a,n46p-i49g,n46p-a48g,n46c-n108y,n46c-n108s,n46c-n108q,n46c-n108m,n46c-n108c,n46c-n108h,n46l-n108y,n46l-n108q,n46l-n108d,n46l-n108m,n46l-n108h,n46l-f84m,n46l-i49a,n46l-i49g,n46l-v82g,i49a-n108y、v28g-a48g、v28g-i49a、v28g-i49g、v28g-v82t、v28g-f84y、v28w-n108h、n46c-v82g、n46c-v82t、n46c-f84m、n46l-v82t、n46p-f84m、n46p-n108m、a48g-n108h、i49a-n108h、i49g-n108h、i49g-n108y、i49g-v82g、i49g-v82t、i49g-f84y、v82g-n108y、v82t-n108h、v82t-n108c、f84m-n108h、f84m-n108m、f84m-n108q。
32.所述v28g-n46c表示第28位氨基酸位点由缬氨酸突变为甘氨酸以及第46位氨基酸位点由天冬酰胺变为半胱氨酸,上文或下文中其他类似的表达方式均做与此相似的解释。
33.通过上述双点突变得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
34.在本发明的一个实施方式中,所述突变型tada-8e是指tada-8e中氨基酸进行以下三点突变后所得的脱氨酶:
35.(1)氨基酸位点第28、48、49位的氨基酸同时突变后的脱氨酶,或,
36.(2)氨基酸位点第28、48、82位的氨基酸同时突变后的脱氨酶,或,
37.(3)氨基酸位点第28、48、108位的氨基酸同时突变后的脱氨酶,或,
38.(4)氨基酸位点第28、49、82位的氨基酸同时突变后的脱氨酶,或,
39.(5)氨基酸位点第28、49、108位的氨基酸同时突变后的脱氨酶,或,
40.(6)氨基酸位点第49、82、108位的氨基酸同时突变后的脱氨酶;
41.优选地,所述突变型tada-8e是指tada-8e中氨基酸进行以下三点突变后所得的脱氨酶:
42.i49a-v82t-n108y、i49a-v82g1-n08y、i49g-v82t-n108y、i49g-v82g-n108y、a48g-v82g-n108y、a48g-i49g-n108y、v28g-v82g-n108y、v28g-v82g-n108h、v28g-i49a-n108y、v28g-i49a-n108h、v28g-i49g-n108h、v28g-a48g-n108y、v28g-a48g-n108h、v28g-a48g-i49g、v28g-a48g-i49a、v28g-a48g-v82g、v28g-a48g-v82t、v28g-i49g-v82g、v28g-i49g-v82t、v28g-i49g-n108y、v28g-i49a-v82g、v28g-i49a-v82t、i49g-v82g-n108h、i49g-v82t-n108h。
43.所述v28g-a48g-i49g表示第28位氨基酸位点由缬氨酸突变为甘氨酸、第48位氨基酸位点由丙氨酸变为甘氨酸以及第49位由异亮氨酸突变为甘氨酸,上文或下文中其他类似的表达方式均做与此相似的解释。
44.通过上述三点突变得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
45.在本发明的一个实施方式中,所述突变型tada-8e是指tada-8e中氨基酸位点第108位的氨基酸突变的同时,tada-8e中氨基酸位点第28、48、49、82中还有三个位点突变后
的脱氨酶;
46.优选地,所述突变型tada-8e是指tada-8e中氨基酸位点第108位进行突变n108y或n108h的同时,tada-8e中氨基酸位点第28、48、49、82中还有三个位点进行如下突变后的脱氨酶;
47.tada-8e中氨基酸位点第28位进行突变v28g,
48.tada-8e中氨基酸位点第48位进行突变a48g,
49.tada-8e中氨基酸位点第49位进行突变i49a或i49g,
50.tada-8e中氨基酸位点第82位进行突变v82t或v82g。
51.所述v28g-i49g-v82t-n108y表示第28位氨基酸由缬氨酸突变为甘氨酸、第49位氨基酸由异亮氨酸突变为甘氨酸、第82位氨基酸由缬氨酸突变为苏氨酸以及第108位氨基酸由天冬酰胺突变为酪氨酸,上文或下文中其他类似的表达方式均做与此相似的解释。
52.通过上述四点突变得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
53.在本发明的一个实施方式中,所述突变型tada-8e是指tada-8e中氨基酸位点第28、48、49、82、108位的氨基酸同时突变后的脱氨酶;
54.优选地,所述突变型tada-8e是指tada-8e中氨基酸进行以下五点突变后所得的脱氨酶:
55.tada-8e中氨基酸位点第108位进行突变n108y或n108h的同时,tada-8e中氨基酸位点第28、48、49、82位点还进行如下突变后的脱氨酶;
56.tada-8e中氨基酸位点第28位进行突变v28g,
57.tada-8e中氨基酸位点第48位进行突变a48g,
58.tada-8e中氨基酸位点第49位进行突变i49a或i49g,
59.tada-8e中氨基酸位点第82位进行突变v82t或v82g。
60.所述v28g-a48g-i49g-v82t-n108h表示第28位氨基酸由缬氨酸突变为甘氨酸、第48位氨基酸由丙氨酸突变为甘氨酸、第49位氨基酸由异亮氨酸突变为甘氨酸、第82位氨基酸由缬氨酸突变为苏氨酸以及第108位氨基酸由天冬酰胺突变为组氨酸,,上文或下文中其他类似的表达方式均做与此相似的解释。
61.通过上述五点突变得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
62.在本发明的一个实施方式中,突变型tada-8e的5’和3’分别添加不同序列的各类变体后置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
63.优选地,突变型tada-8e的5’和3’分别添加nls序列和linker序列后获得nls-突变型tada-8e-linker,nls-突变型tada-8e-linker置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
64.其中,nls-突变型tada-8e-linker是指相对于nls-tada-8e-linker而言,tada-8e中氨基酸中一个或几个发生了突变,nls-tada-8e-linker的氨基酸序列如seq id no.4所示,nls-突变型tada-8e-linker的氨基酸序列为nls-tada-8e-linker氨基酸序列中将tada-8e置换为突变型tada-8e得到的氨基酸序列。nls序列为pkkkrkv,linker序列为sggssggssgsetpgtsesatpessggssggssr。
65.在本发明的一个实施方式中,所述cas核酸酶选择为nspcas9时,所述nspcas9内部的融合位点包括第113、203、312、459、535、583、687、701、715、730、770、793、801、895、905、
919、946、1010、1029、1047、1117、1154、1249、1282位融合位点;
66.优选为第1249位融合位点。
67.本发明的第二个目的是提供一种碱基编辑器,tada-8e的5’和3’分别添加nls序列和linker序列后获得nls-tada-8e-linker,nls-tada-8e-linker置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
68.nls-tada-8e-linker的氨基酸序列如seq id no.4所示;
69.所述cas核酸酶选自cas9、cas12、cas13蛋白家族,优选地,所述cas核酸酶选自nspcas9及其突变体、sacas9及其突变体、cas12a及其突变体或cas12f及其突变体,进一步优选为nspcas9。
70.在本发明的一个实施方式中,所述cas核酸酶选择为nspcas9时,所述nspcas9内部的融合位点包括第113、203、312、459、535、583、687、701、715、730、770、793、801、895、905、919、946、1010、1029、1047、1117、1154、1249、1282位融合位点;
71.优选为第1249位融合位点。
72.本发明的第三个目的是提供一种碱基编辑器,为突变型tada-x置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
73.突变型tada-x是指tada-x中第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;
74.tada-x是指不同来源的tada;优选地,tada-x有多组,其突变体氨基酸序列分别如seq id no.5-seq id no.57中的任一所示;
75.所述cas核酸酶选自cas9、cas12、cas13蛋白家族,优选地,所述cas核酸酶选自nspcas9及其突变体、sacas9及其突变体、cas12a及其突变体或cas12f及其突变体,进一步优选为nspcas9。
76.在本发明的一个实施方式中,突变型tada-x是指q2lyc0、f2g306、g0jn58、b5zcw4、q1as41、e4ttf3、q57le3、q99w51、ectada中与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;
77.q2lyc0、f2g306、g0jn58、b5zcw4、q1as41、e4ttf3、q57le3、q99w51或ectada突变体的氨基酸序列分别为seq id no.8、seq id no.14、seq id no.20、seq id no.22、seq id no.27、seq id no.43、seq id no.54、seq id no.55、seq id no.58。
78.上述得到的碱基编辑器介导a
·
t
‑‑g·
c突变。
79.在本发明的一个实施方式中,突变型tada-x是指b3pcy2、a5wft9、c1dxn9、b2ur34、r4k908、d5w8r4、e1taf4中与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;
80.b3pcy2、a5wft9、c1dxn9、b2ur34、r4k908、d5w8r4、e1taf4突变体的氨基酸序列分别为seq id no.15、seq id no.19、seq id no.29、seq id no.32、seq id no.44、seq id no.49、seq id no.57。
81.上述得到的碱基编辑器介导c
·g‑‑
t
·
a突变。
82.在本发明的实施方式中,突变型tada-x是指q13xz4、a8f050、e8wvh3、p44931、g0exn4、e0tbl5、a1w869、d5x1y1、i3yb54与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;
83.q13xz4、a8f050、e8wvh3、p44931、g0exn4、e0tbl5、a1w869、d5x1y1、i3yb54突变体的氨基酸序列分别为seq id no.10、seq id no.18、seq id no.25、seq id no.28、seq id no.38、seq id no.46、seq id no.48、seq id no.50、seq id no.53。
84.上述得到的碱基编辑器介导a
·
t
‑‑g·
c和c
·g‑‑
t
·
a突变。
85.在本发明的实施方式中,突变型tada-x的5’和3’分别添加nls序列和linker序列后获得nls-突变型tada-x-linker,nls-突变型tada-x-linker置于cas核酸酶的n-末端、c-末端或内部的融合位点融合形成的融合蛋白;
86.其中,nls-突变型tada-x-linker是指相对于nls-tada-8e-linker而言,tada-8e替换为突变型tada-x,nls-tada-8e-linker的氨基酸序列如seq id no.4所示。
87.在本发明的实施方式中,所述cas核酸酶选择为nspcas9时,所述nspcas9内部的融合位点包括第113、203、312、459、535、583、687、701、715、730、770、793、801、895、905、919、946、1010、1029、1047、1117、1154、1249、1282位融合位点;
88.优选为第1249位融合位点。
89.本发明的第四个目的是提供一种碱基编辑器的构建方法,其特征在于,包括以下步骤:
90.将tada-8e、突变型tada-8e或突变型tada-x和cas核酸酶不同位点融合,构建得到碱基编辑器;
91.tada-8e的氨基酸序列如seq id no.1所示;
92.突变型tada-8e是指tada-8e中氨基酸位点为第28、30、46、48、49、82、84、108、110或111位的氨基酸中一个或几个突变后的脱氨酶;
93.突变型tada-x是指tada-x中与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;tada-x有多组,其突变体氨基酸序列分别如seq id no.5-seq id no.57中的任一所示。
94.在本发明的一个实施方式中,还可以将tada-8e、突变型tada-8e或突变型tada-x 5’和3’分别添加nls序列和linker序列。
95.本发明的第五个目的是提供一种碱基编辑器abe的应用,所述碱基编辑器abe介导a
·
t
‑‑g·
c突变;
96.碱基编辑器abe是指q2lyc0、f2g306、g0jn58、b5zcw4、q1as41、e4ttf3、q57le3、q99w51、ectada与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺后置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,其中,q2lyc0、f2g306、g0jn58、b5zcw4、q1as41、e4ttf3、q57le3、q99w51或ectada突变体的氨基酸序列分别为seq id no.8、seq id no.14、seq id no.20、seq id no.22、seq id no.27、seq id no.43、seq id no.54、seq id no.55、seq id no.58;
97.碱基编辑器abe还指tada-8e中氨基酸进行以下单点突变或点突变组合后所得的脱氨酶置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,这类融合蛋白仅具有明显的介导a
·
t
‑‑g·
c突变能力。
98.本发明的第六个目的是提供一种碱基编辑器cbe的应用,所述碱基编辑器cbe介导c
·g‑‑
t
·
a突变;
99.碱基编辑器cbe是指b3pcy2、a5wft9、c1dxn9、b2ur34、r4k908、d5w8r4、e1taf4与
ectada第106和第108位同源的氨基酸分别突变为缬氨酸和天冬酰胺后置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,其中,b3pcy2、a5wft9、c1dxn9、b2ur34、r4k908、d5w8r4、e1taf4突变体的氨基酸序列分别为seq id no.15、seq id no.19、seq id no.29、seq id no.32、seq id no.44、seq id no.49、seq id no.57;
100.碱基编辑器cbe还指tada-8e中氨基酸进行以下突变后所得的脱氨酶置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,
101.单点突变:n46p
102.双点突变:v28g-n108y,v28g-n108c,v28g-n108h,v28g-n46l,v28g-n46c,v28g-n46p,v28w-n46l,v28w-n46c,v28w-n46p,n46p-n108y,n46p-n108s,n46p-n108q,n46p-n108d,n46p-n108c,n46p-n108h,n46p-f84m,n46p-i49a,n46p-i49g,n46p-a48g,n46c-n108y,n46c-n108s,n46c-n108q,n46c-n108m,n46c-n108c,n46c-n108h,n46l-n108y,n46l-n108q,n46l-n108d,n46l-n108m,n46l-n108h,n46l-f84m,n46l-i49a,n46l-i49g,n46l-v82g,i49a-n108y
103.三点突变:i49a-v82t-n108y、i49a-v82g1-n08y、i49g-v82t-n108y、i49g-v82g-n108y、a48g-v82g-n108y、a48g-i49g-n108y、v28g-v82g-n108y、v28g-v82g-n108h、v28g-i49a-n108y、v28g-i49a-n108h、v28g-i49g-n108h、v28g-a48g-n108y、v28g-a48g-n108h;
104.四点突变:v28g-a48g-i49a-n108y、v28g-a48g-i49g-n108y、v28g-a48g-v82t-n108y、v28g-a48g-v82g-n108y、v28g-i49a-v82t-n108y、v28g-i49a-v82g-n108y、v28g-i49g-v82t-n108y、v28g-i49g-v82g-n108y、a48g-i49a-v82t-n108y、a48g-i49a-v82g-n108y、a48g-i49g-v82t-n108y、a48g-i49g-v82g-n108y、v28g-a48g-i49a-n108h、v28g-a48g-i49g-n108h、v28g-a48g-v82t-n108h、v28g-a48g-v82g-n108h、v28g-i49a-v82t-n108h、v28g-i49a-v82g-n108h、v28g-i49g-v82t-n108h、v28g-i49g-v82g-n108h、a48g-i49a-v82t-n108h、a48g-i49a-v82g-n108h、a48g-i49g-v82t-n108h、a48g-i49g-v82g-n108h。
105.五点突变:v28g-a48g-i49a-v82t-n108y、v28g-a48g-i49 g-v82t-n108y、v28g-a48g-i49a-v82g-n108y、v28g-a48g-i49g-v82g-n108y、v28g-a48g-i49a-v82t-n108h、v28g-a48g-i49g-v82t-n108h、v28g-a48g-i49a-v82g-n108h、v28g-a48g-i49g-v82g-n108h。
106.本发明的第七个目的是提供一种碱基编辑器acbe的应用,所述碱基编辑器acbe介导a
·
t
‑‑g·
c和c
·g‑‑
t
·
a突变;
107.碱基编辑器acbe是指q13xz4、a8f050、e8wvh3、p44931、g0exn4、e0tbl5、a1w869、d5x1y1、i3yb54与ectada第106和第108位同源的氨基酸分别突变为缬氨酸和天冬酰胺后置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,其中,q13xz4、a8f050、e8wvh3、p44931、g0exn4、e0tbl5、a1w869、d5x1y1、i3yb54突变体的氨基酸序列分别为seq id no.10、seq id no.18、seq id no.25、seq id no.28、seq id no.38、seq id no.46、seq id no.48、seq id no.50、seq id no.53;
108.碱基编辑器acbe还指tada-8e中氨基酸进行点突变或点突变组合后所得的脱氨酶置于nspcas9的n-末端、第1249位融合位点融合形成的融合蛋白,这类融合蛋白具有介导a
·
t
‑‑g·
c和c
·g‑‑
t
·
a突变能力。
109.本发明第七方面,提供突变型tada-8e蛋白,所述突变蛋白为非天然蛋白,突变型tada-8e蛋白指tada-8e中氨基酸位点为第28、30、46、48、49、82、84、108、110或111位的氨基酸中一个或几个突变后的脱氨酶;
110.优选地,突变型tada-8e是指tada-8e中氨基酸进行以下单点突变后所得的脱氨酶:
111.v28w、v28g、n46l、n46p、n46c、a48c、a48g、a48n、a48s、i49d、i49e、i49h、i49n、i49p、i49q、i49v、i49w、i49y、i49r、i49a、i49t、i49g、i49l、i49s、i49m、i49c、i49f、i49k、v82g、v82a、v82t、v82c、v82s、v82d、f84m、n108h、n108m、n108c、n108d、n108f、n108q、n108s、n108y、v28a、v28d、v28e、v28k、v28m、v28r、v28l、v28q、v30a、v30d、v30g、v30w、v30e、v30n、v30q、v30y、v30t、v30s、n46h、n46k、n46y、n46f、n46e、n46q、n46d、n46g、n46m、n46v、n46s、n46t、a48d、a48e、a48y、a48w、a48f、a48q、v82f、f84d、f84r、f84a、f84e、f84p、f84k、f84c、f84h、f84i、f84s、f84t、f84v、f84q、f84n、f84g、f84y、n108v、n108i、n108l、n108a、n108t、n108r、k110d、k110w、k110e、r111p、r111e、r111t、r111a、r111v、r111g、r111i、r111w、r111l、r111d;
112.或,突变型tada-8e是指tada-8e中氨基酸进行以下双点突变后所得的脱氨酶:
113.v28g-n108y,v28g-n108c,v28g-n108h,v28g-n46l,v28g-n46c,v28g-n46p,v28w-n46l,v28w-n46c,v28w-n46p,n46p-n108y,n46p-n108s,n46p-n108q,n46p-n108d,n46p-n108c,n46p-n108h,n46p-f84m,n46p-i49a,n46p-i49g,n46p-a48g,n46c-n108y,n46c-n108s,n46c-n108q,n46c-n108m,n46c-n108c,n46c-n108h,n46l-n108y,n46l-n108q,n46l-n108d,n46l-n108m,n46l-n108h,n46l-f84m,n46l-i49a,n46l-i49g,n46l-v82g,i49a-n108y、v28g-a48g、v28g-i49a、v28g-i49g、v28g-v82t、v28g-f84y、v28w-n108h、n46c-v82g、n46c-v82t、n46c-f84m、n46l-v82t、n46p-f84m、n46p-n108m、a48g-n108h、i49a-n108h、i49g-n108h、i49g-n108y、i49g-v82g、i49g-v82t、i49g-f84y、v82g-n108y、v82t-n108h、v82t-n108c、f84m-n108h、f84m-n108m、f84m-n108q;
114.或,所述突变型tada-8e是指tada-8e中氨基酸进行以下三点突变后所得的脱氨酶:
115.i49a-v82t-n108y、i49a-v82g1-n08y、i49g-v82t-n108y、i49g-v82g-n108y、a48g-v82g-n108y、a48g-i49g-n108y、v28g-v82g-n108y、v28g-v82g-n108h、v28g-i49a-n108y、v28g-i49a-n108h、v28g-i49g-n108h、v28g-a48g-n108y、v28g-a48g-n108h、v28g-a48g-i49g、v28g-a48g-i49a、v28g-a48g-v82g、v28g-a48g-v82t、v28g-i49g-v82g、v28g-i49g-v82t、v28g-i49g-n108y、v28g-i49a-v82g、v28g-i49a-v82t、i49g-v82g-n108h、i49g-v82t-n108h;
116.或,所述突变型tada-8e是指tada-8e中氨基酸进行以下四点突变后所得的脱氨酶:v28g-a48g-i49a-n108y、v28g-a48g-i49g-n108y、v28g-a48g-v82t-n108y、v28g-a48g-v82g-n108y、v28g-i49a-v82t-n108y、v28g-i49a-v82g-n108y、v28g-i49g-v82t-n108y、v28g-i49g-v82g-n108y、a48g-i49a-v82t-n108y、a48g-i49a-v82g-n108y、a48g-i49g-v82t-n108y、a48g-i49g-v82g-n108y、v28g-a48g-i49a-n108h、v28g-a48g-i49g-n108h、v28g-a48g-v82t-n108h、v28g-a48g-v82g-n108h、v28g-i49a-v82t-n108h、v28g-i49a-v82g-n108h、v28g-i49g-v82t-n108h、v28g-i49g-v82g-n108h、a48g-i49a-v82t-n108h、
a48g-i49a-v82g-n108h、a48g-i49g-v82t-n108h、a48g-i49g-v82g-n108h;
117.或,所述突变型tada-8e是指tada-8e中氨基酸进行以下五点突变后所得的脱氨酶:v28g-a48g-i49a-v82t-n108y、v28g-a48g-i49 g-v82t-n108y、v28g-a48g-i49a-v82g-n108y、v28g-a48g-i49g-v82g-n108y、v28g-a48g-i49a-v82t-n108h、v28g-a48g-i49g-v82t-n108h、v28g-a48g-i49a-v82g-n108h、v28g-a48g-i49g-v82g-n108h。
118.本发明第八方面,提供腺嘌呤脱氨酶tada突变蛋白,所述腺嘌呤脱氨酶tada突变蛋白为非天然蛋白,所述腺嘌呤脱氨酶tada突变蛋白是指tada-x中与ectada第106和第108同源的氨基酸分别突变为缬氨酸和天冬酰胺的脱氨酶;
119.tada-x是指不同来源的tada;优选地,tada-x突变体有多组,其氨基酸序列分别如seq id no.5-seq id no.57中的任一所示。
120.进一步地,所述的突变型tada-8e蛋白或所述的腺嘌呤脱氨酶tada突变蛋白为单体或二聚体。
121.本发明第九方面,提供一种多核苷酸,编码所述碱基编辑器中的融合蛋白。
122.或,多核苷酸,编码所述的突变型tada-8e蛋白或所述的腺嘌呤脱氨酶tada突变蛋白。
123.本发明第十方面,提供一种载体,含有所述的多核苷酸。
124.本发明第十一方面,提供一种宿主细胞,含所述碱基编辑器,或含有所述的突变型tada-8e蛋白或所述的腺嘌呤脱氨酶tada突变蛋白,或含有所述载体。
125.本发明第十二方面,提供一种试剂盒,包含用于构建所述碱基编辑器的试剂。
126.与现有技术相比,本发明具有以下有益效果:
127.(1)本发明中开发的abe工具在介导a
·
t
‑‑g·
c突变时有更高的特异性,其介导c
·g‑‑
t
·
a突变的能力被明显抑制,甚至清除。
128.(2)本发明开发的cbe工具在介导c
·g‑‑
t
·
a突变时有更高的精确度,且rna和dna水平的脱靶效应有明显降低,甚至消除。
129.(3)本发明中开发的acbe工具,只需要单一的脱氨酶,其体积更小,且在rna和dna水平的脱靶效应有明显降低,甚至消除,具有更高的应用价值。
附图说明
130.图1为tada-8e融合于nspcas9蛋白不同位置(包括n-、c-和内部的融合位点)时所得的多种碱基编辑器abes在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率示意图。
131.图2为nls-tada-8e-linker融合于nspcas9蛋白不同位置(包括n-、c-和内部的融合位点)时所得的多种碱基编辑器abes在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率示意图。
132.图3a为1249-nls-tada-8e-linker和1249-tada-8e在sgrna-s1位点处对第四位碱基c(c4)和第六位碱基c(c6)的编辑效率(c
·g‑‑
t
·
a突变率)示意图。
133.图3b为v28、v30、n46、a48、i49、v82、f84、n108、k110、r111在tada-8e结构(pdb:6vpc)中的空间位置示意图;图中标示的氨基酸残基位于tada-8e的活性口袋。
134.图3c为增强1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力和对胞嘧啶(c)
偏好性的单点突变。柱状图从左至右分别为1249-nls-tada-8e-linker突变体的胞嘧啶(c)偏好性(胞嘧啶(c)偏好性=c
·g‑‑
t
·
a突变率/a
·
t
‑‑g·
c突变率),胞嘧啶(c)相对编辑活性(胞嘧啶(c)相对编辑活性=突变型/无突变型1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变率)以及腺嘌呤(a)相对编辑活性(腺嘌呤(a)相对编辑活性=突变型/无突变型1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变率)。
135.图4为1249-nls-tada-8e-linker中tada-8e在v28(a)和v30(b)饱和突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
136.图中深色框标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力和对胞嘧啶(c)的偏好性。
137.图5为1249-nls-tada-8e-linker中tada-8e在n46(a)和a48(b)饱和突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
138.图中深色框标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力和对胞嘧啶(c)的偏好性。
139.图6为1249-nls-tada-8e-linker中tada-8e在i49(a)和v82(b)饱和突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
140.图中深色框标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力和对胞嘧啶(c)的偏好性。
141.图7为1249-nls-tada-8e-linker中tada-8e在f84(a)和n108(b)饱和突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
142.图中深色框标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力和对胞嘧啶(c)的偏好性。
143.图8为1249-nls-tada-8e-linker中tada-8e在k110(a)和r111(b)饱和突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图。
144.图9为1249-nls-tada-8e-linker中tada-8e在v28位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
145.图10为1249-nls-tada-8e-linker中tada-8e在v30位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
146.图11为1249-nls-tada-8e-linker中tada-8e在n46位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
147.图12为1249-nls-tada-8e-linker中tada-8e在a48位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
148.图13为1249-nls-tada-8e-linker中tada-8e在i49位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
149.图14为1249-nls-tada-8e-linker中tada-8e在v82位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
150.图15为1249-nls-tada-8e-linker中tada-8e在f84位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
151.图16为1249-nls-tada-8e-linker中tada-8e在n108位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
152.图17为1249-nls-tada-8e-linker中tada-8e在k110位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
153.图18为1249-nls-tada-8e-linker中tada-8e在r111位点饱和突变后在sgrna-s1位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率(热图)示意图。
154.图19为1249-nls-tada-8e-linker中tada-8e引入v28g-x(a)和v28w-x(b)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;所述v28g-x表示在第28位氨基酸由缬氨酸突变为甘氨酸的基础上其它氨基酸位点还存在突变x。
155.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
156.图20为1249-nls-tada-8e-linker中tada-8e引入n46p-x(a)、n46c-x(b)和n46l-x(c)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
157.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
158.图21为1249-nls-tada-8e-linker中tada-8e引入a48g-x(a)、i49g-x(b)和i49a-x(c)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
159.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
160.图22为1249-nls-tada-8e-linker中tada-8e引入v82g-x(a)、v82t-x(b)和f84m/y-x(c)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
161.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
162.图23为1249-nls-tada-8e-linker中tada-8e引入n108y-x(a)、n108h-x(b)和n108m/c/d/q/s-x(c)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
163.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
164.图24为1249-nls-tada-8e-linker中tada-8e引入n108m-x(a)、n108c-x(b)、n108d-x(c)、n108s-x(d)和n108q-x(e)双点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
165.图中深色框标示的点突变型1249-nls-tada-8e-linker几乎无a
·
t
‑‑g·
c突变能力,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
166.图25与单点突变相比,能进一步增强1249-nls-tada-8e-linker对胞嘧啶(c)的编辑能力和偏好性的双点突变汇总。
167.图26为1249-nls-tada-8e-linker中tada-8e引入各类三点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图。图中深色框标示的点突
变型1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变能力显著降低,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
168.图27为1249-nls-tada-8e-linker中tada-8e引入v28g-x-y(a)和a48g-x-y(b)三点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;所述v28g-x-y表示在第28位氨基酸由缬氨酸突变为甘氨酸的基础上其它两处氨基酸位点还存在突变x和突变y;
169.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x和y指代其它位点的氨基酸突变。
170.图28为1249-nls-tada-8e-linker中tada-8e引入i49a-x-y(a)和i49g-x-y(b)三点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
171.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x和y指代其它位点的氨基酸突变。
172.图29为1249-nls-tada-8e-linker中tada-8e引入v82g-x-y(a)和v82t-x-y(b)三点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
173.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x和y指代其它位点的氨基酸突变。
174.图30为1249-nls-tada-8e-linker中tada-8e引入n108h-x-y(a)和n108y-x-y(b)三点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
175.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x和y指代其它位点的氨基酸突变。
176.图31为1249-nls-tada-8e-linker中tada-8e引入v28g-x-y-z(a)和a48g-x-y-z(b)四点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
177.示意的,所述v28g-x-y-z表示在第28位氨基酸由缬氨酸突变为甘氨酸的基础上还存在突变x、突变y和突变z;
178.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y和z指代其它位点的氨基酸突变。
179.图32为1249-nls-tada-8e-linker中tada-8e引入i49a-x-y-z(a)和i49g-x-y-z(b)四点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
180.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y和z指代其它位点的氨基酸突变。
181.图33为1249-nls-tada-8e-linker中tada-8e引入v82g-x-y-z(a)和v82t-x-y-z(b)四点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
182.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y和z指代其它位点的氨基酸突变。
183.图34为1249-nls-tada-8e-linker中tada-8e引入n108h-x-y-z(a)和n108y-x-y-z
(b)四点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
184.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y和z指代其它位点的氨基酸突变。
185.图35为1249-nls-tada-8e-linker中tada-8e引入v28g-x-y-z-u(a)、a48g-x-y-z-u(b)、i49a-x-y-z-u(c)和i49g-x-y-z-u(d)五点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
186.示意的,所述v28g-x-y-z-u表示在第28位氨基酸由缬氨酸突变为甘氨酸的基础上还存在突变x、突变y、突变z和突变u;
187.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y、z和u指代其它位点的氨基酸突变。
188.图36为1249-nls-tada-8e-linker中tada-8e引入v82g-x-y-z-u(a)、v82t-x-y-z-u(b)、n108h-x-y-z-u(c)和n108y-x-y-z-u(d)四点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图;
189.图中红色箭头标示的点突变能明显增强1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力,其中深红色箭头为优选点突变。x、y、z和u指代其它位点的氨基酸突变。
190.图37为1249-nls-tada-8e-linker中tada-8e引入各类四点和五点突变后在sgrna-s1位点处介导a
·
t
‑‑g·
c突变能力和c
·g‑‑
t
·
a突变能力改变示意图。图中深色框标示的点突变型1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变能力显著降低,但其c
·g‑‑
t
·
a突变能力仍不弱于野生型1249-nls-tada-8e-linker。
191.图38为不同类型的tada融合于nspcas9蛋白1249位点时所得的多种碱基编辑器abes在sgrna-1、sgrna-18、sgrna-pt14、sgrna-hpe6和sgrna-s5位点处对碱基a(a
·
t
‑‑g·
c突变)和c(c
·g‑‑
t
·
a突变率)的编辑效率示意图(实验结果为两次独立生物重复实验的平均值)。
192.图39为不同类型的碱基编辑器在rna水平和dna水平(非cas依赖型)的脱靶效应示意图。
193.a.各碱基编辑器在rna水平的a-i脱靶数目。
194.b.各碱基编辑器在rna水平的c-u脱靶数目。
195.c.各碱基编辑器在在dna水平的a-g脱靶效应(非cas9依赖型)。共四种脱靶位点r-loop 1,2,3,4用于检测。
196.d.各碱基编辑器在在dna水平的c-t脱靶效应(非cas9依赖型)。共四种脱靶位点r-loop 1,2,3,4用于检测。
197.*指p《0.05;**指p《0.01;***指指p《0.001。(结果来自三次独立生物重复实验)。
198.图40为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
199.图中为1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-tada-8e-linker(v28g)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d);1249-nls-tada-8e-linker(n108y)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的
活性窗口(e)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(f)。
200.图41为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
201.图中为1249-nls-tada-8e-linker(n46l)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-tada-8e-linker(n46c)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d);1249-nls-tada-8e-linker(n46p)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(e)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(f)。
202.图42为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
203.图中为1249-nls-tada-8e-linker(v28g-n46l)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-tada-8e-linker(v28g-n46c)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d);1249-nls-tada-8e-linker(v28g-n46p)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(e)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(f)。
204.图43为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
205.图中为1249-nls-tada-8e-linker(n46c-n108y)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-tada-8e-linker(n46p-n108s)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d)。
206.图44为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
207.图中为1249-nls-tada-8e-linker(f84m-n108y)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-tada-8e-linker(f84m-n108c)介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d)。
208.图45为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口及介导c
·g‑‑
t
·
a突变时对碱基的偏好性示意图;
209.图中为1249-nls-q13xz4(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(b);1249-nls-b3pcy2(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(c)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(d);1249-nls-e8wvh3(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(e)及介导c
·g‑‑
t
·
a突变时对碱基的偏好性(f)。
210.图46为优选碱基编辑器介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口示意图;
211.图中为1249-nls-b5zcw4(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(a);1249-nls-q57le3(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性窗口(b);1249-nls-q99w51(vn)-linker介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的活性
窗口(c)。
具体实施方式
212.下面结合附图和具体实施例对本发明进行详细说明。
213.实施例1
214.tada-8e为基础的碱基编辑器abe构建
215.已知ectada*可放置于nspcas9(d10a)的n-末端、c-末端或是内部的融合位点用于功能性abe的构建(nat commun,2020.11(1):5827)。本实施例中,为获得编辑活性更高和编辑窗口更多样化的abe工具,根据已有研究(nat commun,2020.11(1):5827),将tada-8e(seq id no.1)分别置于sv40nls-linker-nspcas9-nucleoplasmin nls(seq.id no.2,序列中2-17位为sv40nls-linker序列,18-1384位对应nspcas9(d10a)的2-1368位序列,1385-1400位为nucleoplasmin nls序列)的n-末端、c末端(c末端有额外的link序列(seq id no.3))和多个内部融合的位点(表1),构建出多种abe工具表达载体abe-internal-8e(通过2a-egfp元件同时表达egfp)。此外,考虑到蛋白接头(linker)或能改善内部融合后融合蛋白的构象,申请人在tada-8e的5’和3’分别添加nls序列和linker序列获得nls-tada-8e-linker(seq id no.4),并分别置于nspcas9的n-末端和多个内部融合的位点,构建出多种abe工具表达载体abe-internal-8e(通过2a-egfp元件同时表达egfp)。为评估abe-internal-8e的编辑活性,将不同的abe-internal-8e与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
216.表1 nspcas9融合位点
217.[0218][0219]
收集的双阳性细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证不同abe-internal-8e在s1位点的编辑效率。结果显示,与tada-8e相比,nls-tada-8e-linker能增强多种abe-internal-8e的编辑活性,并在一定程度上拓展编辑窗口(图1-2)。此外,结果显示,在nspcas9第1249位融合位点构建的1249-tada-8e和1249-nls-tada-8e-linker具有一定的c
·g‑‑
t
·
a突变活性,其中,1249-nls-tada-8e-linker在c4位点的c
·g‑‑
t
·
a突变活性高于1249-tada-8e(图3a)。
[0220]
实施例2
[0221]
对1249-nls-tada-8e-linker工具中的tada-8e进行点突变筛选
[0222]
本实施例中,根据tada-8e的结构信息(pdb:6vpc),选取tada-8e中位于酶活性口袋中与反应底物邻近的数个氨基酸(第28、30、46、48、49、82、84、108、110或111位的氨基酸)中任一个进行饱和突变(图3b),分析不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响。
[0223]
为评估不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响,将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1,facs)或直接收取
细胞(方案2,no.facs)。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
[0224]
收集的细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证1249-nls-tada-8e-linker各突变体的碱基编辑活性改变。
[0225]
本实施例中,对tada-8e单点突变后的碱基编辑器的a
·
t
‑‑g·
c突变和c
·g‑‑
t
·
a突变的能力进行分析。
[0226]
分析指标为:(1)点突变后,第三位腺嘌呤(a3)、第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)、第七位腺嘌呤(a7)的编辑效率变化(pam为21-23位点)(相对效率=点突变组/无突变组,相对效率》1表明突变型1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0227]
(2)根据1249-nls-tada-8e-linker对s1位点中各碱基的编辑情况可知,其对a3、a5、a7、a8和a9的编辑效率最高且各位点效率接近,因此选取a5作为1249-nls-tada-8e-linker介导a
·
t
‑‑g·
c突变能力的代表。点突变后,c4突变效率与a5突变效率的比值变化(c4/a5),以及c6突变效率与a5突变效率的比值变化(c6/a5)可反映1249-nls-tada-8e-linker对胞嘧啶(c)和腺嘌呤(a)两种碱基偏好性的改变。c4/a5的相对效率=(点突变组c4/a5)/(无突变组c4/a5),c6/a5的相对效率=(点突变组c6/a5)/(无突变组c6/a5),相对效率》1表明突变型1249-nls-tada-8e-linker对胞嘧啶(c)的编辑能力和偏好性增强。
[0228]
结合以上两种指标,申请人对可促进1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力和增加胞嘧啶(c)偏好性的点突变进行筛选。结果显示,v28w、v28g、n46l、n46p、n46c、a48c、a48g、a48n、a48s、i49d、i49e、i49h、i49n、i49p、i49q、i49v、i49w、i49y、i49r、i49a、i49t、i49g、i49l、i49s、i49m、i49c、i49f、i49k、v82g、v82a、v82t、v82c、v82s、v82d、f84m、n108h、n108m、n108c、n108d、n108f、n108q、n108s、n108y点突变能增强1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力及对胞嘧啶(c)的编辑偏好性(图3c)。其余点突变对1249-nls-tada-8e-linker功能的影响可参见图4-图8。
[0229]
此外,对点突变后1249-nls-tada-8e-linker编辑s1位点各碱基的效率(方案1,facs分选部分)进行分析后发现(效率热图),v28位点的不同点突变中,v28d、v28e、v28k能有效提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,v28d、v28e突变在a5位点(pam位点编号为21-23)具有明显的编辑活性(a
·
t
‑‑g·
c突变);v28k突变则在a3-a7具有明显的编辑活性,其中在a5-a7具有最高的编辑效率(a
·
t
‑‑g·
c突变)。此外,v28m、v28r、v28d、v28q、v28k、v28l、v28e突变均可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。v28w、v28a、v28g则能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%),其中v28g还能同时抑制1249-nls-tada-8e-linker介导a
·
t
‑‑g·
c突变的能力并导致其活性窗口变窄(图9)。
[0230]
v30位点的不同点突变中,v30d、v30g、v30w、v30e、v30n、v30q、v30y、v30t、v30s均能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度。v30d、v30w、v30e的核心活性窗口为a5;v30n、v30q、v30y的活性窗口为a5-a7;v30t、v30s的活性窗口为a3-a7。此外,v30a、v30d、v30t、v30g、v30p、v30w、v30e、v30k、v30n、v30q、v30r、v30s、v30y能显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率),其中v30g、v30p、v30k、v30r还同时抑制了1249-nls-tada-8e-linker介导a
·
t
‑‑g·
c突变的能力(图
10)。
[0231]
n46位点的所有19种点突变均导致1249-nls-tada-8e-linker活性窗口的缩小。其中n46h、n46k、n46y、n46f只在a5有较低的编辑活性(~30%)。n46g、n46m的活性窗口为a5-a7,其中a5为核心活性窗口(a5编辑效率~60%,a7约~20%)。n46e、n46q、n46d的活性窗口为a3-a7。n46h、n46k、n46y、n46f、n46g、n46m、n46e、n46q、n46d能显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。有趣的是,n46p在s1位点仅能介导c4-c6位点的c
·g‑‑
t
·
a突变。n46a、n46v的活性窗口位于c4-a5,其中n46a活性较低(《20%);n46l的活性窗口位于c4-a5-c6;n46c的活性窗口位于c4-a5-c6-a7。n46a、n46v、n46l、n46c突变后的1249-nls-tada-8e-linker具有更窄的活性窗口,并具备介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的两种能力。n46a、n46r、n46w点突变后,1249-nls-tada-8e-linker基本不具备任何编辑活性。n46s、n46t具有更窄的活性窗口,具备介导c
·g‑‑
t
·
a突变和a
·
t
‑‑g·
c突变的两种能力,但a
·
t
‑‑g·
c突变的能力显著强于c
·g‑‑
t
·
a突变的能力(图11)。
[0232]
a48位点的不同点突变中,a48d、a48e能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a3-a7。a48y、a48w、a48e、a48d、a48f、a48q能显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。a48g、a48s、a48n能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%)。a48l点突变导致1249-nls-tada-8e-linker基本不具备任何编辑活性(图12)。
[0233]
i49位点的不同点突变中,所有19种点突变均能在一定程度上提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力,且大部分点突变能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%)。(图13)
[0234]
v82位点的不同点突变中,v82f可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。v82k、v82w、v82r、v82y导致1249-nls-tada-8e-linker基本不具备任何编辑活性。v82a、v82t、v82c、v82s、v82d能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%)(图14)。
[0235]
f84位点的不同点突变中,f84d、f84r能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a5;f84a、f84e、f84p能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a3-a7。此外,f84k、f84c、f84h、f84i、f84s、f84t、f84v、f84q、f84n、f84g能导致其活性窗口变窄。f84y、f84e、f84r可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。f84m能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%)(图15)。
[0236]
n108位点的不同点突变中,除n108v外,均能导致1249-nls-tada-8e-linker的活性窗口明显变窄。n108i、n108l、n108a、n108t能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a5,n108r能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a3-a7。n108i、n108l、n108r、n108a、n108t可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)。n108h、n108m、n108c、n108d、n108f、n108q、n108s、n108y能明显提高1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(提升超过20%)(图16)。
[0237]
k110位点的不同点突变中,k110d、k110w能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a2-a8。k110e、k110w可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)(图17)。
[0238]
r111位点的不同点突变中,r111p、r111e、r111t能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a5。r111a、r111v、r111g、r111i、r111w能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a3-a7。r111l能明显提高1249-nls-tada-8e-linker的碱基编辑特异性和精确度,活性窗口主要位于a2-a7。r111p、r111d、r111l、r111e、r111i、r111t、r111w可显著抑制1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变的能力(《10%的编辑效率)(图18)。
[0239]
实施例3
[0240]
对1249-nls-tada-8e-linker工具中的tada-8e进行点突变组合筛选(双点突变)
[0241]
本实施例中,根据tada-8e的结构信息(pdb:6vpc),选取能增强tada-8e介导c
·g‑‑
t
·
a突变能力的关键点突变v28g、v28w(优选v28g),n46p、n46c、n46l,a48g,i49a、i49g,v82t,f84m,n108h、n108m、n108c、n108d、n108q、n108s、n108y(优选n108h、n108y),以及能降低rna脱靶风险的v82g点突变,通过构建双点突变型1249-nls-tada-8e-linker,分析不同双点突变组合对1249-nls-tada-8e-linker碱基编辑活性的影响。
[0242]
为评估不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响,将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1),或直接收集所有细胞(方案2)。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
[0243]
收集好的细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证1249-nls-tada-8e-linker各突变体的活性变化。
[0244]
分析指标为:(1)双点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(相对效率=双点突变组/无突变组,双点突变相对效率》单点突变相对效率时表明,与单点突变相比,双点突变后1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0245]
(2)双点突变后,c4/a5的相对效率=(双点突变组c4/a5)/(无突变组c4/a5),c6/a5的相对效率=(双点突变组c6/a5)/(无突变组c6/a5),双点突变相对效率》单点突变相对效率时表明,与单点突变相比,双点突变后1249-nls-tada-8e-linker对胞嘧啶(c)的编辑能力和偏好性增强。
[0246]
综合以上两种指标,申请人对可促进1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力的双点突变进行筛选(图19-24)。其中双点突变v28g-n108y,v28g-n108c,v28g-n108h,v28g-n46l,v28g-n46c,v28g-n46p,v28w-n46l,v28w-n46c,v28w-n46p,n46p-n108y,n46p-n108s,n46p-n108q,n46p-n108d,n46p-n108c,n46p-n108h,n46p-f84m,n46p-i49a,n46p-i49g,n46p-a48g,n46c-n108y,n46c-n108s,n46c-n108q,n46c-n108m,n46c-n108c,n46c-n108h,n46l-n108y,n46l-n108q,n46l-n108d,n46l-n108m,n46l-n108h,n46l-f84m,n46l-i49a,n46l-i49g,n46l-v82g,i49a-n108y能几乎完全抑制1249-nls-tada-8e-linker
的a
·
t
‑‑g·
c突变能力,同时保持不弱于1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变能力。此外,与相应的单点突变相比,v28g-n46c、v28g-n46p、v28g-a48g、v28g-i49a、v28g-i49g、v28g-v82t、v28g-f84y、v28w-n108h、v28w-n46p、v28w-n46c、n46c-v82g、n46c-v82t、n46c-f84m、n46l-a48g、n46l-v82t、n46l-f84m、n46p-f84m、n46p-n108h、n46p-n108m、n46p-n108c、n46p-n108q、n46p-n108s、a48g-n108h、i49a-n108h、i49g-n108h、i49g-n108y、i49g-v82g、i49g-v82t、i49g-f84y、v82g-n108y、v82t-n108h、v82t-n108c、f84m-n108h、f84m-n108m、f84m-n108q双点突变能进一步增强1249-nls-tada-8e-linker对胞嘧啶(c)的编辑能力和偏好性(图25)。
[0247]
实施例4
[0248]
对1249-nls-tada-8e-linker工具中的tada-8e进行点突变组合筛选(三点突变)
[0249]
本实施例中,根据tada-8e的结构信息(pdb:6vpc),以及单点突变和三点突变的结果,选取能增强tada-8e介导c
·g‑‑
t
·
a突变能力的关键点突变v28g,a48g,i49a、i49g,v82t,n108h、n108y,以及能降低rna脱靶风险的v82g点突变,通过构建三点突变型1249-nls-tada-8e-linker,分析不同三点突变组合对1249-nls-tada-8e-linker的碱基编辑活性的影响。
[0250]
为评估不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响,将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1),或直接收集所有细胞(方案2)。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
[0251]
收集好的细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证1249-nls-tada-8e-linker各突变体的活性变化。
[0252]
分析指标为:(1)三点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(相对效率=三点突变组/无突变组,相对效率》单点突变组表明,与单点突变相比,三点突变后1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0253]
(2)三点突变后,c4/a5的相对效率=(三点突变组c4/a5)/(无突变组c4/a5),c6/a5的相对效率=(三点突变组c6/a5)/(无突变组c6/a5),相对效率》单点突变组表明,与单点突变相比,三点突变后1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变的能力增强。
[0254]
综合以上两种指标,我们发现,显著抑制1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变能力,同时保持或增强c
·g‑‑
t
·
a突变能力的三点突变均包含有n108y或n108h点突变。这类三点突变有i49a-v82t-n108y、i49a-v82g1-n08y、i49g-v82t-n108y、i49g-v82g-n108y、a48g-v82g-n108y、a48g-i49g-n108y、v28g-v82g-n108y、v28g-v82g-n108h、v28g-i49a-n108y、v28g-i49a-n108h、v28g-i49g-n108h、v28g-a48g-n108y、v28g-a48g-n108h(图26)。
[0255]
分析指标为:(1)三点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(三/单相对效率=三点突变组/对应的单点突变组,相对效率》1表明,与单点突变相比,三点突变后1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0256]
(2)三点突变后,c4/a5的三/单相对效率=(三点突变组c4/a5)/(对应的单点突变组c4/a5),c6/a5的三/单相对效率=(三点突变组c6/a5)/(对应的单点突变组c6/a5),相对效率》1表明,与单点突变相比,三点突变后1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变的能力增强。
[0257]
结合以上两种指标,申请人对可促进1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力的三点突变进行筛选(图27-30)。结果显示,v28g-a48g-i49g、v28g-a48g-i49a、v28g-a48g-v82g、v28g-a48g-v82t、v28g-a48g-n108h、v28g-a48g-n108y、v28g-i49g-v82g、v28g-i49g-v82t、v28g-i49g-n108h、v28g-i49g-n108y、v28g-i49a-v82g、v28g-i49a-v82t、v28g-i49a-n108h、v28g-i49a-n108y、i49g-v82g-n108h、i49g-v82g-n108y、i49g-v82t-n108h、i49g-v82t-n108y三点突变能进一步增强1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力。
[0258]
实施例5
[0259]
对1249-nls-tada-8e-linker工具中的tada-8e进行点突变组合筛选(四点突变)
[0260]
本实施例中,根据tada-8e的结构信息(pdb:6vpc),以及单点突变、二点突变和三点突变的结果,选取能增强tada-8e介导c
·g‑‑
t
·
a突变能力的关键点突变v28g,a48g,i49a、i49g,v82t,n108h、n108y,以及能降低rna脱靶风险的v82g点突变,通过构建1249-nls-tada-8e-linker的四点突变表达载体,分析不同四点突变组合对1249-nls-tada-8e-linker的碱基编辑活性的影响。
[0261]
为评估不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响,将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1),或直接收集所有细胞(方案2)。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
[0262]
收集好的细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证1249-nls-tada-8e-linker各突变体的活性变化。
[0263]
分析指标为:(1)四点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(四/单相对效率=四点突变组/对应的单点突变组,相对效率》1表明,与单点突变相比,四点突变后1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0264]
(2)四点突变后,c4/a5的四/单相对效率=(四点突变组c4/a5)/(对应的单点突变组c4/a5),c6/a5的四/单相对效率=(四点突变组c6/a5)/(对应的单点突变组c6/a5),相对效率》1表明,与单点突变相比,四点突变后1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变的能力增强。
[0265]
结合以上两种指标,申请人对可促进1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力的四点突变进行筛选(图31-34)。结果显示,v28g-i49g-v82t-n108y、a48g-i49a-v82t-n108h、a48g-i49g-v82g-n108h四点突变能进一步增强1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力。
[0266]
实施例6
[0267]
对1249-nls-tada-8e-linker工具中的tada-8e进行点突变组合筛选(五点突变)
[0268]
本实施例中,根据tada-8e的结构信息(pdb:6vpc),以及单点突变二点突变、三点突变和四点突变的结果,选取能增强tada-8e介导c
·g‑‑
t
·
a突变能力的关键点突变v28g,a48g,i49a、i49g,v82t,n108h、n108y,以及能降低rna脱靶风险的v82g点突变,通过构建1249-nls-tada-8e-linker的五点突变表达载体,分析不同五点突变组合对1249-nls-tada-8e-linker的碱基编辑活性的影响。
[0269]
为评估不同点突变对1249-nls-tada-8e-linker的碱基编辑活性的影响,将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1),或直接收集所有细胞(方案2)。本实施例中使用的sgrna为s1(序列为gaacacaaagcatagactgc)。
[0270]
收集好的细胞抽提基因组,使用可特异性扩增sgrna-s1位点信息的引物进行定向pcr。pcr产物通过sanger测序验证1249-nls-tada-8e-linker各突变体的活性变化。
[0271]
分析指标为:(1)五点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(五/单相对效率=五点突变组/对应的单点突变组,相对效率》1表明,与单点突变相比,五点突变后1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变或c
·g‑‑
t
·
a突变的能力增强);
[0272]
(2)五点突变后,c4/a5的五/单相对效率=(五点突变组c4/a5)/(对应的单点突变组c4/a5),c6/a5的五/单相对效率=(五点突变组c6/a5)/(对应的单点突变组c6/a5),相对效率》1表明,与单点突变相比,五点突变后1249-nls-tada-8e-linker的c
·g‑‑
t
·
a突变的能力增强。
[0273]
结合以上两种指标,申请人对可促进1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力的五点突变进行筛选(图35-36)。结果显示,v28g-a48g-i49g-v82t-n108h、v28g-a48g-i49g-v82t-n108y、v28g-a48g-i49a-v82t-n108h、v28g-a48g-i49a-v82t-n108y五点突变能进一步增强1249-nls-tada-8e-linker介导c
·g‑‑
t
·
a突变能力。
[0274]
此外,我们对四点突变和五点突变的数据做了进一步分析,分别计算两种指标:
[0275]
(1)多点突变后,第四位胞嘧啶(c4)、第五位腺嘌呤(a5)、第六位胞嘧啶(c6)的编辑效率变化(pam为21-23位点)(相对效率=多点突变组/无点突变组)。
[0276]
(2)多点突变后,c4/a5的相对效率=(多点突变组c4/a5)/(无点突变组c4/a5),c6/a5的相对效率=(多点突变组c6/a5)/(无点突变组c6/a5)。
[0277]
综合以上两种指标,我们发现,显著抑制1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变能力,同时保持或增强c
·g‑‑
t
·
a突变能力的四/五点突变均包含有n108y或n108h点突变。这表明n108位点的点突变对改变碱基编辑器编辑胞嘧啶(c)及腺嘌呤(a)的偏好性非常关键,n108y/h点突变能明显增强1249-nls-tada-8e-linker编辑胞嘧啶(c)的偏好性,除a48g-i49a-v82t-n108h外,所有包含n108y/h的四点突变和五点突变(v28g、a48g、i49a/g、v82t/g和n108h/y的各类四点突变和五点突变组合)均可显著抑制1249-nls-tada-8e-linker的a
·
t
‑‑g·
c突变能力。(图37)。
linker(n46p)、1249-nls-tada-8e-linker(n108y)、、1249-nls-tada-8e-linker(v28g-n46l)、1249-nls-tada-8e-linker(v28g-n46p)、1249-nls-tada-8e-linker(v28g-n46c)、1249-nls-tada-8e-linker(n46c-n108y)、1249-nls-tada-8e-linker(n46p-n108s)、1249-nls-tada-8e-linker(f84m-n108y)、1249-nls-tada-8e-linker(f84m-n108c)、1249-nls-q13xz4(vn)-linker、1249-nls-b3pcy2(vn)-linker、1249-nls-b5zcw4(vn)-linker、1249-nls-e8wvh3(vn)-linker、1249-nls-q57le3(vn)-linker、1249-nls-q99w51(vn)-linker、1249-nls-ectada(vn)-linker以分析其在rna水平的脱靶效应。其中1249-nls-tada-8e-linker(8e)为阳性对照;ncas9-d10a为阴性对照。
[0285]
为评估各优选工具在rna水平的脱靶效应,将各优选表达载体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-puromycin)共转染至培养的293t细胞。转染后24小时加入嘌呤霉素筛选阳性细胞。嘌呤霉素处理48小时后,收集细胞提取总rna进行rna-seq实验。本方案使用的sgrna为sg-rnf(序列为gtcatcttagtcattacctg)。
[0286]
rna编辑是指在mrna水平上改变遗传信息的过程。具体来说,它指的是mrna分子中核苷酸的缺失、插入或化学修饰。这种修饰影响基因的表达,不同氨基酸的产生和开放阅读框的形成。在哺乳动物细胞中,主要存在两类rna编辑,分别为a-i编辑和c-u编辑。这种rna编辑是由rna依赖的腺嘌呤脱氨酶介导的。
[0287]
我们首先对a-i编辑结果进行分析,发现tada-8e*点突变可显著降低1249-nls-tada-8e-linker在rna水平的脱靶效应。点突变后,rna水平的脱靶效应与本底(n.c.,仅转染sgrna)及阴性对照组(cas9-d10a+sgrna)类似。此外,其它新筛选的功能性tada为基础的碱基编辑器中,1249-nls-b5zcw4(vn)-linker和1249-nls-b3pcy2(vn)-linker在rna水平的脱靶效应与本底及阴性对照相似,1249-nls-q13xz4(vn)-linker、1249-nls-ectada(vn)-linker、1249-nls-q57le3(vn)-linker和1249-nls-e8wvh3(vn)-linker在rna水平的脱靶效应比本底及阴性对照略高,但明显低于1249-nls-tada-8e-linker。1249-nls-q99w51(vn)-linker在rna水平的脱靶效应明显高于1249-nls-tada-8e-linker(图39a)。
[0288]
rna水平的c-u编辑结果显示,各样品组与本底(n.c.,仅转染sgrna)及阴性对照组(cas9-d10a+sgrna)类似,没有明显的增加(图39b)。
[0289]
实施例9
[0290]
部分工具在dna水平的脱靶效应分析(非cas依赖型脱靶效应)
[0291]
本实施例中,优选1249-nls-tada-8e-linker(v28g)、1249-nls-tada-8e-linker(n46l)、1249-nls-tada-8e-linker(n46c)、1249-nls-tada-8e-linker(n46p)、1249-nls-tada-8e-linker(n108y)、1249-nls-tada-8e-linker(v28g-n46l)、1249-nls-tada-8e-linker(v28g-n46p)、1249-nls-tada-8e-linker(v28g-n46c)、1249-nls-tada-8e-linker(n46c-n108y)、1249-nls-tada-8e-linker(n46p-n108s)、1249-nls-tada-8e-linker(f84m-n108y)、1249-nls-tada-8e-linker(f84m-n108c)、1249-nls-q13xz4(vn)-linker、1249-nls-b3pcy2(vn)-linker、1249-nls-b5zcw4(vn)-linker、1249-nls-e8wvh3(vn)-linker、1249-nls-q57le3(vn)-linker、1249-nls-q99w51(vn)-linker以分析其在dna水平的脱靶效应(非cas依赖型脱靶效应)。另选择1249-nls-tada-8e-linker(8e)为对照。
[0292]
dna水平的脱靶效应(非cas依赖型脱靶效应)通过r-loop实验进行分析[8]。其基
本原理是,dsacas9与靶向基因组特定位点(位点x)的sasgrna(sasgrna-x)在细胞中共表达,会在位点x处诱导形成单链dna(ssdna)区域;此时,细胞内共表达的碱基编辑器(abe或cbe)因其自身对ssdna的亲和力,便可能结合ssdna并介导c
·g‑‑
t
·
a(cbe)或a
·
t
‑‑g·
c(abe)突变。
[0293]
人源hek293t细胞系复苏培养后以30%-50%密度铺12孔平板,24小时后采用脂质体共转染碱基编辑器的各优选表达载体(通过2a-egfp元件同时表达egfp)和失活型sacas9(dsacas9)-sasgrna共表达载体(同时表达红色荧光蛋白),培养72小时后胰酶消化收取细胞,流式细胞分选双阳性细胞,通过裂解液裂解细胞提取基因组,之后针对sasgrna位点设计引物进行定向扩增,扩增产物经纯化后进行深度测序,进行数据分析了解sasgrna位点处的a-g和c-t突变频率。研究中共选取四种不同的sasgrna脱靶位点(sasgrna-1~6)用于在dna水平的脱靶效应分析(非cas依赖型脱靶效应)。
[0294]
a-g突变效率结果显示,1249-nls-tada-8e-linker(8e)在sasgrna-1,2,4,6四个位点处的碱基编辑效率均《8%(该编辑效率为脱靶位点所有a-g突变频率的总和),表明其dna水平的脱靶效应(非cas依赖型脱靶效应)很低。而与1249-nls-tada-8e-linker(8e)相比,1249-nls-tada-8e-linker(v28g)、1249-nls-tada-8e-linker(n46l)、1249-nls-tada-8e-linker(n46c)、1249-nls-tada-8e-linker(n46p)、1249-nls-tada-8e-linker(n108y)、1249-nls-tada-8e-linker(v28g-n46l)、1249-nls-tada-8e-linker(v28g-n46p)、1249-nls-tada-8e-linker(v28g-n46c)、1249-nls-tada-8e-linker(n46c-n108y)、1249-nls-tada-8e-linker(n46p-n108s)、1249-nls-tada-8e-linker(f84m-n108y)、1249-nls-tada-8e-linker(f84m-n108c)、1249-nls-q13xz4(vn)-linker、1249-nls-b3pcy2(vn)-linker、1249-nls-b5zcw4(vn)-linker、1249-nls-e8wvh3(vn)-linker、1249-nls-q57le3(vn)-linker、1249-nls-q99w51(vn)-linker等点突变能显著降低sasgrna-1,2,4四个位点的dna水平脱靶效应(非cas依赖型脱靶效应);在sasgrna-6位点处,以上碱基编辑器的dna水平脱靶效应(非cas依赖型脱靶效应)也低于8e,其在1,2,4,6四种脱靶位点的a-g碱基编辑效率均《4%(图39c)。
[0295]
c-t突变效率分析显示,除v28g-n46c在sasgrna-6位点处的突变效率接近4%外,其余碱基编辑器在四种位点的c-t突变效率均《2%(图39d)。
[0296]
dna脱靶效应分析结果表明,点突变和新的tada脱氨基酶构建的碱基编辑器在非cas依赖型脱靶效应上处于较低的水平,安全性有明显提高。
[0297]
实施例10优选碱基编辑器的活性窗口和碱基偏好性
[0298]
本实施例中,优选1249-nls-tada-8e-linker、1249-nls-tada-8e-linker(v28g)、1249-nls-tada-8e-linker(n46l)、1249-nls-tada-8e-linker(n46c)、1249-nls-tada-8e-linker(n46p)、1249-nls-tada-8e-linker(n108y)、1249-nls-tada-8e-linker(v28g-n46l)、1249-nls-tada-8e-linker(v28g-n46p)、1249-nls-tada-8e-linker(v28g-n46c)、1249-nls-tada-8e-linker(n46c-n108y)、1249-nls-tada-8e-linker(n46p-n108s)、1249-nls-tada-8e-linker(f84m-n108y)、1249-nls-tada-8e-linker(f84m-n108c)、1249-nls-q13xz4(vn)-linker、1249-nls-b3pcy2(vn)-linker、1249-nls-b5zcw4(vn)-linker、1249-nls-e8wvh3(vn)-linker、1249-nls-q57le3(vn)-linker、1249-nls-q99w51(vn)-linker分析其活性窗口和碱基偏好性,另选择1249-nls-tada-8e-linker(8e)为对照。
[0299]
为系统分析碱基编辑器的活性窗口和碱基偏好性,选择12种sgrna(s18序列:acacacacacttagaatctg;hek4序列:ggcactgcggctggaggtgg;zscan2序列:gtgcggcaagagcttcagcc;aavs1序列:gaccctcagccgtgctgctc;fan3序列:cgccgtctccaaggtgaaag;emx序列:gagtccgagcagaagaagaa;mskc序列:cgtcgccgatcttcacaggg;pt14序列:tccaaacccatatatacagc;rnf序列:gtcatcttagtcattacctg;s1序列:gaacacaaagcatagactgc;sgb序列:agagccccccctcaaagaga;ube3a序列:gtacagttagtactcagcag)开展相关研究。将1249-nls-tada-8e-linker突变体(通过2a-egfp元件同时表达egfp)与单向导rna(sgrna)(sgrna同时表达尿嘧啶糖基化酶抑制因子ugi和2a-mcherry)共转染至培养的293t细胞。细胞培养72小时后,细胞培养72小时后,通过facs收集同时表达egfp和mcherry的双阳性细胞(方案1)。
[0300]
收集好的细胞抽提基因组,使用可特异性扩增目标sgrna位点信息的引物进行定向pcr。pcr产物通过扩增子测序,以分析优选碱基编辑器的活性窗口和碱基偏好性(n=3次生物学重复)。
[0301]
结果显示,1249-nls-tada-8e-linker具有介导c
·g‑‑
t
·
a突变(cbe活性)和a
·
t
‑‑g·
c突变(abe活性)的能力,但其abe活性显著高于其cbe活性。其中1249-nls-tada-8e-linker的abe活性窗口为a2-a14(pam为21-23),cbe活性窗口为(c4-c7)(图40a)。1249-nls-tada-8e-linker的cbe活性呈现出碱基偏好性,其对不同碱基位点的偏好性为ca≈ct》cg≈cc,ac≈tc》gc≈cc(图40b)。
[0302]
tada-8e不同点突变对其碱基编辑活性和碱基偏好性都有影响。单点突变而言,其中v28g点突变后,1249-nls-tada-8e-linker(v28g)的cbe活性高于abe活性,cbe活性窗口为(c4-c7),abe活性窗口为a5(图40c)。其对不同碱基位点的偏好性为ca≈ct》cg≈cc,ac≈tc》cc》gc(图40d)。1249-nls-tada-8e-linker(n108y)的cbe活性与abe活性类似,其中cbe活性窗口为(c4-c7),abe活性窗口为(a5-a7)(图40e)。其对不同碱基位点的偏好性为ct≈ca≈cc》cg,tc》ac》cc≈gc(图40f)。1249-nls-tada-8e-linker(n46l)几乎无abe活性,其cbe活性窗口为(c4-c8)(图41a)。其对不同碱基位点的偏好性为cg》ca≈cc≈ct,cc≈tc》gc≈ac(图41b)。、1249-nls-tada-8e-linker(n46c)的cbe活性与abe活性类似,其中cbe活性窗口为(c4-c8),abe活性窗口为(a5-a7)(图41c)。其对不同碱基位点的偏好性为ct≈ca≈cc》cg,cc≈tc》gc≈ac(图41d)。1249-nls-tada-8e-linker(n46p)仅有cbe活性,活性窗口为(c4-c8)(图41e)。其对不同碱基位点的偏好性为cc≈tc》gc≈ac(图41f)。
[0303]
双点突变而言,1249-nls-tada-8e-linker(v28g-n46l)的abe活性很低,cbe活性窗口为(c4-c8)(图42a),其对不同碱基位点的偏好性为cg≈ct≈ca》cc,tc≈cc》gc≈ac(图42b)。1249-nls-tada-8e-linker(v28g-n46c)的abe活性很低,cbe活性窗口为(c4-c9)(图42c),其对不同碱基位点的偏好性为tc≈cc≈ac》gc(图42d)。1249-nls-tada-8e-linker(v28g-n46p)的abe活性很低,cbe活性窗口为(c4-c8)(图42e),其对不同碱基位点的偏好性为ct≈cg≈ca》cc,tc≈cc》gc≈ac(图42f)。1249-nls-tada-8e-linker(n46c-n108y)的abe活性和cbe活性均非常低,abe活性窗口为a5,cbe活性窗口为c4-c6(图43a)。其对不同碱基位点的偏好性为ca≈ct》cc≈cg,ac≈tc》cc≈gc(图43b)。1249-nls-tada-8e-linker(n46p-n108s)的cbe活性显著高于abe活性,abe活性窗口为a5,cbe活性窗口为c4-c9(图43c),其并无明显的碱基偏好性(图43d)。1249-nls-tada-8e-linker(f84m-n108y)的abe活
性和cbe活性相似,abe的活性窗口为a5-a7,cbe的活性窗口为c4-c7(图44a),其对不同碱基位点的偏好性为ct≈ca≈cc》cg,tc≈ac》cc≈gc(图44b)。1249-nls-tada-8e-linker(f84m-n108c)的abe活性显著高于cbe,abe的活性窗口为a5-a7,cbe的活性窗口为c4-c7(图44c)。其对不同碱基位点的偏好性为ca≈ct》cc≈cg,ac≈tc》cc≈gc(图44d)。
[0304]
总结可知,tada-8e不同点突变会显著改变1249-nls-tada-8e-linker的碱基编辑活性和偏好性,且不同点突变对abe和cbe活性的影响有明显差别。
[0305]
tada同源蛋白来源的碱基编辑器而言,1249-nls-q13xz4(vn)-linker的cbe活性显著高于abe活性,cbe活性窗口为c4-6,abe活性窗口为a5,a7(图45a)。其对不同碱基位点的偏好性为ca≈ct》cc≈cg,ac≈tc》cc≈gc(图45b)。1249-nls-b3pcy2(vn)-linker的abe活性很低,cbe活性窗口为c4-7(图45c)。其对不同碱基位点的偏好性为,在ct/ac位点具有高编辑活性,在cg/gc位点编辑活性很低(图45d)。1249-nls-e8wvh3(vn)-linker具有相似的abe和cbe活性,cbe活性窗口为c4-6,abe活性窗口为a3-7(图45e)。其对不同碱基位点的偏好性为ca≈ct》cc》cg,ac》tc≈cc≈gc(图45f)。1249-nls-b5zcw4(vn)-linker的cbe活性很低,abe活性窗口为a5-7(图46a)、1249-nls-q57le3(vn)-linker的cbe活性很低,abe活性窗口为a5,(图46b),1249-nls-q99w51(vn)-linker的cbe和abe活性均很低,cbe活性窗口为c5,abe活性窗口为a3,a5(图46c)
[0306]
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。