使用靶向核酸内切酶和单链核酸的基因组编辑的制作方法

xiaoxiao2020-6-24  16

专利名称:使用靶向核酸内切酶和单链核酸的基因组编辑的制作方法
技术领域
本发明总体上涉及使用靶向核酸内切酶和单链核酸编辑特定染色体序列。
背景技术
常规的基因组工程具有贯穿基础研究、药物发现和基于细胞的药物的巨大潜力。许多用于靶向基因敲除、诱变或整合的现有方法依赖于同源重组。然而,许多细胞中低自发重组率以及筛选工作规模和分离靶向事件所要求的时间已经阻碍这个领域中的进展。因此,存在对于可以以高的速度、效率和准确度快速实现靶向基因组编辑的技术的需要。发明简述在本公开的各个方面,提供了一种用于编辑细胞中至少一种内源染色体序列的方法。这种方法包括向细胞中引入(i)至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸,其中所述靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂,和( )至少一种单链核 酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一性的第一部分。该方法还包括将所述细胞在如此条件下维持,从而通过同源重组法(homology-directed process)修复由革巴向核酸内切酶引入的双链断裂,从而所述染色体序列与单链核酸的序列交换,因而编辑所述染色体序列。又一个方面提供一种用于编辑细胞中染色体序列的试剂盒。该试剂盒包含(a)至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸,其中所述靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂,和(b)至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一性的第一部分。下文更详尽地描述本公开的其他方面和特征。对彩色图片的参考本申请文件含有彩色制作的至少一张照片。此专利申请公开连同彩色照片的副本将由专利办公室在请求并支付必需费用时提供。附图简述

图1展示用来修饰RSK2激酶基因座的寡核苷酸的设计。在顶部展示RSK2激酶野生型基因组序列,同时指出ZFN结合位点。在底部展示携带特定突变的寡核苷酸的序列。图2记录了 BamHI位点整合至RSK2激酶基因座中。细胞汇集物用BamHI消化并且片段由凝胶电泳分离。图3描述了在RSK2激酶基因座处携带BamHI位点的分离的单个细胞克隆。将各个克隆中的RSK2基因座进行PCR扩增并且用BamHI消化。图4图示了用来修饰AAVSl基因座的寡核苷酸的设计。在顶部展示AAVSl野生型基因组序列,同时指出ZFN结合位点。下方显示包含位点的有义和反义寡核苷酸的序列。图5显示HindIII位点整合至AAVSl基因座中。上图描述与ZFN和寡核苷酸接触的细胞,并且下图描述与仅寡核苷酸接触的细胞。细胞汇集物用HindIII消化并且片段由凝胶电泳分离。图6描述了在AAVSl基因座处携带HindIII位点的分离的单个细胞克隆。将各个克隆中的AAVSl基因座进行PCR扩增并且用HindIII消化。图7显示使用不同长度的有义寡核苷酸,使HindIII位点整合至AAVSl基因座中。将源自细胞汇集物的基因组DNA进行PCR扩增并且用HindIII消化。沿顶部的数字指每种寡核苷酸的核苷酸长度。M代表标记,G代表GFP ( S卩,无ZFN对照),并且Z代表ZFN。图8描述使用不同长度的反义寡核苷酸,使HindIII位点整合至AAVSl基因座中。将源自细胞汇集物的基因组DNA进行PCR扩增并且用HindIII消化。沿顶部的数字指每种寡核苷酸的核苷酸长度。M代表标记,G代表GFP ( S卩,无ZFN对照),并且Z代表ZFN。 图9显示当ZFN作为与不同长度的寡核苷酸组合的mRNA或DNA递送时,使HindIII位点整合至AAVSl基因座中。将源 自细胞汇集物的基因组DNA进行PCR扩增并且用HindIII消化。沿顶部的数字指每种寡核苷酸的核苷酸长度。R代表RNA,D代表DNA,M代表标记,G代表GFP ( S卩,无ZFN对照),并且Z代表ZFN。图10描述了在AAVS l基因座处包含HindIII位点的细胞的Cel-1测定法。沿顶部的数字指每种寡核苷酸的核苷酸长度。M代表标记,G代表GFP ( S卩,无ZFN对照),并且Z代表ZFN。图11显不同源寡核苷酸与非同源寡核苷酸用于在AAVSl基因座处整合HindIII位点的用途。1,8=有义,单链;2,9=反义,单链;3,10=有义加反义;4=有义,单链(2x) ;5,11=双链(预退火);6,12=仅寡核苷酸(无ZFN)和7=野生型。图12显示用单链DNA寡核苷酸(ssODN)和ZFN在特定基因座处靶向缺失
0.1-1OOkb基因组DNA。图12A显示在ZFN切割位点5’的缺失。图12B显示在ZFN切割位点3’的缺失。染色体序列中的远端缺失端点区域命名为I,并且在靶向的切割位点附近的ZFN结合位点命名为II。ssODN供体包含与远端缺失端点区域具有序列同一性的区域(命名为I’)和与靶向的切割位点附近的ZFN结合位点具有序列同一性的区域(命名为II)。图13描述了用单链寡核苷酸和ZFN在K562中AAVSI基因座处靶向缺失基因组DNA的PCR证实结果。标记为“I”的泳道使用同时暴露于寡核苷酸和ZFN的K562细胞,并且因此PCR片段源自缺失等位基因。标记为“2”的泳道使用仅暴露于寡核苷酸但不暴露于ZFN的K562细胞,并且所产生的PCR片段是野生型等位基因(无缺失)。标记为“3”的泳道使用仅暴露于ZFN的K562细胞,并且因此PCR产物也指示野生型等位基因的片段。在图13中的每个泳道组上方展示野生型等位基因PCR片段和缺失等位基因PCR片段的预期大小,并且展示和验证了使用单链寡核苷酸和ZFN时约0.1kb,0.5kb、l.0kbU.5kb、2kb、2.5kb、3.0kb、3.5kb、4.0kb、4.5kb、5.0kb、10.0kb、10.2kb、20.0kb、20.2kb、50kb 和 IOOkb 的革巴向基因组DNA缺失。在泳道组当中,带有星号的组表示ZFN切割位点的3’缺失;无星号
的组表示ZFN切割位点的5’缺失;带有双星号“**”的一个组表示ZFN切割位点的5’和3’缺失。“M”代表DNA标记。图14展示了用单链寡核苷酸和ZFN在不同细胞类型中AAVSl基因座处靶向缺失5kb基因组DNA的PCR证实结果。缺失等位基因PCR片段在包括K562、HCT116、U20S、A549、HEK293、HepG2和MCF7细胞的全部细胞样品中均具有预期大小303bp。“I”代表“寡核苷酸+ZFN"; “ 2 ”代表“仅寡核苷酸”;“ 3 ”代表“仅ZFN” ;并且“M”代表DNA标记。预期的野生型等位基因PCR片段是5303bp,并且预期缺失等位基因PCR片段是303bp。图15描述了用单链寡核苷酸和ZFN在K562中IRK4、RSK2和RSK4基因座处靶向缺失基因组DNA的PCR证实结果。缺失等位基因PCR片段在全部细胞样品中对于IRAK4基因座、RSK2基因座和RSK4基因座分别具有预期大小334bp、281bp和190bp。“I”代表“寡核苷酸+ZFN” ; “ 2 ”代表“仅寡核苷酸” ;“ 3 ”代表“仅ZFN” ;并且“M”代表DNA标记。图16显示用ssDNA寡核苷酸和ZFN在细胞中实现同时靶向基因组缺失和插入的示例性方案。远端缺失端点区域命名为I,并且在靶向的切割位点附近的ZFN结合位点命名为II。ssODN供体包含与远端缺失端点区域具有序列同一性的区域(命名为I’)、与靶向的切割位点附近的ZFN结合位点具有序列同一性的区域(命名为II)和1xP序列(命名为III)。正向引物㈧和反向引物⑶位于区域I和II的侧面并且可以用来验证靶向缺失。引物C包含在ZFN右结合臂和相邻基因组DNA的连接部位处的核苷酸,从而正向引物(A)和反向引物C可以用来验证靶向插入。图17显示使用图16中所示的引物A和B,PCR验证5kb基因组序列的靶向缺失,所述靶向缺失产生从缺失等位基因中预期的303bp PCR片段(泳道6:AAVS1-ZFN和AAVS1-5kb ssODN)。使用引物A和C,1xP位点的靶向插入的PCR验证由泳道10中具有预期大小的PCR片段显示。泳道I和2代表DNA标记;泳道3代表GFP ;泳道4代表仅AAVSIZFN(mRNA);泳道5代表仅寡核苷酸供体;泳道6代表AAVS1ZFN+寡核苷酸供体;泳道7代表GFP ;泳道8代表AAVSIZFN(mRNA);泳道9代表仅寡核苷酸供体;泳道10代表AAVS1ZFN+寡核苷酸供体。图18展示 5’连接序列(SEQ ID NO: 29)和证实供体序列在5’连接处整合的序列分析。高亮绿色的序列代表用于PCR扩增的引物(小写字母不来自测序结果),黑色字母的序列代表寡核苷酸供体中不存在的小鼠Rosa26质粒序列;蓝色字母的序列代表寡核苷酸供体中的小鼠Rosa26质粒序列;红色字母的序列代表寡核苷酸供体中的AAVSl序列;粉红色字母的序列代表寡核苷酸供体中不存在的AAVSl序列。图19展示3’连接序列(SEQ ID NO:30)和证实供体序列在3’连接处整合的序列分析。高亮绿色的序列代表用于PCR扩增的引物(小写字母不来自测序结果),黑色字母的序列代表寡核苷酸供体中不存在的小鼠Rosa26质粒序列;蓝色字母的序列代表寡核苷酸供体中的小鼠Rosa26质粒序列;红色字母的序列代表寡核苷酸供体中的AAVSl序列;粉红色字母的序列代表寡核苷酸供体中不存在的AAVSl序列。图20显示仅暴露于两种ZFN(Z)、两种寡核苷酸供体(O)和质粒供体(D)的克隆(Z+0+D)包含了表示供体序列整合的大小390bp的5’连接部位PCR片段(图20A)和大小309bp的3’连接部位PCR片段(图20B)。图21描述了(与靶向序列的)寡核苷酸序列同一性和寡聚物介导的IOkb基因组序列靶向缺失的效率的关系。IOkb缺失的效率由SYBR Green实时PCR测量。1=100%同一性;2=98%同一性;3=90%同一性;4=50%同一性;5=阴性对照。图22展示由ssDNA寡核苷酸和ZFN介导的通用质粒插入方法的方案。ZFN产生双链断裂(DSB)。用与ZFN切割位点互补的区段,两个寡核苷酸供体随后结合DSB末端。两个寡核苷酸供体的5’末端与所需质粒序列的任一末端处的质粒主链序列(通用或非通用)的同源性造成侵入质粒供体中。当使用供体质粒解开DSB时,在ZFN切割位点处引入和插入来自供体质粒的所需序列。发明详述本公开提供了使用靶向核酸内切酶和单链核酸编辑内源染色体序列的方法。具体而言,该靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂,并且这种单链核酸包含与染色体序列在靶向切割位点的至少一侧上具有显著序列同一性的区域。使用单链核酸,通过同源重组修复法(homology-directed repair process)修复由革巴向核酸内切酶引入的双链断裂,从而染色体序列与单链核酸的序列交换,因而编辑所述染色体序列。编辑的染色体序列可以包含至少一个核苷酸的插入、至少一个核苷酸的缺失、至少一个核苷酸的置换或其组合。本文中还提供试剂盒,其包含使用本文中公开的方法编辑染色体序列的适宜试剂。(I)用于编辑染色体序列的方法本公开的一个方面提供一种用于编辑细胞中至少一种内源染色体序列的方法。这种方法包括向细胞中引入(a)至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸,所述靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂,和(b)至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一性的序列。该方法还包括将所述细胞在如此条件下维持,从而通过同源重组修复法修复由靶向核酸内切酶引入的双链断裂,从而所述染色体序列与所述单链核酸至少之一的序列交换,因而编辑这个染色体序列。下文详细描述该方法的组成部分。(a)靶向核酸内切酶该方法包括向细胞中引入至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸。靶向核酸内切酶是识别和结合特定双链染色体DNA序列并且在染色体序列中靶向的切割位点处引入双链断裂的实体。靶向核酸内切酶可以是天然存在的蛋白质或工程化蛋白质。可选地,靶向核酸内切酶可以不含蛋白质(例如,人工靶向DNA双链断裂诱导剂)。靶向核酸内切酶的类型可以并且将变化。在一些实施方案中,靶向核酸内切酶可以是锌指核酸酶。在其他实施方案中,靶向核酸内切酶可以是大范围核酸酶(meganuclease)或归巢核酸内切酶。在其他实施方案中,革巴向核酸内切酶可以是转录激活物样效应物(TALE)-核酸酶。在其他实施方案中,靶向核酸内切酶可以是位点特异性核酸酶。在其他实施方案中,靶向核酸内切酶可以是人工靶向DNA双链断裂诱导剂。(i)锌指核酸酶在一个实施方案中,引入细胞中的靶向核酸内切酶可以是锌指核酸酶(ZFN)。一般而言,锌指核酸酶包含DNA结合作用结构域(即,锌指)和切割结构域(即,核酸酶),二者均在下文描述。锌指结合结构 域。锌指结合结构域可以经工程化以识别并且结合选择的任何核酸序列。见例如,Beerli 等人,(2002)Nat.Biotechnol.20:135-141 ;Pabo 等人,(2001)Ann.Rev.Biochem.70:313-340 ;Isalan 等人,(2001)Nat.Biotechnol.19:656-660 ;Segal等人,(2001) Curr.0pin.Biotechnol.12:632-637 ;Choo 等人,(2000) Curr.0pin.Struct.Biol.10:411-416 ;Zhang 等人,(2000)J.Biol.Chem.275(43):33850-33860 ;Doyon 等人,(2008)Nat.Biotechnol.26:702-708 ;和 Santiago 等人,(2008)Proc.Natl.Acad.Sc1.USA105:5809-5814。与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新的结合特异性。工程化方法包括但不限于理性设计和多种类型的选择。理性设计例如使用包含双联体、三联体和/或四联体核苷酸序列和独立锌指氨基酸序列的数据库,其中每个双联体、三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关。见例如,美国专利N0.6,453,242和6,534,261,所述专利的公开内容以引用方式整体并入本文。作为实例,美国专利6,453,242中描述的算法可以用来设计靶向预选择的序列的锌指结合结构域。替代性方法,如使用非简并性识别密码表的理性设计也可以用来设计靶向特定序列的锌指结合结构域(Sera等人,(2002)Biochemistry41:7074-7081)。公共可用的基于网页的用于鉴定DNA序列中潜在祀位点并且设计锌指结合结构域的工具可以分别在http://www.zincfingertools.0rg和http://bindr.gdcb.1astate.edu/ZiFiT/(Mandell 等人,(2006)Nuc.Acid Res.34:W516-ff523 ;Sander 等人,(2007)Nuc.Acid Res.35:W599-ff605)找到。可以将锌指结合结构域设计成识别并且结合约3个核苷酸至约21个核苷酸长度或优选地约9个至约18个核苷酸长度的DNA序列。通常,本文中公开的锌指核酸酶的锌指结合结构域包含至少3个锌指识别区(即,锌指)。在一个实施方案中,锌指结合结构域可以包含4个锌指识别区。在另一个实施方案中,锌指结合结构域可以包含5个锌指识别区。在又一个实施方案中,锌指结合结构域可以包含6个锌指识别区。可以将锌指结合结构域设计成与任何适合的靶DNA序列结合。见例如,美国专利N0.6,607,882,6, 534,261和6,453,242,所述专利的公开内容以引用方式整体并入本文。选择锌指识别区的示例性方法可以包括噬菌体展示和双杂交系统,并且这些方法在美国专利 N0.5,789,538,5, 925,523,6, 007,988,6, 013,453,6, 410,248,6, 140,466、6,200,759 和 6,242,568,以及 W098/37186、W098/53057、W000/27878、W001/88197 和GB2, 338, 237中公开,所述的每个专利以引`用方式整体并入本文。此外,已经例如在W002/077227中描述了增强锌指结合结构域的结合特异性。锌指结合结构域和用于设计和构建融合蛋白(和编码它们的多核苷酸)的方法是本领域技术人员已知的并且在美国专利申请公开N0.20050064474和20060188987中详细描述,所述的每个专利以引用方式整体并入本文。锌指识别区和/或多指状锌指蛋白可以使用适合的接头序列(包括例如,5个或更多个氨基酸长度的接头)连接在一起。对于6个或更多个氨基酸长度的接头序列的非限制性实例,见,美国专利N0.6,479,626,6, 903,185和7,153,949,所述专利的公开内容以引用方式整体并入本文。本文所述的锌指结合结构域可以包括在蛋白质的各个锌指之间的合适接头的组合。在一些实施方案中,锌指核酸酶还可以包含核定位信号或序列(NLS)。NLS是促进靶向锌指核酸酶蛋白至胞核中以便在染色体中靶序列处引入双链断裂的氨基酸序列。核定位信号是本领域已知的。见例如,Makkerh等人,(1996)Current Biology6:1025-1027。切割结构域。锌指核酸酶还包括切割结构域。锌指核酸酶的切割结构域部分可以从任何核酸内切酶或核酸外切酶获得。可以源自其中的切割结构域的核酸内切酶的非限制性实例可以源自包括但不限于限制性核酸内切酶和归巢核酸内切酶。见例如,2002-2003目录,New England Biolabs, Beverly, Mass.;和 Belfort 等人,(1997) Nucleic AcidsRes.25:3379-3388或www.neb.com。切割DNA的另外的酶是已知的(例如,SI核酸酶、绿豆核酸酶、胰DNA酶1、微球菌核酸酶、酵母HO核酸内切酶)。还见Linn等人,(编著)Nucleases, Cold Spring Harbor Laboratory Press, 1993。可以使用这些酶(或其功能性片段)的一种或多种作为切割结构域的来源。切割结构域也可以源自如上文所述的其切割活性需要二聚化的酶或其部分。可能需要两种锌指核酸酶用于切割,因为每种核酸酶包含活性酶二聚体的单体。可选地,单一锌指核酸酶可以包含产生活性酶二聚体的两种单体。如本文所用,“活性酶二聚体”是能够切割核酸分子的酶二聚体。这两个切割单体可以源自相同的核酸内切酶(或其功能性片段),或每个单体可以源自不同的核酸内切酶(或其功能性片段)。当两个切割单体用来形成活性酶二聚体时,这两种锌指核酸酶的识别位点优选地如此布置,从而两种锌指核酸酶与其相应识别位点的结合将切割单体以允许切割单体(例如,通过二聚化)彼此形成活性酶二聚体的空间取向安置。作为结果,识别位点的近端面可以由约5个至约18个核苷酸隔开。例如,近端面可以由约5、6、7、8、9、10、11、12、13、14、15、
16、17或18个核苷酸隔开。然而,将理解,任何整数数字的核苷酸或核苷酸对可以间插在两个识别位点之间(例如 ,约2个至约50个或更多个核苷酸对)。锌指核酸酶(例如本文中详述的那些)的识别位点的近端面可以由6个核苷酸隔开。通常,切割部位存在于识别位点之间。限制性核酸内切酶(限制性酶)存在于许多物种中并且能够序列特异结合于DNA(在识别位点)并在结合位点处或其附近切割DNA。某些限制性酶(例如,IIS型)在离开识别位点的部位切割DNA并且具有可分开的结合结构域和切割结构域。例如,IIS型酶Fok I在一条链上距其识别位点9个核苷酸处并且在另一条链上距其识别位点13个核苷酸处催化DNA的双链切割。见例如,美国专利N0.5,356,802,5, 436,150和5,487,994 ;以及Li 等人,(1992) Proc.Natl.Acad.Sc1.USA89:4275-4279 ;Li 等人,(1993) Proc.Natl.Acad.Sc1.USA90:2764-2768 ;Kim 等人,(1994a)Proc.Natl.Acad.Sc1.USA91:883-887 ;Kim 等人,(1994b) J.Biol.Chem.269:31, 978-31,982。因此,锌指核酸酶包含来自至少一种IIS型限制性酶的切割结构域和可以经工程化或可以未经工程化的一个或多个锌指结合结构域。示例性IIS型限制性酶例如在国际公开W007/014275中描述,所述专利的公开内容以引用方式整体并入本文。另外的限制性酶还含有可分开的结合结构域和切割结构域,并且这些限制性酶还由本公开涵盖。见例如,Roberts等人,(2003)Nucleic Acids Res.31:418-420。一种示例性IIS型限制性酶(其切割结构域与结合结构域可分开)是Fok10这种特定的酶作为二聚体有活性(Bitinaite等人,(1998)Proc.Natl.Acad.Sc1.USA95:10,570-10,575)。因此,出于本公开的目的,将用于锌指核酸酶中的Fok I酶部分视为切割单体。因此,对于使用Fokl切割结构域的靶向切割双链,各自包含Fokl切割单体的两种锌指核酸酶可以用来重构活性酶二聚体。可选地,也可以使用含有锌指结合结构域和两个Fok I切割单体的单一多肽分子。在某些实施方案中,切割结构域可以包含最小化或防止同型二聚化的一个或多个工程化切割单体,例如,在美国专利公开N0.20050064474、20060188987和20080131962中描述,所述每个专利的公开内容以引用方式整体并入本文。以非限制性实例方式,在FokI的位置 446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537 和 538 处
的氨基酸残基是影响Fok I切割半结构域二聚化的全部靶。形成专性异二聚体的示例性工程化的FokI切割单体包括其中第一切割单体在Fok I的氨基酸残基位置490和538处包含突变并且在氨基酸残基位置486和499处包含突变的第二切割单体。因此,在一个实施方案中,在氨基酸位置490处的突变将Glu(E)替换为Lys(K);在氨基酸位置538处的突变将Iso (I)替换为Lys (K);在氨基酸位置486处的突变将Gln (Q)替换为Glu (E);在氨基酸499处的突变将Iso (I)替换为Lys (K)。具体而言,通过以下方式制备工程化切割单体:将一个切割单体中位置490处的E突变成K和538位置处的I突变成K以产生命名为“E490K:1538K”的工程化切割单体,并且将另一个切割单体中位置486处的Q突变成E和499位置处的I突变成L以产生命名为“Q486E:1499L”的工程化切割单体。上述的工程化切割单体是其 中最小化或消除异常切割作用的专性异二聚体突变体。可以使用适合的方法制备工程化切割单体,例如通过如美国专利公开N0.20050064474中所述的野生型切割单体(Fok I)的定点诱变制备。(ii)其他靶向核酸内切酶在另一个实施方案中,靶向核酸内切酶可以是大范围核酸酶。大范围核酸酶以大识别位点(即,通常约12碱基对至约40碱基对的识别位点)为特征的内切脱氧核糖核酸酶。由于这种要求,这种识别位点通常仅在任何给定的基因组中出现一次。在大范围核酸酶当中,归巢核酸内切酶的LAGLIDADG家族已经变成用于研究基因组和基因组工程的有价值工具。可以通过使用本领域技术人员熟知的技术修饰其识别序列,将大范围核酸酶靶向特定的染色体序列。在又一个实施方案中,靶向核酸内切酶可以是转录激活物样效应物(TALE)核酸酶。TALE是来自植物病原体黄单胞菌属(Xanthomonas)的转录因子,其可以轻易地经工程化以结合新的DNA靶。TALE或其截短形式可以与核酸内切酶(如Fok I)的催化性结构域连接,以产生称作TALE核酸酶或TALEN的靶向核酸内切酶。在又一个实施方案中,靶向核酸内切酶可以是位点特异性核酸酶。具体而言,位点特异性核酸酶可以是其识别序列很少在基因组中出现的“稀有切割”核酸内切酶。优选地,位点特异性核酸酶的识别序列仅在基因组中出现一次。在又一个实施方案中,靶向核酸内切酶可以是人工靶向DNA双链断裂诱导剂(也称作人工限制性DNA切割物)。例如,人工靶向DNA双链断裂诱导剂可以包含切割与靶向切割位点互补的DNA和至少一个寡核苷酸的金属/螯合剂复合物。因此,人工靶向DNA双链断裂诱导剂不含有任何蛋白质,金属/螯合剂复合物的金属可以是铈、镉、钴、铬、铜、铁、镁、锰、锌等。金属/螯合剂复合物的螯合剂可以是EDTA、EGTA, BAPTA等。在一个优选实施方案中,金属/螯合剂复合物可以是Ce (IV) /EGTA。在另一个优选实施方案中,人工靶向DNA双链断裂诱导剂可以包括Ce (IV)/EGTA的复合物和假互补性肽核酸(PNA)的两条链(Katada 等人,Current Gene Therapy, 2011, 11 (I):38-45)。(iii)编码靶向核酸内切酶的核酸在一些实施方案中,可以将靶向核酸内切酶作为核酸引入细胞中,其中所述细胞随后表达并产生靶向核酸内切酶。编码靶向核酸内切酶的核酸可以是DNA或RNA。RNA可以信使RNA,并且mRNA可以是5’加帽的、聚腺苷酸化的或两者。通常,编码靶向核酸内切酶的核酸将与启动子控制区可操作地连接。该控制区域可以是组成型或诱导型的。可以将编码靶向核酸内切酶的核酸(及其连接的控制区)作为载体如质粒等引入细胞中。可选地,可以将编码靶向核酸内切酶的核酸(及其连接的控制区)作为线形分子引入细胞中。(b)单链核酸(i) 一般特性该方法还包括向细胞中引入至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一'I"生的区域。在一些实施方案中,将一条单链核酸引入细胞中。在其他实施方案中,将两条单链核酸引入细胞中。在其他实施方案中,将三条或更多条单链核酸引入细胞中。短语“显著序列同一性”意指寡核苷酸与靶向染色体序列具有至少约75%序列同一性。在一些实施方案中,寡核苷酸可以与靶向染色体序列具有约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%序列同一性。另外,单链核酸通常与靶向切割位点的至少一侧上的至少约10个核苷酸具有显著序列同一性。在一些实施方案中,单链核酸可以与靶向切割位点的至少一侧上的约15个核苷酸、约20个核苷酸、约25个核苷酸、约30个核苷酸、约40个核苷酸、约50个核苷酸、约100个核苷酸或多于100个核苷酸具有显著序列同一'I"生。引入细胞中的单链核酸的长度可以并且将变化。例如,单链核酸的范围可以为约20个核苷酸长度直至约200,000个核苷酸长度。在各个实施方案中,单链核酸的范围可以是约20个核苷酸至约100个核苷酸长度、约100个核苷酸至约1000个核苷酸长度、约1000个核苷酸至约10,000个核苷酸长度、约10,000个核苷酸至约100,000个核苷酸长度或约100,000个核苷酸至约200,000个核苷酸长度。在一些实施方案中,单链核酸可以是线形的。在其他实施方案中,单链核酸可以是环形的(例如,通过本领域 技术人员已知的噬菌体方法制备)。单链核酸可以相对于目的染色体序列是有义或反义的。单链核酸的组成可以并且将变化。核酸的核苷酸可以是脱氧核糖核苷酸、核糖核苷酸或其组合。核苷酸可以是标准核苷酸(即,腺苷、鸟苷、胞苷、胸苷和尿苷)或核苷酸类似物。核苷酸类似物指具有修饰的嘌呤或嘧啶碱基或修饰的核糖部分的核苷酸。核苷酸类似物可以是天然存在的核苷酸(例如,肌苷)或非天然存在的核苷酸。对核苷酸的糖或碱基部分的修饰的非限制性实例包括添加(或移除)乙酰基、氨基、羧基、羧甲基、羟基、甲基、磷酰基和巯基以及将碱基的碳和氮原子用其他原子置换(例如,7-氮杂嘌呤类)。核苷酸类似物也包括双脱氧核苷酸、2’-0_甲基核苷酸、锁核酸(LNA)、肽核酸(PNA)和吗啉代。单链核酸的核苷酸可以通过磷酸二酯键、硫代磷酸酯键、磷酰亚胺键、磷酰二胺键或其组合连接。在优选的实施方案中,单链核酸包含脱氧核糖核苷酸。(ii)优选的单链核酸在一个实施方案中,单链核酸可以包含与靶向切割位点的上游侧处的染色体序列具有显著序列同一性的第一区域和与靶向切割位点的下游侧处的染色体序列具有显著序列同一性的第二区域(例如,见图1和图4)。在这个实施方案的各种重复中,单链核酸还可以包含相对于染色体序列的至少一个核苷酸变化。例如,单链核酸将通常包含至少一个核苷酸的置换、至少一个核苷酸的缺失、至少一个核苷酸的插入或其组合。在各种重复中,单链核酸可以包含I个、2个、3个、4个、5个或更多个核苷酸变化。作为这些核苷酸变化的结果,编辑的染色体序列可以包含改变的序列或小突变,从而产生修饰的基因产物,不产生基因产物等。在替代性实施方案中,单链核酸可以包含侧面为第一和第二区域的外源序列,所述第一和第二区域与靶向切割位点的任一侧具有显著序列同一性(如上文详细)。因此,编辑的染色体序列可以包含整合的外源核酸序列。如本文所用,术语“外源”指正常情况下不在这个染色体位置存在的任何序列。例如,外源序列可以是来自另一种生物体的“基因”、来自相同生物体的“基因”的另外的拷贝、人工序列、编码报道分子的序列等。在另一个实施方案中,单链核酸可以包含与靶向切割位点的一侧上的染色体序列具有显著序列同一性的第一区域和与处于靶向切割位点远端的染色体序列具有显著序列同一性的第二区域(见图12)。远端染色体序列可以靶向切割位点的上游或下游;并且远端染色体序列可以与靶向切割位点相距约20碱基对至约1,000, 000碱基对存在。例如,远端染色体序列可以距靶向 的切割位点约0.1,0.3、1、3、10、30、100、300或1,000千碱基对(上游或下游)。作为结果,编辑的染色体序列可以包含直至约1,000,000碱基对的缺失。在这个实施方案的一种重复中,单链核酸可以包含与靶向切割位点的下游侧的染色体序列具有显著序列同一性的第一区域和与位于靶向切割位点上游的远端染色体序列具有显著序列同一性的第二区域,其中编辑的染色体可以相对于靶向切割位点包含上游(或5’)缺失。在这个实施方案的另一种重复中,单链核酸可以包含与靶向切割位点的上游侧的染色体序列具有显著序列同一性的第一区域和与位于靶向切割位点下游的远端染色体序列具有显著序列同一性的第二区域,其中编辑的染色体可以相对于靶向切割位点包含下游(或3’)缺失。在又一个实施方案中,单链核酸可以包含侧面为第一区域和第二区的外源序列,所述第一区域与靶向切割位点的一侧上的染色体序列具有显著序列同一性,所述第二区域与处于靶向切割位点远端的染色体序列具有显著序列同一性的第二区域(如上文详述)。在这个实施方案中,编辑的染色体序列可以包含缺失,以及外源序列在靶向的切割位点处的整合(见图16)。外源序列的同一性可以并且将变化。例如,外源序列可以是来自另一种生物体的“基因”、来自相同生物体的“基因”的另外的拷贝、报道分子等。(C)任选的供体多核苷酸在某些实施方案中,该方法还包括将至少一种供体多核苷酸引入细胞中。供体多核苷酸包含用于在靶向的切割位点处整合至染色体序列中的序列,其中用于整合的序列侧面为第一序列和第二序列,所述序列的每一种与单链核酸的一部分具有显著序列同一性。因此,将供体多核苷酸连同第一单链核酸和第二单链核酸(和至少一种靶向核酸内切酶)一起引入。第一单链核酸包含与靶向切割位点的上游侧具有显著序列同一性的第一部分和与供体多核苷酸中的第一序列具有显著序列同一性的第二部分。第二单链核酸包含与靶向切割位点的下游侧具有显著序列同一性的第一部分和与供体多核苷酸中的第二序列具有显著序列同一性的第二部分。供体多核苷酸可以包含脱氧核糖核苷酸、核糖核苷酸、修饰的核苷酸、核苷酸类似物等。另外,供体多核苷酸可以是环形或线形的。一般地,供体多核苷酸将是DNA。例如,供体多核苷酸可以是DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体等。供体多核苷酸还可以包含复制起点、选择标记、多克隆位点等。供体多核苷酸的大小可以并且将变化。例如,供体核苷酸的范围可以是约I千碱基(kb)至约200kb。在一个实施方案中,供体多核苷酸可以包含约IOOkb的编码目的蛋白的人DNA序列的外显子和内含子序列。(d)细胞该方法包括将上文描述的靶向核酸内切酶分子和核酸引入细胞中。多种细胞适用于所述方法中。通常,细胞将是真核细胞或单细胞真核生物体。在一些情况下,细胞可以是培养的细胞、原代细胞或永生细胞。合适的细胞包括真菌或酵母,如毕赤酵母(Pichia)、酵母(Saccharomyces)或裂殖酵母(Schizosaccharomyce);昆虫细胞如来自草地夜蛾(Spodoptera frugiperda)的 SF9 细胞或来自黑腹果妮(Drosophila melanogaster)的 S2细胞;和动物细胞,如小鼠、大鼠、仓鼠、非人灵长类或人细胞。示例性细胞是哺乳动物细胞。哺乳动物细胞可以是原代细胞。通常,可以使用对双链断裂敏感的任何原代细胞。这些细胞可以是多种细胞类型的,例如,成纤维细胞、成肌细胞、T或B细胞、巨噬细胞、上皮细胞等。当使用哺乳动物细胞系时,细胞系可以是任何建立的细胞系或未曾描述过的原代细胞系。细胞系可以是贴壁的或非贴壁,或可以使用本领域技术人员已知的标准技术,在刺激贴壁、非贴壁或器官型生长的条件下培育细胞系。合适的哺乳动物细胞系的非限制性实例包括中国仓鼠卵巢(CHO)细胞、由SV40转化的猴肾CVI系(C0S7)、人胚肾系293、幼仓鼠肾细胞(BHK)、小鼠Sertoli细胞(TM4)、猴肾细胞(CV1-76)、非洲绿猴肾细胞(VERO)、人宫颈癌细胞(HeLa)、犬肾细胞(MDCK)、buffalo大鼠肝细胞(BRL3A)、人肺细胞(W138)、人肝细胞Ofep G2)、小鼠乳腺瘤细胞(MMT)、大鼠肝瘤细胞(HTC)、HIH/3T3细胞、人U2-0S骨肉瘤细胞、人A549细胞、人K562细胞、人HEK293细胞、人HEK293T细胞、人HCT116细胞、人MCF-7细胞和TRI细胞。对于哺乳动物细胞系的广泛列表,本领域普通技术人员可以参考美国典型培养物保藏中心目录(ATCC' Mamassas, VA)。在其他实施方案中,细胞可以是干细胞。合适的干细胞包括而不限于胚胎干细胞、ES样干细胞、胎儿干细胞、 成人干细胞、多潜能干细胞、诱导的多潜能干细胞、多能干细胞、寡能干细胞和单能干细胞。在其他实施方案中,细胞可以是单细胞胚。胚可以是脊椎动物或无脊椎动物的。合适的脊椎动物包括哺乳动物、鸟、爬行类、两栖类和鱼类。合适的哺乳动物的实例包括而不限于啮齿类、伴侣动物、家畜和非灵长类。啮齿类的非限制性实例包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。合适的伴侣动物包括但不限于猫、犬、兔、刺猬和雪貂。家畜的非限制性实例包括马、山羊、羊、猪、牛、骆驼和羊驼。合适的非灵长类包括但不限于僧帽猴、黑猩猩、狐猴、猕猴、狨猴、絹毛猴、蜘蛛猴、松鼠猴和绿猴。鸟的非限制性实例包括鸡、火鸡、鸭和鹅。可选地,动物可以是无脊椎动物如昆虫、线虫等。昆虫的非限制性实例包括果蝇和蚊子。(e)递送至细胞上文描述的靶向核酸内切酶分子和核酸可以由多种手段引入细胞中。合适的递送手段包括微量注射法、电穿孔法、声致穿孔法(sonoporation)、基因枪法、磷酸钙介导转染、阳离子转染法、脂质体转染、树状物转染法、热休克转染法、核转染法转染法、磁性转染法、脂质体转染法、刺穿转染(impalefection)、光学转染法、专利试剂增强的核酸摄取和借助脂质体、免疫脂质体、病毒体或人工病毒粒的递送法。在一个实施方案中,靶向核酸内切酶分子和核酸可以由核转染法引入细胞中。在另一个实施方案中,靶向核酸内切酶分子和核酸可以由微量注射法引入细胞(例如,单细胞胚)中。可以将靶向核酸内切酶分子和核酸微量注射至细胞的胞核或细胞质中。在其中将多于一种祀向核酸内切酶分子和多于一种单链核酸引入细胞的实施方案中,可以同时或依次地引入分子。例如,可以同时引入分别对靶向切割位点特异的靶向核酸内切酶分子以及相应的单链核酸。可选地,可以依次引入每种靶向核酸内切酶分子以及相应的单链核酸。可以类似地引入任选的供体多核苷酸。靶向核酸内切酶分子与单链核酸的比率可以并且将变化。通常,靶向核酸内切酶分子与核酸的比率范围可以是约1:10至约10:1。在各个实施方案中,靶向核酸内切酶分子与核酸的比率可以是约 1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。在一个实施方案中,该比率可以是约1:1。(f)培养细胞该方法还包括将所述细胞在适宜的条件下维持,从而可以使用单链核酸,通过同源重组法修复由靶向核酸内切酶引入的双链断裂,从而编辑该染色体序列。在其中将编码靶向核酸内切酶的核酸引入细胞的实施方案中,该方法包括将细胞在适宜的条件下维持,从而细胞表达靶向核酸内切酶。通常,细胞将在对于细胞的适宜条件下维持。合适的细胞培养物条件是本领域熟知的并且例如在 Santiago 等人,(2008)PNAS105:5809-5814 ;Moehle 等人,(2007)PNAS104:3055-3060 ;Urnov 等人,(2005) Nature435:646-651 ;和 Lombardo 等人(2007)Nat.Biotechnology25:1298-1306中描述。本领域技术人员理解,用于培养细胞的方法是本领域已知的并且可以并且将根据细胞类型变化。在全部情况下,常规优化可以用来确定用于特定细胞类型的最好技术。

在其中细胞是单细胞胚的实施方案中,胚可以在体外培养(例如,在细胞培养中)。一般而言,将胚在适宜的温度并且在适宜的培养基中伴随必需o2/co2比率的情况下培养,以允许修复双链断裂并且允许胚胎发育。培养基的合适的非限制性实例包括M2、M16、KSOM、BMOC和HTF培养基。技术人员将理解培养条件可以并且将根据胚的物种变化。在全部情况下,常规优化可以用来确定用于特定胚胎物种的最好培养条件。在一些情况下,也可以通过将胚胎转移至雌性宿主的子宫中,在体内培养胚胎。通常而言,雌性宿主来自与胚胎相同或相似的物种。优选地,雌性宿主是假孕的。准备假孕雌性宿主的方法是本领域已知的。另外,将胚胎转移至雌性宿主中的方法是已知的。在体内培养胚胎允许胚胎发育并且可以导致源自该胚胎的动物活产。在所述方法的这个步骤期间,靶向核酸内切酶(在一些情况下,此酶从引入的编码的靶向核酸内切酶的核酸中表达)识别、结合和产生在染色体序列中靶向切割位点处的双链断裂。染色体序列中的双链断裂通过同源重组用单链核酸修复,从而核酸序列与染色体序列交换。核酸序列可以物理地整合或,可选地,可以使用核酸序列作为修复断裂的模板,导致编辑染色体序列。靶向编辑染色体序列的频率可以并且将根据多种因素变化。在一些实施方案中,编辑的频率可以是大于约0.01%,0.03%,0.1%、0.3%、1%、3%、10%或30%。可以使用本领域熟知的技术分离单一细胞克隆,其包含编辑的染色体序列。本领域技术人员熟悉用于产生对所编辑染色体序列纯合的细胞的方法。换而言之,细胞可以对所编辑的染色体序列是杂合或纯合的。编辑的染色体序列可以包含一个或多个点突变(即,其中将一个核苷酸置换为另一个核苷酸)、一个或多个缺失和/或一个或多个插入。点突变可以是错义突变、无义突变或沉默突变。缺失的范围可以是约I碱基对至约500千碱基对,并且插入的范围可以是约I碱基对至约200千碱基对。因此,编辑的染色体序列,可以产生修饰的基因产物(即,蛋白质或非编码RNA)。例如,在其中编辑的染色体序列存在于蛋白质编码区内部的实施方案中,所产生的蛋白质可以包含至少一个氨基酸变化。在其他实施方案中,修饰的染色体序列可以产生修饰的非编码RNA或者修饰的染色体序列可以具有改变的调节功能。可选地,编辑的染色体序列可以失活,从而不产生功能性基因产物(或消除调节区的功能)。例如,在其中编辑的染色体序列存在于蛋白质编码区内部的实施方案中,点突变、缺失和/或插入可以引入过早终止密码子、剪接位点连接突变和/或移码突变,从而不产生功能性蛋白质。在其中编辑的染色体序列包含插入的实施方案中,插入的序列可以编码肽、蛋白质、蛋白质结构域、蛋白质片段、蛋白质亚基、蛋白质标签等。可选地,插入的序列可以提供限制性核酸内切酶识别侧、编码非编码RNA、包含微RNA结合位点或作为转录性控制元件发挥作用。(II)包含至少一个编辑的染色体序列的细胞本公开的另一个方面提供了包含至少一个编辑的染色体序列的细胞,其中所述染色体序列由上文在部分(I)中描述的方法编辑。在上文部分(I) (d)中详述了合适的细胞。(III)试 剂盒又一个方面包括用于编辑细胞中染色体序列的试剂盒。试剂盒包含(a)至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸,其中所述靶向核酸内切酶能够在染色体序列中靶向切割位点处引入双链断裂,和(b)至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一性的第一部分。因此,试剂盒提供了使用由上文在部分(I)中详述的方法编辑染色体序列的手段。该试剂盒还可以包含用于实施所公开的方法以便使用靶向核酸内切酶和单链核酸编辑基因组的一种或多种另外的试剂。试剂盒通常包括带有一个或多个容器的包装物,所述容器装有试剂作为一种或多种独立组合物或任选地作为其中将允许所述试剂的相容性的混合物。试剂盒也可以包含从使用者的观点看可能合乎需要的其他材料,如缓冲液剂、稀释剂、培养基(culture medium)/介质(media)、标准物和/或在加工或实施基因组编辑方法的任何步骤中有用的任何其他材料。本文中提供的试剂盒优选地包括如上文在部分(I)中详述的用于编辑染色体序列的说明书。试剂盒中包括的说明书可以附属于包装材料或可以作为包装物插页包括。虽然说明书一般是书写或打印的材料,但它们不限于此。本公开涵盖能够储存这类说明并将它们传达给终端用户的任何媒介。这类媒介包括但不限于电子储存媒介(例如磁盘、磁带、胶卷、芯片)、光学媒介(例如CD ROM)等。如本文所用,术语“说明书”可以包括提供该说明书的互联网网站地址。
(IV)应用本文中公开的编辑染色体序列的方法可以具有多种应用。在一些实施方案中,该方法可以出于研究目的用来将靶向突变引入目的蛋白,从而可以检查修饰的蛋白质的功能。这种方法也可以用来失活蛋白质编码序列,从而无蛋白质产生,其中可以检查细胞或包含这种细胞的生物体的表型。另外,该方法可以出于研究目的用来调节或失活RNA编码区或转录性控制区。在其他实施方案中,该方法可以用来缺失染色体序列的大区域和/或整合外源核酸序列。在其他实施方案中,本文中公开的方法可以用于临床目的或治疗目的。即,该方法可以用来修复或校正致病基因或染色体序列。作为实例,镰刀形红细胞病可以由单核苷酸变化引起(即,珠蛋白基因中A至T的变化导致β-珠蛋白中谷氨酸盐至缬氨酸的变化)。因而,本公开的方法可以用来在具有镰刀形红细胞性状或疾病的个体的细胞中纠正β_珠蛋白基因中的SNP。类似地,该方法可以用来校正在特定疾病或疾病状态中发挥作用的其他基因或染色体序列中的剪接连接突变、缺失、插入等。除非另外定义,本文中所用的全部技术与科学术语具有如本发明所属领域的技术人员通常理解的含义。以下参考文献为技术人员提供用于本发明中的许多术语的一般定义:Singleton 等人,Dictionary of Microbiology and Molecular Biology (第 2版,1994) ;The Cambridge Dictionary of Science and Technology (Walker 编著,1988);The Glossary of Genetics,第 5 版,R.Rieger 等人(编著),Springer Verlag (1991);以及 Hale 和 Marham, The Harper Collins Dictionary of Biology (1991)。如本文所用,除非另外指明,否则以下术语具有归属于它们的含义。当介绍本公开或其优选实施方案的要素时,冠词“一个(a)”、“一种(an)”、“该(the) ”和“所述”意指存在一个或多个所述要素。术语“包含”、“包括”和“具有”意在是包括性的并且意指可以存在除所列要素之外的另外的要素。术语“编辑”或“基因组编辑”指借以改变特定染色体序列的方法。编辑的染色体序列可以包含至少一个核苷酸的插入、至少一个核苷酸的缺失和/或至少一个核苷酸的置换。编辑的修饰的染色体序列可以编码修饰的基因产物(例如,具有改变的氨基酸序列的蛋白质、具有改变的核苷酸序列的非编码RNA等)、提供修饰的功能(例如,改变的启动子功能、改变的增强子功能等)、可能未能产生基因产物(即,序列未转录和/或没有产生功能性产物)、未能提供调节功能、编码外源序列,或提供新功能(即,作为调节型启动子、诱导型启动子、微RNA结合位点等)。如本文所用,术语“内源的”指相对于细胞为天然的染色体序列。如本文所用的术语“外源”指正常情况下不在特定染色体位置存在的核酸序列。外源序列可以来自另一种生物体,可以是人造的,或可以是在另一个染色体位置处存在的核酸序列的重复拷贝。如本文所用,“基因”指编码基因产物的DNA区域(包括外显子和内含子),以及调节基因产物产生的全部 DNA区域,无论这类调节序列是否与编码序列和/或转录的序列相邻。因此,基因包括但未必限于启动子序列、终止子、翻译调节序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、交界元件、复制起点、基质附着位点和基因座控制区域。术语“核酸”和“多核苷酸”指处于线形或环状构象的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开的目的,这些术语不得解释为在聚合物的长度方面起限制作用。这些术语可以包括天然核苷酸的已知类似物以及在碱基、糖和/或磷酸酯部分经修饰(例如,硫代磷酸酯主链)的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T发生碱基配对。术语“多肽”和“蛋白质”互换地使用来指氨基酸残基的聚合物。如本文所用,术语“靶位点”或“靶序列”指限定待编辑的染色体序列的部分和锌指核酸酶针对其工程化以识别并且结合的核酸序列,前提是存在用于结合的充分条件。术语“上游”和“下游”指核酸序列中相对于固定位置的定位。上游指相对于该位置为5’(即,靠近链的5’末端)区域并且下游指相对于该位置为3’(即,靠近链的3’末端)区域。用于确定核酸和氨基酸序列同一性的技术是本领域已知的。一般而言,这类技术包括测定基因的mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并且将这些序列与第二核苷酸序列或氨基酸序列比较。也可以测定基因组序列并且以这种方式比较。通常,同一性分别指两个多核苷酸或多肽序列的精确核苷酸对核苷酸或氨基酸对氨基酸对应性。两个或更多个序列(多核苷酸或氨基酸)可以通过确定它们的同一性百分比进行比较。两个序列(无论是核酸 序列或氨基酸序列)的同一性百分比是两个比对的序列之间的精确匹配数目除以较短序列的长度并乘以100。核酸序列的近似比对结果由Smith和 Waterman, Advances in Applied Mathematics2:482-489 (1981)的局部同源性算法提供。通过使用由 Dayhoff, Atlas of Protein Sequences and Structure, M.0.Dayhoff 编著,第 5 增刊 3:353-358,National Biomedical Research Foundation, Washington, D.C.,USA 开发并由 Gribskov,Nucl.Acids Res.14(6):6745-6763(1986)归一化的评分矩阵,这种算法可以适用于氨基酸序列。这种算法确定序列的同一性百分比的示例性实施由Genetics Computer Group (Madison, Wis.)在 “BestFit” 应用中提供。用于计算序列之间同一性百分比或相似性的其他合适程序通常是本领域已知的,例如,另一种比对程序是BLAST,随默认参数使用。例如,使用以下默认参数,可以使用BLASTN和BLASTP:遗传密码=标准;过滤=无;链=两条链;截值=60 ;期望=10 ;矩阵=BL0SUM62 ;描述=50个序列;分选=高评分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein+Spupdate+PIRo可以在GenBank网站上找到这些程序的细节。就本文所述的序列,所需的序列同一性程度的范围是大约80%至100%和其之间的任何整数值。一般而言,序列之间的同一性百分比是至少70-75%、优选地80-82%、更优选地85_90%、甚至更优选地92%、仍更优选地95%并且最优选地98%序列同一性。可选地,可以通过以下方式确定多核苷酸之间的序列相似性程度:在允许共有序列同一性程度的区域之间形成稳定双链体的条件下使多核苷酸杂交,随后用单链特异性核酸酶消化并且确定消化片段的大小。如使用以上方法所测定,当两个核酸序列或两个多肽序列在限定的分子长度范围内显示至少约70%-75%、优选地80%-82%、更优选地85%_90%、甚至更优选地92%、仍更优选地95%和最优选地98%序列同一性时,这两个序列是基本上彼此相似的。如本文所用,基本上相似还指与指定的DNA或多肽序列显示完全同一性的序列。基本上相似的DNA序列可以在Southern杂交实验中例如在如对这个特定系统所限定的严格条件下鉴定。限定适宜杂交条件属于本领技术范围内。见,例如,Samtoook等人,上文;Nucleic Acid Hybridization:A Practical Approach,编者 B.D.Hames 和
S.J.Higgins, (1985) Oxford !Washington, D.C.; IRL Press)。两个核酸片段的选择性杂交可以如下确定。两个核酸分子之间序列同一性的程度影响这些分子之间杂交事件的效率和强度。部分相同的核酸序列将至少部分地抑制完全相同的序列与祀分子的杂交。可以使用本领域熟知的杂交测定法(例如,Southern(DNA)印迹、Northern (RNA)印迹、溶液杂交等,见 Sambrook,等人,Molecular Cloning:ALaboratory Manual,第 2版,(1989)Cold Spring Harbor, N.Y.)评估对完全相同序列的杂交的抑制。可以使用不同程度的选择性,例如,使用从低严格性至高严格性变化的条件实施此类测定法。如果使用低严格性条件,可以使用甚至缺少部分序列同一性程度的第二探针(例如,与靶分子具有小于约30%序列同一性的探针)评估非特异性结合的不存在,从而,在不存在非特异性结合事件的情况下,第二探针将不与靶杂交。当使用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,并且随后通过选择适宜的条件,探针和参考序列选择性地杂交或彼此结合以形成双链体分子。能够在中等严格杂交条件下与参考序列选择性杂交的核酸分子一般地在允许检出至少约10-14个核苷酸长度的靶核酸序列的条件下杂交,其中所述靶核酸序列与选择的核酸探针的序列具有至少大约70%序列同一性。严格杂交条件一般地允许检出至少约10-14个核苷酸长度的靶核酸序列,其中所述靶核酸序列与选择的核酸探针的序列具有大于约90-95%的序列同一性。如本领域已知,可以确定用于探针/参考序列杂交的杂交条件,其中探针和参考序列具有特定的序列同一性程度(见例如,Nucleic Acid Hybridization:A PracticalApproach,编者 B.D.Hames 和 S.J.Higgins, (1985) Oxford !Washington, D.C.; IRL Press)。用于杂交的条件是本领域技术人员熟知的。杂交严格性指杂交条件不利于形成含有错配核苷酸的杂交分子的程度,较高的严格性与较低的错配杂 交分子耐受性相关。影响杂交严格性的因素是本领域技术人员熟知的并且包括但不限于温度、pH、离子强度和有机溶剂(例如,甲酰胺和二甲亚砜)的浓度。如本领域技术人员已知,杂交严格性因较高的温度、较低的离子强度和较低的溶剂浓度而增加。就严格性杂交条件而言,本领域熟知可以通过变化例如以下因素:序列的长度和性质、多个序列的碱基组成、盐和其他杂交溶液组分的浓度、杂交溶液中存在或不存在封闭剂(例如,硫酸葡聚糖和聚乙二醇)、杂交反应温度和时间参数以及变化洗涤条件,使用众多的等同条件来建立具体的严格性。可以遵循本领域的标准方法选择特定的杂交条件集合(见例如,Sambrook,等人,Molecular Cloning:A Laboratory Manua,第 2 版,(1989)Cold SpringHarbor, N.Y.)。
实施例包括以下实施例以说明本发明。实施例1:RSK2激酶的修饰以下实施例详述RSK2激酶基因座的修饰。将寡核苷酸(125nt)设计成将3个不同突变并入RSK2激酶染色体序列。寡核苷酸包含:(I)在ZFN结合位点中防止后续非同源末端接合(NHEJ)的两个点突变,(2) TGC至GTT变化以使Cys转换成ValjP (3)沉默性C至A变化以产生用于克隆筛选的单一 BamHI位点(图1)。使用标准合成方法产生寡核苷酸(例如,无化学修饰)并且用PAGE使其纯化。将一对锌指核酸酶(ZFN)设计成靶向RSK2激酶基因座。将一种ZFN设计成结合序列5’-GTATACATAAAGCTA-3’(SEQ ID N0:6;图1中所示的左侧结合位点),并且将另一种ZFN设计成结合序列5’ -GGAGTTTGCAGTGAAGGTA-3’ (SEQID N0:7 ;图1中所示的右侧结合位点)。人K562细胞用8 μ g编码ZFN的mRNA和0.3nmol寡核苷酸核转染。在孵育两日后,对细胞汇集物分析BamHI位点的存在。如图2中所示,同时暴露于寡核苷酸和ZFN的细胞携带BamHI位点,而单独引入寡核苷酸没有效果。整合频率的范围是约20_30%。将单个细胞克隆分离并且使用qPCR测定法筛选以鉴定携带BamHI位点的那些细胞克隆(见图3)。筛选大约750个克隆并且鉴定出约40个阳性克隆。阳性克隆随后针对靶向的染色体位置周围进行PCR扩增并且用BamHI消化以证实对RSK2激酶染色体基因座的编辑。测序数据揭示,BamHI阳性克隆也对所需的Cys至Val密码子变化为阳性。实施例2 =AAVSl基因座的修饰以下实施例详述了寡核苷酸向AAVSl基因座中引入HindIII位点的用途。图4展示AAVSl基因座的野生型序列和包含HindIII位点的有义和反义寡核苷酸的序列(IOSnt)。使用标准方法产生这些寡核苷酸(例如,无化学修饰)并且用PAGE纯化。将一对ZFN设计成靶向AAVSl基因座。将一种ZFN设计成结合序列5’ -ACCCCACAGTGG-3’ (SEQ ID N0:8 ;图4中所示的左侧结合位点),并且将另一种ZFN设计成结合序列5’-TAGGGACAGGAT-3’ (SEQ ID NO:9 ;图4中所示的右侧结合位点)。使用标准方法,制备加帽、聚腺苷酸化的编码ZFN的mRNA。将ZFN mRNA和包含HindIII位点的寡核苷酸经核转染至1(562、!1(:1'116、似03、4549、册1(293、!1印62或1077细胞中。在孵育一段时间后,对细胞汇集物分析HindIII位点的存在。同时暴露于寡核苷酸和ZFN的细胞含有HindIII片段,其中单独用寡核苷酸处理的那些没有HindIII片段(图5)。将单个细胞A549克隆分离并且使用qPCR测定法筛选以鉴定携带HindIII位点的那些细胞克隆(图6)。筛选大约933个克隆,308个鉴定为阳性。因此,递送HindIII位点的频率是约33%。阳性克隆随后针对靶向的染色体位置周围进行PCR扩增并且用HindIII消化以证实寡核苷酸序列的插入。将亲本PCR产物的位置处显示模糊条带的克隆测序并且证实含有HindIII位点(见图6)。亲本PCR产物的位置周围显示多个强烈条带的克隆假设含有源自NHEJ的小插入。实施例3 =AAVSl基因座的修饰-寡核苷酸的长度为确定较短的寡核苷酸是否可能用来递送HindIII位点至AAVSl基因座,制备长度范围36至106nt的寡核苷酸。例如,106nt寡核苷酸在ZFN切割位点的任一侧上具有50nt序列同一性(即,具有50nt的同源性臂),而同源性臂之间存在一个HindIII位点(6nt)。在下表I中显示寡核苷酸的序列。
权利要求
1.一种用于编辑细胞中至少一种内源染色体序列的方法,所述方法包括: a)向细胞中引入(i)至少一种靶向核酸内切酶或编码靶向核酸内切酶的核酸,所述靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂,和(ii)至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一性的第一部分;和 b)将所述细胞在如此条件下维持,从而通过同源重组法修复由所述靶向核酸内切酶引入的双链断裂,从而所述染色体序列与所述单链核酸的序列交换,因而编辑所述染色体序列。
2.根据权利要求1所述的方法,其中所述单链核酸包含与靶向的切割位点的另一侧上的染色体序列具有显著序列同一性的第二区域。
3.根据权利要求2所述的方法,其中所述单链核酸还包含相对于所述染色体序列的至少一个核苷酸变化,从而编辑的染色体序列包含至少一个核苷酸的插入、至少一个核苷酸的缺失、至少一个核苷酸的置换或其组合。
4.根据权利要求2所述的方法,其中所述单链核酸还包含侧面为所述第一区域和所述第二区域的外源序列,从而所述编辑的染色体序列包含整合的外源序列。
5.根据权利要求1所述的方法,其中所述单链核酸包含与位于靶向的切割位点上游或下游的远端染色体序列具有显著序列同一性的第二区域,从而编辑的染色体序列包含缺失。
6.根据权利要求5所述的方法,其中所述单链核酸还包含侧面为所述第一区域和所述第二区域的外源序列,从而所述编辑的染色体序列还包含整合的外源序列。
7.根据权利要求1所述的方法,其中所述单链核酸是线形或环形的。
8.根据权利要求1所述的方法,其中所述单链核酸具有约20个核苷酸至约100,000个核苷酸的长度。
9.根据权利要求1所述的方法,其中所述单链核酸包含脱氧核糖核苷酸、核糖核苷酸、核糖核苷酸模拟物、修饰的核苷酸、2’ -O-甲基核苷酸、锁核酸、肽核酸或其组合。
10.根据权利要求1所述的方法,其中所述单链核酸包含磷酸二酯键、硫代磷酸酯键、磷酰亚胺键、磷酰二胺键或其组合。
11.根据权利要求1所述的方法,其中所述单链核酸是有义或反义的。
12.根据权利要求1所述的方法,其中所述单链核酸与靶向切割位点的至少一侧上的至少10个核苷酸具有至少约90%序列同一性。
13.根据权利要求1所述的方法,其中所述靶向核酸内切酶是锌指核酸酶、大范围核酸酶、转录激活物样效应物(TALE)核酸酶、位点特异性核酸酶或人工靶向DNA双链断裂诱导剂。
14.根据权利要求1所述的方法,所述方法还包括将至少一种供体多核苷酸引入所述细胞中。
15.根据权利要求14所述的方法,其中将一种靶向核酸内切酶、包含与靶向切割位点的上游侧具有显著序列同一性的第一部分的第一单链核酸、包含与靶向切割位点的下游侧具有显著序列同一性的第一部分的第二单链核酸和一个供体多核苷酸引入所述细胞中,所述供体多核苷酸包含与第一单链核酸的第二部分具有显著序列同一性的第一序列和与第二单链核酸的第二部分具有显著序列同一性的第二序列,并且其中所述供体多核苷酸的第一和第二序列位于用于插入所述染色体序列中的序列的侧面。
16.根据权利要求14所述的方法,其中将第一革巴向核酸内切酶、包含与第一革巴向核酸内切酶的靶向切割位点的上游侧具有显著序列同一性的第一部分的第一单链核酸、第二靶向核酸内切酶、包含与第二靶向核酸内切酶的靶向切割位点的下游侧具有显著序列同一性的第一部分的第二单链核酸和一个供体多核苷酸引入所述细胞中,所述供体多核苷酸包含与所述第一单链核酸的第二部分具有显著序列同一性的第一序列和与所述第二单链核酸的第二部分具有显著序列同一性的第二序列,并且其中所述供体多核苷酸的第一和第二序列位于用于插入染色体序列中的序列的侧面。
17.根据权利要求1所述的方法,其中所述细胞是培养的细胞、原代细胞、永生细胞、干细胞、诱导的多潜能干细胞(iPS)或单细胞胚。
18.根据权利要求1所述的方法,其中所述细胞是人细胞、哺乳动物细胞、脊椎动物细胞、无脊椎动物细胞或单细胞真核生物。
19.根据权利要求1所述的方法,其中所述靶向核酸内切酶是锌指核酸酶并且所述单链核酸是包含至少30个核苷酸的脱氧核糖核酸。
20.一种用于编辑细胞中内源染色体序列的试剂盒,所述试剂盒包括: a)至少一种靶向核酸内切酶或编码靶 向核酸内切酶的核酸,所述靶向核酸内切酶能够在染色体序列中靶向的切割位点处引入双链断裂;和 b)至少一种单链核酸,其包含与靶向切割位点的至少一侧上的染色体序列具有显著序列同一'I"生的第一部分。
21.根据权利要求20所述的试剂盒,其中所述单链核酸包含与靶向的切割位点的另一侧上的所述染色体序列具有显著序列同一性的第二区域。
22.根据权利要求21所述的试剂盒,其中所述单链核酸还包含相对于所述染色体序列的至少一个核苷酸变化,从而所述编辑的染色体序列包含至少一个核苷酸的插入、至少一个核苷酸的缺失、至少一个核苷酸的置换或其组合。
23.根据权利要求21所述的试剂盒,其中所述单链核酸还包含侧面为第一区域和第二区域的外源序列,从而所述编辑的染色体序列包含于整合的外源序列。
24.根据权利要求20所述的试剂盒,其中所述单链核酸包含与位于靶向的切割位点上游或下游的远端染色体序列具有显著序列同一性的第二区域,从而所述编辑的染色体序列包含缺失。
25.根据权利要求24所述的试剂盒,其中所述单链核酸还包含侧面为第一区域和第二区域的外源序列,从而所述编辑的染色体序列还包含整合的外源序列。
26.根据权利要求20所述的试剂盒,其中所述单链核酸是线形或环形的。
27.根据权利要求20所述的试剂盒,其中所述单链核酸具有约20个核苷酸至约100, 000个核苷酸的长度。
28.根据权利要求20所述的试剂盒,其中所述单链核酸包含脱氧核糖核苷酸、核糖核苷酸、核糖核苷酸模拟物、修饰的核苷酸、2’ -O-甲基核苷酸、锁核酸、肽核酸或其组合。
29.根据权利要求20所述的试剂盒,其中所述单链核酸包含磷酸二酯键、硫代磷酸酯键、磷酰亚胺键、磷酰二胺键或其组合。
30.根据权利要求20所述的试剂盒,其中所述单链核酸是有义或反义的。
31.根据权利要求20所述的试剂盒,其中所述单链核酸与靶向切割位点的至少一侧上的至少10个核苷酸具有至少约90%序列同一性。
32.根据权利要求20所述的试剂盒,其中所述靶向核酸内切酶是锌指核酸酶、大范围核酸酶、转录激活物样效应物(TALE)核酸酶、位点特异性核酸酶或人工靶向DNA双链断裂诱导剂。
33.根据权利要求20所述的试剂盒,其中所述试剂盒包含第一单链核酸和第二单链核酸,所述第一单链核酸包含与靶向切割位点的上游侧具有显著序列同一性的第一部分,所述第二单链核酸包含与靶向切割位点的下游侧具有显著序列同一性的第一部分,并且还包含供体多核苷酸,所述供体 多核苷酸包含与所述第一单链核酸的第二部分具有显著序列同一性的第一序列和与所述第二单链核酸的第二部分具有显著序列同一性的第二序列,并且其中所述供体多核苷酸的第一和第二序列位于用于插入所述染色体序列中的序列的侧面。
34.根据权利要求20所述的试剂盒,所述试剂盒还包含至少一种用于PCR的引物。
35.根据权利要求20所述的试剂盒,所述试剂盒还包含至少一种选自缓冲液、稀释剂和培养基的试剂。
36.根据权利要求20所述的试剂盒,其中所述靶向核酸内切酶是锌指核酸酶并且所述单链核酸是包含至少30个核苷酸的脱氧核糖核酸。
全文摘要
本发明提供用于编辑细胞中特定染色体序列的方法和试剂盒。具体而言,将靶向核酸内切酶和单链核酸用来编辑所述染色体序列。
文档编号C12N15/00GK103168101SQ201180045842
公开日2013年6月19日 申请日期2011年7月22日 优先权日2010年7月23日
发明者陈福强, S.M.普吕特-米勒, G.D.戴维斯 申请人:西格马-奥尔德里奇有限责任公司

最新回复(0)