腺病毒组装方法

xiaoxiao2020-6-24  18

专利名称:腺病毒组装方法
腺病毒组装方法相关申请的交叉引用本申请要求2010年8月16日提交的美国临时申请61/374,198的权益,为了所有目的,该临时申请全部并入本文。
背景技术
有52种人类腺病毒感染不同的人组织,还有上百种腺病毒能够感染从鱼到灵长动物的其他物种。这些病毒是高效的纳米级机器,能够在感染I小时内将它们的遗传物质有效负载至细胞核内。这些DNA病毒不整合到宿主DNA中,利用成熟的GMP方案可以产生高滴度的病毒,而且它们在为了表达异常基因进行的研究和人类基因治疗应用中表现很安全。但是,到目前为止,由于使用几乎只限于一个变种Ad5或Ad2/5嵌合体以及不能快速和系统地构建和组合多个基因修饰,它们的潜在应用受到了局限。因此,需要将常用的腺病毒载体扩展到Ad2/5以外,并且要建立一个技术平台来协助由组成部分快速离体地组装新的腺病毒基因组,以便能够系统地引入多个修饰和异源元件。这样的系统可以利用天然的病毒架构在能够高效运送和表达36个基因(不包括剪接变体)方面的优点。所述系统可以提供有力的诊断剂和治疗剂,这些诊断剂和治疗剂包含对不同肿瘤样品中失去调控的途径活性的多重和定量测量。腺病毒载体在多种应用中的潜力受限于快速和系统地操纵36kb病毒基因组的能力。而且,基础研究、动物模型、基因治疗和溶瘤治疗中使用的腺病毒载体只限于腺病毒(Ad)血清型2和5。Ad2和Ad5居于最早发现的腺病毒之列,因此传统上有大量载体/工具来操纵它们的基因组,特别是El区域。Ad2/5纤维蛋白(Fiber proteins)通过结合受体CAR感染上皮细胞。不幸的是,不是所有类型的细胞都表达CAR,而且CAR在许多转移病例中被下调。再者,接近80%的人口具有预先存在的抗Ad2/5的中和抗体,这与脱靶肝摄取和炎症一起限制了系统性应用。因此,使用Ad2/5载体进行基因递送和癌症治疗不一定是最佳选择,而主要是历史的偶然事件。我们的最终目的是建立强力的癌症病毒疗法,所述疗法不仅能够进行肿瘤选择性裂解复制,还可以在多轮治疗中进行系统地给药、避免对肝脏的毒性、有效地靶向和穿越令人苦恼的肿瘤血管、经由不同的受体感染细胞、在肿瘤内通过前药活化酶/毒素的局部表达产生肿瘤旁观者效应并且复苏有益的宿主抗病毒免疫反应。这些主要挑战因为人类腺病毒不能在小鼠中复制而更加严重。这排除了相比异种移植模型有许多优势的在免疫活性癌症基因工程小鼠模型(GEMMs)中进行人溶瘤病毒评价的可能。52种人类腺病毒的存在表明腺病毒高度专性适应不同宿主组织环境中的感染和复制。这些病毒中的许多可以感染不同组织,并且含有能够结合除CAR之外的细胞受体的纤维蛋白以及一群不同的‘E3’免疫调节基因。由于缺少修饰它们的基因组所需要的工具,对它们的这些独特属性还没有广泛的研究或利用。类似地,还存在感染其他物种的腺病毒,包括鼠腺病毒(M AV-1)。本文提供了对现有技术中的这些和其他问题的解决方案。发明概述
本发明一方面提供了制备重组腺病毒的方法(文中又称为“Adsembly”)。所述方法包括由两个或更多个腺病毒基因模块组装核酸,所述模块选自El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或者腺病毒大模块(maciOmodule)(或者如下文描述的突变体)。本发明另一方面提供了包含复数个腺病毒基因模块的文库。本发明另一方面提供了实施本文提供的方法的试剂盒。附图简述

图1.现有腺病毒载体方法和Adsembly的比较列表。Adsembly克服了现有系统中的多个限制。图2.进一步开发腺病毒作为治疗剂所需要克服的挑战。简图表明了该领域需要克服的几个主要问题。图3.列举了四种不同腺病毒属的系统发生树。没有列出所有已知腺病毒。该图展示了腺病毒家族中的种类多样性。图4.52种已知的人腺病毒的受体和向性。受体和向性在血清型和亚型之间有所不同,因此可以利用这一点来重新靶向某些病毒。图5.腺病毒各属中保守的“核心”基因组区。顶端的图是人Ad5基因组(SEQ IDNo: 137)的简化图谱,其中的核心区以虚线框强调。正如下端图中围绕基因的白框表明的,该核心区在所有腺病毒属中保守。所有属都含有该核心区,并且几乎全部的核心开放读框都是从IVa2(左端)到pVIII (右端)。基因组的多变性存在于基因组的末端。申请人将我们的模块名称划分为El模块(文中又称为El样模块)(条带指示的核心区左侧的全部)、核心模块(条带指示的)和E·3模块(文中又称为E3样模块)(条带指示的核心区右侧的全部),因为模块内容在不同腺病毒种类之间会有所变化,但它们相对核心区的位置不会变。一些情况中,纤维(fiber)紧挨着核心区,而在其他(人Ads)中位于核心区之外。图6.多种腺病毒属的转录图谱,显示了腺病毒种类之间的保守转录单位。显示了核心基因,以及在一或两个属中可以看到的基因。该图可以看出不同属之间基因组末端的多样性。这里引用的〃Davison, Benko, Harrach〃是指 Be.nk0 M et al., (2005)FamilyAdenoviridae.Fauquet CM, Mayo MA, Maniloff J, Desselberger U, Ball LA(eds): VirusTaxonomy.VIIIth Report of the International Committee on Taxonomy of Viruses.Elsevier,New York pp213_228。图7A-7C.SEQ ID NO: 32给出的人Ad5聚合酶蛋白中氨基酸966-1103 (底端,紧靠共有序列的上方)与来自非人腺病毒的多个聚合酶蛋白中的相应区域的比对。每个非人Ad序列在与该Ad5聚合酶序列进行分别比较时,该区域内至少45%相同。左侧的记号表示GenBank登录号,从上到下分别对应SEQ ID NO: 1-32 图7D-7G.SEQ ID NO: 73给出的人Ad5六邻体蛋白(hexon protein)中氨基酸501-747 (底端,紧靠共有序列的上方)与来自非人腺病毒的多个六邻体蛋白中的相应区域的比对。每个非人Ad序列在与Ad5六邻体序列进行分别比较时,该区域内至少45%相同。左侧的记号表示GenBank登录号,从上到下分别对应SEQ ID N0:33_73。图7H-71.SEQ ID NO: 103给出的人AdOTNA结合蛋白中氨基酸408-475 (底端,紧靠共有序列的上方)与来自非人腺病毒的多个DBPs中的相应区域的比对。每个非人Ad序列在与AdOTBP序列进行分别比较时,该区域内至少35%相同。以黄色标识的残基在各物种之间是100%保守的。左侧的记号表示GenBank登录号,从上到下分别对应SEQ ID NO: 74-103。图7J.SEQ ID NO: 135给出的人Ad5pVIII蛋白中氨基酸6-43 (底端,紧靠共有序列的上方)与来自非人腺病毒的多个pVIII蛋白中的相应区域的比对。每个非人Ad序列在与Ad5pVIII序列进行分别比较时,该区域内至少35%相同。左侧的记号表示GenBank登录号,从上到下分别对应SEQ ID NO: 104-135。图8.腺病毒基因组操作的初始概念一览。图9.利用四个DNA片段进行的多位点gateway的简单示意图。多位点gateway是我们提议的用于重新组装基因组的系统。左侧是提议的系统。图10A.详细说明gateway att重组位点的命名和组织的示意图。由Gateway克隆得到了四种不同的att重 组位点。四种均含有21bp的中央attB区,这里是重组真正发生的位置。利用特异的酶混合物(BP)将attP位点与attB位点重组。得到的反应产生了attL和attR位点。用另一种酶混合物(LR)可以使反应逆向进行,这时attL和attR重组形成attP和attB。图10B.6个不同att位点之间的序列差别。每个位点特异地与它的配对位点重组。attBl位点只与attPl位点重组,attB2只与attP2,等等。图11.A)人Ad5基因组(SEQ ID NO: 137)分为重组装模块的例子。B)利用多位点gateway技术将提议的模块重新组装后,attB位点的插入位置。图12.人Ad5基因组(SEQ ID NO: 137)中可能的attB插入位点的例子。可以通过将目标区域内的多种腺病毒序列进行比对,选择非保守序列周围的位置来确定插入位点。箭头表示给Ad5选择的位点。A) El和E2模块之间的attB4插入。B) E2和L3模块之间的attB6插入位点。C)L3和E3模块之间的attB5插入。D)E3和E4模块之间的attB3插入位点。对于该具体插入,我们决定通过提供双份的位于纤维polyA/终止子和E4polyA之间的Ad5序列给该重组位点提供一个缓冲区。因此,与attB插入一起,在这两个元件之间有27bp的重复。图13.试图通过PCR获得5个Ad5模块时的挑战和结果。底部的表列出了 PCR获得的每个片段的测序结果以及与已经发表的Ad5序列的差别。因为所有错误的再现性都是100%,这说明我们使用的模板与发表的Ad5序列不同,且该PCR的忠实度很高。图14.Ad5腺病毒基因模块可以通过PCR由直接得自纯化的病毒的DNA获得。从纯化的病毒中直接分离Ad5基因组DNA,作为Ad5模块PCRs的模板。所有5个PCRs都成功。左边小图:一式四份的E2和L3模块PCR。右边小图:一式两份的El、E3和E4模块PCR。红色箭头指示所需的PCR产物。右侧的箭头省略了,因为目标产物非常清楚。图15.Ad5腺病毒基因模块在gateway BP反应中的效率。El、E2和L3模块在标准反应中无效,而E3和E4模块有效。图16.不依赖序列和连接反应的克隆法(SLIC)的示意图。左侧是单一片段SLIC,而右侧是多(9)片段SLIC的例子。图17.利用SLIC,在不使用gateway克隆酶的情况下制备gateway入门载体。图18.Ad5El区对细菌有中等毒性。利用SLIC,将Ad5El区或对照(IacZ)插入gateway DONR载体。IacZ对照上的所有菌落均是“正常”大小,对IacZ插入是阳性的。El平板上只出现了两个“正常”大小的菌落,两个菌落对El都是阴性。但是,有几个较小的菌落(箭头),全部都是El阳性的。因此,Ad5El区延缓了细菌的生长。这解释了为什么我们无法利用gateway重组反应插入El。图19.由5个模块入门载体重新组装Ad5基因组的原始的多位点gateway策略。首先,将5个入门载体中的3个与填充载体合并。然后去除填充载体以便插入反选盒(counterselection cassettes)。然后合并最后的2个入门载体从而形成完整的基因组。该特定策略显示出与El模块关联的毒性,以及E2和L3模块的大体积。图20.人Ad5Adsembly双DEST载体的形成。E2和L3模块由各自的入门载体通过PCR获得,并利用SLIC与载体骨架合并。然后,将载体消化后,通过SLIC将gateway反选盒插到模块旁侧,模块末端带有独特的限制酶位点。图21.人Ad5的Adsembly过程。将核心模块双DEST载体与其余的3个入门载体中的一个在gateway LR反应中合并从而重新组装完整的病毒基因组。图22.Adsembly方法中尝试的多个反选标记物的效率。使用了 PheS+ccdB,对于通过菌落盲选,或者首先利用菌落PCR鉴定到插入然后通过标准的限制酶消化筛选都是有效的。图23.Adsembly 载体骨架含有适合所述方法的实施方案的两个独特属性。载体骨架使用的是P15A复制原点,降低了质粒的拷贝数,从而减少Ad5El模块介导的毒性。此外,载体含有哺乳动物1-SceI表达盒,这使得转染后病毒基因组能够从载体骨架上自剪切下来。图24.Adsembly反应的效率。A)Ad5的Adsembly反应使用了 20fmol核心双DEST载体和各IOfmol的El模块、E3模块和E4模块入门载体进行。反应在室温下过夜进行,第二天转化到NEBlO-β细胞中。长出16个克隆,经过处理以备经EcoRV消化进行筛选。16个克隆中的2个显示出正确的限制酶消化样式(星号,克隆4和8)。“L”是DNA序列梯(ladder)。“㈠”是阴性对照,即经过消化的核心双DEST载体。“⑴”是阳性对照,经过消化的完整Ad5基因组。B)提高El入门载体的量增强了 Adsembly的效率。Ad5的Adsembly反应使用了 20fmol核心双DEST载体、50fmol El模块入门载体和各IOfmol的E3和E4模块入门载体。反应在室温下过夜进行,第二天转化到NEBlO-β细胞中。长出10个克隆,经过处理以备经EcoRV消化进行筛选。10个克隆中的7个显示出正确的限制酶消化样式(红色星号).“L”是DNA序列梯。是阴性对照,即经过消化的Ad5E2-E4载体。“(+) ”是阳性对照,即经过消化的完整Ad5基因组。图25.人Ad5的AdSlicR方法。从给Adsembly制备的E2-L3核心模块开始,载体经SwaI消化被线性化。然后利用SLIC将E3和E4模块插入载体。后续的载体用PacI线性化,然后通过SLIC插入El模块形成完整基因组。图26.人Ad5AdSlicR方法中的效率。菌落PCR作为第一道筛选流程,然后将PCR阳性克隆进行限制酶消化。图27.Adsembled (经Adsembly制得的)病毒在组织培养中的生长情况。A)通过Adsembly组装的复制型腺病毒形成的噬菌斑。将Adsembled基因组转染到293细胞中,到第7天出现肉眼可见的卩遼菌斑。B) AdsembledAd5的传代和继续生长。从Adsembled Ad5的转染收集总病毒,重新在新鲜的293细胞上铺板。第3天可以看出波及整个平板上的明显致细胞病变效应。图28.Adsembled Ad5生长在293细胞中时滴度只有略微下降。293细胞用MOI=IO的野生型Ad5、Adsembled Ad5或AdSLIC Ad5 (不含有attB插入或者分别含有四种attB插入中的一个)转染。48小时后收集总病毒,经ELISA测定滴度。唯一显示出缺陷的病毒是Adsembled病毒和只含有attB3插入的AdSLIC病毒。与野生型水平相比,均表现出适度的
2倍下降。这些数据还显示利用AdSLIC制备的病毒在293细胞中没有复制缺陷。所有病毒的输入水平经过滴定,接近le7IU/mL(未显示)。图29.图29A给出了本文描述的Adsembly入门载体文库中的载体。首先列出了模块所来源的Ad血清型,之后是对载体进行的改变。如果没有变化,标记为“野生型”。图29B给出了用于本文描述的Adsembly和AdSLIC的大模块载体。首先列出了大模块Ad所来源的血清型,之后是包含大模块的模块,然后是对载体进行的任何改变。如果没有变化,标记为“野生型”。图29C给出了利用本文描述的Adsembly或AdSLIC组装成的腺病毒基因组。首先列出了基因组所基于的Ad血清型,之后是对病毒进行的任何改变。如果没有变化,标记为“野生型”。图30.利用SLIC将完整基因组插入质粒。A)所述过程的示意图,经PCR获得的质粒载体含有与要插入的病毒基因组末端同源的短片段( 20bp)。然后用T4DNA聚合酶处理基因组和载体,正常用于SLIC。B)完整Ad5基因组插入质粒骨架的例子。筛选到的所有6个克隆都含有完整的基因组。因为基因组可以正向或者反向插入,这里的情况中四个处于一个方向(克隆1、4、5和6),两个处于另一个方向(克隆2和3)。图31-33描述了腺病毒基因组改造的方法。图34.上方小图:利用AdSLICr系统,组装非人腺病毒-小鼠腺病毒I型的基因组(SEQ ID NO: 104)的例子。El、E3-纤维蛋白和E4模块质粒的设计使得可以用限制性酶对它们进行切割留下突 出 端,所述突出端是将它们经过序列和连接不依赖性克隆(SLIC)到线性化(用SwaI或PmeI)核心载体中所需的。这将减少为了获得SLIC所需的线性片段而进行PCR的必要,从而消除引入错误的可能。设计还保证最终的基因组构建体中不插入外来序列。一般方法包括切割E3-纤维蛋白和E4模块,并与PmeI线性化的核心载体合并。这生成了 E2-E4大模块,然后用SwaI对其进行切割,并与切割好的El模块合并产生完整的基因组。下方小图:利用以上策略组装了野生型I型鼠腺病毒,转染小鼠3T6细胞后获得能形成噬菌斑的感染性病毒。图35.为了鉴定会妨碍生长的插入位点,对含有单一 attB重组位点插入的病毒的生长分析。因为利用Adsembly制备的病毒与野生型病毒相比,有略微的生长缺陷(图28),所以利用AdSLIC制备病毒,这样它们只含有利用Adsembly制备的病毒中带有的attB插入中的一个。293细胞(上方图形)被以MOI=IO感染。U20S细胞(下方图形)被以M0I=50感染。48小时后收集总病毒并滴定。模块[L3]和[E3]之间的attB5插入与野生型病毒相比没有影响在U20S细胞中的生长,但其他三个接点处的attB插入与野生型细胞相比的确对生长有抑制。图36.因为位于El和E2-L2模块之间的初始attB4插入位点造成了生长缺陷(图35),设计了替代的位置选项。碱基对位点参照SEQ ID NO: 137中给出的位点。图37.由于位于E3和E4模块之间的初始attB3插入位点造成了生长缺陷(图35),设计了替代的位置选项。碱基对位点参照SEQ ID NO: 137中给出的位点。图38.用病毒以M0I=50感染U20S细胞,48小时后收集总病毒并滴定。将利用Adsembly生成的三种病毒与野生型病毒进行比较。含有替代attB位点插入的病毒(黑色菱形和三角形)与原来的attB位点安置(黑色X’ s)相比,生长情况改善。所有这些病毒缺少位于L2和L3模块之间的attB位点,并且含有不影响生长的位于L3和E3模块之间的attB插入。图39.Adsembly可以用于生成病毒,所述病毒中从El模块开始表达转基因。这种情况中,在El模块中用GFP表达盒替换Ad5的ElA和ElB基因。利用Adsembly组装病毒,得到了表达GFP的活病毒。图40.Adsembly可以用于生成病毒,所述病毒中利用天然的病毒转录架构从E3模块开始表达转基因。E3模块经过改造被删除了 11.6K的蛋白(Ad5核苷酸29491-29772),代之以mCherry。然后E3转录物自然剪接产生mCherry基因,蛋白得以表达。显示了利用Adsembly进行病毒的制备和U20S细胞的转导。这是I)从E3模块开始的转基因表达,和2)利用天然的病毒转录构架表达外来基因的例子。图41.利用天然的病毒转录架构从E4模块开始表达多重转基因。将天然E4启动子替代为CMV启动子,3个天然E4基因替代为转基因。然后利用Adsembly生成病毒。碱基对位点参照SEQ ID NO: 137中给出的位点。图42.Adsembly可以用于生成病毒,所述病毒中利用天然病毒转录架构从E4模块开始表达多重转基因。用图41中制备的 病毒向U20S细胞中转导24小时,收集总RNA,由RNA通过随机引发合成cDNA,进行PCR来检测对mCherry基因的剪接。黑色箭头指示未剪接的转录物,该转录物会表达GFP。白色箭头指示发生剪接的转录物,该转录物表达mCherry。这显示了由单一模块可以表达多重外来基因。泳道I和2分别是未被转导的细胞或者感染了野生型Ad5的细胞的阴性对照。图43.利用Adsembly在单个基因组组装中给多重模块引入多种类型的变化。示意图显示了 Ad5基因组的5个模块,其中的垂直箭头指示在完整基因组组装前给每个模块做的改变。El模块被转化为荧光素酶-GFP融合蛋白的转基因表达盒。L3模块中的六邻体蛋白通过点突变将Glu451改变为Gin。E3模块中天然Ad5纤维的一部分被来自其他的人腺病毒血清型的多种纤维组分之一所替代。利用Adsembly制备了 6种病毒,每种含有代替的纤维蛋白。给Ad5列出的碱基对位点参照SEQ ID N0:137中给出的位点。登录号DQ086466、AJ854486、BK001453、NC_001460 和 AY_737797 分别对应 SEQID NO: 139-143。图44.利用Adsembly生成的纤维嵌合病毒与正常Ad5纤维相比,在人胚胎干细胞(hESC)中的转导能力提高。以不同MOIs将人ESC转导24或48小时,经显微镜测量GFP表达。顶端小图是不含病毒的阴性对照。第二行小图是表达处于CMV启动子调控下的GFP的“Ad5CMV-GFP”。左侧标明了所检验的病毒纤维嵌合体(即Ad5/3是带有Ad3纤维球部的Ad5)。所有图像是在5x放大倍数摄取的。图45.将腺病毒血清型的核心模块进行交换产生了有活性的病毒。制备了来自Adll的核心模块。Ad5El和E3模块经过改造分别带有AdllpIX和U外显子-纤维。利用AdSLIC组装了整个病毒,病毒在293细胞上重建。“最终病毒”列表中提到的碱基对位置与SEQ ID N0:137(Ad5)和 SEQ ID NO: 141 (Adll)中给出的一致。
图46.利用AdSLIC对病毒基因进行突变以便研究基因在病毒感染方面的功能。在El模块中,E1B-55K基因中的His260位点被突变为Ala。其他所有模块是野生型的。该病毒是利用AdSLIC组装的。用复制缺陷型Ad5 (泳道I)、野生型Ad5 (泳道2)或者Ad5H260A (泳道3)以MOI=IO感染人小气道上皮细胞。感染后36小时收集总蛋白,通过Western印迹进行p53 (顶端小图)、mdm2、Ad5晚期蛋白和肌动蛋白分析。与野生型Ad5不同,Ad5_H260A病毒不能降解P53,在晚期蛋白的产生方面有缺陷。发明详述定义“核酸”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸和它们的聚合物,以及它们的互补链。该术语涵盖这样的核酸,所述核酸含有已知的核苷酸类似物或者骨架带有修饰的残基或连接;所述核酸是合成的、天然存在的和非天然存在的;所述核酸与参照核酸有类似的结合性能并且与参照核苷酸的代谢方式类似。这种类似物的例子包括,但不限于硫代磷酸酯、胺基磷酸酯、甲基磷酸酯、手性-甲基磷酸酯、2-0-甲基核糖核苷酸、肽核酸(PNAs)。除非另有说明,特定核酸序列还暗含其保守性修饰的变体(例如简并密码子取代)和互补序列,以及明确指出的序列。具体来说,可以通过产生这样的序列来实现简并密码子取代,所述序列中的一或多个选中(或全部)密码子的第三个位点被混合碱基和/或脱氧肌苷残基取代(Batzer et al., Nucleic Acid Res.19:5081(1991) ; Ohtsuka et al., J.Biol.Chem.260:2605-2608(1985);Rossolini et al.,Mol.Cell.Probes8:91-98 (1994))。术语核酸与基因、cDNA、mRNA、寡核苷酸和多核苷酸可以互换使用。特定核酸序列还暗含“剪接变体”。类似地,由核酸编码的特定蛋白暗含由该核酸的剪接变体编码的所有蛋白。“剪接变体”正如这个名字暗示的是基因替代剪接的产物。转录结束后,开始的核酸转录物可能发生剪接,使得不同(替代)核酸剪接产物编码不同的多肽。剪接变体的产生机制可能各不相同,但都包括外显子的替代剪接。由同一核酸经过通读转录产生的替代的多肽也涵盖在这个定义中。剪接反应的任何产物,包括重组形式的剪接产物都包括在这个定义中。Leicher, et al., J.Biol.Chem.273 (52): 35095-35101 (1998)中讨论了一例钾离子通道剪接变体。构建含有所需治疗基因编码和调控序列的合适载体可以采用常规的连接和限制性酶切技术,这些技术在本领域已有很好的了解(参见Maniatis et al., in MolecularCloning:A Laboratory Manual, Cold Spring Harbor Laboratory, New York(1982))。可以将分离的质粒、DNA序列或者合成寡核苷酸切割、修饰并按照需要的形式重新连接。核酸在与另一个核酸序列形成功能性关系时是“可操纵地连接”。例如,编码前体序列或者分泌前导序列的DNA如果能够表达为参与多肽分泌的前体蛋白,则所述DNA是可操纵地连接编码多肽的DNA ;启动子或增强子如果能够影响序列的转录,则所述启动子或增强子是可操纵地连接编码序列;或者核糖体结合位点如果定位方式如果能够协助翻译的进行,则所述核糖体结合位点是可操纵地连接编码序列。通常,“可操纵地连接”意味着被连接在一起的DNA序列距离很近,而且对于分泌前导序列的情 况,是连续的和符合读框的。但增强子不需要必须连续。连接是通过在方便的限制酶切位点进行相连完成的。如果不存在这样的位点,可以按照常规做法使用合成寡核苷酸适配子或接头。
在提及两个或更多个核酸或多肽序列的语境中,术语“相同的”或“同一性”百分比是指利用BLAST或BLAST2.0序列比较算法,使用以下描述的缺省参数,或者通过人工比对和目测进行测量(参见例如NCBI网站等),所述两个或更多个序列或子序列是相同的,或者含有特定百分比的氨基酸残基或核苷酸是相同的(即在比较窗口或者指定区域内按照最大对应性进行比较和对位排列时,特定区域内有大约60%的同一性,优选65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更高的同一性)。这样的序列即可被认为是“基本相同的”。这个定义还可以指示或者可以应用于测试序列的互补序列。定义还包括含有缺失和/或添加的序列,以及含有取代的序列。正如以下描述的,优选的算法可以can account for gaps等。优选地,至少大约25个氨基酸或核苷酸长的区域内存在同一性,或者更优选地在50-100个氨基酸或核苷酸的区域内。为进行序列比较,一般将一个序列作为参照序列,将测试序列与它相比。使用序列比较算法时,将测试和参照序列输入计算机,指定子序列坐标,如果需要还可以指定序列算法的程序参数。优选地,可以使用缺省程序参数,或者可以指定替代参数。然后序列比较算法基于程序参数计算测试序列相对参照序列的序列同一性百分比。“比较窗口”用于本文包括两个序列被最优化对位排列后,选自多个由20-600,优选大约50-大约200,更通常是大约100-大约150个位点组成的连续位点之一的区段,其中所述序列与具有相同数量连续位点的参照序列进行比较。用于将序列对位排列进行比较的方法是本领域已知的。可以如下实施序列比较的最佳对位排列,例如通过Smith &Waterman, Adv.Appl.Math.2:482 (1981)的局部同源性算法;通过 Needleman & ffunsch, J.Mol.Biol.48:443 (1970)的同源比对算法;通过 Pearson&Lipman, Proc.Nat,1.Acad.Sc1.USA85:2444(1988)的寻找相似性的方法;通过这些算法的计算机化实施(WisconsinGenetics Software Package 中的 GAP、BESTFIT、FASTA 和 TFASTA, Genetics ComputerGroup, 575Science Dr.,Madison, WI);或者通过人工比对和目测(参见例如CurrentProtocols in Molecular Biology(Ausubel et al.,eds.1995supplement))。适用于确定序列同一性百分比和序列相似性的算法的优选例子是BLAST和BLAST2.0 算法,这 两个算法分别在Altschul et al.,Nuc.Acids Res.25:3389-3402 (1977)和 Altschul et al.,J.Mol.Biol.215:403-410 (1990)中有描述。使用了参数如文中所述的BLAST和BLAST2.0来确定本发明的核酸和蛋白的序列百分比同一性。正如本领域已知的,进行 BLAST 分析的软件可以通过 National Center for Biotechnology Information公开获得。该算法涉及首先通过鉴定查询序列中长度为W的短字节来鉴定高评分序列对(HSPs),所述HSPs当与数据库序列中相同长度的字节比对时,或者匹配或者满足某些正数的阈值打分 T。T 代表相邻字得分阈值(neighborhood word score threshold) (Altschulet al.,同前)。这些初始的匹配相邻字作为种子,启动搜索含有它们的更长的HSPs。将匹配字沿着每个序列,在累加比对得分能够增加的情况下尽量远地向两个方向延伸。对于核苷酸序列,利用参数M(—对匹配残基的奖励分;永远>0)和N(错配残基的罚分;永远〈0)计算累加得分。对于氨基酸序列,利用打分矩阵来计算累加得分。当累加比对得分从它达到的最大值下降数量X时;由于一或多个得负分的残基比对的累积,累加得分达到零或以下时;或者到达序列的末端时,停止匹配字在每个方向的延伸。BLAST算法参数W、T和X决定算法的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用的缺省参数为字长(W)=ll、期望值(E)=10、M=5、N=-4,双链比较。对于氨基酸序列,BLASTP程序使用的缺省参数为字长=3、期望值(E) =10、BLOSUM62 打分矩阵(参见 Henikoff&Henikoff, Proc.Natl.Acad.Sc1.USA89:10915 (1989))比对(B) =50、预期值(E) =10、M=5、N=_4,双链比较。术语“多肽”、“肽”和“蛋白质”在文中可以互换使用来指代氨基酸残基的聚合物。这些术语适用这样的氨基酸聚合物,所述氨基酸聚合物中的一或多个氨基酸残基是相应的天然存在氨基酸的人工化学模拟物;也适用天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。术语“氨基酸”是指天然存在的和合成的氨基酸,以及能够按照和天然存在的氨基酸相似的方式发挥作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些氨基酸,以及后来发生修饰的氨基酸,例如羟脯氨酸、Y -羧基谷氨酸盐和O-磷酸丝氨酸。氨基酸类似物是指与天然存在的氨基酸有相同的基本化学结构的化合物,即结合在氢原子上的α碳、羧基、氨基和R基团,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这些类似物带有被修饰的R基团(例如正亮氨酸)或者被修饰的肽骨架,但保持了和天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指其结构与氨基酸的一般化学结构不同的化合物,但与天然存在的氨基酸的功能方式类似。

氨基酸在文中可以用它们的众所周知的三字母符号或者IUPAC-1UB BiochemicalNomenclature Commission推荐的单字母符号来表示。类似地,可以用它们的公认单字母代码来指示核苷酸。“保守性修饰的变体”适用于氨基酸和核酸序列两者。就特定核酸序列而言,保守性修饰的变体是指那些编码相同或基本相同氨基酸序列的核酸,或者对于不编码氨基酸序列的核酸,是指基本相同的序列。由于遗传密码的简并性,有多个功能上相同的核酸编码任何给定蛋白。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子限定是丙氨酸的每个位点,可以将密码子改变为上述相应密码子中的任何一个而不会改变被编码的多肽。这样的核酸变异是“沉默变异”,是保守性修饰变体的一种。本文中每个编码多肽的核酸序列还描述了所述核酸的每个可能的沉默变体。本领域技术人员可以认识到核酸中的每个密码子(除了 AUG,它通常是唯一的甲硫氨酸的密码子jPTGG,通常是唯一的色氨酸的密码子)都可以被修饰而产生功能相同的分子。相应地,就表达产物而言,每个被描述序列中暗含了多肽编码核酸的每个沉默变体,但对实际的探针序列来说,没有这种含义。对于氨基酸序列,本领域技术人员可以认识到那些改变、增加或者删除编码序列中的单个氨基酸或较小百分比氨基酸的对核酸、肽、多肽或蛋白序列进行的个别取代、缺失或添加是“保守性修饰变体”,其中所述改变导致氨基酸被化学上相似的氨基酸所取代。给出功能相似氨基酸的保守性取代表格是本领域已知的。这样的保守性修饰变体是本发明的多态性变体、种间同源物和等位基因额外的,而不是排除它们。以下8个组各自含有相互是保守性取代的氨基酸:1)丙氨酸(A),甘氨酸(G);2)天冬氨酸(D),谷氨酸(E) ;3)天冬酰胺(N)、谷氨酰胺(Q) ;4)精氨酸(R)、赖氨酸(K); 5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y),色氨酸(W) ; 7)丝氨酸(S),苏氨酸⑴;和8)半胱氨酸(C)、甲硫氨酸(M)(参见例如Creighton, Proteins(1984))。提到例如细胞、病毒、核酸、蛋白或载体时使用的术语“重组”表明这些细胞、病毒、核酸、蛋白或载体被引入了异源核酸或蛋白或者天然核酸或蛋白被改变而被修饰,或者细胞来源于被这样修饰的细胞。因此,重组细胞例如表达天然(非重组的)细胞中没有的基因;或者表达的是天然基因,但是表达异常、表达下降或者根本没有表达。术语“严紧杂交条件”是指这样的条件,在所述条件下探针与通常存在于复杂的核酸混合物中它的靶子序列杂交,但不和其他序列杂交。严紧条件是序列依赖性的,并且随着环境的不同而不同。较长的序列在较高温度下特异杂交。Tijssen, Techniquesin Biochemistry and Molecular Biology--Hybridization with NucleicProbes, “Overview of principles of hybridization and the strategy of nucleicacid aSSayS”(1993)中可以找到关于核酸杂交的全面指南。通常对于限定的离子强度pH,选择的严紧条件比具体序列的融解温度(Tm)低大约5-10°C。^是(一定离子强度、pH和核苷浓度下)与靶序列互补的探针有50%与靶序列平衡杂交的温度(靶序列过量的情况下,在Tm,平衡时有50%的探针被占据)。还可能通过加入去稳定剂,比如甲酰胺来达到严紧条件。对于选择性或特异性杂交,阳性信号是背景的至少两倍,优选是背景杂交的10倍。示范性的严紧杂交条件可以如下:50%甲酰胺、5x SSC和1%SDS,42°C温育,或者5x SSC、1%SDS、于65°C温育,并于65°C在0.2x SSC和0.1%SDS中洗涤。严紧条件下相互不杂交的核酸如果编码的多肽基本相同,所述核酸仍然是基本相同的。例如核酸拷贝是利用遗传密码所能允许的最大密码子简并性形成的,会发生这种情况。在这种情况中,核酸一般在中等严紧的杂交条件下发生杂交。示范性的“中等严紧杂交条件”包括在37°C下在40%甲酰胺、IM NaCl、l%SDS的缓冲液中杂交和在45°C在IX SSC中洗涤。阳性杂交至少是背景的两倍。本领域技术人员容易理解可以使用替代的杂交和洗涤条件来提供严紧度相似的条件。确定杂交参数的其他指导方针在许多参考文献和例如Current Protocols in Molecular Biology, ed.Ausubel, et al., John Wiley & Sons 中有提供。对于PCRJ^ 36° C的温度对于低严紧扩增是典型的,虽然根据引物长度,退火温度可能在约32° C和48° C之间。对于高严紧PCR扩增,约62° C的温度是典型的,虽然根据引物长度和特异性,高严紧退火温度可以处于约50° C到约65° C的范围。对高和低严紧扩增的典型循环条件包括90° C-95° C30秒-2分钟的变性阶段,持续30秒-2分钟的退火阶段,和大约72° Cl-2分钟的延伸阶段。Innis et al.(1990)PCR Protocols, AGuide to Methods and Applications, Academic Press, Inc.N.Y.)中提供了低和高严紧扩增反应的试验方案和指南。用于本文,术语“癌症”是指在哺乳动物中发现的所有类型的癌症、肿瘤(neoplasm)或恶性肿瘤,包括白血病、癌(carcinomas)和肉瘤(sarcomas)。示范性的癌症包括脑、乳房、宫颈、结肠、头颈、肝、肾、肺、非小细胞肺、黑素瘤、间皮瘤、卵巢、肉瘤、胃、子宫和髓母细胞瘤的癌症。额外的例子包括何杰金氏病、非何杰金氏淋巴瘤、多发性骨髓瘤、神经母细胞瘤、卵巢癌、横纹肌肉瘤、原发性血小板增多症、原发性巨球蛋白血症、原发性脑瘤、癌症、恶性胰岛素瘤、恶性类癌、膀胱癌、恶性前皮肤病损、睾丸癌、淋巴瘤、甲状腺癌、神经母细胞瘤、食道癌、泌尿生殖道癌、恶性高钙血症、子宫内膜癌、肾上腺皮质癌、胰腺内分泌和外分泌的肿瘤以及前列腺癌。术语“白血 病”是泛指造血器官的进展性、恶性疾病,通常特征在于血液和骨髓中白细胞和它们的前体细胞的异常增殖和发育。白血病的临床分类通常基于(I)疾病的持续期和特点-急性或慢性;(2)涉及的细胞类型-骨髓的(髓细胞性)、淋巴的(淋巴性)或者单核细胞型;和(3)血液中异常细胞的增加或未增加-白血病或非白血性(亚白血病性)。P388白血病模型是广泛接受的预测体内抗白血病活性的模型。据信,在P388检测方法中测试显示阳性的化合物一般在体内会表现出一定水平的抗白血病活性,无论被治疗的白血病类型如何。相应地,本发明包括白血病的治疗方法,优选治疗下述白血病的方法:急性骨髓性白血病、慢性淋巴细胞白血病、急性粒细胞性白血病、慢性粒细胞性白血病、急性早幼粒细胞白血病、成人T-细胞白血病、非白血性白血病、白细胞不增多性白血病、嗜碱性白血病、母细胞性白血病、牛白血病、慢性髓细胞性白血病、皮肤白血病、胚胎性白血病、嗜酸粒细胞白血病、葛氏(Gross’)白血病、毛细胞白血病、成血细胞性白血病、血胚细胞性白血病、组织细胞性白血病、干细胞性白血病、急性单核细胞性白血病、白血病减少性白血病、淋巴性白血病、淋巴细胞性(lymphoblastic)白血病、淋巴细胞性(lymphocytic)白血病、淋巴球性(lymphogenous)白血病、淋巴样白血病、淋巴肉瘤细胞性白血病、肥大细胞白血病、巨核细胞白血病、小原粒细胞性白血病、单核细胞白血病、髓性(myeloblastic)白血病、髓细胞性(myelocytic)白血病、骨髓粒细胞性白血病、髓单核细胞性白血病、内格利型(Naegeli)白血病、浆细胞白血病、多发性骨髓瘤、浆细胞性白血病、早幼粒细胞性白血病、李德尔氏细胞性(Rie der cell)白血病、希林氏(Schilling’s)白血病、干细胞性白血病、亚白血性白血病和未分化细胞白血病。术语“肉瘤”通常所指的肿瘤是由胚胎结缔组织这样的物质组成的,一般包含包埋在纤维或均相物质中的紧密堆积的细胞。可以组合使用抗肿瘤的巯基结合线粒体氧化剂和抗癌剂来治疗的肉瘤包括软骨肉瘤、纤维肉瘤、淋巴肉瘤、黑素肉瘤、粘液肉瘤、骨肉瘤、艾伯内西氏(Abemethy’s)肉瘤、脂肉瘤、脂肪肉瘤、软组织腺泡状肉瘤、成釉细胞肉瘤、葡萄状肉瘤、绿色肉瘤、绒毛膜癌、胚胎性肉瘤、Wilms’瘤、子宫内膜肉瘤、间质肉瘤、尤文氏(Ewing's)肉瘤、筋膜肉瘤、纤维母细胞肉瘤、巨细胞肉瘤、粒细胞肉瘤、何杰金氏肉瘤、特发性多发性色素沉着出血性肉瘤(idiopathic multiple pigmented hemorrhagic sarcoma)、B细胞的免疫母细胞肉瘤、淋巴瘤、T细胞的免疫母细胞肉瘤、詹森(Jensen’s)肉瘤、卡波西(Kaposi’s)肉瘤、库柏法细胞(Kupffer cell)肉瘤、血管肉瘤、白血病性肉瘤、恶性间叶瘤、骨膜外肉瘤、网状细胞肉瘤、劳氏肉瘤(Rous sarcoma)、浆液囊性肉瘤、外阴滑膜肉瘤和毛细管扩张性肉瘤。术语“黑素瘤”意味着从皮肤和其他器官的黑色素细胞系统发生的肿瘤。可以组合使用抗肿瘤的巯基结合线粒体氧化剂和抗癌剂来治疗的黑素瘤包括例如,肢端雀斑样痣黑素瘤、无黑素性黑素瘤、良性幼年黑素瘤、克罗德曼(Cloudman’ s)黑素瘤、S91黑素瘤、哈帕二氏(Harding-Passey)黑素瘤、青少年性黑素瘤、雀斑样痣恶性黑素瘤、恶性黑素瘤、结节性黑素瘤、甲床黑素瘤和浅表扩散性黑素瘤。术语“癌(carcinoma)”是指由上皮细胞构成的恶性新生长物,易于渗透到周围组织,产生转移物。可以组合使用抗肿瘤的巯基结合线粒体氧化剂和抗癌剂来治疗的示范性癌包括例如腺泡癌、腺泡状癌、腺囊性癌、腺样囊性癌、腺癌、肾上腺皮质癌、肺泡上皮癌、肺泡细胞癌、基底细胞癌(basal cell carcinoma)、基底细胞癌(carcinomabasocellulare)、类基底细胞癌、基底鳞状细胞癌、细支气管肺泡癌、细支气管癌、支气管癌、髓样癌、胆管癌、绒膜上皮癌、胶样癌(colloid carcinoma)、粉刺癌、子宫体癌、筛状癌、销甲状癌、癌疮、柱状细胞癌(cylindrical carcinoma)、柱状细胞癌(cylindrical cellcarcinoma)、导管癌、硬癌(carcinoma durum)、胚胎癌、脑样癌、表皮样癌、腺样上皮细胞癌、夕卜生性癌、溃瘍性癌、纤维癌、胶样癌(gelatiniforni carcinoma)、胶状癌(gelatinouscarcinoma)、巨大细胞癌、巨细胞癌、腺癌、粒层细胞癌、基底细胞癌(hair-matrixcarcinoma)、多血癌、肝细胞癌、许特耳氏细胞(Hurthle cell)癌、胶样癌(hyalinecarcinoma) > hypemephroid carcinoma、幼稚型胚胎性癌、原位癌(carcinoma in situ)、表皮内癌、上皮内癌、克龙派切尔(Krompecher’s)癌、库尔契茨基细胞(Kulchitzky-cell)癌、大细胞癌、豆状癌(lenticular carcinoma、carcinoma lenticulare)、脂瘤样癌、淋巴上皮性癌、软癌(carcinoma medullare)、髓样癌(medullary carcinoma)、黑色素癌、髓样癌(carcinoma molle)、粘液癌(mucinous carcinoma、carcinoma muciparum)、粘液细胞癌、粘液表皮样癌、粘液癌(carcinoma mucosum、mucous carcinoma)、粘液瘤样癌、鼻咽癌、燕麦细胞癌、骨化性癌(carcinoma ossificans、osteoid carcinoma)、乳头状癌、门脉周癌、原位癌(preinvasive carcinoma)、棘细胞癌、脑样癌、肾脏的肾细胞癌、储备细胞癌、肉瘤样癌、施奈德氏(Schneiderian)癌、硬癌(scirrhous carcinoma)、阴囊癌、印戒细胞癌、单纯癌、小细胞癌、马铃薯状癌、球状细胞癌、梭细胞癌、髓样癌(carcinomaspongiosum) 、鳞状癌、鳞状细胞癌、绳捆癌(string carcinoma)、血管扩张性癌(carcinomatelangiectaticum> carcinoma telangiectodes)、移行细胞癌、结节性皮癌(carcinomatuberosum、tuberous carcinoma)、抚状癌和绒毛状癌。“治疗有效剂量或量”在本文意味着一个能够产生它的给药效应的剂量。确切的剂量和剂型取决于治疗目的,由本领域技术人员利用已知技术确定(参见例如Lieberman, Pharmaceutical Dosage Forms (vols.1-3, 1992) ;Lloyd, The Art, Scienceand Technology of Pharmaceutical Compounding (1999) ;Remington: The Scienceand Practice of Pharmacy, 20th Edition, Gennaro, Editor(2003)和 Pickar, DosageCalculations(1999))。术语“可药用盐”或“可药用载体”意味着包括活性化合物的盐,根据本文描述的化合物带有的取代基,所述盐是用相对无毒的酸或碱制备的。本发明的化合物含有相对酸性的功能团时,可以通过在无溶剂或合适的惰性溶剂中用足够量的所需碱与所述化合物的中性形式进行接触获得碱加成盐。可药用碱加成盐的例子包括钠、钾、钙、铝、有机胺或镁盐或者类似的盐。当本发明的化合物含有相对碱性的功能团时,可以通过在无溶剂或合适的惰性溶剂中用足够量的所需酸与所述化合物的中性形式进行接触获得酸加成盐。可药用酸加成盐的例子包括那些由下述无机酸衍生的盐:盐酸、氢溴酸、硝酸、碳酸、重碳酸、磷酸、一氢磷酸、二氢磷酸、硫酸、一氢硫酸、氢碘酸或亚磷酸等等,以及由下述相对无毒的有机酸衍生的盐:乙酸、丙酸、异丁酸、马来酸、丙二酸、苯甲酸、琥m酸、辛二酸、延胡索酸、乳酸、扁桃酸(mandelic)、邻苯二甲酸、苯磺酸、对甲苯磺酸、柠檬酸、酒石酸、甲磺酸等等。还包括诸如精氨酸等的氨基酸的盐,和诸如葡糖醛酸或半乳糖醛酸的有机酸的盐(参见例如Berge etal., Journal of Pharmaceutical Science66:1-19 (1977))。本发明的某些特定化合物既含有碱性功能团也含有酸性功能团,使得化合物能够转化为碱或者酸加成盐。本领域技术人员已知的其他可药用载体也适用于本发明。
实施方案详述1.组装方法发明一个方面提供了制备重组腺病毒的方法(文中又称为“Adsembly”)。所述方法包括从选自El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或腺病毒大模块(或者象下文描述的它们的突变体)中的两个或者更多个腺病毒基因模块组装核酸。在一些实施方案中,方法包括从选自El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或腺病毒大模块中的三个、四个或五个腺病毒基因模块组装核酸。核酸可以是腺病毒基因组构建体。腺病毒基因组构建体是被表达时(例如被引入哺乳动物细胞中时)能够形成重组腺病毒的核酸。核酸还可以是部分腺病毒基因组构建体,当被表达时(例如被引入哺乳动物细胞中时),能够与其他病毒(例如辅助病毒)一起形成重组腺病毒。这样形成的腺病毒可以复制并包装产生子代病毒。因此,本文提供的方法可能包括由两个或更多个基因组模块或者异源元件体外组装腺病毒基因组,所述腺病毒基因组在单独(转染感受态细胞系)或者与辅助病毒一起转染到哺乳动物细胞内时能够复制并包装产生子代病毒。基因组模块的选择可以基于进化上保守的序列、转录或者功能元件。在一些实施方案中,方法包括由选自El模块、E2-L2模块、L3-L4模块、E3模块和E4模块的三个或更多个腺病毒基因模块组装核酸。这样得到的核酸(文中又称为“组装的核酸”)可以在组装后被表达(例如发生复制、转录、翻译和包装),从而形成重组腺病毒。核酸的表达可以在体外、原位、细胞内(例如通过将核酸转染到细胞内)或者体内进行。在某些实施方案中,表达在细胞内进行从而导致产生细胞。术语“腺病毒基因模块”用于本文是指El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或者它们的大模块。因此腺病毒基因模块是核酸(例如DNA)。“个别腺病毒基因模块”用于本文是指El模块、E2-L2模块、L3-L4模块、E3模块或者E4模块。在一些实施方案中,可以在组装核酸之前由更小的子模块组装一或多个个别腺病毒基因模块。腺病毒大模块是El模块、E2-L2模块、L3-L4模块、E3模块、E4模块中的两个、三个或四个的组合。因此大模块是包含El模块、E2-L2模块、L3-L4模块、E3 模块、E4模块中的两个、三个或四个的线性核酸链(例如DNA)。术语“腺病毒大模块”用于本文是指:E1-L2大模块(即包含合并的El模块和E2-L2模块的核酸);E1-L4大模块(即包含合并的El模块、E2-L2模块和L3-L4模块的核酸);E1-E3大模块(即包含合并的El模块、E2-L2模块、L3-L4模块和E3模块的核酸);E2-L4大模块(即包含E2-L2模块和L3-L4模块的核酸,文中又称为“核心大模块”);E2-E3大模块(即包含合并的E2-L2模块、L3-L4模块和E3模块的核酸);E2-E4大模块(即包含合并的E2-L2模块、L3-L4模块、E3模块和E4模块的核酸);L3-E3大模块(即包含合并的L3-L4模块和E3模块的核酸);L3-E4大模块(即包含合并的L3-L4模块、E3模块和E4模块的核酸);和E3-E4大模块(即,包含合并的E3模块和E4模块的核酸)。在一些实施方案中,腺病毒大模块是E2-L4大模块(即核心大模块)或者E3-E4大模块。当腺病毒大模块被作为两个或更多个选中的腺病毒模块中的一个来组装核酸时,其他选中的腺病毒模块不是所述腺病毒大模块中的个别腺病毒基因模块。换句话说,每个个别腺病毒基因模块在组装成的核酸中无论是单独或者位于大模块内,均只出现一次。例如,当两个或更多个选中组装核酸的腺病毒基因模块中的一个是核心大模块时,不会选择E2-L2或L3-L4模块作为组装好的核酸中包含的另一个模块。同样地,对于选择了三个或更多个腺病毒基因模块的情况,腺病毒大模块不是E1-E3大模块或E2-E4大模块。在一些实施方案中,方法包括由选自(i)El模块,(ii)核心大模块和(iii)E3模块、E4模块或E3-E4大模块中的三个腺病毒基因模块组装核酸。方法还可以包括由选自El模块、核心大模块、E3模块和E4模块的四个腺病毒基因模块组装核酸。在一些实施方案中,可以在组装核酸之前将一或多个腺病毒基因模块组合形成大模块。对于形成大模块的情况,方法包括由大模块和所述模块中不包含的一或多个个别腺病毒基因模块(即El模块、E2-L2模块、L3-L4模块、E3模块和/或E4模块)组装核酸。在一些实施方案中,大模块是核心大模块。因此,在一些实施方案中,方法包括利用核心大模块和选自El模块、E3模块或E4模块的一或多个腺病毒基因模块组装核酸。腺病毒是一种在细胞核内进行复制的无包膜二十面体病毒。本文提供的腺病毒基因模块是指腺病毒基因组中的某些位点,象例如Davison et al., Journal of GeneralVirology, (2003),84 ,28695-2938中描述的。在一些实施方案中,腺病毒基因模块来源于人腺病毒。图5是人Ad5的简图,显示了本文提供的腺病毒基因模块和它们的以kb计量的大概大小。每个模块可能编码多重基因产物和替代的基因剪接排列。“E1模块”用于本文是含有腺病毒反向末端重复(ITR)的核酸。El模块可能另外包含与组装成的核酸的蛋白编码区可操纵连接的启动子。El模块一般来源于腺病毒ElA和/或ElB区域。除了 ITR区域,El模块可以还含有从腺病毒基因组的El末端到病毒聚合酶编码区的任何病毒基因(在下文中有讨论)。例如,El模块可以另外包含下述的编码区:主要转录激活蛋白ElA (例如编码pRB家族的失活蛋白)、E1B-19K (例如编码细胞凋亡阻断剂)、E1B55K(例如p53结合、mre结合和病毒mRNA输出蛋白)和/或PIX(例如编码次要结构蛋白和与病毒衣壳上的六邻体相互作用的蛋白)。El模块可能长大约4kb、3kb、2kb或lkb。在一些实施方案中,El模块与自然界中发现的腺病毒的ElA和ElB区的长度大概相同(例如参见图5)。“E2-L2”模块用于本文是含有病毒DNA聚合酶编码区和六邻体蛋白编码区中至少一个的核酸。在一些实施方案中,E2-L2模块还包含病毒DNA结合蛋白编码区。E2-L2模块一般来源于腺病毒E2B的LI和/或L2区。E2-L2模块可能另外包含下述的编码区:E2BIVa2(例如编码晚期转录激活蛋白和协助病毒DNA包装到病毒衣壳中的蛋白)、E2B Pol (例如编码病毒DNA聚合酶)、E2B pTP (例如编码附着在病毒基因组末端,是病毒复制或包装必需的末端蛋白)、L152K(例如编码病毒DNA包装到衣壳内所必需的蛋白)、LlIIIa(例如编码帮助稳定衣壳的次要结构蛋白)、L2III(五邻体(penton))(例如编码形成纤维突起处的衣壳顶点的主要结构蛋白)、L2pVII (例如编码与组蛋白H3有同源性并且与衣壳中的病毒DNA连接的核心结构蛋白)、L2V(例如编码在DNA和病毒衣壳之间形成连接的核心结构蛋白)和L2pX(例如编码结合并凝聚病毒基因组的核心结构蛋白)。在一些实施方案中,E2-L2模块与自然界中发现的腺病毒的E2B、L1和L2区的长度大概相同(例如参见图5)。“L3-L4”模块用于本文是含有病毒DNA聚合酶编码区和六邻体蛋白编码区中的至少一个的核酸。在一些实施方案中,L3-L4模块可能还包含病毒DNA结合蛋白编码区。在一些实施方案中,当E2-L2模块含有病毒DNA聚合酶编码区时,L3-L4不含有病毒DNA编码区,反之亦然。同样,当E2-L2模块含有六邻体蛋白编码区时,L3-L4不含有六邻体蛋白编码区,反之亦然。同样,当E2-L2模块含有病毒DNA结合蛋白编码区时,L3-L4不含有病毒DNA-结合蛋白编码区,反之亦然。换句话说,病毒DNA聚合酶编码区、六邻体蛋白编码区和病毒DNA结合蛋白编码区一般在组装好的核酸中只出现一次。L3-L4模块还可能包含下述的编码区:L3pVI (例如编码在衣壳和病毒基因组DNA之间于顶点形成连接的次要结构蛋白)、L3II (六邻体)(例如编码形成衣壳三角形面的主要结构蛋白)、L323K(例如编码对病毒蛋白进行加工从而完成衣壳组装的病毒蛋白酶)、E2A DBP(例如,编码与病毒DNA结合并协助复制的DNA结合蛋白)、L4100K(例如编码抑制细胞蛋白的合成并促进病毒晚期蛋白翻译的蛋白)、L433K(例如编码促进晚期病毒基因的剪接的蛋白)、一或多个纤维蛋白和L422K (例如编码促进晚期病毒基因表达并协助病毒DNA包装的蛋白)。在一些实施方案中,L3-L4模块与自然界中发现的腺病毒的L3、E2A和L4区的长度大概相同,或者与自然界中发现的腺病毒的L3、E2A、L4和L5区的长度大概相同(例如参见图5)。“核心大模块”(文中又称为“E2-L4大模块”)用于本文是指含有病毒DNA聚合酶编码区和六邻体蛋白编码区中的至少一个的核酸。在一些实施方案中,核心大模块还包含病毒DNA结合蛋白编码区。在一些实施方案中,核心大模块包含大多数病毒结构蛋白以及DNA复制和包装所需要的蛋白。在一些实施方案中,模块包含病毒DNA聚合酶编码区、六邻体蛋白编码区和病毒DNA聚合酶编码区。在其他实施方案中,核心可能还包含下述的编码区:L3pVI (例如编码在衣壳和病毒基因组DNA之间于顶点形成连接的次要结构蛋白)、L3II (六邻体)(例如编码形成衣壳三角面的主要结构蛋白)、L323K(例如编码对病毒蛋白进行加工从而完成衣壳组装的病毒蛋白酶)、E2ADBP (例如编码与病毒DNA结合并协助复制的DNA结合蛋白)、L4100K(例如编码抑制细胞蛋白的合成并促进病毒晚期蛋白翻译的蛋白)、L433K(例如编码促进晚期病毒基因的剪接的蛋白)、和L422K(例如编码促进晚期病毒基因表达并协助病毒DNA包装的蛋白)、E2B IVa2(例如编码晚期转录激活蛋白和协助病毒DNA包装到病毒衣壳中的蛋白)、E2B Pol (例如编码病毒DNA聚合酶)、E2B pTP(例如编码附着在病毒基因组末端,是病毒复制或包装所必需的末端蛋白)、L152K(例如编码将病毒DNA包装到衣壳内所必需的蛋白)、LlIIIa(例如编码帮助稳定衣壳的次要结构蛋白)、L2III (五邻体)(例如编码形成纤维突起处的衣壳顶点的主要结构蛋白)、L2pVII (例如编码衣壳中与组蛋白H3有同源性并且与病毒DNA连接的核心结构蛋白)、L2V (例如编码在DNA和病毒衣壳之间形成连接的核心结构蛋白)、一或多个纤维蛋白以及L2pX (例如编码结合并凝聚病毒基因组的核心结构蛋白)。在一些实施方案中,L3-L4模块与自然界中发现的腺病毒的E2B、L1、L2、L3、E2A和L4区的长度大概相同,或者与自然界中发现的腺病毒的E2B、L1、L2、L3、E2A、L4和L5区的长度大概相同(例如参见图5)。病毒DNA聚合酶基因所编码的蛋白含有的序列与SEQ ID NO: 32 (图7A-C)中给出的人AdOTNA聚合酶或者来源于另外一个物种的同源物的氨基酸996-1103中至少50个连续(或者全部)氨基酸有至少45%(例如50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的同一性。六邻体基因所编码的蛋白含有的序列与SEQID N0:73(图7D-G)中给出的人Ad5六邻体或者来源于另外一个物种的同源物的氨基酸501-747中至少50个连 续(或者全部)氨基酸有至少45%(例如50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%)的同一性。病毒 DNA 结合蛋白基因所编码的蛋白含有的序列与SEQ ID N0:103(图7H-1)中给出的人AdOTNA结合蛋白或者来源于另外一个物种的同源物的氨基酸408-475中至少50个连续(或者全部)氨基酸有至少35% (例如 45%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%)的同一I"生。
“E4模块”用于本文是含有腺病毒反向末端重复(ITR)的核酸。在一些实施方案中,E4另外包含一或多个纤维蛋白的编码区。E4模块可能还包含下述的编码区:E4orf6/7(例如编码介导病毒转录的E2F转录激活的蛋白)、E4orf6 (例如编码促进病毒DNA的合成、稳定和输出病毒晚期mRNAs,以及促进剪接的蛋白)、E4orf4(例如编码调节病毒转录和剪接并且调制PP2A的蛋白)、E4orf3(例如编码阻断p53介导的转录、破坏MRNDNA修复复合体和防止环化的蛋白)、E4orf2和E4orfl (例如编码促进经由PI3激酶进行的信号传导,从而导致蛋白合成和细胞存活的蛋白)。在一些实施方案中,E4模块与自然界中发现的腺病毒的E4区的长度大概相同,或者与自然界中发现的腺病毒的E4和L5区的长度大概相同(例如参见图5)。“E3模块”用于本文是含有一或多个纤维蛋白编码区和/或腺病毒反向末端重复(ITR)的核酸。在一些实施方案中,E3模块包含从pVIII的蛋白编码区末端到位于基因组右端的ITR的任何已知腺病毒序列(如图5所示)。pVIII编码区是任何这样的基因,所述基因编码的蛋白含有的序列与SEQ ID:135中给出的人Ad5pVIII中氨基酸6-43(图7J)中的至少50个连续(或者全部)氨基酸有至少35%(例如50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的同一性。E3模块可能另外包含下述的编码区:L4pVIII (例如编码次要结构蛋白)E312.5K、E3CR1 α (例如编码阻断细胞凋亡的蛋白)、E3gpl9K(例如编码抑制MHC-1抗原呈递的免疫调节蛋白)、E3ADP (例如编码具有有效裂解细胞以释放病毒的功能的蛋白)、E3RID α (例如编码去除细胞表面的促凋亡FasL和TRAIL的免疫调节蛋白)、E3RID β -(例如编码去除细胞表面的促凋亡FasL和TRAIL的免疫调节蛋白)、E314.7K(例如编码阻断细胞凋亡的蛋白)和L5IV(Fiber)(例如,编码从五邻体基座伸出的负责受体结合的主要结构蛋白)。在一些实施方案中,E3模块与自然界中发现的腺病毒的E3区的长度大概相同,或者与自然界中发现的腺病毒的E3和L5区的长度大概相同(例如参见图5)。“E3-E4大模块”用于本文是包含腺病毒反向末端重复(ITR)的核酸。E_3_E4大模块可能还包含从PVIII的蛋白编码区末端到位于基因组右端的ITR的任何已知腺病毒序列(如图5所示)。E3-E4大模块可能另外包含下述的编码区:E4orf6/7 (例如编码介导病毒转录的E2F转录激活的蛋白)、E4orf6 (例如编码促进病毒DNA的合成、稳定和输出病毒晚期mRNAs以及促进剪接的蛋白)、E4orf4(例如编码调节病毒转录和剪接并且调制PP2A的蛋白)、E4orf3 (例如编码阻断p53介导的转录、破坏MRN DNA修复复合体和防止环化的蛋白)、E40rf2、E40rfI (例如编码促进经由PI3激酶进行的信号传导,从而导致蛋白合成和细胞存活的蛋白)、L4pVIII (例如编码次要结构蛋白)、E312.5K、E3CR1 α (例如编码阻断细胞凋亡的蛋白)、E3gpl9K(例如编码抑制MHC-1抗原呈递的免疫调节蛋白)、E3ADP(例如编码具有有效裂解细胞以释放病毒的功能的蛋白)、E3RIDa (例如编码去除细胞表面的促凋亡FasL和TRAIL的免疫调节蛋白)、E3RID β -(例如编码去除细胞表面的促凋亡FasL和TRAIL的免疫调节蛋白)、Ε314.7Κ (例如编码阻断细胞凋亡的蛋白)和L5IV (Fiber)(例如,编码从五邻体基座伸出的负责受体结合的主要结构蛋白)。在一些实施方案中,一或多个腺病毒基因模块相对腺病毒基因模块所来源的天然腺病毒中发现的模块序列(例如野生型),包含一或多个突变(例如,核酸的取代、添加或缺失)。例如,本文提供的核酸可能编码有效数量的腺病毒基因模块,从而在某些细胞条件下,核酸转染到细胞中时导致形成有复制能力的腺病毒。一或多个腺病毒基因模块中的突变可能使得得到的腺病毒在一些细胞(例如,患病细胞,比如癌细胞)中能够复制,而在其他细胞(例如,未患病细胞,比如健康细胞)中不复制。突变还可能包含一或多个蛋白编码区的添加(例如添加一或多个外源或异源蛋白编码区,比如非病毒蛋白编码区)。一或多个蛋白的添加可能带来额外的病毒功能、丢失病毒功能(例如复制)、提供病毒检测方法(例如荧光标记物)、提供病毒纯化方法(例如带有His标签的衣壳蛋白)或者提供能够产生目标蛋白的病毒,所述蛋白随后经分离和/或纯化进一步使用。因此,突变可能增加了病毒功能或者减少了病毒功能。因此本文制备的重组腺病毒包括通过引入外源(例如异源)核酸或者改变天然核酸序列而被改造的腺病毒。所述改变可以是如上所述通过一或多个腺病毒基因模块中的突变进行的,或者是通过将天然腺病毒基因组中存在的一或多个腺病毒基因模块排除进行的。因此在一些实施方案中,核酸包括发生突变的腺病毒核酸序列。腺病毒核酸序列是在自然界或者天然腺病毒(例如野生型)中发现的序列。发生突变的腺病毒核酸序列可能是如上所述由一或多个腺病毒基因模块中的突变造成的,或者是通过将天然腺病毒基因组中的一或多个腺病毒基因模块排除得到的。在某些实施方案中,核酸包括发生缺失的腺病毒核酸序列、异常腺病毒核酸序列或者外源(例如异源)核酸序列(例如编码非腺病毒基因产物)。发生突变的腺病毒核酸序列可能包括突变的E4-0RF3基因产物(带来改变的功能)、突变的ElB-55k基因产物、突变的腺病毒纤维基因产物、突变的病毒外壳蛋白、前药转化酶、报告蛋白、突变的六邻体蛋白、与PlX融合的蛋白、对某些细胞有毒性的蛋白、来自获得核酸的类型以外的腺病毒的完整或部分纤维基因、和/或靶向蛋白(例如肿瘤靶向蛋白或者脉管靶向蛋白)。在一些实施方案中,核酸包含El模块。核酸还可以包含El模块和E4模块。在某些实施方案中,核酸包含El模块和E2-L2模块。核酸还可以包含El模块和L3-L4模块。核酸还可以包含El模块、E2-L2模块和L3-L4模块。在一些实施方案中,方法包括由选自El模块、核心模块、E3模块和/或它们的衍生物或组分的至少三个腺病毒基因模块组装核酸。在相关实施方案中,例如对于人Ad5,方法包括由El模块、E2-L2模块、L3-L4模块、E3模块和E4模块组装核酸。在某些实施方案中,形成的核酸至少长 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49 或 50kb。在一些实施方案中,形成的核酸至少长10、ll、12、13、14、15、16、17、18、19、20、21、22kb。在一些实施方案中,形成的核酸至少长10、ll、12、13、14、15kb。在一些实施方案中,形成的核酸至少长10、ll、12kb。在一些实施方案中,形成的核酸至少长12kb。

由本文提供的方法形成的核酸可以是任何能够表达的核酸。核酸可以被表达从而产生腺病毒。腺病毒可能是感染性的和/或可以自我复制的(例如复制型的)。在一些实施方案中,核酸是质粒。在一些实施方案中,组装包括将腺病毒基因模块(或大模块)组合在一起形成核酸,其中腺病毒模块或大模块的方向有助于在导入细胞时形成有复制能力的腺病毒(例如能够在细胞内表达或形成病毒)。因此,在一些实施方案中,腺病毒基因模块(例如大模块)被组装成特定的取向。可以采用任何适合的克隆技术,包括例如所谓的“gateway”技术和/或不依赖序列和连接反应的克隆技术(“SLIC”)。Gateway技术或者类似的技术采用位点特异性重组将来自一条核酸的核酸(例如DNA)片段交换为另一个。最终结果是将一个核酸序列插入了目标载体或质粒。这些技术和方法在文中一起被称为“位点特异性重组法”或者“ SSR方法”。在SSR方法的一个这样的应用中,DNA片段被从入门载体转移到目标载体中,其结果是目标载体的繁殖(图9)。入门载体和目标载体一般含有重组位点。在一些实施方案中,入门载体是能够重组型的。在其他实施方案中,入门载体是能够杂交的。杂交型入门载体可能含有一或多个腺病毒基因模块,这些模块可以通过限制性酶切从入门载体中释放出来,从而释放出腺病毒基因模块。本文提供了吸取了 gateway技术的SSR方法,可以将腺病毒基因模块插入目标载体从而形成核酸(例如核酸质粒)。使用gateway技术的一般方法在例如 Sone et.al., J Biotechnol.(2008) SeplO; 136 (3-4): 113-2l>Hartley, et al., GenomeRes.(2000),10,1788 - 1795 和 Sasaki, et al.,J.Biotechnol.(2004),107,233 - 243 中有描述。例如,使用SSR方法时,组装包括将重组型目标载体(例如包含重组位点核酸序列`的目标载体)和一或多个腺病毒基因模块与整合酶(例如λ噬菌体整合酶、λ噬菌体切除酶或细菌宿主的整合因子)接触,从而形成腺病毒基因模块载体。所述一或多个腺病毒基因模块是有重组能力的腺病毒基因模块(例如包含重组位点核酸序列的腺病毒基因模块)O在一些实施方案中,一或多个有重组能力的腺病毒基因模块是通过给腺病毒基因模块添加重组位点核酸序列,从而形成一或多个重组型腺病毒基因模块。在其他实施方案中,一或多个有重组能力的腺病毒基因模块是重组型入门载体的一部分。在一些实施方案中,含有一或多个腺病毒基因模块的重组型入门载体是通过将一或多个有重组能力的腺病毒基因模块和重组型供体载体与整合酶接触形成,从而形成含有一或多个腺病毒基因模块的重组型入门载体。因此,在一些实施方案中,重组型目标载体和含有一或多个腺病毒基因模块的一或多个重组型入门载体与整合酶活性接触,从而形成腺病毒基因模块载体。图20-21示意了本文提供的建立人Ad5的方法的实施方案。组装包括将目标载体和各含有腺病毒基因模块的一或多个入门载体与一或多个λ曬菌体整合酶、λ曬菌体切除酶或细菌宿主的整合因子组合,从而形成腺病毒基因模块载体。在一些实施方案中,入门载体是通过给腺病毒基因模块添加重组位点,然后将供体载体和一或多个λ噬菌体整合酶、λ噬菌体切除酶或细菌宿主的整合因子组合,从而形成腺病毒基因模块入门载体。目标载体是腺病毒基因模块与之连接的核酸,比如质粒。所述连接可能是通过含有要包含(插入)到目标载体中的腺病毒基因模块的一或多个入门载体的交换进行的。在与重组型目标载体和一或多个腺病毒基因模块与整合酶(例如整合酶、切除酶和/或宿主整合因子)接触(例如组合)之前,目标载体中可能存在一或多个腺病毒基因模块。重组位点核酸序列,文中又称为“att”位点是协助两个核酸之间进行体外位点特异性重组的核酸序列。在一些实施方案中,重组位点核酸序列大约长21bp。例如,重组位点核酸序列可能是gateway重组信号,比如图10所示的和/或Sone et.al., J Biotechnol.(2008) SeplO;136(3-4):113-21;Hartley, et al., Genome Res.(2000),10,1788 - 1795 和Sasaki, et al., J.Biotechnol.(2004), 107, 233 - 243 中给出的(例如 attB 位点、attL 位点、attR位点、attP位点、attBr位点、attPr位点等)。在一些实施方案中,一或多个有重组能力的腺病毒基因模块形成供体载体的一部分(或者存在于供体载体中)。所述供体载体可以是与gateway技术或者相似类型的克隆技术相容的质粒。在一些实施方案中,DEST载体含有不同反选盒。反选盒是在某些条件下阻止细菌细胞生长的任何DNA片段。图22描 述了本文提供的方法中使用的各种反选盒的效率。图19详细描述了利用多位点gateway策略,重组Ad5腺病毒基因模块的原始方案。这个具体策略涉及四个入门载体的组合,其中三个是腺病毒基因模块,第四个是无关的填充模块。这四个模块一经组合,即可通过gateway反应除去填充模块从而形成目标载体。最后,通过gateway反应插入其余两个腺病毒基因模块得到完整的病毒基因组。当gateway反应中使用的是较大的腺病毒基因模块时,这个原始方案效率不高,并且存在Ad5El模块带来的毒性问题。组合方法(例如SLIC和SSR方法)使得更容易由模块组装基因组(例如,进行的步骤更少,每个步骤效率更高)。SLIC技术通过依靠两个核酸(例如DNA片段)中由外切核酸酶生成的单链核酸(例如DNA)突出,进行了单链同源序列的退火(图16)。因此,SLIC技术采用依靠在插入核酸(例如DNA)和目标载体中由外切核酸酶生成的单链核酸(例如DNA)突出进行的同源重组和单链退火(例如杂交)。本文提供的方法采用SLIC技术将腺病毒基因模块插入到目标载体中从而形成核酸(例如核酸质粒)。这个过程在文中还被称为AdSlic或AdSlicR。例如 Li et al., Nature Methods (2007),4,251-256 中描述了使用 SLIC 技术的一般方法。图25示意了给人Ad5建立的AdSlicR的例子。图26详细描述了 AdSlicR方法中反应的效率。例如,使用SLIC技术(或类似的克隆技术)的情况中,组装包括将(例如每个末端)带有单链核酸(例如DNA)突出的可杂交型目标载体(例如目标载体(例如线性载体))与一或多个腺病毒基因模块进行杂交(例如退火),从而形成腺病毒基因模块载体。所述可杂交型目标载体在文中还可以被称为SLIC型载体。所述一或多个腺病毒基因模块可以是可杂交型腺病毒基因模块(例如,这样的腺病毒基因模块(例如,线性腺病毒基因模块),所述模块(在例如每个末端)带有至少一个单链核酸(例如DNA)突出能够有效地与目标载体上的单链核酸(例如DNA)突出互补,从而协助(在例如严紧条件下)杂交)。在一些实施方案中,目标载体突出和腺病毒基因模块突出各种长大约20到25bp。可杂交型目标载体可以利用任何合适的方法形成。例如,在一些实施方案中,当目标载体是环形的(例如质粒),将目标载体(例如利用内切核酸酶)切割形成线性目标载体。任何将线性目标载体与外切核酸酶(即具有外切核酸酶活性的酶,比如T4DNA聚合酶)接触,从而形成可杂交型目标载体。类似地,可以通过将腺病毒基因模块与外切核酸酶接触(例如处理)而形成可杂交型腺病毒基因模块。在一些实施方案中,可杂交型目标载体与一或多个腺病毒基因模块的杂交可能包括将可杂交型目标载体和腺病毒基因模块与DNA聚合酶合并在一起。在一些实施方案中,当腺病毒基因模块是环形或者包含在环形质粒中时,在外切核酸酶处理前通过内切核酸酶将腺病毒基因模块线性化。因此,在一些实施方案中,一或多个可杂交型腺病毒基因模块是通过将包含一或多个入门载体腺病毒基因模块的入门载体与内切核酸酶接触,从而形成一或多个释放出来的入门载体腺病毒基因模块。所述一或多个释放出来的入门载体腺病毒基因模块可以与外切核酸酶接触,从而形成一或多个可杂交型腺病毒基因模块。文中提到的入门载体腺病毒基因模块是作为入门载体的一部分的腺病毒基因模块。文中提到的释放出来的入门载体腺病毒基因模块是由例如限制性内切酶从入门载体上释放出来的腺病毒基因模块。在一些实施方案中,腺病毒基因模块不是环形的(例如通过PCR或基因合成获得的),不需要在外切核酸酶处理前进行线性化。在一些实施方案中,将SLIC型载体与一或多个腺病毒基因模块进行退火可能包括将SLIC型载体和腺病毒基因模块与DNA聚合酶组合。在一些实施方案中,SLIC型载体在与SLIC型腺病毒基因模块退火前,含有一或多个腺病毒基因模块。因此在一些实施方案中,可以顺序进行多重SLIC反应来插入多重腺病毒基因模块。在一些实施方案中,为了获得处于质粒中的腺病毒基因组以便作为产生腺病毒基因模块的模板,可以利用SLIC将整个腺病毒基因组插入质粒骨架。在一些实施方案中,SLIC型腺病毒基因组是从纯化的病毒保藏物中获得的。图30示意了这一过程的一个实施方案,并提供了人Ad5的例子。腺病毒基因模块载体是含有至少一个腺病毒基因模块的核酸。利用合适的克隆技术,给目标载体添加所需数量的 腺病毒基因模块,从而形成腺病毒基因模块载体。例如,一旦形成后,可以利用合适的克隆技术(例如gateway克隆技术和/或SLIC克隆技术)进一步改造腺病毒基因模块(例如腺病毒基因模块载体),以便加入更多腺病毒基因模块,从而形成核酸,后者即可(在例如细胞内)被表达形成腺病毒(例如可以复制的腺病毒)。因此,在一些实施方案中,可以利用合适的克隆技术将第一个腺病毒基因模块进一步改造形成第二个、第三个和/或第四个腺病毒模块,其中分别向载体添加了第二、第三和/或第四腺病毒基因模块,从而形成了核酸,核酸经表达形成腺病毒(例如可复制的腺病毒)。因此在一些实施方案中,核酸是腺病毒基因模块载体。的确,可以使用不同的克隆技术来组装核酸或腺病毒基因模块载体。在一些实施方案中,组装包括将可杂交型目标载体与第一腺病毒基因模块杂交(例如退火)从而形成第一腺病毒基因模块载体。第一腺病毒基因模块可能是可杂交型腺病毒基因模块。第一腺病毒基因模块载体可以和第二腺病毒基因模块入门载体与整合酶(例如整合酶、切除酶或者宿主整合因子)进行接触(例如合并),从而形成第二腺病毒基因模块载体。第二腺病毒基因模块载体可能是可重组型第二腺病毒基因模块载体(例如目标载体),第二腺病毒基因模块可能是可重组型第二腺病毒基因模块。在一些实施方案中,第一腺病毒基因模块是E2-L2模块、L3-L4模块或者E2-L4大模块。第二腺病毒基因模块可以是El模块、E3模块或者E4模块。图20-21提供了联合使用克隆方法来组装腺病毒基因模块的例子,其中联用了 SLIC和 gateway。在其他实施方案中,组装包括将可重组型目标载体和第一腺病毒基因模块与(在有)整合酶(例如,整合酶、切除酶或者宿主整合因子)进行接触(例如合并),从而形成第一腺病毒基因模块载体。第一腺病毒基因模块是可重组型第一腺病毒基因模块(例如入门载体)。第一腺病毒基因模块载体与第二腺病毒基因模块杂交,从而形成第二腺病毒基因模块载体。第一腺病毒基因模块载体是可杂交型腺病毒基因模块载体(例如目标载体)。第二腺病毒基因模块是可杂交型腺病毒基因模块(例如入门载体)。在一些实施方案中,第二腺病毒基因模块是E2-L2模块、L3-L4模块或者E2-L4大模块。第一腺病毒基因模块可以是El模块、E3模块或者E4模块。在一些实施方案中(例如人Ad5的例子中),E2-L2模块和L3-L4模块分别大约14kb和10kb。文中提供的一个发现是E2-L2和L3-L4模块的大小太大,在一些实施方案中利用标准或者gateway (例如多位点gateway)克隆技术不能有效地组装为核酸。图15中提供了例子。因此在一些实施方案中,SLIC克隆技术(或类似的克隆技术)被用来将这些模块插入到目标载体(例如入门载体)中。利用例如gateway克隆技术添加其他腺病毒基因模块。因此在一些实施方案中,当E2-L2模块和L3-L4模块被组装为核酸时,优选联用SLIC和gateway (例如多位点gateway)克隆策略来组装核酸。图20-21中给出了 SLIC和gateway (例如多位点gateway)克隆策略联用的特定实施方案。本文提供的方法的某些实施方案实现了快速有效的腺病毒基因组构建体的组装。一些情况中,腺病毒基因组构建体在不到10、9、8、7、6、5、4、3、2或者I个小时内即可组装好。本文提供的方法还使得可以进行腺病毒片段到载体的插入、在个别载体内进行的简单独立突变、和/或多位点特异性体外组装。如下文所述,在一些实施方案中,一个或全部腺病毒基因模块可能选自重组腺病毒基因模块库。因此,Adsembly过程的某些实施方案能够快速有效地构建多种重组腺病毒,从而可以根据腺病毒基因模块的最佳组合快速优化定制腺病毒的功能性。因此方法提供了通过将来自各种腺病毒血清型的部分进行混合和匹配以制备新的腺病毒血清型嵌合体的能力。这使得不仅能将每个血清型的独特属性结合在一起,而且能够利用到血清型的不同向性以及避开对流行血清型已有的免疫能力的可能性。本文提 供的方法的某些实施方案避免了对有限的限制酶位点克隆技术的依赖性。方法还可以避开对腺病毒血清型5的单一依赖性。确实在人Ad5的例子中,当采用了 El模块、E2-L2模块、L3-L4模块、E3模块和E4模块所有5种模块时,相对以前的已知方法突变体选择显著增加。在某些实施方案中,本文提供的方法能够在基因组中同时形成复合的变化。所述方法还可能避开以前的单一依赖在专门化细菌菌株或哺乳动物细胞培养物(例如MAGIC)中经常需要几个月进行低效同源重组的已知基因组组装方式。而且,本文提供的方法的某些实施方案给出了简单的试验方案,只需常见试剂而无需使用专门的细菌(例如ccdB抗性)。本文提供的方法和文库的用途包括例如:(I)为了基因功能分析而进行的腺病毒基因的突变,(2)获得腺病毒突变体,其中腺病毒基因功能的丢失使它们不能在正常细胞内复制,但在能够补充其功能的肿瘤细胞中可以选择性地发生裂解性复制。(3)靶向基因表达,作为复制缺陷型载体或者可复制型病毒。(4)方法可以提供用于基因表达的新的复制缺陷型腺病毒。可以将利用文中所述方法组装的腺病毒为了这个目的进行优化。在人Ad5的情况中,El模块文库可能包括例如多个ElA或ElB缺失的模块和/或每个含有不同的哺乳动物启动子从而允许使用者能够选择最佳启动子来表达目的基因。(5)利用已有的腺病毒基因组转录构架进行多基因表达。在El模块、E2-L2模块、L3-L4模块、E3模块和E4模块中每一种都运用了的实施方案中,只有E4模块中不存在突变。可以利用任何适宜的方法(例如PCR技术或者基因合成),从任何合适的腺病毒获得El模块、E2-L2模块、L3-L4模块、E3模块、E4模块以及它们的大模块。例如,可以用从纯化病毒获得的病毒基因组DNA进行PCR(图14)。图13详细描述了人Ad5腺病毒基因模块的PCR效率。在一些实施方案中,El模块、E2-L2模块、L3-L4模块、E3模块和E4模块的组合构成了或者它们的大模块构成了完整的或者基本完整的腺病毒基因组。利用文中提供的教导,本领域技术人员可以确定模块之间中断处的确切位置。例如,可以利用生物信息学手段确定重组位点核酸序列(例如,gateway重组信号或者gateway重组位点)的最佳插入位点。可以将多个腺病毒血清型进行比对,并在腺病毒基因模块之间进行基因组区域的保守性分析。在一些实施方案中,避开了血清型之间的核苷酸保守区,而简并区域是可以接受的插入位点。例如,图12、图35、图36、图37和图38中箭头指示了人Ad5中某些适宜的重组位点核酸序列的插入位点。在一些实施方案中,腺病毒基因模块之间的序列可能较短,因此需要序列的重复。图12提供了一个例子,其中由于Ad5纤维蛋白polyA和E4polyA之间的序列短,与attB位点插入一起插入了一个27bp的Ad5序列重复。在一些实施方案中,核酸(例如腺病毒基因模块载体)包含一或多个重组位点核酸序列。图35-39中公开了一些例子,但这些例子不是意图限制重组位点核酸序列在重组腺病毒中的核酸序列位置如何影响重组腺病毒的生长速率。因此在一些实施方案中,包含一或多个重组位点核酸序列(例如att位点)的重组腺病毒可能比没有一或多个重组位点核酸序列的重组腺病毒生长地慢。在其他实施方案中,包含一或多个重组位点核酸序列(例如att位点)的重组腺病毒可能与没有一或多个重组位点核酸序列的重组腺病毒生长地至少一样快。在其他实施方案中,核酸(例如腺病毒基因模块载体)包含位于E3模块和E4模块之间的重组位点核酸序列。在一些实施方案中,E3模块和E4模块之间的重组位点核酸序列是attB3重组位点核酸序列。在一些实施方案中,核酸(例如腺病毒基因模块载体)包含位于如SEQ ID NO: 137中给出的核苷酸32904之后的或者位于所述序列同源物中的等同核苷酸之后的重组位点核酸序列。在其他实施方案中,核酸(例如腺病毒基因模块载体)包含位于El模块和E2-L2模块之间的重组位点核酸序列。在其他实施方案中,核酸(例如腺病毒基因模块载体)包含位于如SEQ ID NO: 137中给出的核苷酸4035之后的或者位于所述序列同源物中的等同核苷酸之后的重组位点核酸序列。在其他实施方案中,核酸(例如腺病毒基因模块载体)包含位于如SEQ ID NO: 137中给出的核苷酸3608之后的或者位于所述序列同源物中的等同核苷酸之后的重组位点核酸序列。在一些实施方案中,核酸(例如腺病毒基因模块载体)包含位于L3-L4模块和E3模块之间的重组位点核酸序列。在一些实施方案中,L3-L4模块和E3模块之间的重组位点核酸序列是attB5重组位点核酸序列。在其他实施方案中,核酸(例如腺病毒 基因模块载体)包含位于El模块和E2模块之间的第一重组位点核酸序列、L3-L4模块和E3模块之间的第二重组位点核酸序列、E3模块和E4模块之间的第三重组位点核酸序列。在其他实施方案中,第一重组位点核酸序列包含在核酸中如SEQ ID NO: 137中给出的核苷酸4035之后或者所述序列的同源物中等同核苷酸之后,第三重组位点核酸序列包含在核酸中如SEQ ID NO: 137给出的核苷酸32904之后或者所述序列同源物中等同核苷酸之后。以下列出的插入策略的例子显示了 Ad5基因组(SEQ ID NO: 137)中的四个插入。数字表示已公开的Ad5基因组序列中重组位点核酸序列插入所位于的核苷酸位点。在以下例子中,attB序列(即重组位点核酸序列)带有下划线,最后一个插入的Ad5序列重复显示为粗体。本领域技术人员很容易识别相似情景中或者同源病毒序列中合适的和/或等同的插入位点。4075 和 4076 之间的:CAACTTTTCTATACAAAGTTGTA17959 和 17960 之间的:CAACTTTTTAATACAAAGTTG27173 和 27174 之间的:TCAACTTTGTATACAAAAGTTGTG32815 和 32816 之间的:ACAACTTTGTATAATAAAGTTGCTGAATCGTTTGTGTTATGTTTCAACGTG图21中的组装策略被使用17次来产生感染性人Ad5病毒。图24详细描述了本文提供的方法的效率。在四·个独立情景中,野生型Adsembled腺病毒被转染至细胞内,产生了病毒。此外,该实验方案生成了 13个突变体腺病毒,全部能够产生感染性病毒。图27提供了由转染重组装得到的表现为单个噬菌斑并且在293细胞上进行了传代的野生型Ad5的图像。由图20-21和图25中的策略产生的病毒在293细胞中测试了复制效率,如图28所
/Jn ο另一方面,提供了通过本文公开的方法制备的腺病毒。在一些实施方案中,腺病毒是可复制型的。在另一个实施方案中,腺病毒不是可复制型的。I1.腺病毒基因模块和大模块文库另一方面,提供了包含复数个腺病毒基因模块(例如大模块)的文库。在一些实施方案中,文库包含复数个不同El模块。在其他实施方案中,文库包含复数个不同E2-L2模块。在其他实施方案中,文库包含复数个不同L3-L4模块。在其他实施方案中,文库包含复数个不同E3模块。在其他实施方案中,文库包含复数个不同E4模块。在其他实施方案中,文库包含复数个不同核心大模块。在一些实施方案中,根据以上描述的方法制备了腺病毒基因组文库。在其他实施方案中,文库包含复数个不同El模块、复数个不同E2-L2模块、复数个不同L3-L4模块、复数个不同E3模块、复数个不同E4模块和/或复数个不同核心大模块。在一些实施方案中,文库包含复数个不同大模块,其中所述大模块包含复数个不同E1-L2大模块、复数个不同E2-L4大模块(即核心大模块)和/或复数个不同E3-E4大模块。在一些实施方案中,复数个不同腺病毒基因模块和/或大模块区别在于它们来源于不同的腺病毒类型(例如不同种或者不同血清型)。例如,在一些实施方案中,复数个不同El模块、复数个不同E2-L2模块、复数个不同L3-L4模块、复数个不同E3模块、复数个不同E4模块和/或复数个不同大模块(例如核心大模块)包含来自复数个腺病毒类型(例如一个以上人腺病毒血清型)的腺病毒基因模块。在一些实施方案中,复数个不同腺病毒基因模块和/或大模块区别在于它们编码不同的突变体模块或大模块(例如缺失的腺病毒核酸序列、取代的腺病毒核酸序列、异常的腺病毒核酸序列或者编码非腺病毒基因产物的核酸序列)。例如,文库可能包含复数个不同的El模块、复数个不同的E2-L2模块、复数个不同的L3-L4模块、复数个不同的E3模块、复数个不同的E4模块或者复数个不同的大模块(例如核心大模块),所述模块包含缺失的腺病毒核酸序列、突变的腺病毒核酸序列、异常腺病毒核酸序列或者编码非腺病毒基因产物的核酸序列。在一些实施方案中,复数个不同的腺病毒基因模块和/或大模块是可重组型的(例如,包含在入门载体中)。例如,文库可以包含可重组型的复数个不同的El模块、复数个不同的E2-L2模块、复数个不同的L3-L4模块、复数个不同的E3模块、复数个不同的E4模块和/或复数个不同的E2-L4大模块。在一些实施方案中,复数个不同的腺病毒基因模块和/或大模块是可杂交型的(例如比如线性化后是SLIC型的)。例如,在一些实施方案中,文库包含可杂交型的复数个不同的El模块、复数个不同的E2-L2模块、复数个不同的L3-L4模块、复数个不同的E3模块、复数个不同的E4模块和/或复数个不同的E2-L4大模块。

本文提供的文库的部分可以由不同使用者制备,在不同使用者之间共享。可以将各种腺病毒基因模块混合和匹配构建具有所需功能或者没有某功能的新的腺病毒构建体。因此本文的方法和文库提供了通过将来自各种腺病毒血清型的部分进行混合和匹配以制备新的腺病毒血清型嵌合体的能力。腺病毒基因模块文库给使用者提供了构建理想腺病毒载体的多项选择。在一些实施方案中,腺病毒基因模块可能对细菌是有毒的。例如,图18显示了人Ad5El模块的毒性。在一些实施方案中,可能需要将腺病毒基因模块包含在以低拷贝数维持的质粒中(例如P15A复制原点)。在一些实施方案中,腺病毒基因模块毒性、大小或者其他因素可能会妨碍它们在SSR方法(例如gateway反应)中的用途。例如,图15详细描述了 5个人Ad5腺病毒基因模块的标准gateway BP反应效率。在一些实施方案中,使用SSR方法(例如gateway反应)效率低的腺病毒基因模块可以通过替代的克隆方法(例如SLIC)来操作。图17示意了用SLIC代替SSR方法(例如利用gateway克隆酶)来制备入门载体的策略。II1.试剂盒另一方面,提供了供本文描述的方法和文库使用的试剂盒,所述试剂盒包含含有选自El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或者腺病毒大模块(或者如下所述的它们的突变体)的两个或更多个腺病毒基因模块的核酸。试剂盒的合适成分包括以上I和/或II部分中讨论过的组合物和成分。例如在一些实施方案中,试剂盒可能包含核酸,所述核酸含有选自El模块、E2-L2模块、L3-L4模块、E3模块、E4模块或者腺病毒大模块中的3、4或5个腺病毒基因模块。正如上文讨论过的,核酸可能构成载体(例如质粒)(例如目标载体或供体载体)的一部分。在一些方面中,本文提供的试剂盒可能包含带有或者没有腺病毒基因模块的载体。可用于试剂盒的载体可能包含一或多个重组位点核酸序列和/或单链核酸突出(或者在与合适的酶接触时能够形成单链核酸突出的核酸序列)。在一些实施方案中,载体是如上所述的可杂交型的目标载体、SLIC型载体或者供体载体。载体可以包含一或多个腺病毒基因模块。在一些实施方案中,载体中包含反选盒。参考本文对Adsembly方法和文库的描述,用于实施本文提供的方法的试剂盒的其他成分是显而易见的(例如外切核酸酶、整合酶、启动子序列等)。IV.实施例以下实施例仅供阐释而非限制要求保护的发明。A.病毒组装方法1.“组合”化学和“重组”病毒基因组以开发新一代病毒载体和复制裂解性癌症疗法我们开发了由组成部分快速离体组装病毒基因组的新的重组策略,从而能够对多重修饰和异源元件进行系统地组合。腺病毒载体的多种应用潜能受限于快速和系统地改造和组合多重基因修饰的能力。当前使用的方法主要依赖于基因组中在合适位置上存在的独特的合适限制酶位点,一般来说不适合系统地使用或者不能在快速的单一步骤中生成准确的复合修饰。大基因组DNA片段的操作和缺乏独特的限制位点使这种方法有技术上的难度和受到限制。另一种方法需要生成带有要改造基因组区域的小“穿梭”载体,和带有病毒基因组的“骨架”载体。对这些载体来说主要限速步骤是重组,所述重组或者是在哺乳动物细胞内通过同源重组发生的(概率非常小的事件,发生在随机位点,需要进行多轮噬菌斑纯化来分离所需的重组体),或者是在特殊的细菌菌株中通过同源重组发生的。这些方法有它们的局限性。

为了克服目前技术的局限性,我们开发了新的腺病毒基因组组装策略,使得能够快速和系统地过夜生成复合病毒突变体。这样可以省略在哺乳动物细胞内进行的低效不准确重组、对BACs或穿梭载体的需要、费时费力的噬菌斑纯化。这个策略提供了由组成部分快速体外组装新的病毒基因组的能力,包括:1)对病毒基因的多重突变/修饰;2)来自其他病毒亚型的基因(例如结合不同受体的病毒外壳蛋白),和改变血清型;3)异常基因,例如前药转化酶以便诱发强力的肿瘤旁观者效应;4)添加荧光报告物或标签用于体内造影和诊断,以及5)定向体外病毒进化。此外,这项技术利用了天然的病毒转录构架,对于人Ad5它编码了 36个基因(不包括剪接变体),因此多蛋白复合体和整个途径可以经由腺病毒感染来组装、递送和共表达。为了克服Ad2/5和目前的方法学的局限,我们开发了 Adsembly方法,使得能够体外由基因组组成部分和异源元件快速离体组装腺病毒基因组。利用生物信息学手段,我们根据进化保守序列、转录和功能模块,将不同腺病毒基因组(36-38kb)分为5个单位。这5个单位的每一个包含基因组构成成分文库的相容部分,通过突变或异源元件的加入可以改变它们的功能和多样性,并且这些功能和多样性可以通过添加来自完全不同的腺病毒血清型、突变体和种的等同单位进一步扩展。为了制备具有独特性能的新腺病毒,从文库中选择每个单位各一个,利用Adsembly (例如Ad-SlicR)快速体外重新组装成完整基因组。可以利用Adsembly通过多位点特异性重组来组装新的基因组,所述基因组在转染后,即从质粒骨架上自我剪接并复制产生新的病毒。可以利用Ad-SlicR策略除去插入的重组序列以便实现更强力的病毒复制(如果需要)和临床应用。本文公开的策略可以使用基因组构成元件文库,所述文库是由具有不同Ad2/5向性和其他所需特性的人和/或动物腺病毒制备的或者已经经过基因改造被赋予了改变的功能性。为了实现这一目的,我们利用了经过修饰,特异性和效率得以提高的噬菌体位点特异性重组系统,又被称为Gateway 。被命名为attB、attP、attL和attR的四类重组位点经由不同噬菌体酶进行重组。最近鉴定到了新的att位点特异性,可以允许多个DNA片段以一定的顺序和方向进行同时重组。本文公开的是该系统的新应用,即由基因组组成部分离体组装整个病毒基因组。令人惊讶的是这项技术革新了腺病毒载体的建立和潜在应用。使用引入了独特attB位点(编号1-6)对的引物组来扩增与之匹配的相邻病毒基因组。Ad5腺病毒基因组长36kb,暂时划分为“早期”(E)和“晚期”(L)转录单位,它们共同编码36-40个基因。野生型Ad5/2、Ad5/2的突变体和完全不同的腺病毒亚型或动物病毒被用做DNA模板。将PCR片段重组到“入门”载体中生成含有腺病毒基因组组成元件的文库。LR重组到目标载体中使得个体元件多种排列组装成新的病毒基因组(图1B)。通过对目标载体的抗生素抗性进行的阳性选择和对大肠杆菌中未反应目标载体进行的阴性选择(毒性基因ccdB提供的(Hartley et al.,2000))来协助这一过程。对于片段的数量或大小限制了重组效率的情况,制备了中间目标载体,其中的第二 BP/LR反应中发生modular replacement或者完全组装。该快速病毒DNA操作新方法通过利用DNA重组的固有化学属性改变了新病毒的工程化过程。还引入 了其他组合,例如,腺病毒34纤维蛋白,该蛋白与CD46细胞受体结合,能够规避针对Ad2/5病毒产生的中和抗体。2.材料与方法采用以上指导方针,用以下参照成分制备了经过改造的腺病毒。使用了 GatewayDONR载体。在人Ad5的例子中,经PCR获得El模块并利用SLIC插入载体pDONR P1P4。利用PCR扩增包含attLl和attL4重组位点的pDONR P1P4载体骨架,并通过SLIC与Ad5El模块组合。为了制备替代的反选盒,对载体pDONR P1P4进行了改造。包含attPl和attP4重组位点的该载体骨架利用PCR扩增,并与PheSA294(:突变和四环素抗性盒(来自pENTR L3-pLac-Tet-L2的pLac-Tet盒)组合形成新的DONR载体。然后经PCR扩增新DONR 载体中的 attRl-PheSA294G-Tet (r) _attR4 片段,并插入到 Adsembly DEST 载体中。参见“MultiSite Gateway Pro Plus”,Cat#12537-100 和 Sone, T.et al.J Biotechnol.2008S印10;136(3-4):113—21。在人Ad5的例子中,E3模块经gateway BP反应插入pDONR P5P3r载体。E4模块经gateway BP 反应插入 pDONR P3P2 载体。来自 pDONR P5P2 载体的 attR5-ccdB_Cm(r) _attR2片段经 PCR 扩增,插入 Adsembly DEST 载体中。参见 “MultiSite Gateway ProPlus”,Cat#12537-100;and Sone,T.et al.JBiotechnol.2008S印10;136 (3-4):113-21。用于Adsembly DEST载体的载体骨架是由来自三个不同来源的部分构成的。Amp (r)盒和IacZ基因是从质粒pUC19扩增的。将它们与pl5A复制原点组合,所述复制原点来自质粒 pSB3K5_I52002 (BioBricksiGEM2007partsdistribution 的一部分)。使质粒保持在较低(10-12)拷贝数的pl5A ori是减少El毒性所需要的。最后,为了产生能够自身切除的病毒,从pAdZ5-CV5-E3+质粒PCR 1-SceI酶的哺乳动物表达盒。将该盒克隆到载体骨架中形成被称为P15A-Scel的载体。这是启动基因组组装所使用的载体。在Ad5的例子中,基因模块全部得自由野生型Ad5病毒纯化的DNA或者质粒pAd/CMV/V5/DEST (Invitrogen)。对于人Ad5例子中的DEST载体,将E2和L3模块通过3片段SLIC插入质粒pl5A_SceI。旁侧带有attR5和attR2位点的表达ccdB的反选标记物和Chlor (r)通过PCR从质粒pDONR P5P2获得。第二反选标记物(PheS-Tet)是经PCR从载体pDONRPlP4PheSA294G-Tet (见上文)获得。将这两个反选标记物用加在E2和L4模块末端的独特限制酶切割后,通过SLIC插入pl5A-SceI E2-L4的右侧(ccdB/Cm)和左侧(PheS/Tet)从而形成DEST载体。对于人Ad5的例子中含有腺病毒基因模块的多位点gateway入门载体,将El模块通过SLIC插入pDONR P1P4。E3模块通过gateway BP反应插入pDONR P5P3R。E4模块经gateway BP 反应插入 pDONR P3P2。

对于Amp (r)盒:质粒 pUC19、pl5A or1:质粒 pSB3K5_I52002 是 BioBricksiGEM2007parts distribution的一部分。腺病毒基因模块或者是来自由Ad5毒粒纯化的DNA 或者是质粒 pAd/CMV/V5/DEST (Invitrogen)。DONR 载体 pDONR P1P4、P5P2、P5P3R、P3P2来自Jon Chesnut (Invitrogen)。PheS基因来源于DH5alpha细菌基因组DNA,随后通过Quickchange 形成 PheSA294G 突变体。对于 Tet (r)基因,质粒 pENTR L3-pLac_Tet_L2 来自JonChesnut(Invitrogen)。对于Adsembly方法的实施方案,将20fmol双DEST载体(一般含有旁侧带有两个反选盒的核心模块)与其余含有基因模块的入门载体各IOfmol组合。在Ad5的例子中,这包括将20fmol E2-L3双DEST载体与各IOfmol的El模块入门载体、E3模块入门载体和E4模块入门载体组合。在一些情况中,增加一或多个入门载体的量可能提高效率(例如,给Ad5使用50fmolEl模块入门载体)。将这些载体与2 μ I LR Clonase II (Invitrogen)在终体积10 μ I中组合。反应于25° C过夜(12-16小时)温育。加入I μ I蛋白酶K(Invitrogen)并在37° C温育10分钟来终止反应。然后取5 μ I反应转化至对ccdB基因产物敏感的高感受态细菌(>le9cfu/μ g),并铺在 YEG-Cl 琼脂板(如 Kast,P.Gene, 138 (1994) 109-114 中所描述的使用PheSA294(:反选时)或者其他对于载体使用的反选来说合适的培养基上。对于PCRs,所有PCR均使用Phusion酶(NEB)进行。由Ad5获得腺病毒基因模块的PCR用Ix HF缓冲液、dNTP各200 μ Μ、引物各0.5 μ M和IOng模板进行。对于E2-L2模块,还添加了 3%DMS0。模板是质粒 pAd/PL-DEST (Invitrogen;对于 E2-L2、L3-L4 和 E4 模块)或者Ad5基因组DNA(对于El和E3模块)。PCR条件如下。对于E2-L2和L3_L4:98。C30秒-98。ClO秒、65° C30秒(每2个循环降低1° C) ,72° C7分钟,10个循环-98° ClO秒、60° C30秒、72° C8分钟,29个循环-72° ClO分钟-保持在4° C。对于E3:98° C30秒-98° ClO秒、70° C30秒(每个循环降低0.5° C)、72° C2分30秒,10个循环-98° ClO秒、68° C30秒、72° C2分30秒,25个循环-72° ClO分钟-保持在4° C。对于E4:98° C30秒-98° ClO秒、63° C30秒(每个循环降低0.5° C)、72° C2分钟,6个循环-98° ClO秒、60° C30秒、72° C2分钟,29个循环-72° C5分钟-保持在4° C。对于由纯化的病毒获得病毒基因组DNA,将最多100 μ I纯化病毒加入300 μ I含有IOmM Tris pH8、5mM EDTA、200mM NaCl和0.2%SDS的裂解缓冲液。混合液于60。C温育5分钟,之后加入5 μ I蛋白酶K储液( 20mg/mL),在60° C继续温育I小时。然后将样品置于冰上5分钟,随后于15K X g转15分钟。取上清液加入等体积的异丙醇、混合均匀,15K X g于4° C旋转15分钟。沉淀用70%乙醇洗涤,再次4° C旋转15分钟。将沉淀干燥,重悬待用。对于SLIC,线性片段用外切核酸酶于室温下在如下20μ I反应中处理20分钟:50mM Tris pH8、10mM MgCl2、50 μ g/mL BSA、200mM 脲、5mM DTT 和 0.5μ1 T4DNA 聚合酶。加入I μ 10.5Μ EDTA并在75° C温育20分钟来终止反应。然后将等量的Τ4处理的DNA在新试管中混合至20 μ I。对于组合两个片段的SLIC,每个反应各使用10 μ I。对于组合三个片段的SLIC,每个反应各使用7 μ I。通过加热至65° ClO分钟,然后每5秒降低0.5° C缓慢冷却至25° C使片段退火。退火后,取5μ I反应进行转化并筛选克隆。对于用于例如Ad5的AdSlicR,使用IOOng T4处理的pl5A_SceI (经PCR线性化)和各300ng的E2和L3模块(由它们各自的入门载体经PCR获得)进行3片段SLIC反应。这产生了载体 pl5A-SceI E2-L4。5μ g pl5A_SceI E2-L4 用 SwaI 切割并使用 QiagenQiaexII凝胶纯化。E3和E4模块由它们各自的入门载体经PCR获得。将各个被线性化的载体(450ng)和PCR产物(200ng)用T4DNA聚合酶处理,用150_200ng载体和 IOOng各模块PCR正常进行SLIC。分离阳性克隆,取5μ g新载体用PacI切割并凝胶纯化,然后与ElPCR产物(IOOng T4处理过的)在新的SLIC反应中组合。基因组组装至此完成,质粒可用于转染来重建病毒。B.经过改造的腺病毒腺病毒常用于基因转移的用途。例如,它们被用于将转基因递送给培养物中的细胞、体内动物组织或者对于基因治疗递送递送给体内人类细胞。这种方式使用腺病毒的一个限制因素是基因表达只是暂时的。腺病毒是非整合型病毒,因此一旦发生细胞分裂就会丢失转基因的表达。其他能够发生整合的病毒系统,比如逆转录病毒和慢病毒,被用于同样的基因转移目的。但是,这些天然具有整合能力的病毒较小,因此限制了可以表达的转基因的量,很难生长到高滴度,难以由它们表达多个转基因,而且它们会整合到基因组中的随机位置。已有试验表明PhiC31整合酶可以介导含有 280bp attB序列的外来环形DNA整合到宿主细胞染色体中的特定位置,被称为假性attP位点。已经使用环形质粒DNA展示了这个过程,但还没有在诸如腺病毒的病毒中证明,可能是因为腺病毒基因组是线性的,因此或者不发生整合或者整合导致染色体断裂。这里我们提供了可以这样形成重组腺病毒基因组的系统,所述系统在转导后,基因组的一部分经由ere介导的1xP位点重组变成环形,从而使得可以通过PhiC31整合酶/attB进行定向整合。对于这项技术,以多种方式将腺病毒基因组进行了改造(参见图31-33)。首先,删除了 El和E3区以便表达多个转基因。E4区被表达ere重组酶和PhiC31整合酶的盒代替。利用tet-反应性启动子或其他类似的可调控元件来调节这些酶的表达。基因组中安置了两个1xP位点,一个在El区的左端表达转基因的地方,第二个位于纤维蛋白和E4区之间。因此位于两个1xP位点之间的全部都被插入到细胞染色体中。最后,在E3区内安置PhiC31attB位点,虽然可以将 这个短序列安排在其他位置只要是位于1xP位点之间(虽然本实施例中ere重组酶和PhiC31整合酶是由含有1xP位点和转基因的同一个腺病毒表达的,也可以由分开的病毒表达这些酶)。在腺病毒被转导到细胞中时,ere重组酶和PhiC31整合酶被诱导。Cre协助腺病毒基因组中的1xP位点的重组。这导致位于1xP位点之间的DNA发生环化。然后这使得整合酶利用片段中的attB位点将环形片段重组到细胞染色体中(参见图33)。最终的结果是腺病毒基因组中选定的一部分被稳定(非回复性)整合到宿主细胞染色体中有限的几个位置之一。从这个整合片段稳定地表达转基因。没有腺病毒复制或复活的风险,因为1)E1区被删除和2)在这个过程中病毒基因组的末端被删除。这两个区域是病毒转录和复制所必需的。该系统与现有逆转录病毒和慢病毒系统相比的优势包括I)在基因组内数量有限的位置发生整合,而不是随机整合,2)提高了转基因表达允许的大小,3)通过纤维蛋白修饰(图39-42)或者使用其他腺病毒血清型和种(图45)将腺病毒重新导靶到特异细胞或组织的能力,4)使用Adsembly系统操作的简易性,5)生产高滴度病毒的简易性和6)由单一载体进行多基因表达的简易性。该系统通过利用病毒介导的DNA递送推进了目前的PhiC31整合技术(由LifeTechnologies以“ Jump-1n”产品线销售)。现有技术只是基于质粒的,因此局限于可以被有效地转染或电穿孔的细胞。而且不能体内使用除非生成特定的转基因小鼠。腺病毒被常规用于体内递送转基因,因此极大地扩展了现有技术的能力。一个体现是利用多基因表达盒通过将改造过的腺病毒可滴定地和定向地递送到特异组织中来产生小鼠模型。另一个体现是含有att位点以便进行靶向敲入的小鼠系。再一个体现是iPS。C.利用ADSEMBLY制备完整的近乎野生型腺病毒5型利用以下策略,使用Adsembly构建了 Ad5的近乎野生型版本。将侧翼带有gateway反选盒的野生型核心序列与野生型Ad5El模块、野生型Ad5E3模块和野生型Ad5E4模块混合(图21)。分离到含有完全组 装好的基因组的克隆并转染到293细胞中。7天后可以看到噬菌斑,收集病毒并在更多293细胞上扩增。生长分析显示该近乎野生型的病毒(与真正的野生型病毒相比,它含有3个attB插入)达到的滴度只比真正的野生型病毒略低(图28)。D.复制缺陷型突变体AD5的制备,所述突变体表达GFP,含有来自另外的血清型的纤维蛋白我们利用Adsembly制备了突变体Ad5。Ad5El模块经过改变,其中的ElA和ElB区被缺失,因此使得任何用这个新载体制备的病毒都是复制缺陷型的。除去ElA和ElB后,插入了含有CMV IE启动子和GFP基因的哺乳动物表达盒。Ad5E3模块的改变是用来自Ad34的纤维蛋白基因代替Ad5纤维蛋白基因。将这些突变体El和E3-纤维蛋白模块与侧翼带有gateway反选盒的野生型Ad5E4模块和野生型Ad5核心模块在标准Adsembly反应中组合(图21)。分离到含有完全组装好的基因组的克隆并转染至293细胞中。7天后可以看到噬菌斑,收集病毒并在更多293细胞上扩增。该病毒的生长情况表明这一策略可以用于I)转基因表达,2)荧光基因表达,3)复制缺陷型病毒构建体,4)制备嵌合腺病毒,和5)在Ad5背景中的替代的纤维蛋白表达。 E.利用ADSLICR制备可复制型AD5
利用AdSlicR由腺病毒基因模块构建野生型Ad5。野生型E3和E4模块从它们的腺病毒基因模块载体经PCR获得。将它们与SwaI切割的野生型Ad5核心模块在标准SLIC反应中组合(图25)。分离到成功含有核心模块和E3和E4模块的克隆并用PacI进行切害I]。然后将其与通过PCR从腺病毒基因模块载体获得的野生型Ad5El模块在第二个SLIC反应中组合。分离到含有完全组装好的基因组的克隆并转染到293细胞中。到第7天有可见的噬菌斑。将得到的病毒在更多293细胞上进行扩增。对该病毒进行的生长分析显示它与野生型Ad5可以生长到同样的滴度(图28)。V.表格表1-9公开了利用本文提供的方法制备的腺病毒基因模块载体、目标载体和入门
载体的例子。
权利要求
1.制备重组腺病毒的方法,所述方法包括由选自El模块、E2-L2模块、L3-L4模块、E3模块、和E4模块的三个或更多个腺病毒基因模块组装核酸。
2.如权利要求I所述的方法,其中所述核酸包含El模块。
3.如权利要求2所述的方法,其中所述核酸还包含E4模块。
4.如权利要求2所述的方法,其中所述核酸还包含E2-L2模块、L3-L4模块,或者既有E2-L2模块也有L3-L4模块。
5.如权利要求I所述的方法,其中在组装所述核酸之前,通过将三个或更多个腺病毒基因模块中的两个组合而形成大模块。
6.如权利要求5所述的方法,其中大模块是E2-L4大模块。
7.如权利要求6所述的方法,其中该方法包括由所述E2-L4大模块和选自El模块、E3模块、或E4模块的一或多个腺病毒基因模块组装所述核酸。
8.如权利要求I所述的方法,其中该方法包括由选自El模块、E2-L2模块、L3-L4模块、E 3模块、和E4模块的至少四个腺病毒基因模块组装所述核酸。
9.如权利要求8所述的方法,该方法包括由El模块、E2-L2模块、L3-L4模块、E3模块、和E4模块组装所述核酸。
10.如权利要求8所述的方法,其中所述核酸至少12kb。
11.如权利要求I所述的方法,其中所述核酸包含缺失的腺病毒核酸序列、突变的腺病毒核酸序列、异常腺病毒核酸序列或者编码非腺病毒基因产物的核酸序列。
12.如权利要求11所述的方法,其中所述突变的腺病毒核酸序列编码突变的E4-ORF3基因产物。
13.如权利要求11所述的方法,其中所述突变的腺病毒核酸序列编码突变的ElB-55k基因产物。
14.如权利要求11所述的方法,其中所述突变的腺病毒核酸序列编码突变的腺病毒纤维蛋白基因产物。
15.如权利要求11所述的方法,其中所述突变的腺病毒核酸序列编码突变的病毒外壳蛋白。
16.如权利要求11所述的方法,其中所述异常腺病毒核酸序列编码前药转化酶。
17.如权利要求11所述的方法,其中所述非腺病毒基因产物是报告蛋白。
18.如权利要求11所述的方法,其中所述非腺病毒基因产物是靶向蛋白。
19.如权利要求18所述的方法,其中所述靶向蛋白是肿瘤靶向蛋白或者脉管系统靶向蛋白。
20.如权利要求I所述的方法,还包括转录所述核酸,从而形成重组腺病毒。
21.如权利要求20所述的方法,其中所述重组腺病毒是可复制型的。
22.如权利要求20所述的方法,其中所述重组腺病毒是复制缺陷型的。
23.如权利要求I所述的方法,其中所述方法是在体外实施的。
24.如权利要求I所述的方法,其中所述组装包括将可杂交型目标载体与一或多个可杂交型腺病毒基因模块杂交,从而形成腺病毒基因模块载体。
25.如权利要求24所述的方法,其中所述可杂交型目标载体的形成是通过 (i)切割目标载体从而形成线性目标载体,和(ii)将所述线性目标载体与外切核酸酶进行接触从而形成可杂交型的目标载体。
26.如权利要求24所述的方法,其中所述一或多个可杂交型腺病毒基因模块的形成是通过 (i)将包含一或多个入门载体腺病毒基因模块的入门载体与外切核酸酶进行接触,从而形成一或多个释放出的入门载体腺病毒基因模块,和 (ii)将一或多个释放的入门载体腺病毒基因模块与外切核酸酶进行接触,从而形成一或多个可杂交型腺病毒基因模块。
27.如权利要求I所述的方法,其中组装包括将可重组型的目标载体和一或多个含有一或多个所述腺病毒基因模块的可重组型入门载体与整合酶进行接触,从而形成腺病毒基因模块载体。
28.如权利要求27所述的方法,其中含有一或多个所述腺病毒基因模块的所述可重组型入门载体的形成,是通过将一或多个可重组型腺病毒基因模块和可重组型供体载体与整合酶进行接触,从而形成含有一或多个所述腺病毒基因模块的所述可重组型入门载体。
29.如权利要求I所述的方法,其中组装包括 (i)将可杂交型目标载体与可杂交型第一腺病毒基因模块杂交,从而形成第一腺病毒基因模块载体;和 (ii)将所述第一腺病毒基因模块载体和可重组型第二腺病毒基因模块入门载体与整合酶进行接触,从而形成第二腺病毒基因模块载体。
30.如权利要求29所述的方法,其中所述第一腺病毒基因模块是E2-L2模块、L3-L4模块、或E2-L4大模块;第二腺病毒基因模块是El模块、E3模块或E4模块。
31.文库,所述文库包含复数个不同El模块、复数个不同E2-L2模块、复数个不同L3-L4模块、复数个不同E3模块、复数个不同E4模块或者复数个不同E2-L4大模块。
32.如权利要求31所述的文库,其中所述复数个不同El模块、所述复数个不同E2-L2模块、所述复数个不同L3-L4模块、所述复数个不同E3模块、所述复数个不同E4模块、或所述复数个不同E2-L4大模块包含来自复数个腺病毒种的腺病毒基因模块。
33.如权利要求32所述的文库,其中所述复数个不同El模块、所述复数个不同E2-L2模块、所述复数个不同L3-L4模块、所述复数个不同E3模块、所述复数个不同E4模块或所述复数个不同E2-L4大模块包含来自一个以上人腺病毒血清型的腺病毒基因模块。
34.如权利要求31所述的文库,其中所述复数个不同El模块、所述复数个不同E2-L2模块、所述复数个不同L3-L4模块、所述复数个不同E3模块、所述复数个不同E4模块或所述复数个不同E2-L4大模块包含缺失的腺病毒核酸序列、取代的腺病毒核酸序列、异常腺病毒核酸序列、或者编码非腺病毒基因产物的核酸序列。
35.如权利要求31所述的文库,其中所述复数个不同El模块、所述复数个不同E2-L2模块、所述复数个不同L3-L4模块、所述复数个不同E3模块、所述复数个不同E4模块或所述复数个不同E2-L4大模块是可重组型的。
36.如权利要求31所述的文库,其中所述复数个不同El模块、所述复数个不同E2-L2模块、所述复数个不同L3-L4模块、所述复数个不同E3模块、所述复数个不同E4模块或所述复数个不同E2-L4大模块是可杂交型的。
37.根据权利要求1-20中任一项所述方法制备的腺病毒基因组文库。
全文摘要
本文提供了组装改良腺病毒的方法、腺病毒基因模块文库和它们的组合物。
文档编号C12N7/01GK103237889SQ201180050029
公开日2013年8月7日 申请日期2011年8月16日 优先权日2010年8月16日
发明者C.奥谢, C.鲍尔斯 申请人:萨克生物研究学院

最新回复(0)