基于芯片进行规模化快速制备单根寡核苷酸的方法

xiaoxiao2020-10-23  5

基于芯片进行规模化快速制备单根寡核苷酸的方法
【技术领域】
[0001] 本发明涉及芯片合成寡核苷酸的技术领域,特别是涉及单根寡核苷酸低成本规模 化制备方法。更具体的说,本发明涉及利用聚丙烯酰胺凝胶分离方法对芯片合成所得的寡 核苷酸混合物进行分离的方法。本发明还涉及针对单根寡核苷酸快速制备方面的芯片上寡 核苷酸库的设计方法。
【背景技术】
[0002] 标准的DNA化学合成是从3'端到5'端延长核苷酸链的循环过程。二十世纪八十年 代,已经发展了四步法亚磷酰胺化学合成方法[1]。这个方法现在仍被大多商业化DNA合成 公司所采用。该过程将酸活化的脱氧核苷亚磷酰胺(Deoxynucleoside phosphoramidite) 分子耦合到一个被固定在固相上(一般是硅材质表面)的脱氧核苷酸分子上。在第一个合 成循环中,核苷酸链将从第一个被固定在表面的受保护的核苷酸分子开始延伸。其中,经常 采用的固定化表面主要是可控孔度玻璃(controlled pore glass,CPG)或者聚苯乙稀珠子 (polystyrene beads, PS beads)。目前,基于四步法合成方法的DNA全自动合成仪已经可 以将单次合成的通量从1根提高到1,536根序列[幻。目前,商业化提供的CPG合成长寡核 苷酸(<60nt)的价格可以达到$0. 10-0. 20/nt,较长的寡核苷酸及进一步合成的基因价格 大约是 $0· 40-1. ΟΟ/bp [幻。
[0003] 传统的DNA合成方法受到通量和成本限制,合成的寡核苷酸只能充当PCR或者定 点突变的引物。但随着DNA化学合成技术的发展,尤其是基于微阵列技术的并行合成寡核 苷酸合成技术的发展[4][反幻,大量寡核苷酸序列可以在几厘米见方的芯片上并行合成, 通量得到提升,对应的成本也随之降低,可以直接应用到代谢工程改造、药物开发、基因组 功能分析等领域。
[0004] 人工合成的高保真的寡核苷酸多用来制作单链核酸探针,检测序列特异性的分 子,包括DNA与蛋白质、药物或其他配体分子之间的相互作用,从而应用到核酸杂交、原位 杂交荧光检测(FISH)、噬菌体展示、核磁共振NMR等技术中[Z]。另外,DNA或RNA可以在 细胞内结合序列互补的基因组DNA或转录的mRNA,造成基因沉默或蛋白表达水平下调,弓丨 起表型的改变。因此,寡核苷酸也可以应用到基因功能检测、基因治疗相关的药物开发等方 面。比如,双链DNA寡核苷酸可以作为检测哺乳细胞对外源DNA相关应答的工具[§],也可 以用来作为敲除细胞内相关基因序列或调控序列从而研宄基因功能的工具。
[0005] 另外,蛋白表达相关调控因子,如启动子、核糖体结合位点等序列都是短的 DNA(即寡核苷酸)序列,这种类型的寡核苷酸可以直接进行人工合成。因此,研宄者们可 以通过理性设计和构建寡核苷酸文库,来达到优化蛋白质表达的目的。如Schlabach, M. R.等人通过人工设计合成了一套启动子文库,分别克隆到含有GFP基因的表达载体中,控 制表达蛋白产生荧光信号,经过FACS筛选得到强启动子,用来优化哺乳细胞内蛋白表达水 平[殳]。
[0006] 寡核苷酸相关分子,包括反义 RNA「101, aptamers Till、siRNAs (small-interferin g RNAs) [1£]等可以选择性调控疾病相关基因的表达,具有成为治疗人类疾病的药物的潜 力。在发达国家,已经有不少分子进入了临床研宄[11]。而反义寡核苷酸,可以直接作为 药物治疗疾病,如Isis' s Vitravene就是市场上开发的第一个治疗患视网膜炎的AIDS病 人的寡核苷酸药物[Ii].另外,dsDNA可以克隆到转录载体中直接转录得到RNA分子,比 如microRNA前体等,继而应用到各项RNA干扰相关的研宄中。近些年来,双链RNA包括 siRNA(small interfering RNA)和 shRNA(short hairpin RNA) Γ15, 161 的研宄进入快速 发展阶段。其中,shRNA可以通过化学合成单链后退火得到,也可以通过RNA聚合酶III转 录寡核苷酸DNA模板得到。通常60-100bp的双链DNA寡核苷酸中含有19-29bp与目标基 因同源的序列,并且该部分序列存在两份,形成回文结构,经过酶切,会形成发夹结构[II]。 因此,人工合成长寡核苷酸除了可以作为长链DNA组装的起始元件,还可以用来构建RNA转 录模板文库及各种短DNA文库,在很大程度上扩大了寡核苷酸应用的范围。
[0007] 化学合成的寡核苷酸可以通过聚丙烯酰胺凝胶电泳(PAGE)[迟]、高效液相色谱 (HPLC)[丛]、毛细管电泳(CE)等方法进行纯化。一般PAGE纯化是使用变性聚丙烯酰胺凝 胶电泳分离DNA后,从凝胶中回收目标DNA。该方法得到的DNA纯度可以大于90 %,尤其对 大于50mer的寡核苷酸有效。使用HPLC的方法纯化DNA更加高效且方便,可以达到很高的 纯度(>95% )和灵敏度,但是成本相比PAGE方法偏高,且更适用于小于50mer的未修饰寡 核苷酸。已经商业化应用的HPLC纯化选用的有简易反相柱C18柱、反相净化滤芯(RPC)纯 化柱等。其中C18柱对DNA有特异性吸附,可以被有机溶液洗脱,而不会被水洗脱,因此能 有效地去除盐分,但不能有效去除比目的片段小的小片段。RPC纯化原理与反相HPLC-样, 但是更加有效且经济。超高效液相色谱(UPLC)是一种比HPLC方法更快速、更高效和更高 分辨率的DNA检测分离技术。已发展的纯化方法多用于纯化寡核苷酸化学合成中的N-I长 度的边反应产物,目标产物是单一的一条DNA。
[0008] 目前,商业化提供的CPG合成寡核苷酸(<60nt)的价格一般在$0· 10-0. 20/nt,更 长的寡核苷酸(<200nt)价格大约会上升到到$0.40-1. 00/nt Q]。众所周知,CPG合成方法 可以提供大量高保真性的寡核苷酸DNA,但是存在通量低、成本高的缺点。因此,过去二十 年,基于芯片的寡核苷酸合成方法得到快速发展,该方法可以提高合成通量并降低成本 [3, 20-25]。有报道称420, 000根寡核苷酸可以在同张芯片上合成,成本可以降到0. 001-10 美分/nt [玉M]。但是芯片合成方法得到的寡核苷酸是一个复杂的混合物(序列不同,长度 也可能不同)[迷],单种寡核苷酸的量极低(IO 4-IO6个分子)[沒]。目前单根寡核苷酸的商 业合成还是使用CPG合成方法,限制了寡核苷酸在代谢工程改造、药物开发、基因组功能分 析等方面的应用潜力。所以,更高通量、更低成本的单根寡核苷酸合成方法应该被开发。目 前还没有基于芯片大规模制备单根寡核苷酸的技术的报道。基于芯片合成的寡核苷酸混合 库,分离独立寡核苷酸时,可以采用的方法是直接分离方法或者特异性引物扩增。但是具有 以下难点:(1)单独寡核苷酸的绝对量极少(IO 4-IO6个分子[互]),无法直接应用到下游,也 无法直接进行分离(单种寡核苷酸的浓度过低,也不足以分辨);(2)背景序列复杂[迷], 因此无论是直接分离(背景序列长度不一,具有相同长度的寡核苷酸也不在少数,因此无 法直接分离),还是选择性扩增(复杂背景导致非特异性扩增),都存在技术难度。同时,特 异性扩增需要合成序列特异的引物,针对整张芯片不同寡核苷酸序列进行特异性引物合成 的话,成本过高。

【发明内容】

[0009] 基于上述问题,本发明建立了一套基于芯片合成的高通量低成本的单根寡核苷酸 规模化分离制备方法。本发明以一种新的、基于微芯片的高并行DNA原位合成方法[M,盟] 进行寡核苷酸的大量合成。采用的4K芯片可以最高合成接近4, 000根不同的寡核苷酸。在 设计寡核苷酸序列时,引入通用引物将芯片合成的全部寡核苷酸分成一系列亚库,从而降 低寡核苷酸混合物的复杂性;每个亚库含有5-11根长度不同的寡核苷酸,相邻长度的寡核 苷酸相差至少4碱基,从而可以通过PAGE方法分辨并分离。另外,得到的寡核苷酸序列中包 括目标序列及其两端的通用引物,该序列可以通过IIS型内切酶移除引物得到目标寡核苷 酸;也可以作为模板,根据使用者的需求使用通用引物来自行扩增。本发明通过芯片合成 了 615根不同的寡核苷酸,分为88个寡核苷酸亚库,合成寡核苷酸总长度达62, 809碱基, 构成了包括绿色荧光蛋白、木糖异构酶、三种纤维素酶编码基因(共6, 441碱基对),以及 223种线虫来源的microRNA前体模板DNA (共19, 930碱基对)。通过条件优化,本发明可以 在22h之内得到纳摩尔级的PAGE纯度的分离的双链寡核苷酸,花费最低可降至$0. 004/碱 基,并且,随着单张芯片合成量的提高,成本可以进一步降低。本发明可以提供的单根寡核 苷酸从通量、成本、产量和保真度方面都可以满足科研中对大量独立寡核苷酸序列的需求, 在通量和成本方面优于目前商业化提供的单根寡核苷酸(>60碱基),极大地填补了单根寡 核苷酸(>60碱基)高通量低成本合成这方面的空白。
[0010] 具体地,本发明提供一种高通量合成和纯化寡核苷酸的方法,所述方法包括以下 步骤:1)设计寡核苷酸序列,在寡核苷酸两端加上通用引物,以将合成的全部寡核苷酸分 成若干亚库,不同亚库具有不同的通用引物,同一亚库具有相同通用引物,所述通用引物上 含有IIS型内切酶的酶切位点;2)进行基于微芯片的DNA原位合成并洗脱合成产物;3)利 用所述通用引物对所述合成产物进行PCR扩增;4)分离扩增产物。
[0011] 在一个优选的实施方案中,所述亚库以要合成的寡核苷酸片段大小来分配。
[0012] 在一个优选的实施方案中,在寡核苷酸和一侧的通用引物之间还具有接头序列。
[0013] 在一个优选的实施方案中,所述接头序列在所述寡核苷酸的3'端。
[0014] 在一个优选的实施方案中,所述接头序列含有Iis型内切酶的酶切位点。
[0015] 在一个优选的实施方案中,每个亚库含有5-11根长度不同的寡核苷酸。
[0016] 在一个优选的实施方案中,每个亚库中相邻长度的寡核苷酸相差至少4个碱基。 [0017] 在一个优选的实施方案中,步骤4)中的分离使用聚丙烯酰胺凝胶电泳进行。
[0018] 在一个优选的实施方案中,所述聚丙烯酰胺凝胶浓度为8% -10%且为非变性的。
[0019] 在一个优选的实施方案中,所述方法在步骤4)后还包括用IIS型内切酶酶切和/ 或用相应通用引物选择性PCR扩增分离后的独立寡核苷酸的步骤。
[0020] 在一个优选的实施方案中,所述IIS型内切酶是内切酶Sch I,Bbs I或Bsa I。
[0021] 在一个优选的实施方案中,所述微芯片是4k芯片。
[0022] 附图简述
[0023] 图1单根寡核苷酸制备分离原理。芯片合成的寡核苷酸混合库中的单根寡核苷酸 序列两端可以引入不同组的通用引物对,通过PCR扩增得到独立的各个寡核苷酸亚库。每 个寡核苷酸亚库包含5-11根不同的寡核苷酸,这些寡核苷酸具有不同长度,相邻寡核苷酸 之间的长度差别至少4碱基。
[0024] 图2单根寡核苷酸设计原理。需要合成的目标寡核苷酸两端引入通用引物,该引 物部分序列可以通过IIS型限制性内切酶切除,而不会破坏目标序列,也不会残留额外的 碱基。有些寡核苷酸两端除了通用引物序列,另外还在DNA的3'端引入了接头序列,该接 头序列同样可以通过IIS型内切酶切除。
[0025] 图3寡核苷酸亚库完整性验证设计原理(基因组装)。分离寡核苷酸亚库得到的 单根寡核苷酸可以通过基因序列组装来验证是否存在序列缺失或错误(非目标寡核苷酸 序列)。此处,构成同一根基因片段的寡核苷酸并不属于扩增时同一组寡核苷酸亚库。基因 序列通过软件DNAWorks或TmPrimer切割成为多个片段,进而切割成一组寡核苷酸。这些 寡核苷酸可以通过后续的组装得到全长基因 DNA。
[0026] 图4 PAGE分离寡核苷酸亚库。8% PAGE分离寡核苷酸亚库(A,B)。 A. EGFP亚库al的8 % PAGE分离,目标条带(泳道1)如箭头所示,分别是 IOlbp, IlObp, 115bp, 120bp, 125bp ;B. CtCBH 6个亚库的分离(泳道1~6),每个亚库分别 含有9, 9, 8, 8, 8, 5根不同的寡核苷酸。以上相邻大小的寡核苷酸之间的差异至少4个碱基。 其中,CtCBH亚库2 (泳道2)的目的条带使用箭头标注,分别是73bp,80bp,85bp,91bp,96b p,IOlbp, 105bp, 109bp, 115bp。以上泳道 M 表不 20bpDNA Ladder Marker(Takara)。
[0027] 图5单根寡核苷酸组装片段DNA。A. PAGE分离CtCBH亚库3,泳道M:20bp DNA ladder marker (Takara);泳道I:CtCBH亚库3寡核苷酸,目标条带7lbp-116bp,共8条寡 核苷酸序列;B.分离后再扩增的单根寡核苷酸(可组装成为TrCBH片段2),泳道1~11: 组成TrCBH片段2的11条分离后的寡核苷酸;C. Sch I对合成的寡核苷酸(构成TrCBH片 段2)进行酶切,寡核苷酸在酶切前后的大小差别30个碱基的通用引物序列长度,泳道1 : 酶切前;泳道2 :酶切后;D.酶切后的寡核苷酸组装成为TrCBH片段2,目标片段334bp,泳 道1 :组装使用构成该片段序列的完整的11条寡核苷酸;泳道2 :组装时缺一条寡核苷酸; E. CtCBH全长基因的融合,目标片段I. 6kb (泳道1)。
[0028] 图6制备单寡核苷酸的完整性验证。分离制备得到的寡核苷酸用于组装基因 DNA 全长,并进行测序验证。目的基因分别是OXI (1. 3kb),TrCBH (1. 4kb),CtCBH (1. 6kb)和 TrEGl (I. 3kb)〇
[0029] 图7单根寡核苷酸分离制备时间成本。第一步:芯片合成寡核苷酸(<12h);第二 步:从芯片上洗脱寡核苷酸混合物(1小时);第三步:寡核苷酸亚库扩增(1-1. 5小时);第 四步:寡核苷酸亚库内的单根寡核苷酸分离(3小时);第五步:分离后的单根寡核苷酸进 行选择性扩增(使用通用引物或者特异性引物)(1-1. 5小时);第六步:含有不同通用引 物结合序列的寡核苷酸混合进行退火反应,暴露DNA链上的错误碱基,形成错配(3小时); 第七步:MICC纠错,该系统全称是MutS固定化纤维素柱,基于MutS错配结合蛋白对双 链上 呈现的错误配对进行结合,同时与MutS融合在一起的纤维素结合结构域又与纤维素结合, 在纤维柱上的MutS蛋白结合正确配对和错配的能力是不同的,时间差导致正确DNA与错误 DNA分离开来(15分钟);第八步:选择性扩增纠错后的单根寡核苷酸(1-1. 5小时);第九 步:下游应用,如寡核苷酸文库构建或DNA组装。从芯片合成到得到单根寡核苷酸,共需要 22h〇
[0030] 图8 microRNA前体模板DNA序列寡核苷酸设计原理。由于芯片合成能力限制,寡 核苷酸合成的最大长度是120nt。因此,大于120nt的目标片段被切割成为2~4根较短的 寡核苷酸序列。构成同一根目标片段的寡核苷酸,相邻之间存在重叠区域,重叠区域的Tm 统一由软件设计为70 °C。
[0031] 图9分离后的单根寡核苷酸。A. 8% PAGE分离线虫来源microRNA前体模板DNA 亚库11,14,16,33寡核苷酸;B.分离后的寡核苷酸使用通用引物重新进行选择性扩增。以 上microRNA模板DNA亚库11含有8根寡核苷酸,长度85bp-120bp ;亚库14含有7根寡核 苷酸,长度87bp-116bp ;亚库16含有8根寡核苷酸,长度87bp-117bp ;亚库33含有8根寡 核昔酸,长度 90bp_120bp。Lane M:20bp DNA Ladder Marker(Takara)0
[0032] 图10制备分离的单根寡核苷酸(microRNA前体DNA模板)。A~R图示意从385 根寡核苷酸中选择的一些单根寡核苷酸(来自线虫亚库),经过分离制备所得产物。每个亚 库所含寡核苷酸根数是7~11根,平均长度IOObp。
[0033] 发明详述
[0034] 基因芯片技术已经在基因合成方面得到广泛应用,以芯片技术合成的寡核苷酸有 通量高、成本低的优点。但是芯片得到的寡核苷酸产物复杂度高,单种的寡核苷酸含量低是 制约以该方法得到的寡核苷酸直接应用到下游过程的因素。本发明基于芯片合成寡核苷 酸方法,并利用聚丙烯酰胺凝胶办法建立一种高通量、低成本、高回收的单根寡核苷酸合成 分离系统,可直接应用下游过程。以下是本发明的具体描述。
[0035] 1)寡核苷酸库的设计与合成。
[0036]目的寡核苷酸的设计涉及长度分布、引物序列及接头序列的添加。
[0037] 方法:如图1所示,将全部寡核苷酸序列按照长度分成不同寡核苷酸亚库,在同一 个亚库的寡核苷酸序列两端添加相同的通用引物序列,不同亚库的寡核苷酸两端具有不同 的通用引物序列。分组后得到一系列由不同长度的寡核苷酸序列构成的寡核苷酸亚库,每 个亚库含5~11根不同的寡核苷酸。如图2所示,当同一个亚库内的寡核苷酸序列不可避 免地具有相同长度时,在目的序列的3'端添加不同长度的接头序列,使原本长度相同的寡 核苷酸序列得以区分。这些额外的通用引物序列及接头序列可以通过内切酶Sch I切除。 这类内切酶的识别位点与切割位点不同,使用该酶进行酶切,不会残余额外碱基,也不会切 除目的序列本身的碱基,且酶切后形成平末端。
[0038] 2)芯片合成寡核苷酸库。
[0039] 目的寡核苷酸的合成涉及光生酸介导的微流体芯片合成系统。
[0040] 方法:本发明合成寡核苷酸采用的平台是基于光生酸介导的微流体芯片合成系统 [豆],使用的芯片是LC science 4k芯片[豆]。
[0041] 3)寡核苷酸亚库的扩增。
[0042] 方法:根据设计,每个寡核苷酸亚库内所含的5-11根寡核苷酸可以使用同一对通 用引物,通过PCR扩增得到。
[0043] 4)聚丙烯凝胶酰胺方法分离寡核苷酸。
[0044] 方法:每组寡核苷酸亚库内的相邻长度的寡核苷酸序列之间相差至少4~5碱基, 因此,8%~10%浓度的非变性聚丙烯酰胺凝胶电泳可以用以分离同一亚库内的不同长度 的寡核苷酸。分离后的含有单一寡核苷酸条带的胶被直接切割下来浸入TE缓冲液中,使 DNA扩散出来。
[0045] 5)选择性扩增分离后的独立寡核苷酸。
[0046] 方法:以聚丙烯酰胺凝胶电泳分离后的单根寡核苷酸TE浸出液为模板,使用对应 的通用引物选择性扩增单根寡核苷酸,而后使用与通用引物所含IIS型限制性内切酶位点 对应的Sch I、Bbs I或Bsa I内切酶切除额外的通用引物序列或者接头序列,得到目的寡 核苷酸序列。该步骤的选择性扩增可以多次进行,从而得到使用者所需要的DNA总量。 实施例
[0047] 试剂和菌株:本发明中的所有试剂均是市场购买的试剂级以上试剂。KOD plus DNA聚合酶用作寡核苷酸亚库的扩增,购自东洋纺生物公司(Τ0Υ0Β0)。Pfu DNA聚合酶用 于单根寡核苷酸的扩增,购自上海申能博彩生物公司(BBST)。核酸限制性内切酶、T4连 接酶均购自Fermentas中国公司。试剂等除特别注明以外,都购自上海生工。大肠杆菌 Escherichia coli XLlO-Gold作为DNA操作时使用的宿主菌。包含100 μ g/mL氨节青霉 素的Luria-Bertani (LB)培养基用于培养E.coli。引物由上海生工合成。包含lOOyg/mL 氨苄青霉素的LB培养基用于培养E. coli。引物由上海生工合成。
[0048] 实施例1
[0049] 合成构成绿色荧光蛋白、木糖转移酶等编码基因的单根寡核苷酸
[0050] 本发明合成了 3张芯片,分别用来合成绿色荧光蛋白基因 (EGFP, GenBank:ACX42327. 1,SEQ ID NO :68)、木糖转移酶基因(来自菌株 Orpinomyces sp·ukkl,0XI,GenBank序列号:ACA65427·l,SEQIDN0:69)、三种纤维素酶基因【全 称 cellobiohydrolase II,来自 Trichoderma reesei 菌株(缩写 TrCBH, GenBank 序列号:ADC83999. 1,SEQ ID NO :72);全称 endoglucanase I,来自 Trichoderma reesei 菌株(缩写 TrEGl, GenBank 序列号:ΗΜ641862· 1,SEQ ID NO :71),全称 l,4-beta_cellobiosidase 来自 Chaetomium thermophilum 菌株(缩写 CtCBH, GenBank 序 列号:CAM98448. 1,SEQ ID NO :70)】,以此为例,单张芯片合成的寡核苷酸数量从30条上 升到156条,合成的总长度从3, 060nt上升到14, 898nt,单根寡核苷酸长度范围在63~ 126nt,平均长度基本都在IOOmer左右(如表1所示)。合成得到的230根寡核苷酸(序 列1~230)用于组装成不同基因的全长序列,并进行后续的蛋白质表达和功能验证,以此 证明本分明得到的单根寡核苷酸的准确性和可用性。
[0051] 表1芯片合成寡核苷酸的组分.
[0052]
[0053] 寡核苷酸的设计
[0054] 绿色荧光蛋白EGFP(GenBank:ACX42327. 1,SEQ ID NO :68)编码基因使用软件 DNAWorks[M]进行针对大肠杆菌E. coli的密码子优化,并移除限制性内切酶位点。木 糖异构酶(from Orpinomyces sp.ukkl,0X1,GenBank:ACA65427. 1,SEQ ID NO :69)编码 基因使用软件DNAWorks[Μ]进行针对马克思克鲁维酵母的密码子优化,并移除限制性 内切酶位点。三种纤维素酶【全称cellulases including cellobiohydrolase II,来自 Trichoderma reesei 菌株(缩写 TrCBH, GenBank 序列号:ADC83999.1,SEQ ID NO :72); 全称 endoglucanase I precursor from Trichoderma reesei 菌株(缩写 TrEGl, GenBank 序列号:ΗΜ641862·1,SEQ ID NO :71),全称 cellulose 1,4-beta-cellobiosidase from Chaetomium thermophilum 菌株(缩写 CtCBH, GenBank 序列号:CAM98448.1,SEQ ID NO: 70)】编码基因使用软件DNAWorks [Μ]进行针对酿酒酵母的密码子优化,并移除分子克隆 过程中载体中多克隆位点所常用的限制性内切酶位点,比如Hind III,Xho I等位点。然 后,这些序列被TmPrime软件以Tm -致为原则进行分割,成为230根寡核苷酸序列(平均 长度约IOOnt)。如图3所示,这些寡核苷酸可以组装成为对应的片段,10~11根寡核苷 酸完全覆盖约300bp的片段的正负双链,寡核苷酸以相互交错互补配对的原则分布,相邻 寡核苷酸之间只存在缺刻,而非缺口,即没有碱基的缺失。寡核苷酸重叠区域的Tm值都设 定为70°C。230根寡核苷酸可分成36个亚库,每个亚库含有5~9根寡核苷酸,在每个亚 库这些寡核苷酸的5'及3'端添加相同的通用引物序列(15nt),当两条寡核苷酸长度一致 时,在其中一条的寡核苷酸的3'端加入5nt, IOnt, 15nt, 20nt长度的接头序列,从而得到一 个含有不同长度寡核苷酸的亚库,每根寡核苷酸长度相差至少4nt (图1)。通用引物序列 及接头序列与目的寡核苷酸序列之间存在Sch I酶切位点,便于后续额外序列的切除(图 1,2)。构成同一根片段的寡核苷酸被分到不同的亚库中,分离得到单根寡核苷酸后,将属于 同一片段的多个寡核苷酸聚集到一起,经过酶切移除引物及接头序列后,才可以进行后续 的组装实验。本发明中的寡核苷酸长度以及所使用的通用引物如表2所示。
[0055] 寡核苷酸亚库的扩增
[0056] 根据寡核苷酸芯片合成目的不同,三张芯片合成的寡核苷酸亚库分别命名为1) EGFP亚库al-a3, cl-c3,其中,al和cl,a2和c2, a3和c3亚库的组合可以组装成为EGFP 基因片段1,片段2和片段3 ;2) 0X1亚库1~8, ;3) TrCBH亚库1~8 JrEGl亚库1~7 ; CtCBH亚库1~7。以芯片微流技术(芯片来源:LC SCIENCES,美国休斯敦)制备得到寡 核苷酸,从芯片上洗脱得到寡核苷酸(单链DNA)混合物(~20pmol),其中每条寡核苷酸的 量根据不同芯片合成寡核苷酸总量的不同而不同。以单种寡核苷酸0. 〇13fmol为模板,使 用对应的通用引物(如表2所示),采用DNA聚合酶KOD plus (Τ0Υ0Β0, Japan)进行寡核苷 酸亚库的扩增。
[0057] PCR反应体系为:
[0058] IO \ KOD-plus buffer (Toyobo) 2.5 pL 2.U niM dNTPs (Toyobo) 2.5 μL 25 mPvl MgSO4 (Toyobo) 1.5 tuL Primer-F (100 μ.Μ. Sangon) 0.25 μ L Primcr-R (H)O μ M. Sangon) ().25 μ L Template (0.013 Γηιο? each oligo) ().25 μL KOD-plus DNA polymerase (I U/pL TOYOBO) ().25 μL ddH:C) 17.25 μ L 【总体积】 【25 μι】
[0059] PCR反应条件是:
[0060] Step 1:94 C 5 min; Step 2: 94 Γ 15 s: Step 3: Tm+ IVC 30 s: Step 4: 68 °C 30 s: Step 5: Go to Step 2. 29 c>clcs: Step 6: 68 C 10 min a
[0061] 表2寡核苷酸长度及扩增使用的通用引物序列
[0062]
[0063]
[0064] 寡核苷酸的分离
[0065] 将扩增得到的寡核苷酸亚库(5~7根不同寡核苷酸)通过8 %聚丙烯酰胺凝胶 【20cm(长)x0. 15cm(宽)xl6cm(高)】进行电泳分离。电泳条件是150V预电泳10分钟, 上样品(每孔600ng,9pmol)后,冰浴条件下300V电泳3小时。电泳采用脉冲法,即30分 钟停顿一次并立即重新开始。或者可以通过10 %聚丙稀凝胶【8. 5cm (长)x0.1 Ocm (宽) x7. 5cm(高)】进行电泳,电泳条件是100V预电泳10分钟,上样品(每孔480ng, 7. 2pmol) 电泳100分钟。PAGE完成后,胶于EB中染色,显示每根寡核苷酸(35ng,0. 5pmol)之间至 少4bp的差距可以在凝胶中明显区分开(图4)。将每根寡核苷酸直接从凝胶上切割下来捣 碎,浸入50 μ L TE缓冲液中,直接作为下一步选择性扩增的DNA模板材料。
[0066] 8 %聚丙烯酰胺凝胶成分(50mL):
[0067] 4()% acr:bis (19:1) IO niL IOxTBEbuITcr 5 mL ddH20 34.45mL
[0068] TEVlED 50 μL 10% ammonium pcrsulialc 500 (U.L
[0069] 如图4A,B所示,同一个亚库的寡核苷酸在凝胶上可以肉眼分辨到清晰的单个条 带,如图5B所示,分离得到的寡核苷酸产物确实是以特异性的单根状态存在的。这说明,本 发明基于PAGE分离寡核苷酸的方法是可行的。
[0070] 单根寡核苷酸的选择性扩增
[0071] PAGE分离后的单根寡核苷酸从凝胶切割并捣碎,浸入到TE缓冲液中,DNA会立即 扩散溶解到TE缓冲液,以此单根寡核苷酸DNA为模板,采用对应扩增组的寡核苷酸通用引 物,使用Pfu DNA聚合酶进行寡核苷酸的选择性扩增。当单一寡核苷酸就是目标产物时,扩 增体系是50 μ L。当得到的单一寡核苷酸还要进行下步组装反应时,扩增体系是20 μ L。
[0072] PCR反应体系为:
[0073] IO \ Pfu builcr (BBST) 5 pL l()niMdNTPs( ?:?: I.) 1 μL Primcr-F (100 μ M. Sangon) ?.5 μL Primcr-R (K)U μ Μ. Sangon) (i.5 μL Template (凝胶中DNA的TE溶出液) I pL Pfu DNA polymerase (5 U/uL, BBST) ().5 μ L ddH20 41,uL 【总体积】 【50 L】
[0074] PCR反应条件是:
[0075] Slcp 1:95 0C1 5 min: Step 2: 95 Γ 30 s: Step 3: 50 C 30 s: Step 4:72 Γ 30 s; Step 5: Go ?ο Step 2. 29 c> clcs; Step 6: 72 C I Umiiin
[0076] 寡核苷酸亚库的完整性验证
[0077] 为了验证分离得到的亚库内的寡核苷酸是否完整,以证明本方法可以大量制备寡 核苷酸序列。以这些寡核苷酸作为原材料,在溶液中进行靶基因序列的组装。首先,将构成 同一片段的10~11根已分离后的寡核苷酸混合在一起,进行统一的酶切和之后的拼装。酶 切体系如下:
[0078] 酶切反应混合物:
[0079] I () X Tango 缓冲液(Thermo) 10 μι 寡核苷酸(4 Hg) 60 pmol Sch I (K) U/,u L. Thermo) 2 μ L H2O 补齐到【50 HL】
[0080] 酶切反应于37°C进行1小时后,采用乙醇沉淀方法进行纯化,并重悬于50 μ L TE 缓冲液中备用。
[0081] 纯化后的寡核苷酸混合物直接用于片段拼装。拼装采用聚合酶循环拼装方法 (PCA)。反应体系如下:
[0082] PCA反应体系为:
[0083] IO X Pfu bulTcr (BEST) I \xL 10 mMdNTPs(Sangon) 0.3 gL Template (寡核苷酸) 12 pmol Pfu DNA polvmcrasc(5 U^L, BEST) (). 1 μL ddH.O 补齐到【ΙΟμL?
[0084] PCR反应条件是:
[0085] Slcp 1: 95 "C 5 min; Step 2: 95 Γ 30 s; Step 3:72 "C 120 s: Step 4: Go 丨o Step 2· 14 cycles: Step 6: 72 "C 10 min〇
[0086] 以PCA产物为模板,采用片段通用引物(含有Bbs I酶切位点),使用Pfu DNA聚 合酶扩增基因片段。反应如下:
[0087] PCR反应体系为:
[0088] 1?\ Plii bulTcr (BBST) 5 pL 10 niM dNTPs (Sangon) I pL Primcr-F (U) M. Sangon) I pL Primcr-R (K) M. Sangon) I Template (PCA 产物稀释 10~100 倍) 1 μL Plu DNA poi> mcrasc (5 U/ L. BBST) I gL ddH:0 40 μL 【总体积】 【50μυ
[0089] PCR反应条件是:
[0090] Step 1: 95 "C 5 min; Step 2: 95 C 30 s: Slcp 3: 55 'C 30 s: Step 4: 72 C 30 s: Step 5: Go to Step 2. 29 cycles: Step 6: 72 "C IO min 〇
[0091] 得到的产物用3%浓度的琼脂糖电泳进行分离,并使用Axygen凝胶纯化试剂盒 (Axygen生物技术公司,中国杭州)进行片段的纯化,洗脱于50ul洗脱液中备用。
[0092] 以纯化后的基因片段为材料,直接进行基因全长的组装。组装方法采用融合PCR 方法。采用相应基因特异性引物序列,以PrimerStar HS DNA聚合酶(Takara,大连)将 多个片段一步融合成全长序列。得到的产物采用3%浓度的琼脂糖电泳进行分离,并使用 Axygen凝胶纯化试剂盒(Axygen生物技术公司,中国杭州)进行片段的纯化,洗脱于50 μ L 洗脱液中备用。具体反应如下:
[0093] PCR反应体系为:
[0094] 10\ PS bulTcr (TAKARA) 10 μL 2.5 mM dNTPs (Sangon) 4 μ£
[0095] Primer-F (K) M. Sangoη) 1 μ.L Primcr-R (K) Μ. Sangon) I μL Template IOO ng DNA mixture PrimcSTAR DNA poh mcrasc (2.5 U/ L TAKARA) 0.5 μ!..; ddH:0 补齐列【5(i,uL】
[0096] PCR反应条件是:
[0097] Slep 1: 98 C 5 min: Step 2: 98 C 10 s: Slcp 3: 55 I: 5 s: Step 4: 72 C I kb/min: Step 5: Go Io Step 2. 29 c>clcs: Step 6: 72 C Ki miiin
[0098] 如图5A-E所示,分离后的寡核苷酸亚库中对应同一根片段的序列被重新混合在 一起,两端的通用引物序列通过酶切完全移除,而后组装基因片段乃至基因全长。如图 所示,当构成一根片段DNA的寡核苷酸缺一根时,片段DNA都无法组装成功,当寡核苷酸的 个数完整时,就可以得到目标大小的片段DNA。因此,可以证明我们分离得到的寡核苷酸确 实是预期的序列。
[0099] 分离得到的单一寡核苷酸同样经过测序验证,结果表明这种制备方法完全可以满 足下游的直接应用。纯化后的DNA通过加 A反应在3'末端加入碱基A。
[0100] 加 A反应体系为:
[0101] 10 \ Taq buffer (Thermo) 5 μL 10 mM dATP (Sangon) I pL DNA 42 (uL Taq DNA polymerase (I U/ 1,Thermo) 2 pL 总体积【50μυ
[0102] 反应条件是:
[0103] Step 1:72 °C 30min〇
[0104] 混合液使用乙醇沉淀方法进行纯化,后使用pGEM-T Eazy Vector System I (Promega)试剂盒进行TA连接。
[0105] 连接反应体系为:
[0106] 2 \ Rapid Ligaiion BuiTcr (Promcga) 5 pL pGEM-T Easy Vector I μΕ DNA 4,uL T4 DNA Ligasc (3 Vciss units/ I. Promcga) I μL 总体积【ΙΟμL?
[0107] 反应条件是:
[0108] Step 1:16 °C 8hours〇
[0109] 连接产物通过热激法转化入E.coli XLlO-Gold感受态细胞。随机挑选克隆进行 Sanger测序(送至上海生工)。当PAGE检测条带非常单一时,随机挑选的10个克隆全部 都含有目标序列。当PCR效果及分离效果不佳时,随机挑选的7根单寡核苷酸内有4根是 目标产物。
[0110] 组装得到的基因全长,包括EGFP、0X1、TrEGl、TrCBH、CtCBH基因分别进行了测序 验证(图6)。
[0111] 本发明制备的单根寡核苷酸的产量以及成本如表4所示,所需时间成本如图7所 不O
[0112] 表4单根寡核苷酸(>60nt)制备能力
[01131
[0114] 以上实例说明通过本发明的方法可以快速制备高产量的单根寡核苷酸,产物具有 尚准确性、低成本、尚保真性的特点,具有很尚的应用价值。
[0115] 实施例2
[0116] 合成microRNA前体模板DNA的单根寡核苷酸文库
[0117] 本发明合成了 1张芯片,用来合成223条microRNA前体模板DNA (线虫来源,序 列来自miRBase: http://www.mirbase.org/)。以此为例,单张芯片合成的寡核苷酸数量达 到385条,合成的模板总长度达到达到19, 930nt,单根寡核苷酸长度范围在73~120nt,平 均长度基本都在l〇3mer左右,芯片合成寡核苷酸总长度达到39, 946nt (表5)。
[0118] 表5芯片合成信息
[0119]
[0120] 试剂和菌株:本发明中的所有试剂均是市场购买的试剂级以上试剂。KOD plus DNA聚合酶用作寡核苷酸亚库的扩增,购自东洋纺生物公司(Τ0Υ0Β0)。Pfu DNA聚合酶用于 单根寡核苷酸的扩增,购自上海申能博彩生物公司(BBST)。核酸限制性内切酶、T4连接酶 均购自Fermentas中国公司。试剂等除特别注明,都购自上海生工。大肠杆菌Escherichia coli XLlO-Gold作为DNA操作时使用的宿主菌,大肠杆菌E. coli BL21(DE3)作为蛋白表 达的宿主菌,购自Invitrogen公司。包含100 μ g/mL氨节青霉素的LB培养基用作培养 E. coli。引物由上海生工合成。
[0121] 寡核苷酸的设计及合成
[0122] 如表6所示,将所有的寡核苷酸(385根寡核苷酸)分为不同的亚库(共52个亚 库),每个亚库含有7~11根不同寡核苷酸(如图1,2所示)。合成的寡核苷酸亚库分别 命名为microRNA前体模板DNA线虫亚库1~52。设计的关键点是:(1)引入额外的通用引 物序列,将总的寡核苷酸混合库分为一系列寡核苷酸亚库(如表7所示),降低寡核苷酸的 复杂性。通用引物序列内含有IIS型限制性内切酶识别位点,该种内切酶的特点是识别位 点和切割位点位于不同位置,进行酶切时,切割位点在识别位点的3'端,间隔多个碱基,如 Sch I的切割位点和识别位点间隔5个碱基。这些额外添加的通用引物序列都可以通过IIS 型限制性内切酶位点移除,并且不切除本身序列,也不残留额外碱基;(2)每个亚库所含的 相邻寡核苷酸之间长度差别至少是4bp,便于下游的分离过程(如图1所示);(3)同张芯 片合成的寡核苷酸分到同一亚库时,不可避免会出现长度一致的情况,此时,需要在目的序 列的3'端引入接头序列,使得本来长度相同的DNA显示出长度差异(如图2所示)。这些 接头序列长度不一(1~36nt)。其中,大于或等于IOnt的接头序列含有IIS型限制性内 切酶识别位点,如Sch I、Bbs I等,因此这些额外的接头序列可以通过酶切完全移除。而小 于IOnt的接头序列都添加在无需移除的寡核苷酸序列5'端,这些寡核苷酸序列两端本身 含有构建载体时所需的酶切位点。
[0123] 另外,随着同张芯片上合成寡核苷酸数量的增加,而同组亚库的寡核苷酸个数由 于平均长度(~IOOnt)和相邻之间长度差(Mnt)的限制,很难超过15根,因此需要的通 用引物量随之增加。在这里,使用的通用引物是可以使用到不同芯片合成的寡核苷酸文库 中的,将一系列预先设计的通用引物库内的引物之间两两组合,可以得到大量区分寡核苷 酸亚库的标签,满足大量寡核苷酸的分组。但是,需要注意的一点是,在设计通用引物库时, 通用引物序列长15个碱基,其中所含5~6个碱基的IIS型限制性内切酶位点是不可变 的,因此可变区只有9~10个碱基,同时该引物需要达到至少43°C的Tm值,因此可变的位 置就更少了。结果导致通用引物序列之间可能会存在一定同源性,导致一部分非特异性扩 增。因此,在引入通用引物到寡核苷酸序列设计的时候需要特别注意,避免不恰当的引物组 合造成的PCR困扰。
[0124] 构成线虫来源microRNA前体DNA模板的寡核苷酸共385根,最终可以得到223条 microRNA前体的模板DNA,分别对应一条microRNA前体(SEQ ID N0:73-295),这些序列是 线虫来源microRNA前体序列,来自miRBase数据库:http://www. mirbase.org/,编号对应 如下:
[0125] SEQ ID NO : 73 ~295
[0126]
[0127]
MI0000344 MI0000345 MI0000346 MI0000347 MI0000348 ΜΙ?)(???0349 Μ1()0(??)35?? Μ100(??)351 ΜΙ(Κ)0(?352 ΜΙ00(?()353 Μ!()00(?752 ΜΙ0()()0753 ΜΙ0()()0754 ΜΙ()()00755 MI0019L58 Μ1()()00756 ΜΙ?)000757 Μ10()00758 ΜΙ?)0(Κ)759 MIU(MU)S 19 Μ?()?)05184 ΜΙ?)0(?5185 ΜΙ(Κ)05!86 ΜΚ?005Ι87 ΜΙ()??()5188 ΜΙ0??()5189 VI1()()0519(? M10005191 M10005192 M10005193 ΜΙ00?).5?94 ΜΙ00?).5?95 M10005196 M 1000.5197 M10005198 ΜΙ?)005199 Μ1?)()()520() Μ1?)0()5201 ΜΙ0005879 Μ1?)()?)588() Μ1()?)(?5881 Μ100?)5899 M 1()()()590() M10007979 ΜΙ00?)798?) MI0U07981 Μ 丨()()()7982 M10007983 ΜΙ(Κ)〇7984 ΜΙ(Κ)〇7985 Μ?Ο()()79Κ6 ΜΙ()0?)8196 ΜΙ(??)08197 ΜΙ?)(??)8198 Ml(H)OH 199 M10008200 M 丨()()()82()2 M10010967 Μ!00(?82?)3 ΜΙ0()()8204 M I(K) 10955 M I(K) 10956 MI()010957 MlOO 10958 MIOO10969 Ml(H) 10959 MIOO10960 MIOO10961 Μ?()?)10%2 MIOO10963 M I(K) 10964 ΜΙ(?ΟΚ)96? M IOOl 0966 M IOOl 0968 VU(M) 1()97() Mi0010971 MIOO !0972 MI(H) 10973 ΜΙ00?(?974 ΜΙ00?3633 ΜΙ0017.53.5 ΜΙ0017536 ΜΙ0017.537 MIOO17538 ΜΚ?017539 Μ1??()17540 MIOUl 7541 ιΜΙΟΟ 17542 MlOOl 7543 Μ10017544 ΜΙ0017545 ΜΙ0017546 MIOO17705 MI00177U6 MIUUl 77()7 MIUOl 7708 MKKU 77()9 MKKU 7711 MKKll 771() ΜΙ0017712 MIUOl 7713 MlUUl 7714 Μ10017715 Μ10017716 MI(K)17717 ΜΙ0017718 MIOOl 7719 ΜΙ001772?) ΜΙ0017721 ΜΙ0017722 ΜΙ0017723 VllOOl 7724 ΜΙ?)019?)66 Μ10019067 ΜΙ0019068 MIOO19069 VU(K) 19()7() MI(M) I ()()71 M I(K) 19(172 M KKH 9073 ΜΙ0??19074 Μ 丨()()19153 ΜΙ0019154 ΜΙ0019155 ΜΙ0019156 ΜΙ0019157 MIOO 191.59
[0128] 因为目标长度是41bp~180bp,而芯片合成寡核苷酸的最大长度是120bp,所以, 当这些目标DNA序列超过了芯片合成最大长度时,需要利用软件切割成较短的寡核苷酸; 未超过芯片最大合成长度的DNA部分,可以直接应用到下游的实验过程中。另外,为了便于 后续转录载体的构建,我们在目标片段两端直接引入构建载体所需的酶切位点,或者同源 重组位点序列。当目标序列<78bp时,我们在目标序列两端加入酶切识别位点,并且直接在 芯片上合成全长序列(<120bp)。当目标序列>78bp时,利用DNAWorks [並]和自建软件将目 标序列全长两端引入酶切位点或同源同组位点后,切割成2~4段较短一些的寡核苷酸,相 邻寡核苷酸之间重叠区域的Tm设定为70°C,方便后续的融合全长过程(如图8所示)。芯 片合成由LC science公司完成。
[0129] 表6人工合成短DNA序列信息表
[0130]
[0131] 表7寡核苷酸长度及扩增使用的通用引物序列
[0132]
[0133] 寡核苷酸亚库的扩增
[0134] 以芯片微流技术制备得到寡核苷酸,从芯片上洗脱得到寡核苷酸(ssDNA)混合物 (~20pmol),其中每条寡核苷酸的量根据不同芯片合成寡核苷酸总量的不同而不同。以单 种寡核苷酸〇. 013fmol为模板,使用对应的通用引物(如表2所示),采用DNA聚合酶为KOD plus DNA聚合酶进行寡核苷酸亚库的扩增。
[0135] PCR反应体系为:
[0136] 10 X KOD~plus bulTcr (Toyobo) 2.5 μL 2.() niM dNTPs (Toyobo) 2.5 μ L 25 ηιΜ MgSO4 (Toyobo) 1.5 μ L Prinicr-F (100 μΜ. Sangon) ().25 pL Primcr-R (KH) μ,Μ. Sangon) (1.25 μ L Template (0.013 Imol each oligo) 0.25 μL KOD-pius DNA pohmcrasc (I U/ L TOYOBO) ().25 μL ddH:0 17.25 μ L
[0137] 【总体积】 【25 μυ
[0138] PCR反应条件是:
[0139] Step 1: 94 C' 5 min: Step 2: 94 C 15 s: Slcp 3: Tni土 3'C 30 s: Step 4: 68 C 30 s; Slcp 5: Go to Step 2, 29 cycles; Step 6: 68 C 10 min〇
[0140] 寡核苷酸的分离
[0141] 将扩增得到的寡核苷酸亚库(7~11根不同寡核苷酸)通过8%聚丙烯酰胺凝胶 【20cm(长)x0. 15cm(宽)x 16cm(高)】进行电泳分离。电泳条件是150V预电泳10分钟, 上样品(每孔600ng,9pmol)后,冰浴条件下300V电泳3小时。电泳采用脉冲法,即30分 钟停顿一次并立即重新开始。每根寡核苷酸(35ng,0.5pmol)之间至少4bp的差距可以在 凝胶中明显区分开(图5A)。将每根寡核苷酸直接从凝胶上切割下来浸入50 μ L TE缓冲液 中,作为下一步选择性扩增的DNA模板材料。
[0142] 8%聚丙烯酰胺凝胶成分(5〇11^):
[0143] 40% acr:bis (19:1) 10 inL 10 X TBE bullcr 3 mL ddH20 34.45mL TEMED 50 μL 10% ammonium pcrsulialc 500 ,LlL ?
[0144] 单根寡核苷酸的选择性扩增
[0145] PAGE分离后的单根寡核苷酸从凝胶切割分离后浸入到TE缓冲液中,DNA会扩散溶 解到TE缓冲液,以此单根寡核苷酸DNA为模板,采用对应扩增组的寡核苷酸通用引物,使用 Pfu DNA聚合酶(BBST)进行寡核苷酸的选择性扩增。当单一寡核苷酸就是目标产物时,扩 增体系是50 μ L。当得到的单一寡核苷酸还要进行下步组装反应时,扩增体系是20 μ L。
[0146] PCR反应体系为:
[0147] 10 X Pfu bulTer (BBST) 5 jiL 10 niMdNTPs ( I I .) I μ.Ι Primer-F (KU) M. Sangon) 0.5 p.L Primcr-R (H)U Μ. Sangon) 0.5 μ L Template (凝胶中DNA的TE溶出液) 1叫 Pfu DNA pol> mcrasc (5 U/ L· BBST) 0.5 HL ddH:0 41 μ L 【总体积】 【50 μι】
[0148] PCR反应条件是:
[0149] Step 1: 95 C 5 min: Slcp 2: 95 "C 30 s;
[0150] Step 3: 50 C 30 s: Slcp 4: 72 C 30 s: Step 5: Go to Step 2. 29 cx clcs: Step 6: 72 "C 10 min。
[0151] 如图9B,10所示,采用本发明方法,可以得到明显单一的PAGE纯度的寡核苷酸,这 些寡核苷酸具有不同长度,纯度已经达到PAGE级别。
[0152] 寡核苷酸的功能验证
[0153] 为了验证分离得到的寡核苷酸是否可用,以这些寡核苷酸作为原材料,进行统一 的酶切和之后的拼装。酶切体系如下:
[0154] 酶切反应混合物:
[0155] I (I \ Tango 缓;丨 I 丨液(Thermo) 10 μ L 寡核苷酸(4 μ§) 60 pmol Sch I (10 U/p L. Thermo) 2 μ.L H2O 补齐到【50μυ
[0156] 酶切反应于37°C进行1小时后,采用乙醇沉淀方法进行纯化,并重悬于50L TE缓 冲液中备用。
[0157] 纯化后的寡核苷酸混合物直接用于片段拼装。拼装采用聚合酶循环拼装方法 (PCA)。反应体系如下:
[0158] PCA反应体系为:
[0159] Η?χΡ??! bullcr (BBST) 1 μL 10 mM dNTPs (Sangon) 0.3 μ L Template (寡核苷酸) 12 ρηχο? Pfu DNA polvnicrasc(5 Li/ L. BBST) (}. I μL ddHoO 补齐到【1〇μυ
[0160] PCR反应条件是:
[0161] Step 1: 95 C 5 min: Step 2: 95 C 30 s; Step 3:72 "C 120 s: Step 4: Go to Step 2. 14 c\clcs: Step 6: 72 "C 1(} min。
[0162] 以PCA产物为模板,使用Pfu DNA聚合酶扩增目的片段。反应如下:
[0163] PCR反应体系为:
[0164] 10 X Plu bullcr (BBST) 5 pL IOmMdNTPs(SangOn) IgL Primcr-F (K) M. Sangon) IpL Prinicr-R (K) M. Sangon) 1 μL Template (PCA 产物稀释 10~100 倍) I μL Pfu DNA pol\ mcrasc (5 U/ I- BBST) I μL
[0165] ddH:0 40 μL 【总体积】 【50μ.υ
[0166] PCR反应条件是:
[0167] Step 1: 95 C 5 min; Step 2: 95 'C 30 s; Step 3: 55 tC 30 s; Step 4: 72 C 3() s: Step 5: Go to Slcp 2. 2.9 c\clcs: Step 6: 72 C l Uniiiu
[0168] 得到的产物采用乙醇沉淀方法进行纯化,纯化后的DNA通过加 A反应在3 '末端加 入喊基A。
[0169] 加 A反应体系为:
[0170] Ki x Taq buficr (Thermo) 5 pL 10 niM dATP (Sangon) I pL DNA 42 μ L Taq DNA pohmcrasc (I U/μΙ. Thermo) 2 μL 总体积【50μυ
[0171] 反应条件是:
[0172] Step 1:72 °C 30min〇
[0173] 混合液使用乙醇沉淀方法进行纯化,后使用pGEM-T Eazy Vector System I (Promega)试剂盒进行TA连接。
[0174] 连接反应体系为:
[0175] 2 X Rapid Ligation Buffer (PromcL,a) 5 pL pGEM-T Easy Vector I pL DNA 4μΙ T4 DNA Ligasc (3 Vciss units/ I. Promega) I pL 总体积【ΙΟμυ
[0176] 反应条件是:
[0177] Step 1:16 °C 8hours。
[0178] 连接产物通过热激法转化入E.coli XLlO-Gold感受态细胞。随机挑选克隆进行 Sanger测序(送至上海生工)。测序结果显示,目的片段被成功获得。
[0179] 表8单根寡核苷酸(>60nt)制备能力
[0180]
[0181] 本发明建立的这种规模化的单一寡核苷酸分离制备方法具有以下优势:(1)整体 时间成本低,如图7所示,从芯片合成到得到单一寡核苷酸的过程可以在22h内完成;(2) PAGE分离后的寡核苷酸纯度较高;(3)试剂成本低,如表8所示,当芯片合成1,879根寡核 苷酸时,得到40pmol寡核苷酸产物时,单个碱基的成本可以降到$0. 004,比现在商业提供 的寡核苷酸(>60nt,$0. 4~1. Ο/nt)降低了大约100倍。当芯片合成通量提高时,单个碱 基的成本会进一步降低;(4)产量高,如表8所示,当芯片合成385根寡核苷酸时,最终得到 的单一寡核苷酸最高量可以达到600nmol。理论上我们所使用的4K芯片最大合成规模是 3, 600根寡核苷酸,此时,单一寡核苷酸的最高量同样可以达到7. 7nmol。分离后的单一寡 核苷酸可以作为模板,通过通用引物再次扩增,根据需求得到大量的单一寡核苷酸。当然, 进一步提高寡核苷酸产物产量会伴随着成本的提高,提高的部分来源于寡核苷酸扩增时使 用的DNA聚合酶的成本。例如,商业化提供的直接化学合成的寡核苷酸可选择的最少的DNA 量大约是1~3nmol,采用本发明方法制备3nmol寡核苷酸时成本提高达到$0. 171/nt。但 是,实际应用寡核苷酸时,无论是以克隆为手段,还是直接以双链DNA形式起作用,一轮分 离过程得到的40pmol的寡核苷酸DNA量都已足够,因此成本可以继续缩减到$0. 009/nt。 另外,只要单根寡核苷酸模板存在,使用者就可以根据自己的需要自行扩增所需的DNA产 物量,非常方便。
[0182] 参考文献
[0183] I. Froehlerj B. C. and M. D. Matteuccij Substituted 5-PhenyItetrazoles-Improved Activators of Deoxynucleoside Phosphoramidites in Deoxyoligonucleotide Synthesis. Tetrahedron Letters,1983. 24(31):p. 3171-3174.
[0184] 2. Cheng, J. Y. , e t al. , High throughput parallel synthesis of oligonucleotides with 1536channeI synthesizer. Nucleic Acids Research, 2002. 30(18).
[0185] 3. Carr, P. A. and G. M. Church, Genome engineering. Nature Biotechnology, 2009 .27(12) :p. 1151-1162.
[0186] 4. Gaoj X. L. , E. Gularij and X. C. Zhou, In situ synthesis of oligonucleotide microarrays. Biopolymers, 2004. 73 (5) :p. 579-596.
[0187] 5. Gaoj X. L. , et al. , A flexible light-directed DNA chip synthesis gated by deprotection using solution photogenerated acids. Nucleic Acids Research, 2001. 2 9(22) :p. 4744-4750.
[0188] 6. Lee, C. -C. , T. M. Snyder, and S. R. Quake, A microfluidic oligonucleotide synthesizer. Nu cleic Acids Research, 2010. 38(8):p. 2514-2521.
[0189] 7. Wysoczynskij C. L. , et al. , Reversed-phase ion-pair liquid chromatography method for purification of duplex DNA with single base pair resolution. Nucleic Acids Res,2013. 41 (20) :p.el94.
[0190] 8. Igouchevaj 0. , V. Alexeev, and K. Yoon, Differential cellular responses to exogenous DNA in mammalian cells and its effect on oligonucleotide-directed gene modification. Gene Therapy, 2006. 13(3) :p. 266-75.
[0191] 9. Schlabachj M. R. , et al., Synthetic design of strong promoters. Proc Natl Acad Sci U S A,2010. 107(6) :p. 2538-43.
[0192] 10. Bennett, C. F. and E. E. Swayzej RNA Targeting Therapeutics:Molecular Mechanisms of Antisense Oligonucleotides as a Therapeutic Platform. Annual Review of Pharmacology and Toxicology,2010. 50:p. 259-293.
[0193] 11. Keefe, A. D. , S. Paij and A. Ellington, Aptamers as therapeutics (vol 9, pg 537, 2010). Nature Reviews Drug Discovery,2010. 9 (8).
[0194] 12. Castanottoj D. and J. J. Rossi, The promises and pitfalls of RNA-interference-based therapeutics. Nature, 2009. 457(7228):p. 426-433.
[0195] 13.Gragoudasj E.S.,et al.,Pegaptanib for neovascular age-related macular degeneration. New England Journal of Medicine, 2004. 351 (27):p. 2805-2816.
[0196] 14. Orrj R. M. , Technology evaluation:Fomivirsen, Isis pharmaceuticals Inc/ CIBA vision. Current Opinion in Molecular Therapeutics, 2001. 3 (3):p. 288-294.
[0197] 15. Shalemj 0. , et al. , Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Science, 2013.
[0198] 16. Flores-Jassoj C. F. , et al. , One-oligonucleotide method for constructing vectors for RNA interference.Acta Pharmacol Sin,2005. 26(12) :p. 1467-73.
[0199] 17. McIntyre, G. J. and G. C. Fanning, Design and cloning strategies for constructing shRNA expression vectors. BMC Biotechnolj2006.6:p. I.
[0200] 18. Lopez-Gomollonj S. and F. E. Nicolas, Purification of DNA Oligos by Denaturing Polyacrylamide Gel Electrophoresis(PAGE) · Laboratory Methods in Enzy mology:DNA,2013. 529:p. 65-83.
[0201] 19. Andrus, A. and R. G. Kuimelisj Analysis and Purification of Synthetic Nucleic Acids Using HPLCj in Current Protocols in Nucleic Acid Chemistry. 2001, John Wiley&Sons, Inc.
[0202] 20.LeProustj E. ,et al. , Characterization of oligodeoxyribonucleotide synthesis on glass plates. Nucleic Acids Res,2001. 29(10):p. 2171-80.
[0203] 21. Barone, A.D.,et al. , Photolithographic synthesis of high-density oligonucleotide probe arrays.Nucleosides Nucleotides Nucleic Acids,2001. 20(4-7) :p. 525-31.
[0204] 22. Hughes, T. R. , et al. , Expression profiling using microarrays fabricated by an ink-jet oligonucleotide synthesizer.Nat Biotechnolj 2001. 19(4) :p. 342-7.
[0205] 23. Chow, B. Y. , C. J. Emigj and J. M. Jacobson, Photoelectrochemical synthesis of DNA microarrays. Proc Natl Acad Sci U S A, 2009. 106(36) :p. 15219-24.
[0206] 24. Cheongj W. C. , et al. , New insights into the de novo gene synthesis using the automatic kinetics switch approach. Analytical Biochemistry, 2010. 406( I) :p. 51-60.
[0207] 25. Egelandj R. D. and E. M. Southern,Electrochemical Iy directed synthesis of oligonucleotides for DNA microarray fabrication. Nucleic Acids Research, 2005. 33 (14).
[0208] 26. Kosurij S., et al. , Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips. Nature Biotechnology,2010. 28 (12):p. 1295-U108.
[0209] 27. Quanj J. Y., et al. , Parallel on-chip gene synthesis and application to optimization of protein expression. Nature Biotechnology, 2011. 29(5):p. 449-U239.
[0210] 28. Tianj J. ,et al. , Accurate multiplex gene synthesis from programmable DNA microchips. Nature, 2004. 432(7020) :p. 1050-4.
[0211] 29. Zhou, X. , et al. , Microfluidic PicoArray synthesis of oligodeoxynucleotides and simultaneous assembling of multiple DNA sequences. Nucleic Acids Res,2004. 32(18) :ρ· 5409-17.
[0212] 30. Hoover, D. M. and J. Lubkowskij DNAWorks : an automated method for designing oligonucleotides for PCR-based gene synthesis.Nucleic Acids Research, 2002. 30(10).
[0213] 31. Wan, W. , et al·,Error removal in microchip-synthesized DNA using immobilized MutS. Nucleic Acids Res,2014.
[0214] 32. Hong, J. , et al. , Cloning of a gene encoding a highly stable endo-beta-l,4-glucanase from Aspergillus niger and its expression in yeast. J Biosci Bioengj 2001. 92(5) :p. 434-41.
[0215] 33. Hong,J.,et al. , Construction of thermotolerant yeast expressing thermostable cellulase genes. J Biotechnolj2007.130 (2):p. 114-123.
[0216] 34. Schiestlj R. H. and R. D. Gietzj High-Efficiency Transformation of Intact Yeast-Cells Using Single Stranded Nucleic-Acids as a Carrier. Current Genetics, 1989. 16(5-6) :p. 339-346.
[0217] 35. Ilmen, M.,et al. , High level secretion of cellobiohydrolases by Saccharomyces cerevisiae. Biotechnology for Biofuels, 2011. 4(1):p.30.
[0218] 36. Zhang, Y. H. P. , et al. , A transition from cellulose swelling to cellulose dissolution by o-phosphoric acid:Evidence from enzymatic hydrolysis and supramolecular structure. Biomacromoleculesj 2006. 7(2):p. 644-648. 〇
【主权项】
1. 一种高通量合成和纯化寡核苷酸的方法,所述方法包括以下步骤: 1) 设计寡核苷酸序列,在寡核苷酸两端加上通用引物,以将合成的全部寡核苷酸分成 若干亚库,不同亚库具有不同的通用引物,同一亚库具有相同通用引物,所述通用引物上含 有IIS型内切酶的酶切位点; 2) 进行基于微芯片的DNA原位合成,并洗脱合成产物; 3) 利用所述通用引物对所述合成产物进行PCR扩增; 4) 分离扩增产物。2. 根据权利要求1所述的方法,所述亚库以要合成的寡核苷酸片段大小来分配。3. 根据权利要求1所述的方法,在寡核苷酸和一侧的通用引物之间还具有接头序列。4. 根据权利要求3所述的方法,所述接头序列含有IIS型内切酶的酶切位点。5. 根据权利要求1所述的方法,每个亚库含有5-11根长度不同的寡核苷酸。6. 根据权利要求1所述的方法,每个亚库中相邻长度的寡核苷酸相差至少4个碱基。7. 根据权利要求1所述的方法,步骤4)中的分离使用聚丙烯酰胺凝胶电泳进行。8. 根据权利要求1所述的方法,所述方法在步骤4)后还包括用IIS型内切酶酶切和/ 或用相应通用引物选择性PCR扩增分离后的独立寡核苷酸的步骤。9. 根据权利要求1所述的方法,所述IIS型内切酶是内切酶SchI,BbsI或BsaI。10. 根据权利要求1所述的方法,所述微芯片是4k芯片。
【专利摘要】本发明公开了一种基于芯片进行规模化快速制备单根寡核苷酸的方法,具体是基于DNA微芯片和聚丙烯酰胺凝胶分离方法,规模化快速分离制备单根寡核苷酸的方法。本发明还公开了以规模化制备单根寡核苷酸的芯片上寡核苷酸合成序列的设计方法。该方法可以在22h之内得到纳摩尔级的PAGE纯度的独立的双链寡核苷酸。该方法得到的单根寡核苷酸的花费最低可降至$0.009/碱基,并且,随着单张芯片合成量的提高,成本可以进一步降低。本发明成功制备615根不同的寡核苷酸,分为88个寡核苷酸亚库,合成寡核苷酸总长度达62,809个碱基。
【IPC分类】C07H21/04, C07H1/00
【公开号】CN104892711
【申请号】CN201510252872
【发明人】洪泂, 高晓连, 李璐璐
【申请人】中国科学技术大学
【公开日】2015年9月9日
【申请日】2015年5月18日

最新回复(0)