一种多样本多片段dna甲基化高通量测序方法

xiaoxiao2020-10-23  5

一种多样本多片段dna甲基化高通量测序方法
【技术领域】
[0001] 本发明涉及高通量基因组甲基化DNA检测领域,尤其涉及一种多样本多片段DNA 甲基化高通量测序方法。
【背景技术】
[0002] DNA甲基化是一种重要的表观遗传调控因子。在哺乳动物细胞中,DNA甲基化通常 发生在CpG二核苷酸的胞嘧啶上,形成5甲基胞嘧啶。DNA甲基化的改变,尤其是抑癌基因 启动子区的高甲基化在多种肿瘤的形成和发展过程当中起着重要的作用,同时DNA低甲基 化也与癌基因的过表达和染色体的不稳定相关。
[0003] 当前,研宄DNA甲基化的方法有基因组整体甲基化检测的甲基化DNA免疫共沉 淀芯片(microarray analysis following methylated DNA immunoprecipitation, MeMe DIP-chip)、甲基化 DNA 免疫共沉淀测序(sequencing analysis following methylated DNA immunoprecipitation, MeDIP-seq)、简化的表观亚硫酸氢盐测序技术(reduced representation bisulfite sequencing, RRBS)、重亚硫酸盐全基因组测序(bisulfite genomic sequencing)和特异基因位点甲基化检测的传统的重亚硫酸盐克隆测序、焦磷酸 测序。其中,单个基因位点DNA甲基化检测的金标准是重亚硫酸盐克隆测序,其利用重亚硫 酸盐将基因组DNA中的未甲基化的胞嘧啶(C)修饰为尿嘧啶(U),甲基化的胞嘧啶(C)保持 不变,在PCR扩增中,尿嘧啶(U)变成胸腺嘧啶(T),然后将PCR产物连接到特定载体上,转 化到感受态细菌中,挑取10个以上单克隆菌株进行一代测序,根据参考序列中胞嘧啶位置 C/T的频率来判断该位点的甲基化程度。
[0004] 最近有文献报道了一种新的定量检测特异片段DNA甲基化的方法,这种方法结合 了重亚硫酸盐转化、特异性片段扩增、依赖转座酶的建库方式和第二代测序,称为重亚硫酸 盐扩增子测序(BiSulfite Amplicon Sequencing,BSAS)。这种方法可以对特异基因组区域 内的甲基化胞嘧啶进行精准的绝对定量。但是该文章中使用的是依赖转座酶的建库方式, 使用Illumina公司的Nextera XT建库试剂盒,使用双向标签序列Index,每个测序芯片上 可以最多同时检测96个样本。
[0005] 重亚硫酸盐克隆测序方法是一种可靠性和精确度很高的方法,能明确目的片段中 每一个CpG位点的甲基化状态,但是不足之处是至少要测序10个以上克隆才能获得可靠数 据,过程较为繁琐,耗时耗资过多。
[0006] BSAS的缺点是对于PCR产物使用转座酶酶切以后,就不能检测PCR产物两端被酶 切掉序列的甲基化状态;每个样本需要构建一个文库。而且,还有文献报道扩增子测序中会 出现等位基因间PCR重组的现象。

【发明内容】

[0007] 针对上述重亚硫酸盐扩增子测序中存在的问题,本发明提供了一种针对多样本多 片段的DNA甲基化高通量检测方法,该方法能够在一个文库中同时分析多个样本、多个目 标片段的DNA甲基化状态,片段长度可以达到500bp左右,并且PCR重组发生率低,该方法 还具有起始样本量少、针对性强、成本低、充分利用测序通量等优点。
[0008] 本发明解决上述技术问题所采用的技术方案为:
[0009] -种多样本多片段DNA甲基化高通量测序方法,其特征在于包括以下步骤:步骤 一:提取基因组DNA,对基因组DNA进行重亚硫酸盐处理,然后对处理好的基因组DNA进行 PCR扩增,其中针对不同基因片段使用不同的PCR引物,相同的基因片段使用标签序列区分 不同的样本;
[0010] 步骤二:将步骤一中不同的PCR产物进行混合,使用混合好的PCR产物进行测序文 库制备;
[0011] 步骤三:对测序文库进行QPCR质检定量;
[0012] 步骤四:上机测序,对不同样本特异性片段甲基化状况进行高精度分析。
[0013] 为优化上述技术方案,具体措施还包括:
[0014] 上述样品基因组DNA可以来源于任意物种,包括但不限于动物、植物、昆虫的基因 组 DNA。
[0015] 上述步骤1中PCR引物针对不同基因、不同的扩增区域设计,片段长度可以达到 500bp左右(最长片段长度大于500bp);同时在上下游PCR引物的5'端分别加上3个碱基 以上的标签序列,含不同标签序列的上下游引物分别组合用以区分不同的样本。
[0016] 上述步骤一中进行PCR扩增所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的 热启动taq酶、常规的r-taq酶或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA 的热启动taq酶;还包括对扩增产物进行1. 5%的琼脂糖胶电泳纯化的步骤。
[0017] 还包括将纯化回收的产物定量,然后将不同样本的产物按照相同的摩尔数混合, 得到混合的PCR产物的步骤。
[0018] 上述对步骤二的文库制备利用如下步骤进行:
[0019] 步骤1,对混合后的PCR产物进行定量,优选荧光定量的方法,取50ng进行文库制 备;
[0020] 步骤2,将混合的PCR产物进行3'末端修复和3'末端添加碱基A ;优选通过T4聚 核苷酸激酶、Klenow片段聚合酶、Klenow片段(3' -5' exo_)聚合酶、dNTP、dATP的作用同 时进行3'末端修复和3'末端添加碱基A ;
[0021] 步骤3,,将3'末端添加碱基A的产物连接测序接头,获得测序接头连接产物;3' 末端添加上碱基A的产物,通过优选的T4DNA连接酶的作用,与测序通用的接头进行连接, 得到接头连接效率高的连接产物;
[0022] 步骤4,将测序接头连接产物进行PCR扩增,其中PCR循环数为6轮,获得测序文 库;
[0023] 还包括对文库制备中各步骤的产物进行纯化回收的步骤,纯化方法包括但不限于 磁珠纯化、纯化柱纯化、2 %琼脂糖胶电泳纯化,优选磁珠纯化。
[0024] 本发明还提供了根据上述的方法建立的测序文库。
[0025] 本发明还提供了根据上述的方法检测多个样本、多个目标片段的DNA甲基化状 ??τ O
[0026] 针对重亚硫酸盐扩增子测序中存在的问题,本发明提供了一种针对多样本多片段 的DNA甲基化高通量检测方法,该方法能够在一个文库中同时分析多个样本、多个目标片 段的DNA甲基化状态,片段长度可以达到500bp左右,并且PCR重组发生率低,该方法还具 有起始样本量少、针对性强、成本低、充分利用测序通量等优点。
【附图说明】
[0027] 图1显示了实施例中所有样本在CDH13片段内每个胞嘧啶位点甲基化的水平。
[0028] 图2显示了实施例中所有样本在SEPT9片段内每个胞嘧啶位点甲基化的水平。
【具体实施方式】
[0029] 本发明的主要技术流程:提取基因组DNA,然后对基因组DNA进行重亚硫酸盐处 理,然后对处理好的基因组DNA进行PCR扩增,其中针对不同基因片段使用不同的PCR引 物,相同的基因片段使用标签(barcode)序列区分不同的样本,然后将不同的PCR产物进行 混合,混合好的PCR产物进行测序文库的制备,然后对文库进行QPCR质检定量,然后上机测 序,最后进行不同样本特异性片段甲基化状况的高精度分析。
[0030] 根据本发明的实施例,其中样品基因组DNA可以来源于任意物种,包括但不限于 动物、植物、昆虫的基因组DNA。
[0031] 根据本发明的实施例,将抽提的基因组DNA进行重亚硫酸盐处理,如利用EZ DNA Methylation-Gold KitTM(ZYMO)使非甲基化胞喃啶转化为尿喃啶。
[0032] 根据本发明的实施例,其中PCR引物首先针对不同基因、不同的扩增区域设计,片 段长度最长可达500bp左右;其次在上下游PCR引物的5'端分别加上3个碱基以上的标签 (barcode)序列,含不同barcode的上下游引物分别组合用来区分不同的样本。
[0033] 根据本发明的实施例,将区分样本的引物组合设计好以后,以重亚硫酸酸盐转化 后的DNA为模板进行PCR扩增,其中所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的 热启动taq酶、常规的r-taq或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的 热启动taq酶;对扩增产物进行1. 5%的琼脂糖胶电泳纯化。
[0034] 根据本发明的实施例,将纯化回收的产物使用NanoD rop2000 (Thermo Fisher)定 量,然后将不同样本的产物按照相同的摩尔数混合,得到混合的PCR产物。
[0035] 根据本发明的实施例,其中文库制备的步骤如下:
[0036] 步骤一对混合的PCR产物进行定量,并取50ng进行如下步骤建库;
[0037] 对混合后的PCR产物进行定量,优选荧光定量的方法,如Qubit? 2. 0荧光定量仪 (Invitrogen),取50ng进行如下所述步骤建库;
[0038] 步骤二将混合的PCR产物进行3'末端修复和3'末端添加碱基A ;
[0039] 混合后的PCR产物,通过优选的T4聚核苷酸激酶、Klenow片段聚合酶、Klenow片 段(3' -5' exo-)聚合酶、dNTP、dATP的作用同时进行3'末端修复和3'末端添加碱基A ;
[0040] 步骤三将3'末端添加碱基A的产物连接测序接头,以便获得测序接头连接产物;
[0041] 3'末端添加上碱基A的产物,通过优选的T4DNA连接酶的作用,与测序通用的接头 进行连接,以便得到接头连接效率高的连接产物;
[0042] 步骤四将测序接头连接产物进行PCR扩增,其中PCR循环数为6轮,获得测序文 库;
[0043] 以接头连接后的产物为模板,使用Illumina公司通用的建库PCR引物,包括一条 通用的上游引物,和一条带有标签(Index)序列的下游引物,使用高效的PCR扩增酶进行 PCR,其中PCR循环数选择6轮。使用带有标签(Index)序列的引物进行PCR以后,可以将 不同来源的文库进行混合,然后上机测序。
[0044] 根据本发明的实施例,为了有效提高建库各步骤中的产物纯度、减少杂质干扰、有 利于后续步骤的进行,可以对文库制备中各步骤的产物进行纯化回收,纯化方法包括但不 限于磁珠纯化、纯化柱纯化、2%琼脂糖胶电泳纯化,优选磁珠纯化。
[0045] 根据本发明的实施例,使用QPCR的方法对测序文库进行质检定量,其中使用 Illumina phix control kit v3 作为标准品。
[0046] 根据本发明的实施例,通过二代测序平台进行测序,优选Illumina Miseq平台, Miseq的测序读长可以达到2*300,因此我们的目标片段长度可达500bp左右。
[0047] 为了进一步说明本发明的内容,下面结合本发明的一个具体实施例作进一步详细 描述:
[0048] 1、提取基因组DNA
[0049] 样本为临床全血样本,DNA 抽提米用 High Pure PCR Template Preparation Kit (Roche),具体步骤如下:
[0050] a)第一次使用新的试剂盒时:
[0051] i.用4. 5ml的无菌水完全溶解蛋白酶K粉末,使用完毕后放于-20°C储存;
[0052] ii.向装有Wash-buffer的瓶子中加入80ul的无水乙醇,并混勾;
[0053] b)将 Elution Buffer 于 7〇 度预热;
[0054] c)取 I. 5ml 离心管,加入 200ul 血样,200ul Binding Buffer,40ul Proteinase K,立即70度温浴十分钟;
[0055] d)加入IOOul异丙醇并混合完全;
[0056] e)将一个High Filter Tube插入一个收集管中,用移液管移取样品到过滤管的上 层缓冲液池中,8000 Xg.离心Imin ;
[0057] f)从收集管中取下过滤管,弃滤液和收集管,将过滤管和一个新的收集管组装起 来,加入500ul Inhibitor Removal Buffer到过滤管的上层缓冲液池中,8000Xg离心 Imin ;
[0058] g)从收集管中取下过滤管,弃滤液和收集管,将过滤管和一个新的收集管组装起 来,加入500ul Wash Buffer到过滤管的上层缓冲液池中,8000Xg.离心Imin;
[0059] h)从收集管中取下过滤管,弃滤液和收集管,将过滤管和一个新的收集管组装起 来加入500ul Wash Buffer到过滤管的上层缓冲液池中,8000Xg.离心Imin;
[0060] i)弃滤液,并额外全速离心整个High Filter TubelOs,弃收集管;
[0061] j)将过滤管插入一个新的无菌的I. 5ml微型离心管,加入70 μ 1预热的Elution Buffer至过滤管的上层缓冲液池中,8000Xg.离心lmin,即得到基因组DNA。
[0062] 2、重亚硫酸盐处理基因组DNA
[0063] 采用 EZDNA Methylation-Gold KUtm(ZYMO)试剂盒,具体步骤如下:
[0064] a) CT Conversion Reagent 的制备:添加 900ul 水,50ul 的Μ-Dissolving Buffer, 和300ul的M-Dilution Buffer到一管CT Conversion Reagent中,在室温下溶解并且在 摇床上摇动IOmin ;
[0065] b)M-WASH BUFFER的制备:加入24ml无水乙醇至M-WASH BUFFER瓶中,并在瓶盖 上做好标记;
[0066] c)在PCR管中添加:
[0067] ① DNA量500ng,根据浓度算好体积,用水来补至20 μ 1
[0068] ② 130ul 的 CT Conversion Reagent
[0069] 轻弹试管或移液器操作来混合样品;
[0070] d)将样品管放到循环变温器并按以下步骤操作:
[0071] ① 98°C放置 IOmin
[0072] ② 64。〇放置2.511
[0073] e)将柱子放入 Collection Tube 中,并加入 600ul 的 M-Binding Buffer,并将步 骤2的样品加入到柱子中,盖上盖子将柱颠倒数次来混合样品;
[0074] f)全速(>10, OOOx g)离心 30sec,弃废液;
[0075] g)添加 200ul 的 M-Wash Buffer 到柱中,全速离心 30sec ;
[0076] h)添加 2OOul 的 M-Desphonation Buffer 到柱中并且在室温(2〇°C _3〇°C )下放 置 15-20min ;
[0077] i)全速离心30sec,弃废液;
[0078] j)加 200ul 的 M-Wash Buffer 到柱中,全速离心 30sec ;
[0079] k)再添加 200ul 的 M-Wash Buffer 并且离心 30sec ;
[0080] 1)直接添加 IOul的M-Elution Buffer到柱基质中,将柱放置在I. 5ml的管中,全 速离心来洗脱DNA。
[0081] 3、针对不同基因片段和样本使用不同的PCR引物扩增
[0082] 本实施例中,采用两个基因片段,基因名称分别为⑶H13和SEPT9,均为人源的基 因,引物序列如下表:
[0085] 本实例中,针对108个样品检测上述两个基因片段的DNA甲基化,采用3个碱基的 标签序列区分样本,因此上下游分别有11个标签序列,每个样本有唯一的上下游标签序列 组合。所使用的标签序列如下表:
[0086]
[0087] PCR扩增体系为:
[0088]
[0090] PCR反应条件:
[0091]
[0092] PCR扩增产物采用I. 5%的琼脂糖胶电泳胶回收,胶回收试剂盒采用GeneJET Gel Extraction Kit(Thermo)试剂盒,最后20ul洗脱产物。
[0093] 4、PCR产物混合
[0094] 取Iul凝胶回收的产物用NanoDrop2000 (Thermo Fisher)定量,然后将不同样本 的产物按照相同的摩尔数混合,得到混合的PCR产物。
[0095] 5、文库制备
[0096] 步骤一对混合后的PCR产物使用Qubit? 2. 0 (Invitrogen)进行定量,取50ng建 库;然后对50ng待建库的DNA使用Agencourt AMPure XP beads纯化,具体步骤如下:
[0097] a)将 AMPure XP beads 置于室温下至少 30min ;
[0098] b)向I. 5mL 离心管中加入50ng待建库的DNA,再加入L 5倍体积混勾的AMPure XP beads,在漩祸混勾器上混勾并室温放置5min ;
[0099] c)将离心管放在磁力架上直至溶液澄清(大约3到5min);
[0100] d)保持离心管在磁力架上,小心弃掉离心管中的上清,注意不要碰到beads ;
[0101] e)继续保持离心管在磁力架上,加入500 yL的70%乙醇;
[0102] f)将管子放置lmin,使所有beads沉淀,弃掉乙醇;
[0103] g)重复步骤e)和f) 一次;
[0104] h)在37°C加热模块中干燥样品5min或直到残余的乙醇完全消失;
[0105] i)加入16 μ L无菌水,在漩涡混匀器上混匀,室温温育2min ;
[0106] j)保持离心管在磁力架上,静置2_3min,直到溶液澄清;
[0107] k)将16 μ L左右的上清液转移至一个新的I. 5mL离心管中,弃掉beads。
[0108] 步骤二将混合的PCR产物进行3'末端修复和3'末端添加碱基A ;
[0109] 将上一步得到的DNA按下表在I. 5ml离心管中配制末端修复和加 A反应体系:

[0112] 然后将离心管放在25°C水浴锅中水浴20minutes,72°C失活20minutes。反应完后 使用Agencourt AMPure XP beads纯化,最后用10. 5ul无菌水洗脱DNA0
[0113] 步骤三将3'末端添加碱基A的产物连接测序接头,以便获得测序接头连接产物;
[0114] 将上一步得到的DNA按下表在I. 5ml离心管中配制连接反应体系:
[0115]
[0116] 然后将离心管放在25°C水浴锅中水浴20minutes,72°C失活20minutes。反应完后 使用Agencourt AMPure XP beads纯化,最后用20ul无菌水洗脱DNA0
[0117] 备注:接头由一下序列退火形成:
[0118] Adaptor 1:5,-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3,
[0119] Adaptor2:5,-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3,
[0120] 步骤四将测序接头连接产物进行PCR扩增,其中PCR循环数为6轮,获得测序文 库;
[0121] 将上一步得到的DNA按下表在0. 2ml离心管中配制PCR反应体系:
[0122]
[0123] PCR反应条件:
[0124]
[0126] 备注:PCR引物序列如下:
[0127] TrueSeq Universal Primer:
[0128] 5 ' -AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3 '
[0129] TrueSeq Primer-Index4:
[0130] 5,-CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT CU
[0131] 反应完后使用Agencourt AMPure XP beads纯化,最后用IOul无菌水洗脱DNA。
[0132] 6、文库质检定量
[0133] 上步得到的文库用Qubit? 2. 0 (Invitrogen)进行定量,QPCR进行质检。
[0134] 7、上机测序及数据分析
[0135] 将样品使用Illumina MiseqPE-300程序进行双末端测序;Miseq产出的测序结果 是fastq形式的DNA序列,通过测序文库标签(Index)、样本标签序列(barcode)将测序序 列对应到每个样本,然后计算每个样本所测片段每个CG位点的甲基化状态。附图1显示了 所有样本在CDH13片段内每个胞嘧啶位点甲基化的水平,附图2为所有样本在SEPT9片段 内每个胞嘧啶位点甲基化的水平。
[0136] 由上述的实施例可以看出,本发明的多样本多片段DNA甲基化高通量测序方法, 能够在一个文库中同时分析多个样本、多个目标片段的DNA甲基化状态,片段长度可以达 到500bp左右,并且PCR重组发生率低,该方法还具有起始样本量少、针对性强、成本低、充 分利用测序通量等优点。同时需要指出的是,本实施例以人源基因为例进行本发明方法的 阐述,但本发明的方法在人源基因上的应用仅仅局限于科学研宄或者获取中间数据,并不 用于人类疾病的诊断和治疗。
[0137] 以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例, 凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的 普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护 范围。
【主权项】
1. 一种多样本多片段DNA甲基化高通量测序方法,其特征在于包括以下步骤: 步骤一:提取基因组DNA,对基因组DNA进行重亚硫酸盐处理,然后对处理好的基因组 DNA进行PCR扩增,其中针对不同基因片段使用不同的PCR引物,相同的基因片段使用标签 序列区分不同的样本; 步骤二:将步骤一中不同的PCR产物进行混合,使用混合好的PCR产物进行测序文库制 备; 步骤三:对测序文库进行QPCR质检定量; 步骤四:上机测序,对不同样本特异性片段甲基化状况进行高精度分析。2. 根据权利要求1所述的一种多样本多片段DNA甲基化高通量测序方法,其中样品基 因组DNA可以来源于任意物种,包括但不限于动物、植物、昆虫的基因组DNA。3. 根据权利要求1所述的一种多样本多片段DNA甲基化高通量测序方法,其中步骤1 中PCR引物针对不同基因、不同的扩增区域设计,片段长度可以达到500bp左右;同时在上 下游PCR引物的5'端分别加上3个碱基以上的标签序列,含不同标签序列的上下游引物分 别组合用以区分不同的样本。4. 根据权利要求3所述的一种多样本多片段DNA甲基化高通量测序方法,其中步骤一 中进行PCR扩增所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的热启动taq酶、常规 的r-taq酶或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的热启动taq酶;还 包括对扩增产物进行1. 5%的琼脂糖胶电泳纯化的步骤。5. 根据权利要求4所述的一种多样本多片段DNA甲基化高通量测序方法,其中还包 括将纯化回收的产物定量,然后将不同样本的产物按照相同的摩尔数混合,得到混合的PCR 产物的步骤。6. 根据权利要求1所述的一种多样本多片段DNA甲基化高通量测序方法,其中对步骤 二的文库制备利用如下步骤进行: 步骤1,对混合后的PCR产物进行定量,优选荧光定量的方法,进行文库制备; 步骤2,将混合的PCR产物进行3'末端修复和3'末端添加碱基A;优选通过T4聚核苷 酸激酶、Klenow片段聚合酶、Klenow片段(3' -5'exo_)聚合酶、dNTP、dATP的作用同时进 行3'末端修复和3'末端添加碱基A; 步骤3,,将3'末端添加碱基A的产物连接测序接头,获得测序接头连接产物;3'末端 添加上碱基A的产物,通过优选的T4DNA连接酶的作用,与测序通用的接头进行连接,得到 接头连接效率高的连接产物; 步骤4,将测序接头连接产物进行PCR扩增,其中PCR循环数为6轮,获得测序文库。7. 根据权利要求1所述的一种多样本多片段DNA甲基化高通量测序方法,其中还包括 对文库制备中各步骤的产物进行纯化回收的步骤,纯化方法包括但不限于磁珠纯化、纯化 柱纯化、2%琼脂糖胶电泳纯化,优选磁珠纯化。8. 根据权利要求1-7中任一项的方法建立的测序文库。9. 根据权利要求1-7中任一项的方法用于检测多个样本、多个目标片段的DNA甲基化 状态。
【专利摘要】本发明的一种多样本多片段DNA甲基化高通量测序方法,能够在一个文库中同时分析多个样本、多个目标片段的DNA甲基化状态,片段长度可以达到500bp左右,并且PCR重组发生率低,该方法还具有起始样本量少、针对性强、成本低、充分利用测序通量等优点。
【IPC分类】C12Q1/68, C40B40/06, C12N15/11
【公开号】CN104894233
【申请号】CN201510196548
【发明人】陈静, 吴奇涵, 窦同海, 王曦路
【申请人】上海昂朴生物科技有限公司
【公开日】2015年9月9日
【申请日】2015年4月22日

最新回复(0)