一种两核苷酸合成测序分析多模板pcr产物的方法

xiaoxiao2020-10-23  4

一种两核苷酸合成测序分析多模板pcr产物的方法
【技术领域】
[0001] 本发明属于生物技术领域,是一种PCR产物序列分析方法,具体涉及一种两核苷 酸合成测序分析多模板PCR产物的方法。
【背景技术】
[0002] 人类基因组计划和各种模式生物基因组计划的开展和完成,使人类步入了后基因 时代,对当代的生物学研宄和医学研宄产生了巨大的影响,分子生物学相关学科得到了迅 猛的发展。从基因水平上认识生命的差异,疾病发生、发展的规律,以及药物与生命体的相 互作用将成为可能。就基因序列分析而言,后基因时代的重点已由全基因组序列测定转移 到了对基因组中个体遗传差异及物种间遗传差异的比较。在基础研宄方面,DNA的序列分析 是进一步研宄和改造目的基因的基础,研宄疾病基因的遗传规律,克隆致病基因;在应用方 面,直接寻找疾病的易感基因突变位点,通过对某一特定疾病的基因组样本中突变基因型 进行大规模鉴定和检测,可以获得与该疾病相关基因型的信息。很多常见疾病的遗传学影 响可归因于有限的等位基因变异。对人类基因组序列分析可以发现,任何两个无关个体的 基因组序列相似程度达到99. 9%,而剩余的差异则导致个体对疾病易感性差异和药物反应 差异。因此,研宄基因组上序列的变异与疾病的关系成为揭示复杂疾病遗传机制的第一步。 单核苷酸多态性(SNP)既与单基因遗传病相关,也可能与多基因遗传病相关。目前已经确定 4000多种遗传疾病是由单碱基突变引起的,而一些重大疾病如癌症、糖尿病、心血管疾病、 抑郁症、哮喘等,是受众多基因以及环境因子共同作用,通过对某一特定疾病的基因组样本 中大量突变基因型进行大规模鉴定和检测,可以获得与该疾病相关基因型的信息。
[0003] 与为数有限的蛋白质测序和DNA序列分析方法相比,基因突变(包括SNP)分析的 基本方法在数量上已达20余种。种类繁多的分析方法,既反映了研宄基因突变(包括SNP) 分析方法在生物学和医学领域所受到的重视程度,也反映出尚无一种方法能满足后基因时 代对基因突变(包括SNP)分析的要求。目前对于多DNA模板的PCR产物,或者混合样本PCR 产物的分析主要依赖于传统的焦测序法和Sanger测序法。前者适合短片段序列的分析、且 易于定量,但对于多模板DNA序列的分析完全依赖核苷酸加入的顺序(由于可能存在不同 步合成的情况,核苷酸的不同加入方法得到的测序结果会不一样);而Sanger测序法虽然能 够适合多模板DNA序列分析,但缺点是无法将其定量。因此,现有分析方法不能完全满足对 多DNA模板PCR产物序列的分析要求。
[0004] 最近,我们实验室提出一种基于两核苷酸实时合成测序的方法,该方法通过每次 反应同时加入两种dNTPs合成测序,得到两组编码,然后解码这两组编码便能确定测序片 段的具体碱基信息(肖鹏峰等,中国发明专利:ZL 201210128597. 6)。该方法具有大幅提高 测序长度,且测序得到的测序信号强度比传单核苷酸合成测序的信号强等特点。然而,该发 明专利只针对一个DNA模板样本进行分析,无法对包含多模板DNA的序列进行分析,限制了 序列分析的范围。

【发明内容】

[0005] 技术问题:为了克服现有技术中存在的不足,本发明提供一种两核苷酸合成测序 分析多模板PCR产物的方法,为PCR产物的DNA序列提供一种快速、高效、灵敏的分析方法。
[0006] 技术方案:为实现上述目的,本发明采用的技术方案为: 一种两核苷酸合成测序分析多模板PCR产物的方法,步骤包括:I) DNA提取;2) PCR扩 增;3)测序;4)关联分析; 所述步骤3)的测序方法为:同时加入两种不同的核苷酸,且PCR扩增产物均匀 分成至少两份(最多三份),选择三组((dATP a S+dGTP) AdCTP+dTTP),(dATP a S+dCTP/ (dGTP+dTTP),(dATPa S+dTTP) AdCTP+dGTP))中可能合成循环测序的中至少两组(最多三 组)进行测序,得到至少两组(最多三组)测序编码测序信息。
[0007] 所述步骤3)的具体方法包括以下步骤: 3-1)制备单链DNA模板:将PCR扩增产物均匀分成至少两份(最多三份),分别与链霉 亲和素包裹的磁珠反应,生物素修饰的DNA链固定到所述磁珠上,在0. 05-0. 2 M NaOH溶液 下变性;将未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板; 3-2)测序引物杂交:将测序引物与所述单链DNA模板在杂交反应体系中,70-80° C下 放置5-10 min,自然冷却至室温,完成杂交; 3-3)测序:配备测序反应体系,与所述步骤3-2)得到的杂交产物混合,选择三组 ((dATP a S+dGTP)/(dCTP+dTTP), (dATP a S+dCTP/ (dGTP+dTTP), (dATP a S+dTTP)/(dCTP +dGTP))中可能合成循环测序的中至少两组(最多三组)进行测序,得到至少两组(最多三 组)测序编码测序信息。
[0008] 所述步骤3-2)中,所述测序引物是一段与单链DNA模板完全互补的一段序列。
[0009] 所述步骤3)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号 强度信息,所述测序信号强度与合成核苷酸数目成正比,即每个测序反应的测序信号强度 均可以转化为核苷酸合成的数目。如果把整个PCR产物模板量定为1单位,则核苷酸合成 的数目可以是整数单位,也可以是非整数单位(如(dATPa S+dGTP) -个合成测序反应得到 2. 5个单位核苷酸合成的信息,则编码记为(AG) 2_5,该编码可以分解成一阶整数编码(相当 于合成一个核苷酸单位)和小于1的非整数编码构成,记为(AG) (AG) (AG)°_5,依次类推)。
[0010] 所述步骤4)中,根据至少两组不同两核苷酸合成循环测序分别得到的至少两组编 码信息,按照两次测序相同位置碱基及其数目相等的原理,将至少两组编码信息分解成最 大一阶的整数编码和小于1的非整数编码,并依次进行解码。根据对于小于1的非整数解 码的信息,构建关联方程式,确定PCR产物的不同DNA模板及其含量; 所述关联方程式为:对于包含任意一个SNP位点的PCR产物,可能包含不超过四种不同 的DNA模板(即变化位点碱基为A/G/C/T之一),设定这四种DNA模板1、…、i的含量分 别为X1、…、Xi,且X 1+…+ Xi=L其中〇 < Xi〈l、l < i < 4 ;在至少两组不同两核苷酸合 成循环测序信息解码的得到的最大一阶编码信息中,至少包含一个小于1的非整数测序编 码信息反映 SNP位点变化。包含SNP位点的单个测序反应测序信息反映该两核苷酸在本次 测序反应中合成的核苷酸数目,从而构建出一个方程式。很明显,在SNP位点的存在A/G/C/ T四种变化的情况下,需要两个单个测序反应方能将该位点的A/G/C/T信息全部测定,从而 可以构建两个独立的方程式;基于相同的道理,从另一组循环测序中同样可以构建两个独 立的方程式。另外,于同一位置碱基信息在两次测序中信息不变的原理,在两组测序信息中 包含同样(碱基及其与含量)信息,因此上述四个方程式是有关联的,这样通过构建方程组, 求出X1、…、X i的具体数值。
[0011] 所述SNP位点上的测序信息进行关联分析是指对包含至少两组不同两核苷酸合 成循环测序信息进行解码后的关联,即在解码出的小于1的非整数解码的信息中构建关联 方程式,以确定PCR产物的不同DNA模板及其含量; 若PCR产物中包含若干个SNP位点的分析,则将进行若干单个SNP位点的关联分析。
[0012] 所述步骤2)中,PCR扩增所用的PCR-条引物为5'端被生物素、氨基或者丙烯酰 胺基团修饰,与表面修饰链霉亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应 制备单链DNA模板。
[0013] 进一步的,在本发明中,所述加入两核苷酸测序释放的检测分子是相同的,所述检 测分子为化学发光检测的焦磷酸盐、电化学检测的氢离子或者光学检测的荧光信号。
[0014] 进一步的,在本发明中,所述PCR扩增产物的分析指包括单个样本PCR产物和混合 样本PCR产物的分析。
[0015] 有益效果:本发明提供的两核苷酸合成测序分析多模板PCR产物的方法,应用 两核苷酸同时加入到反应中的测序信息,即每个测序反应得到包括两核苷酸种类及其核 苷酸合成数目的测序编码信息,对同一 PCR产物均匀分成至少两份(最多三份),通过三 组((dATP a S+dGTP) AdCTP+dTTP),(dATP a S+dCTP/ (dGTP+dTTP),(dATP a S+dTTP) / (dCTP+dGTP))可能合成循环测序的中至少两组(最多三组)进行测序,得到至少两组(最多 三组)测序编码测序信息,并结合两组编码信息进行解码,最后通过关联分析确定PCR产物 的不同DNA模板及其含量。本发明与传统焦测序相比,具有如下有益效果: 1)本发明适合所有多模板PCR产物序列的分析。相对于传统的焦测序分析方法,本发 明对多模板PCR产物的测序在通过SNP位点时,最多需要两个测序反应,适合所有样本的分 析,易于发现新的突变形式,拓宽了分析范围;而传统的焦测序在通过SNP位点时,可能最 多需要四个测序反应来实现,因核苷酸加入顺序会造成不同步合成,影响该SNP变化信息 的判断,不易于新突变形式的发现,同时也会给后续测序信息的判读造成干扰。
[0016] 2)本发明能够对各种未知DNA模板进行定性、定量分析,相对于传统的焦测序分 析方法,本发明提供两次测序信息相互校正,提高了分析的准确度和灵敏度。
[0017] 3)本发明适合多个混合样本的多模板PCR产物分析,可以直接测定混合样本中各 个DNA模板的比例,可以用于从大规模样本中寻找、筛选核酸标志物。
[0018] 4)本发明直接采用商品化、非标记的天然核苷酸进行合成测序,它可以在任何基 于实时合成测序的测序平台进行。
【附图说明】
[0019] 图1为本发明方法对任意拟定的包含一个SNP位点的四种可能DNA模板混合物序 列(5, -GACGTGACGNTC-3',SNP 位点 N=A/C/T/G,且 A、C、T、G 含量分别为 Xl、x2、x3、x4)测 序信息关联分析示意;图中, (dATPaS+dGTPV(dCTP+dTTP):表示(dATPaS+dGTPV(dCTP+dTTP)循环测序得到的 最大一阶编码测序信息,e、f为小于1的非整数; (dATP a S+dTTP) AdCTP+dGTP):表示(dATP a S+dTTP) AdCTP+dGTP))循环测序得到的 最大一阶编码测序信息,g、h为小于1的非整数; 解码:表示由((dATPa S+dGTPV(dCTP+dTTP), (dATPa S+dTTPV(dCTP+dGTP))两组循 环测序的一阶编码信息组合解码得到的互补碱基序列; 关联分析:表示由((dATP a S+dGTP) AdCTP+dTTP), (dATP a S+dTTP) AdCTP+dGTP)) 两组循环测序的中小于I的非整数编码信息组合解码得到的互补碱基序列。在 (dATP a S+dGTP) AdCTP+dTTP)测序得到的(CT) %表示dCTP, dTTP两核苷酸发生了 e个单 位核苷酸的合成,因此互补的碱基(G+A)的含量为e ;同理,(T+C)=f ;而在(dATPa S+dGTP)/ (dCTP+dTTP)测序得到的(AT) g表示dATP,dTTP两核苷酸发生了 g个单位核苷酸的合成, 因此互补的碱基(T+A)的含量为g;同理,(C+G)=h。同时,基于同一位置碱基信息在两次测 序中信息不变的原理,在两组测序信息中包含同样(碱基及其与含量)信息,因此可以构建 下列四个方程式用于各DNA模板的含量: x2+x3_e X1+X4 _f Xi+X3=S X2+X4_h 求解上述方程组得到X1、X2、X3、X4的数值,从而确定模板0嫩1、0嫩2、0嫩3、0嫩4的含 量: 含量X1的模板DNAl序列为:GAICGTCACGTC ; 含量x2的模板DNA2序列为:GA£CGTCACGTC ; 含量x3的模板DNA3序列为:GA ACGTCACGTC ; 含量x4的模板DNA4序列为:GA £CGTCACGTC (下划线为SNP位点)。
[0020] 图2为本发明方法对包含MMP7 (U25346)基因一个SNP (C/T,rsll568819)位 点的 PCR 产物分析方法;图 2 (1)、(2)分别为(dATPa S+dGTPV(dCTP+dTTP),(dATPa S +dCTP) AdGTP+dTTP)循环焦测序得到的信息。其中,图2 (1)纵坐标A= (dATP a S+dGTP), T= (dCTP+dTTP);图 2 (2 )纵坐标 A= (dATP a S+dCTP),T= (dGTP+dTTP)。
[0021] 图3为本发明方法对包含MMP7 (U25346)基因一个SNP (C/T,rsll568819)位点 的PCR产物测序信息关联分析;图中, (dATP a S+dGTP) AdCTP+dTTP):表示(dATP a S+dGTP) AdCTP+dTTP)循环测序得到的 最大一阶编码测序信息; (dATP a S+dTTP) AdCTP+dGTP):表示(dATP a S+dTTP) AdCTP+dGTP))循环测序得到的 最大一阶编码测序信息; 解码:表示由((dATPa S+dGTP) AdCTP+dTTP), (dATPa S+dTTPV(dCTP+dGTP))两组循 环测序的一阶编码信息组合解码得到的互补碱基序列; 关联分析:表示由((dATP a S+dGTP) AdCTP+dTTP),(dATP a S+dTTP) AdCTP+dGTP))两 组循环测序的中小于I的非整数编码信息组合解码得到的互补碱基序列,并构建三个方程 式用于求解各DNA模板的含量。
【具体实施方式】
[0022] 实施例1 :人样本包含MMP7 (U25346)基因包含一个SNP (C/T,rsll568819位点 的PCR产物DNA模板分析方法,具体方法包括: (1) 将血样本采用传统的蛋白激酶K与苯酚/氯仿抽提法提取外周血中的基因组DNA ; (2) 将 PCR 引物 5' - agtctacaga actttgaaag tatgtg -3',5' -biotin- ctatgagagc agtcatttga ctttg -3'与 200 mg 基因组 DNA,0.2 mM dNTP,l U Taq DNA 聚合酶,IX 扩增 缓冲液,1.8 mM 1%(:12的50 μ L PCR扩增体系进行扩增,扩增条件为:94° C起始变性5 min;35个热循环为:94 ° C变性30s、61 ° C退火45s、72 ° C延伸45s;最后72 ° C延 伸 7 min ; (3) 将PCR扩增产物均匀分成两份,分别进行(4)~(6)步骤的操作; (4) PCR扩增产物与链霉亲和素修饰的磁珠反应,使修饰生物素的DNA链固定到磁 珠上,在0.1 M NaOH溶液下变性,将未固定的另一条DNA链清除;然后用洗液(10 mM Tris-Acetate, pH 7. 6)洗绦,得到固定的单链DNA模板; (5) 将测序引物Y -ctaaaacgag gaagtattac atc-3<与磁珠固定的单链DNA模板在 反应体系((10 mM Tris-HCl,2 M NaCl,l mM EDTA(乙二胺四乙酸钠),0· 1% Tween 20,pH 7.6) 80° C下杂交5 min,然后自然冷却至室温,完成杂交; (6) 焦测序反应体系包括0.1 M Tris-Ac (pH 7.7),2 mM EDTA(乙二胺四乙酸钠), 10 mM Mg(Ac)2,0.2% BSA(小牛血清蛋白),10 mM DTT(二巯苏糖醇),10 mM APS(磷酰硫 酸腺),0.4 11^/1^?¥?(聚乙烯吡咯烷酮),4 11110-111(^€61^11(虫荧光素),2"1^八丁? sulfurylase(三磷酸腺苷硫酸化酶),0.4 mM Iuciferase (焚光素酶),2 U/mL apyrase VII (三磷酸腺苷双磷酸酶VII),2 U/mL DNA聚合酶I (Klenow fragment, exo-);焦测 序反应体系与上述(5)杂交产物混合用于测序反应; (7) 将上述(6)的两份反应体系置于焦测序仪(PSQ 96MA system (Biotage AB, Uppsala, Sweden))中,分别按照(dATPa S+dGTPV(dCTP+dTTP)和(dATP a S+dCTP/ (dGTP+dTTP)的循环加入方式对DNA模板进行合成测序(参见专利ZL 201210128597.9); 分别得到由按照先后顺序排列的单个测序反应的碱基片段编码信息图2 (1)和图2 (2); (8) 根据图2 (1)和图2 (2)谱的峰值,转换成核苷酸合成的数目(合成一个核苷酸 =10 au 信号强度),分别段编码信息:(AG) (CT)2 (AG) (CT)2 (AG)2 (CT) (AG)2、(AC) °_5 ( GT) 2_5(AC) (GT)4 (AO2(GT),并按照一阶编码和小于1的非整数编码依次得到两组测序的编码 信息,解码、关联分析(图3),得到两种DNA模板的含量: 含量 50% 的 DNA 模板 1 :5' -CTGCCAATAAS 含量 50% 的 DNA 模板 2 :5' -CTGCCAATAAI^
【主权项】
1. 一种两核苷酸合成测序分析多模板PCR产物的方法,其特征在于,该方法的步骤包 括:1)DNA提取;2)PCR扩增;3)测序;4)关联分析; 所述步骤3)的测序方法为:同时加入两种不同的核苷酸,且PCR扩增产物均匀分 成 2 ~3 份,选择三组(dATPaS+dGTP)AdCTP+dTTP),(dATPaS+dCTP/ (dGTP+dITP), (dATPaS+dTTP)AdCTP+dGTP))中可能合成循环测序的2~3组进行测序,得到测序编码 测序信息。2. 根据权利要求1所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述步骤3)的具体方法包括以下步骤: 3-1)制备单链DNA模板:将PCR扩增产物均匀分成2~3份,分别与链霉亲和素包裹 的磁珠反应,生物素修饰的DNA链固定到所述磁珠上,在0. 05-0. 2MNaOH溶液下变性;将 未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板; 3-2 )测序引物杂交:将测序引物与上述单链DNA模板在杂交反应体系中,70-80°C下放 置5-10min,自然冷却至室温,完成杂交得到杂交产物; 3-3)测序:配备测序反应体系,与所述步骤3-2)得到的杂交产物混合,选择三组((dATP a S+dGTP)/(dCTP+dTTP), (dATP a S+dCTP/ (dGTP+dTTP), (dATP a S+dTTP)/(dCTP +dGTP))中可能合成循环测序的2~3组进行测序,得到2~3组测序编码测序信息。3. 根据权利要求2所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 步骤3-2)中,所述测序引物是一段与步骤3-1)中单链DNA模板完全互补的一段序列。4. 根据权利要求1所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述步骤3)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信 息,所述测序信号强度与合成核苷酸数目成正比,即每个测序反应的测序信号强度均可以 转化为核苷酸合成的数目。5. 根据权利要求1所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述步骤4)关联分析中,根据2~3组不同两核苷酸合成循环测序分别得到的2~3组编 码信息,按照两次测序相同位置碱基及其数目相等的原理,将2~3组编码信息分解成最大 一阶的整数编码和小于1的非整数编码,并依次进行解码,根据对于小于1的非整数解码的 信息,构建关联方程式,确定PCR产物的不同DNA模板及其含量。6. 根据权利要求5所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述关联方程式为:对于包含任意一个SNP位点的PCR产物,可能包含不超过四种不同的 DNA模板,即变化位点碱基为A/G/C/T之一,设定这四种DNA模板1、…、i的含量分别为 X1、…、Xi,且X1+…+Xi=L其中0彡XiH彡i彡4;在至少两组不同两核苷酸合成循 环测序信息解码的得到的最大一阶编码信息中,至少包含一个小于1的非整数测序编码信 息反映SNP位点变化;包含SNP位点的单个测序反应测序信息反映该两核苷酸在本次测序 反应中合成的核苷酸数目,从而构建出一个方程式;在SNP位点的存在A/G/C/T四种变化的 情况下,需要两个单个测序反应方能将该位点的A/G/C/T信息全部测定,从而可以构建两 个独立的方程式;从另一组循环测序中同样可以构建两个独立的方程式;另外,于同一位 置碱基信息在两次测序中信息不变的原理,在两组测序信息中包含同样碱基及其与含量信 息,因此上述四个方程式是有关联的,这样通过构建方程组,求出X1、…、Xi的具体数值。7. 根据权利要求6所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述将SNP位点上的测序信息进行关联分析是指对包含至少两组不同两核苷酸合成循环 测序信息进行解码后的关联,即在解码出的小于1的非整数解码的信息中构建关联方程 式,以确定PCR产物的不同DNA模板及其含量; 若PCR产物中包含若干个SNP位点的分析,则将进行若干单个SNP位点的关联分析。8. 根据权利要求1所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述步骤2)中,PCR扩增所用的PCR-条引物为5'端被生物素、氨基或者丙烯酰胺基团修 饰,与表面修饰链霉亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应制备单链 DNA模板。9. 根据权利要求1所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述加入两核苷酸测序的检测分子是相同的,所述检测分子为化学发光检测的焦磷酸盐、 电化学检测的氢离子或者光学检测的荧光信号。10. 根据权利要求5所述的两核苷酸合成测序分析多模板PCR产物方法,其特征在于: 所述PCR扩增产物,其分析包括单个样本PCR产物和混合样本PCR产物的分析。
【专利摘要】本发明公开了一种两核苷酸合成测序分析多模板PCR产物的方法。该方法对同一PCR产物均匀分成至少两份,进行两核苷酸合成测序,每个测序反应得到包括两核苷酸种类及其核苷酸合成数目的测序编码信息,选择三组中至少两组不同两核苷酸合成循环测序分别得到的至少两组编码信息进行解码,最后通过关联分析确定PCR产物的不同DNA模板含量。本发明拓宽了单核苷酸合成测序的分析范围,适合多模板PCR产物、以及混合样本PCR产物的序列分析,可以直接测定样本中各个DNA模板的比例,也可以用于从大规模样本中寻找、筛选核酸标志物。
【IPC分类】C12Q1/68
【公开号】CN104894246
【申请号】CN201510262137
【发明人】肖鹏峰, 浦丹, 潘荣芳, 殷豪景
【申请人】东南大学
【公开日】2015年9月9日
【申请日】2015年5月21日

最新回复(0)