针对融合基因进行扩增子测序的引物设计方法
【技术领域】
[0001] 本发明涉及生物技术领域,具体来说涉及一种针对融合基因进行扩增子测序的引 物设计方法。
【背景技术】
[0002] 扩增子测序是指通过设计感兴趣的基因组区域的引物,经过多重PCR扩增,将目 标区域DNA富集后进行高通量测序的研宄策略。该技术使用多组PCR引物对目标区域进行 扩增,用于样本量较大而扩增区段较小(<l〇〇k)的情况,通常情况下可以通过扩增子测序的 技术对基因的热点突变区或者长度<l〇〇k的全外显子去进行扩增和分析,关注的是SNP、插 入/缺失等突变类型。
[0003] 扩增子测序的引物设计目前最有效和商业化程度最好的方法是通过Ion Ampliseq? Designer (www. ampliseq. com)来进行。Ion Ampliseq? Designer 是隶属于赛 默飞公司(Thermo Fisher Scientific Inc.)的引物设计工具,采用该流程设计引物的具 体流程如下: 1、打开 Ion Ampliseq? Designer 网站(www. ampliseq. com),注册并登陆。
[0004] 2、登陆之后点击Add design按钮。
[0005] 3、点击 start a new design按钮,进入相应界面,填写Assay design name,选择 DNA Gene designs (multi-pool)和 Human (hgl9),点击 Next :Add Targets。
[0006] 4、确定待检测的序列信息及对应的染色体位置: 在采用该工具的扩增子测序引物设计中,代表待检测区域的指标是该区域序列对应的 染色体位置,查找方法是找到待检测区域(或者待测位点前后各推IOObp的区域)的基因 组序列,将该序列粘贴到 http://genome. ucsc. edu/cgi_bin/hgBlat?org=human 的空白界 面,即可得到其对应的染色体起始位置,和正反链的信息。
[0007] 5、进入设计界面之后,根据需要选择Exon padding和DNA Type,在Add gene/ Region处选择Region,再在input specifications处填写基因名字以及对应的染色体起 始位置。当需要设计的目标区域较多时,此处可以选用upload File功能,将待检测的一组 目标区域的名称、对应的染色体起始位点的信息总结在一个.CSV文件中,直接上传,点击 upload。
[0008] 6、序列成功上传后,点击submit targets,系统通常会在12h之内完成引物设计。
[0009] 结果是针对靶点附近序列扩增的一系列引物,相应引物对的扩增片段长度一般为 125-175bp、125-275bp或125-375bp,根据待检测样品的不同而不同,例如125-175bp用于 FFPE及cDNA检测,而125-375bp用于gDNA检测。
[0010] 融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套调控序列(包括 启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。融合基因是重要 的肿瘤标志物,以白血病的分型为例,bcr/abl融合基因存在于95%以上的慢性粒细胞白血 病患者,是CML最重要的分标志,PML-RARa融合基因是急性早幼粒细胞白血病APL患者 特异的分子生物学标志。融合基因的检测对于疾病的分型、靶向治疗、个性化用药等起着 非常关键的作用,目前在基因水平上对融合基因进行检测的方法有:Southern blotting、 RT-PCR和实时定量PCR。然而这些方法都是只针对单个融合基因的检测,是否可以利用上 述扩增子测序的技术,采用多重PCR扩增的方法,同时对多种融合基因进行检测?这就涉 及到最关键的技术问题:引物设计。
[0011] 普通扩增子引物设计是一项极为耗时费力的工作,我们希望能够采用以上所述 的Ion Ampliseq? Designer工具进行融合基因扩增子引物设计。然而如上所述,Ion Ampliseq? Designer工具所设计的扩增子引物针对的是SNP、插入/缺失等突变类型,而没 有考虑到融合基因。Ion Ampliseq? Designer工具是根据基因及其所在的染色体位置推断 出序列,然后设计引物。但是在融合基因的情况下,所融合的两个基因在染色体上的原始位 置可能相隔甚远,或者原本是在不同的染色体上,因此在Ion Ampliseq? Designer工具中 输入基因位置,往往得到大量的废引物,或者根本不能得到结果。再考虑融合的两个基因是 位于不同的正负链上和倒位融合,情况更为复杂。因此有必要对现有的利用Ion Ampliseq? Designer工具进行扩增子引物设计的方法进行改良,以便适用于设计用于融合基因扩增子 测序的引物序列。
[0012] 本文将介绍通过Ion Ampliseq? Designer工具进行融合基因扩增子引物的设计 方法。
【发明内容】
[0013] 为了高效地进行融合基因扩增子引物设计,我们对现有利用Ion Ampliseq? Designer工具进行扩增子引物设计的方法进行改良,使其适用于融合基因扩增子引物设 计。
[0014] 我们开发的利用Ion Ampliseq? Designer工具进行融合基因扩增子引物设计的 方法采用了以下技术方案: 一种针对融合基因进行扩增子测序的引物设计方法,所述方法是在Ion Ampliseq? Designer工具上进行的扩增子引物设计方法,其特征在于,所述方法包括以下步骤: 1) 确定融合基因序列信息,即确定发生融合的前基因 A序列和后基因 B序列以及融合 位点,找到前基因 A和后基因 B发生融合的外显子区序列,以及各自的染色体定位信息,即 各自对应的染色体起点和终点位置; 2) 在Ion Ampliseq? Designer中输入前基因 A和后基因 B发生融合的外显子区的各 自的染色体定位信息,分别设计出扩增子引物; 3 )根据基因 A、基因 B在染色体中定位的正负链信息,确定基因 A、基因 B分别应该选 择正向引物还是反向引物,其中选择情况如下所示:
, 4 )引物及扩增子序列确认,即当引物设计完成之后,首先需要对并选择好的融合基因 引物在融合基因的序列中进行位置查找,查看其扩增子长度,并判断扩增子长度范围。
[0015] 进一步,步骤4)中所获得的扩增子长度范围为125_175bp。
[0016] 进一步,若步骤4)中所获得的扩增子长度范围不为125-175bp,则该方法还进一 步包括步骤5)对在步骤2)中输入的前基因 A和后基因 B的染色体定位信息进行调整,重 复步骤2)至4),直至在步骤4)中所获得的扩增子长度范围在125-175bp内。
[0017] 具体来说,步骤5)的染色体定位信息调整包括:若所得扩增子长度大于175bp,则 将前基因 A的输入定位信息右移或将后基因 B的输入定位信息左移以缩短扩增子长度,若 所得扩增子长度小于125bp,则将前基因 A的输入定位信息左移或将后基因 B的输入定位信 息右移以增加扩增子长度。进一步,每次调整的量为50bp或50bp以上。
[0018] 通过采用本发明的方法,可以利用Ion Ampliseq? Designer工具进行融合基因扩 增子检测引物的设计,从而为利用扩增子测序方法检测融合基因扫清了障碍。
【具体实施方式】
[0019] 本发明的目的是提供一种利用Ion Ampliseq? Designer工具来设计可以用于融 合基因扩增子检测的引物的方法,从而使得我们可以利用扩增子测序方法来对融合基因进 行检测,突破现有融合基因检测的缺陷。
[0020] 下面将结合具体实例来详细说明本发明的原理及步骤。
[0021] 根据发生融合的两个基因在染色体上的定位情况可将融合基因分为四类:正 链-正链、负链-负链、正链-负链、负链-正链,融合基因的引物设计也是在Ion Ampliseq? Designer中进行,原理及步骤如下: 确定融合基因序列信息 即确定发生融合的前基因 A序列和后基因 B序列以及融合位点,找到基因 A和基因 B 发生融合的外显子区序列,及各自对应的染色体起点和终点位置。
[0022] 扩增子引物设计 在Ion Ampliseq? Designer中分别设计出前基因 A和后基因 B发生融合的外显子区 的扩增子引物(操作方法如上文现有技术部分所述)。
[0023] 选择正反向引物 根据基因 A、基因 B在染色体中定位的正反链信息,确定基因 A、基因 B分别应该选择正 向引物还是反向
引物。正链-正链、负链-负链、正链-负链、负链-正链四类融合基因进行 扩增子引物设计时,前后基因所得到的的扩增子引物的方向选择也是不同的,具体如下表1 所示: 表1.融合基因扩增子引物的正反向选择
引物及扩增子序列确认 当引物设计完成之后,首先需要对并选择好的融合基因引物在融合基因的序列中进行 位置查找,查看其扩增子长度,看所得扩增子的长度范围是否为125-175bp,以保证选用的 引物所得的扩增子长度范围在125-175bp以内。
[0024] 根据需要调整位置重新设计 当扩增子长度不在125-175bp时,则需要根据情况重新调整步骤1)中基因 A和基因 B 所输入Ion Ampliseq? Designer的染色体定位信息,重新进行引物设计、正反向选择和确 认,直到符合要求为止。
[0025] 由于定位在正链上的基因序列,代表其在染色体上定位的起点和终点的数字增加 时,设计出的引物序列的位置往右移动。而定位在负链上的基因序列,代表其在染色体上定 位的起点和终点的数字增加时,设计出的引物序列的位置往左移动。因此,调整引物序列位 置的方法也要根据融合基因中前后基因在染色体上的定位正反链的不同而被分为四种不 同的情况,具体说明如下: 1) 正链-正链,以 NC0A4 (E6)-RET(E12)为例: 选择根据NC0A4(exon6)序列设计出来的正向引物和RET(exonl2)序列设计出来的反 向引物,在融合基因序列中找到相应的位置,选择扩增子长度在125-175bp的引物对。
[0026] 如果扩增子长度偏长(>175bp),则需要调整NC0A4 (exon6)的正向引物位置和/或 RET (exonl2)的反向引物位置,使NC0A4 (exon6)的染色体定位的起始位点数字增加50bp或 以上(序列右移),使RET(exonl2)的染色体定位的起始位点数字减少50bp或以上(序列左 移) 同理,如果扩增子长度偏短(<125bp),则需要调整NC0A4(exon6)的正向引物位置和/ 或RET (exon 12)的反向引物位置,使NC0A4 (exon6)的染色体定位的起始位点数字减少50bp 或以上(序列左移),使RET(exonl2)的染色体定位的起始位点数字增加50bp或以上(序列 右移) 2) 负链-负链,以 LRIG3 (E16)-R0S1 (E35)为例: 选择根据LRIG3 (exon6)序列设计出来的反向引物和ROSl (exon35)序列设计出来的 正向引物,在融合基因序列中找到相应的位置,选择扩增子长度在125-175bp的引物对。
[0027] 如果扩增子长度偏长(>175bp),则需要调整LRIG3 (exon6)的反向引物位置和/ 或ROSl (exon35)的正向引物位置,使LRIG3 (exon6)的染色体定位的起始位点数字减少 50bp或以上(序列右移),使ROSl (E35)的染色体定位的起始位点数字增加50bp或以上(序 列左移) 同理,如果扩增子长度偏短(<125bp),则需要调整LRIG3 (exon6)的反向引物位置和/ 或ROSl (exon35)的正向引物位置,使LRIG3 (exon6)的染色体定位的起始位点数字增加 50bp或以上(序列左移),使ROSl (E35)的染色体定位的起始位点数字减少50bp或以上(序 列右移) 3) 正链-负链,以 EML4 (E13) - ALK (E20)为例: 选择根据EML4 (exonl3)序列设计出来的正向引物和ALK (exon20)序列设计出来的 正向引物,在融合基因序列中找到相应的位置,选择扩增子长度在125-175bp的引物对。
[0028] 如果扩增子长度偏长(>175bp),则需要调整EML4(exonl3)的正向引物位置和/或 ALK (exon20)的正向引物位置,使EML4 (exonl3)的染色体定位的起始位点数字增加50bp 或以上(序列右移),使ALK (ex〇n20)的染色体定位的起始位点数字也增加50bp或以上(序 列左移) 同理,如果扩增子长度偏短(<125bp),则需要调整NC0A4(exon6)的正向引物位置和/ 或RET (exon 12)的反向引物位置,使NC0A4 (exon6)的染色体定位的起始位点数字减少50bp 或以上(序列左移),使RET(exonl2)的染色体定位的起始位点数字增加50bp或以上(序列 右移) 4)负链-正链,以 KIF5B (E15) - RET (E12)为例: 选择根据KIF5B (exonl5)序列设计出来的反向引物和RET(exonl2)序列设计出来的 反向引物,在融合基因序列中找到相应的位置,选择扩增子长度在125-175bp的引物对。
[0029] 如果扩增子长度偏长(>175bp),则需要调整KIF5B (exonl5)的反向引物位置和/ 或RET (exon 12)的反向引物位置,使NC0A4 (exon6)的染色体定位的起始位点数字减少50bp 或以上(序列右移),使RET(exonl2)的染色体定位的起始位点数字减少50bp或以上(序列 左移)。
[0030] 同理,如果扩增子长度偏短(<125bp),则需要调整KIF5B (exonl5)的反向引物位 置和/或RET(exonl2)的反向引物位置,使NC0A4(exon6)的染色体定位的起始位点数字增 加50bp或以上(序列左移),,使RET (exonl2)的染色体定位的起始位点数字增加50bp或以 上(序列右移)。
[0031] 上面结合具体实施例对本发明的实施方式作了详细的说明,但是本发明不限于上 述实施方式,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明 宗旨的如提下做出各种变化。
【主权项】
1. 一种针对融合基因进行扩增子测序的引物设计方法,所述方法是在Ion Ampliseq? Designer工具上进行的扩增子引物设计方法,其特征在于,所述方法包括以下步骤: 1) 确定融合基因序列信息,即确定发生融合的前基因 A序列和后基因 B序列以及融合 位点,找到前基因 A和后基因 B发生融合的外显子区序列,以及各自的染色体定位信息,即 各自对应的染色体起点和终点位置; 2) 在Ion Ampliseq? Designer中输入前基因 A和后基因 B发生融合的外显子区的各 自的染色体定位信息,分别设计出扩增子引物; 3 )根据基因 A、基因 B在染色体中定位的正负链信息,确定基因 A、基因 B分别应该选 择正向引物还是反向引物,其中选择情况如下所示:, 4 )引物及扩增子序列确认,即当引物设计完成之后,首先需要对并选择好的融合基因 引物在融合基因的序列中进行位置查找,查看其扩增子长度,并判断扩增子长度范围。2. 如权利要求1所述的针对融合基因进行扩增子测序的引物设计方法,其特征在于, 步骤4)中所获得的扩增子长度范围为125-175bp。3. 如权利要求1所述的针对融合基因进行扩增子测序的引物设计方法,其特征在于, 若步骤4)中所获得的扩增子长度范围不为125-175bp,则该方法还进一步包括步骤5)对在 步骤2)中输入的前基因 A和后基因 B的染色体定位信息进行调整,重复步骤2)至4),直至 在步骤4)中所获得的扩增子长度范围在125-175bp内。4. 如权利要求3所述的针对融合基因进行扩增子测序的引物设计方法,其特征在于, 步骤5)的染色体定位信息调整包括:若所得扩增子长度大于175bp,则将前基因 A的输入 定位信息右移或将后基因 B的输入定位信息左移以缩短扩增子长度,若所得扩增子长度小 于125bp,则将前基因 A的输入定位信息左移或将后基因 B的输入定位信息右移以增加扩增 子长度。5. 如权利要求4所述的针对融合基因进行扩增子测序的引物设计方法,其特征在于, 每次调整的量为50bp或50bp以上。
【专利摘要】本发明公开了一种利用Ion AmpliseqTM Designer工具来设计可用于融合基因的扩增子测序的引物的方法,所述方法包括1)确定融合基因序列信息;2)扩增子引物设计;3)正反向引物选择;4)引物及扩增子序列确认等步骤。本发明使得可以采用Ion AmpliseqTM Designer工具来设计可用于融合基因的扩增子测序的引物,从而使得采用扩增子测序方法来检测融合基因成为可能,而突破现有融合基因检测的缺陷。
【IPC分类】C12N15/10, C12N15/11
【公开号】CN104894113
【申请号】CN201510262143
【发明人】王焱, 张蕾
【申请人】南京科维思生物科技有限公司
【公开日】2015年9月9日
【申请日】2015年5月21日