一种检测基因融合的方法及装置的制造方法

xiaoxiao2020-10-23  6

一种检测基因融合的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及生物学领域,具体而言,涉及一种检测基因融合的方法及装置。
【背景技术】
[0002] 基因突变是指基因组DNA分子发生的突然的、可遗传的变异现象(gene mutation)。从分子水平上看,基因突变是指基因在结构上发生碱基对组成或排列顺序的改 变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但这种稳定性是相对的。在一定 的条件下基因也可以从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点 上,突然出现了一个新基因,代替了原有基因,这个基因叫做突变基因。于是后代的表现中 也就突然地出现祖先从未有的新性状。
[0003] 基因突变是生物进化的重要因素之一,所以研宄基因突变除了本身的理论意义以 外还有广泛的生物学意义。基因突变为遗传学研宄提供突变型,为育种工作提供素材,所以 它还有科学研宄和生产上的实际意义。
[0004] 有的基因突变是由于染色体发生结构变异形成。在自然条件或人为因素的影响 下,染色体发生的结构变异主要有:缺失、重复、倒位和易位,其中,基因融合也是染色体发 生结构变异的一种。所谓融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套 调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。
[0005] 目前常用的检测融合检测方法均是基于DNA水平进行高通量测序,利用CREST、 breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融合形式。

【发明内容】

[0006] 本发明旨在提供一种检测基因融合的方法及装置,以解决现有技术中的检测基因 融合的方法不能准确定位到融合断点及融合形式的技术问题。
[0007] 为了实现上述目的,根据本发明的一个方面,提供了一种检测基因融合的方法。该 方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA ;S2,在已知的 融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3, 通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列; S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序 列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,判断S41所得 到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤 Sl,S2, S3和S41 ;S43,检测已知融合形式:判读融合形式的序列的比对质量是否足够高, 判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融 合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时 满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式 的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三 阈值,则判断该样本中存在该已知融合形式。
[0008] 进一步地,S41中的比对软件采用的是TMAP比对软件,建立比对结果索引文件采 用的软件是samtools软件。
[0009] 进一步地,构建测序文库是否成功以五个管家基因的测序序列数的检出情况作为 标准。
[0010] 进一步地,S42具体包括:利用比对软件比对管家基因,如果五个管家基因测得的 总序列数少于20, 000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符 合分析需求,重复步骤Sl,S2, S3和S41 ;否则符合分析需求,进行S43。
[0011] 进一步地,比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷 酸序列。
[0012] 进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0. 12 ;第三阈值为20 条。
[0013] 根据本发明的另一方面,提供了一种检测基因融合的装置。该装置包括:CDNA获 取模块,用于提取待检测样本RNA,将RNA进行反转录,得到cDNA ;测序文库构建模块,用于 在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序 文库;测序模块,用于通过高通量的方法对测序文库进行测序,得到融合形式的序列;融合 形式检测模块,用于检测融合形式的序列;融合形式检测模块进一步包括以下子模块:比 对子模块,用于比对软件将测序模块得到的融合形式的序列与相应的融合形式的参考序列 相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;数据分析子模块,用 于判断比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将数据输入已知 融合形式检测子模块;已知融合形式检测子模块,用于检测已知融合形式:判读融合形式 的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度 是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二 阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已 知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式 的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
[0014] 进一步地,比对子模块中的比对软件采用的是TMAP比对软件,建立比对结果的索 引文件采用的软件是samtools软件。
[0015] 进一步地,测序文库构建模块中测序文库是否成功以五个管家基因的测序序列数 的检出情况作为标准。
[0016] 进一步地,比对子模块进一步用于利用比对软件比对管家基因,如果五个管家基 因测得的总序列数少于20, 000条,或出现两个或两个以上的管家基因测得的序列数目为 〇,则不符合分析需求。
[0017] 进一步地,比对子模块中比对管家基因的序列时计算比对到不同外显子的长度至 少20个核苷酸序列。
[0018] 进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0. 12 ;第三阈值为20 条。
[0019] 基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基 因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了 一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平 上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少 量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信 号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于 基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
【附图说明】
[0020] 构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示 意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0021] 图1示出了根据本发明一实施例的检测基因融合的方法的流程示意图;以及
[0022] 图2示出了根据本发明一实施例的检测基因融合的结果示意图。
【具体实施方式】
[0023] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本发明。
[0024] 目前,常用的检测融合检测方法均是基于DNA水平进行高通量测序,如利用 CREST、breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融 合形式。针对现有技术中的上述不足,本发明提供了以下技术方案。
[0025] 根据本发明一种典型的实施方式,提供一种检测基因融合的方法。该方法包括以 下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA ;S2,在已知的融合基因的 断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通 量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包 括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对, 并根据比对的位置进行排序,然后建立index (比对结果索引文件);S42,判断S41所得到 的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤 S1,S2,S3和S41 ;S43,检测已知融合形式:判读融合形式的序列的比对质量是否足够高,判 读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融合 形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时满 足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式的 序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三 阈值,则判断该样本中存在该已知融合形式。
[0026] 其中,S42的判断标准是测序结果中的序列数(reads数)达到一定量,是对总量 的限制;S43中判断标准是具体到每一条序列数是否符合标准,是对具体的序列数进行的 限制。
[0027] 基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基 因融合的 分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了 一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平 上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少 量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信 号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于 基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
[0028] 根据本发明一种典型的实施方式,在构建RNA文库时,使用扩增子库中包含的PCR 引物进行了 PCR反应,样品中包含的极为微量的RNA融合序列得到了扩增,使得反映在最后 结果中该融合的序列数较高,从而使本方法具有较高的灵敏度。
[0029] 其中,扩增子(amplicon)库是针对特定的融合形式设计出相应的PCR引物,并将 这部分PCR引物与对照基因上设计的PCR引物组合在一起形成扩增子(amplicon)库。
[0030] 本发明中的比对,可采用的软件如1^3,1:(^1^1:,130¥1^6,根据本发明一种典型的实 施方式,S41中的比对软件采用的是TMAP (torrent mapper,4. 2版本)比对软件,建立index 采用的软件是samtools软件。
[0031] 优选的,构建测序文库时以五个管家基因作为比对标准,测量建库过程是否正确, 管家基因相当于阳性对照。
[0032] 根据本发明一种典型的实施方式,S42具体包括:利用比对软件比对管家基因,如 果五个管家基因测得的总序列数少于20, 000条,或出现两个或两个以上的管家基因测得 的序列数目为〇,则不符合分析需求,重复步骤Sl,S2, S3和S41 ;否则符合分析需求,进行 S43。此步是为了对测序的结果进行一定的限制,管家基因总是会有一定的表达量,因此即 便是未检出融合,管家基因一般也会有较高的测序量。若管家基因的测序结果较低,说明建 库过程或者测序过程可能有误。
[0033] 根据本发明一种典型的实施方式,比对管家基因的序列时计算比对到不同外显子 的长度至少20个核苷酸序列。这是由于当使用例如Proton平台在测序时会将序列末端测 序质量较差的部分剪切掉,这将会导致测序的reads较参考序列更短一些。在进行序列计 数时,为了考虑这部分序列,同时会因为非特异性比对造成序列数目升高,在统计序列数目 时,序列在参考序列的断点两侧都至少有10个碱基的比对。
[0034] 根据本发明一种典型的实施方式,第一阈值为大于等于10个核苷酸;第二阈值为 0. 12 ;第三阈值为20条,第四阈值为大于等于20个核苷酸。
[0035] 根据本发明一种典型的实施方式,提供了一种检测基因融合的装置。该装置包括: cDNA获取模块,用于提取待检测样本RNA,将RNA进行反转录,得到cDNA ;测序文库构建模 块,用于在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列, 构建测序文库;测序模块,用于通过高通量的方法对测序文库进行测序,得到融合形式的序 列;融合形式检测模块,用于检测融合形式的序列;融合形式检测模块进一步包括以下子 模块:比对子模块,用于比对软件将测序模块得到的融合形式的序列与相应的融合形式的 参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;数据分析子 模块,用于判断比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将数据输 入已知融合形式检测子模块;已知融合形式检测子模块,用于检测已知融合形式:判读融 合形式的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中 的长度是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小 于第二阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支 持该已知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融 合形式的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
[0036] 本方法具有灵敏度高,特异性好且较为经济的优势。
[0037] 优选的,比对子模块中的比对软件采用的是TMAP比对软件,建立比对结果的索引 文件采用的软件是samtools软件。
[0038] 根据本发明一种典型的实施方式,测序文库构建模块中测序文库是否成功以五个 管家基因的测序序列数的检出情况作为标准。
[0039] 根据本发明一种典型的实施方式,比对子模块进一步用于利用比对软件比对管家 基因,如果五个管家基因测得的总序列数少于20, 000条,或出现两个或两个以上的管家基 因测得的序列数目为〇,则不符合分析需求。
[0040] 根据本发明一种典型的实施方式,比对子模块中比对管家基因的序列时计算比对 到不同外显子的长度至少20个核苷酸序列。
[0041] 优选的,第一阈值为大于等于10个核苷酸;第二阈值为0. 12 ;第三阈值为20条。
[0042] 下面将结合实施例进一步说明本发明的有益效果。
[0043] 实施例1
[0044] 1)待检的样本是H2228 ALK融合细胞系,利用荧光定量计(Qubit)进行定量,其浓 度为18. 2ng/ul ;反转录的条件为:42°C保持30min ;然后升温至85°C保持5min ;最后10°C 保温,对RNA进行反转录,得到cDNA,反转录体系配置如表1。
[0045] 表 1
[0046]
[0047]
[0048] 2) cDNA扩增子库中包含了针对ALK和ROSl基因融合而设计的7对引物,详细信息 如下表:
[0049]
[0050] cDNA扩增cDNA的扩增体系配置见表2,进行多重PCR扩增,得到目的片段,基本步 骤如下:先在99°C预变性2min,其次在99°C变性15s,然后在60°C退火延伸4min ;重复变性 及退火延伸过程30次;最后在KTC保温,结束反应。
[0051] 表 2
[0052]
[0053] cDNA扩增产物需要进行引物的部分消化。消化的反应体系为:20ul扩增产物+2ul FuPa酶反应液;消化的反应条件为:先在50°C消化IOmin ;然后在55°C消化IOmin ;再在 60°C消化20min ;最后在KTC下保温,结束消化过程。
[0054] 3)将上述消化后的cDNA扩增产物进行连接接头,首先在22 °C保持30min,其次在 72°C保持IOmin ;最后在10°C保温的条件下进行接头连接步骤;接头连接体系详见表3。
[0055] 表 3
[0056]
[0057] 其中,带标签的接头A序列如SEQ ID NO: 1和SEQ ID NO: 2所示:
[0058] SEQ ID NO: 15 :5'CCATCTCATCCCT*G*CGTGTCTCCGACTCAGCTAAGGTAACGAT 3'
[0059] SEQ ID NO:16 :3'CGCACAGAGGCTGAGTCGATTCCATTGCTA 5'
[0060] 接头 Pl 序列如 SEQ ID NO: 3 和 SEQ ID NO:4 所示:
[0061] SEQ ID N0:17 :5'CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT 3'
[0062] SEQ ID N0:18 :3,T*T*GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA5,。其中 CTAAGGTAAC为Barcode序列;*表示硫代磷酸酯键。
[0063] 4)将上述接头连接后的PCR扩增产物进行磁珠纯化,然后利用qPCR定量,将产物 稀释到IOOpM进行乳液PCR。其中,乳液PCR反应的体系配置见下表5所示,在One touch 2仪器上选择Proton :Ion PI Template 0T2 200 kit V3后进行乳液PCR,得到用于高通量 测序的文库,最后进行模板富集。
[0064] 表 5
[0065]
[0066] 5)在DA8600基因测序仪上进行测序,测序平台得到的电信号转化将basecalling 转化为碱基序列,过滤掉低质量的碱基序列,结果以bam文件格式存储(文件名:.bam)。
[0067] 图1示出了实施例1的检测融合形式流程示意图。
[0068] 首先将捕获测序的结果(非比对文件)比对到panel所对应的参考序列上得到比 对文件,并使用samtools工具建立index,比对的结果作为基因融合检测程序(LPFtools) 的输入文件。LPFtools打开比对的结果文件,并依次分析每一条比对的结果。对于一条比 对结果,首先判断其是否明显支持基因融合,判断的标准有比对质量是否足够高,是否跨过 panel设计的断点,并且在断点的两端的比对长度超过阈值(默认为10nt)。如满足上述条 件则判断为该条序列支持融合,并将该形式的融合序列支持数加1。最终根据每种形式的融 合序列支持数判断样品中是否发生该种形式的融合。
[0069] 检测融合形式的序列 ,具体步骤详见下:
[0070] 第一部分:数据质控。
[0071] 步骤1:利用TMAP比对软件将高通量测序序列比对到已知融合形式的参考序列 上,然后根据比对的位置进行排序,并用samtools软件建立index ;
[0072] 步骤2 :通过control gene判断数据是否符合分析需求。为了从数据的角度来 判断建库是否异常,一般会在试剂盒设计时加入control gene,一般选择的是管家基因 (house-keeping gene)。由于是RNA水平的测序,测序得到的一条序列会涵盖两个外显子, 所以统计比对到管家基因的序列时只计算比对到不同外显子的长度至少20nt的序列。如 果五个control gene测得的总序列数少于20, 000条,则说明该样本测得的数据量太少,不 能进行后续分析。如果出现两个或两个以上的control gene测得的序列数目为0,则说明 建库或者样本有异常,建议重新建库。
[0073] 第二部分:检测融合突变,可检测特定类型的融合突变:
[0074] 试剂盒中针对明确断点而设计引物的融合形式(称为已知融合形式),这种融合 形式可以从COSMIC数据库中找到明确的参考序列。
[0075] 步骤3 :依次分析步骤1得到的每条序列的比对结果。首先判读该序列的比对质 量是否足够高;其次判读比对到断点两侧的参考序列的长度是否满足阈值(默认为l〇nt); 然后判读每侧比对的序列中错配(mismatch)碱基的比例是否小于阈值(默认为0. 12)。如 果序列同时满足上述三个条件,则判读该条序列支持该已知融合形式,否则该序列不支持 该已知融合形式,将该序列输出到另一个bam文件中。如果支持该已知融合形式的序列总 数大于阈值(默认为20),则判断该样本中存在这种已知融合形式。
[0076] 6) H2228 ALK融合细胞系检查结果为表6 :
[0077] 表 6
[0078]
[0079] 图2 :该发明的整体流程中判断序列数是否支持某种融合形式。
[0080] 图2中表示的序列数1-4是否能够通过判断,其中序列数1和序列数2明显支持 panel之中的ampliconl,而序列数3-序列数4虽然跨过断点但是有一端的长度较短,因此 不能判断他们是否明显的支持融合。
[0081] 从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:
[0082] 基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基 因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了 一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平 上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少 量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信 号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于 基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
[0083] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技 术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修 改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0084]
[0085
[0086

[0087]
【主权项】
1. 一种检测基因融合的方法,其特征在于,包括以下步骤: Sl,提取待检测样本RNA,将所述RNA进行反转录,得到CDNA; 52, 在已知的融合基因的断点两侧设计引物,以所述cDNA为模板扩增出融合形式的序 列,构建测序文库; 53, 通过高通量的方法对所述测序文库进行测序,得到所述融合形式的序列; 54, 检测所述融合形式的序列; 所述S4具体包括: S41,利用比对软件将所述S3得到的所述融合形式的序列与相应的融合形式的参考序 列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件; 542, 判断所述S41所得到的数据是否符合分析需求,如果符合分析需求,进行S43,如 果不符合分析需求,重复步骤Sl,S2,S3和S41 ; 543, 检测已知融合形式:判读所述融合形式的序列的比对质量是否足够高,判读比对 所述融合形式的序列到断点两侧在所述参考序列中的长度是否满足第一阈值,判读比对所 述融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果所述融合形式的 序列同时满足上述三个条件,则判读该条所述融合形式的序列支持该已知融合形式,否则 该条所述融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的所述融合形 式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。2. 根据权利要求1所述的方法,其特征在于,所述S41中的比对软件采用的是TMP比 对软件,建立所述比对结果索引文件采用的软件是samtools软件。3. 根据权利要求1所述的方法,其特征在于,构建所述测序文库是否成功以五个管家 基因的测序序列数的检出情况作为标准。4. 根据权利要求3所述的方法,其特征在于,所述S42具体包括:利用比对软件比对所 述管家基因,如果五个管家基因测得的总序列数少于20, 000条,或出现两个或两个以上的 管家基因测得的序列数目为0,则不符合分析需求,重复步骤Sl,S2,S3和S41 ;否则符合分 析需求,进行S43。5. 根据权利要求4所述的方法,其特征在于,比对所述管家基因的序列时计算比对到 不同外显子的长度至少20个核苷酸序列。6. 根据权利要求1所述的方法,其特征在于,所述第一阈值为大于等于10个核苷酸; 所述第二阈值为〇. 12 ;所述第三阈值为20条。7. -种检测基因融合的装置,其特征在于,包括: cDNA获取模块,用于提取待检测样本RNA,将所述RNA进行反转录,得到cDNA; 测序文库构建模块,用于在已知的融合基因的断点两侧设计引物,以所述cDNA为模板 扩增出融合形式的序列,构建测序文库; 测序模块,用于通过高通量的方法对所述测序文库进行测序,得到所述融合形式的序 列; 融合形式检测模块,用于检测所述融合形式的序列; 所述融合形式检测模块进一步包括以下子模块: 比对子模块,用于比对软件将所述测序模块得到的所述融合形式的序列与相应的融合 形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件; 数据分析子模块,用于判断所述比对子模块所得到的数据是否符合分析需求,如果符 合分析需求,将所述数据输入已知融合形式检测子模块; 已知融合形式检测子模块,用于检测已知融合形式:判读所述融合形式的序列的比对 质量是否足够高,判读比对所述融合形式的序列到断点两侧在所述参考序列中的长度是否 满足第一阈值,判读比对所述融合形式的序列每侧的序列中错配碱基的比例是否小于第二 阈值,如果所述融合形式的序列同时满足上述三个条件,则判读该条所述融合形式的序列 支持该已知融合形式,否则该条所述融合形式的序列不支持该已知融合形式,如果支持该 已知融合形式的所述融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合 形式。8. 根据权利要求7所述的装置,其特征在于,所述比对子模块中的比对软件采用的是 TMAP比对软件,建立所述比对结果的索引文件采用的软件是samtools软件。9. 根据权利要求7所述的装置,其特征在于,所述测序文库构建模块中所述测序文库 是否成功以五个管家基因的测序序列数的检出情况作为标准。10. 根据权利要求9所述的装置,其特征在于,所述比对子模块进一步用于利用比对软 件比对所述管家基因,如果五个管家基因测得的总序列数少于20, 000条,或出现两个或两 个以上的管家基因测得的序列数目为0,则不符合分析需求。11. 根据权利要求10所述的装置,其特征在于,所述比对子模块中比对所述管家基因 的序列时计算比对到不同外显子的长度至少20个核苷酸序列。12. 根据权利要求7所述的装置,其特征在于,所述第一阈值为大于等于10个核苷酸; 所述第二阈值为〇. 12 ;所述第三阈值为20条。
【专利摘要】本发明公开了一种检测基因融合的方法及装置。其中,该方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对;S42,判断S41所得到的数据是否符合分析需求;S43,检测已知融合形式。本方法具有灵敏度高,特异性好且较为经济的优势。
【IPC分类】G06F19/22, C12M1/34, C12Q1/68
【公开号】CN104894271
【申请号】CN201510317371
【发明人】蒋智, 曹志生, 李宗文, 张广鑫, 张兰英, 孟雪红, 王玉梅, 尹静妮, 谭泽民, 曹银川, 吴晓朦, 潘凯
【申请人】天津诺禾致源生物信息科技有限公司
【公开日】2015年9月9日
【申请日】2015年6月10日

最新回复(0)