用于检测hiv-1分化体及逆转录酶和蛋白酶区的重组体的系统和方法

xiaoxiao2020-6-24  5

【专利下载】Tel:18215660330

专利名称:用于检测hiv-1分化体及逆转录酶和蛋白酶区的重组体的系统和方法
技术领域
本发明提供用于检测和分析与Hiv-1有关的序列变体、特别是HIV分化体A、B、C、D、F和G及其相关重组体的序列变体的方法、试剂和系统。本文所用术语“分化体”总的来讲具有与相关领域普通技术人员所理解的相同含义,是指通常存在于特定地理区域的HIV-1病毒的遗传独特亚群。例如在欧洲,约75%的HIV感染为HIV-B (即分化体B)感染,约25%由HIV-A、HIV-C和其它分化体群组成。变体可包括在平行的靶多核苷酸群体中的单核苷酸多态性(SNP)、插入/缺失变体(称为“indel”)和等位基因频率。本发明还涉及通过平行焦磷酸测序研究通过聚合酶链式反应(PCR)复制的核酸以鉴定已知和未知序列的突变和多态性的方法。本发明包括使用特别设计的核酸引物,以扩增与特定HIV特性或功能有关的HIV RNA或其互补DNA的特定区和/或一系列重叠区,例如分别与HIV将病毒RNA转录成双链DNA (dsDNA)以备整合至宿主细胞中和适当装配/使病毒多蛋白成熟以产生感染性病毒粒的能力有关的逆转录酶(RT)和蛋白酶(Prot)区。此外,引物的靶位点具有低突变率,使得疑似含有变体(亦称为准种)的靶HIV核酸群中的核酸能够稳定扩增以产生各自的扩增子。以大量平行、有效和有成本效益的方式,对数千独特的HIV扩增子进行测序,以产生扩增子群中存在的序列变体的分布,这使得高于先前所用方法的更大检测灵敏度成为可能。
背景技术
人免疫缺陷病毒(一般称为HIV)依然是世界范围的主要问题,尽管许多化合物获准用于治疗。由于病毒逆转录酶的易错性质和高病毒周转(找=1-3天)所致,HIV基因组突变得非常快。鉴于在其9.7 Kb基因组复制期间的高突变率,‘准种’的形成导致以动态关系存在的许多不同的突变体。

HIV RT基因编码序列位于pol区的5’端附近,在基因组中两侧是Prot区和RNA酶区——前者具有部分重叠的读框,该读框始于gag基因的p6蛋白的3’端。RT蛋白由440个氨基酸(51 kDa)编码,其主要功能产生于作为异二聚体的组合,所述异二聚体具有由560个氨基酸(66 kDa)编码的RT/RNA酶H多蛋白。它包括3个主要的酶功能:1)使互补DNA链与基因组RNA聚合,2)使亲本RNA链降解,留下由酶的逆转录酶活性产生的互补DNA,和3)产生第一链的第二互补链,从而通过聚合酶活性产生dsDNA原病毒(Lu等,J.Biol.Chem.279 (2004) 54529-54532,其通过引用以其整体结合到本文中用于所有目的)。对于任何HIV-1病毒基因,引物设计的一个主要困难是因为这种酶的保真度低,这就导致甚至在病毒RNA至dsDNA的单一 RT转化中的高频率突变。文献指出HIV-1RT在单条DNA链聚合期间引起1/2000-1/4000的取代差错频率(substitution errorfrequencies)。由于第一链和第二链相继聚合,因此对于各HIV-1基因组转化,这些出错率可相当于每轮复制共5-10个突变(Preston等,Science 242 (1988) 1168-1171)。这种突变的dsDNA病毒基因组然后整合到宿主生物将要全体复制的染色体中,用于感染并随后整合到其它宿主细胞中。针对逆转录酶功能的药物是减少病毒繁殖的极好靶标,因此,FDA批准了适于以下两种类别的药物:核苷/核苷酸类似物逆转录酶抑制剂(NRTI/NtRTI)和非核苷逆转录酶抑制剂(NNRTI),两者靶向逆转录酶,但却通过不同方式靶向逆转录酶。抗逆转录病毒药物的NRTI类别由RNA和DNA的核苷酸结构单元(buiIdingblock)的结构类似物组成。当整合到病毒DNA中时,这些有缺陷的核苷酸类似物防止与下一个核苷酸形成新的3’ 一5’磷酸二酯键,引起链合成提前终止,并有效地抑制病毒复制(Zapor, M.J.等,Pyschosomatics 45 (2004) 524-535)。NRTI 通常耐受:性良好,但仍可能具有一些难题。在这些难题中有:线粒体毒性(由外周神经病表明(Moyle,G.J.等,Drug Saf 6 (1998) 481-494 ;Simpson, D.Μ.等,J.Acquir.1mmune Defic.Syndr.Hum.Retrovirol.9 (1995) 153-161)、肌病(Gold,R.等,N.Engl.J.Med.323(1990) 994 ;de la Asuncion, J.G.等,J.Clin.1nvest.102 (1998) 4-9)、乳酸性酸中毒(Carr, A.Clin.1nfect.Dis.36,增刊 2 (2003) S96-S100)和外周脂肪营养不良(Carr,Α.等,AIDS 14 (2000) F25-32)、造血系统毒性(表现为贫血、中性粒细胞减少或血小板减少;Gallicchio, V.S.等,Int.J.1mmunopharmaco1.15 (1993) 263-268)、耳毒性(Simdon, J.Clin.1nfect.Dis.32 (2001) 1623-1627)和多种不良的药物相互作用。齐多夫定,通常称为AZT或Retrovir ,是最早获得FDA批准的NRTI药物。这种药物通常与其它抗逆转录病毒药物(例如用于高效抗逆转录病毒治疗(HAART)方案的抗逆转录病毒药物)联合,并且还用来防止病毒由母亲传给儿童。齐多夫定的毒性和副作用与其它NRTI的类似,最见的是血液学毒性。可得到许多其它经批准的核苷类似物药物,但本文仍列举这些核苷类似物药物(齐多夫定是一种胸苷类似物):阿巴卡韦(Ziagen ),一种由GlaxoSmithKline 销售的 鸟苷类似物;去轻肌苷(Videx ),—种由 Bristol Myers Squibb销售的腺苷类似物;以及恩曲他滨(Emtriva ), 一种由Gilead Sciences销售的胞卩密唳类似物。至今唯一经FDA批准的核苷酸RT抑制剂是药物Viread ,亦称富马酸替诺福韦二索罗基酯,一种由Gilead Sciences销售的腺苷5’ -单磷酸类似物。尽管NRTI是竞争结合到HIV基因组中的核苷或核苷酸类似物,但是NNRTI通过与酶直接非竞争地结合而阻断互补DNA延伸。这就影响蛋白质在其活性部位的构象变化,降低对核苷结合的亲和力。NNRTI不需要胞内磷酸化以变得有活性和抑制HIV-1。它们的抗病毒效能和耐受性使NNRTI成为HAART方案的有利组分,且毒性和病毒交叉耐药性不与NRTI重叠(Zapor等,Pyschosomatics 45 (2004) 524-535)。常见的副作用包括轻度皮疹(Scott, L.J.等,Drugs 2 (2000) 373-407)、肝酶水平升高(Dieterich, D.T.等,Clin.1nfect.Dis.38,增刊 2 (2004) S80-89)和脂肪重新分布(Adkins,J.C.等,Drugs 56(1998) 1055-1066)。常用于治疗的NNRTI包括但不限于:依法韦仑(Sustiva /Stocrin )、奈韦拉平(Viramune )和依曲韦林(Intelence )。蛋白酶基因编码区直接位于RT基因的上游。该基因编码99个氨基酸单体,所述单体与另一个单体配对以作为同二聚体起作用。所得天冬氨酰基蛋白酶同二聚体负责切割HIV-1病毒装配所需要的Gag和Gag-Pol蛋白。前体多蛋白的切割发生在宿主细胞表面,在时间上与其从细胞中的释放接近。成熟,即gag、gag-pol和nef区的HIV-1多蛋白的切害I],是复制病毒粒的存活力所必需的。由于蛋白酶在病毒RNA转化时通过逆转录酶复制,因此在其核苷酸序列内无疑将具有突变。某些突变可导致功能丧失,然而,其它突变能够保持功能,并赋予蛋白酶抑制剂抗性。随后在整个复制子代中这些突变体的选出,使得更难以适当地治疗个体和提供有效的HAART混合物。蛋白酶抑制剂(PI)是与蛋白酶同二聚体催化部位结合的极好的药物类别。根据通过蛋白质三维结构解析获得的信息,对这些药物进行特殊改造。每一种PI都竞争催化部位,并防止蛋白酶接受对病毒存活和整体感染是必需的Gag和Gag-Pol多蛋白。经改造以恰在从细胞释放之前阻止病毒蛋白质活化,PI终止病毒生命周期而不是阻止病毒生命周期,例如治疗药的NRTI/NNRTI类别。因此,PI并不“杀死”病毒,而是降低受感染个体的病毒载量,并减慢感染对宿主T细胞的攻击。PI的一些实例包括但不限于:氨普那韦(Agenerase )、阿扎那韦(Reyataz )、利托那韦(Norvir )和洛匹那韦/利托那韦(Kaletra )。现有的HIV药物抗性测定法通常作为群体测定法进行(Kuritzkes, D.R.等,J.1nfect.Dis.203 (2011) 146-148 ;Van Laethem,K.等,J.Virol.Methods 153 (2008)176-181 ;Paar,C.等,J.Clin.Microbiol.49 2697-2699),所述测定法就其性质而言,比基于克隆分离的每个病毒毒株的测定法较不灵敏。然而,之前所采用的克隆分析测定法是极为劳动密集型的,需要分别测试来自各受试者的数千细胞克隆以获得高的灵敏度。由454测序平台提供的长的读取长度(read-length)理想地适于在单次测序运行中自多个受试者产生数千个克隆读数。因此,通过基于序列的HIV逆转录酶和蛋白酶抑制剂抗性测定法对这些突变的有效检测(其中克隆序列直接获自病毒RNA准种而无需劳动密集型克隆步骤)是十分需要的,并且能够从早期检测中切实加深对疾病和治疗可能性的认识。此外,使可被称为“大量平行”的处理成为可能的高通量测序技术的实施方案,具有比现有测序技术实质上更强大的分析、灵敏度和通量特征。例如,使用本发明的HIV特异性引物的高通量测序技术能够达到检测低丰度等位基因(包括群体中频率为1%或更低的等位基因变体)的灵敏度。如上所述,这在检测HIV变体的情况下很重要,其中高灵敏度提供重要的早期检测机制 ,这产生显著的治疗益处。发明概沭
本发明的实施方案涉及核酸序列的测定。更具体地讲,本发明的实施方案涉及采用高通量测序技术检测序列变体的方法和系统。本文描述了用于检测低频率出现的与逆转录酶和/或蛋白酶有关的一种或多种HIV序列变体的方法,所述方法包括以下步骤:(a)从HIV样品群的多种RNA分子中产生cDNA物类;(b)由cDNA物类扩增多种第一扩增子,其中各第一扩增子用能够从HIV分化体产生扩增子的核酸引物对扩增,所述HIV分化体包括分化体A、分化体B、分化体C、分化体D、分化体F和分化体G ; (c)克隆扩增第一扩增子的扩增拷贝以产生多种第二扩增子;(d)测定第二扩增子的核酸序列组成;和(e)检测第二扩增子的核酸序列组成中的一种或多种序列变体。上述实施方案和实施不必彼此相容或排斥,可以不相冲突和其它可能的任何方式组合,不论它们是与相同还是不同的实施方案或实施联合提供。相对于其它实施方案和/或实施,一个实施方案或实施的描述并非是限制性的。此外,在备选实施中,本说明书中其它部分描述的任一个或多个功能、步骤、操作或技术可与概述中描述的任一个或多个功能、步骤、操作或技术组合。因此,上述实施方案和实施是说明性的而不是限制性的。附图简沭当结合附图考虑时,可从下列详细描述中更清楚地理解上述特征和更多的特征。附图中,相似的参考数字表示相似的结构、元件或方法步骤,参考数字最左边的数字表示其中参考元件最早出现的附图数(例如元件160最早出现在

图1中)。然而所有这些约定只是代表性的或说明性的,而不是限制性的。图1是计算机控制下的测序仪器和反应基质(reaction substrate)的一个实施方案的原理框 图2是6种扩增子相对于HIV逆转录酶和蛋白酶区的位置关系的实施方案的简化图
例;
图3是4种扩增子相对于HIV逆转录酶和蛋白酶区的位置关系的一个实施方案的简化图例;
图4A是图2的6扩增子策略提供的HIV逆转录酶和蛋白酶区的覆盖的一个实施方案的简化图例;
图4B是图3的4扩增子策略提供的HIV逆转录酶和蛋白酶区覆盖的一个实施方案的简化图例;
图5是软件界面的一个实施方案的简化图例,其提供得自多个分化体的样品与通过图2的6扩增子策略产生的已知变体 的测定频率的关联;
图6是软件界面的一个实施方案的简化图例,其提供得自多个分化体的样品与图3的4扩增子策略产生的已知变体的测定频率的关联;
图7是采用图2的6扩增子策略检测的K65R逆转录酶突变的一个实施方案的简化图例。图 7 以出现顺序分别展示 SEQ ID NO 16-18、18、19-20、21、20、19-20、19-20、22-23、24、20、19-20 和 25 ;
图8是用于产生检测药物抗性或灵敏度变体的HIV-1扩增子序列数据的工作流程的一个实施方案的简化图例。发明详沭
按下文中将更详细的描述,本发明的实施方案包括使用设计成在单次测序测定中同时检测分化体A、B、C、D、F和G的HIV变体的靶特异性序列或引物物类以及使用这些引物用于高灵敏度检测逆转录酶和蛋白酶区的HIV序列变体的系统和方法。a.概论
术语“流动图(flowgram)”一般是指通过SBS方法、特别是基于焦磷酸的测序方法(亦称为“焦磷酸测序(pyrosequencing)”)产生的序列数据的图示,并可更准确地称为“热解图(pyrogram)”。本文所用术语“读数”或“序列读数” 一般是指由单个核酸模板分子或模板核酸分子的大量基本相同的拷贝群获得的全部序列数据。本文所用术语“运行”或“测序运行” 一般是指在一种或多种模板核酸分子的测序操作中进行的一系列测序反应。本文所用术语“流动/流”一般是指单循环,通常是将流体溶液引入包括模板核酸分子的反应环境的重复过程的部分,其中所述溶液可包括用于添加至新生分子的核苷酸物类或其它试剂,例如可用于测序方法或减少来自之前核苷酸物类流动的滞留物(carryover)或噪声影响的缓冲液、洗漆溶液或酶。
本文所用术语“流动循环(flow cycle) ”一般是指序贯的系列流动,其中包含核苷酸物类的流体在循环中流动一次(即流动循环可包括以T、A、C、G核苷酸物类的次序顺次加入,但是其它序列组合也视为该定义的部分)。通常,流动循环是在循环之间具有相同流动顺序的重复循环。本文所用术语“读取长度” 一般是指可被可靠测序的模板分子长度的上限。存在对系统和/或方法的读取长度产生影响的多个因素,包括但不限于模板核酸分子中GC含量的程度。本文所用术语“试验片段”或“TF” 一般是指可用于质量控制、校准或其它相关目的的已知序列组成的核酸元件。本文所用术语“引物”一般是指在其中在合适的温度下,在合适的缓冲液中诱导与核酸链互补的引物延伸产物的合成的条件下,用作DNA合成起始点的寡核苷酸。引物优选为单链寡脱氧核糖核苷酸。“新生分子”一般是指通过掺入与模板分子中的相应核苷酸物类互补的核苷酸物类,由模板依赖性DNA聚合酶延伸的DNA链。

术语“模板核酸”、“模板分子”、“靶核酸”或“靶分子” 一般是指作为从中产生序列数据或信息的测序反应的对象的核酸分子。本文所用术语“核苷酸物类”一般是指通常被掺入新生核酸分子中的核酸单体的特性,包括嘌呤(腺嘌呤、鸟嘌呤)和嘧啶(胞嘧啶、尿嘧啶,胸腺嘧啶)。“天然”核苷酸物类包括例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶和胸腺嘧啶。上述天然核苷酸物类的修饰形式包括而不限于次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6- 二氢尿嘧啶和5-甲基胞嘧啶。本文所用术语“单体重复”或“均聚物” 一般是指包含相同核苷酸物类(即重复核苷酸物类)的两个或更多个序列位置。本文所用术语“均质延伸”一般是指延伸反应的关系或阶段,其中基本相同的模板分子群的各个成员在反应中均一地进行相同的延伸步骤。本文所用术语“完成效率”一般是指在给定流动过程中适当延伸的新生分子的百分比。本文所用术语“不完全延伸率” 一般是指不能适当延伸的新生分子数相对于总的新生分子数的比率。本文所用术语“基因组文库”或“鸟枪法文库(shotgun library) ” 一般是指来源于和/或代表生物或个体的整个基因组(即基因组的全部区)的分子集合体。本文所用术语“扩增子”一般是指选择的扩增产物,例如自聚合酶链式反应或连接酶链式反应技术产生的扩增产物。本文所用术语“变体”或“等位基因” 一般是指各自编码相似序列组成但彼此有某种程度的差别的多个基因物类之一。差别可包括相关领域普通技术人员已知的任何变异类型,包括但不限于多态性例如单核苷酸多态性(SNP)、插入或缺失(插入/缺失事件的组合亦称为“indel”)、重复序列(亦称为串联重复)数目的差异和结构变异。本文所用术语“等位基因频率”或“等位基因的频率” 一般是指由特定变体组成的群体中所有变体的比例。本文所用术语“key序列”或“key元件” 一般是指包括已知序列组成的在已知位置上(即通常包括在连接的衔接元件中)与模板核酸分子缔合的核酸序列元件(通常约4个序列位置,即TGAC或核苷酸物类的其它组合),其用作从模板分子产生的序列数据的质量控制参考。如果序列数据在正确位置上包括与Key元件缔合的已知序列组成,则序列数据通过质量控制。本文所用术语“关键通过(keypass) ”或“关键通过孔”一般是指在反应孔中已知序列组成的全长核酸试验序列(即上文提及的“试验片段”或“TF”)的测序,其中将来源于TF序列和/或与TF缔合的Key序列的或与靶核酸缔合的衔接头中的序列的准确性与TF和/或Key的已知序列组成相比较,并用来衡量测序的准确性和用于质量控制。在典型的实施方案中,测序运行中孔的总数的一部分将是关键通过孔,这在某些实施方案中可以是按区域分布的。本文所用术语“平端” 一贯按相关领域普通技术人员的理解来解释,一般是指具有以一对互补核苷酸碱基物类结束的末端的线性双链核酸分子,其中一对平端通常适于彼此连接。本文所用术语“粘性末端”或“突出端” 一贯按相关领域普通技术人员的理解来解释,一般是指在分子一条链的末端具有一个或多个不配对核苷酸物类的线性双链核酸分子,其中不配对核苷酸物类可存在于任一条链上,并包括单个碱基位置或多个碱基位置(有时亦称“粘端”)。 本文所用术语“SPRI ” 一贯按相关领域普通技术人员的理解来解释,一般是指“固相可逆固定法(Solid Phase Reversible Immobilization) ”的专利技术,其中在特定的缓冲条件下在珠粒存在时使靶核酸选择性沉淀,其中所述珠粒常被羧化并且是顺磁的。使沉淀的靶核酸固定在所述珠粒上,使之保持结合直到按照操作者的需要用洗脱缓冲液除去(DeAngelis,M.M.等,Nucleic Acids Res.23 (1995) 4742-4743)。本文所用术语“羧化” 一贯 按相关领域普通技术人员的理解来解释,一般是指通过加入至少一个羧基基团对材料(例如微粒)的修饰。羧基为COOH或C00-。本文所用术语“顺磁性的” 一贯按相关领域普通技术人员的理解来解释,一般是指材料的特性,其中所述材料的磁性只在外部施加的磁场存在下发生,一旦外部施加的磁场被撤除,则不保持任何磁化作用。本文所用术语“珠粒”或“珠粒基质” 一般是指形状不规则或规则的任何合适大小的任何类型的固相颗粒,其由任何数目的已知材料制造,所述材料例如纤维素、纤维素衍生物、丙烯酸树脂、玻璃、硅胶、聚苯乙烯、明胶、聚乙烯吡咯烷酮、乙烯基与丙烯酰胺共聚物、二乙烯基苯交联的聚苯乙烯等(例如Merrifield, Biochemistry 3 (1964) 1385-1390中的描述)、聚丙烯酰胺、乳胶、聚苯乙烯、葡聚糖、橡胶、娃、塑料、硝化纤维素、天然海绵、硅胶、可控孔度玻璃、金属、交联葡聚糖(例如Sephadex )琼脂糖凝胶(Sepharose )和本领域技术人员已知的其它固相珠粒支持体。本文所用术语“反应环境” 一般是指其中通常可发生反应的空间体积,其中至少暂时包含反应物或将反应物限制在内以允许检测至少一种反应产物。反应环境的实例包括但不限于杯、管、瓶以及平面或非平面基质上的一个或多个凹陷、孔或室。本文所用术语“实际终止剂(virtual terminator) ” 一般是指大大减慢反应动力学的终止剂,其中可采用其它步骤终止反应,例如除去反应物。
下文概括地描述了与样品制备与加工、序列数据生成和序列数据分析有关的系统和方法的一些不例性实施方案,其一些或全部适用于本发明的实施方案。具体地说,描述了用于制备模板核酸分子、扩增模板分子、产生靶特异性扩增子和/或基因组文库的系统和方法、测序方法和仪器以及计算机系统的示例性实施方案。在典型的实施方案中,来源于实验或诊断样品的核酸分子应由其未加工形式制备并处理成适于高通量测序的模板分子。处理方法在应用之间可以不同,产生包括不同性质的模板分子。例如,在高通量测序的某些实施方案中,优选产生这样的模板分子,其具有与特定测序方法可准确生成序列数据的长度至少相当的序列或读取长度。在本实例中,长度可包括约25-30个碱基、约50-100个碱基、约200-300个碱基、约350-500个碱基、约500-1000个碱基的范围、大于1000个碱基或适于特定测序应用的任何其它长度。在某些实施方案中,采用本领域普通技术人员已知的多种方法,使样品(例如基因组样品)的核酸断裂。在优选的实施方案中,使核酸随机断裂(即不选择特异性序列或区)的方法可包括所谓的喷雾处理或超声处理方法。然而,应了解断裂的其它方法(例如使用限制性内切核酸酶消化)可用于断裂的目的。此外,在本实例中,某些处理方法可采用本领域已知的大小选择方法以选择性地分离所需长度的核酸片段。此外,在某些实施方案中,优选使另外的功能元件与每个模板核酸分子缔合。所述元件可用于多种功能,包括但不限于用于扩增和/或测序方法的引物序列、质量控制元件(即例如Key元件或其它类型的质量控制元件)、编码例如与起始或患者样品的各种关联的独特标识(亦称为多重标识(multiplex identifier)或“MID”)或其它功能元件。例如,本发明的某些实施方案包括使具有已知和可鉴定的序列组成的MID元件的一个或多个实施方案与样品关联,并且使MID元件的实施方案与来自相关样品的模板核酸分子偶联。将来自多种不同样品的MID偶联的模板核酸分子合并成单一的“多重”样品或组合物,其然后可被有效处理以生成各MID偶联的模板核酸分子的序列数据。使各模板核酸的序列数据去卷积以鉴定偶联的MID元件的序列组成,并与已鉴定的起始样品相关联。在本实例中,多重组合 物可包括约384种样品、约96种样品、约50种样品、约20种样品、约16种样品、约12种样品、约10样品或其它数目的样品的代表。在研究的情况下,可使各样品与不同的实验条件、治疗、种类或个体相关联。同样地,在诊断的情况下,可使各样品与不同的组织、细胞、个体、病况、药物或其它治疗相关联。相关领域普通技术人员应了解,提供上列样品数用于示例性目的,因此不应视为限制。在优选的实施方案中,各MID元件的序列组成易于鉴定,并抵抗因测序方法引入的错误。一些MID元件的实施方案包括与天然存在的序列具有最小序列相似性的核酸物类的独特序列组成。或者,MID元件的实施方案可包括与天然存在的序列有某种程度的序列相似性。此外,在优选的实施方案中,相对于模板核酸分子和/或与模板分子偶联的衔接元件的某些特征,各MID元件的位置是已知的。具有已知的各个MID的位置可用于发现序列数据中的MID元件,并解释MID序列组成的可能错误及随后与起始样品相关联。例如,可用作针对MID元件的位置关系的锚的一些特征可包括但不限于模板分子的长度(即已知MID元件是自5’或3’端的如此多的序列位置)、可识别的序列标记例如Key元件和/或定位于MID元件附近的一个或多个引物元件。在本实例中,Key元件和引物元件一般包含通常在多重组合物中在样品之间不变化的已知序列组成,并可用作搜索MID元件的位置参考。通过应用程序135执行的分析算法可在计算机130上执行以分析每个MID偶联的模板所生成的序列数据,来鉴定较易识别的Key元件和/或引物元件,并从这些位置推算,以鉴定假定包括MID元件的序列的序列区。应用程序135然后可处理假定区和可能的与假定区相距的侧翼区中某种距离的序列组成,以确定地鉴定MID元件及其序列组成。可在某些处理步骤中,将所述功能元件的一些或全部组成与核苷酸序列偶联的衔接元件。例如,某些实施方案可使包含互补序列组成的引发序列(priming sequence)元件或区与用于扩增和/或测序的引物序列缔合。此外,相同元件可用于所谓的“链选择”和用于将核酸分子固定在固相基质上。在某些实施方案中,两类引发序列区(以下称引发序列A和引发序列B)可用于链选择,其中仅选择和包括具有一拷贝引发序列A和一拷贝引发序列B的的单链作为制备的样品。在备选实施方案中,衔接元件的设计特征消除了对链选择的需要。相同引发序列区可用于扩增和固定的方法中,例如,引发序列B可被固定在固相基质上,扩增产物可在其上延伸。用于断裂、链选择及加入功能元件和衔接头的样品处理的其它实例描述于2004年I月28日提交的美国专利申请顺序号10/767,894,标题为“Method for preparingsingle-stranded DNA libraries (用于制备单链DNA文库的方法)”;2008年5月29日提交的美国专利申请顺序号 12/156,242,标题为 “System and Method for Identificationof Individual Samples from a Multiplex Mixture (用于鉴定来自多重混合物的各个样品的系统和方法)”;以及2009年2月23日提交的美国专利申请顺序号12/380,139,标题为“System and Method for Improved Processing of Nucleic Acids for Productionof Sequencable Libraries (用于产生可测序文库的核酸的改良处理的系统和方法)”,其每一份均通过引用以其整体结合到本文中用于所有目的。描述了用于进行模板核酸分子扩增以产生基本相同的拷贝群的系统和方法的各种实例。对普通技术人员将是显而易见的是,当一种或多种核苷酸物类掺入与一拷贝模板分子缔合的各新生分子 中时,在某些SBS的实施方案中需要产生许多拷贝的各种核酸元件,以产生更强的信号。存在许多本领域已知的产生核酸分子拷贝的技术,例如使用所谓的细菌载体的扩增、“滚环”扩增(描述于上文通过引用结合的美国专利号6,274,320和7,211,390)和聚合酶链式反应(PCR)方法,所述每种技术均适用于本发明。特别适于高通量应用的一种PCR技术包括所谓的乳液PCR方法(亦称为emPCR 方法)。乳液PCR方法的典型实施方案包括产生两种不混溶物质的稳定乳液,以产生在其内可以发生反应的水性液滴。具体地说,适用于PCR方法的乳液的水性液滴可包括第一液体,例如作为液滴悬浮或分散在另一液体(例如通常包括某些类型的油的疏水液体(亦称为连续相))中的水基液体(亦称为不连续相)。可使用的油的实例包括但不限于矿物油、硅基油或氟化油。此外,一些乳液实施方案可使用起稳定乳液的作用的表面活性剂,其可特别用于特定的处理方法,例如PCR。表面活性剂的某些实施方案可包括硅酮或氟化表面活性剂的一种或多种。例如,可使用的一种或多种非离子型表面活性剂包括但不限于失水山梨醇单油酸酯(亦称为Span 80)、聚氧乙烯失水山梨醇单油酸酯(亦称为Tween 80),或者在一些优选的实施方案中,聚二甲基硅氧烷共聚醇(亦称为Abil EM90)、聚硅氧烷、多烷基聚醚共聚物、聚甘油脂、泊洛沙姆和PVP/十六烷共聚物(亦称为Unimer U-151),或者在更优选的实施方案中,在环戍娃氧烧(cyclopentasi1xane)中的高分子量娃酮聚醚(亦称为DC5225C,可获自 Dow Corning)。乳液的液滴亦可称为区室、微囊体、微型反应器、微环境或相关领域常用的其它名称。水性液滴的大小可变化,这取决于乳液组分或组合物的组成、其中所含内容物和所采用的形成技术。所述乳液产生微环境,在其中可进行化学反应,例如PCR。例如,可将进行所需PCR反应需要的模板核酸和所有试剂包封和化学隔离在乳液的液滴中。如上所述,在某些实施方案中可采用其它表面活性剂或其它稳定剂促进液滴的额外稳定性。PCR方法的典型热循环操作可使用液滴实现,以扩增被包封的核酸模板,导致产生包括许多基本相同的拷贝的模板核酸的群。在某些实施方案中,液滴内的群体可称为“克隆隔离的”、“区室化的”、“隔离的”、“包封的”或“局部化”群体。同样在本实例中,所述液滴的一些或全部可进一步包封固相基质,例如用于连接模板和模板的扩增拷贝、与模板互补的扩增拷贝或其组合的珠粒。此外,可使固相基质能够连接其它类型的核酸、试剂、标记或其它目标分子。在破乳和珠粒回收后,在典型的实施方案中还可能需要“富集”具有成功扩增的模板核酸分子的基本相同的拷贝群固定在其上的珠粒。例如,用于富集“DNA阳性”珠粒的方法可包括使引物物类与固定的扩增拷贝的游离端上的区(通常存在于衔接序列中)杂交,采用聚合酶介导的延伸反应使引物延伸,并使引物与富集基质(例如磁珠或琼脂糖珠粒)结合。可将选择性条件(例如磁场或离心)施加于包含珠粒的溶液,其中富集珠粒对选择性条件起反应,并与“DNA阴性”珠粒(即没有或很少固定的拷贝)相分离。可用于本发明的乳液的实施方案可包括能够使所述化学反应以大量平行方式进行的极高密度的液滴或微囊体。用于扩增的乳液及其用于测序应用的用途的其它实例描述于美国专利号 7,638,276,7, 622,280,7, 842,457,7, 927,797 和 8,012,690 以及美国专利申请顺序号13/033,240,其每一份均通过引用以其整体结合到本文中用于所有目的。
`
此外,产生用于测序的靶特异性扩增子的实施方案(有时称为超深度测序(Ultra-Deep Sequencing))可用于本发明,其包括使用特异性核酸引物组以扩增来自包含靶核酸的样品的选定靶区。此外,样品可包括已知含有或疑似含有序列变体的核酸分子群,所述序列变体包含与研究或诊断效用有关的序列组成,其中可使用引物扩增,并提供对样品中的序列变体分布的深入了解。例如,可以进行通过核酸样品中的多个等位基因的特异性扩增和测序来鉴定序列变体的方法。先通过设计的PCR引物对对核酸进行扩增,以扩增目标区或核酸群的共有区段附近的区。随后使PCR反应的每种产物(第一扩增子)在单独的反应容器(例如上述基于乳液的容器)中分别进一步扩增。对各来源于第一扩增子群的一个成员的所得扩增子(本文称为第二扩增子)进行测序,序列集合体用来测定存在的一种或多种变体的等位基因频率。重要的是,该方法不需要存在变体的先有知识,且通常可鉴定以频率〈1%存在于核酸分子群中的变体。所述靶特异性扩增和测序方法的一些优势包括比之前达到的更高水平的灵敏度,并且特别可用于包括模板核酸分子的混合群体的策略。此外,使用高通量测序仪器的实施方案,例如使用由454 Life Sciences Corporation提供的孔的所谓PicoTiterPlate 阵列(有时亦称PTP 板或阵列)的实施方案,所述方法可用来产生每次运行或实验超过100,000、超过300,000、超过500,000或超过1,000, 000核酸区的序列组成,且至少部分可
取决于用户偏好,例如通过使用垫圈能用的通道配置等。此外,所述方法提供检测低丰度等位基因的灵敏度,低丰度等位基因可代表样品中存在1%或以下的等位基因变体。该方法的另一个优点包括成生包括分析区的序列的数据。重要的是,不必具有待分析基因座的序列的先有知识。用于测序的靶特异性扩增子的其它实例描述于2005年4月12日提交的美国专利申请顺序号 11/104,781,标题为 “Methods for determining sequence variants usingultra-deep sequencing (使用超深度测序测定序列变体的方法)”;2008年3月14日提交的 PCT 专利申请顺序号 US2008/003424,标题为“System and Method for Detection ofHIV Drug Resistant Variants (用于HIV药物抗性变体检测的系统和方法)”;以及2009年6月 17 日提交的美国专利号7,888,034,标题为“System and Method for Detection ofHIV Tropism Variants (用于HIV向性变体检测的系统和方法)”,其每一份均通过引用以其整体结合到本文中用于所有目的。此外,测序的实施方案可包括Sanger型技术,通常称为杂交测序(SBH)、连接测序(SBL)或掺入测序(SBI)技术的技术。测序技术还可包括所谓的polony测序技术;纳米孔(nanopore)、波导和其它单一分子检测技术;或可逆终止子技术。如上所述,优选的技术可包括合成测序方法。例如,一些SBS实施方案对核酸模板的基本相同的拷贝群进行测序,并且通常使用一种或多种寡核苷酸引物,其被设计成退火至样品模板分子或与模板分子连接的一个或多个衔接头的预先确定的互补位置。在核酸聚合酶存在下,引物/模板复合物与核苷酸物类一起存在。如果核苷酸物类与对应于样品模板分子上的序列位置(其与寡核苷酸引物3’端直接相邻)的核酸物类互补,则聚合酶可用核苷酸物类使引物延伸。或者,在某些实施方案中,引物/模板复合物与大量目标核苷酸物类(通常A、G、C和T)同时存在,并掺入与样品模板分子上的相应序列位置(其与寡核苷酸引物的3’端直接相邻)互补的核苷酸物类。在所述实施方案的任一个中,核苷酸物类可被化学封闭(例如在3’-0位上)以防止进一步延伸,并且需要在下一轮合成时解封闭。还应理解将核苷酸物类添加到新生分子末端的方法是与上述添加至引物末端的方法基本相同的。如上所述,可通过本领域已知的各种方法,来检测核苷酸物类的掺入,例如通过利用酶促反应方法以产生光来检测焦磷酸(PPi)的释放,或者通过检测H+的释放和测量pH的变化(描述于美国专利号6,210,891,6, 258,568和6,828,100的实施例,其每一份均通过引用以其整体结合到本文中用于所有目的),或者通过与核苷酸结合的可检测标记。可检测标记的一些实例包括但不限于质量标签(mass tag)和荧光或化学发光标记。在典型的实施方案中,例如通过洗漆除去未掺入的核苷酸。此外,在某些实施方案中,可对未掺入的核苷酸进行酶促降解,例如使用描述于以下文献的腺苷三磷酸双磷酸酶或焦磷酸酶的降解:2008年6月27日提交的美国专利申请顺序号12/215,455,标题为“System and Method forAdaptive Reagent Control in Nucleic Acid Sequencing (核酸测序中适应性试剂控制的系统和方法)”;以及2009年I月29日提交的12/322,284,标题为“System and Methodfor Improved Signal Detection in Nucleic Acid Sequencing (核酸测序中改进的信号检测的系统和方法)”;其每一份均通过引用以其整体结合到本文中用于所有目的。在使用可检测标记的实施方案中, 在随后的合成循环之前,可检测标记通常须被灭活(例如通过化学裂解或光漂白)。如上所述,可用另一核苷酸物类或大量的目标核苷酸物类查询模板/聚合酶复合物中的下一个序列位置。核苷酸添加、延伸、信号采集和洗涤的重复循环导致模板链的核苷酸序列的确定。随着本实例的继续,通常在任一测序反应中同时分析大量或大批基本相同的模板分子(例如103、104、105、IO6或IO7个分子),以获得强到足以可靠检测的信号。另外,在某些实施方案中,通过应用所谓的“配对末端(paired-end) ”测序策略改进测序方法的读取长度容量和质量可能是有利的。例如,测序方法的某些实施方案对从中可生成高质量的可靠读数的分子总长度有限制。换句话说,可靠读取长度的序列位置总数可不超过25、50、100或500个碱基,这取决于所采用的测序实施方案。配对末端测序策略通过对分子的每个末端(有时称为“标签”端)进行分别测序来延长可靠读取长度,所述分子包括通过接头序列在中心连接的每个末端上的原始模板核酸分子的片段。模板片段的原始位置关系是已知的,因此来自序列读数的数据可重新组合成为具有更长的高质量读取长度的单一读数。配对末端测序实施方案的其它实例描述于美国专利号7,601,499,标题为“Paired end sequenci ng (配对末端测序)”;以及2009年I月28日提交的美国专利申请顺序号12/322,119,标题为“Paired end sequencing (配对末端测序)”,其每一份均通过引用以其整体结合到本文中用于所有目的。SBS仪器的一些实例可执行上述某些或全部方法,并可包括一种或多种检测设备,例如用于光学检测的电荷耦合装置(即CCD摄影机)或共焦型体系结构(confocal typearchitecture)、用于离子或化学检测体系结构的离子敏场效应晶体管(亦称为“ISFET”)或化学敏场效应晶体管(亦称为“ChemFET” )、微流体室或流动池、反应基质和/或泵和流动阀。以基于焦磷酸的测序为例,仪器的某些实施方案可利用产生固有低水平的本底噪声的化学发光检测策略。在某些实施方案中,用于测序的反应基质可包括平面基质,例如载玻片型基质、包含其中含有ISFET检测元件的孔型结构的半导体芯片,或在某些实施方案中可包括孔型结构的波导型反应基质。此外,反应基质可包括如上所述可获自454 Life SciencesCorporation的、由光纤面板形成的所谓PTP 阵列,所述光纤面板经酸蚀刻以产生几十万或更多极小孔,各孔能够容纳基本相同的模板分子群(即一些优选的实施方案,在孔与孔的间距为35 μπι的70 X 75mm PTP 阵列上包括约330万个孔)。在某些实施方案中,可将基本相同的模板分子的每个群体布置在固相基质(例如珠粒)上,其每一个都可被置于所述孔之一中。例如,仪器可包括试剂递送元件用于将流体试剂供给PTP板架,以及能够收集从PTP板上的各孔中发出的光的光子的CCD型检测装置。包括改进的信号识别的特征的反应基质的实例描述于2005年8月30日提交的美国专利号7,682,816,标题为“1'!1爪41111COATED MICROffELL ARRAYS AND METHODS OF MAKING SAME (薄膜包被的微孔阵列和制备所述微孔阵列的方法)”,其通过引用以其整体结合到本文中用于所有目的。用于进行SBS型测序和焦磷酸测序的仪器和方法的其它实例描述于美国专利号7,323,305和7,575,865,均在上文中通过引用予以结合。另外,可采用使一个或多个样品制备过程自动化的系统和方法,例如上述emPCR 方法。例如,可采用自动化系统以提供有效溶液用于产生用于emPCR处理的乳液、进行PCR热循环操作,并富集成功制备的核酸分子群用于测序。自动化样品制备系统的实例描述于美国专利号7,927,797和美国专利申请顺序号13/045,210,其每一份均通过引用以其整体结合到本文中用于所有目的。此外,目前描述的本发明的实施方案的系统和方法可包括使用存储用于在计算机系统中执行的计算机可读介质的一些设计、分析或其它操作的执行。例如,下面详细描述了处理采用SBS系统和方法生成的检测信号和/或分析数据的若干实施方案,其中处理和分析实施方案可在计算机系统中执行。用于本发明的计算机系统的示例性实施方案可包括任何类型的计算机平台,例如工作站、个人计算机、服务器或任何其它现有的或未来的计算机。然而,本领域普通技术人员应了解,本文所述的前述计算机平台经过特殊配置以执行本发明的专门操作,不得视为通用计算机。计算机通常包括已知部件,例如处理器、操作系统、系统存储器、存储设备、输入输出控制器、输入输出设备和显示设备。相关领域普通技术人员还应了解,有许多可能的计算机配置和部件,还可包括高速缓冲存储器、数据备份设备和许多其它设备。显示设备可包括提供视觉信息的显示设备,这种信息通常可在逻辑和/或物理上经组构成为像素阵列。还可包括接口控制器,其可包括用于提供输入和输出接口的各种已知的或未来的软件程序的任一种。例如,接口可包括通常所谓的“图形用户界面”(通常称为GUI),为用户提供一个或多个图示。接口通常能够接受使用相关领域普通技术人员已知的选择或输入方式的用户输入。在相同或备选实施方案中,在计算机上的应用程序可采用包括所谓的“命令行接口”(通常称为CLI)的接口。CLI通常提供应用程序与用户间的基于文本的互动。通常,命令行接口作为通过显示设备的文本行显示输出并接收输入。例如,一些实施可包括所谓的“外壳程序”,例如相关领域普通技术人员已知的Unix Shells或采用面向对象型编程体系结构的 Microsoft Windows Powershel I,例如 Microsoft.NET 框架。相关领域普通技术人员应了解接口可包括一个或多个⑶1、CLI或其组合。

处理器可包括市售处理器,例如Intel Corporation制造的Celeron 、Core 或Pentium 处理器、由Sun Microsystems制造的SPARC 处理器、由AMD公司制造的Athlon 、Sempix)nTM、Phen0mTM或Opteixm 处理器,或者可以是市售的或将可获得的其它处理器之一。处理器的某些实施方案可包括所谓的多核处理器和/或能够采用单核或多核配置的平行处理技术。例如,多核体系结构通常包括两个或更多个处理器“执行核”。在本实例中,各执行核可作为独立处理器执行,使得多线程平行执行成为可能。另外,相关领域普通技术人员应了解,处理器可以一般称之为32位或64位的多核体系结构或目前已知或未来可开发的其它体系结构配置进行配置。处理器通常执行操作系统,操作系统可为例如来自Microsoft Corporation的Windows 型操作系统(例如 Windows XP> Windows Vista 或 Windows _7);来自 AppleComputer Corp 的Mac OS X操作系统(例如Mac OS X vl0.6 “Snow Leopard”操作系统);可获自许多厂商的Unix 或Linux型操作系统或所谓的开放源码;其它操作系统或未来的操作系统;或其某些组合。操作系统以众所周知的方式与固件和硬件对接,便于处理器协调和执行可用各种编程语言编写的各种计算机程序的功能。通常与处理器协作的操作系统协调并执行功能计算机的其它部件的功能。操作系统还提供调度、输入-输出控制、文档和数据管理、存储管理和通信控制和相关服务,所有这些都依照已知的技术。
系统存储器可包括各种已知的或未来的存储设备的任一种。实例包括任何普遍可获得的随机存取存储器(RAM)、磁性介质例如常驻硬盘或磁带、光学介质例如读写光盘或其它存储设备。存储设备可包括各种已知的或未来的设备的任一种,包括磁盘驱动器、磁带驱动器、移动硬盘驱动器、USB或闪速驱动器或软盘驱动器。这类类型的存储设备通常分别由程序存储介质(未显示)读取和/或写入程序存储介质,例如光盘、磁带、移动硬盘、USB或闪速驱动器或软盘。目前在用或可稍后开发的这些程序存储介质的任一种,都可视为计算机程序产品。应了解这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序,亦称计算机控制逻辑,通常存储在系统存储器和/或与存储设备联用的程序存储设备中。在某些实施方案中,描述了包括计算机可用介质的计算机程序产品,所述计算机可用介质具有存储在其中的控制逻辑(计算机软件程序,包括程序代码)。控制逻辑当通过处理器执行时,致使处理器执行本文所述功能。在其它实施方案中,某些功能主要在硬件中使用例如硬件状态机来执行。为了执行本文所述功能,硬件状态机的执行对相关领域技术人员而言将是显而易见的。输入输出控制器可包括接受和处理用户信息的各种已知设备的任一种,用户不论是人还是机器,不论是本地的还是远程的。这类设备包括例如调制解调卡、无线卡、网络接口卡、声卡或用于各种已知输入设备任一种的其它类型的控制器。输出控制器可包括用于向用户提供信息的各种已知显示设备任一种的控制器,用户不论是人还是机器,不论是本地的还是远程的。在所述实施方案中,计算机的功能元件通过系统总线彼此通信。计算机的某些实施方案可利用网络或其它类型的远程通信与某些功能元件通信。对相关领域技术人员将是显而易见的是,如果在软件中执行,则可将仪器控制和/或数据处理应用程序装载到系统存储器和/或存储设备内并由其执行。仪器控制和/或数据处理应用程序的全部或部分还可驻留在只读存储器或存储设备的类似设备中,这类设备不需要仪器控制和/或数据处理应用程序先通过输入输出控制器装载。相关领域技术人员应了解仪器控制和/或数据处理应用程序或其部分,可以已知方式通过处理器装载到系统存储器或高速缓冲存储器 或两者中以利于执行。此外,计算机可包括一个或多个库文件、实验数据文件和存储在系统存储器中的互联网客户程序。例如,实验数据可包括一个或多个实验或测定的相关数据,例如检出信号值或与一个或多个SBS实验或方法相关的其它值。另外,互联网客户程序可包括能够利用网络访问另一台计算机的远程服务的应用程序,并且可包括例如一般所称的“网页浏览器”。在本实例中,一些常用的网页浏览器包括可获自Microsoft Corporation的Microsoft Internet Explorer 8、来自 Mozilla Corporation 的Mozilla Firefox 3.6、来自 Apple Computer Corp.的 Safari 4、来自 Google Corporation 的 Google Chrome 或本领域目前已知或未来开发的其它类型的网页浏览器。此外,在相同实施方案或其它实施方案中,互联网客户程序可包括能够通过网络访问远程信息的专业软件应用程序或可以是其组件,例如用于生物应用的数据处理应用程序。网络可包括本领域普通技术人员熟知的多种不同网络类型的一种或多种。例如,网络可包括利用通常所称的TCP/IP协议套进行通信的局域网或广域网。网络可包括这样的网络,其包括通常称为互联网的互连计算机网络全球系统,或者还可包括各种内联网体系结构。相关领域普通技术人员还应了解,联网环境中一些用户可能更喜欢利用所谓的“防火墙”(有时亦称数据包过滤器(Packet Filter)或边界保护装置(Border ProtectionDevices))以控制信息在硬件和/或软件系统间的往返通信。例如,防火墙可包括硬件或软件组件或其某些组合,通常被设计成强制执行用户(例如网络管理员等)设定的安全策略。b.本发明的实施方案
如上所述,本发明的实施方案涉及检测样品中的分化体A、B、C、D、F和G或多种分化体的重组体的HIV逆转录酶和蛋白酶序列变体和通过使变体序列组成与药物抗性和/或灵敏度类型关联而检测抗性和/或灵敏度与靶向存在的HIV逆转录酶和蛋白酶功能的药物的相关性的方法。另外,本发明的实施方案涉及多重测序测定法,该测定法将多个样品混入混合库中,并进行测序以对来自分化体A、B、C、D、F和G或其重组体的各个样品变体的同时检测进行平行检测,其中为各样品指派多重标识序列(MID)以使已鉴定的变体与样品关联。本领域普通技术人员应了解,样品通常可来源于单个分化体或者两个或更多个分化体之间的重组。还应了解,所述相关性可包括检出变体与已知与药物抗性和/或灵敏度有关的变异的诊断相关性,以及检出变体与样品的药物抗性和/或灵敏度表型的发现相关性。本发明的实施方案包括靶向已知与药物抗性和/或灵敏度类型有关的HIV逆转录酶和蛋白酶的区、与由数千病毒颗粒平行生成序列信息的测序技术联用的两阶段PCR技术(即如上所述产生第一和第二扩增子),该技术能够鉴定HIV逆转录酶和蛋白酶类型的出现(根据类型与样品中变体的检出序列组成的关联),甚至以低频率出现在样品中的类型。实际上,本发明的实施方案可 检出含有非化学计量的等位基因量的HIV病毒颗粒的样品中存在的序列变体,例如以大于50%、小于50%、小于25%、小于10%、小于5%或小于1%存在的HIV逆转录酶和蛋白酶变体。所述实施方案使得以快速可靠且具成本效益的方式的这种鉴定成为可能。在一个典型的测序实施方案中,可使用使一个或多个工序自动化的一种或多种仪器组件。例如,可使用使一些或全部工序自动化并进行一些或全部工序的仪器来实现测序方法的实施方案。图1提供测序仪器100的说明性实例,其对于需要俘获光学信号的测序过程,通常包括光学子系统和流体子系统,以执行发生在反应基质105上的测序反应和数据捕获。然而,应了解对于需要数据捕获的其它方式(即pH、温度、电化学等)的测序过程,可采用相关领域普通技术人员已知的用于数据捕获方式的子系统。例如,可通过用户101或一些自动化实施方案将模板分子样品加载到反应基质105上,然后使用测序仪器100以大量平行方式测序,以生成代表各模板分子的序列组成的序列数据。重要的是,用户101可包括任何这样的用户,包括但不限于独立研究人员、技术人员、临床医生、大学或法人实体。在某些实施方案中,样品可任选使用样品制备仪器180以完全自动化或部分自动化方式制备用于测序,样品制备仪器180经配置以进行一些或全部必要制备物以用于使用仪器100的测序。本领域普通技术人员应了解,样品制备仪器180为用于说明目而提供,并且可代表一种或多种仪器,所述仪器各自经设计以进行与特定测序测定所需要的样品制备有关的一些或全部步骤。样品制备仪器的实例可包括机器人平台,例如可获自HamiltonRobotics、Beckman Coulter 或 Caliper Life Sciences 的机器人平台。此外,如图1所示,测序仪器100可与一个或多个外部计算机组件有效连接,外部计算机组件例如可执行系统软件或固件例如应用程序135的计算机130,应用程序135可提供对一个或多个仪器例如测序仪器100或样品制备仪器180的指令控制和/或数据分析功能。计算机130还可通过网络150与其它计算机或服务器有效连接,网络150能够远程操作仪器系统和将大量数据输出至能够存储和处理的系统。在本实例中,测序仪器100和/或计算机130可包括上文概述的实施方案的一些或全部组件和特性。在本发明的一个方面,根据被设计成以极低偏差方式产生扩增子的分化体A(>500个序列)、B (>1000个序列)、C (>4000个序列)、D (>800个序列)和F/G (约300个序列)的HIV序列比对,设计靶特异性引物直接用于所述测序应用。已知HIV序列的比对可采用相关领域普通技术人员已知的方法进行。例如,本领域可获得多种序列比对方法、算法和应用程序,包括但不限于Smith-Waterman算法(Smith, T.F.和Waterman, M.S.147 (1981) J.Mol.Biol.195-197) ;BLAST 算法(Altschul,S.F.等,J.Mol.Biol.215 (1990) 403-410);以及 Clustal (Thompson,J.D.等,Nucl.Acids Res.25 (1997)4876-4882)。序列与单一序列的比对提供HIV序列群最常见序列组成的共有序列。同样在本实例中,软件应用程序可标出HIV分型的目标区,以及针对比对的共有序列的引物序列的靶区。目标区包括已知对突变敏感的区和可促成HIV抑制剂抗性的区。然后可以设计针对共有序列区的引物组,所述共有序列区比已知突变易感性的区更保守(即较不可能突变)。此外,引物设计包括其它考虑,例如就用于测定扩增产物序列组成的测序技术的读取长度容量而言,所得到的扩增产物的长度。对于引物设计,具有低突变率的靶向序列区的优点包括可靠地使用设计引物而没有因可能使引物不能结合的靶区上的变异所致失败的实质危险的能力。重要的是,设计本发明的引物,使得每个引物组可从多个HIV分化体产生扩增子,具体地说每个引物组可从HIV分化体A、B、C、D、F和G及两个或更多个分化体的相关重组体产生扩增子。实际上,本发明特别可用于检测分化体间发生的重组事件。例如,由于本发明的引物对分化体A 、B、C、D、F和G群内的特定分化体无选择性,因此来自至少两种不同分化体的重组变体可按所述方法扩增和测序,至少部分是因为本发明的测序方法对其中来自分化体的序列元件重组的“折点”不敏感的事实。因此,可分析所生成的序列数据,并鉴定重组事件,因为除了与分化体特异性序列特征的关联外,不需要事前信息。另外,本领域普通技术人员了解,可视为共有序列“保守”区的区内的某些位置在其组成方面仍是可变的,被视为“简并”位置。在某些优选的实施方案中,用于引物设计的参数包括:在其中在用于确定共有序列的多重序列比对中在某位置上存在小于98%频率的核苷酸物类的情况下,在引物组成中的该位置上取代入简并碱基。另外,影响结合靶区选择和引物组成的其它参数包括限制简并位置在仅有两个备选核苷酸物类的简并位置上,并且限制引物组成不超过两个简并位置以降低在扩增反应中形成引物二聚物的风险,以及增加可通过保持引物重复数至最低限度而产生足量的扩增产物的可能性(各简并位置需要至少两个重复,每个具有备选核苷酸物类之一)。在某些实施方案中,还需要将简并位置限于引物组成的最后5个序列位置(即在正向引物的3’端和反向引物的5’端上),因为最后5个位置高度保守对结合效率是有利的。例如,简并序列位置通常具有至少两个不同的作为该位置上的备选序列组成出现的核苷酸物类。在本文所述实施方案中,无简并核苷酸掺入代表大于两个核苷酸的引物设计中(即不使用可代表3或4个核苷酸的H、B、V或N),这再次增加可产生的足量扩增产物的可能性。简并碱基是本领域众所周知的,并且各种类型的简并用表不与该类型有关的备选核苷酸组成的IUPAC符号表不。例如,IUPAC符号R表不嘌呤碱基(即A和G)是可能的备选物。本发明的一个实施方案包括下列设计成产生适于高通量测序的6种扩增子的引物物类:
TOFMuW
5' C:Xn;4TCG(XlXtXTC:CirCJC,C'ATC,ACiAAT('AC,TrnTGGC,ARCGAC'C.3' tSEQ ID NO:1)
Mil.Niifih
5' CTATCK:CiC:C:mit:CACKX:CCiC'TCACiWOCi€CT:ATC:(:AWrtTCi(i 3'
CSEQ ID NO; >)
Iili Mtilii l>-2
5' CGTAT€G(:€TCTX.TCGC.G€CATCAGGCAATTGGAGG1T1TATCAA RGTI'
(SEC) ID NO: J)
权利要求
1.一种用于检测低频率出现的与逆转录酶和/或蛋白酶有关的一种或多种Hiv序列变体的方法,所述方法包括以下步骤: (a)自HIV样品群中的多种RNA分子中产生cDNA物类; (b)由所述cDNA物类扩增多种第一扩增子以产生第一扩增子的扩增拷贝,其中各第一扩增子用能够从HIV分化体产生扩增子的核酸引物对扩增,所述HIV分化体包括分化体A、分化体B、分化体C、分化体D、分化体F和分化体G ; (c)对第一扩增子的扩增拷贝进行克隆扩增以产生多种第二扩增子; (d)测定第二扩增子的核酸序列组成;和 (e)检测第二扩增子的核酸序列组成中的一种或多种序列变体。
2.权利要求1的方法,所述方法还包括以下步骤: (f)使检出的序列变体与HIV逆转录酶或蛋白酶相关变异关联。
3.权利要求1的方法,其中: 已知HIV逆转录酶或蛋白酶相关变异与对抑制剂的抗性有关。
4.权利要求1的方法,其中: 所述核酸引物对能够由包含两个分化体的重组体的重组体HIV分化体产生扩增子,所述分化体选自分化体A、分化体B、分化体C、分化体D、分化体F和分化体G。
5.权利要求1的方法,其中: 所述多种扩增子包括6种扩增子。
6.权利要求5的方法,其中: 用于扩增6种扩增子的引物对包括Til3F Multi引物和TilR Multi引物;Ti2F MultiD-2 引物和 Ti2R Multi E_2 引物;Til3F Multi 引物和 Ti3R Multi B 引物;Ti4F Multi D2引物和Ti4R Multi B引物;Ti5F Multi引物和Ti5R Multi B引物;以及Ti6F Multi引物和 Ti6R Multi 引物。
7.权利要求5的方法,其中: 所述6种扩增子提供与逆转录酶和蛋白酶相关的HIV区的完全覆盖。
8.权利要求7的方法,其中: 所述6种扩增子提供至少与逆转录酶和蛋白酶相关的HIV区的双重覆盖。
9.权利要求1的方法,其中: 所述多种扩增子包括4种扩增子。
10.权利要求9的方法,其中: 用于扩增4种扩增子的引物对包括Til3F Multi引物和Ti3R Multi B引物;Ti4FMulti A引物和Ti5R引物;Ti5Fn引物和Ti2R引物;以及Ti6F Multi引物和Ti6R Multi引物。
11.权利要求9的方法,其中: 所述4种扩增子提供与转录酶和蛋白酶有关的HIV区的完全覆盖。
12.权利要求1的方法,其中:检出的序列变体在HIV病毒群中以1%或以下的频率出现。
13.一种用于检测与逆转录酶和/或蛋白酶区有关的一个或多个HIV序列变体的试剂盒,其包括:用于扩增权利要求1的第一扩增子的多个核酸引物对。
14.权利要求13的试剂盒,其中: 一个或多个引物对选自Til3F Multi引物和TilR Multi引物;Ti2F Multi D-2引物和 Ti2R Multi E-2 引物;Til3F Multi 引物和 Ti3R Multi B 引物;Ti4F Multi D2 引物和Ti4R Multi B 引物;Ti5F Multi 引物和 Ti5R Multi B 引物;Ti6F Multi 引物和 Ti6R Multi引物。
15.权利要求13的试剂盒,其中: 一个或多个引物对选自Til3F Multi引物和Ti3R Multi B引物;Ti4F Multi A引物和Ti5R引物;Ti5Fn引物和Ti2R引物;以及Ti6F Multi引物和Ti6R Multi引物。
全文摘要
本文描述了用于检测低频率出现的与逆转录酶和/或蛋白酶有关的一种或多种HIV序列变体的方法,所述方法包括以下步骤(a)从HIV样品群的多种RNA分子中产生cDNA物类;(b)由cDNA物类扩增多种第一扩增子,其中各第一扩增子用能够从HIV分化体产生扩增子的核酸引物对扩增,所述HIV分化体包含分化体A、分化体B、分化体C、分化体D、分化体F和分化体G;(c)克隆扩增第一扩增子的扩增拷贝以产生多种第二扩增子;(d)测定第二扩增子的核酸序列组成;和(e)检测第二扩增子的核酸序列组成中的一种或多种序列变体。
文档编号C12Q1/70GK103154274SQ201180048703
公开日2013年6月12日 申请日期2011年10月6日 优先权日2010年10月8日
发明者B.B.西门, E.P.圣约翰 申请人:霍夫曼-拉罗奇有限公司

最新回复(0)