制备富集文库的方法

xiaoxiao2020-6-24 53

专利名称：制备富集文库的方法
技术领域：
本发明涉及一种制备包含允许鉴定至少一种结合至少一种靶标的结合实体的特定核酸序列信息的富集文库(enriched library)的方法,其中所述特异结合实体已经存在于体外展示文库中。背景已经开发了展示技术以整合核酸的信息存储和扩增能力与其他化合物的功能活性。展示技术依赖于功能结合实体(即表型)和提供关于功能实体结构信息的核酸序列(基因型)之间的关联。注:虽然由于表型和基因型包含于同一分子(DNA或RNA)，核酸适体(nucleic acid aptamer)技术被认为是一种展示技术。此类方法的优点是可以构建非常大型的文库，并就功能实体的所需活性进行探查。然后，具有所需活性的文库成员可以与不具有所需活性的文库成员分开，从而形成富集文库，其具有更大部分的具有所需活性的成员。这种方法被称为选择或富集。一些展示技术允许多轮选择，这种情况下，一轮富集文库被扩增并用于准备新的富集展示文库和用于下一轮选择，等等。随后，富集文库中的文库成员的结构可以通过其同族(cognate)核酸序列进行鉴定，从而甚至允许从微量的材料进行鉴定。本发明相关文库可根据现有技术称为“体外展示文库”。本发明中，术语“体外展示文库”应当根据现有技术来理解一即作为包含大量不同结合实体的文库，其中每个结合实体附加到核酸分子，所述核酸分子包含允许鉴定所述结合实体的特定核酸序列信息——即一旦人们知晓所述核酸分子的所述特定核酸序列信息即可直接知晓附加到所述核酸分子的所述特定结合实体的结构一附加到所述核酸分子(基因型)的所述结合实体(即表型)的结构在本发明中被称为B-结构。现有技术描述了大量制备这种体外展示文库的不同的方法一本发明合适的实施例包括例如 EP1809743B1 (Vipergen),EP1402024B1 (Nuevolution),EP1423400B1 (DavidLiu)、Nature Chem.Biol.(2009), 5:647-654 (Clark)、W000/23458 (Harbury)、NatureMethods (2006),3 (7),561-570,2006 (Miller), Nat.Biotechnol.2004 ；22,568-574(Melkko),Nature.(1990)；346 (6287)，818-822 (Ellington)或 Proc Natl Acad Sci USA(1997).94 (23):12297-302 (Roberts)、TO06053571A2 (Rasmussen)。例如上述提到的现有技术所描述的一今天人们可以制备包含非常多(例如IO15种)特定结合实体(例如不同的化合物)的体外展示文库。鉴于此——很明显，能够改进这些文库的选择/富集步骤来制备富集文库将是非常有趣的一例如更有效地能够鉴定结合到感兴趣的靶标(例如医学上重要的受体分子)的特定结合实体(例如化合物)的结构。本发明附图3显示EP1809743Bl(Vipergen)所述的体外展示技术的一个实例-
如附图3所示一该实例的选择步骤通过固定靶标(例如受体)于固相表面(例如珠或玻璃盘)来进行。不限于理论一就我们所知，本发明附图3的实例可看做本发明相关体外展示技术现有技术(例如上述现有技术)的实例——即就我们所知，在现有技术中存在于体外展示文库的合适的结合实体的选择通常在展示文库结合事件之前或之后通过固定靶标(例如受体)于固相载体(例如玻璃盘、柱、珠、硝酸纤维素膜、小室等)来实施。未结合物和低亲和性结合物通常被洗脱下来，而富集结合物群体从固相载体上回收。在现有技术中已被描述的体外区室化(in vitro compartmentalization，IVC)用于查询文库中表型和基因型联系的技术。这些现有技术可分成两组:a) IVC用于促进建立正确的表型和基因型联系，其允许之后(区室破坏后)的功能选择(例如特定靶标结合)，和b) IVC用于促进基于区室里表型的活性建立正确的表型和基因型联系，即在区室里基因被转录和翻译并且区室里所得蛋白的功能直接或间接用于分选、生存或扩增。换句话说，本发明相关所谓IVC现有技术——可描述为:组a)——其中表型活性在区室化步骤之后查询；或组b)——其中表型活性在区室化步骤之中查询。现有技术属于组a)的IVC实例:Bertschinger 等人，(2007) Protein Engineering, Design & Selectionvol.20n0.2pp.57 - 68;Miller OJj Bernath Kj Agresti JJ，Amitai Gj Kelly BTj MastrobattistaEj Taly V，Magdassi Sj Tawfik DS，Griffiths AD.Directed evolution by in vitrocompartmentalization.Nat Methods.2006Jul;3 (7):561_70;DoijN.和 Yanagawa，H.(1999) FEBS Lett.，457，227 - 230;和Yonezawaj M. ，Doij N.，Kawahashij Y.，Higashinakagawaj T.和 Yanagawa，H.(2003) Nucleic Acids Res.，31，ell8。现有技术属于组b)的IVC实例:Tawfikj D.S.和 Griffiths，A.D.(1998)Man-made cell-like compartments formolecular evolution.Nat.Biotechnol.，16，652—656;Ghadessy，F.J.，Ong，J.L.和 Holliger，P.( 2001) Proc.Natl Acad.Sc1.USA, 98,4552 - 4557;Tay Y，Ho Cj Droge P，Ghadessy FJ.Selection of bacteriophagelambda integrases with altered recombination specificity by in vitrocompartmentalization.Nucleic Acids Res.2010Mar;38 (4):e25.Epub2009Dec4;Zheng Y，Roberts RJ.Selection of restriction endonucleases usingartificial cells.Nucleic Acids Res.2007;35 (11):e83.Epub2007;Mastrobattista E，Taly V，Chanudet Ej Treacy P，Kelly BTj GriffithsAD.High-throughput screening of enzyme libraries:1n vitro evolution of abeta-galactosidase by fluorescence-activated sorting of double emulsions.ChemBiol.2005Dec;12 (12):1291-300;Levy Mj Griswold KEj Ellington AD.Direct selection of trans-acting ligaseribozymes by in vitro compartmentalization.RNA.2005 Oct;11 (10): 1555-62.Epub2005 Aug30;Sepp A，Choo Y.Cell-free selection of zinc finger DNA-binding proteinsusing in vitro compartmentalization.J Mol Biol.2005 Nov25;354 (2):212-9.Epub2005 0ct3;Bernath K, Magdassi S, Tawfik DS.Directed evolution of protein inhibitorsof DNA-nucleases by in vitro compartmentalization (IVC) and nano-dropletdelivery.J Mol Biol.2005Feb4;345 (5): 1015-26.Epub2004Dec7。现有技术进一步的IVC实例可发现于:Bertschinger 等人，(2004) Protein Engineering, Design & Selectionvol.20n0.2pp.699 - 707;Chen Yu 等人，(November2008) Nucleic Acid Research, Vol.36, Nr.19, Pages:Article N0.E128;Hansen 等人.J.Am.Chem.Soc., 2009, 131 (3) , ppl322 - 1327。

发明内容
本发明要解决的问题可以视为是提供改进的基于体外展示的方法来制备富集文库，其包含至少一种结合到感兴趣的靶标(例如药学上相关的受体)的结合实体(例如化合物)。在许多情况下，治疗学发展中最显著的是，结合实体(药物)的两个参数是特别重要的，即效力(亲和性)和解离速率(药物:靶标复合物的解离半衰期)。本发明为在这两个重要的结合参数上富集的体外展示方法提供改进的解决办法。在其他情况下，对于结合特性的结合速率属性是需要的。本发明为在对于结合特性的结合速率属性上富集的体外展示方法提供改进的解决办法。可以看出，解决办法基于:(i):制备附加到核酸分子(基因型)的结合实体(即表型)的体外展示文库一该步骤可按照制备这样的体外展示文库的已知现有技术制备；(ii):制备包含附加到核酸分子(基因型)的靶标(即表型)的结构一该步骤可按照制备这样的结构的已知现有技术制备；和其中，本发明所述的方法可以视为特征在于:(iii):结合步骤在溶液(例如在含水条件下)中进行；(iv):使用合适的体外区室化系统(例如油包水乳液系统)产生比靶标分子更多的单独的区室；(V):融合共区室化的靶标和结合实体基因型；(vi):去区室化；获得融合的基因型的富集体(体外展示文库中的阳性结合物比未结合物具备更高的融合倾向)；和(vii):可选地，例如纯化和/或优选扩增融合的基因型。基于本发明的详细描述和公知常识——本领域技术人员可以多种不同的方式执行步骤(iii)至步骤(vi )。步骤(vii)是可选步骤一如本发明所述人们一旦获得步骤(Vi)的富集文库即可按照现有技术以不同方式使用该文库一例如富集文库可被看做富集体外展示文库，例如可用于第二轮的选择/富集或人们可以直接从步骤(vi)的富集文库鉴定感兴趣的特定结合实体的结构。正如上面所讨论的一本发明相关所谓的IVC现有技术一可描述为:组a)—其中表型活性在区室化步骤之后查询；或组b)——其中表型活性在区室化步骤之中查询。显而易见的，从上述和如本发明进一步讨论的一本发明所述的方法从概念上与这样所谓的IVC现有技术不同一例如基于第一方面的步骤(iii)被查询的表型活性，其在第一方面的区室化步骤(iv)之前。一种简单的方式来解释本发明所述新方法的原理是，展示文库的未结合物随机分布于区室并因此以随机的方式与靶标共区室化，其频率基于区室的数量和靶标分子的数量的比例。相反，基于结合活性，结合物会与靶标分子共区室化——独立于区室的数量和靶标分子的数量的比例。因此，当区室的数量和靶标分子的数量的比例大于I时结合物的富集得以实现——比例越高富集得越高。本发明的附图1和2提供本发明所述新方法的示例性实施例。本发明的实施例1和2提供本发明相关的例如结合实体和感兴趣的靶标的数量的实例——可以从实施例1和2的结论看出——人们可以通过本发明所述的方法从文库中获得例如1000倍富集的结合物。因此，本发明的第一方面涉及一种方法，一种制备富集文库的方法，所述富集文库包含允许鉴定至少一种结合实体的特定核酸序列信息，所述结合实体结合至少一种靶标，其中所述特定结合实体已存在于体外展示文库并且其中所述方法包括下述步骤:(i):制备至少100种不同结合`实体(Bn (n=100或更多)的体外展示文库，其中每个结合实体附加到核酸分子，所述核酸分子包括允许鉴定结合实体的特定核酸序列信息——即人们一旦知晓所述核酸分子的所述特定核酸序列信息即可直接知晓附加到所述核酸分子的所述特定结合实体的结构一附加到所述核酸分子(基因型)的所述结合实体(即表型)的所述结构本发明称为B-结构。(ii):制备具有附加到核酸分子的至少一种靶标Tn (n=l或更多)的核酸分子，所述核酸分子包括允许鉴定所述特定靶标的特定核酸序列信息，其中所述靶标能够结合存在于步骤(i)的文库的至少一种结合实体一附加到所述核酸分子(基因型)的靶标(即表型)的结构本文中称为T-结构；并且其中所述方法特征在于:(iii):在结合条件下，将包括X (X是大于IO4的数)个步骤(i)的文库的B-结构的溶液与包括Y (Y是大于IO2的数)个步骤(ii)的T-结构的溶液混合，所述条件是含有能够结合靶标分子的结合实体的B-结构与含有不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构，并且其中人们得到至少一种结合实体与至少一种靶标的结合，从而生成包含B-结构结合到T-结构的复合物(本文中称为Bgg5T-结构)；(iv):应用体外区室化系统——在结合条件下，所述条件是含有能够结合靶标分子的结合实体的B-结构与包括不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构——其中，在B-结构、T-结构和Bgg5T-结构随机进入单独的区室的条件下，所述区室化系统包括的单独的区室为步骤(iii)存在的Y个T-结构的至少2倍；和
(V):融合同时存在于相同单独的区室里的B-结构和T-结构的核酸分子一即融合所述B-结构的核酸分子至所述T-结构的核酸分子——这个结构本文中称为BT8^-结构，所述BT融合-结构包括允许鉴定步骤(i )所述结合实体的特定核酸序列信息和允许鉴定步骤(ii)所述特定靶标的特定核酸序列信息；和(vi):组合步骤(V)的所述单独的区室的内容物，以得到BTa合-结构文库，该步骤在以下条件下进行:其中没有B-结构和T-结构的核酸分子的融合——即在步骤(V)中没有生成任何新的BT8^-结构，其中所述文库是与源自靶标与结合实体的未结合对的BTa
结构相比，为源自靶标与结合实体的结合对的BT8^-结构种类的富集文库。本发明所述的第一方面的所述方法可称为通过共区室化的富集(ECC)。本发明所述的ECC方法的优点在于重要结合特征的富集可为分离而优化一因为
ECC是同质性测试(homogenous assay)-祀标没有固定于固相载体。现有技术方法是
异质性的——依赖于靶标固定于固相载体(例如珠、柱、小室、塑料、滤器等)。与同质性测试相比，异质性测试是极其难于控制的，因为例如亲和力效应、涂层密度和固相载体本身对测试的干扰。正如上面所讨论的，在本发明相关体外展示技术的现有技术(例如上述提到的现有技术)里一在体外展示文库里选择存在的合适的结合实体在现有技术中通常在所述展示结合事件之前或之后通过固定靶标(例如受体)于固相载体(例如玻璃盘、柱、珠、硝酸纤维素滤器、小室等)来进行。未结合物和低亲和力结合物通常被洗脱掉，而富集的结合物群体从固相载体上回收。因此，本领域技术人员所理解的，当本发明上述相关现有技术方法“依赖于靶标固定于固相载体”可被本领域技术人员以下述方式所理解，选择合适的结合实体依赖于这种固定靶标于固相载体作为获得选择合适的结合实体的要素。对本领域技术人员显而易见的是，第一方面所述的方法不是依赖于靶标固定于固相载体的这样的现有技术方法，因为所述结合实体的选择是基于第一方面的步骤(iv)所要求的所述Bgg5T-结构分离进入所述单独的区室的。基于上述讨论和作为本领域技术人员所理解的一在第一方面的所述方法中人们可以从理论上想象一种情形，其中所述靶标步骤(ii)的T-结构是例如包含珠的。理论上可以是T-结构，其中靶标结合至珠并且包含允许鉴定步骤(ii)的所述T-结构的特定靶标的所述特定核酸序列信息的所述特定核酸分子然后也结合至珠。对本领域技术人员显而易见的是——这种包含珠的特别的T-结构将不会改变第一方面的所述方法不是一种方法的事实，其中选择合适结合实体这种祀标固定于固相载体。基于上述讨论和在上下文中为本领域技术人员所理解的，所述第一方面的所述方法可被看做一种方法，其意味着所述B T-结构(即所述靶标结合实体复合物)在所述第一方面的步骤(iv)的所述单独的/分离的区室里保持悬浮于溶液中。ECC允许在分离状态中优化结合实体结合靶标的主要结合特征。例如效力(亲和性)、关联速率(结合速率)或结合实体和靶标的解离半衰期(解离速率)。基于亲和力的选择通过使用平衡条件实现并由所述混合步骤(结合步骤)中的所述靶标浓度控制，即所述展示文库中Kd比所述靶标浓度小10倍的的结合实体的90%的分子是靶标结合的，而Kd与所述靶标浓度相同的结合实体的50%的分子是靶标结合的，以及Kd比所述靶标浓度小10倍的结合实体的10%的分子是靶标结合的。因此，亲和富集很容易通过所述混合步骤的所述靶标浓度进行控制。本发明一个单独的方面涉及所述第一方面的步骤(vi)的富集文库并且其可通过所述第一方面的所述方法或本发明所述第一方面的相关实施方案获得。本发明的实施方案描述如下，仅通过实施例的方式。

凰1:本发明所述方法的原理的原理的示例性实施例。Ml:本发明所述方法的原理的原理的示例性实施例——它是一个示例性实施例其中乳状液PCR用于所述第一方面的所述融合步骤(V )。此处显示的是描述于EP1809743B1 (Vipergen)中的体外展示技术的实施例——可从图3中看出——这个实施例的所述选择步骤是通过固定靶标(例如受体)于固体表面(例如珠或玻璃盘)实施的。图4-7:这些图是本发明实施例中进一步讨论的。发明详述体外展示文库——第一方面的步骤(i )术语“体外展示文库”应当按照现有技术理解一即作为包括大量不同结合实体的文库，其中每个结合实体附加到核酸分子并且所述核酸分子包括允许鉴定所述结合实体的特定核酸序列信息一即人们一旦知晓所述核酸分子的所述特定核酸序列信息即可直接知晓附加到所述核酸分子的所述特定结合实体的结构一附加到所述核酸分子(基因型)的所述结合实体(即表型)的所述结构本发明称为B-结构。如本发明所讨论的一现有技术描述了大量制备这种体外展示文库的不同方法——即步骤(i)的体外展示文库。换句话说，今天正确制备附加到所述核酸分子(基因型)的所述结合实体(即表型)的结构对于本领域技术人员来说是常规工作——即所述结构本发明称为“B-结构”。正如本领域已知的——结合实体(即表型)可通过例如共价结合或例如高亲和性非共价结合被附加到所述核酸分子(基因型)。本发明优选的是所述结合实体(即表型)通过共价结合被附加到所述核酸分子(基因型)。步骤(i )的体外展示文库包括大量不同的B-结构一即上述的制备步骤(i )的体外展示文库对于本领域技术人员来说是常规工作。本发明中合适的实例包括例如EP1809743B1 (Vipergen)，EP1402024B1(Nuevolution),EP1423400B1 (David Liu), Nature Chem.Biol.(2009)，5:647-654(Clark),W000/23458 (Harb ury),Nature Methods (2006),3 (7)，561-570，2006(Miller) , Nat.Biotechnol.2004; 22, 568 - 574 (Melkko)，Nature.( 1990) ; 346(6287)，818-822 (Ellington)或 Proc Natl Acad Sci USA (1997).94 (23): 12297 - 302(Roberts)。换句话说，第一方面的步骤(i)的所述体外展示文库可通过现有技术所述的大量方式制备得到。不限于理论一本发明合适的体外展示文库技术的实例包括DNA编码化学文库技术、适体(Aptamer)技术、RNA/DNA展示技术例如CIS展示、核糖体展示、mRNA展示或珠展示系统(使用核酸用于编码)。如现有技术所述(参见例如EP1809743B1 (Vipergen))——所述B-结构的所述核酸分子可以是例如PNA、LNA、RNA、DNA或它们的组合。优选地，所述B-结构的所述核酸分子是DNA。在本发明的一个优选的实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可为双链核酸分子。在本发明的一个优选的实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可为至少0%双链(即单链)，可为至少10%双链、至少20%双链、至少30%双链、至少40%双链、至少50%双链、至少60%双链、至少70%双链、至少80%双链、至少90%双链或100%双链。在本发明的一个优选的实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可包含一个 PCR引发位点或其一部分。在本发明的一个优选的实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可包含两个PCR引发位点或其一部分。在本发明的一个优选的实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可包含至少三个PCR引发位点或其一部分。在本发明的一些实施方案中，PCR引发位点的部分包括至少5个核酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸或至少20个核苷酸。在本发明的一些实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可包含与所述B结构的所述基因型的单链悬反向互补的单链悬。在本发明的一些实施方案中，所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)可包含与所述B结构的所述基因型的单链悬反向互补的单链悬。所述单链悬可优选为I个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸长。结合实体所述结合实体可为感兴趣的任何合适的结合实体。第一方面步骤(i)的记载“至少100种不同的结合实体(Bn (n=100或更多)”。在实践中，在步骤(i)的文库中可存在更多倍多种不同结合实体——例如至少104、至少IO5或至少IO6种不同结合实体——即η=至少ΙΟ4、η=至少IO5或η=至少106。因此，理论上，其中所述文库包括确切的IO4种不同结合实体一此处可将这个表达为 Bn (η=104)*Β104。不限于理论地，可能很难制备有超过102°种不同结合实体的文库。合适的实例可以是其中所述结合实体是选自下列组成的组中的至少一种结合实体:蛋白质、多肽、核酸和化合物(优选平均分子量MW低于10000道尔顿的小化合物，更优选平均分子量MW低于5000道尔顿，更加优选平均分子量MW低于1000道尔顿)。本发明相关结合实体(例如化合物)的合适的实例可被发现于现有技术一参见例如 EP1809743B1 (Vipergen) , EP1402024B1 (Nuevolution) , EP1423400B1 (DavidLiu), Nature Chem.Biol.(2009),5:647-654 (Clark), W000/23458 (Harbury), NatureMethods (2006),3 (7) , 561-570, 2006 (Miller) , Nat.Biotechnol.2004; 22, 568 - 574(Melkko) ,Nature.(1990) ; 346 (6287) , 818-822 (Ellington)或 Proc Natl Acad SciUSA (1997).94 (23):12297 - 302 (Roberts)。总之，本领域技术人员知晓在上下文中可感兴趣的大量不同可能的结合实体。第一方面的步骤(ii)如本发明所述一祀标应当能够结合步骤(i)的所述文库中存在的至少一种结合实体一否则它不是一个能用于鉴定结合至少一种靶标的特定结合实体的合适的靶标。基于上述讨论一今天正确附加靶标(即表型)到核酸分子(基因型)对于本领域技术人员来说是常规工作并从而制备附加到所述核酸分子(基因型)的所述靶标(即表型)的结构——即在本发明中称为“τ-结构”。换句话说，人们可以基于例如上面所讨论的制备步骤(i)的所述体外展示文库的相同的现有技术制备本发明相关“T-结构”。正如本领域已知的——靶标(即表型)可通过例如共价结合或例如高亲和性非共价结合被附加到所述核酸分子(基因型)。本发明中可优选所述靶标(即表型)通过共价结合附加到所述核酸分子(基因型)。

第一方面步骤(i)记载“至少一种靶标Tn (n=l或更多)”。如本发明所述——本发明所述方法的优点是人们可以有效和快速的方式同时筛选可能结合例如2种或更多靶标的结合实体。例如一所述靶标可以是2种不同受体分子，然后本发明所述方法可同时鉴定结合受体之一的一种结合实体和结合另一种受体的另一种结合实体。在上面的实施例(2种不同例如受体靶标)里我们可以有一种情况，其中所述靶标Tn (n=2)或可选地表述为T2。基于上述讨论一可能相关的是在步骤(ii)中有至少2种不同靶标(即Tn (n=2或更多)、或在步骤(ii)中有至少3种不同靶标(即Tn (n=3或更多)、或在步骤(ii)中有至少10种不同祀标(即Tn (n=10或更多)、或在步骤(ii)中有至少100种不同祀标(即Tn(n=100或更多)。不限于理论的，很难在步骤(ii)中有多于100.000种不同靶标一即超过100.000种不同T-结构。如现有技术(参见例如EP1809743B1 (Vipergen))所述——所述T-结构的所述核酸分子可以是例如PNA、LNA、RNA、DNA或它们的组合。优选地，所述T-结构的所述核酸分子是DNA。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可为至少5个核苷酸长、至少10个核苷酸长、至少20个核苷酸长、至少30个核苷酸长、至少40个核苷酸长、至少50个核苷酸长、至少60个核苷酸长、至少70个核苷酸长、至少80个核苷酸长、至少90个核苷酸长、至少100个核苷酸长、至少200个核苷酸长、至少300个核苷酸长、至少400个核苷酸长或至少500个核苷酸长。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可为双链核酸分子。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可为至少5个碱基对长、至少10个碱基对长、至少20个碱基对长、至少30个碱基对长、至少40个碱基对长、至少50个碱基对长、至少60个碱基对长、至少70个碱基对长、至少80个碱基对长、至少90个碱基对长、至少100个碱基对长、至少200个碱基对长、至少300个碱基对长、至少400个碱基对长或至少500个碱基对长。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可为至少0%双链(即单链)，可为至少10%双链、至少20%双链、至少30%双链、至少40%双链、至少50%双链、至少60%双链、至少70%双链、至少80%双链、至少90%双链或100%双链。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含一个PCR引发位点或其一部分。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含两个PCR引发位点或其一部分。在本发明的一个优选的实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含至少三个PCR引发位点或其一部分。在本发明的一些实施方案中,PCR弓丨发位点包括至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少 18个核苷酸、至少19个核苷酸或至少20个核苷酸。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含与所述T结构的所述基因型的单链悬反向互补的单链悬。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含与所述T结构的所述基因型的单链悬反向互补的单链悬。所述单链悬可优选为I个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸长。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含对每个靶标分子特异的独特序列(独特分子标识一UMI )。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含对每种靶标分子特异的独特序列(独特分子标识一UMI)，其由至少16个N (N=A, C、G或T)、至少17个N、至少18个N、至少19个N、至少20个N、至少21个N、至少22个N、至少23个N、至少24个N、至少25个N、至少26个N、至少27个N、至少28个N、至少29个N或至少30个N组成。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含对每种靶标分子特异的独特序列(独特分子标识一UMI)，其由连续的序列组成。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含对每种靶标分子特异的独特序列(独特分子标识一UMI)，其由不连续的序列组成。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含不同于第二靶标的第二基因型序列的第一序列(允许多重PCR(multiplexing))。在本发明的一些实施方案中，所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)可包含不同于第二靶标的第二基因型序列的第一序列(允许多重PCR)，其中所述第一和第二靶标基因型包含不同PCR引发位点。麵所述靶标可以是任何感兴趣的合适的靶标。在本发明的一个优选的实施方案中——促进鉴定所需性质的结合实体的富集的特定富集方法包括不限于:富集附加靶标分子的核酸。这种方法中所述靶标分子是例如DNA、RNA、蛋白、碳水化合物、有机或无机分子。正如现有技术已知的一合适的靶标可以存在于例如人体的例如受体分子并且人们将会对鉴定能够结合所述受体的结合实体(例如化合物)感兴趣。按照现有技术一合适的实例可为其中所述靶标是DNA、RNA、蛋白、碳水化合物、有机或无机分子或其片段。按照现有技术一合适的实施例可为其中所述靶标是自身抗原、细菌蛋白、血蛋白、细胞粘附蛋白、细胞因子、细胞骨架蛋白、DNA-结合蛋白、发育蛋白、工程蛋白、酶、细胞外基质蛋白、GTP-结合蛋白调节剂、糖蛋白、生长因子、热休克蛋白、脂蛋白、膜蛋白、金属蛋白、马达蛋白、磷蛋白、朊病毒、蛋白质复合物、蛋白结构域、RNA-结合蛋白、受体、重组蛋白质、种子贮藏蛋白、结构蛋白、转录`共调节蛋白、转运蛋白、病毒蛋白或其片段。总之，本领域技术人员知晓在上下文中可感兴趣的大量不同可能的靶标。第一方面的步骤(iii):在本发明图1的所述示例性实施例中一该步骤(iii)对应于步骤“I结合”。正如上面所讨论的-步骤(iii)记载:“混合包括X (X是大于IO4的数)个步骤(i)的文库的B-结构的溶液”术语相关于B-结构的数量的“X”应当理解为步骤(i)的文库的B-结构的总数量。例如-如果所述文库包括100种不同结合实体(Bn (n=100))并且每种所述100
种不同B-结构有100个拷贝，那么数量“X”等于100X 100=104。在实践中，数量X可以高很多倍一例如，如果所述文库包括IO6种不同结合实体[Bn Cn=IO6)]并且每种所述IO6种不同B-结构有IO4个拷贝，那么数量“X”等于IO6XIO4=IOi0o正如上面所讨论的-步骤(iii)记载:“包括Y (Y是大于IO2的数)个步骤(ii)的T-结构的溶液”术语相关于T-结构的数量的“Y”应当理解为步骤(ii)的文库的T-结构的总数量。例如一如果步骤(ii)仅有I种靶标[Tn (n=l)]并且每种所述T-结构有IO2个拷贝，那么数量“Y”等于I XlO2=IO2t5
正如上面所讨论的一人们可以有例如2种不同靶标(例如两种不同受体分子)一在这种情况下步骤(ii)可以有两种靶标[Tn (n=2)]并且如果每种所述两种不同T-结构有IO2个拷贝，那么数量“Y”等于2X 102=200。在实践中，人们可以有相关T-结构特别多的拷贝——这种情况的原因是人们可能想要相关T-结构的大量拷贝以提高T-结构上所述靶标结合B-结构的所述结合实体的可能性。因此，在优选的实施方案中，有至少10°、至少101、至少102、至少103、至少104、至少105、至少106、至少107、至少108、至少109、至少1010、至少1011、至少1012、至少1013、至少1014、至少IO15或至少IO16个感兴趣的T-结构拷贝。本发明所述的ECC方法的优点在于重要结合特征的富集可为分离而优化一因为
ECC是同质性测试(homogenous assay)-祀标没有固定于固相载体。现有技术方法是
异质性的——依赖于靶标固定于固相载体(例如珠、柱、小室、塑料、滤器等)。与同质性测试相比，异质性测试是极其难于控制的，因为例如亲和力效应、涂层密度和固相载体本身对测试的干扰。ECC允许在分离状态中优化结合实体结合靶标的主要结合特征。例如效力(亲和性)、关联速率(结合速率)或结合实体和靶标的解离半衰期(解离速率)。基于亲和力的选择通过使用平衡条件实现并由所述混合步骤(结合步骤)中的所述靶标浓度控制，即所述展示文库中Kd比所述靶标浓度小10倍的结合实体的90%的分子是靶标结合的，而与所述靶标浓度相同Kd的结合实体的50%的分子是靶标结合的，以及Kd比所述靶标浓度小10倍的结合实体的10%的分子是靶标结合的。因此，亲和富集很容易通过所述混合步骤的所述靶标浓度进行控制。在本发明的一个优选的实施方案中——在所述“混合步骤(iii)”中T-结构的浓度为至少1(Γ15Μ、至少1(Γ14Μ、至少1(Γ13Μ、至少1(Γ12Μ、至少1(ΓηΜ、至少ΙΟ,Μ、至少1(Γ9Μ、至少1(Γ8Μ、至少1(Γ7Μ、至少1(Γ6Μ、至少1(Γ5Μ、至少1(Γ4Μ或至少1(Γ3Μ。另外，基于关联速率的选择通过控制混合步骤(iii)允许的时间来实现一因此，所述“混合步骤”可以比达到结合平衡条件所需的时间更短的时间周期来进行。步骤(iii)记载:“在结合条件下，所述条件是含有能够结合靶标分子的结合实体的B-结构与含有不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构，并且其中人们得到至少一种结合实体与至少一个靶标的结合，从而生成包含B-结构结合到T-结构的复合物(本文中称为Bgg5T-结构)”术语“更有效地结合”应当按照普通实践理解，例如更高的亲和力、更快的结合速率或更低的解离速率。正如本领域技术人员已知的——在上下文中在条件下执行步骤(iii)对本领域技术人员来说是常规工作，其中人们得到这个“更有效地结合”的效果。例如一人们可以通过例如使用在步骤(iii )的所述结合条件下B和T-结构基因型基本上不结合(例如通过碱基对杂交)很容易地获得这种“更有效地结合”效果——对本领域技术人员显而易见的是这可例如通过使用例如没有或有非常小的单链碱基重叠作为B和T-结构的基因型的双链DNA来获得。
优化步骤(iii)的所述结合条件以获得所需的步骤(iii)的“更有效地结合”对于本领域技术人员来说是常规工作。正如本领域技术人员已知的——本发明相关优化参数可以是例如离子强度、温度
坐寸ο因此，在任何本发明相关实际情况中一无论本领域技术人员(在例如所述结合条件的适当的常规调整之后)在步骤(iii)的结合条件下工作与否，他将不会有任何合理的疑问。在优选的实施方案中，步骤(iii)在结合条件下进行，其中包含能够结合靶标分子的结合实体的B-结构，比包含不能够结合相同靶标的包含结合实体的B-结构可以10倍(更优选100倍、更加优选1000倍)更有效结合相应T-结构。步骤(iii_b)-稀释步骤-优选实施方案:在本发明图1的所述示例性实施例中一该可选步骤(ii1-b)对应于所述步骤“2稀释”。所述混合步骤(iii)可优选随后的稀释步骤一本发明术语称为步骤(ii1-b)并在所述第一方面的步骤(iv)之前执行。因此，在所述第一方面的一个优选实施方案中，包括额外的在所述第一方面的步骤(iv)之前执行的步骤(ii1-b),
包括:(ii1-b):在结合条件下稀释步骤(iii)的所述溶液至少2倍，所述条件是包含能够结合靶标分子的结合实体的B-结构与包含不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构。引入的所述稀释溶液和所述稀释步骤(ii1-b)的所述条件(如温度)可与所述混合步骤(iii)的所述结合条件不同一但上述效果应当在稀释步骤(ii1-b)中得以保持。步骤(i i 1-b )中可优选步骤(iii)的所述溶液被稀释至少IO2倍、或步骤(i i i )的所述溶液被稀释至少IO3倍、或步骤(iii)的所述溶液被稀释至少IO4倍、或步骤(iii)的所述溶液被稀释至少IO5倍、或步骤(iii)的所述溶液被稀释至少IO6倍、或步骤(iii)的所述溶液被稀释至少IO7倍、或步骤(iii)的所述溶液被稀释至少IO8倍或步骤(iii)的所述溶液被稀释至少IO9倍。该稀释步骤的优点在于富集可基于所述BT结构的解离半衰期来执行并很容易通过稀释度和孵育时间来控制。当步骤(iii)的所述混合溶液被稀释时，结合实体和靶标的结合(biding)是不太可能发生的事情即“未结合事件”一所述解离速率(所述解离半衰期)独立于稀释。所以，在极稀溶液(T-结构浓度<〈Kd)中基本上只会发生解离。因此，所述BT-结构的解离半衰期富集很容易通过稀释度和孵育时间控制。所述解离半衰期与亲和力一起对结合实体的可用性非常重要。其中最引人注目的是，对于有效新药的开发来说，高亲和力和长解离半衰期是药理作用的关键参数(NatureReviews Drug Discovery (2006)5，730-739，(Copeland))。因此，本新发明的所述方法以前所未有有效的和可控的方式在这两个参数上富集。此外，这两个参数可以彼此独立地控制。第一方面的步骤(iv):
查看这个步骤的简单方式是步骤(iii)的结合实体与靶标的所述结合“转变”成B-结构和T-结构的共区室化。该步骤(iv)的所述条件应当是给出与步骤(iii)的所述效果一致的效果的“结合条件下”一参见上文。在本发明图1的所述示例性实施例中一该可选步骤(ii1-b)对应于所述步骤“3乳化w/o”。第一方面的步骤(iv)进一步记载:“其中区室化系统包括的单独的区室为步骤(iii)存在的Y个T-结构的至少2倍”本发明中这可看做本发明所述方法的一个重要步骤一即“单独的区室为步骤
(iii)存在的Y个T-结构的至少2倍”是重要的。本发明所述图1中一所述体外区室化系统可以是例如油包水乳液系统一如本发明下面进一步讨论的，合适的油包水乳液系统是本领域众所周知的。在图1的理论假设的示例性实施例中步骤(ii)仅有I种靶标[Τη (n=l)]并且每种所述T-结构有3个拷贝——即数量“Y”是3。因此，在图1的理论假设的示例性实施例中所述体外区室化系统里应当有至少(2X3)=6个单独的区室(例如油滴)一请注意本发明图1中有少于30个单独的区室(SP图1仅是本发明所述方法的一些因素的示例)。正如上面所讨论的——在实践中可有例如至少IO4个感兴趣的T-结构的拷贝一即在这种情况下Y可为IO4并且在这种情况下所述体外区室化系统里应当有至少(2X IO4) =2X IO4个单独的区室(例如油滴)。这个“单独的区室为步骤(iii)存在的Y个T-结构的至少2倍”的优点在于所述展示文库中未结合物随机分布于所述区室并因此以随机的方式与所述靶标共区室化，其频率依赖于区室的数量和靶标分子的数量的比例(在这种情况下为I比10，而由于其结合活性，结合物会独立于区室的数量和靶标分子的数量的比例(在这个理想情况下I比I)与靶标分子共区室化。因此，在这种情况下当与未结合物相比结合物富集2倍。基于上述讨论，人们可以说如果在所述体外区室化系统中相应有更多单独的区室人们可以获得更好的富集一因此，在一个优选的实施方案中，“单独的区室为步骤(iii)存在的Y个T-结构的至少10倍”、更优选“单独的区室为步骤(iii)存在的Y个T-结构的至少100倍”、更优选“单独的区室为步骤(iii)存在的Y个T-结构的至少10000倍”、更优选“单独的区室为步骤(iii)存在的Y个T-结构的至少100000倍”、更优选“单独的区室为步骤(iii)存在的Y个T-结构的至少1000000倍”。在本发明的一个优选的实施方案中，所述区室数量大于步骤(iii)的T-结构的所述 Y 数量的 2、5、10、50、100、1000、5000、10000、50000、100000、500000、1000000、5000000 或10000000 倍。第一方面步骤(iv)进一步记载:“在其中B-结构、T-结构和BT-结构随机进入单独的区室的条件下”这应当为本领域技术人员理解将在上下文中理解的——其涉及，为了获得本发明的有利富集，人们所需的条件，其中所述B-结构、T-结构和BT-结构随机进入单独的区室。换句话说——在任何给定的区室中的被区室化的任何B-结构、T-结构和BT-结构的倾向依赖于所述区室的体积和总体积。换句话说——如果几乎所有的B-结构、T-结构和BT-结构仅进入一个特定的单独的区室人们将显然不会得到上述讨论的有利富集。如下所讨论的一如果人们例如使用合适的油包水乳液系统作为所述体外区室化系统，人们能够很容易地确定条件，其中所述B-结构、T-结构和BT-结构随机进入单独的区室(例如单独的油滴)一其实难以确定如下不是随机的条件一即其中几乎所有的B-结构、T-结构和BT-结构仅进入一个特定的单独的区室(例如单独的油滴)。在步骤(iv)的一个优选实施方案中一一单独的区室为步骤(iii)中的B-结构的所述X数量的至少10的平方根(3.16)倍。泊松分布用于假定描述所述区室中B-结构的分布。这意味着所有区室具有相同的体积。具有n=0、l、2或更多B-结构分子的区室的概率可通过下式进行计算:
权利要求
1.一种制备富集文库的方法，所述富集文库包含允许鉴定至少一种结合实体的特定核酸序列信息，所述结合实体结合至少一种靶标，其中所述特定结合实体已存在于体外展示文库，并且其中所述方法包括下述步骤: (i):制备至少100种不同结合实体(BnCn=IOO或更多)的体外展示文库，其中每个结合实体附加到核酸分子，所述核酸分子包括允许鉴定结合实体的特定核酸序列信息——即人们一旦知晓所述核酸分子的所述特定核酸序列信息即可直接知晓附加到所述核酸分子的所述特定结合实体的结构一附加到所述核酸分子(基因型)的所述结合实体(即表型)的所述结构在本文中称为B-结构。
(ii):制备具有附加到核酸分子的至少一种靶标Tn(n=l或更多)的核酸分子，所述核酸分子包括允许鉴定所述特定靶标的特定核酸序列信息，其中所述靶标能够结合存在于步骤(i )的文库的至少一种结合实体一附加到所述核酸分子(基因型)的靶标(即表型)的结构在本文中称为T-结构；并且其中所述方法特征在于: (iii):在结合条件下，将包括X(X是大于IO4的数)个步骤(i)的文库的B-结构的溶液与包括Y (Y是大于IO2的数)个步骤(ii)的T-结构的溶液混合，所述条件是含有能够结合靶标分子的结合实体的B-结构与含有不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构，并且其中人们得到至少一种结合实体与至少一种靶标的结合，从而生成包含B-结构结合到T-结构的复合物(本文中称为Bgg5T-结构)； (iv):应用体外区室化系统——在结合条件下，所述条件是含有能够结合靶标分子的结合实体的B-结构与包括不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构——其中，在B-结构、T-结构和Bgg5T-结构随机进入单独的区室的条件下，所述区室化系统包括的单独的区室为步骤(iii)存在的Y个T-结构的至少2倍；和 (V):融合同时存在于相同单独的区室里的B-结构和T-结构的核酸分子一即融合所述B-结构的核酸分子至所述T-结构的核酸分子——这个结构本文中称为BT8^-结构，所述BT8^-结构包括允许鉴定步骤(i)所述结合实体的特定核酸序列信息和允许鉴定步骤(ii)所述特定靶标的特定核酸序列信息；和 (vi):组合步骤(V)的所述单独的区室的内容物，以得到BT8^-结构文库，该步骤在以下条件下进行:其中没有B-结构和T-结构的核酸分子的融合——即在步骤(V)中没有生成任何新的BT8^-结构，其中所述文库是与源自靶标与结合实体的未结合对的BT8^-结构相比，为源自靶标与结合实体的结合对的BT8^-结构种类的富集文库。
2.权利要求1的方法，其中步骤(i)的结合实体(即表型)通过例如共价结合附加到所述核酸分子(基因型)，并且其中步骤(ii)所述靶标(即表型)通过共价结合附加到所述核酸分子(基因型)，并且其中所述B-结构的所述核酸分子是DNA，所述T-结构的所述核酸分子是 DNA。
3.权利要求2的方法，其中所述B-结构中的所述DNA核酸分子(基因型)是双链核酸分子，并且其中所述T-结构中的所述DNA核酸分子(基因型)是双链核酸分子。
4.前述任一项权利要求的方法，其中所述B-结构中附加到所述结合实体(表型)的所述核酸分子(基因型)含有PCR引发位点，并且其中所述T-结构中附加到所述靶标(表型)的所述核酸分子(基因型)含有PCR引发位点。
5.前述任一项权利要求的方法，其中步骤(i)的所述体外文库包括至少IO5种不同结合实体(即Bn (n=105)，并且其中步骤(i)的所述结合实体是平均分子量MW低于5000道尔顿的化合物。
6.前述任一项权利要求的方法，其中步骤(ii)中至少有两种不同靶标[即Tn(n=2或更多]。
7.前述任一项权利要求的方法，其中至少一种靶标是蛋白质。
8.前述任一项权利要求的方法，其中步骤(iii)中有至少IO5拷贝的感兴趣的T-结构一即“Y”是至少105，并且其中所述“混合步骤(iii)”中的T-结构的所述浓度是至少1(Γ9Μ。
9.前述任一项权利要求的方法，其中步骤(iii)在结合条件下进行，其中含有能够结合至靶标分子的结合实体的B-结构，与包含不能够结合至相同靶标的结合实体的B-结构相比，100倍有效地结合所述相应的T-结构。
10.前述任一项权利要求的方法，其中权利要求1的方法包括在权利要求1的所述步骤(iv)之前进行的额外的步骤(ii1-b),包括: (ii1-b):在结合条件下稀释步骤(iii)的所述溶液至少100倍，所述条件是包含能够结合靶标分子的结合实体的B-结构与包含不能够结合相同靶标分子的结合实体的B-结构相比更有效地结合相应的T-结构。
11.前述任一项权利要求的所述方法，其中权利要求1的步骤(iv)中的单独的区室为存在于步骤(iii)的T-结构的Y数量的至少100倍，其中权利要求1的步骤(iv)中的单独的区室为步骤(iii)的B-结构的X数量的至少10的平方根(3.16)倍。
12.前述任一项权利要求的方法，其中步骤(iv)的所述体外区室化系统是油包水乳液系统，并且其中所述平均区室体积小于10_12L。
13.前述任一项权利要求的方法，其中同时存在于权利要求1的步骤(V)的所述相同的单独区室里的B-结构和T-结构的所述核酸分子的所述融合是: (a):通过DNA连接酶完成，其形成位于3’-OH和5’磷酸基团间的磷酸二酯键；或 (b):通过使用DNA聚合酶(例如使用微乳滴PCR)。
14.权利要求12的方法，其中步骤(iv)的所述体外区室化系统是油包水乳液，其中步骤(V)的所述单独区室的所述内容物通过一种方法在权利要求1的步骤(vi)中被组合，其中所述油区室被破坏。
15.前述任一项权利要求的方法,其中存在额外的步骤(vii),其中存在于步骤(vi)的所述富集文库的BT8^-结构通过PCR扩增并随后进行DNA测序以鉴定至少一种结合至少一种感兴趣的靶标的单独的结合实体。
16.前述任一项权利要求的方法，其中存在额外的步骤(vii)，包括使用步骤(vi)的所述富集文库鉴定至少一种结合至少一种感兴趣的靶标的单独的结合实体。
17.前述任一项权利要求的方法，其中所述Bgg5T-结构在所述第一方面的步骤(iv)的所述单独区室中保持悬浮于溶液中。
18.前述任一项权利要求的方法，其中所述方法不依赖于固相载体上的靶标固定化。
全文摘要
一种制备包含允许鉴定至少一种结合至少一种靶标的结合实体的特定核酸序列信息的富集文库的方法，其中所述特定结合实体已经存在于体外展示文库中。
文档编号C12N15/10GK103119165SQ201180046388
公开日2013年5月22日申请日期2011年9月1日优先权日2010年9月27日
发明者N·J·V·汉森, A·B·克里斯滕森, L·K·拉森, F·A·斯勒克, L·K·彼得森, J·拉斯穆森-迪特沃斯特, P·布莱克斯克耶尔, T·H·汉森, J·霍尔姆奎斯特申请人:威泊根私人有限公司

2010-2011专利技术

最新回复(0)