β-葡糖苷酶变体及其编码多核苷酸的制作方法

xiaoxiao2020-6-24  3

【专利下载】Tel:18215660330

专利名称:β-葡糖苷酶变体及其编码多核苷酸的制作方法
技术领域
本发明涉及β -葡糖苷酶变体,编码所述变体的多核苷酸,产生所述变体的方法,和使用所述变体的方法。
背景技术
纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解 连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶。内
切葡聚糖酶在随机位置消化纤维素聚合物,使其暴露于纤维二糖水解酶攻击(attack)。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖的分子。纤维二糖是水溶性的β -1, 4-连接的葡萄糖二聚体。β -葡糖苷酶将纤维二糖水解成葡萄糖。将含木素纤维素原料(lignocellulosic feedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖容易地由酵母发酵成乙醇。美国专利号7,244,605公开了烟曲霉(Aspergillus fumigatus) β -葡糖苷酶及其多核苷酸。在本领域中,改善用于木素纤维素原料的酶法降解的具有β -葡糖苷酶活性的多肽是有利的。本发明提供了与其亲本相比具有改善性质的亲本葡糖苷酶的变体
发明内容
本发明涉及分离的β -葡糖苷酶变体,其在对应于SEQ ID NO:2的成熟多肽的位置89,91,100,140,186,283,456,和512的一个或多个(例如几个)位置包含取代,其中所述变体具有葡糖苷酶活性。本发明亦涉及编码所述变体的分离的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;以及产生所述变体的方法。
本发明亦涉及用于降解或转化纤维素材料的方法,其包括:在此种具有β_葡糖苷酶活性的变体的存在下用酶组合物处理所述纤维素材料。本发明亦涉及用于产生发酵产物的方法,其包括:(a)在此种具有β -葡糖苷酶活性的变体的存在下用酶组合物糖化纤维素材料;(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(C)从发酵回收所述发酵产物。本发明亦涉及发酵纤维素材料的方法,其包括用一种或多种(例如几种)发酵微生物发酵所述纤维素材料,其中所述纤维素材料是在此种具有β -葡糖苷酶活性的变体的存在下用酶组合物糖化的。


图1A和IB显不烟曲霉β _甸糖昔酶基因的基因组DNA序列和推导的氣基酸序列(分别为SEQ ID Ν0:1和2)。预测的信号肽以下划线表示,而预测的内含子斜体表示。图2显示具有不同浓度的野生型烟曲霉家族GH3Ai3-葡糖苷酶,变体L89M+G91L+F100D+I140V+I186V+S283G+N456E+F512Y,变体 L89M+G91L+I140V+I186V,和变体F100D+S283G+N456E+F512Y的里氏木霉(Trichoderma reesei)纤维素分解蛋白组合物的净葡萄糖产生。定义乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸Ct-萘酯(alpha-napthyl acetate)和乙酸对硝基苯酯(p-nitrophenyl acetate)的水解。就本发明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEEN 20(聚氧乙烯山梨坦单月桂酸酯)的50mM乙酸钠pH5.0中的0.5mM乙酸对硝基苯酯作为底物确定的。一个单位的乙酰木聚糖酯酶定义为能够在pH5,25°C每分钟释放I微摩尔对硝基苯酹阴离子(p-nitrophenolate anion)的酶量。等位变体(allelic variant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
a -L-阿拉伯呋喃糖苷酶:术语“ a _L_阿拉伯呋喃糖苷酶”意指a _L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化对a -L-阿拉伯糖苷中的末端非还原性a -L-阿拉伯呋喃糖苷残基的水解。该酶对a -L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本发明而言,a-L-阿拉伯呋喃糖苷酶活性是使用总体积200 μ I中的每ml的IOOmM乙酸钠pH5中5mg的中等粘度小麦阿拉伯木聚糖(MegazymeInternational Ireland, Ltd., Bray, C0.Wicklow, Ireland)在 4CTC进行 30 分钟,接着通过AM1NEX HPX-87H 柱层析(Bio-Rad Laboratories, Inc., Hercules, CA, USA)的阿拉伯糖分析来确定的。α -葡糖醛酸糖苷酶:术语“ α -葡糖醛酸糖苷酶”意指a _D_葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronate glucuronohydrolase) (EC3.2.1.139),其催化 a -D-葡糖醛酸糖苷水解为D-葡糖醛酸和醇。就本发明而言,α -葡糖醛酸糖苷酶活性是根据deVries, 1998, J.Bacteriol.180:243-249确定的。一个单位的α _葡糖醒酸糖苷酶等于能够在pH5,40°C每分钟释放I微摩尔葡糖醛酸或4-0-甲基葡糖醛酸的酶量。β -葡糖苷酶:术语“ β -葡糖苷酶”意指β -D-葡糖苷葡糖水解酶(beta-D-glucoside glucohydrolase) (E.C.N0.3.2.1.21),其催化末端非还原 β -D-葡萄糖残基的水解,并释放β-D-葡萄糖。就本发明而言,葡糖苷酶根据Venturi等,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophiIum:production, purification and some biochemical properties,J.BasicMicrobiol.42:55-66的方法使用对硝基苯基-β _D_葡糖吡喃糖苷作为底物确定。一个单位的β -葡糖苷酶定义为在25°C,pH4.8,在含有0.01% TWEEN 20的50mM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-葡糖吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚阴离子。β -木糖苷酶:术语“ β -木糖苷酶”意指β -D-木糖苷木糖水解酶(β -D-xylosidexylohydrolase) (E.C.3.2.1.37),其催化短 β (I — 4)木寡糖(xylooligosaccharide)的外水解以从非还原端去除连续的D-木糖残基。就本发明而言,一个单位的β_木糖苷酶定义为在40°C,pH5在含有0.01% TWEEN 20的IOOmM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-木糖苷每分钟产生1.0微摩尔对硝基苯酚阴离子。cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工包括剪接,然后作为成熟的已剪接的mRNA出现。纤维二糖水解酶:术语“纤维二糖水解酶”意指l,4-13_D-葡聚糖纤维二糖水解酶(I, 4-beta-D-glucan cellobiohydrolase) (E.C.N0.3.2.1.91),其催化纤维素、纤维寡糖,或任何包含β -1,4-连接的葡萄糖的聚合物中的1,4- β -D-糖苷键的水解,从链的还原或非还原末端释放纤维二糖(Teeri, 1997,Crystalline cellulosedegradation:New insight into the function of cellobiohydrolases,Trendsin Biotechno1gyI 5:1 60-1 67;Teeri 等,1998, Trichoderma reeseicellobiohydrolases:why so efficient on crystalline cellulose , Biochem.Soc.Trans.26:173-178)。根据 Lever 等,1972,Anal.Biochem.47:273-279 ;van Tilbeurgh等,1982,FEBS Lettersl49:152-156 ;van Tilbeurgh 和 Claeyssens, 1985,FEBSLettersl87:283-288 ;以及 Tomme 等,1988, Eur.J.Biochem.170:575-581 描述的方法确定纤维二糖水解酶活性。在本发明中,Tomme等的方法可用于确定纤维二糖水解酶活性。
纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链i3-(l_4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸衆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于 Handbook on Bioethanol (Charles E.Wyman 编),pp.105-118, Taylor&Francis, Washington D.C.;Wyman, 1994, Bioresource Technology50:3-16;Lynd, 1990, AppliedBiochemistry and Biotechno1gy24/25:695-719;Mosier 等,,1999, Recent Progressin Bioconversion of Lignocellulosics,于 Advances in Biochemical Engineering/Biotechnology, T.Scheper 主编,Volume65, pp.23-40, Springer-Verlag, New York)。在本文中应理解的是,纤维素可以是任何形式的木素纤维素,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一个优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,所述纤维素材料是木素纤维素,其包含纤维素、半纤维素和木质素。在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。在另一个方面,纤维素材料是芦竹(arundo)。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹材。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸杆。在另一个方面,纤维素材料是芒草属。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素 材料是柳枝稷(switch grass)。在另一个方面,纤维素材料是麦杆。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是揪树。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是杨树。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉线头(cotton linter)。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。在另一个方面,纤维素材料是水生生物质。如用于本文中,“水生生物质”意指在水生环境中由光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergentplant)、浮叶植物(floating-leaf plant)或沉水植物(submerged plant)。纤维素材料可以按原样(as is)使用或进行预处理,使用本领域已知的常规方法,如本文所述。在一个优选的方面,纤维素材料经预处理。纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶,纤维二糖水解酶,β_葡糖苷酶,或其组合。测量纤维素分解活性的两种基本方法包括:(I)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和β_葡糖苷酶),如 Zhang 等,Outlook for cellulase improvement:Screening and selectionstrategies, 2006, Biotechnology Advances24:452-481 所综述的。总纤维素分解活性通常是使用不溶性底物来测定的,所述底物包括Whatman N0.1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用Whatman N0.1滤纸作为底物的滤纸测定法。该测定法是由International Unionof Pure and Applied Chemistry (IUPAC) (Ghose, 1987,Measurement of cellulaseactivities, Pure App1.Chem.59:257-68)确立的。就本发明而言,纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解的增加来确定:l-50mg的纤维素分解酶蛋白/g的PCS中纤维素(或其它经预处理的纤维素材料)在合适的温度,例如50°C、55°C或60°C进行3-7日,与未添加纤维素分解酶蛋白的对照水解相比较。通常条件为:Iml反应液,经洗涤或未洗涤的PCS,5%不溶性固形物,50mM 乙酸钠pH5,ImM MnSO4,50°C、55°C或60°C,72 小时,通过AMINLX HPX-87H柱(Bio-Rad Laboratories, Inc., Hercules, CA, USA)进行糖分析。编码序列:术语“编码序列”意指直接指定变体的氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框以起始密码子如ATG、GTG或TTG开始,并且以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。调控序列(control sequence):术语“调控序列”意指对编码本发明的变体的多核苷酸表达是必需的核酸序列。各个调控序列对于编码所述变体的多核苷酸可以是天然的(即,来自同一基因)或外源的(即,来自不同基因),或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码变体的多核苷酸编码区的连接。内切葡聚糖 酶:术语“内切葡聚糖酶”意指内切-1,4-(1, 3; 1,4)-β -D-葡聚糖4-葡聚糖水解酶(endo-Ι, 4_ β -D-glucan4-glucanohydrolase) (E.C.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(Iichenin)中的l,4-13-D-糖苷键、混合的β_1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的β-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(Zhang等,2006, BiotechnologyAdvances24:452-481)确定的还原端增加来确定。就本发明而言,根据Ghose, 1987, Pureand App1.Chem.59:257-268的方法,在pH5,40°C使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。表达:术语“表达”包括涉及变体产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码变体的多核苷酸,并且所述多核苷酸与提供用于其表达的调控序列可操作地连接。家族GH3 β -葡糖苷酶:术语“家族GH3 β -葡糖苷酶”意指根据Coutinho,P.Μ.和Henrissat,B.,1999,Carbohydrate—active enzymes:an integrated database approach,于"Recent Advances in Carbohydrate Bioengineering^, H.J.Gilbert, G.Davies, B.Henrissat 和 B.Svensson 编,The Royal Society of Chemistry, Cambridge, pp.3-12 的家族3的糖基水解酶。家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定义为根据 Henrissat B., 1991, A classification of glycosyl hydrolasesbased on amino-acid sequence similarities, Biochem.J.280:309-316,及 HenrissatB.和 Bairoch A., 1996, Updating the sequence-based classification of glycosylhydrolases, Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。该家族中的酶原先基于在一个家族成员测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的,且它们无法视为真正的(bona fide)糖苷酶。然而,基于当与纤维素酶或纤维素酶的混合物一同使用时,其增强木素纤维素分解的能力,它们被保留在CAZy分类中。阿魏酸酯酶:术语“阿魏酸酯酶(feruloyl esterase) ”意指4_轻基_3_甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulic acid esterase)、轻基肉桂酰基酯酶、FAE-1I1、肉桂酸酯水解酶、FAEA、cinnAE、FAE-1或FAE-1I。就本发明而言,阿魏酸酯酶活性是使用50mM乙酸钠pH5.0中的0.5mM阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶等于能够在pH5,25°C每分钟释放I微摩尔对硝基苯酚阴离子的酶量。片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽;其中所述片段具有β_葡糖苷酶活性。在一个方面,所述片段含有SEQ ID NO:2的至少720个氨基酸残基,例如至少760个氨基酸残基,或至少800个氨基酸残基。半纤维素 分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如几种)水解半纤维素材料的酶。参见,例如Shallom, D.和Shoham, Y.Microbial hemicellulases.Current Opinion In Microbiology, 2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支化和直链多糖的混杂集团,这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为鲁棒(robust)的网络。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(GH),或水解乙酸或阿魏酸侧基的酯连接的糖酯酶(CE)。这些催化模块,基于其一级结构的同源性,可指派为GH和CE家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,GH-A)。最具信息性和最新的这些和其他糖活性酶的分类可在Carbohydrate-Active Enzymes (CAZy)数据库获得。半纤维素分解酶活性可根据Ghose和Bisaria, 1987, Pure&Appl.Chem.59:1739-1752 在合适的温度,例如 50°C、55°C或 60°C,和pH,例如5.0或5.5进行测量。
高严格条件:术语“高严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在65°C将载体材料最终洗涤三次,每次15分钟。宿主细胞:术语“宿主细胞”意指任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖任何亲本细胞的后代,其由于在复制中发生的突变而不同于亲本细胞。增加的比活性:术语“增加的比活性”意指与亲本的每分子或微摩尔的酶活性相比更高的变体的每分子或微摩尔的酶活性。变体相对于亲本的增加的比活性可例如在一种或多种(例如几种)pH、温度、底物浓度和产物抑制剂(例如葡萄糖)浓度的条件下进行评估。在一个方面,所述条件是pH。举例而言,所述pH可为3至7范围的任何pH,例如3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,或7.0 (或其之间)。可使用任何用于取得所需pH的合适缓冲液。在另一个方面,所述条件是温度。举例而言,所述温度可为25°C至90°C范围的任何温度,例如 25,30,35,40,45,50,55,60,65,70,75,80,85,或 90 (或其之间)。在另一个方面,所述条件是底物浓度。举例而言,所述底物浓度可为ImM至IOOmM范围的任何底物浓度,例如ImM,10mM,25mM,50mM,75mM,或IOOmM(或其之间)。底物的实例包括但不限于纤维二糖、纤维三糖、纤维四糖、β_龙胆二糖、昆布二糖(Iaminaribose)或槐糖。在另一个方面,所述条件是产物抑制剂浓度。举例而言,所述产物抑制剂浓度可为ImM 至 120mM 范围的任何浓度,例如 ImM,10mM,25mM,50mM,75mM,IOOmM,或 120mM(或其之间)。产物的实例包括但不限于葡萄糖、β -D-甘露糖、β -D-山梨糖或D-葡糖醛酸。在另一个方面,使用两个或更多个(例如几个)上述条件的组合以确定变体相对于亲本的增加的比活性,如在3至7范围的pH,例如3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,或7.0(或其之间),在25°C至90°C范围的任何温度,例如25,30,35,40,45,50,55,60,65,70,75,80,85,或90°〇(或其之间)。在一个方面,相对于亲本的变体的比活性在pH4.0和25°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和30°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和35°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.0和40°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和45°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和50°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.0和55°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.0和60°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和65°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和70°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和75°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.0和80°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和85°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.0和90°C确定。
在另一个方面,相对于亲本的变体的比活性在pH4.5和25°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和30°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和35°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.5和40°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和45°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和50°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.5和55°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.5和60°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和65°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和70°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.5和75°C确定。在另一个方面,相对于亲本的变体的比活性在pH4.5和80°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和85°C确定。在另一个方面,相对于亲本的变体的比活性在PH4.5和90°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.0和25°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和30°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和35°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.0和40°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和45°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和50°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.0和55°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.0和60°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和65°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和70°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和75°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.0和80°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和85°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.0和90°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.5和25°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和30°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和35°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.5和40°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和45°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和50°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.5和55°C确定 。在另一个方面,相对于亲本的变体的比活性在pH5.5和60°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和65°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和70°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.5和75°C确定。在另一个方面,相对于亲本的变体的比活性在pH5.5和80°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和85°C确定。在另一个方面,相对于亲本的变体的比活性在PH5.5和90°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和25°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和30°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和35°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和40°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和45°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和50°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和55°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和60°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和65°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和70°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和75°C确定。在另一个方面,相对于亲本的变体的比活性在pH6.0和80°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和85°C确定。在另一个方面,相对于亲本的变体的比活性在PH6.0和90°C确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为IOmM的葡萄糖的存在下确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为25mM的葡萄糖的存在下确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为50mM的葡萄糖的存在下确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为75mM的葡萄糖的存在下确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为IOOmM的葡萄糖的存在下确定。在上述每一个方面,相对于亲本的变体的比活性可在浓度为120mM的葡萄糖的存在下确定。变体相对于亲本的增加的比活性可使用本领域中对于葡糖苷酶任何已知的酶测定法来确定。此类酶测定法包括但不限于以纤维二糖或对硝基苯基_β -D-葡糖吡喃糖苷作为底物。或者,变体相对于亲本的增加的比活性可使用任何对于变体的应用测定法来确定,其中将变体的性能与亲本相比较。举例而言,可使用实施例5中所述的应用测定法。在一个方面,所述变体的比活性是亲本的比活性至少1.01倍,例如至少1.05倍,至少1.1倍,至少1.5倍,至少1.8倍,至少2倍,至少5倍,至少10倍,至少15倍,至少20倍,至少25倍,和至少50倍高。分离的:术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(I)任何非天然存在的物质,(2)任何至少部分地从一种或多种或全部与其天然结合的天然存在的成分移出的物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)任何相对于见于自然界的该物质经人力修饰的物质;或(4)任何通过相对于与其自然结合的其他组分增加该物质的量(例如,编码该物质的基因的多拷贝;比与编码该物质的基因自然结合的启动子更强的启动子的使用)而修饰的物质。分离的物质可存在于发酵液样品中。低严格条件:术语“低严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5Χ SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在50°C将载体材料最终洗涤三次,每次15分钟。成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,根据预测SEQ ID NO: 2的氨基酸I至19是信号肽的SignalP程序(Nielsen等,1997, ProteinEngineeringlO: 1-6),成熟多肽是SEQ ID NO:2的氨基酸20至863。在本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有β -葡糖苷酶活性的成熟多肽的多核苷酸。在一个方面,根据预测SEQ ID NO:1的核苷酸I至57编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQ ID NO:1的核苷酸58至2580。在另一个方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸58至2580中含有的cDNA序列。中等严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在55°C将载体材料最终洗涤三次,每次15分钟。中等-高严格条件:术语“中等-高严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在60°C将载体材料最终洗涤三次,每次15分钟。突变体:术语“突变体”意指编码变体的多核苷酸。核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段,或其为合成的,其包含一个或多个调控序列。可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。亲本或亲本葡糖苷酶:术语“亲本”或“亲本葡糖苷酶”意指一种葡糖苷酶,对其进行改变以产生本发明的变体。所述亲本可为天然存在的(野生型)多肽或其变体,或它们的片段。具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强的多肽”意指催化具有纤维素分解活性的酶对纤维素材料的水解的增强的GH61多肽。就本发明而言,通过测量来自由纤维素分解酶在下述条件下水解纤维素材料的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤 维素分解增强活性:l_50mg总蛋白/g PCS中纤维素,其中总蛋白包含50-99.5%w/w的纤维素分解酶蛋白,及0.5-50%w/w的具有纤维素分解增强活性的多肽的蛋白质,在合适的温度,例如50°C、55°C或60°C和pH,例如5.0或5.5历时1-7天,与用等量的总蛋白加载量而无纤维素分解增强活性(l-50mg纤维素分解蛋白/g PCS中纤维素)所进行的对照水解相比。在一个优选的方面,使用在总蛋白重量的2-3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或者总蛋白质量的2_3%的烟曲霉β-葡糖苷酶(如WO 2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的CELLUCLAST 1.5L (Novozymes A/S, BagSV^rd, Denmark)的混合物作为纤维素分解活性的来源。具有纤维素分解增强活性的GH61多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。预处理的玉米秸杆:术语“PCS”或“预处理的玉米秸杆”意指通过用热和稀硫酸处理、碱预处理或中性预处理的源自玉米秸杆的纤维素材料。序列同一性:参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS: The European Molecular Biology Open Software Suite, Rice 等,2000,TrendsGenet.16:276-277),优选3.0.0、5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch 算法(Needleman 和 Wunsch, 1970, J.Mol.Biol.48:443-453)来测定。使用的参数为缺口罚分(gap penalty) 10,缺口延伸罚分(gap extension penalty)0.5和EBL0SUM62 (BL0SUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:(同样的残基X100)/(比对长度一比对中缺口的总数)就本发明而言,两个核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS: The European Molecular Biology Open Software Suite, Rice 等,2000,见上文),优选3.0.0、5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch, 1970,见上文)来测定。使用的参数为缺口罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:(同样的脱氧核糖核苷酸X100)/(比对长度一比对中缺口的总数)亚序列:术语“亚序列(subsequence) ”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如几个)核苷酸的多核苷酸;其中所述亚序列编码具有葡糖苷酶活性的片段。在一个方面,所述亚序列含有SEQ ID Ν0:1的成熟多肽编码序列的至少2160个核苷酸,例如至少2280个核苷酸,或至少2400个核苷酸。变体:术语“变体”意指在一个或多个(例如几个)位置包含改变,即取代、插入和/或缺失的具有β_葡糖苷酶活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代;缺失意指去除占据某位置的氨基酸;而插入意指在邻接并紧接着占据某位置的氨基酸之后添加氨基 酸。本发明的变体具有SEQ ID NO: 2的成熟多肽的β-葡糖苷酶的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%。非常高严格条件:术语“非常高严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5Χ SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在70°C将载体材料最终洗涤三次,每次15分钟。非常低严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在45°C将载体材料最终洗涤三次,每次15分钟。含木聚糖材料:术语“含木聚糖材料”意指任何包含含有β -(1-4)连接的木糖残基骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-0-甲基醚,L-阿拉伯糖和/或多种包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖类型的多糖可分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan),后者包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和复合杂木聚糖。参见,例如 Ebringerova 等,2005, Adv.Polym.Sc1.186:1-67。在本发明的方法中,可使用任何含有木聚糖的材料。在一个优选的方面,所述含木聚糖材料是木素纤维素。木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括:(I)测定总木聚糖分解活性,和(2)测定单独的木聚糖分解活性(例如内切木聚糖酶、β_木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醒酸酯酶(a-glucuronyl esterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中,包括 Biely 和 Puchard, Recent progress in the assays of xylanolyticenzymes, 2006, Journal of the Science of Food 和 Agriculture86(11):1636-1647 ;Spanikova 和 Biely, 2006, Glucuronoyl esterase-Novel carbohydrate esteraseproduced by Schizophyllum commune, FEBS Letters580(19):4597-4601 ;Herrmann,Vrsanska,Jurickova,Hirsch,Biely 和 Kubicek,1997,The beta-D-xylosidase ofTrichoderma reesei is a multifunctional beta—D—xylan xylohydrolase, BiochemicalJournal321:375-381。总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量,所述木聚糖包括例如燕麦小麦(oat spelt)、山毛榉木(beechwood)和落叶松木(Iarchwood)木聚糖,或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-0-甲基葡糖醛酸木聚糖产生还原糖,如 Bailey, Biely, Poutanen, 1992,Interlaboratory testing of methods for assay ofxylanase activity, Journal of Biotechnology23 (3): 257-270 中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作为底物在37°C在0.01%TRITON* X-100 (4-(I, I, 3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH6中来确定。一个单位的木聚糖酶活性定义为在37°C,pH6在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL_阿拉伯木聚糖每分钟产生1.0微摩尔天青精。就本发明而言,木聚糖降解活性是通过测量由木聚糖降解酶在下述通常条件下造成的桦木木聚糖(Sigma Chemical C0., Inc., St.Louis, MO, USA)水解的增加来确定的:Iml反应液,5mg/ 底物(总固形物),5mg木聚糖分解蛋白质/g底物,50mM乙酸钠,pH5,50 °C, 24 小时,如 Lever, 1972,A new reaction for colorimetric determination ofcarbohydrates, Anal.Biochem47:273-279所述使用对轻基苯甲酸酸餅(PHBAH)测定法进行糖分析。木聚糖酶:术语“木聚糖酶”意指1,4- β -D-木聚糖-木糖水解酶(I, 4- β -D-xylan-xylohydrolase) (E.C.3.2.1.8),其催化木聚糖中 I, 4_β -D-木糖苷键的内水解。就本发明而言,木聚糖酶活性是使用0.2%AZCL-阿拉伯木聚糖作为底物确定的。一个单位的木聚糖酶活性定义为在37°C,pH6在200mM磷酸钠pH6缓冲液中从作为底物的
0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青精。野生型多肽:术语“野生型多肽”意指由天然存在的微生物,如见于自然界的细菌、酵母或丝状真菌表达的葡糖苷酶。发明详述本发明涉及分离的多肽,其在对应于SEQ ID NO:2的成熟多肽的位置89,91,100,140,186,283,456,和512的一个或多个(例如几个)位置包含取代,其中所述变体具有β-葡糖苷酶活性。变体命名规则:就本发明而言,使用公开于SEQ ID Ν0:2中的成熟多肽以确定在其它β -葡糖苷酶中对应的氨基酸残基。将其它葡糖苷酶的氨基酸序列与公开于SEQ ID Ν0:2中的成熟多肽进行比对,并基于该比对,可以使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48 =443-453)(如用EMBOSS软件包(EMBOSS:欧洲分子生物开放软件套件(The European Molecular Biology Open Software Suite), Rice 等,2000, TrendsGenetl6:276-277)的Needle程序执行,优选为5.0.0版或之后的版本)确定SEQ ID NO: 2所公开的成熟多肽中任何氨基酸残基对应的氨基酸位置编号。使用的参数为缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩阵。在另一个β_葡糖苷酶中对应氨基酸残基的鉴定可通过使用数种计算机程序使用其各自的缺省参数进行的多个多肽序列的比对来确定,所述计算机程序包括但不限于MUSCLE (根据log期望的多重序列比较,multiple sequencecomparison by log-expectation ;3.5 版或之后的版本;Edgar, 2004, Nucleic AcidsResearch32:1792-1797), MAFFT (6.857 版或之后的版本;Katoh 等,2005,NucleicAcids Research33:511-518;Katoh 和 Toh, 2007,Bioinformatics23:372-374;Katoh等,2009,Methods in Molecular Biology537:39-64; Katoh和 Toh, 2010,Bioinformatics26:1899-1900)和采用 Clustalff 的 EMBOSS EMMA (1.83 或之后;Thompson 等,1994,NucleicAcids Research22:4673-4680)。当其它多肽与SEQ ID N0:2的成熟多肽歧异到传统的基于序列的比较无法检测出其关系时(Lindahl 和 Elofsson, 2000,J.Mol.Biol.295:613-615),可使用其它配对序列比较算法。在基于序列的搜索中较高的敏感度可使用采用多肽家族的概率表现(probabilistic representation)(序型)搜索数据库的搜索程序来获得。例如,PS1-BLAST程序通过迭代的(iterative)数据库搜索过程来产生序型,并能够检测出较远的同源物(Atschul 等,1997,Nucleic Acids Res.25:3389-3402)。当多肽的家族或超家族在蛋白质结构数据库中具有一个或多个代表时,甚至可达成更高的敏感度。程序如GenTHREADER(Jonesl999, J.Mol.Biol.287:797-815;McGuffin 和 Jones, 2003, Bioinformaticsl9:874-881)使用来自不同来源(PS1-BLAST、二级结构预测(secondary structureprediction)、结构比对序型(structural alignment profile)以及溶解势(solvationpotential))的信息作为预测所查询序列(query sequence)的结构折叠(structuralfold)的神经网络的输入。类似地,Gough等,2000,J.Mol.Biol.313:903-919的方法可用于将未知结构的序列与存在于SCOP数据库中的超家族模型进行比对。这些比对可接着用于生成所述多肽的同源性模型,且上述模型可就其准确度使用多种为此目的开发的工具加以评价。
对于已知结构的蛋白质,可获取数种工具和资源以供找回(retrieve)和生成结构比对。例如,已将SCOP超家族的蛋白质进行了结构比对,且这些比对是可获取并可下载的。两个或更多蛋白质结构可使用多种算法,如距离比对矩阵(distance alignmentmatrix) (Holm 和 Sander, 1998,Proteins33:88-96)或组合延伸(combinatorialextension) (Shindyalov 和 Bourne, 1998, Protein Engineering.11:739-747)进行比对,且这些算法的实施可另外用于查询具有目标结构的结构数据库,以发现可能的结构同源物(例如 Holm 和 Park, 2000, Bio informat ics 16:566-567)。在描述本发明的变体时,为了参照方便起见,采用了下面所述的命名法。使用通用的IUPAC单字母或三字母氨基酸缩写。座也。对于氨基酸取代,使用下述命名法:初始氨基酸,位置,取代氨基酸。相应地,在226位用丙氨酸取代苏氨酸命名为“Thr226Ala”或“T226A”。多重突变可以用加号(“ +,,)分开,例如,“Gly205Arg+Ser411Phe” 或 “G205R+S411F”,分别代表 205 和 411 位用精氨酸(R)取代甘氨酸(G),以及用苯丙氨酸(F)取代丝氨酸(S)。篮失。对于氨基酸缺失,使用了如下命名法:初始氨基酸,位置*。相应地,在位置195缺失甘氨酸命名为“Glyl95*”或“G195*”。多个缺失通过加号(“ + ”)分开,例如,“Glyl95*+Ser411*,,或 “G195*+S411*,,。通2k。对于氨基酸插入,使用了如下的命名法:初始氨基酸,位置,初始氨基酸,插入的氨基酸。因此,在位置195的甘氨酸之后插入赖氨酸命名为“Glyl95GlyLys”或“G195GK”。多个氨基酸的插入命名为[初始氨基酸,位置,初始氨基酸,插入的氨基酸#1,插入的氨基酸#2 ;等等]。例如,在位置195的甘氨酸之后插入赖氨酸和丙氨酸记为“Glyl95GlyLysAla” 或 “G195GKA”。在此情况下,通过在插入的氨基酸残基前的氨基酸残基的位置号添加小写字母而对插入的氨基酸残基进行编号。因此,在上一例子中序列为:
权利要求
1.一种β-葡糖苷酶变体,其在对应于SEQ ID Ν0:2的成熟多肽的位置89,91,100,140,186,283,456,和512的一个或多个(例如几个)位置包含取代,其中所述变体具有β-葡糖苷酶活性。
2.权利要求1的变体,其为亲本葡糖苷酶的变体,选自下组: (a)多肽,其与SEQID NO: 2的成熟多肽具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性; (b)多肽,其由多核苷酸编码,所述多核苷酸在高严格条件下或非常高严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)其cDNA序列,或(iii)或(i)或(ii)的全长互补链; (c)多肽,其由多核苷酸编码,所述多核苷酸与SEQID NO:1的成熟多肽编码序列或其cDNA序列具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;和 (d)SEQID NO:2的成熟多肽的片段,其具有β-葡糖苷酶活性。
3.权利要求2的变体,其与亲本β-葡糖苷酶的氨基酸序列具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,但少于100%序列同一性 。
4.权利要求1-3任一项的变体,其与SEQID ΝΟ:2的成熟多肽具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,但少于100%序列同一性。
5.权利要求1-4任一项的变体,其包含一个或多个选自下组的取代:L89M,G91L,F100D, I140V, I186V, S283G, Ν456Ε,和 F512Y。
6.权利要求1-4任一项的变体,其包含如下取代或由如下取代组成:L89M,G91L,F100D, I140V, I186V, S283G, Ν456Ε,和 F512Y。
7.—种分离的多核苷酸,其编码权利要求1-6任一项的变体。
8.—种宿主细胞,其包含权利要求7的多核苷酸。
9.一种产生变体的方法,其包括: (a)在适于表达所述变体的条件下培养权利要求8的宿主细胞;和 (b)回收所述变体。
10.一种转基因植物、植物部分或植物细胞,其用权利要求7的多核苷酸转化。
11.一种产生权利要求1-6任一项的变体的方法,其包括: (a)在有助于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物或植物细胞;和 (b)回收所述变体。
12.—种用于获得变体的方法,其包括:将在对应于SEQ ID NO:2的成熟多肽的位置.89,91,100,140,186,283,456,和512的一个或多个位置的取代导入亲本β-葡糖苷酶,其中所述变体具有β -葡糖苷酶活性;和回收所述变体。
13.一种用于降解或转化纤维素材料的方法,其包括在权利要求1-6任一项的变体的存在下用酶组合物处理所述纤维素材料。
14.权利要求13的方法,其进一步包括回收经降解的纤维素材料。
15.权利要求13或14的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
16.一种用于产生发酵产物的方法,其包括: (a)在权利要求1-6任一项的变体的存在下用酶组合物糖化纤维素材料; (b)用一种或多种微生物发酵经糖化的纤维素材料以产生发酵产物;和 (C)从发酵回收所述发酵产物。
17.权利要求16的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
18.一种发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料是在权利要求1-6任一项的变体存在下用酶组合物糖化的。
19.权利要求18的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
20.权利要求18或19的方法,其中所述纤维素材料的发酵产生发酵产物。
21.权利要求20的方法,其进一步包括从发酵回收发酵产物。
22.—种全培养液配制物或细胞培养组合物,其包含权利要求1-6任一项的变体。
全文摘要
本发明涉及亲本β-葡糖苷酶的变体。本发明亦涉及编码变体的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;和使用所述变体的方法。
文档编号C12N9/42GK103221538SQ201180056301
公开日2013年7月24日 申请日期2011年9月30日 优先权日2010年10月1日
发明者M.沃古利斯, P.哈里斯, D.奥斯伯恩 申请人:诺维信股份有限公司

最新回复(0)