糖苷水解酶61家族蛋白在纤维素加工中的用途的制作方法

xiaoxiao2020-6-24  10

专利名称:糖苷水解酶61家族蛋白在纤维素加工中的用途的制作方法
技术领域
本发明总体涉及糖酵解酶及其用途的领域。更具体地,本发明提供来自嗜热毁丝霉(Myceliophthora thermophila)的GH61蛋白、和所述蛋白在从纤维素生物质产生可发酵糖类和乙醇中的用途。直量纤维素生物质是用于生成可发酵糖类的重要的可再生资源。这些糖类可用作发酵和其他代谢工艺的基质以产生生物燃料、化学化合物和其他有商业价值的终产物。虽然将糖类诸如单糖发酵为乙醇相对直接,但将纤维素生物质有效转化为可发酵的糖类是有挑战的。Ladisch 等人,1983, Enzyme Microb.Technol.5:82。纤维素生物质向可发酵糖类的转化可以开始于化学、机械、酶促或其他预处理以提高纤维素对水解的敏感性。这种预处理之后可以是使用分解纤维素的酶进行的纤维素向纤维二糖、纤维寡糖、葡萄糖和其他糖类与糖聚合物的酶促转化。这些酶总称为“纤维素酶”,并包括内切葡聚糖酶、β -葡糖苷酶和纤维二糖水解酶。发明概述在一个方面,本发明提供从嗜热毁丝霉获得的重组糖苷水解酶61家族(GH61)蛋白和编码所述蛋白的核酸。本发明`还提供来自嗜热毁丝霉培养物肉汤的分离和纯化的GH61蛋白。这些蛋白可用于增加含纤维素的基质经历被纤维素酶诸如内切葡聚糖酶、β_葡糖苷酶和纤维二糖水解酶之一或其组合糖化的反应的产物的产量。重组或分离的GH61蛋白的加入或存在可增加纤维素酶的产物的产量,例如,至少20%、30%、50%、70%、2倍、3倍或更多。本发明的一个实施方案是包含分离的或重组的GH61蛋白的组合物和用于制备这样的组合物的方法。蛋白可从嗜热毁丝霉分离,或可通过重组产生来获得。提供了二十四种全长嗜热毁丝霉GH61蛋白的氨基酸序列。本发明的GH61蛋白包括包含与所列的蛋白(SEQID NO:1-30)的任一种或其生物活性片段至少约60%、约70%、约80%、约85%、约90%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%相同的氨基酸序列的蛋白。示例性的GH61蛋白是GH61a(SEQ ID NO:2)。其他示例性GH61蛋白包括GH61o、GH61v、GH61x、GH61b 和 GH61e(SEQ IDNO:6、13、15、16、19、30)。其他示例性的 GH61 蛋白包括 GH61f、GH61v、GH61p、GH61g 和 GH61i(SEQ ID NO:7、13、20、21、23、26)。在一个方面,根据本发明的方法制备的组合物包括分离的或重组的GH61蛋白和本公开文件中列出的一种或多种纤维素酶,包括但不限于选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的纤维素酶。GH61蛋白和纤维素酶可从相同或不同的宿主细胞类型获得。
本发明的另一实施方案是从纤维素基质产生可发酵糖类的方法。将包含基质的浆料与包含GH61蛋白的组合物接触,从而从基质产生可发酵糖类诸如葡萄糖和木糖。组合物还可包含选自纤维素酶蛋白(内切葡聚糖酶、葡糖苷酶、I型纤维二糖水解酶和2型纤维二糖水解酶)、酯酶、木聚糖酶、半纤维素酶、脂酶、蛋白酶、淀粉酶和葡糖淀粉酶的一种或多种酶。基质可获取自,例如,小麦、麦杆、高粱、玉米、大米、大麦、甘蔗渣、草、柳枝稷、玉米粒、玉米芯、玉米纤维、或其组合,以预处理的麦杆示例。可发酵糖类可被回收并用于产生终产物诸如醇(诸如乙醇或丁醇)、糖醇(诸如山梨醇)、有机酸(诸如乳酸、丙烯酸、乙酸、琥珀酸、谷氨酸、柠檬酸或丙酸)、氨基酸(诸如甘氨酸、赖氨酸或天冬氨酸)、有机酸、烷、烯、二醇或甘油。本发明的另一实施方案是在用一种或多种纤维素酶的糖化反应中,通过在上述GH61蛋白的存在下进行反应来增加可发酵糖类的产量的方法。在另一个方面,本发明提供水解纤维素基质的方法。将基质与包含一种或多种重组GH61蛋白、一种或多种β-葡糖苷酶(BGL)以及一种或多种纤维二糖水解酶(CBH)的组合物接触。在一些实施方案中,酶组合物基本上无内切葡聚糖酶(EG)。水解可导致葡萄糖产量比在所述GH61蛋白不存在时进行的相同反应的产量多至少20%、30%、50%、70%、2倍、3倍或更多。本发明的另一实施方案是从纤维素基质产生终产物的方法。在藉以产生可发酵糖类的条件下将基质与包含上述GH61蛋白的组合物接触。然后在发酵中将可发酵糖类与微生物接触以产生终产物,诸如以上列出的那些。该方法适于制备醇,尤其是乙醇,其中微生物是酵母。 本发明的其他实施方案包括:a)上述重组GH61蛋白,任选地被产生为带有异源信号肽山)编码GH61蛋白的核酸序列,其可以可操作地连接于异源启动子;c)产生所述重组GH61蛋白的宿主细胞,以嗜热毁丝霉、酵母、毛壳属(Chaetomium)、梭孢壳属(Thielavia)、支顶抱属(Acremonium)、毁丝霉属(Myceliophthora)、曲霉属(Aspergillus)或木霉属(Trichoderma)宿主细胞示例。本发明还包括重组产生的GH61蛋白在产生乙醇中的用途。GH61蛋白包括与所列的蛋白的任一种、或其具有GH61活性的片段至少60%、约70%、约80%、约85%、约90%、约92 %、约93 %、约94 %、约95 %、约96 %、约97 %、约98 %或约99 %相同的氨基酸序列。在一个相关的方面,本发明提供编码GH61蛋白的核酸。本发明还提供包含编码本发明的蛋白序列(SEQ ID NO:1至30)、可操作地连接于异源启动子的重组核酸序列的细胞。宿主细胞可以是(例如)嗜热毁丝霉细胞或酵母细胞。在一个实施方案中,重组核酸序列包括SEQ ID NO:31 ;或SEQID NO:32至59的任一种。该细胞还可表达选自内切葡聚糖酶(EG)、β -葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)、和/或2型纤维二糖水解酶(CBH2)的至少一种重组纤维素酶蛋白。在一个实施方案中,该细胞表达GH61蛋白和选自内切葡聚糖酶(EG)、β -葡糖苷酶(BGLl)、I型纤维二糖水解酶(CBHl)、和/或2型纤维二糖水解酶(CBH2)、和/或所述纤维素酶蛋白的变体的至少一种、至少两种、或至少三种重组纤维素酶蛋白。在一个方面,本发明提供包含GH61蛋白(例如,SEQ ID Ν0:2)、内切葡聚糖酶(EG)、β -葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的组合物,其中GH61蛋白、EG、BGL、CBH1和CBH2的组合质量是组合物中总的无细胞的蛋白的至少约20%、40%、60%、70%、80%、90%、95%、或基本上全部。组合物中可存在的CBH1、CBH2、EG和BGL酶的一种、两种、三种、或所有四种可以是衍生自天然存在的纤维素酶蛋白的变体。组合物还可以是包含纤维素酶蛋白的细胞培养物肉汤。在一个方面,本发明提供包含SEQ ID NO:3至30的任一种的GH61蛋白或其分泌片段。任选地,该蛋白包含分泌片段和相应的信号肽序列,如果存在信号肽序列的话。在一个相关的方面中,本发明提供与本文提供的多肽或生物片段具有至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91 %、至少约92 %、至少约93 %、至少约94%、至少约95 %、至少约96 %、至少约97 %、至少约98 %或至少约99 %序列同一性的GH61蛋白变体。在一个方面,本发明提供编码上述蛋白的重组核酸序列,其可具有天然存在的基因或其片段的序列。在一个实施方案中,核酸的蛋白编码序列可操作地连接于异源信号序列。通常,该重组核酸序列可操作地连接于异源启动子。在一个方面,本发明提供包含本发明的重组核酸的宿主细胞。该细胞可 表达选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)U型纤维二糖水解酶(CBHl)、和/或2型纤维二糖水解酶(CBH2)的至少一种、两种、三种或四种重组纤维素酶蛋白。在一个方面,本发明提供包含包括选自SEQ ID NO:1至30、和或其至少一种生物活性片段的分泌部分的序列的至少一种分离的蛋白的组合物。在一个实施方案中,该组合物还包含至少一种内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)、和/或2型纤维二糖水解酶(CBH2),其中GH61蛋白、EG、BGL、CBHl和/或CBH2的组合质量是组合物中总的无细胞的蛋白的至少约70%。在一个方面,本发明提供用于糖化的方法:(a)在至少一种GH61蛋白被分泌进入培养物肉汤的条件下培养本发明的细胞,和(b)在发生糖化的条件下混合所述肉汤与纤维素生物质,其中(a)可在(b)之前发生或与(b)同时发生。在一个方面,本发明提供水解淀粉的方法,包括将淀粉与包含一种或多种重组GH61蛋白和一种或多种淀粉酶的组合物接触。本发明的其他实施方案将由以下说明变得明显。


图1取自使用来自嗜热毁丝霉的重组产生的GH61a蛋白的实验。使用来自嗜热毁丝霉的培养物肉汤的纤维素酶试验了该蛋白的纤维素酶增强活性。图1(A)显示与在GH61a不存在时的糖化反应相比,在GH61a存在下进行的相同反应的产量改进的百分比。在图1(B)中,将数据绘图来显示总的葡萄糖产量。图2取自使用从嗜热毁丝霉的培养物肉汤分离的包含GH61的级分(斤action)的实验。将GH61蛋白GH61f、GH61p、和/或GH61a与CBHla和CBH2b混合。这些结果证明,包含这些组分的酶混合物具有将纤维素基质转化为葡萄糖的足够的酶活性。图3显示GH61a蛋白对纤维素生物质的粘度的影响。详沭1.引言
已确定,丝状真菌嗜热毁丝霉产生GH61蛋白。当含纤维素的基质经历被一种或多种纤维素酶糖化时,GH61蛋白增加可发酵糖类的产量。除了其他用途以外,由糖化产生的可发酵糖类可用在发酵反应中以产生终产物,诸如但不限于乙醇。GH61蛋白可从嗜热毁丝霉细胞分离。GH61蛋白还可通过表达编码本公开文件中提供的GH61蛋白序列的任一种的核酸来重组地产生,本公开文件中提供的GH61蛋白序列包括野生型序列以及野生型序列的变体和片段。本发明的GH61蛋白和组合物的制备和用途在以下部分更详细地描述。II定义本文提到的所有专利和出版物,包括在这些专利和出版物中公开的所有序列均通过引用明确地并入本文。除非另外指明,否则本发明的实施涉及在分子生物学领域、发酵领域、微生物学领域和相关领域中通常使用的常规技术,这些技术是所属领域普通技术人员已知的。除非在本文中另外定义,否则本文使用的所有技术术语和科学术语均具有本发明所属领域的普通技术人员所通常理解的含义。尽管在本发明的实施或试验中可使用与本文所述的方法和材料相似或等同的任何方法和材料,但描述了一些优选的方法和材料。实际上,意图在于本发明不限于本文所述的特定方法学、方案和试剂,因为这些可随使用它们的背景而改变。本文提供的标题不是对本发明的多个方面或实施方案的限制。尽管如此,为了促进对本发明的理解,以下定义了若干术语。数值范围包括限定范围的数字。这样,本文公开的每个数值范围旨在包括落在这种较宽的数值范围内的每个较窄的数值范围,如同这种较窄的数值范围全部被明确写在本文一样。意图还在于本文公开的每个最大(或最小)的数值限制(numerical limitation)包括每个较低(或较高)的数值限制,如同这种较低(或较高)的数值限制被明确地写在本文一样。如本文所用,术语“包括”及其同源词以其包含的意义使用(即,等同于术语“包含”及其对应的同源词)。如在此处和在所附权利要求中所用,除非上下文另外清楚地表示,否则单数“一(a)”、“一(an)”和“该(the) ”包括复数指代。因此,例如,提到“宿主细胞”包括多个此类
宿主细胞。除非另外指明,否则分别以5'至3'方向从左到右书写核酸;以氨基到羧基方向从左到右书写氨基酸序列。本文提供的标题不是对可通过参照作为整体的说明书而具有的本发明的多个方面或实施方案的限制。据此,通过参照作为整体的说明书更完全地定义以下所定义的术语。如本文所用,“GH61蛋白”是具有GH61(或“纤维素酶增强”)活性的蛋白。“GH61蛋白”或GH61多肽可具有天然存在的(野生型)蛋白的序列,或可包括相对于野生型蛋白的变异。如本文所用,表I和表2所示的GH61蛋白序列(SEQ ID NO:1_30)被认为是野生型序列。如果当蛋白被包括在糖化反应(例如,使用内切葡聚糖酶、葡糖苷酶、以及I型和2型纤维二糖水解酶进行)中时比在GH61蛋白不存在时在相同条件下进行的糖化反应导致更大量(即,更大产量)的一种或多种可溶性糖类(例如,葡萄糖),则该蛋白具有“GH61活性”或“纤维素酶增强活性”或是“生物活性”的。“生物活性变体”是保留野生型蛋白的GH61活性的至少一些(例如,至少10% )的变体或片段。如本文所用,“变体”GH61蛋白(或编码GH61蛋白的多核苷酸)是包含相对于野生型GH61 (或编码GH61的野生型多核苷酸)的一种或多种修饰的GH61蛋白。修饰包括一个或多个氨基酸残基(或多核苷酸中的一个或多个核苷酸或密码子)的取代、插入、缺失、和/或氨基或羧基截短。包含相对于野生型蛋白的缺失的变体可称为“片段”。如本文所用,GH61蛋白的“片段”是(a)具有野生型序列但包含相对于SEQ ID NO:1-30的缺失的多肽或(b)包含相对于多肽SEQ ID NO:1_30的缺失的GH61变体。蛋白序列中的氨基酸“取代”是该序列中的单个氨基酸被另一种氨基酸代替。氨基酸取代可以是“保守的”取代,在这种情况中取代氨基酸与其代替的氨基酸共有一种或多种化学特性。共有的特性包括以下:碱性氨基酸:精氨酸(R)、赖氨酸(K)、组氨酸(H);酸性氨基酸:谷氨酸(E)和天冬氨酸(D);不带电荷的极性氨基酸:谷氨酰胺(Q)和天冬酰胺(N);疏水氨基酸:亮氨酸(L)、异亮氨酸(I)、缬氨酸(V);芳族氨基酸:苯丙氨酸
(F)、色氨酸(W)和酪氨酸(Y);含硫氨基酸:半胱氨酸(C)、甲硫氨酸(M);小氨基酸:甘氨酸
(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、脯氨酸(P)、半胱氨酸(C)和甲硫氨酸(M)。术语“前蛋白”具有其在本领域中的标准含义,是指包括附加的氨基末端信号肽(或前导序列)区域的多肽。随着蛋白的分泌,信号肽酶将信号肽从前蛋白上切割。蛋白的分泌部分可称为“成熟的”或“分泌的”蛋白。因此,前蛋白的氨基酸序列,该序列包括信号肽部分和分泌的(成熟)部分。 如本文所用,术语“信号肽”具有其在本领域中的通常含义,是指与多肽的氨基末端连接的氨基酸序列,指导编码的多肽进入细胞的分泌途径。“糖化”是指酶催化的反应,导致复杂碳水化合物水解为可发酵糖类(例如,单糖类诸如葡萄糖或木糖)。该酶可以是纤维素酶,诸如内切葡聚糖酶、β -葡糖苷酶、I型和/或2型纤维二糖水解酶、和这些纤维素酶的组合。该纤维素酶可来自产生纤维素酶的野生型或纤维素酶-工程化的生物体(例如,真菌诸如嗜热毁丝霉或酵母)的培养物肉汤。当相邻单糖的至少一些之间的糖苷键被水解,从而将此前键合的单体对彼此分开时,“水解”纤维素或另一种多糖(例如,淀粉)发生。当在反应期间存在的特定组分(诸如GH61蛋白)导致与在相同条件下以相同的基质和其他代用品、但不存在目标组分时进行的反应相比产生更多产物时,出现“增加”反应产物(诸如可发酵糖类)的产量。术语“改进的”或“改进的特性”在描述GH61变体的特性的语境中使用时,是指与野生型GH61(例如,SEQ ID NO:2)或指定参考多肽相比表现出一种或多种特性的改进的GH61变体多肽。改进的特性可包括但不限于,增加的蛋白表达、增加的热活性、增加的热稳定性、增加的PH活性、增加的稳定性(例如,增加的pH稳定性)、增加的产物特异性、增加的比活性、增加的底物特异性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、减少的被葡萄糖抑制、增加的对抑制剂(例如,乙酸、凝集素、鞣酸和苯酚化合物)的抗性、和改变的PH/温度曲线。术语“纤维素酶(cellulase) ”(或“纤维素酶(cellulose enzyme),,)宽泛地是指催化纤维素β_1,4-糖苷键水解为更短的纤维素链、寡糖、纤维二糖和/或葡萄糖的酶,例如,内切葡聚糖酶、β -葡糖苷酶和纤维二糖水解酶。
如本文所用,术语“多核苷酸”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸的聚合物、及其互补物。如本文所用,“基因”是编码蛋白的核酸序列。该核酸可具有或不具有任何内含子,可以是或不是重组的,并可还包括或不包括影响转录或翻译的元件。为了本说明书的目的,编码蛋白的cDNA序列有时可称为“基因”。术语“重组核酸”具有其常规含义。重组核酸或等义地“多核苷酸”,是被插入到异源位置,以使其不与自然界发现的正常情况下在该核酸两侧的核苷酸序列缔合的核酸(例如,被插入到载体中或异源生物体的基因组中的核酸)。同样,不在自然界出现的核酸序列例如天然存在的基因的变体是重组的。包含重组核酸或从重组核酸体外或体内表达的蛋白的细胞也是“重组的”。重组核酸的实例包括(i)可操作地连接于异源启动子和/或(ii)编码带有蛋白序列和异源信号肽序列的融合多肽的编码蛋白的DNA序列:。当核酸缔合,通常在溶液中缔合时,它们“杂交”。核酸杂交是由于各种被很好表征的物理-化学力,诸如氢键键合、溶剂排斥(solvent exclusion)、碱基堆积等。如本文所用,在核酸杂交实验诸如Southern杂交或Northern杂交的背景下术语“严格的杂交洗涤条件”是序列依赖性的,并且在不同环境参数下是不同的。有关核酸杂交的深入指导见于 Ti jssen, 1993, “Laboratory Techniques in Biochemistry and MolecularBiology-Hybridizationwith Nucleic Acid Probes,,,Part I, Chapter2(Elsevier, NewYork),其通过引用并入本文。对于至少100个核苷酸长度的多核苷酸而言,对低严格条件到极高严格条件限定如下:在标准的DNA印迹程序后,在42°C在5XSSPE,0.3% SDS,200 μ g/ml剪切和变性的鲑鱼精DNA,以及对于低严格性的25%甲酰胺,对于中等和中-高严格性的35%甲酰胺,或对于高严格性和极高严格性的50%甲酰胺中预杂交和杂交。对于至少100个核苷酸长度的多核苷酸,使用2XSSC,0.2% SDS在50°C (低严格性)、在550C (中等严格性)、在60°C (中-高严格性)、在65°C (高严格性)或在70°C (极高严格性)将载体材料(carrier material)最终洗漆三次,每次15分钟。术语“表达载体”是指包括编码本发明的多肽的区段,并且所述区段可操作地连接于提供其转录的另外区段(例如,启`动子、转录终止序列、增强子)和任选地选择性标记的线性或环状的DNA分子。为了本公开的目的,如果启动子在自然界不与基因序列缔合时,该启动子对该基因是“异源的”。当信号肽序列在自然界不与蛋白序列缔合时,该信号肽对该蛋白是“异源的”。关于调节序列(例如,启动子),术语“可操作地连接”是指如下配置:在该配置中调节序列被安放在相对于多肽编码序列的位置以使得该调节序列影响多肽的表达。关于信号序列,术语“可操作地连接”是指如下配置:在该配置中信号序列编码与多肽融合的氨基末端信号肽,以使该基因的表达产生前蛋白。 如本文所用,术语“肽”、“多肽”和“蛋白”在本文可互换地使用,是指氨基酸残基的聚合物。如本文所用,术语“氨基酸”是指天然存在的和合成的氨基酸、以及氨基酸类似物。术语“生物质”、“生物质基质”、“纤维素生物质”、“纤维素原料”、“木质纤维素原料”和“纤维素基质”都是指包含纤维素的材料。为了简化,本文使用的术语“纤维素基质”是指通常在预处理后,能够被纤维素酶(任选地存在GH61蛋白)作用来产生可发酵糖类的包含纤维素的材料。纤维素基质的实例包括但不限于,生物质诸如木头、木纸浆、纸浆、玉米纤维、玉米粒、玉米芯、谷物残渣诸如玉米皮、玉米秸杆、草、小麦、麦杆、大麦、大麦杆、干草、稻草、柳枝稷、废纸、纸和纸浆加工废料、木质或草本植物、果浆或蔬菜浆、酒糟、稻壳、棉、大麻、亚麻、剑麻、甘鹿S、高粱、大豆、碾磨谷物、树、树枝、根、叶、木片、锯末、灌木丛、蔬菜、果实、和花获得的组分、及其混合物。在一些实施方案中,使用本领域已知的方法“预处理”或处理纤维素材料,诸如化学预处理(例如,氨预处理、稀酸预处理、稀碱预处理、或溶剂暴露)、物理预处理(例如,蒸汽爆破或辐照)、机械预处理(例如,研磨或碾磨)和生物预处理(例如,施加增溶木质素的微生物)和其组合,以增加纤维素对水解的敏感性。纤维素基质及其加工在以下更详细地描述。纤维素基质通过包括以下的方法“获取自”特定来源(诸如玉米或小麦):获得该来源或该来源的实体部分(诸如玉米芯或麦杆),然后任选地预处理该来源或部分。纤维素酶蛋白序列(即,纤维素变体)当通过使用体外诱变或分子进化方法向野生型序列引入变异来产生时,“衍生自”野生型纤维素酶序列。通常蛋白序列将与野生型序列至少 70%、约 75%、约 80%、约 85%、约 90%、约 91 %、约 92%、约 93%、约 94%、约 95%相同。纤维素基质已经通过一些物理和/或化学手段加工来帮助糖化时,被称为是“预处理的”。“可发酵糖类”意为简单糖类(simple sugars)(单糖、二糖和短寡糖),诸如但不限于葡萄糖、木糖、半乳糖、阿拉伯糖、甘露糖和蔗糖。可发酵糖类是微生物能够利用或发酵的任何糖。术语“转化(transform) ”或“转化(transformation) ”在提到细胞使用时,表示细胞具有整合入其基因组或作为经过多代被维持的附加体(例如,质粒)的非天然核酸序列。

术语“引入”在将核酸序列插入细胞的语境中使用时表示被接合、转染、转导或转化(统称为“转化”)或以其他方式并入到细胞的基因组中或作为附加体被保持在细胞内。“纤维素酶工程化的”细胞是包含编码纤维素酶或纤维素酶变体的至少一种、至少两种、至少三种、或至少四种重组序列且其中纤维素酶或纤维素酶变体的表达相对于野生型形式已被修饰的细胞。当非天然存在的纤维素酶变体被表达或当天然存在的纤维素酶被过表达时,纤维素酶的表达是“被修饰的”。过表达纤维素酶的一种方式是可操作地连接强(任选地组成型)启动子于纤维素酶编码序列。过表达纤维素酶的另一种方式是增加异源的、变异的、或内源的纤维素酶基因的拷贝数。纤维素酶工程化的细胞可以是真菌细胞,诸如酵母细胞或丝状真菌细胞(例如,解纤维素热酸菌(Acidothermus cellulolyticus)、Thermobifida fusca、灰腐质霉(Humicolagrisea)、嗜热毁丝霉、嗜热毛壳菌(Chaetomiumthermophilum)、枝顶孢属、梭孢壳属、里氏木霉(Trichoderma reesei)、曲霉属)。在一些实施方案中,纤维素酶工程化的细胞是嗜热毁丝霉细胞。术语“培养”是指在液体或固体培养基中使微生物(例如真菌)细胞的群体生长。一些培养的细胞表达和分泌蛋白,诸如例如,GH61蛋白或纤维素酶蛋白。当细胞在液体培养基中生长时,蛋白可能被分泌到培养基中,该培养基被称为多种术语,包括细胞培养培养基、细胞培养上清液和细胞肉汤。如本文所用,术语“回收”是指从细胞肉汤或可选地从固体培养基收获、分离、收集或离析蛋白、糖、细胞或终产物(例如,醇)。如本文所用,术语“分离的”是指从与之在自然界中通常缔合的组分(诸如其他蛋白、核酸或细胞)中部分地或完全地分开的核酸、多肽、或其他组分。已经被“纯化”的产物是已经从获得其的来源富集至少10倍、任选地至少100倍、或至少1000倍的产物。例如,从其占总蛋白0.1%的培养物肉汤获得的蛋白可被纯化,使得其为制品中蛋白的 1%、2.5%、10%、25%、50%、80%、95%或 100% (wt/wt)。“部分纯化的”产物已经从产生其的来源富集至少2倍、或至少5倍,但仍包含至少50%、有时至少90% (wt/wt)的溶剂以外的不相关组分。“分级(fractionating) ”液体产物诸如培养物肉汤表示施加分离工艺(诸如盐沉淀、柱色谱、尺寸排阻、和过滤)或所述工艺的组合,从而获得一种溶液,其中期望蛋白(诸如GH61蛋白、纤维素酶、或其组合)在该溶液中为比在最初液体产物中占总蛋白的百分比更大的百分比。“浆料”是其中分散一种或多种固体组分诸如纤维素基质的水溶液。如本文所用,包含一种或多种蛋白的“组合物”可以是,例如,包含蛋白的无细胞组合物、细胞溶解产物、包含例如以分泌形式的蛋白的细胞肉汤;包含蛋白的细胞,诸如表达蛋白的重组细胞;表达不同蛋白的两种或多种细胞群体的混合物(例如,表达重组GH61蛋白的一种细胞和表达纤维素酶蛋白的第二细胞)。术语“无细胞组合物”是指其中已经去除了细胞和细胞碎片的包含蛋白的组合物,诸如纯化的纤维素酶混合物或包含分泌的蛋白的、已经从其去除了细胞和不溶性物质的细胞培养物肉汤。术语“同一性百分比”、同一性”、“百分比相同”和相同”在本文可互换地使用,是指两条最佳地对齐的序列跨比较窗的比较。为了优化比较,比较窗可在任一条序列中包括添加或缺失。同一性百分比是序列之间相同的位置数目除以比较窗中位置的总数(包括其中一条序列具有缺口的位置)。例如,具有在310个位置与序列GH61a(其分泌形式具有323个氨基酸)匹配的氨基酸序列的蛋白,将与该参考序列具有310/323 = 95.9%同一性。类似地,具有300个残基(S卩,小于全长)并在280个位置与参考序列匹配的蛋白变体将具有280/300 = 93.3%同一性。尽管最佳比对和评分可手动完成,但通过使用计算机执行的比对算法可促进该过程。实例是BLAST和BLAST2.0算法,描述在Altschul等,1990,J.Mol.Biol.215:403-410 和 Altschul 等,1977,NucleicAcids Res.3389-3402 中。可选地,两条氨基酸序列之间的同一性程度可使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-53)确定,该算法已经在EMBOSS软件包的Needle程序中实现(EMBOS S:The European Molecular Biology OpenSoftware Suite,Rice等,2000,Trendsin Geneticsl6:276-77),优选地以3.0.0或后来的版本。使用的任选参数是:缺口开放罚分10、缺口延伸罚分0.5、和EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩阵。Needle的标为“最长同一性”的输出值(使用nobrief选项获得的)用作同一性百分比,并如下计算:(相同残基X 100) + (比对的 长度-比对中的缺口总数)。HI:GH61某闵的鉴定
如实施例1所述,鉴定了对嗜热毁丝霉内源的二十四种GH61蛋白。参见下表I和表2。如实施例2和3所示,名称为GH61a的特定嗜热毁丝霉GH61蛋白(SEQ ID NO:2)显示为在纤维素酶存在时增强糖化反应。类似地,本发明的其他GH61蛋白(SEQ ID NO:3至
30)可用于增强纤维素酶活性。表I提供GH61前蛋白的序列(SEQ ID NO:1),以加下划线显示预测的天然信号肽,和预测的分泌的(成熟)形式(SEQ ID NO:2)。序列ID NO: 2的长度是323个氨基酸。预期本发明的某些GH61a蛋白变体包括SEQ IDNO:2的残基11-323 (包括但不限于,氨基末端截短的片段),或与SEQ IDNO:2的残基11-323具有至少:约70%、约75%、约80%、约85%、约 90%、约 91%、约 92%、约 93%、约 94%、约 95%、约 96%、约 97%、约 98%、或约99%的序列同一性。在一些实施方案中,GH61s蛋白变体与SEQ IDNO:2的残基11-323具有至少90%的同一性并长至少315个残基。表2提供28种GH61前蛋白序列,预测的天然信号肽加下划线。预测GH61t和GH61n不具有信号肽。除了另外指明或从上下文清楚的情况以外,提及表2中所列的一种或多种序列意为涵盖前蛋白形式和分泌形式(即,包含完整序列的蛋白、和不包括加下划线的序列的蛋白)的一种或两种。还预期本发明的某些GH61蛋白包括表2所示的序列的残基11至C末端(包括但不限于,氨基末端截短的片段),或与这些序列的残基11至C末端具有至少:约 70%、约 75%、约 80%、约 85%、约 90%、约 91 %、约 92%、约 93%、约 94%、约 95%、约96%、约97%、约98%、或约99%的序列同一性。在表2中可使用以下名称:B =全长蛋白(包括信号肽)的SEQ ID N0.;C=信号肽(加下划线的);D=成熟蛋白(不加下划线的);E = D的开始于分泌部分的残基11的部分(即,在最后一个缺口与C末端之间,亦即氨基末端截短部分)。表I和表2中的信号肽边界是基于对基本序列的分析来预测的。实际的裂解位点与预测的位点差达数个残基(例如,1-10个,例如,达1、2、3、4、5、6、7、8、9或10个)是有可能的。异源信号肽的存在也可以影响裂解位点。信号肽裂解位点可通过表达全长序列,并鉴定分泌的GH61蛋白的氨基末端残基来确定。预计在成熟蛋白氨基末端添加或缺失数个残基可以对分泌的蛋白的活性影响很小或无影响。M I
糖苷水解酶61蛋白GH61a
权利要求
1.一种制造组合物的方法,包括组合以下: a)来自嗜热毁丝霉(Myceliophthorathermophila)的分离或重组的GH61蛋白;和 b)选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的一种或多种纤维素酶。
2.一种制造组合物的方法,包括组合以下: a)来自嗜热毁丝霉的分离或重组的GH61蛋白;和 b)选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的一种或多种纤维素酶; 其中在纤维素经历被包含EG、BGL、CBHl和CBH2的酶组合糖化的反应中,与所述GH61蛋白不存在时的相同糖化反应相比,所述GH61蛋白增加葡萄糖的产量至少20%。
3.如权利要求1或权利要求2所述的方法,其中所述GH61蛋白是重组的。
4.如权利要求1或权利要求2所述的方法,其中所述GH61蛋白通过从嗜热毁丝霉培养物分离GH61蛋白活性而获得。
5.如权利要求1-4任一项所述的方法,其中所述GH61蛋白增加所述反应中的葡萄糖的产量至少约50%。
6.如权利要求5任一项所述的方法,其中所述GH61蛋白增加葡萄糖的产量至少约2 倍。
7.一种制造组合物的方法,包括组合以下: a)包含与SEQID NO:1至30的任一种至少约80%、约85%、约90%、约95%、约97%或约99%相同的氨基酸序列的重组产生的GH61蛋白;和 b)选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的一种或多种纤维素酶。
8.一种组合物,包含: a)包含与选自由SEQID NO:1至30和SEQ ID NO:1至30的任一种的具有GH61活性的片段组成的组的序列至少约70 %、约75 %、约80 %、约85 %、约90 %、约95 %、约97 %或约99%相同的氨基酸序列的重组产生的GH61蛋白;和 b)选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的一种或多种纤维素酶, 其中在纤维素经历被包含EG、BGL、CBHl和CBH2的酶组合糖化的反应中,与所述GH61蛋白不存在时的相同反应相比,所述GH61蛋白增加葡萄糖的产量至少20%。
9.如权利要求8所述的组合物,其中所述GH61蛋白包含与SEQID NO:2、或其具有GH61活性的片段至少95%相同的氨基酸序列。
10.如权利要求8所述的组合物,其中所述GH61蛋白包括与GH61o、GH61v、GH61x、GH61b和GH61e(SEQ ID NO:6、13、15、16、19、30)的任一种;或其具有GH61活性的片段至少95%相同的氨基酸序列。
11.如权利要求8所述的组合物,其中所述GH61蛋白包括与GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)的任一种;或其具有GH61活性的片段至少95%相同的氨基酸序列。
12.如权利要求8所述的组合物,其中所述GH61蛋白包括SEQID NO:1至30的任一种;或其具有GH61活性的片段。
13.如权利要求8至12任一项所述的组合物,包含两种、三种、或多于三种纤维素酶。
14.如权利要求8至13任一项所述的组合物,其中所述纤维素酶是重组的。
15.如权利要求8至14任一项所述的组合物,其中所述纤维素酶是真菌酶类。
16.如权利要求8至15任一项所述的组合物,其中所述纤维素酶来自嗜热毁丝霉。
17.如权利要求8至16任一项所述的组合物,包括在一种宿主细胞群体中表达编码所述GH61蛋白的基因,和在另一种宿主细胞群体中表达编码纤维素酶的至少一种基因。
18.如权利要求8至16任一项所述的组合物,包括在相同宿主细胞类型中表达编码所述GH61蛋白的基因和编码纤维素酶的至少一种基因。
19.如权利要求17或18所述的组合物,其中所述基因编码包含异源信号肽的GH61蛋白。
20.一种从纤维素基质产生可发酵糖类的方法,包括将包含所述基质的浆料与包含GH61蛋白的组合物接触,从而从所述基质产生可发酵糖类, 其中所述GH61蛋白包括与SEQ ID NO:1至30的任一种至少约80%、约85%、约90%、约93 %、约95 %、约97 %或约99 %相同的氨基酸序列。
21.如权利要求20所述的方法,其中所述GH61蛋白包括与SEQID NO:1至30的任一种的分泌部分100%相同的氨基酸序列。
22.如权利要求20或21所述的方法,其中在所述接触之前,将所述基质预处理。
23.如权利要求20至22任一项所述的方法,其中所述GH61蛋白与SEQID NO:2至少95%相同。
24.如权利要求20至23任一项所述的方法,其中所述组合物包含选自酯酶、木聚糖酶、半纤维素酶、脂酶、蛋白酶、淀粉酶、葡糖淀粉酶和其组合的一种或多种酶。
25.如权利要求20至24任一项所述的方法,其中所述组合物包含选自EG、BGL、CBHl和CBH2的一种或多种纤维素酶。
26.如权利要求20至25任一项所述的方法,其中所述基质获取自小麦、麦杆、高粱、玉米、大米、大麦、甘蔗渣、草、柳枝稷、玉米粒、玉米芯、玉米纤维、或其组合。
27.如权利要求20至26任一项所述的方法,其中所述基质获取自麦杆。
28.如权利要求20至27任一项所述的方法,其中所述可发酵糖类包括葡萄糖。
29.如权利要求20至28任一项所述的方法,还包括回收所述可发酵糖类。
30.如权利要求20至29任一项所述的方法,还包括从所述可发酵糖类产生终产物, 其中所述终产物包括醇(诸如乙醇或丁醇)、糖醇(诸如山梨醇)、有机酸(诸如乳酸、丙烯酸、乙酸、琥珀酸、谷氨酸、柠檬酸或丙酸)、氨基酸(诸如甘氨酸、赖氨酸或天冬氨酸)、有机酸、烷、烯、二醇或甘油。
31.如权利要求30所述的方法,其中所述醇是乙醇。
32.—种用于在含纤维素的基质经历被一种或多种纤维素酶糖化的反应中增加可发酵糖类的产量的方法,包括在包括与SEQ ID NO:1至30的任一种;或SEQ ID NO:1至30的任一种的具有GH61活性的片段至少80%相同的氨基酸序列的GH61蛋白存在下进行所述反应。
33.如权利要求32所述的方法,其中所述GH61蛋白包括与SEQID NO:2、或其片段至少95%相同的氨基酸序列。
34.如权利要求32所述的方法,其中所述GH61蛋白包括与GH61o、GH61v、GH61x、GH61b和GH61e(SEQ ID NO:6、13、15、16、19、30)的任一种;或所述序列的任一种的片段至少95%相同的氨基酸序列。
35.如权利要求32所述的方法,其中所述GH61蛋白包括与GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)的任一种;或所述序列的任一种的片段至少95%相同的氨基酸序列。
36.如权利要求32所述的方法,其中所述GH61蛋白包括SEQID N0:1至30的任一种;或其片段。
37.如权利要求32至36任一项所述的方法,其中所述纤维素酶包括内切葡聚糖酶(EG)、β -葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)的组合。
38.一种水解纤维素基质的方法,包括将所述基质与包含一种或多种重组GH61蛋白、一种或多种葡糖苷酶(BGL)、和一种或多种纤维二糖水解酶(CBH)的组合物接触,其中所述酶组合物基本上无内切葡聚糖酶(EG)。
39.如权利要求38所述的方法,其中所述组合物包含I型纤维二糖水解酶和2型纤维二糖水解酶二者。
40.如权利要求38或39任一项所述的方法,其中所述GH61蛋白是来自嗜热毁丝霉的分离或重组的GH61蛋白。
41.如权利要求38至40任一项所述的方法,其中所述GH61蛋白与SEQID NO:2或其具有GH61活性的片段至少80%相同。
42.如权利要求38至41任一项所述的方法,其中所述水解导致葡萄糖产量是在所述GH61蛋白不存在时以BGL酶和CBH酶水解所述纤维素基质获得的葡萄糖产量的约1.5倍闻。
43.一种从纤维素基质产生终产物的方法,包括: a)将所述纤维素基质与根据权利要求8至16任一项的组合物或根据权利要求1-7任一项的方法获得的组合物接触,藉以从所述基质产生可发酵糖类;和 b)在发酵中将所述可发酵糖类 与微生物接触以产生终产物。
44.如权利要求43所述的方法,所述方法是同时糖化和发酵的工艺。
45.如权利要求43所述的方法,其中所述纤维素基质的糖化与所述发酵连续地发生。
46.一种从纤维素基质产生终产物的方法,包括: a)获得根据权利要求20至42任一项的方法产生的可发酵糖类;和 b)在发酵中将所述可发酵糖类与微生物接触以产生终产物。
47.如权利要求43至46任一项所述的方法,其中所述终产物是醇。
48.如权利要求47所述的方法,其中所述醇是乙醇。
49.如权利要求43至48任一项所述的方法,其中所述微生物是酵母。
50.一种重组GH61蛋白,包括与SEQ ID NO:1至30的任一种、或其具有GH61活性的片段至少约80%相同的氨基酸序列。
51.如权利要求50所述的重组GH61蛋白,其中在纤维素经历被来自丝状真菌的培养物肉汤中包含的纤维素酶糖化的反应中,所述GH61蛋白增加葡萄糖的产量。
52.如权利要求51所述的重组GH61蛋白,其中所述细胞是嗜热毁丝霉细胞。
53.如权利要求51或52所述的GH61蛋白,其中所述GH61蛋白包括与SEQID NO:6、16、19和23的任一种;或其具有GH61活性的片段至少95%相同的氨基酸序列。
54.如权利要求51或52所述的GH61蛋白,包括与GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)的任一种;或其具有GH61活性的片段至少约95%相同的氨基酸序列。
55.如权利要求51至54任一项所述的GH61蛋白,包括SEQID NO:1至30的任一种;或其具有GH61活性的片段。
56.—种重组多核苷酸,包括编码权利要求51至55任一项的GH61蛋白的核酸序列。
57.如权利要求56所述的重组多核苷酸,包括SEQID NO:31、或其编码具有GH61活性的多肽的片段。
58.如权利要求56所述的重组多核苷酸,包括SEQID NO:32至59的任一种、或其编码具有GH61活性的多肽的片段。
59.如权利要求56至58任一项所述的重组多核苷酸,其中所述GH61蛋白具有异源信号肽。
60.如权利要求56至59 任一项所述的重组多核苷酸,其是表达载体。
61.如权利要求60所述的表达载体,其中编码所述GH61蛋白的所述核酸序列可操作地连接于异源启动子。
62.—种宿主细胞,包含权利要求56至61任一项的重组多核苷酸。
63.如权利要求62所述的宿主细胞,还包含各编码一种纤维素酶的一种或多种基因。
64.如权利要求63所述的宿主细胞,其中所述纤维素酶选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、I型纤维二糖水解酶(CBHl)和2型纤维二糖水解酶(CBH2)。
65.如权利要求63或64所述的宿主细胞,其中所述纤维素酶编码基因的至少一种是重组多核苷酸。
66.如权利要求62至65任一项所述的宿主细胞,其中编码所述GH61蛋白的所述核酸序列可操作地连接于异源启动子。
67.如权利要求62至66任一项所述的宿主细胞,其是丝状真菌细胞。
68.如权利要求62至66任一项所述的宿主细胞,其是毛壳属(Chaetomium)、梭抱壳属(Thielavia)、支顶抱属(Acremonium)、毁丝霉属(Myceliophthora)、曲霉属(Aspergillus)或木霉属(Trichoderma)宿主细胞。
69.如权利要求68所述的宿主细胞,其是嗜热毁丝霉细胞。
70.如权利要求62至66任一项所述的宿主细胞,其是酵母细胞。
71.—种组合物,所述组合物由包括以下的方法制备:培养根据权利要求62至70任一项的宿主细胞,从所述培养获得肉汤,和任选地分级所述肉汤。
72.重组产生的GH61蛋白在产生乙醇中的用途, 其中所述GH61蛋白包括与选自SEQ ID NO:1至30的序列;或所述选择的序列的具有GH61活性的片段至少约80 %、约85 %、约90 %、约95 %、约97 %或约99 %相同的氨基酸序列;其中在纤维素经历被来自嗜热毁丝霉细胞的培养物肉汤中包含的纤维素酶糖化的反应中,所述GH61蛋白增加葡萄糖的产量。
73.如权利要求72所述的用途,其中所述GH61蛋白包括与SEQID NO:2 ;或其片段至少约95 %相同的氨基酸序列。
74.如权利要求72所述的用途,其中所述GH61蛋白包括与GH61o、GH61v、GH61x、GH61b和GH61e(SEQ ID NO:6、13、15、16、19、30)的任一种;或其片段至少95%相同的氨基酸序列。
75.如权利要求72所述的用途,其中所述GH61蛋白包括与GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)的任一种;或其片段至少95%相同的氨基酸序列。
76.如权利要 求72至75任一项所述的用途,其中所述GH61蛋白包括SEQID NO:1至30的任一种;或其片段。
77.一种重组核酸,编码如以上描述的GH61蛋白。
78.—种分离的或重组产生的如以上描述的GH61蛋白。
79.—种组合物,包含如以上描述的GH61蛋白和纤维素酶。
80.GH61蛋白在如 以上描述的水解纤维素基质或产生乙醇中的用途。
全文摘要
本发明提供从嗜热毁丝霉(Myceliophthora thermophila)获得的重组GH61蛋白、和编码所述蛋白的核酸。本发明还提供从嗜热毁丝霉上清液分离的、具有GH61蛋白活性的蛋白级分。这些制品可用于增加含纤维素的基质经历被一种或多种纤维素酶诸如内切葡聚糖酶、β-葡糖苷酶或纤维二糖水解酶糖化的反应中产物的产量。在乙醇生产中GH61蛋白与纤维素酶的组合可用于分解纤维素生物质为可发酵糖类。
文档编号C12N9/24GK103080306SQ201180040308
公开日2013年5月1日 申请日期2011年8月22日 优先权日2010年8月20日
发明者蒂普纳斯·贝德亚洛伊, 路易斯·克拉克, 奥诺拉托·坎波皮亚诺, 克丽帕·拉奥, 洛兰·绍博, 亚诺什·托罗克, 杨劼 申请人:科德克希思公司

最新回复(0)