乙酸转化提高的甘油和乙酸转化酵母细胞的制作方法
【专利说明】乙酸转化提高的甘油和乙酸转化酵母细胞 发明领域
[0001] 本发明涉及在微生物如酵母中的代谢工程。具体而言,本发明涉及乙酸转化提高 的甘油和乙酸转化酵母细胞。本发明还涉及其中所述酵母细胞生成发酵产物如乙醇的方 法。
[0002] 发明背景
[0003] 第二代生物乙醇由例如水解成游离单体糖如己糖和戊糖以发酵成乙醇的植物生 物质的木质纤维素级分生产。除生物质预处理和水解期间的糖释放外,还形成一些有毒副 产物。例如,糠醛和HMF就是这些产物中的两种。它们形成的量取决于几个预处理参数,如温 度、压力和预处理时间。木质纤维素水解产物也含有大量的乙酸,乙酸是微生物如酵母发酵 能力的强抑制剂。
[0004] 甘油是糖发酵成乙醇期间的主要副产物,其主要由于重氧化反应消耗在厌氧条件 下的生物合成期间形成的过量NADH而形成(van Dijken和Scheffers,1986)。因此,在工业 发酵期间,酵母细胞消耗的约5至10%的糖被转为甘油。降低这种多元醇的量被认为是增加 乙醇产量的有前景的途径。这可以通过调节分批补料过程中的进料速率,或通过选择生成 更少甘油的菌株而实现。
[0005] 然而,在文献中,已经报道几种不同的方法,它们可以帮助减少乙酸对水解产物中 糖发酵的抑制作用,以及通过缺失甘油生成中涉及的基因(例如通过酵母的遗传工程)(部 分)解决氧化还原平衡问题。
[0006] Sonderegger等(2004)公开了在发酵木糖的Saccharomyces cerevisiae菌株中磷 酸转乙酰酶和乙醛脱氢酶的异源表达。结合天然磷酸酮酶,Sonderegger等由此生成了功能 磷酸酮酶途径,其能够净重氧化通过用于该特定菌株中的木糖利用的木糖还原酶和木糖醇 脱氢酶的异源表达所产生的NADH。
[0007] Guadalupe等(2009)描述了一种Saccharomyces cerevisiae菌株,其中通过破坏 内源性NAD依赖型甘油3-磷酸脱氢酶基因(GPD1和GPD2)而消除副产物甘油的生成。编码乙 酰化NAD依赖型乙醛脱氢酶的E. col i mhpF基因的表达通过为培养基补充乙酸恢复了 gpdlgpd2双缺失菌株厌氧生长的能力。
[0008] Yu等(2010)构建了经代谢工程化以通过甘油脱氢酶(由GCY1编码)、二羟基丙酮激 酶(DAK1)和甘油摄取蛋白(GUP1)的同时过表达提高由甘油生成乙醇的Saccharomyces cerevisiae菌株。在同一团队的后来报告中(Yu等,2011),描述到分别编码醇脱氢酶和丙酮 酸脱羧酶的ADH1和roci的额外过表达引起在发酵条件下的生长速率和甘油消耗增加,导致 最终乙醇产量略有增加。
[0009] Lee和Dasilva(2006)公开了经工程化以通过引入Escherichia coli mgs和gldA 基因的表达等由甘油生成1,2_丙二醇的酵母Saccharomyces cerevisiae。
[0010] Guadelupe等(并且还在专利申请W0 2011/010923中)描述的技术提供了用于在生 物质糖发酵和前述乙酸发酵成例如乙醇期间降低水解产物的乙酸含量的方法。
[0011]通过引入额外的NADH生成途径,例如通过另外(过)表达甘油消耗途径,进一步增 强转化乙酸的能力是有潜在可能性的。在表达厌氧乙酸转化途径的酵母菌株(例如Medina 等,2009所描述)中引入前述⑶P1-、GCY1-和DAK1-基因(Yu等,2010)后,乙酸转化应增加以 维持氧化还原平衡,导致水解产物的去毒进一步增加且乙醇产量更高。然而Yu等的解决方 案不起作用,因为酵母甘油脱氢酶(由GCY1编码)使用NADP+作为辅因子,由于辅因子再生不 足而导致辅因子不平衡。替代性甘油脱氢酶(来自于E.coli的gldA)结合乙酸还原途径一起 被测试并且的确提高了在厌氧生长(发酵)条件下乙酸的转化(专利申请W02013/081456)。
[0012] 发明概述
[0013] 因此,本发明的一个目的是提供能够由乙酸或乙酸盐/酯(acetate)生成乙醇并同 时保持其发酵己糖(葡萄糖、果糖、半乳糖等)以及戊糖如木糖的能力的酵母,以及其中使用 这些菌株生成乙醇和/或其它发酵产物的方法。一个目的是提供能够由甘油和/或甘油和乙 酸生成乙醇并同时保持其发酵己糖(葡萄糖、果糖、半乳糖等)以及戊糖如木糖的能力的细 胞,例如酵母细胞。另一个目的是增加发酵产物的生成(产量、生产速率(production rate) 或两者)。
[0014] -个或多个目的根据提供经遗传修饰的酵母细胞的本发明实现,所述酵母细胞包 含:
[0015] a)编码异源NAD+依赖型乙酰化乙醛脱氢酶(E.C. 1.2.1.10)的一个或多个核苷酸 序列;
[0016 ] b)编码同源或异源乙酰-CoA合成酶(E. C. 6.2.1.1)的一个或多个核苷酸序列;
[0017] c)编码异源甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核苷酸序列;和
[0018] d)编码同源或异源二羟基丙酮激酶(E. C. 2.7.1.28或E. C. 2.7.1.29)的一个或多 个核苷酸序列。
[0019] 在一个实施方案中,所述细胞具有编码甘油3-磷酸磷酸水解酶和/或编码甘油3-磷酸脱氢酶基因的一个或多个内源核苷酸序列的缺失或破坏。
[0020] 以上一个或多个目的根据本发明实现。
[0021] 从实施例明显看出,根据本发明可以实现提高的发酵产物生产(乙醇)。
【附图说明】
[0022] 图1.甘油和乙酸(乙酸盐/酯)转化成乙醇所涉及的酶促反应的示意图。乙酸盐/酯 首先通过酵母酶Acs(Acsl和/或Acs2,分别由基因 ACS1和ACS2编码)转化成乙酰-CoA。然后 乙酰-CoA通过mhpF基因转化成乙醛,或通过来自于E. col i的双功能adhE酶(或催化相同转 化的类似酶)直接转化成乙醇。引入甘油消耗途径之后,转化外部添加的甘油,产生额外的 NADH流。GPD1和GPD2基因的缺失是任选的,以避免细胞内生成甘油和NADH被这些酶利用。
[0023] 由于甘油生成的消除、从培养基中(并且一直存在于木质纤维素水解产物中)的乙 酸盐/酯/乙酸和外部添加到培养基(或水解产物)中的甘油的乙醇产生,每所消耗糖(葡萄 糖和/或其它糖)的乙醇产量增加。
[0024]图2.菌株构建方法的示意图展示。使用PCR扩增INT(整合)侧翼和表达盒(CAS)(包 括选择标记)并转移到酵母中。将在接头之间(在图1中分别指定为5、a、b、c和3)进行重组, 导致所述途径整合在酵母基因组中的期望位置(在这种情况下为INT1)。目标基因的数量可 扩大,如实施例中所述。使用独特的接头以促进独立表达盒的重组并整合到受体细胞的基 因组中。
[0025]图3.筛选结果。根据残留的乙酸盐/酯浓度绘制残留的乙酸浓度。
[0026]图4.根据残留的乙酸盐/酯浓度绘制残留的乙酸浓度。基于残留的乙酸盐/酯和甘 油浓度以及由甘油和乙酸盐/酯的乙醇产生,用暗灰色显示150个表现最佳的菌株。
[0027] 图5.新产生的转化株(R1-R8)和参考菌株(RN1069、RN1189和YD01247)的再筛选结 果。每次转化挑选8个独立转化株。同样,以8倍接种参考菌株。在上图中,描绘了孵育72小时 后残留的乙酸(乙酸盐/酯)浓度。在下图中,绘制了残留的甘油浓度。
[0028] 图6.筛选结果。总共筛选2592个菌株,包括参考菌株RN1189。参考菌株RN1189被包 括27次。在下图中描绘了参考菌株RN1189相对于其它菌株(总共2592个)的性能。如前所述 为菌株评级,其中表现最佳的菌株用较浅的颜色表示(并且更靠近图的左下角)。表现较不 好的菌株用较深的颜色表示;颜色变化是渐进的。参考菌株RN1189例外,其用最深的颜色表 7Jn 〇
[0029]图7.筛选结果。这里;^出了表现最佳的前五个菌株:1)表;^YD01247,2)是 YD01248,3)是YD01249,4)是YD01250。菌株5既未命名也未进一步试验。
[0030] 序列表简述
[0031 ] SEQ ID NO: ladhE Escherichia coli双功能乙醛-CoA/醇脱氢酶(蛋白质);
[0032] SEQ ID N0:2acdH Lactobacillus plantarum乙酸脱氢酶(蛋白质);
[0033] SEQ ID N0:3eutE Escherichia coli乙醇胺利用蛋白(蛋白质);
[0034] SEQ ID N0:4Linll29Listeria innocua酸脱氢酶(蛋白质);
[0035] SEQ ID N0:5adhE Staphylococcus aureus双功能乙酸-CoA/醇脱氢酶(蛋白质);
[0036] SEQ ID N0:6ACS2Saccharomyces cerevisiae乙酰-CoA连接酶(蛋白质);
[0037] SEQ ID N0:7gldA Escherichia coli甘油脱氣酶(蛋白质);
[0038] SEQ ID N0:8gldA Klebsiella pneumoniae甘油脱氢酶(蛋白质);
[0039] SEQ ID N0:9gldA Enterococcus aerogenes甘油脱氣酶(蛋白质);
[0040] SEQ ID NO: lOgldA Yersinia aldovae甘油脱氣酶(蛋白质);
[0041 ] SEQ ID NO: llDAKISaccharomyces cerevisiae二羟基丙酮激酶(蛋白质);
[0042] SEQ ID NO: 12dhaK Klebsiella pneumoniae二羟基丙酮激酶(蛋白质);
[0043] SEQ ID NO: 13DAKlYarrowia lipolytica二羟基丙酮激酶(蛋白质);
[0044] SEQ ID NO: 14DAKlSchizosaccharomyces pombe二羟基丙酮激酶(蛋白质);
[0045] SEQ ID NO: 15含TDH3-启动子的片段;
[0046] SEQ ID NO: 16含TDH1-启动子的片段;
[0047] SEQ ID奶:17含?61(1-终止子的片段;
[0048] SEQ ID奶:18含卩61(1-启动子的片段;
[0049] SEQ ID奶:19含卩1^3-启动子的片段;
[0050] SEQ ID N0:20含PGI1-终止子的片段;
[0051 ] SEQ ID N0:21 含EN01-启动子的片段;
[0052] SEQ ID N0:22含ACT1-启动子的片段;
[0053] SEQ ID N0:23含CYC1-终止子的片段;
[0054] SEQ ID N0:24含TPI1-启动子的片段;
[0055] SEQ ID从):25含八了67-启动子的片段;
[0056] SEQ ID N0:26含EN01-终止子的片段;
[0057] SEQ ID N0:27kanMX标记和侧翼区的序列;
[0058] SEQIDN0:28基因破坏盒GPDl::hphMX的序列;
[0059] SEQIDN0:29基因破坏盒GPD2::natMX的序列;
[0060] SEQ ID NO:30正向引物5'INTI片段(INT5-f);
[0061] SEQ ID NO:31 反向引物5'INTI片段(INT5-r);
[0062] SEQ ID N0:32正向引物表达盒l(con5-f);
[0063] SEQ ID NO :33反向引物表达盒 1(conA-r);
[0064] SEQ ID从):34正向引物标记(。〇1^矸);
[0065] SEQ ID 从):35反向引物标记((:〇1^1);
[0066] SEQ ID NO:36正向引物表达盒2(conB-f);
[0067] SEQ ID NO:37反向引物表达盒2(conC-r);
[0068] SEQ ID NO:38正向引物表达盒3(conC-f);
[0069] SEQ ID NO:39反向引物表达盒3(conD-r);
[0070] SEQ ID NO :40正向引物表达盒4(conD-f);
[0071] SEQ ID N0:41 反向引物表达盒4(con3-r);
[0072] SEQ ID NO:42正向引物3'INTI片段(INT3-f);
[0073] SEQ ID NO:43反向引物3'INTI片段(INT3-r);
[0074] SEQ ID 勵:44质粒口5厶131311的序列;
[0075] SEQ ID 从):45质粒口80*11的序列;
[0076] SEQ ID 从):46质粒口001*11的序列;
[0077] SEQ ID 从):47质粒口031*11的序列;
[0078] SEQ ID N0:48含有经密码子对优化以在S.cerevisiae中表达的adhE(E.coli)DNA 序列的序列;
[0079] SEQ ID N0:49含有经密码子对优化以在S.cerevisiae中表达的acdH (L.plantarum)DNA 序列的序列;
[0080] SEQ ID N0:50含有经密码子对优化以在S.cerevisiae中表达的eutE(E.coli)DNA 序列的序列;
[0081 ] SEQ ID N0:51含有经密码子对优化以在S.cerevisiae中表达的Linll29 (L. innocua)DNA序列的序列;
[0082] SEQ ID N0:52含有经密码子对优化以在S.cerevisiae中表达的adhE(S.aureus) DNA序列的序列;
[0083] SEQ ID N0:53含有经密码子对优化以在S.cerevisiae中表达的ACS2 (S. cerevisiae)DNA 序列的序列;
[0084] SEQ ID N0:54含有经密码子对优化以在S.cerevisiae中表达的gldA(E.coli)DNA 序列的序列;
[0085] SEQ ID N0:55含有经密码子对优化以在S.cerevisiae中表达的gldA (Κ· pneumoniae) DNA序列的序列;
[0086] SEQ ID N0:56含有经密码子对优化以在S.cerevisiae中表达的gldA (E.aerogenes)DNA 序列的序列;
[0087] SEQ ID NO:57含有经密码子对优化以在S.cerevisiae中表达的gldA(Y.aldovae) DNA序列的序列;
[0088] SEQ ID N0:58含有经密码子对优化以在S.cerevisiae中表达的DAK1 (S. cerevisiae)DNA 序列的序列;
[0089] SEQ ID N0:59含有经密码子对优化以在S.cerevisiae中表达的dhaK (Κ· pneumoniae) DNA序列的序列;
[0090] SEQ ID N0:60含有经密码子对优化以在S.cerevisiae中表达的DAK1 (Υ· lipolytica)DNA序列的序列;
[0091] SEQ ID N0:61含有经密码子对优化以在S.cerevisiae中表达的DAKl(S.pombe) DNA序列的序列;
[0092] 发明详述
[0093] Saccharomyces cerevisiae在厌氧条件下由糖如葡萄糖生成乙醇。这个过程是氧 化还原中性的。然而在酵母生长时,产生过剩的NADH。为了恢复氧化还原平衡,酵母将生成 甘油。在这个过程期间,NADH再次转化为NAD+。乙醇工业将甘油视为不期望的副产物。去除 厌氧条件下的甘油形成是乙醇工业长期以来的期望。如上所述,几个不同的团队已经做出 若干尝试以使碳通量从甘油形成重定向到乙醇,从而增加乙醇产率。
[0094] 防止甘油形成最直接的方法会是缺失编码参与甘油生物合成的蛋白质的基因。然 而,当GPD1和GPD2基因被破坏时,酵母不能在厌氧条件下生长,因其不能恢复其氧化还原平 衡。16虹11 &等(2〇〇9)证明在引入祖〇!1依赖型乙酰-(:(^脱氢酶基因0耶.(3〇1丨1111^?-基因,如 Medina等所述)后,如果向发酵培养基中供给乙酸,则gpdlgpd2双缺失菌株在厌氧条件下生 长的能力恢复。乙酸通过ACS 1 /ACS2基因产物转化为乙酰-CoA。乙酰-CoA通过mhpF和ADH1基 因产物转化为乙醛并随后转化为乙醇(Medina等,2009)。这样,消除了不希望的副产物(甘 油)的形成,产生更高的乙醇产率。
[0095]因为乙酸常常被视为水解产物中(尤其是?財妾近或低于乙酸?1^(?1^说(3~4.76) 的水解产物中)存在的毒性最强的化合物,所以期望进一步降低水解产物中的乙酸盐/酯 (乙酸)浓度。增加酵母的乙酸盐/酯厌氧转化潜力的一种方式是通过引入甘油转化途径。通 过引入转化外部添加的甘油的甘油途径,由于gpdlgpd2细胞本身不生成甘油,所以产生甚 至更多NADH,迫使酵母细胞转化更多的乙酸以便维持氧化还原平衡(参见图1和W02013/ 081456)〇
[0096]甘油在生物提炼中可足够大量地获得。为了这个目的,使来自于E. coli的基因 gldA和来自于S.cerevisiae的DAK1过表达,以允许有毒乙酸向乙醇的转化进一步增加 (TO 2013/081456)。的确,获得了更高的乙醇产量。
[0097] 为了在速率和量上更进一步提高甘油和乙酸两者的厌氧(共)转化,试验了替代的 基因组合。对于所述途径中的多个酶,即甘油脱氢酶、二羟基丙酮激酶和乙醛脱氢酶,试验 了可以进一步增强酵母菌株在厌氧条件下除戊糖和己糖之外也将甘油和乙酸转化成乙醇 的能力的多个替代基因。
[0098] 因此,本发明提供了经遗传修饰的酵母细胞,其包含:
[0099] a)编码NAD+依赖型乙酰化乙醛脱氢酶(E.C. 1.2.1.10)的一个或多个核苷酸序列;
[0100] b)编码乙酰-CoA合成酶(E.C.6.2.1.1)的一个或多个核苷酸序列;
[0101 ] c)编码甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核苷酸序列;和
[0102] d)编码二羟基丙酮激酶(E. C. 2.7.1.28或E. C. 2.7.1.29)的一个或多个核苷酸序 列。
[0103] 下面描述了本发明的一些实施方案。下列项描述了本发明的几个实施方案,其中 详述了以上特征a)到d)等等:
[0104] 第1 项:
[0105] 经遗传修饰的细胞,其包含:
[0106] a)编码NAD+依赖型乙酰化乙醛脱氢酶(E.C. 1.2.1.10)的一个或多个核苷酸序列;
[0107] b)编码乙酰-CoA合成酶(E.C.6.2.1.1)的一个或多个核苷酸序列;
[0108] C)编码甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核苷酸序列;和
[0109] d)编码二羟基丙酮激酶(E. C. 2.7.1.28或E. C. 2.7.1.29)的一个或多个核苷酸序 列。
[0110] 第 la 项:
[0111] 经遗传修饰的细胞,其包含:
[0112] a)编码异源NAD+依赖型乙酰化乙醛脱氢酶(E.C. 1.2.1.10)的一个或多个核苷酸 序列;
[0113] b)编码同源或异源乙酰-CoA合成酶(E. C. 6.2.1.1)的一个或多个核苷酸序列;
[0114] c)编码异源甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核苷酸序列;和
[0115] d)编码同源或异源二羟基丙酮激酶(E. C. 2.7.1.28或E. C. 2.7.1.29)的一个或多 个核苷酸序列。
[0116] 第2项·
[0117]根据第1项所述的细胞,其包含编码甘油3-磷酸磷酸水解酶(GPP1、GPP2)和/或编 码甘油3-磷酸脱氢酶基因(GH)1、GPD2)的一个或多个内源核苷酸序列的缺失或破坏;
[0118]第3项·
[0119]根据第1项或第2项所述的细胞,其中
[0120] b)是编码SEQ ID N0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQ ID N0:6具有至少60%序列同一性的SEQ ID N0:6功能同源物的一个或多个异源核苷酸序 列;
[0121 ]第4项.根据第3项所述的细胞,其中
[0122] C)是编码SEQIDN0:7表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0 :7具 有至少60%序列同一性的SEQ ID N0:7功能同源物的一个或多个核苷酸序列;和/或
[0123] 编码SEQIDN0:9表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:9具有至 少60%序列同一性的SEQ ID N0:9功能同源物的一个或多个核苷酸序列;
[0124] 第5项.根据第4项所述的细胞,其中
[0125] C)是编码SEQIDN0:7表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0 :7具 有至少60%序列同一性的SEQ ID N0:7功能同源物的一个或多个核苷酸序列。
[0126] 第6项.根据第1-5项中任一项所述的细胞,其中
[0127] d)是编码SEQ ID N0:11表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 11具有至少60%序列同一性的SEQ ID NO: 11功能同源物的 一个或多个核苷酸序列,和/或
[0128] 编码SEQ ID N0: 13表示的同源或异源二羟基丙酮激酶(E.C.2.7. 1.28或 E.C.2.7.1.29)或与SEQ ID N0:13具有至少60%序列同一性的SEQ ID N0:13功能同源物的 一个或多个核苷酸序列。
[0129] 第7项.根据第6项所述的细胞,其中
[0130] d)是编码SEQ ID N0:13表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 13具有至少60%序列同一性的SEQ ID NO: 13功能同源物的 一个或多个核苷酸序列。
[0131] 第8项.根据第1-7项中任一项所述的细胞,其中
[0132] a)是编码SEQ ID N0:1表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQ ID N0: 1具有至少60%序列同一性的SEQ ID NO: 1功能同源物的一个或多个核苷酸序列;和/或
[0133] 编码SEQ ID N0:2表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQ ID N0: 2具 有至少60%序列同一性的SEQ ID NO: 2功能同源物的一个或多个核苷酸序列,和/或
[0134] 编码SEQ ID N0:3表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQ ID N0: 3具 有至少60%序列同一性的SEQ ID N0:3功能同源物的一个或多个核苷酸序列。
[0135] 第9项.根据第8项所述的细胞,其中
[0136] a)是编码SEQ ID N0:1表示的异源NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10) 或与SEQ ID NO: 1具有至少60%序列同一性的SEQ ID NO: 1功能同源物的一个或多个核苷 酸序列;和/或
[0137] 编码SEQ ID N0:2表示的异源NAD+依赖型乙酰化乙醛脱氢酶江.(:.1.2.1.10)或与 SEQ ID N0: 2具有至少60%序列同一性的SEQ ID N0: 2功能同源物的一个或多个核苷酸序 列。
[0138] 第10项.根据第9项所述的细胞,其中
[0139] a)是编码SEQ ID N0: 2表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQ ID N0: 2具有至少60%序列同一性的SEQ ID N0:2功能同源物的一个或多个核苷酸序列。
[0140] 第11项.根据第1-10项中任一项所述的细胞,其中
[0141] a)是编码SEQ ID N0:3表示的异源NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10) 或与SEQ ID N0:3具有至少60%序列同一性的SEQ ID N0:3功能同源物的一个或多个核苷 酸序列;
[0142] b)是编码SEQ ID N0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQ ID N0:6具有至少60%序列同一性的SEQ ID N0:6功能同源物的一个或多个核苷酸序列;
[0143] C)是编码SEQIDN0:7表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0 :7具 有至少60%序列同一性的SEQ ID N0:7功能同源物的一个或多个核苷酸序列;和
[0144] d)是编码SEQ ID N0:11表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 11具有至少60%序列同一性的SEQ ID NO: 11功能同源物的 一个或多个核苷酸序列。
[0145] 第12项.根据第1-10项中任一项所述的细胞,其中
[0146] a)是编码SEQ ID N0:2表示的异源NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10) 或与SEQ ID N0:2具有至少60%序列同一性的SEQ ID N0:2功能同源物的一个或多个核苷 酸序列;
[0147] b)是编码SEQ ID N0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQ ID N0:6具有至少60%序列同一性的SEQ ID N0:6功能同源物的一个或多个核苷酸序列;
[0148] c)是编码SEQIDN0:9表示的异源甘油3-磷酸脱氢酶(E.C.1.1.1.8)或与SEQID N0:9具有至少60%序列同一性的SEQ ID N0:9功能同源物的一个或多个核苷酸序列;和
[0149] d)是编码SEQ ID N0:11表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 11具有至少60%序列同一性的SEQ ID NO: 11功能同源物的 一个或多个核苷酸序列。
[0150]第13项.根据第1-10项中任一项所述的细胞,其中a)是编码SEQ ID N0:2表示的异 源NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10)或与SEQIDN0:2具有至少60%序列同一 性的SEQ ID N0:2功能同源物的一个或多个核苷酸序列;
[0151] b)是编码SEQ ID N0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQ ID N0:6具有至少60%序列同一性的SEQ ID N0:6功能同源物的一个或多个核苷酸序列;
[0152] C)是编码SEQIDN0:7表示的异源甘油3-磷酸脱氢酶(E.C.1.1.1.8)或与SEQID N0:7具有至少60%序列同一性的SEQ ID N0:7功能同源物的一个或多个核苷酸序列;和
[0153] d)是编码SEQ ID N0:13表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 13具有至少60%序列同一性的SEQ ID NO: 13功能同源物的 一个或多个核苷酸序列。
[0154] 第14项.根据第1-10项中任一项所述的细胞,其中
[0155] a)是编码SEQ ID N0:1表示的异源NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10) 或与SEQ ID NO: 1具有至少60%序列同一性的SEQ ID NO: 1功能同源物的一个或多个核苷 酸序列;
[0156] b)是编码SEQ ID N0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQ ID N0:6具有至少60%序列同一性的SEQ ID N0:6功能同源物的一个或多个核苷酸序列;
[0157] C)是编码SEQIDN0:7表示的异源甘油3-磷酸脱氢酶(E.C.1.1.1.8)或与SEQID N0:7具有至少60%序列同一性的SEQ ID N0:7功能同源物的一个或多个核苷酸序列;和
[0158] d)是编码SEQ ID N0:13表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQ ID NO: 13具有至少60%序列同一性的SEQ ID NO: 13功能同源物的 一个或多个核苷酸序列。
[0159] 可通过修饰宿主细胞而制备根据本发明所述的细胞,例如引入多核苷酸和/或表 达蛋白质,例如对应以上特征a)到d)的核苷酸。
[0160] 多核苷酸或蛋白质可对于宿主细胞的基因组为同源或异源的。术语"异源",就宿 主细胞而言,意指多核苷酸并非自然出现在宿主细胞的基因组中或多肽并非由该细胞自然 产生。"同源",就宿主细胞而言,意指多核苷酸自然出现在宿主细胞的基因组中或多肽由该 细胞自然产生。同源蛋白质表达可以是例如在不同启动子的控制下表达或过表达。异源蛋 白质表达涉及并非在宿主细胞中自然产生的蛋白质的表达。
[0161] 图1中说明了根据本发明所述的细胞。图1给出了参与将甘油和乙酸(乙酸盐/酯) 转化成乙醇的酶促反应的示意图。乙酸盐/酯首先通过酵母酶AcsUcsl和/或Acs2,分别由 基因4031和六032编码)转化成乙酰-(:(^。然后乙酰-(:(^通过1111^^基因转化成乙醛,或通过来 自于E.coli的双功能adhE酶(或催化相同转化的类似酶)直接转化成乙醇。引入甘油消耗途 径之后,转化外部添加的甘油,产生额外的NADH流。如图1和第2项中所示,GPD1和GPD2基因 可被缺失以避免细胞内生成甘油和NADH被这些酶利用。
[0162] 由于甘油生成的消除,从培养基中(并且一直存在于木质纤维素水解产物中)的乙 酸盐/酯/乙酸和外部添加到培养基(或水解产物)中的甘油产生乙醇,每消耗糖(葡萄糖或 其它糖)的乙醇产量增加。
[0163] 本说明书和所附权利要求全篇中,词语"包含"和"包括"及变型如"含有"将包括性 地解释。即,这些词旨在表达情况允许时,可能包括未具体指出的其它要素或整体。不使用 数量词修饰时在本文中用于指一个或多于一个(即一个或至少一个)对象。举例而言,"要 素"可意为一个要素或多于一个的要素。
[0164] "功能"多肽"在本文中也称为"多肽"功能""或"多肽",功能多肽多聚核苷酸"在 本文中是编码"功能"多肽的多核苷酸。本发明还涉及编码此类多肽的多核苷酸,包含编码 多肽的多核苷酸的核酸构建体及用于异源多肽在(酵母)细胞中功能性表达的载体,所述表 达载体包含与在细胞中具功能性的启动子可操作性连接的异源核酸序列并且所述异源核 酸序列编码在所述细胞(的细胞溶质)中具有"功能"酶活性的多肽。本文的"功能"多肽可具 有除"功能"活性外的一种或多种替代和/或附加活性。
[0165] 本文提到的E.C.代码仅用于阐明"功能",但不应以任何方式视为对"功能"的限 制。
[0166] 本文中编码酶的任何外源基因均包含编码与任何SEQ ID Ν0:Χ具有至少50%、 60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列的核苷酸序列,其中 SEQ ID Ν0:Χ是本申请的序列表中的任何蛋白质序列。尤其对于全部SEQ ID N0:1-14。编码 酶的外源基因还可包含编码与任何SEQ ID Ν0:Χ的氨基酸序列相比具有一个或几个替换、 插入和/或缺失的氨基酸序列的核苷酸序列。尤其对于全部SEQ ID N0:1-14。优选地,氨基 酸序列与SEQ ID Ν0:Χ相比具有不超过420、380、300、250、200、150、100、75、50、40、30、20、 10、9、8、7、6、5、4、3、2或l个氨基酸替换、插入和/或缺失。尤其对于全部SEQIDN0 :l-14。
[0167] 本文中编码酶的任何外源基因均包含与任何SEQ ID NO: Y具有至少40%、50%、 60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、 99%或100%核苷酸(DNA)序列同一性的核苷酸序列,其中SEQ ID NO: Y是本申请的序列表 中的任何核苷酸(DNA)序列。尤其对于SEQ ID NO:48-61全部而言。
[0168] 现将在以下更详细地描述第1项的特征a)到d)。
[0169] 特征a)编码NAD+依赖型乙酰化乙醛脱氢酶的一个或多个核苷酸序列:
[0170]本发明的细胞包含编码能够将乙酰CoA还原成乙醛的酶的外源基因,该基因赋予 细胞将乙酰CoA (和/或乙酸)转化成乙醇的能力。能够将乙酰CoA还原成乙醛的酶在本文中 被理解为催化以下反应的双功能酶(adhE):
[0171]乙醛+NADH〇 乙醇-fN AD (1)
[0172]和/或
[0173] NAD++辅酶 A+乙醛〇NADH+乙酰-CoA (2)
[0174] 因此,该酶催化乙醛转化成乙醇(并且反之亦然)并且也称为乙醛脱氢酶(NAD+依 赖型)。该酶是进一步催化辅酶A和乙醛转化成乙酰- C〇A(并且反之亦然)的双功能酶,也命 名为乙醛脱氢酶。当由生长培养基中存在的乙酸盐/酯生成乙酰-辅酶A时,这种酶允许NADH 再氧化,并且因此对于氧化还原辅因子平衡而言不再需要甘油合成。编码NADH依赖型乙酰 化乙醛脱氢酶(E.C. 1.2.1.10)的核酸序列原则上可来源于包含编码所述脱氢酶的核酸序 列的任何生物。
[0175] 可以催化乙酰-辅酶A向乙醛的NADH依赖性还原的已知NAD+依赖型乙酰化乙醛脱 氢酶可一般地分成三类NADH依赖型乙酰化乙醛脱氢酶功能同源物:
[0176] 1)催化乙酰-辅酶A向乙醛的可逆转化以及随后乙醛向乙醇的可逆转化的双功能 蛋白质。这类蛋白质的一个实例为E. col i中的AdhE蛋白(基因库编号:NP-415757)。AdhE似 乎是基因融合的进化产物。AdhE蛋白的NH2-末端区域与醛:NADH氧化还原酶高度同源,而 C00H-末端区域与Fe2+-依赖型乙醇:NADH氧化还原酶家族同源(Membrillo-Hernandez等, (2000)11101.0^111.275:33869-33875)^.(3011 AdhE经受金属催化的氧化并因此对氧敏 感(Tamarit等(1998)J.Biol.Chem.273:3027-32)。
[0177] 2)在严格或兼性厌氧微生物中催化乙酰-辅酶A向乙醛的可逆转化但不具有醇脱 氢酶活性的蛋白质。这类蛋白质的一个实例在Clostridium kluyveri中已有报道(Smith等 (1980) Arch.Biochem.Biophys.203:663_675)。乙酰化乙酸脱氢酶在Clostridium kluyveri DSM 555的基因组中已有注解(基因库编号:EDK33116)。在Lactobacillus plantarum的基因组中鉴定出同源蛋白AcdH(基因库编号:NP-784141)。这类蛋白质的另一 实例是Clostridium beijerinckii NRRL B593中的所述基因产物(Toth等(1999) Appl · Environ .Microbiol · 65:4973-4980,基因库编号:AAD31841) 〇
[0178] 3)作为参与4-羟基-2-酮戊酸酯/盐分解代谢的双功能醛缩酶-脱氢酶复合物的一 部分的蛋白质。此类双功能酶催化儿茶酚间位切割途径的最后两步,儿茶酚是许多细菌物 种中酚、甲苯酸盐/酯、萘、联苯和其它芳香族化合物降解期间的中间产物(Powlowski和 Shingler(1994)Biodegradation 5,219-236)。4_羟基-2-酮戊酸酯/盐首先被4-羟基-2-酮 戊酸醛缩酶转化为丙酮酸盐/酯和乙醛,随后乙醛被乙酰化乙醛脱氢酶转化为乙酰-CoA。这 类乙酰化乙醛脱氢酶的一个实例为Pseudomonas sp CF600中的DmpF蛋白(基因库编号: CAA43226) (Shingler等(1992) J. Bacteriol · 174:711-24) qE. coli MphF蛋白(Ferrandez等 (1997)J.Bacteriol · 179:2573-2581,基因库编号:NP-414885)与Pseudomonas sp·CF600中 的DmpF蛋白同源。
[0179] 尤其是在选自以下的生物中可以找到适合的核酸序列:Escherichia,尤其是 E. coli ;Mycobacterium,尤其是Mycobacterium marinum、Mycobacterium ulcerans、 Mycobacterium tuberculosis; Carboxy do thermus,尤其是Carboxy do thermus hy dr ogeno forman s ; Entamoeba,尤其是Entamoeba histolytica; Shigella,尤其是 Shigella sonnei ;Burkholderia,尤其是Burkholderia pseudomallei ;Klebsiella,尤其 是Klebsiella pneumoniae ;Azotobacter,尤其是Azotobacter uinelandii ;Azoarcus sp; Cupriauidus,尤其是Cupriauidus taiwanensis ; Pseudomonas,尤其是Pseudomonas sp · CF600;Pelomaculum,尤其是Pelotomaculum thermopropionicum。优选地,编码NADH依 赖型乙酰化乙醛脱氢酶的核酸序列来源于Escherichia,更优选地来自E. col i。
[0180] 特别适合的是来自于E. coli的mhpF基因或其功能同源物。这个基因在Ferrandez 等(1997) J.Bacteriol. 179:2573-2581中有描述。已经用S.cerevisiae获得好结果,其中已 经并入来自于E.coli的mhpF基因。
[0181]在另一有利实施方案中,编码(乙酰化)乙醛脱氢酶的核酸序列来自于,尤其是来 自于Pseudomonas sp · CF600的Pseudomonas dmpF〇
[0182] 原则上,编码NAD+依赖型乙酰化乙醛脱氢酶的核酸序列可为野生型核酸序列。优 选的核酸序列编码W02011010923中用SEQ ID N0:2、SEQ ID ^):29表示的嫩0+依赖型乙酰 化乙醛脱氢酶或W02011010923中SEQIDN0:2或SEQIDN0 :29的功能同源物。特别地,该核 酸序列包含根据W02011010923中的SEQ ID N0:1、SEQ ID N0:28的序列或W02011010923中 SEQIDN0:1或SEQIDN0:28的功能同源物。
[0183] 进一步地,乙酰化乙醛脱氢酶(或编码此类活性的核酸序列)可例如选自E . col i adhEnEntamoeba histolytica adh2、Staphylococcus aureus adhE、Piromyces sp.E2adhE、Clostridium kluyveri EDK33116、Lactobaci1lus plantarum acdH和 Pseudomonas putida YP 001268189的组。对于这些酶的序列、编码这些酶的核酸序列和将 核酸序列整合入宿主细胞的方法,参考W0 20091013159,尤其是实施例3、表1(第26页)和其 中提到的序列ID编号,该公开中表1和所述表中提到的序列ID编号表示的序列通过引用并 入本文。
[0184]还应理解,在一个优选实施方案中,细胞具有允许被提供了乙醛脱氢酶活性的细 胞完成乙酰-CoA向乙醇的转化的内源醇脱氢酶活性。还进一步优选,宿主细胞具有允许被 提供了乙醛脱氢酶活性的细胞完成乙酸(经由乙酰-CoA)向乙醇的转化的内源乙酰-CoA合 成酶。
[0185] 编码具有乙醛脱氢酶活性的酶的外源基因优选包含编码与SEQ ID NO: 1至SEQ ID N0:5,优选SEQ ID N0:1 至SEQ ID N0:3,更优选SEQ ID N0:1 或SEQ ID N0:2中的任一个具 有至少 40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 氨基酸序列同 一性的氨基酸序列的核苷酸序列。编码具有乙醛脱氢酶活性的酶的外源基因也可包含编码 与SEQIDN0:1至SEQIDN0:5,优选SEQIDN0:1至SEQIDN0:3,更优选SEQIDN0:1或 SEQ ID N0:2中的任一个的氨基酸序列相比具有一个或几个替换、插入和/或缺失的氨基酸 序列的核苷酸序列。优选地,该氨基酸序列分别与SEQ ID NO: 1至SEQ ID N0:5相比,优选地 分别与SEQ ID NO: 1至SEQ ID NO: 3相比,更优选地分别与SEQ ID NO: 1或SEQ ID NO: 2相 比,具有不超过420、380、300、250、200、150、100、75、50、40、30、20、10或5个氨基酸替换、插 入和/或
缺失。
[0186] 本文中编码具有乙醛脱氢酶活性的酶的外源基因包含与任何SEQ ID Ν0:Υ具有至 少 40%、50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、96%、 97%、98%、99%或100%核苷酸(DNA)序列同一性的核苷酸序列,其中SEQIDN0 :Y是核苷 酸(DNA)序列48-52中的任一个。
[0187] 表1中提到了可为可适于在本发明的细胞中表达的adhE酶的来源的一些生物。
[0188] 表1:具有醇/乙醛脱氢酶(adhE)活性的酶的生物
[0189] 生物
[0190] Piromyces sp E2
[0191] Arthrospira platensis
[0192] Synechococcus sp.
[0193] Microcystis aeruginosa
[0194] Microcoleus chthonoplastes
[0195] Lyngbya sp.
[0196] Thermosynechococcus elongatus
[0197] Treponema phagedenis
[0198] Clostridium difficile
[0199] Clostridium carboxidivorans
[0200] Clostridium acetobutylicum
[0201 ]适合的酶的实例为Escherichia coli的adhE、Lactobacillus plantarum的acdH、 Escherichia coli的eutE、Listeria innocua的Linll29和来自于Staphylococcus aureus 的adhE。这些酶的BLAST参见下表2(a)至2(e),给出了在下面的实施例中试验的适合的替代 性醇/乙醛脱氢酶。
[0202] 表2(a)BLAST查询-来自于Escherichia coli的adHE
[0203]
[0204] 表2(b)BLAST查询-来自于Lactobacillus plantarum的acdH 1
[0206] 表2(c)BLAST查询-来自于Escherichia coli的eutE
[0207]
[0209] 表2(d)BLAST查询-来自于Listeria innocua的Linll29 1
[0211 ]表2(e)BLAST查询-来自于Staphylococcus aureus的adhE [0212]
[0213] 特征b:编码乙酰-CoA合成酶(E. C. 6.2.1.1)的一个或多个核苷酸序列
[0214] 乙酰-CoA合成酶(也称为乙酸-CoA连接酶和乙酰基活化酶)是在原核生成和真核 生物两者中找到的泛在酶,其催化由乙酸盐/酯、辅酶A (CoA)和ATP形成乙酰-CoA,如下所示 [PMID:15316652]:
[0215] ATP+乙酸盐/酯+CoA=AMP+二磷酸盐/酯+乙酰-CoA (4)
[0216] 这种酶的活性对于维持所需的乙酰-CoA水平至关重要,乙酰-CoA是许多重要的生 物合成和分解代谢过程中的关键中间产物。在真核物种中尤其重要,因为它是在这些生物 中将乙酸盐/酯活化为乙酰-CoA的唯一途径(一些原核物种也可以通过乙酸激酶/磷酸转乙 酰酶或通过形成ADP的乙酰-CoA合酶活化乙酸盐/酯)。真核生物通常具有乙酰-CoA合成酶 的两种同种型,生物合成过程中涉及的细胞溶质形式和主要在能量产生中涉及的线粒体形 式。
[0217]已经确定了这种酶的真核(例如来自于酵母)和细菌(例如来自于Salmonella)形 式的晶体结构。酵母酶为三聚体,而细菌酶为单体。然而酵母蛋白质的三聚体状态可以是这 种生物独有的,因为三聚体界面中涉及的残基在其它序列中保守性极低。尽管在两种酶的 寡聚状态上有差异,但是单体的结构几乎相同。含有两个平行β折叠的大N端结构域(~500 残基)后面是含有带螺旋的三链β折叠的小(~110残基)C端结构域。活性位点出现在结构域 界面处,其含量决定了 C端结构域的定向。
[0218]当细胞是酵母细胞时,根据本发明优选内源ACS,在一个实施方案中其在酵母细胞 中过表达。
[0219]表3中列出了适合的实例。在表3顶部,提到了实施例中所用的并且经BLASTED的 ACS2〇
[0220] 產兰:BLAST查询-来自于Saccharomyces cerevisiae的ACS2
[0221]
[0223] 编码具有ACS活性的酶的外源基因优选地包含编码与SEQ IDN0:6具有至少50%、 60%、65%、70%、75%、80%、85%、90%、95%、98%、99%氨基酸序列同一性的氨基酸序列 的核苷酸序列。编码具有ACS活性的酶的外源基因还可包含编码与SEQ IDN0:6的氨基酸序 列相比具有一个或几个替换、插入和/或缺失的氨基酸序列的核苷酸序列。优选地,氨基酸 序列与SEQ IDN0:6相比具有不超过420、380、300、250、200、150、100、75、50、40、30、20、10或 5个氨基酸替换、插入和/或缺失。
[0224] 本文中编码具有ACS活性的酶的外源基因包含与SEQ ID N0: 53具有至少40%、 50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、96%、97%、 98%、99%或100%核苷酸(DNA)序列同一性的核苷酸序列。
[0225] 特征c):根据特征c),该细胞包含编码甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核 苷酸序列。甘油脱氢酶(E.C. 1.1.1.6)是催化以下化学反应的酶:
[0226] 甘油+NAD+# 甘油酮+NADH+H+ (5)
[0227] 因此,这种酶的两种底物为甘油和NAD+,而其三种产物为甘油酮、NADH和H+。甘油酮 和二羟基丙酮在本文中为同义词。
[0228]这种酶属于氧化还原酶家族,特别是作用于具有NAD+或NADP+作为受体的供体的 CH-OH基团的那些酶。这种酶类的系统名称为甘油:NAD+2-氧化还原酶。其它常用名称包括 丙三醇脱氢酶和NAD+连接的甘油脱氢酶。这种酶参与甘油脂质代谢。结构研究已经证实该 酶为锌依赖型,活性位点位于蛋白质的两个结构域之间。
[0229] 表4(a)至4(d)中列出了适合的甘油脱氢酶的实例。在每个表的顶部,提到了实施 例中所用的并且经BLASTED的g 1 dA。
[0230] 表4(a) :BLAST查询-来自于Escherichia coli的gldA
[0231]
[0232] 表4(b) :BLAST查询-来自于Klebsiella pneumoniae的gldA 1
[0235] 表4(c) :BLAST查询-来自于Enterococcus aerogenes的gldA 1
[0237] 表4(d) :BLAST查询-来自于Yersinia aldovae的gldA
[0238]
[0240] 编码具有gldA活性的酶的外源基因优选地包含编码与SEQ IDNO: 7至SEQ ID NO: 10,优选SEQ ID N0:7或SEQ ID N0:9中的任一个具有至少50%、60%、65%、70%、75%、 80%、85%、90%、95%、98%、99 %氨基酸序列同一性的氨基酸序列的核苷酸序列。编码具 有乙醛脱氢酶活性的酶的外源基因还可包含编码与SEQ IDNO:7至SEQ ID N0:10,优选SEQ ID NO:7或SEQ ID NO:9中任一个的氨基酸序列相比具有一个或几个替换、插入和/或缺失 的氨基酸序列的核苷酸序列。优选地,氨基酸序列分别与SEQ ID N0:7、SEQ ID N0:8、SEQ ID N0:9或SEQ ID NO: 10相比,优选分别与SEQ ID N0:7或SEQ ID N0:9相比,具有不超过 300、250、200、150、100、75、50、40、30、20、10或 5个氨基酸替换、插入和/或缺失。
[0241 ] 本文中编码具有gldA活性的酶的外源基因包含与SEQ ID N0:54-57中的任一个具 有至少 40%、50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、 96%、97%、98%、99%或100%核苷酸(DNA)序列同一性的核苷酸序列。
[0242] 特征d):编码二羟基丙酮激酶(E. C. 2.7.1.28或E. C. 2.7.1.29)的一个或多个异源 核苷酸序列。二羟基丙酮激酶涉及反应:
[0243] EC 2.7.1.28 ATP+D-甘油醛< = >ADP+D_甘油醛3-磷酸
[0244] EC 2.7.1.29 ATP+甘油酮< = >ADP+磷酸甘油酮
[0245]
[0246] η 彻 m = -?卜」m
[0247] 这个家族由单链形式的二羟基丙酮激酶(也称为甘油酮激酶)的实例组成,所述激 酶使用ATP(EC 2.7.1.29或EC 2.7.1.28)作为磷酸供体,而不是像在Escherichia coli中 的磷蛋白。这种形式具有与E.coli酶的K和L亚基同源的可分离结构域,并且在酵母和其它 真核生物及在一些细菌,包括Citrobacter freundii中发现。已经证实来自于西红柿的成 员使二羟基丙酮、3,4_二羟基-2-丁酮和一些其它醛醣和酮醣磷酸化。已经证实来自于哺乳 动物的成员催化二羟基丙酮的磷酸化和核糖核苷二磷酸-X化合物的分解二者,其中FAD是 最佳底物。在酵母中存在二羟基丙酮激酶的两种同工酶(Dakl和Dak2)。当细胞为酵母细胞 时,根据本发明优选内源性DAK,在一个实施方案中,它们在酵母细胞中过表达。
[0248] 在表5(a)至5(d)中列出了适合的二羟基丙酮激酶的实例。在每个表的顶部,提到 了实施例中所用的并且经BLASTED的DAK。
[0249] 表5(a) :BLAST查询-来自于Saccharomyces cerevisiae的DAK1
[0250]
[0251 ]表5(b) :BLAST查询-来自于Klebsiella pneumoniae的dhaK 12
2
[0254] 表5(c) :BLAST查询-来自于Yarrowia
[0255]
[0256] 表5(d) :BLAST查询-来自
[0257]
[0258] 编码具有DAK活性的酶的外源基因优选地包含编码与SEQ IDNO: 11至SEQ ID NO: 14,优选SEQIDN0:11或SEQIDN0:13中的任一个具有至少40%、50%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%氨基酸序列同一性的氨基酸序列的核苷酸序列。编 码具有乙醛脱氢酶活性的酶的外源基因还可包含编码与SEQ IDN0:11至SEQ ID N0:14,优 选SEQ ID NO: 11或SEQ ID NO: 13中任一个的氨基酸序列相比具有一个或几个替换、插入 和/或缺失的氨基酸序列的核苷酸序列。优选地氨基酸序列分别与SEQ ID NO: 11、SEQ N0: 12、SEQ ID NO: 13或SEQ ID NO: 14相比,优选分别与SEQ ID NO: 11 或SEQ ID NO: 13相比,具 有不超过420、380、300、250、200、150、100、75、50、40、30、20、10或5个氨基酸替换、插入和/ 或缺失。
[0259] 本文中编码具有DAK活性的酶的外源基因包含与SEQ ID NO:58-61中的任一个具 有至少 40%、50%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、95%、 96%、97%、98%、99%或100%核苷酸(DNA)序列同一性的核苷酸序列。
[0260] ---
[0261] 在一个实施方案中,细胞包含编码甘油3-磷酸磷酸水解酶和/或编码甘油3-磷酸 脱氢酶基因的一个或多个内源核苷酸序列的缺失或破坏。
[0262] 本文在细胞中,NADH依赖性甘油合成所需的酶活性被降低或去除。这种酶活性的 降低或去除可通过修饰编码NAD依赖型甘油3-磷酸脱氢酶活性(GPD)的一个或多个基因或 编码磷酸甘油磷酸磷酸酶活性(GPP)的一个或多个基因从而使得酶比在野生型中表达大大 降低或使得基因编码活性降低的多肽来实现。
[0263] 此类修饰可使用通常已知的生物技术进行,并且尤其可包括编码GPD和/或GPP的 结构基因的启动子区或编码区的一个或多个敲除突变或定点诱变。或者,可通过随机诱变, 然后选择GPD和/或GPP活性降低或缺失的菌株而获得在甘油生成上有缺陷的酵母菌株。 S.cerevisiae GPDl、Gro2、GPPl和GPP2基因在W02011010923中示出,并且在该申请的SEQ ID NO:24-27中公开。
[0264] 优选地,编码GH)的至少一个基因或编码GPP的至少一个基因完全缺失,或该基因 的编码对酶活性而言必需的酶部分的至少一部分缺失。特别地,已经用S. cerevisiae细胞 获得好的结果,其中GPD1基因和GPD2基因的开放阅读框已被失活。结构基因(靶基因)的失 活可由本领域技术人员通过人造合成或以其它方式构建由选择标记基因、两侧的与在宿主 细胞基因组要缺失的区域两侧的序列相同的DNA序列组成的DNA片段来实现。特别地,已经 通过整合标记基因 kanMX和hphMX4使Saccharomyces 〇6代¥丨8丨&6中的6?01和6?02基因失活 而获得了好的结果。随后,将这个DNA片段转化到宿主细胞中。通过例如诊断性聚合酶链反 应或Southern杂交,检查表达显性标记基因的转化细胞中设计为要缺失的区域的正确置 换。
[0265] 因此,在本发明的细胞中,特异性甘油3-磷酸磷酸水解酶和/或编码甘油3-磷酸脱 氢酶的基因被减少。在本发明的细胞中,与除引起特异性活性降低的遗传修饰外遗传上相 同的菌株相比,优选在厌氧条件下,特异性磷酸甘油脱氢酶活性优选降低为至少0.8、0.5、 0 · 3、0 · 1、0 · 05 或0 · 01 倍。可如 Overkamp等(2002,Yeast 19:509-520)所述,测定甘油磷酸脱 氢酶活性。
[0266] 优选地,遗传修饰使细胞基因组中编码特异性甘油磷酸脱氢酶的基因的每个内源 拷贝的表达降低或失活。由于二倍性、多倍性或非整倍性,给定细胞可包含编码具有一个且 相同的氨基酸序列的特异性甘油磷酸脱氢酶的基因的多个拷贝。在此类情况下,优选地编 码甘油磷酸脱氢酶的特异性基因的每个拷贝的表达降低或失活。或者,细胞可含有在氨基 酸序列上不同并且各自由不同基因编码的具有甘油磷酸脱氢酶活性的几种不同的(同工) 酶。在此类情况下,在本发明的一些实施方案中可优选的是,仅某些类型的同工酶减少或失 活,而其它类型仍保持不受影响。然而优选地,编码具有甘油磷酸脱氢酶活性的(同工)酶的 基因的所有拷贝的表达均降低或失活。
[0267] 优选地,通过使基因的至少一部分缺失或通过破坏基因而使编码甘油磷酸脱氢酶 活性的基因失活,由此在这种情况下术语基因还包括在编码序列上游或下游的任何非编码 序列,其(部分)缺失或失活导致宿主细胞中甘油磷酸脱氢酶活性的表达降低。
[0268] 编码要使其活性在本发明的细胞中降低或失活的甘油磷酸脱氢酶的一个优选基 因是如van den Berg和Steensma(1997,Yeast 13:551-559)描述的编码氨基酸序列GPD1的 S.cerevisiae GTO1,及其在其它物种中的直系同源物。
[0269] 表6中提供了包含具有甘油磷酸脱氢酶活性的酶属于Saccharomyces、 Naumovozyna、Candida Vanderwaltozyma和Zygosaccharomyces属的生物(宿主)的适合实 例。
[0270] 趣:具有甘油磷酸脱氢酶(GPD1)活性的酶 生物 氨基酸同一性(%) S. ccrevisiae 100% Naumovozyma dairenensis 19%
[0271] Naumovozyma castellii 8〇% Candida glahmta 71% fmdefwali〇.zyma polyspora 77% Zygosacchawmyces rniixii 74°/〇
[0272] Saccharomycopsis jibidigcra 61%
[0273] 然而,在例如5&(^11&1'〇1115^6 8、0&11(1丨(1&和25^〇8&(^11&1'〇1115^6 8的一些菌株中,编码 甘油磷酸脱氢酶的第二基因有活性,即GPD2,参见例如Overkamp等(2002,同上)。编码要使 其活性在本发明的细胞中降低或失活的甘油磷酸脱氢酶的另一优选基因因此是如 Overkamp等(2002,同上)描述的Saccharomyces cerevisiae GPD2,其编码氨基酸序列 GTO2,以及其在其它物种中的直系同源物。
[0274] 表7中提供了包含具有甘油磷酸脱氢酶活性的酶属于(Zy go) Saccharomyces和 Candida属的生物(宿主)的适合实例。
[0275] 莖:具有甘油磷酸脱氢酶(GPD2)活性的酶 生物 氨基酸苘一性(%) S. cerevisiae .100% Candida glabrota 15%
[0276] Zygosaccharomyces rotixii Spathaspora passalidanim ()2% Scheffersoniyces stipitis 61%
[0277] 在一个实施方案中,所述细胞为酵母,其中酵母细胞的基因组包含在选自GPD1、 GTO2、GPP1和GPP2的至少一个基因处的突变,该突变可为敲除突变,该敲除突变可为与酵母 细胞的相应野生型酵母基因相比,所述基因中的至少一个的完全缺失。
[0278] ---
[0279] 为提高本文酶活性在本发明的转化宿主细胞中以足够水平且呈活性形式表达的 可能性,优选改造编码这些酶和本发明的其它酶(参见下文)的核苷酸序列以最优化其密码 子使用为目的宿主细胞的密码子使用。编码酶的核苷酸序列对宿主细胞密码子使用的适应 性可表示为密码子适应指数(CAI)。本文将密码子适应指数定义为基因的密码子使用对特 定宿主细胞或生物中高度表达的基因的密码子使用的相对适应性的测量。每个密码子的相 对适应性(W)为每个密码子的使用与对于相同氨基酸而言最丰富的密码子的使用之比。将 CAI指数定义为这些相对适应性值的几何平均数。不包括非同义密码子和终止密码子(取决 于遗传密码)。CAI值的范围从0到1,值越高表明最丰富的密码子的比例越高(参见Sharp和 Li , 1987 ,Nucleic Acids Research 15:1281-1295;还参见:Jan sen 等,2003, Nucleic Acids Res.丑(8):2242-51)。适应的核苷酸序列优选具有至少0.2、0.3、0.4、0.5、0.6、0.7、 0.8或0.9的CAI。最优选的是已经针对在目的真菌宿主细胞如S.cerevisiae细胞中表达进 行了密码子优化的序列。
[0280]菌株构建。本文实施例中使用的菌株构建方法在专利申请PCT/EP2013/056623中 有描述。其描述了使得能够由多种目标基因构建表达盒的技术,所述构建的方式使得这些 盒组合成途径并且在该酵母被转化后整合在酵母基因组的特定位点。
[0281] 图2中给出了实施例中使用的菌株构建方法的概述。图2示出了菌株构建方法的示 意图展示。使用PCR扩增INT(整合)侧翼和表达盒(CAS),其包括选择标记,并转移到酵母中。 将在接头之间(在图2中分别示为5、a、b、c和3)进行重组,导致途径整合在酵母基因组中的 期望位置(在这种情况下为INT1)。目标基因的数量可扩大,如实施例中所述。使用独特的接 头以促进独立表达盒的重组并整合到受体细胞的基因组中。根据现有技术的任何其它菌株 构建方法同样可用于构建本发明的菌株。
[0282] 同源性和同一性
[0283] 氨基酸或核苷酸序列当表现出一定水平的相似性时被称为同源。同源的两个序列 表示共同的进化起源。两个同源序列是密切相关还是相关关系更远用"同一性百分比"或 "相似性百分比"表示,它们分别用高或低的。尽管有争议,但为了表示"同一性百分比"或 "相似性百分比","同源性水平"或"同源性百分比"常常可互换使用。
[0284] 两个序列之间的序列比较和同一性百分比的测定可以使用数学算法完成。技术人 员将意识到几种不同的计算机程序可用于比对两个序列并测定两个序列之间的同源性的 事
实(Kruskal,J · B · (1983 )An overview of sequence comparison在D · Sankoff和 J·B.Kruskal (编)中,Time warps , string edits and macromolecules: the theory and practice of sequence comparison,第1-44页,Addison Wesley)。可以使用用于两个序列 比对的Needleman和Wunsch算法测定两个氨基酸序列之间的同一性百分比。(Needleman, S.B.和Wunsch,C. D. (1970)J.Mol. Biol. 48,443-453)。该算法比对氨基酸序列以及核苷酸 序列。已经在计算机程序NEEDLE中执行Needleman-Wunsch算法。为了本发明的目的,使用来 自于EMBOSS包的NEEDLE程序(2.8.0或更高版本,EMB0SS:The European Molecular Biology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16, (6)第276-277页,http://emboss·bioinformatics.nl/) 〇对于蛋白质序列, 将EBL0SUM62用于替代矩阵。对于核苷酸序列,使用EDNAFULL。可指定其他矩阵。用于氨基酸 序列比对的任选参数为10的空位开放罚分和0.5的空位延伸罚分。技术人员将认识到,所有 这些不同的参数将产生略有不同的结果,但是当使用不同的算法时两个序列的总体同一性 百分比无显著改变。
[0285] 全局同源性定义
[0286] 同源性或同一性是两个完整序列之间在包括任何空位或延伸的整个比对区域上 相同匹配的百分比。比对的两个序列之间的同源性或同一性按如下计算:比对中在两个序 列中显示相同氨基酸的相应位置的数量除以包括空位在内的比对总长度。如本文所定义的 同一性可由NEEDLE获得并且在程序的输出中标记为"同一性(IDENTITY)"。
[0287]最长同一1性定义
[0288]比对的两个序列之间的同源性或同一性按如下计算:比对中在两个序列中显示相 同氨基酸的相应位置的数量除以减去比对中空位总数后的比对总长度。如本文所定义的同 一性可由NEEDLE通过使用N0BRIEF选项获得,并且在程序的输出中标记为"最长同一性"。
[0289]本文描述的本发明的多个实施方案可交叉合并。
[0290]本发明的另一些实施方案。
[0291] 在一个实施方案中,酵母细胞包含编码NAD+依赖型醇脱氢酶活性(EC1.1.1.1)的 一个或多个核酸序列。这种酶催化乙醛转化为乙醇。酵母细胞可天然地包含编码此类脱氢 酶的基因,如同Saccharomyces cerevisiae (ADH1-5)的情况一样,参见 ' Lutstorf和 Megnet·1968Arch.Biochem.Biophys·126:933-944' 或 'Ciriacy,1975,Mutat·Res·29:315-326'),或宿主细胞可被提供编码这种活性的一个或多个异源基因,例如S. cerevi siae的 ADH1-5基因中的任一个或每一个或其功能同源物可并入根据本发明所述的细胞中。
[0292] 在一个实施方案中,酵母细胞选自Saccharomycetaceae,尤其选自 Saccharomyces,如Saccharomyces cerevisiae;Kluyveromyces,如Kluyveromyces marxianu;Pichia,如Pichia stipitis或Pichia angusta;Zygosaccharomyces,如 Zygosaccharomyces bai1i i;和Brettanomyces,如Brettanomyces intermedius, Issatchenkia,如 Issatchenkia oriental is和Hansenula的组。
[0293] 在一个实施方案中,所述细胞为原核细胞。在一个实施方案中,细胞选自 Clostridium、Zymomonas、Thermobacter、Escherichia、Lactobacillus、Geobacillus和 Bacillus。
[0294] 本发明还涉及根据本发明所述的酵母细胞用于制备发酵产物优选乙醇的用途。本 发明还提供了一种用于制备发酵产物的方法,其包括由乙酸盐/酯和发酵性碳水化合 物一一尤其是选自葡萄糖、果糖、蔗糖、麦芽糖、木糖、阿拉伯糖、半乳糖和甘露糖的组的碳 水化合物一一制备发酵产物,所述制备在厌氧条件下使用根据本发明所述的酵母细胞进 行。在一个实施方案中,所述制备在包含摩尔比为0.7或更低,尤其为至少0.004至0.5,更尤 其为0.05至0.3的乙酸盐/酯和碳水化合物的发酵培养基中进行。在制备发酵产物的一个实 施方案中,碳水化合物的至少一部分和乙酸盐/酯的至少一部分已经通过水解选自木质纤 维素、纤维素、半纤维素和果胶的组的多糖获得。木质纤维素优选为已经水解从而获得发酵 性碳水化合物和乙酸盐/酯的木质纤维素生物质。
[0295] 在一个实施方案中,木质纤维素或半纤维素材料与酶组合物接触,其中生成一种 或多种糖,并且其中生成的糖被发酵以产生发酵产物,其中所述发酵用根据本发明所述的 酵母细胞进行。
[0296] 本发明的发酵产物可以是任何有用产物。在一个实施方案中,其是选自以下的产 物:乙醇、正丁醇、异丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、己二酸、富马酸、苹果 酸、衣康酸、马来酸、柠檬酸、己二酸、氨基酸如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨 酸、1,3-丙二醇、乙烯、甘油、β-内酰胺抗生素和头孢菌素、维生素、药物、动物饲料添加剂, 专用化学品、化学原料、塑料、溶剂、燃料,包括生物燃料和生物气体或有机聚合物,和工业 酶,如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂解酶、氧化还原酶、转移酶或 木聚糖酶。
[0297] 在一个实施方案中,发酵产物可为乙醇、丁醇、乳酸、塑料、有机酸、溶剂、动物饲料 添加剂、药物、维生素、氨基酸、酶或化学原料中的一种或多种。
[0298] 在一个优选的实施方案中,细胞厌氧生长。厌氧生长条件在本文中为厌氧或限氧。 本文将厌氧定义为在无氧或其中基本不消耗氧,优选低于约5mmol/L/h、约2.5mmol/L/h或 约lmmol/L/h的情况下进行的生长过程,并且其中有机分子用作电子供体和电子受体两者。
[0299] 限氧生长过程是其中氧消耗受到从气体到液体的氧传递限制的过程。限氧程度由 进气气流的量和组成以及所用发酵设备的实际混合/传质特性决定。优选地,在限氧条件下 的过程中,氧消耗速率为至少约5.5mmol/L/h,更优选为至少约6mmol/L/h,如至少7mmol/L/ h。本发明的方法包括回收发酵产物。发酵期间,当存在乙酸时,乙酸/乙酸盐/酯的比率将取 决于pH。步骤d)中的乙酸盐/酯浓度可选择为类似于酵母菌株满足其最终用途的浓度(例 如,在木质纤维素水解产物发酵成发酵产物时,此类水解产物可含有l-10g/l乙酸盐/酯,例 如2g/l乙酸盐/酯)。
[0300] 有利的是,当根据本发明生成乙醇时,其以低于0.04:1,尤其低于0.02:1,优选低 于0.01:1的甘油:乙醇摩尔比生成。可不存在甘油生成(不可检测),尽管至少在一些实施方 案中(其中NADH-依赖性甘油合成减少,而未被完全抑制),一些甘油可作为副产物,例如以 0.001:1或更高的甘油:乙醇比率生成。
[0301 ] 本发明通过提供重组酵母细胞,尤其是Saccharomyces cerevisiae,使其可以通 过经由NADH依赖性反应将乙酸还原为乙醇使NADH重氧化,来允许完全消除甘油生成,或其 至少显著减少。
[0302]这不但有利于避免或至少减少甘油生成,而且因为在NADH重氧化中形成的产物也 是期望产物,即乙醇,所以本发明的方法也可提供增加的产物产量(确定为转化成乙醇的被 转化原料(即碳水化合物加乙酸)的重量%)。因为乙酸通常在木质纤维素水解产物中大量 可用,所以这使得本发明对于使用木质纤维素生物质作为发酵性碳水化合物的来源制备乙 醇特别有利。进一步地,可含有大量乙酸盐/酯的碳水化合物源包括甜菜糖蜜(sugar beet molasse)(水解产物)和淀粉(含有例如来自于玉米干磨过程,来自于玉米湿磨过程;来自于 淀粉废料处理过程,例如经釜馏物回收的废弃产物)。
[0303]在另一优选的实施方案中,本发明的宿主细胞具有以下的至少一种:a)使木糖异 构化为木酮糖的能力;和b)将L-阿拉伯糖转化为D-木酮糖5-磷酸的能力。对于a)而言,酵母 细胞优选具有功能性外源木糖异构酶基因,所述基因赋予酵母细胞使木糖异构化为木酮糖 的能力。对于b)而言,酵母细胞优选具有编码L-阿拉伯糖异构酶、L-核酮糖激酶和L-核酮 糖-5-磷酸4-差向异构酶的功能性外源基因,所述基因一起赋予酵母细胞使L-阿拉伯糖异 构转化为D-木酮糖5-磷酸的能力。
[0304]具有使木糖异构化为木酮糖的能力的真菌宿主细胞如例如W0 03/0624430和W0 06/009434中所描述。优选通过用包含编码木糖异构酶的核苷酸序列的核酸构建体转化来 赋予酵母细胞使木糖异构化为木酮糖的能力。优选地,酵母细胞因此获得使木糖直接异构 化为木酮糖的能力。更优选地,酵母细胞因此获得通过木糖向木酮糖的直接异构化(及木酮 糖的进一步代谢),以木糖作为唯一能量和/或碳来源而需氧和/或厌氧生长的能力。在本文 中应理解,木糖向木酮糖的直接异构化在由木糖异构酶催化的单个反应中发生,与分别由 木糖还原酶和木糖醇脱氢酶催化的木糖经由木糖醇中间体向木酮糖的两步转化不同。
[0305] 可成功用于赋予本发明的酵母细胞使木糖直接异构化为木酮糖的能力几种木糖 异构酶(及其氨基酸和编码核苷酸序列)在本领域中已有描述。这些包括Piromyces sp.和 属于Neocall imastix、Caecomy ces、Piromyces或Ruminomyces (W0 03/0624430)、 Cyllamyces aberensis(US 20060234364)、0rpinomyces(Madhavan等,2008,D0I 10.1007/ s00253-008-1794_6)的其它厌氧真菌的木糖异构酶,Bacteroides细菌属,包括例如 B · thetaiotaomi cron (TO 06/009434)、B · fragil is和B .uniformis(TO 09/109633)的木糖 异构酶,厌氧细菌Clostridium phytofermentans的木糖异构酶(Brat等,2009, Appl.Environ.Microbiol.75:2304-2311),^.Clostridium difficile、Ciona intestinales和Fusobacterium mortiferum(W0 10/074577)的木糖异构酶。
[0306] 具有使L-阿拉伯糖转化为D-木酮糖5-磷酸的能力的真菌宿主细胞如例如在 Wisselink等(2007,Appl·Environ.Microbiol·doi:10·1128/AEM.00177-07)和EP 1499708 中所述。优选通过用包含编码a)阿拉伯糖异构酶;b)核酮糖激酶,优选L-核酮糖激酶木糖异 构酶;和c)核酮糖-5-P-4-差向异构酶,优选L-核酮糖-5-P-4-差向异构酶的核苷酸序列的 核酸构建体转化来赋予酵母细胞将L-阿拉伯糖转化为D-木酮糖5-磷酸的能力。优选地,在 本发明的酵母细胞中,将L-阿拉伯糖转化为D-木酮糖5-磷酸的能力是通过以下反应将L-阿 拉伯糖转化为D-木酮糖5-磷酸的能力:1)阿拉伯糖异构化为核酮糖;2)核酮糖磷酸化为核 酮糖5-磷酸;和3)核酮糖5-磷酸差向异构化为D-木酮糖5-磷酸。编码阿拉伯糖异构酶、核酮 糖激酶和核酮糖-5-P-4-差向异构酶的适合核苷酸序列可获自Bacillus subtilis、 Escherichia coli(参见例如EP 1499708)、Lactobacilli例如Escherichia coli(参见例 如Wisselink等,同上;W02008/041840)或Clavibacter、Arth;robacte;r和Gramella的物种, 其中优选Clavibacter michiganensis、Arthrobacter aurescens和Gramella forsetii (参见 W02009/011591)。
[0307] 本发明的经转化细胞还优选包含木酮糖激酶活性,以致由木糖异构化的木酮糖可 代谢为丙酮酸盐/酯。优选地,酵母细胞含有内源性木酮糖激酶活性。更优选地,本发明的细 胞包含增强特异性木酮糖激酶活性的遗传修饰。优选地,遗传修饰引起木酮糖激酶的过表 达,例如通过编码木酮糖激酶的核苷酸序列的过表达。编码木酮糖激酶的基因可为酵母细 胞内源的或可为与酵母细胞异源的木酮糖激酶。可用于在本发明的酵母细胞中过表达木酮 糖激酶的核昔酸序列为,例如Deng和Ho( 1990,Appl .Biochem. Biotechnol .24-25:193-199) 所述来自于S. cerevisiae(XKSl)的木酮糖激酶基因。另一种优选的木酮糖激酶是与来自于 Piromyces(xylB;参见W0 03/0624430)的木酮糖激酶相关的木酮糖激酶。这种Piromyces木 酮糖激酶实际上与原核激酶比与所有已知的真核激酶如酵母激酶更相关。已经指出真核木 酮糖激酶为非特异性糖激酶,其具有包括木酮糖的广泛底物范围。相反,已经表明与 Piromyces激酶最密切相关的原核木酮糖激酶是木酮糖的更特异性激酶,即具有更窄的底 物范围。在本发明的酵母细胞中,与除引起过表达的遗传修饰外遗传上相同的菌株相比,待 过表达的木酮糖激酶被过表达至少1.1、1.2、1.5、2、5、10或20倍。应理解,这些过表达水平 可适用于酶活性的稳态水平、酶蛋白的稳态水平以及编码该酶的转录物的稳态水平。
[0308] 本发明的细胞还优选包含增加 WO 06/009434中描述的磷酸戊糖途径的通量的遗 传修饰。在一个实施方案中,遗传修饰包含(非氧化部分)磷酸戊糖途径的至少一种酶的过 表达。优选地,该酶选自编码核酮糖-5-磷酸异构酶、核酮糖-5-磷酸3-差向异构酶、转酮醇 酶和转醛醇酶的酶。
[0309] 本发明还优选的细胞包含降低在酵母细胞中的非特异性醛糖还原酶活性的遗传 修饰。优选地,非特异性醛糖还原酶活性在宿主细胞中通过降低编码非特异性醛糖还原酶 的基因的表达或使该基因失活的一个或多个遗传修饰而降低。优选地,该遗传修饰降低酵 母细胞基因组中编码能够还原戊醛糖包括木糖、木酮糖和阿拉伯糖的非特异性醛糖还原酶 的基因的每个内源拷贝的表达或使其失活。由于二倍性、多倍性或非整倍性,给定细胞可包 含编码非特异性醛糖还原酶的基因的多个拷贝,和/或细胞可含有在氨基酸序列上不同并 且各自由不同基因编码的具有醛糖还原酶活性的几种不同的(同工)酶。同样在此类情况 下,优选地,使编码非特异性醛糖还原酶的每个基因的表达降低或失活。优选地,通过使基 因的至少一部分缺失或破坏基因而使基因失活,由此在这种情况下术语基因还包括在编码 序列上游或下游的任何非编码序列,其(部分)缺失或失活导致宿主细胞中非特异性醛糖还 原酶活性的表达降低。编码要使其活性在本发明的酵母细胞中降低的醛糖还原酶的核苷酸 序列及此类醛糖还原酶的氨基酸序列在W0 06/009434中有描述并且包括例如 S. cerevisiae GRE3基因的(非特异性)醛糖还原酶基因(Τ????等,2 0 0 1, Appl .Environm.Microbiol. 67:5668-5674)及其在其它物种中的直系同源物。
[0310] 在一个实施方案中,根据本发明所述的酵母细胞还可包含产生选自以下的一种或 多种特征的遗传修饰:(a)木糖和/或阿拉伯糖向酵母细胞的转运增加;(b)对分解代谢产物 阻遏的敏感性降低;(c)对乙醇、渗透性或有机酸的耐受性增加;和,(d)副产物的生成减少。 副产物应理解为意指除期望发酵产物外的含碳分子,并且包括,例如木糖醇、阿拉伯糖醇、 甘油和/或乙酸。本文描述的任何遗传修饰均可通过传统诱变和对期望突变体的筛选和/或 选择来引入,或简单地通过对具有期望特征的自发突变体的筛选和/或选择而引入。或者, 遗传修饰可由内源基因的过表达和/或内源基因的失活组成。对于增加阿拉伯糖和/或木糖 向酵母细胞的转运而言期望其过表达的基因优选选自编码己糖或戊糖转运蛋白的基因。在 5.〇6代¥丨8丨36和其它酵母中,这些基因包括取1'1、取了2、取了3、取了4、取了5、取了7和641^,其中 最优选取了7、取了5和641^2(参见56(113〇1^和!1〇,¥638七2004 ;21:671-684)。用于在酵母中表达 的另一优选转运蛋白是由P. stipitis SUT1基因编码的葡萄糖转运蛋白(Katahira等, 2008,Enzyme Microb.Techno 1.43:115-119)。类似地,其它物种中这些转运蛋白基因的直 系同源物可过表达。在本发明的酵母细胞中可过表达的其它基因包括编码糖酵解酶和/或 产乙醇酶如醇脱氢酶的基因。供失活的优选内源基因包括己糖激酶基因,例如 S · cerevisiae HXK2基因(参见Diderich等,2001,Appl · Environ .Microbiol. 67 :1587-1593);S.cerevisiae MIG1或MIG2基因,编码甘油代谢中涉及的酶的基因如S.cerevisiae 甘油-磷酸脱氢酶1和/或2基因;或其它物种中这些基因的(杂交)直系同源物。用于木糖发 酵的宿主细胞的其它优选修饰在van Maris等(2006,Antonie van Leeuwenhoek 90:391-418)、102006/009434、102005/023998、102005/111214和恥2005/091733中有描述。如本文 所述的本发明酵母细胞的任何遗传修饰尽可能优选通过自克隆遗传修饰引入或修饰。
[0311] 根据本发明所述的优选宿主细胞具有以木糖和阿拉伯糖中的至少一种作为碳源/ 能量来源,优选作为唯一碳源/能量来源,并且优选在厌氧条件,即如本文所定义的用于厌 氧发酵方法的条件下生长的能力。优选地,当以木糖作为碳源/能量来源生长时,宿主细胞 基本上不产生木糖醇,例如产生的木糖醇低于检测限或按摩尔计,例如低于消耗的碳的 5%、2%、1%、0.5%或0.3%。优选地,当以阿拉伯糖作为碳源/能量来源生长时,酵母细胞 基本上不产生阿拉伯糖醇,例如产生的阿拉伯糖醇低于检测限或按摩尔计,例如低于消耗 的碳的 5%、2%、1%、0.5%或0.3%。
[0312]本发明的一种优选细胞具有以己糖、戊糖、甘油、乙酸及其组合中的至少一种,在 厌氧条件下以至少0.01、0.02、0.05、0.1、0.2、0.25或0.311_1的速率,或更优选地,在厌氧条 件下以至少0.005、0.01、0.02、0.05、0.08、0.1、0.12、0.15或0.211- 1的速率生长的能力。因 此,优选地,宿主细胞具有以木糖和阿拉伯糖中的至少一种作为唯一碳源/能量来源,在厌 氧条件下以至少0.01、0.02、0.05、0.1、0.2、0.25或0.311_ 1的速率,或更优选地,在厌氧条件 下以至少0.005、0.01、0.02、0.05、0.08、0.1、0.12、0.15或0.211- 1的速率生长的能力。更优选 地,宿主细胞具有以己糖(例如葡萄糖)与木糖和阿拉伯糖中的至少一种的混合物(按1:1重 量比)作为唯一碳源/能量来源,在厌氧条件下以至少0.01、0.02、0.05、0.1、0.2、0.25或 〇.3h- 1的速率,或更优选地,在厌氧条件下以至少0.005、0.01、0.02、0.05、0.08、0.1、0.12、 0.15或0.21Γ 1的速率生长的能力。更优选地,宿主细胞具有以己糖(例如葡萄糖)、木糖和阿 拉伯糖中的至少一种与甘油的混合物(按1:1:1重量比)作为唯一碳源/能量来源,在厌氧条 件下以至少0.01、0.02、0.05、0.1、0.2、0.25或0.31^的速率,或更优选地,在厌氧条件下以 至少0.005、0.01、0.02、0.05、0.08、0.1、0.12、0.15或0.211- 1的速率生长的能力。
[0313] 多年以来,对于引进用于由作物糖生产生物乙醇的多种生物提出了建议。然而,实 践中,所有主要的生物乙醇生产方法继续使用Saccharomyces属的酵母作为乙醇生产者。这 是由于Saccharomyces物种对工业方法的许多有吸引力的特性,即高酸、乙醇和渗透耐受 性、厌氧生长的能力并且当然还有其高酒精发酵能力。作为宿主细胞的优选酵母物种包括 S·cerevisiae、S.bulderi、S·barnetti、S.exiguus、S.uvarum、S·diastaticus、K.lactis、 K.marxianus或K fragilis。
[0314] 本发明的酵母细胞可以能够转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半 乳糖、果糖、麦芽
糖、麦芽糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油,例如转 化成发酵性糖。因此,本发明的细胞可表达一种或多种酶,如将纤维素转化成葡萄糖单体和 将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶或外切纤维素酶)、 半纤维素酶(内切或外切木聚糖酶或阿拉伯糖酶),能够将果胶转化为葡萄糖醛酸和半乳糖 醛酸的果胶酶或将淀粉转化为葡萄糖单体的淀粉酶。
[0315]酵母细胞还优选包含将丙酮酸盐/酯转化为期望发酵产物,如乙醇、丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、柠檬酸、富马酸、苹果酸、衣康酸、氨基酸、1,3_丙二醇、乙 烯、甘油、β-内酰胺抗生素或头孢菌素所需的那些酶活性。
[0316] 本发明的一种优选细胞是天然能够酒精发酵,优选能够厌氧酒精发酵的细胞。本 发明的细胞优选具有对乙醇的高耐受性、对低pH(即能够在低于约5、约4、约3或约2.5的pH 下生长)和对有机酸如乳酸、乙酸或甲酸和/或糖降解产物如糠醛和羟甲基糠醛的高耐受性 和/或对升高温度的高耐受性。
[0317] 本发明的细胞的任何以上特征或活性可天然存在于酵母细胞中或可通过遗传修 饰引入或修饰。
[0318] 本发明的细胞可为适于生成乙醇的细胞。然而,本发明的细胞可适于生成除乙醇 外的发酵产物。此类非乙醇发酵产物原则上包括可由真核微生物如酵母或丝状真菌生成的 任何散制(bulk)或精炼化学药品。
[0319] 发酵方法优选在对于酵母细胞而言最佳的温度下进行。因此,对于大多数酵母或 真菌宿主细胞而言,发酵方法在低于约42°C,优选低于约38°C的温度下进行。对于酵母或丝 状真菌宿主细胞而言,发酵方法优选在低于约35°C、约33°C、约30°C或约28°C的温度下和在 高于约20°C、约22°C或约25°C的温度下进行。
[0320] 该方法中木糖和/或葡萄糖的乙醇产率优选为至少约50%、约60%、约70%、约 80%、约90%、约95%或约98%。本文将乙醇产率定义为理论最高产率的百分比。
[0321 ]本发明还涉及一种用于生产发酵产物的方法。
[0322]该发酵方法可按分批、分批补料或连续模式进行。也可应用单独水解发酵(SHF)方 法或同时糖化发酵(SSF)方法。为了最佳生产率,这些发酵方法模式的组合也是可行的。
[0323] 根据本发明所述的发酵方法可在需氧和厌氧条件下进行。优选地,该方法在微需 氧或限氧条件下进行。
[0324] 本文将厌氧发酵方法定义为在无氧或其中基本不消耗氧,优选低于约5mmol/L/h、 约2.5mmo 1 /L/h或约lmmo 1 /L/h的情况下进行的、其中有机分子用作电子供体和电子受体两 者的发酵过程。
[0325] 限氧发酵方法是其中耗氧受到从气体到液体的氧传递限制的方法。限氧程度由进 气气流的量和组成以及所用发酵设备的实际混合/传质特性决定。优选地,在限氧条件下的 方法中,耗氧速率为至少约5.5mmol/L/h,更优选为至少约6mmol/L/h,如至少7mmol/L/h。本 发明的方法包括回收发酵产物。
[0326] 为了回收发酵产物,使用现有的技术。对于不同发酵产物而言,不同的回收方法适 合。从含水混合物回收乙醇的现有方法通常使用分馏和吸附技术。例如,蒸馏釜可用于加工 在含水混合物中含有乙醇的发酵产物,以生成富含乙醇的混合物,然后进行分馏(例如,分 级蒸馏或其它类似技术)。接下来,含有最高浓度的乙醇的级分可通过吸附器以从乙醇中去 除大部分(若非所有)剩余的水。
[0327] 本说明书中引用的所有专利和文献参考的全部内容据此通过引用并入。
[0328] 提供以下实施例仅仅是为了说明性目的,而非旨在以任何方式限制本发明的范 围。 实施例
[0329] 为了在速率和量上提高甘油和乙酸两者的厌氧(共)转化,试验了替代性基因组 合。对于途径中的多个酶,即甘油脱氢酶、二羟基丙酮激酶和乙醛脱氢酶,试验了能够进一 步增强酵母菌株在厌氧条件下除戊糖和己糖外将甘油和乙酸转化成乙醇的能力的多个替 代基因。
[0330] 表8中给出了选定酶候选物。
[0331] 编码期望酶活性的选定酶候选物和参照蛋白质序列(表中给出了SEQ ID N0)
[0332]
[0334] 如TO 2008/000632中所述,基因经密码子对优化以在S.cerevisiae中最佳表达。 表8中指出了蛋白质序列的SEQ ID NO:。
[0335] 定义了四个类别的基因:A)AADH组,由SEQ ID N0:l-5组成;B)ACS组,由SEQ ID NO:6组成;C)GLD组,由SEQ ID NO:7-10组成和D)DAK组,由SEQ ID NO:11-14组成。
[0336] 制备了表达构建体,允许每个基因以高水平和以中等/低水平表达。
[0337] 对于A组而言,选择TDH3-和TDH1-启动子(分别为SEQIDN0:15和16)。就一切情况 而论,这些基因的终止子均为PGK1-终止子(SEQ ID N0:17)。
[0338] 对于B组而言,选择PGK1-和PRE3-启动子(分别为SEQIDN0:18和19)。就一切情况 而论,这些基因的终止子均为PGI1-终止子(SEQ ID N0:20)。
[0339] 对于C组而言,选择EN01-和ACT1-启动子(分别为SEQ ID NO: 21和22)。就一切情况 而论,这些基因的终止子均为CYC1-终止子(SEQ ID N0:23)。
[0340] 对于D组而言,选择TPI1-和ATG7-启动子(分别为SEQIDN0:24和25)。就一切情况 而论,这些基因的终止子均为EN01-终止子(SEQ ID N0:26)。
[0341 ] 如表9中所示,总计,组装了 28个不同的表达盒。
[0342] 表9:骨架质粒载体中产生的所有组装表达盒(ASS)概述(详情请参见材料和方 法)。第一个SEQ ID N0:定义所用的启动子,第二个SEQ ID N0:定义0RF,而第三个SEQ ID NO:定义转录终止子。生成ASS号以便更易参照。
[0343]
[0344]
LuJ40j 卯囹2屮尸/r油纭,便用仕母TW異共仴按大的引籾,旭过項狃莰衣込显 (ASS)。为PCR产物指定CAS。如图2中所描绘,CAS元件与整合侧翼和/或另一 CAS和/或选择标 记部分重叠,在引入感受态酵母细胞后,允许遗传元件重组到转化感受态酵母菌株的基因 组中。
[0346] 在多因子途径设计中,使用专利申请PCT/EP2013/056623中描述的技术,组合出四 个类别(A、B、C和D组)的独立成员的所有可能组合。产生总共1280种不同的可能表达盒组合 并且用于转化菌株RN1069,gpdlgpd2双缺失菌株(参见材料和方法)。
[0347] 如图2中所描绘,在多因子途径设计中包括抗生素抗性标记,以使得选择已经通过 重组成功地将期望途径整合到其基因组中的酵母转化株成。选择标记的序列作为SEQ ID NO: 27给出。
[0348] 另外,在转化混合物中包括图2中命名为5'-ΙΝΤ1和3'-ΙΝΤ1的两个整合侧翼。在 PCR反应中使用宿主菌株的基因组DNA作为模板及I NT 1的5 侧翼的引物组合SEQ ID N0:30 和31(图2)和3'-ΙΝΤ1侧翼的引物组合SEQ ID N0:42和43(图2),生成这些两个侧翼区的序 列。
[0349] 材料和方法
[0350] 一般分子生物学技术
[0351] 除非另有说明,否则所用方法为标准生物化学技术。适合的通用方法教科书的实 例包括Sambrook等,Molecular Cloning,a Laboratory Manual(1989)和Ausubel等, Current Protocols in Molecular Biology(1995),John Wiley&Sons,Inc·〇
[0352] 培养基
[0353] 实验中使用的培养基是如实施例中所示补充了糖的YEP培养基(10g/l酵母提取 物、20g/1蛋白胨)或固体YNB培养基(6.7g/1酵母氮源、15g/1琼脂)。对于固体YEP培养基而 言,在灭菌之前向液体培养基中添加15g/l琼脂。
[0354] 在厌氧筛选实验中,使用矿质培养基。Verduyn等(Yeast(1992),第8卷,501-517) 已经描述了矿质培养基的组成。然而,避免使用硫酸铵;相反,使用2.3g/l尿素作为氮源。另 外,添加麦角固醇(〇. 〇 1 g/L)、吐温80(Tween 80) (0.42g/L)和糖(如所示)。
[0355] 菌株RN1069的转化株(通过整合DNA构建体)为组氨酸营养缺陷型。
[0356] 菌株
[0357] 实验中使用的菌株为RN1041和RN1069。在W0 2012/067510中已经描述了RN1041。 该菌株具有以下基因型:
[0358] MAT a、ura3_52、leu2_l12、his3::loxP、gre3::ΙοχΡ、ΙοχΡ-ρΤΡΙ1::TALI、ΙοχΡ-pTPIl: :RKIUloxP-pTPIl-TKLUloxP-pTPIl-RPEU5: :pADHl-XKSl-tCYCl-LEU2^5: :URA3- pTPIl-xylA-tCYCl
[0359] MAT a =接合型a
[0360] 分别在URA3、LEU2和HIS3基因中的ura3-52、leu2-112、HIS3: :loxP突变。ura3-52 突变由Piromyces xylA过表达构建体上的URA3基因补充;leu2-112突变由XKS1过表达构建 体上的LEU2基因补充。HIS3基因的缺失产生组氨酸营养缺陷型。出于这个原因,RN1041需要 培养基中的组氨酸才能生长。
[0361] gre3::l〇xP是编码醛糖还原酶的GRE3基因缺失。去除标记后ΙοχΡ位点留在基因组 中。
[0362] ΙοχΡ-ρΤΡΙΙ指在本文描述的实验中,通过用TPI1基因的启动子置换天然启动子, 非氧化磷酸戊糖途径的基因的过表达。去除标记后组成型TPI1强启动子上游的ΙοχΡ位点留 在基因组中(Kuyper等,FEMS Yeast Research5(2005)925-934)〇
[0363] δ::意为在Tyl反转座子的长末端重复序列上重组后,构建体的染色体整合。
[0364] 菌株RN1001是菌株RN1041的亲本菌株,即在HIS3-基因缺失之前。
[0365] 菌株RN1069源自RN1041:通过基因置换破坏了GPD1和GPD2基因。为了这个目的,通 过PCR构建两侧是与正好在GPD1或GPD2的开放阅读框(0RF)旁边的序列同源的序列的显性 抗生素抗性标记,并用于转化菌株RN1041。这些基因破坏盒已经分别作为SEQ ID N0:28和 29包括在序列表中。在W02013/081456中也详细描述了菌株RN1069的构建。菌株RN1069的基 因型为:MAT a、ura3_52、leu2_l 12、his3 : : ΙοχΡ、gre3: : ΙοχΡ、loxP-pTPIl: : TALI、ΙοχΡ-pTPIl: :RKIUloxP-pTPIl-TKLUloxP-pTPIl-RPEU5: :pADHl-XKSl-tCYCl-LEU2^5: :URA3-pTPIl-xylA-tCYClgpdl::hphMX、gpd2::natMX。
[0366] 菌株RN1189用作参照菌株。在W02013/081456中描述了菌株RN1189。简言之,通过 用质粒PRN977转化菌株RN1069构建菌株RN1189。质粒pRN977为2μ质粒并且含以下特征:用 于选择转化株的HIS3-基因,E.coli中用于选择的氨苄青霉素抗性标记,来自于E.coli的在 PGK1-启动子和ADH1-终止子控制下的adhE-基因,来自于S.cerevisiae的在TPI1-启动子和 PGI1-终止子控制下的DAK1-基因和在ACT1-启动子和CYC1-终止子控制下的E.coli gldA-基因。所有启动子和终止子均来自于S.cerevisiae。
[0367] 菌株构建
[0368] 在专利申请PCT/EP2013/056623中描述了菌株构建方法。其描述了使得能够由多 个目标基因构建表达盒的技术,所述构建的方式使得这些盒组合成途径并且在该酵母转化 后整合到酵母基因组的特定位点。图2中描绘了示意图。
[0369] 首先,选择酵母基因组中的整合位点(例如,INT1)。使用PCR扩增整合位点上游和 下游部分约500bp的DNA片段,两侧为接头。这些接头是允许在酵母(例如Saccharomyces cerevisiae)中转化后该途径正确体内重组的50bp序列。通过PCR产生目标基因以及选择抗 性标记(例如kanMX),如图2中所示,在每个侧翼整合不同接头。酵母细胞经DNA片段转化后, 在期望位置发生体内重组并整合到基因组中。这种技术允许途径调谐,因为来自于该途径 的一个或多个基因可被其它基因或遗传元件置换,只要允许同源重组的接头保持不变(专 利申请PCT/EP2013/056623)。
[0370] 表达盒构建
[0371] 在DNA 2.0(Menlo Park,CA 94025,USA)合成开放阅读框(0RF)、启动子序列和终 止子。这些遗传元件的序列作为SEQ ID NO: 1直到且包括26列出。如Engler等(2011)和其中 的参考文献所述,使用Golden Gate技术组装启动子、0RF和终止子序列。组装的表达盒连接 到经Bsal消化的骨架载体中;A组(表2)连接到p5Abbn中(SEQ ID NO: 44); B组(表2)连接到 pBCbbn中(SEQ ID N0:45);C组(表2)连接到pCDbbn中(SEQ ID N0:46)且D组(表2)连接到 pD3bbn中(SEQ ID N0:47)。
[0372] 表达盒扩增
[0373] 使用描述为SEQ ID N0:30-43的引物(参见下文),通过PCR扩增如以上("表达盒构 建"部分)所述产生的组装的表达盒、整合侧翼和选择标记。kanMX-标记,如同酵母中用于选 择的G418抗性标记,扩增自含有这种标记的质粒。将该标记的序列描述为SEQ ID N0:27。
[0374] 使用SEQ ID N0:30和31(5'-INT1侧翼)及42和43(3'-ΙΝΤ1侧翼),由来自于菌株 CEN. PK113-7D的基因组DNA扩增I NT 1 -侧翼。
[0375] 表10:用于由ASS(组装的表达盒)扩增CAS(具有用于在酵母中同源重组的重叠序 列的表达盒)的引物概述。使用相应编号(例如,CAS01来自于ASS01)。
[0376]
[0377] 酵母细胞的转化
[0378]根据Schiestl和Gietz(Current Genetics( 1989),第16卷,339-346)描述的方法 进行酵母转化。
[0379] 微孔板中的厌氧生长实验
[0380]在平底NUNC微孔板(MTP)中进行生长实验。每个孔装满275μ1的培养基。培养基的 组成如下:
[0381] 矿质培养基(基于Verduyn等(1992),尿素代替硫酸铵)
[0382] 2 %葡萄糖
[0383] 2 % 木糖
[0384] 1% 甘油
[0385] 2g/l 乙酸
[0386] 200μg/ml组氨酸(在为菌株RN1069和衍生株的情况下,其为his3: :1οχΡ)ρΗ 4.5
[0387] 所有MTP经铝密封物密封。然后将MTP置于厌氧培养箱(Infors)中。生长48小时后, 将MTP从厌氧Infors中取出。然后该板在微孔板离心机中在2750rpm下旋转10分钟。然后将 150μ 1上清液转移到适于NMR分析的MTP中。
[0388] NMR 分析
[0389]为了量化样品中的葡萄糖、木糖、甘油、乙酸和乙醇,向适合的小瓶中精确地转移 150μ1样品。随后添加 100μΙ内标溶液,其含有在D20中的马来酸(20g/l)、EDTA(40g/l)和微 量DSS (4,4-二甲基-4-硅戊烷-1 -磺酸)和450yL D20。
[0390] 在装备有冷冻探针的Bruker Avance III 700MHz上,使用脉冲程序,以水峰抑制 (功率相当于3Hz)在27°C的温度下记录1D咕NMR谱。
[0391]基于以下信号(δ相对于DSS)计算分析物浓度:
[0392] · 5.22ppm下的α-葡萄糖峰(d,0.38H,J = 4Hz),
[0393] · 5.18ppm下的α-木糖峰(d,0.37H,J = 4Hz),
[0394] · 3.55ppm下的甘油峰((1(1,2!1,了1,2 = 6抱和了1£1,:^=12抱)
[0395] · 1 · 91ppm 下的乙酸峰(s, 3H)
[0396] · 1 · 17ppm 下的乙醇峰(t, 3H, J = 7Hz)
[0397] ?标准的信号使用者:
[0398] · 6.05ppm下的马来酸峰(s,2H)
[0399] 实施例1
[0400] 酵母转化株的全部组合阵列的构建
[0401] 如上所述构建菌株的完整组合阵列。为了这个目的,用全部1280种基因混合物(见 上)转化菌株RN1069。将转化混合物铺板在含20g/l葡萄糖和200yg G418/ml的YEP-琼脂上。 [0402]从每种转化,选择两个独立转化株并转移到微孔板中的YEPD琼脂中(每孔1个菌 落)。在每个微孔板上,也接种了参照菌株:RN1189。
[0403] 实施例2
[0404] 生长实验和结果分析
[0405] 在材料和方法中描述的实验设置中试验所选菌落和菌株的阵列(实施例1)。
[0406] 简言之,具有YEro-琼脂的微孔板中的菌株用于接种微孔板中275μ1含200μg/ml组 氨酸、2 %葡萄糖、2 %木糖、1 %甘油和2g/l乙酸的矿质培养基。培养基的pH设为4.5,低于乙 酸的pKa。密封微孔板并且在厌氧条件下培育48小时。通过离心使细胞沉降并且通过NMR分 析上清液。表11中给出了前150个结果。
[0407]
[0408]
[0409]
[0410]
[0411]
[0412]
[0413]
[0414]
[0415]
[0416]
[0417] 在图3中,根据残留甘油浓度绘制发酵液中的残留乙酸浓度。结果清晰地显示,在 残留甘油浓度和残留乙酸浓度之间存在强相关:发酵后残留甘油浓度越低,残留乙酸浓度 越低。这表明两种途径相互关联,正如已经在专利申请W02013/081456中所示。
[0418] 其中一个菌株消耗几乎所有乙酸(图3中左下角数据点)并且表现优于其它转化 株。该菌株命名为YD01247。
[0419] 总的来说,筛选2592个菌株,包括参照菌株RN1189。参照菌株RN1189被包括了27 次。图6中描绘了参照菌株RN1189相对于其它菌株(总共2592个)的性能。如前所述为菌株分 级,其中表现较良好的菌株用较浅的颜色指示(并且更靠近图的左下角)。表现良好性较低 的菌株用较深的颜色指示;颜色的变化是渐变的。参照菌株RN1189例外,其用最深的颜色指 不。
[0420] 为了评估表达盒的最佳组合,使用NMR数据进行计算。根据以下为所有菌株评分:
[0421 ] 1)培养基中剩下的残留乙酸浓度,
[0422] 2)培养基中剩下的残留甘油浓度,
[0423] 3)由甘油和乙酸生成的乙醇的量,从生成的乙醇总量中减去由木糖和葡萄糖生成 的乙醇的理论量。
[0424] 将三个得分加起来为所有样品分级(表11)。基于这最后一项得分最佳的150个菌 株被可视化,并且也显示在图4中。
[0425] 从最佳的150个菌株,确定了属于A、B、C和D组(见上)的哪些表达盒过表达。参见表 11和表12。
[0426] 表12:下表中描绘了前150个表现最佳的转化株中每种表达盒出现的次数
[0427]
[0428]
[0429] 观祭结采为:
[0430] a) -般而言,对强启动子使用的计数比(较)弱启动子的使用更频繁,因为具有强 启动子的表达盒与(较)弱启动子相比,在150个菌株中更多出现(overrepresented);
[0431 ] b) CAS2和CAS3在AADH组中更多出现;
[0432] c)CASll和CAS12大致相同地良好出现(well represented);
[0433] d)虽然表达盒CAS15和CAS16也良好出现,但CAS13和CASH表现为在GLD组中略微 更多出现;
[0434] e)虽然CAS21和CAS23在前150个菌株中也良好出现,但CAS23在DAK组中更多出现;
[0435] f)试验的所有表达盒(CAS)在前150个菌株中均出现,表明存在多个解决方案。
[0436] 然而,表达盒的许多组合与参照菌株RN1189相比,由于甘油和乙酸转化增大,导致 乙醇产率提高。这表明表达盒的许多其它组合可提供将甘油和乙酸在由这两种化合物和发 酵性糖组成的混合物中转化为乙醇的解决方案。菌株YD01247,筛选中的最佳菌株(图3和图 4)是对此的例证:其由表达盒CAS01、CAS12、CAS13和CAS23组成。
[0437]许多菌株几乎消耗掉所有可用乙酸。这些菌株能够消耗3_4g甘油/升。
[0438] 实施例3
[0439] 表达盒最佳组合的再试验
[0440]在多因素设计中,再试验了表达盒最佳组合(实施例2)。因为在菌株YD01247中, ACS2-基因的表达受具有弱启动子的构建体(即CAS12)的控制,所以在实验设计中也采用了 这种表达盒,尽管在实施例2中的前150个菌株中没有更多出现这种表达盒。
[0441 ]用选自A、B、C和D组的表达盒的8个组合转化菌株RN1069 (表13)。
[0442] 表13:表达盒最佳组合的再试验
[0443]
[0444] 转化后,将细胞涂在补充了20g葡萄糖/升和200yg G418/ml的YEP琼脂上。每次转 化,使用8个独立菌落接种装有补充了20g葡萄糖/L和200yg G418/ml的YEP琼脂的微孔板, 除R2外;在这种情况下,仅获得3个转化株。
[0445] 作为参照菌株,RN1069、RN1189和YD01247也按8倍包括在内。
[0446] 具有YEH)琼脂和G418的微孔板中的菌株用于接种微孔板中275μ1含200μg/ml组氨 酸、2%葡萄糖、2%木糖、1 %甘油和2g/l乙酸的矿质培养基,一式三份。培养基的pH设为 4.5,低于乙酸的pKa。密封微孔板并且在厌氧条件下培育。在3个不同的时间间隔,即在24、 48和72小时后,每个时间点将一个板从厌氧振荡器中取出。通过离心使细胞沉降并且通过 NMR分析上清液。图5中示出了孵育72小时后的NMR结果,尤其是甘油和乙酸的残留浓度。
[0447] 菌株RN1069(参照菌株之一)中的残留乙酸浓度仍接近2.0g/l,这与预期相符。同 样,这个菌株也未消耗甘油。
[0448] 概念验证菌株RN1189(W02013/081456)平均消耗0.9g乙酸/L和1.5g甘油/L。
[0449] 参照菌株YD01247在所有中表现最佳;残留乙酸浓度仅为0.2g/L(消耗90 %的乙 酸)并且残留甘油浓度仅为5.5g/L。
[0450] 重构转化株(除R2外)的残留乙酸浓度介于0.3g/L和0.6g/L之间并且残留甘油浓 度介于6 · 6g/L和7 · Og/L之间。
[0451] 转化R2不但产生的转化株较少,而且在结果中观察到很大范围。因此,未解释这些 结果。
[0452] 总之,所有试验的表达盒组合,除R2外,在厌氧甘油和乙酸转化方面与参照菌株 RN1189相比导致性能改善。
[0453] 实施例4
[0454] 对选定转化株的厌氧摇瓶实验
[0455] 在摇瓶中试验选择的转化株的性能。为了这个目的,制备实施例2中产生的表14中 的菌株的预培养物。
[0456] 表14:用于厌氧摇瓶实验的菌株及表达盒的存在
[0457]
[0458」 图7中将菌株YU01247、YU01248、YU01249和YU01250分别表不为数子1、2、3和4。菌 株YD01251是在甘油和乙酸消耗方面表现中等良好的菌株。
[0459]为100ml摇瓶填充25ml每升含有约:20g葡萄糖、20g木糖、10g甘油、200mg组氨酸和 2g乙酸(HAc) (pH 4.5)的矿质培养基(如材料和方法中所述)。
[0460]用来自于预培养物的经洗涤细胞,以达到0.5的初始0D600所需的量接种这些摇 瓶,一式两份。烧瓶经水封封闭以在发酵期间达到厌氧条件。在32°C和lOOrpm下进行培育。 96小时后,终止发酵并且通过离心使细胞沉降。通过NMR分析上清液。结果示于表15中。
[0461] 表15:厌氧摇瓶实验的平均NMR结果
[0462]
[0463] 菌株CEN.PK113-7D仅使葡萄糖发酵,这与预期相符。根据消耗的糖计算的乙醇产 率为0.44,这符合在摇瓶发酵中通常所发现的。理论最高乙醇产量为每克糖0.51g乙醇。
[0464] 原则上,菌株RN1069使葡萄糖和木糖两者发酵。然而,这个菌株具有GPD1和GPD2两 者的缺失,这使得在厌氧条件下的辅因子再生不可能。然而,这个菌株部分地转化葡萄糖和 木糖,推测是因为在实验开始时,在摇瓶的顶部空间一些残留氧以及培养基中溶解的氧可 用,使得能够在实验开始时回收一些辅因子。然而,乙醇产率低,每克消耗的糖为〇.39g乙 醇。
[0465] 表达来自于质粒的AADH、GLD和DAK(RN1189)或表达来自于基因组中的整合构建体 的AADH、ACS、GLD和DAK(YD01247至YD01251)的转化菌株显示每消耗的糖的乙醇产率增加。 达到0.48多至0.50的乙醇产率。由于甘油和乙酸向乙醇的厌氧转化和/或没有甘油生成,所 以达到这些较高值。
[0466] 菌株YD01247比其它YD菌株消耗的木糖更少。然而,正如已经在实施例2和3中所 示,这个菌株已经消耗掉几乎所有乙酸。这个菌株还已消耗大部分甘油。这个菌株显示出最 高的乙醇产率。
[0467] 其它YD菌株相对于菌株RN1189还显示出性能改善:消耗更多的甘油和乙酸,导致 乙醇滴度更高。
[0468] 这些实验证实,表达盒的多种替代组合导致与参照菌株RN1189相比,在甘油和乙 酸厌氧转化方面性能改善,导致在所有情况下乙醇滴度更高并且在一些情况下乙醇产率更 尚。
[0469] 文献
[0470] Engler C.et al(2011)Generation of families of construct variants using golden gate shuffling.Methods Mol Biol.2011;729:1,67-81.doi:10.1007/ 978-1-61779-065-2_ll;
[0471 ] Guadalupe Medina V,Almering MJ, van Maris AJ,Pronk JT(2009) "Elimination of glycerol production in anaerobic cultures of Saccharomyces cerevisiae engineered for use of acetic acid as electron acceptor .''Appl Environ Microbiol.;
[0472] Lee and Dasilva(2006)Application of sequential integration for metabolic engineering of 1,2-propanediol production in yeast.Metab Eng.8(1): 58-65;
[0473] Sonderegger et al(2004)Metabolic Engineering of a Phosphoketolase Pathway for Pentose Catabolism in Saccharomyces cerevisiae.AEM 70(5),2892-2897;
[0474] Van Dijken and Scheffers(1986)Redox balances in the metabolism of sugars by yeasts.FEMS Microbiology Letters Volume 32,Issue 3-4,pages 199-224;
[0475] Yu et al(2010)Engineering of glycerol utilization pathway for ethanol production by Saccharomyces cerevisiae.Bioresour.Techno1.101(11):4157-4161;
[0476] Yu et al(2011) Improvement of ethanol yield from glycerol via conversion of pyruvate to ethanol in metabolically engineered Saccharomyces cerevisiae.Appl Biochem Biotecnol doi:10.1007/sl2010-011-9475-9;
[0477] 专利申请PCT/EP2013/056623(未公开);
[0478] 专利申请TO 2013/081456;
[0479] 专利申请TO 2011/010923。
【主权项】
1. 经遗传修饰的细胞,其包含: a) 编码NAD+依赖型乙酰化乙醛脱氢酶(E.C. 1.2.1.10)的一个或多个核苷酸序列; b) 编码乙酰-CoA合成酶(E.C. 6.2.1.1)的一个或多个核苷酸序列; c) 编码甘油脱氢酶(E.C. 1.1.1.6)的一个或多个核苷酸序列;和 d) 编码二羟基丙酮激酶(E.C. 2.7.1.28或E.C. 2.7.1.29)的一个或多个核苷酸序列。2. 根据权利要求1所述的细胞,其包含编码甘油3-磷酸磷酸水解酶和/或编码甘油3-磷 酸脱氢酶基因的一个或多个内源核苷酸序列的缺失或破坏。3. 根据权利要求2所述的细胞,其中 c)是编码SEQIDN0:7表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:7具有至 少60%序列同一性的SEQIDN0:7功能同源物的一个或多个核苷酸序列;和/或 编码SEQIDN0:9表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:9具有至少 60%序列同一性的SEQIDN0:9功能同源物的一个或多个核苷酸序列。4. 根据权利要求3所述的细胞,其中 c) 是编码SEQIDN0:7表示的异源甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:7具有至 少60%序列同一性的SEQIDN0:7功能同源物的一个或多个核苷酸序列。5. 根据权利要求1-4中任一项所述的细胞,其中 d) 是编码SEQIDN0:11表示的二羟基丙酮激酶(E.C.2.7.1.28或E.C.2.7.1.29)或与 SEQIDNO: 11具有至少40%序列同一性的SEQIDNO: 11功能同源物的一个或多个异源核 苷酸序列;和/或 编码SEQIDN0:13表示的二羟基丙酮激酶(E.C.2.7.1.28或E.C.2.7.1.29)或与SEQ IDNO: 13具有至少40%序列同一性的SEQIDNO: 13功能同源物的一个或多个核苷酸序列。6. 根据权利要求5所述的细胞,其中 d)是编码SEQIDN0:13表示的二羟基丙酮激酶(E·C·2·7·1·28或E·C·2·7·1·29)或与SEQIDNO: 13具有至少40%序列同一性的SEQIDNO: 13功能同源物的一个或多个核苷酸 序列。7. 根据权利要求1-6中任一项所述的细胞,其中 a)是编码SEQIDN0:1表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDN0:1具 有至少60%序列同一性的SEQIDNO: 1功能同源物的一个或多个核苷酸序列;和/或 编码SEQIDNO: 2表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO: 2具有至 少60%序列同一性的SEQIDN0:2功能同源物的一个或多个核苷酸序列;和/或 编码SEQIDNO: 3表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO: 3具有至 少60%序列同一性的SEQIDN0:3功能同源物的一个或多个核苷酸序列。8. 根据权利要求7所述的细胞,其中 a)是编码SEQIDN0:1表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDN0:1具 有至少60%序列同一性的SEQIDNO: 1功能同源物的一个或多个核苷酸序列;和/或 编码SEQIDNO: 2表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO: 2具有至 少60%序列同一性的SEQIDN0:2功能同源物的一个或多个核苷酸序列。9. 根据权利要求8所述的细胞,其中 a)是编码SEQIDNO: 2表示的异源NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO: 2具 有至少60%序列同一性的SEQIDN0:2功能同源物的一个或多个核苷酸序列。10. 根据前述权利要求中任一项所述的细胞,其中 b)是编码SEQIDNO:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQID NO:6具有至少60%序列同一性的SEQIDNO:6功能同源物的一个或多个核苷酸序列。11. 根据权利要求1-10中任一项所述的细胞,其中 a) 是编码SEQIDNO:3表示的NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO:3具有至 少60%序列同一性的SEQIDNO:3功能同源物的一个或多个核苷酸序列; b) 是编码SEQIDNO:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQID NO:6具有至少60%序列同一性的SEQIDNO:6功能同源物的一个或多个核苷酸序列; c) 是编码SEQIDNO:7表示的甘油脱氢酶(E.C.1.1.1.6)或与SEQIDNO:7具有至少 60%序列同一性的SEQIDNO:7功能同源物的一个或多个核苷酸序列;和 d) 是编码SEQIDΝΟ:11表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQIDNO: 11具有至少40%序列同一性的SEQIDNO: 11功能同源物的 一个或多个核苷酸序列。12. 根据权利要求1-10中任一项所述的细胞,其中 a) 是编码SEQIDNO: 2表示的NAD+依赖型乙酰化乙醛脱氢酶或与SEQIDNO: 2具有至 少60%序列同一性的SEQIDN0:2功能同源物的一个或多个核苷酸序列; b) 是编码SEQIDN0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQID N0:6具有至少60%序列同一性的SEQIDN0:6功能同源物的一个或多个核苷酸序列; c) 是编码SEQIDN0:9表示的甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:9具有至少 60%序列同一性的SEQIDN0:9功能同源物的一个或多个核苷酸序列;和 d) 是编码SEQIDN0:11表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQIDNO: 11具有至少40%序列同一性的SEQIDNO: 11功能同源物的 一个或多个核苷酸序列。13. 根据权利要求1-10中任一项所述的细胞,其中a)是编码SEQIDN0:2表示的NAD+依 赖型乙酰化乙醛脱氢酶或与SEQIDNO: 2具有至少60%序列同一性的SEQIDNO: 2功能同 源物的一个或多个异源核苷酸序列; b) 是编码SEQIDN0:6表示的同源或异源乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQID N0:6具有至少60%序列同一性的SEQIDN0:6功能同源物的一个或多个核苷酸序列; c) 是编码SEQIDN0:7表示的甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:7具有至少 60%序列同一性的SEQIDN0:7功能同源物的一个或多个核苷酸序列;和 d) 是编码SEQIDN0:13表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQIDNO: 13具有至少40%序列同一性的SEQIDNO: 13功能同源物的 一个或多个核苷酸序列。14. 根据权利要求1-10中任一项所述的细胞,其中a)是编码SEQIDNO: 1表示的NAD+依 赖型乙酰化乙醛脱氢酶或与SEQIDNO: 1具有至少60%序列同一性的SEQIDNO: 1功能同 源物的一个或多个核苷酸序列; b)是编码SEQIDN0:6表示的乙酰-CoA合成酶(E.C.6.2.1.1)或与SEQIDN0:6具有至 少60%序列同一性的SEQIDN0:6功能同源或异源同源物的一个或多个核苷酸序列; c) 是编码SEQIDN0:7表示的甘油脱氢酶(E.C.1.1.1.6)或与SEQIDN0:7具有至少 60%序列同一性的SEQIDN0:7功能同源物的一个或多个异源核苷酸序列;和 d) 是编码SEQIDNO:13表示的同源或异源二羟基丙酮激酶(E.C.2.7.1.28S E.C.2.7.1.29)或与SEQIDNO: 13具有至少40%序列同一性的SEQIDNO: 13功能同源物的 一个或多个核苷酸序列。15. 根据前述权利要求中任一项所述的细胞,其中所述细胞是酵母细胞。16. 根据权利要求15所述的细胞,其中在所述酵母细胞中编码甘油3-磷酸磷酸水解酶 的所有内源核苷酸序列和编码甘油3-磷酸脱氢酶的所有内源核苷酸序列缺失。17. 根据权利要求16所述的细胞,其中所述酵母细胞无编码NADH依赖型甘油3-磷酸脱 氢酶的基因。18. 根据权利要求15-17中任一项所述的酵母细胞,其中所述酵母细胞选自 Saccharomycetaceae,特另lj是选自Saccharomyces,如Saccharomycescerevisiae; Kluyveromyces,如Kluyveromycesmarxianus;Pichia,如Pichiastipitis或Pichia angusta;Zygosaccharomyces,如Zygosaccharomycesbai1ii;和Brettanomyces,如 Brettanomycesintermedius,Issatchenkia,如Issatchenkiaorientalis^PHansenul^9 组。19. 根据权利要求1-14中任一项所述的细胞,其中所述细胞为原核细胞。20. 根据权利要求19所述的细胞,其中所述细胞选自Clostridium,Zymomonas, Thermobacter,Escherichia,Lactobaci1lus,Geobaci1lus和Baci1lus〇21. 编码SEQIDNO:1-14中任一个表示的多肽的多核苷酸。22. 包含权利要求21的一个或多个多核苷酸的核酸构建体。23. 用权利要求22的核酸构建体转化的宿主细胞。24. 根据权利要求1-20或24中任一项所述的细胞用于制备乙醇的用途。25. 用于制备发酵产物的方法,其包括由乙酸盐/酯和发酵性碳水化合物一一尤其是选 自葡萄糖、果糖、蔗糖、麦芽糖、木糖、阿拉伯糖、半乳糖和甘露糖的组的碳水化合物一一制 备发酵产物,所述制备在厌氧条件下使用根据权利要求18-20中任一项的酵母细胞进行。26. 根据权利要求25所述的方法,其中所述制备在包含摩尔比为0.7或更低,尤其为至 少0.004至0.5,更尤其为0.05至0.3的乙酸盐/酯和碳水化合物的发酵培养基中进行。27. 根据权利要求25或26所述的方法,其中所述碳水化合物的至少一部分和所述乙酸 盐/酯的至少一部分已经通过水解选自木质纤维素、纤维素、半纤维素和果胶的组的多糖获 得。28. 根据权利要求27所述的方法,其中所述木质纤维素是已经水解从而获得发酵性碳 水化合物和乙酸盐/酯的木质纤维素生物质。29. 根据权利要求28所述的方法,其中木质纤维素或半纤维素材料与酶组合物接触,其 中生成一种或多种糖,并且其中生成的糖被发酵以产生发酵产物,其中所述发酵用权利要 求1-18中任一项的经转化宿主细胞进行。30. 根据权利要求29所述的方法,其中所述发酵产物是乙醇、丁醇、乳酸、塑料、有机酸、 溶剂、动物饲料添加剂、药物、维生素、氨基酸、酶或化学原料中的一种或多种。
【专利摘要】经遗传修饰的细胞,其包含:a)编码NAD+依赖型乙酰化乙醛脱氢酶(E.C.1.2.1.10)的一个或多个核苷酸序列;b)编码乙酰-CoA合成酶(E.C.6.2.1.1)的一个或多个核苷酸序列;c)编码甘油脱氢酶(E.C.1.1.1.6)的一个或多个核苷酸序列;和d)编码二羟基丙酮激酶(E.C.2.7.1.28或E.C.2.7.1.29)的一个或多个核苷酸序列。
【IPC分类】C12N9/04, C12P7/06, C12N15/54, C12N15/52, C12N15/53, C12N9/00, C12N9/02, C12P7/10
【公开号】CN105492599
【申请号】CN201480047282
【发明人】保罗·克莱斯森, 沃特·威廉·安东尼奥斯·哈特曼
【申请人】帝斯曼知识产权资产管理有限公司
【公开日】2016年4月13日
【申请日】2014年8月29日
【公告号】EP3039130A2, US20160208291, WO2015028582A2, WO2015028582A3