具有通透酶活性的多肽的制作方法

xiaoxiao2020-6-24  23

专利名称:具有通透酶活性的多肽的制作方法
技术领域
本发明涉及新颖的多肽和表达所述多肽的重组生物。在一个实施方式中,本发明涉及新颖的通透酶多肽,更具体地涉及Saccharomyces cerevisiae中新颖的GAL2。
背景技术
通透酶(Permease)是膜转运蛋白,这是一类多次跨膜蛋白(multipasstransmembrane protein),其促进特定分子(在本文中具体地是一种或多种糖)通过被动转运而扩散进入细胞或扩散出细胞。相反,主动转运蛋白(active transporters)将分子跨膜转运与能量源如ATP或有用的离子梯度偶联在一起。在Saccharomyces cerevisiae中,通透酶GAL2转运半乳糖跨过细胞膜。还已知其为葡萄糖跨膜的转运蛋白。

发明内容
本发明的一个目的是提供新颖的通透酶多肽。本发明的另一个目的是提供表达通透酶多肽的重组菌株,所述重组菌株对于被通透酶转运跨过细胞膜的分子具有经改进的摄入。另一个目的是提供与亲本多肽相比对C5糖具有高亲和力的通透酶多肽。另一个目的是提供与亲本多肽相比对C6糖具有降低的亲合力的通透酶多肽。根据本发明实现了这些目的中的一个或多个。根据本发明,提供了在对应于SEQID NO:55的T219的一个或多个位置上具有突变的多肽,其中所述多肽与SEQ ID N0:55具有至少50%的序列同一性,并且其中所述多肽具有通透酶活性。在一个实施方式中,多肽具有取代T219N或T219Q。在一个实施方式中,多肽具有取代T219N。

图17、19和20表明,具有一个或多个这些突变的多肽具有有利的糖消耗和/或发酵生产。还见下文实施例18。附图概沭图1 展示了菌株 DS62504 (图1 (a))、MK307 (图1 (b))和 IMK311 (图1 (c))的摇瓶培养期间葡萄糖( )、阿拉伯糖(▲)和乙醇(■)浓度以及660nm处的光密度(0D660, )。图2 展示了菌株 DS62504 (图 2 (a)), IMK307 (图 2 (b))和 MK311 (图 2 (c))的厌氧培养期间葡萄糖( )、阿拉伯糖(▲)和乙醇(■)浓度以及排出气中的C02百分比(黑色实线)。发酵物用葡萄糖培养的摇瓶培养物接种。图3展示了通过测量含有2%阿拉伯糖和多种浓度葡萄糖(O、0.11、0.23、0.65、1.3和2.5%)的MY尿素中菌株MK318的摇瓶培养物在660nm处的光密度测定的生长曲线。图4以下菌株摇瓶培养期间的葡萄糖( )、阿拉伯糖(▲)和乙醇(■)浓度以及660nm处的光密度(0D660,.):菌株IMK318,根据表3连续转移(系列1:SF1、SF2和SF5);从该摇瓶系列中选择的单菌落隔离群IMW018。图5展示了以下菌株摇瓶培养期间的葡萄糖( )、 阿拉伯糖(▲)和乙醇(■)浓度以及660nm处的光密度(0D660,.):菌株MK318,根据表3连续转移(系列I:SFU SF2和SF3);从该摇瓶系列中选择的单菌落隔离群IMW017。图6展示了菌株IMW017的连续厌氧培养期间的葡萄糖( )、阿拉伯糖(▲)和乙醇(■)浓度以及排出气中的CO2百分比(灰色实线)。图7展示了菌株IMW017的连续厌氧培养期间排出气中的CO2百分比(灰色实线)和生长速率。比生长速率得自于在葡萄糖和阿拉伯糖混合物上(.)或仅阿拉伯糖上( )分批培养期间的CO2生产曲线。图8展示了菌株IMW017的厌氧连续分批培养期间,补充有阿拉伯糖(A)和葡萄糖与阿拉伯糖的混合物(B)的培养基中,各个批次的CO2生产曲线。假定相等的初始C02生产水平来比对CO2生产曲线。图例中的数字指出连贯的(consecutive)批次编号。图9展示了菌株IMW017连续厌氧分批培养的批次24和25期间的葡萄糖( )、阿拉伯糖(▲)和乙醇(■)浓度以及排出气中的CO2百分比(灰色实线)。图10 展示了菌 株 DS62504、IMK307, IMK31U IMK318, IMWO17 和 IMW018 的己糖激酶活性。图11展示了补充有2%葡萄糖和2%阿拉伯糖的MY培养基中,菌株IMW023摇瓶培养期间的0D660 (.)、阿拉伯糖浓度(▲)和葡萄糖浓度(令)。图12展示了补充有2%葡萄糖和2%阿拉伯糖的MY培养基中,菌株IMW023的连续转移培养物的第一(SFl)和第24 (SF24)摇瓶培养期间的0D660 (.)、阿拉伯糖浓度(▲)和葡萄糖浓度(令)。图13展示了补充有2%葡萄糖和2%阿拉伯糖的MY培养基中,菌株IMW023的连续转移培养物的各个摇瓶培养中测定的估计的比生长速率。图14展示了补充有20g/升葡萄糖和20g/升阿拉伯糖的MY培养基中,菌株IMW023的连续厌氧分批培养期间,排出气中的CO2百分比(灰色实线)和比生长速率,以及各个分批培养期间的比生长速率。灰色阴影表示供应空气来代替氮气的地方。箭头标明开始新的连贯批次。图15展示了补充有20g/升葡萄糖和20g/升阿拉伯糖的MY培养基中,菌株IMW023的连续厌氧分批培养期间,排出气中CO2的百分比(灰色实线)、阿拉伯糖浓度(▲)和葡萄糖浓度(令)。图16展示了补充有20g/升葡萄糖和20g/升阿拉伯糖的MY培养基中,菌株IMW023的厌氧连续分批培养期间,经比对的各个批次的CO2生产曲线。假定相等的初始CO2生产水平来比对CO2生产曲线。图例中的数字指出连贯的批次编号。图17 展示了菌株 DS62504 (图 17 (a))、MK307 (图 17 (b))、MK311 (图 17 (C))、IMWO17 (图 17 (d))、IMWO18 (图 17 Ce))和 IMW058 (图 17 (f)), IMW024 (图 17 (g))、IMW025 (图 17 (h))、IMW047 (图 17 (i))、IMW059 (图 17 (j))、IMW060 (FIG17 (k))、IMW061 (I))摇瓶培养期间的葡萄糖( )、阿拉伯糖(▲)和乙醇(□)浓度以及660nm处的光密度(0D660,.)。图18展示了菌株IMW047的摇瓶培养期间的葡萄糖( )和阿拉伯糖(▲)浓度。图19 展示了菌株 CEN.PK113-7D、IMK318, IMWO17 和 IMW018 的 GALl 氨基酸比对。图20 展示了菌株 CEN.PK113-7D、IMK318, IMWO17 和 IMW018 的 GAL2 氨基酸比对。
图21展示了补充有ZOgr1葡萄糖和ZOgr1阿拉伯糖的MY培养基中,菌株IMW059厌氧培养期间的葡萄糖( )、阿拉伯糖(▲)、乙醇(□)浓度、生物质干重(.)和C02生产(灰色实线)。图22展示了补充有ZOgr1葡萄糖和ZOgr1阿拉伯糖的MY培养基中,菌株IMW060厌氧培养期间的葡萄糖( )、阿拉伯糖(▲)、乙醇(□)浓度、生物质干重(.)和C02生产(灰色实线)。图23展示了补充有ZOgr1葡萄糖和ZOgr1阿拉伯糖的MY培养基中,菌株IMW061厌氧培养期间的葡萄糖( )、阿拉伯糖(▲)、乙醇(□)浓度、生物质干重(.)和C02生产(灰色实线)。图24展示了在ZOgr1葡萄糖和ZOgr1阿拉伯糖的混合物中厌氧培养期间,菌株DS62504 (黑色点线)、IMW059 (黑色实线)、IMW060 (黑色实线)和IMW061 (黑色条纹线)的C02生产曲线。图25展示了菌株DS62504在培养基CFMM2M上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□)浓度。图26展示了菌株IMW060在培养基CFMM2M上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□)浓度。图27展示了菌株IMW061在培养基CFMM2M上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□)浓度。图28展示了菌株DS62504在培养基CFMMlM上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□)浓度。图29展示了菌株IMW060在培养基CFMMlM上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□) 浓度。 图30展示了菌株IMW061在培养基CFMMlM上摇瓶培养期间的葡萄糖( )、甘露糖( )、阿拉伯糖(▲)和乙醇(□)浓度。序列表概沭用于构建基因打断盒的寡核苷酸:SEQ ID N0:1公开了寡核苷酸HXK2_disA的序列SEQ ID N0:2公开了寡核苷酸HXK2_disB的序列SEQ ID NO: 3公开了寡核苷酸HXKl-disA的序列SEQ ID NO:4公开了寡核苷酸HXKl-disB的序列SEQ ID NO: 5公开了寡核苷酸GLKl-disA的序列SEQ ID NO:6公开了寡核昔酸GLKl-disB的序列用于诊断目的的寡核苷酸:SEQ ID NO: 7公开了寡核苷酸KanA的序列SEQ ID NO:8公开了寡核苷酸KanB的序列SEQ ID NO:9公开了寡核苷酸HXK2-FW的序列SEQ ID NO: 10公开了寡核苷酸HXK2-RV的序列SEQ ID NO: 11公开了寡核苷酸HXK1-FW的序列SEQ ID NO: 12公开了寡核苷酸HXKl-RV的序列
SEQIDNO: 13公开了寡核苷酸GLK1-FW的序列SEQIDNO: 14公开了寡核苷酸GLKl-RV的序列SEQIDNO: 15 公开了 HXKl 的 DNA 序列SEQIDNO: 16 公开了 HXK2 的 DNA 序列SEQIDNO: 17 公开了 GLKl 的 DNA 序列SEQIDNO: 18 公开了 GALl 的 DNA 序列SEQIDNO: 19 公开了 YDR516C 的 DNA 序列SEQIDNO: 20 公开了 YLR446W 的 DNA 序列SEQIDNO:21公开了 HXKl的氨基酸序列SEQIDNO:22公开了 HXK2的氨基酸序列SEQIDNO:23公开了 GLKl的氨基酸序列SEQIDNO:24公开了 GALl的氨基酸序列SEQIDNO:25公开了 YDR516C的氨基酸序列SEQIDNO:26公开了 YLR446W的氨基酸序列SEQIDNO: 27公开了寡核苷酸GALl-DisA的序列SEQIDNO: 28公开了寡核苷酸GALl-DisB的序列SEQIDNO: 29公开了寡核苷酸GAL1-FW2的序列SEQIDN0:30公开了寡核苷酸GAL1-RV2的序列SEQIDN0:31公开了寡核苷酸HXK2-FW2的序列SEQIDNO: 32公开了寡核苷酸HXK2-RV2的序列SEQIDNO: 33公开了寡核苷酸HXK2-FW3的序列SEQIDNO: 34公开了寡核苷酸HXK2-RV3的序列SEQIDNO: 35公开了寡核苷酸HXK1-FW2的序列SEQIDNO: 36公开了寡核苷酸HXK1-RV2的序列SEQIDNO: 37公开了寡核苷酸HXK1-FW3的序列SEQIDNO: 38公开了寡核苷酸HXK1-RV3的序列SEQIDNO: 39公开了寡核苷酸GLK1-FW4的序列SEQIDN0:40公开了寡核苷酸GLK1-RV4的序列SEQIDN0:41公开了寡核苷酸GLK1-FW5的序列SEQIDNO:42公开了寡核苷酸GLK1-RV5的序列SEQIDNO:43 公开了 GALl 的 DNA 序列(CEN.PK113-7D)SEQIDNO:44 公开了 GALl 的 DNA 序列(MK318)SEQIDNO:45 公开了 GALl 的 DNA 序列(IMW017)SEQIDNO:46 公开了 GALl 的 DNA 序列(IMW018)SEQIDNO:47 公开了 GAL2 的 DNA 序列(CEN.PK113-7D)SEQIDNO:48 公开了 GAL2 的 DNA 序列(MK318)SEQIDNO:49 公开了 GAL2 的 DNA 序列(IMW017)
SEQIDNO: 50 公开了 GAL2 的 DNA 序列(IMWO18)SEQIDN0:51 公开了 GALl 的氨基酸序列(CEN.PK113-7D)
SEQ ID NO:52 公开了 GALl 的氨基酸序列(MK318)SEQ ID NO:53 公开了 GALl 的氨基酸序列(IMW017)SEQ ID N0:54 公开了 GALl 的氨基酸序列(IMW018)SEQ ID NO: 55 公开了 GAL2 的氨基酸序列(CEN.PK113-7D)SEQ ID NO:56 公开了 GAL2 的氨基酸序列(MK318)SEQ ID NO:57 公开了 GAL2 的氨基酸序列(IMW017)SEQ ID NO:58 公开了 GAL2 的氨基酸序列(IMW018)发明详沭在本说明书和附带的权利要求书 中,词语“包含”和“包括”及其语法变体如“包含”("comprises", 〃comprising〃)、“包括”("includes"和"including")应被解释为包含在内。也就是说,在上下文允许时,这些词语旨在传达可能包括未明确指出的其它元素或整体。冠词“一个”(“a”和“an”)在本文中被用于表示一个或多于一个(即一个或至少一个)所述冠词的语法客体。例如,“一个元件”可表示一个元件或多于一个元件。本发明涉及在对应于SEQ ID N0:55的T219的一个或多个位置上具有突变的多肽,其中所述多肽与SEQ ID NO: 55具有至少50%的序列同一性,并且其中所述多肽具有通透酶活性。在一个实施方式中,对应于T219的位置上的突变可以是用C、P、G、A、V、L、1、M、F、W,Y、H、S、T、N、Q、D、E、K、R取代或缺失。X可以是任何氨基酸,X⑵表示两个X。在一个实施方式中,多肽具有取代T219N或T219Q。在一个实施方式中,多肽具有取代N376S或N376T。在一个实施方式中,根据本发明的多肽具有取代T219N和N376S。在本文中,GAL2是高亲和力半乳糖激酶依赖型和低亲和力半乳糖激酶非依赖型半乳糖转运过程所需的易化扩散转运蛋白(facilitated diffusion transporter)。其属于主要的易化蛋白超家族(major facilitator superfamily)糖转运蛋白(TC2.A.1.1)家族。“通透酶多肽”在本文中也称作“多肽通透酶”或“多肽”。“通透酶多肽多核苷酸”在本文中是编码通透酶多肽的多核苷酸。在本发明的一个实施方式中,通透酶多肽与SEQ ID N0:55具有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。在一个实施方式中,根据本发明的多肽包含一个或多个以下的氨基酸或氨基酸序列:a) G90 ;b)G135 ;c) G147 ;d) G184-X(3)-G188-X(II)-E200-X(2)-P203-X(3)-R207-X(7)-Q215e) Q215 ;g) fG345-X(l)-N347 ;h) Y352 ;i) Y446 ;j ) E460 ;k)F504 和 / 或
1)E521,其中多肽中a)到k)中的位置对应于SEQ ID N0:55中的位置。在一个实施方式中,多肽包含序列 GXXXGXXXXXXXXXXXXEXXPXXXRXXXXXXXQ。本文中,通过单字母氨基酸和这些氨基酸的位置来标明突变。例如,A6在本文中表示SEQ ID NO:1中某位置上的氨基酸(单字母代码),此处为蛋白质6位上为A (丙氨酸)。A6 (L/N/Q/G/V/I/Y/S/E/K)在本文中表示某些位置上的氨基酸突变,此处为蛋白质6位上的A (丙氨酸)被更换为以下任一:L (亮氨酸)、N (天冬酰胺)、Q (谷氨酰胺)、G (甘氨酸)、V (缬氨酸)、1 (异亮氨酸)、Y (酪氨酸)、S (丝氨酸)、E (谷氨酸)或K (赖氨酸)。本发明的通透酶多肽除了糖通透酶活性以外可具有一种或多种替代性的和/或额外的活性。如上文所公开的,本发明的通透酶多肽典型地应具有糖通透酶活性。然而,除了该活性以外或代替该活 性,本发明的通透酶多肽可具有一种或多种上文公开的活性。多核苷酸序列使用本文公开的通透酶多肽及其氨基酸序列,技术人员可以确定编码所述通透酶多肽的合适的多核苷酸。本发明因此提供了包含编码通透酶多肽的基因及其编码序列的多核苷酸序列。本发明的多核苷酸可以是经分离的或合成的。本文中的通透酶多肽和通透酶多肽多核苷酸可以分别是合成的多肽或合成的多核苷酸。合成的多核苷酸可以在密码子使用方面被优化,优选地根据W02006/077258和/或PCT/EP2007/055943中描述的方法进行,所述参考文献通过引用并入本文。PCT/EP2007/055943致力于密码子对优化。所述术语是指多核苷酸分子,其为核糖核酸(RNA)或脱氧核糖核酸(DNA)分子,单链或双链。多核苷酸可以经分离的形式存在,或者包含在重组的核酸分子或载体中,或包含在宿主细胞中。术语“多肽”在本文中用于含有多于七个氨基酸残基的链。本文中的所有寡肽和多肽式以从左到右且从氨基端到羧基端的方向书写。本文中使用的氨基酸的单字母代码是本领域公知的。“经分离的”多肽或蛋白质意指从其天然环境中取出的多肽或蛋白质,例如,就本发明的目的而言,在宿主细胞中表达的重组生产的多肽和蛋白质被认为是经分离的,就如同通过任何合适的技术被基本上纯化的天然或重组的多肽一样,所述合适的技术例如为Smith and Johnson, Gene67:31-40 (1988)中公开的单步骤纯化方法。可以使用标准分子生物学技术和本文提供的序列信息合成或分离本发明的多核苷酸,例如编码通透酶多肽的多核苷酸。可以使用cDNA、mRNA或基因组DNA作为模板和适当的寡核苷酸引物,根据标准PCR扩增技术,扩增编码本发明的通透酶多肽的多核苷酸。藉此扩增的核酸可以被克隆进适当的载体中,并通过DNA序列分析来表征。转化根据本发明的多核苷酸可以在合适的宿主中表达。因此可以使用标准转化技术。本发明还涉及包含如上文所述的多核苷酸的核酸构建体,例如载体。因此,本发明的另一方面涉及载体,包括克隆和表达载体,其包含编码通透酶多肽蛋白质或其功能等同物的本发明的多核苷酸,和例如在本发明的通透酶发生表达的条件下培养合适的宿主细胞、在合适的宿主细胞中转化或转染此类载体的方法。在本文中使用时,术语“载体”是指能够转运与之连接的另一核酸的核酸分子。本发明的多核苷酸可以被并入重组复制载体,例如克隆或表达载体中。载体可被用于在相容的宿主细胞中复制核酸。因此在另一个实施方式中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在导致载体复制的条件下培养所述宿主细胞。可从宿主细胞中回收载体。合适的宿主细胞如下文所述。本领域技术人员应当明白,表达载体的设计可取决于此类因素:要转化的宿主细胞的选择、想要的蛋白质表达水平等等。本发明的载体(例如表达载体)可以被引入宿主细胞中,从而生产由本文所述的核酸编码的蛋白质或肽。本发明的载体(例如重组表达载体)可以被设计为在原核细胞或真核细胞中表达通透酶多肽蛋白质。例如,通透酶多肽可以在以下中表达:细菌细胞例如E.col1、昆虫细胞(使用杆状病毒表达载体)、丝状真菌、酵母细胞或哺乳动物细胞。合适的宿主细胞在Goeddelj Gene Expression Technology:Methods in Enzymologyl85, Academic Press, SanDiego, CA(1990)中更进一步讨论。适当的宿主的代表性例子在下文描述。针对上述宿主细胞的适当的培养基和条件是本领域已知的。对大部分丝状真菌和酵母而言,载体或表达构建体优选地被整合进宿主细胞的基因组中,从而获得稳定的转化体。然而,对某些酵母而言还可获得合适的附加体载体,可以向其中并入表达构建体进行稳定和高水平的表达,其例子包括分别衍生自Saccharomyces和Kluyveromyces的2 μ和pKDl质粒的载体,或含有AMA序列(例如来自Aspergillus的AMAl)的载体。将表达构建体整合进宿主细胞基因组中的情况下,所述构建体被整合进基因组中随机基因座处,或者使用同源重组整合进预定的目标基因座处,在这种情况下目标基因座优选地包含高度表达的基因。

因此,可用于本发明的表达载体包括来自染色体、附加体和病毒的载体,例如来自细菌质粒、噬菌体、酵母附加体、酵母染色体元件、病毒(如杆状病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反转录病毒)的载体和来自其组合的载体,如来自质粒和噬菌体遗传元件的载体(如粘粒和噬菌粒)。当根据本发明的多肽要从宿主细胞中被分泌进培养基时,可以对多肽添加适当的信号序列,从而将重新合成的多肽导向宿主细胞的分泌途径。本领域技术人员知晓如何针对特定的宿主选择适当的信号序列。载体可还包括产生RNA的多核苷酸侧翼的序列,所述侧翼的序列包含与真核基因组序列或病毒基因组序列同源的序列。这会允许将本发明的多核苷酸引入宿主细胞的基因组中。整合型克隆载体可在整合了它的宿主细胞染色体中随机整合或在预定的靶基因座处整合。载体系统可以是单个载体例如单个质粒,或两个或更多个载体,例如两个或更多个质粒,它们一起含有要被引入宿主细胞基因组中的总DNA。载体可以反义方向含有本发明的多核苷酸,以提供反义RNA的生产。
可以通过常规的转化或转染技术将载体DNA引入原核或真核细胞中。本文使用的术语“转化”和“转染”旨在表示用于向宿主细胞中引入外源核酸(例如DNA)的多种本领域公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖-介导的转染、转导、感染、月旨质转染、阳离子脂质介导的转染或电穿孔。用于转化或转染宿主细胞的合适方法可见于Sambrook, et al.(Molecular Cloning:A Laboratory Manual, 2nd, ed.Cold Spring HarborLaboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989),Davis et al., Basic Methods in Molecular Biology (1986)和其它实验室手册中。如上文所述,本发明提供了具有根据SEQ ID NO:55的氨基酸序列、并具有权利要求I中所示突变的经分离的多肽。可以通过本领域已知的方法,将根据本发明的通透酶多肽从重组细胞培养物中回收和纯化。最优选地,使用高效液相色谱(“HPLC”)进行纯化。本发明的多肽包括天然纯化的产物、化学合成步骤的产物,和通过重组技术从原核或真核宿主生产的产物,所述宿主包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞。取决于重组生产步骤中使用的宿主,可以将本发明的多肽糖基化或不糖基化。另外,本发明的多肽也可以包含最初被修饰的甲硫氨酸残基(在一些情况下由宿主介导的过程产生)。本发明还包括根据本发明的多肽的生物活性片段。本发明还提供了包含本发明多核苷酸或载体的宿主细胞。所述多核苷酸对宿主细胞的基因组可以是异源的。通常涉及宿主细胞的术语“异源的”表示多核苷酸不天然存在于宿主细胞的基因组中,或者多肽不由所述细胞天然地生产。在另一实施方案中,本发明包括细胞,例如含有本发明所包括的核酸的经转化的宿主细胞或重组的宿主细胞。“经转化的细胞”或“重组细胞”是其中(或其祖先中)已经借助于重组DNA技术引入了本发明核酸的细胞。原核和真核细胞均包括在内,例如细菌、真菌、酵母等等,特别优选的是酵母细胞,包括例如Saccharomyces,例如Saccharomycescerevisiae。
可选择下述宿主细胞,其调控被插入的序列的表达,并以特异的、期望的方式加工基因产物。蛋白质产物的这类修饰(例如糖基化)和加工(例如切割)可促进蛋白质发挥最佳功能。多种宿主细胞具有用于翻译后加工和修饰蛋白质和基因广物的特性和特异机制。可选择分子生物学和/或微生物学领域技术人员熟悉的适当细胞系或宿主系统,以确保对所表达的外源蛋白质的想要的和正确的修饰与加工。为此,可以使用具有下述细胞机制的真核宿主细胞,所述细胞机制用于基因产物的原始转录本、糖基化和磷酸化的正确加工。这类宿主细胞是本领域公知的。如果需要的话,可以在根据本发明的多肽的制备中使用上述细胞。这样的方法典型地包含在提供编码多肽的编码序列(通过载体)表达的条件下培养(例如用上述表达载体转化或转染的)宿主细胞,并任选地回收被表达的多肽。可以将本发明的多核苷酸并入重组可复制载体例如表达载体中。可以使用载体在相容的宿主细胞中复制核酸。因此在又一个实施方案中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在使得所述载体复制的条件下培养所述宿主细胞。可以从所述宿主细胞中回收载体。
可如上文所述将载体转化或转染进合适的宿主细胞中,以提供本发明多肽的表达。该方法可包括在提供编码多肽的编码序列的载体表达的条件下培养宿主细胞,所述宿主细胞用如上所述的表达载体转化。在本文中使用标准的分离、杂交、转化和克隆技术(例如如Sambrook,J.,FritshjE.F.,and ManiatisjT.Molecular Cloning: A LaboratoryManual.2nd,ed.,Cold Spring Harbor Laboratory, Cold Spring Harbor LaboratoryPress, Cold Spring Harbor, NYj 1989 中所述)

同源性和同一性当氨基酸序列或核苷酸序列展示某些相似性水平时,其被称为是同源的。两个序列同源表示共同的进化来源。两个同源序列是密切相关还是更远相关,这由“百分比同一性”或“百分比相似性”(分别为高或低)来表示。虽然是有争论的,但为了表示“百分比同一性”或“百分比相似性”,“同源性水平”或“百分比同源性”通常互换使用。可以使用数学算法完成两个序列之间的序列比较和同一性百分比测定。技术人员应当明白下述事实:可获得若干种不同的计算机程序来比对两条序列并测定两条序列之间的同源性(Kruskal, J.B.(1983)An overview of sequence comparison In D.Sankoffand J.B.Kruskal, (ed.), Time warps, string edits and macromolecules: the theory andpractice of sequence comparison, pp.l_44Addi son Wesley)。可使用用于比对两条序列的Needleman和Wunsch算法测定两条氨基酸序列之间的百分比同一性(Needleman, S.B.and ffunsch, C.D.(1970) J.Mol.Biol.48,443-453)。所述算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在计算机程序NEEDLE中实施。就本发明目的而言,使用了来自 EMBOSS 包的 NEEDLE 程序(版本 2.8.0 或更高,EMBOSS: The European MolecularBiology Open Software Suite(2000)Rice, P.Longden, 1.and Bleasby, A.Trends inGeneticsl6, (6)pp276—277, http: //emboss, bioinformatics, nl/)。对蛋白质序列而言,使用EBL0SUM62用于替换矩阵。就核苷酸序列而言,使用EDNAFULL。可指定其他矩阵。用于比对氨基酸序列的任选的参数是缺口开放惩罚为10和缺口延伸惩罚为0.5。技术人员会意识到所有这些不同的参数会产生些微不同的结果,但是当使用不同的算法时两条序列的总百分比同一性不显著改变。总体同源性定义同源性或同一性是在包括任何缺口或延伸的总比对区域上的两条全序列之间的相同匹配的百分比。两条比对序列之间的同源性或同一性如下计算:在两条序列中都显示相同氨基酸的比对中的对应位置的数目除以包括缺口在内的比对的总长度。本文中定义的同一性可从NEEDLE中获得并在程序输出中被标记为“同一性”(“IDENTITY”)。最长同一性定义两条比对序列之间的同源性或同一性如下计算:在两条序列中都显示相同氨基酸的比对中的对应位置的数目除以减去比对中的总缺口数目后的比对的总长度。本文定义的同一性可通过使用N0BRIEF选项从NEEDLE中获得,并在程序输出中被标记为“最长同一性”(“longest-1dentity”)。本文所述的本发明的多个实施方式可以交叉组合。糖组合物
根据本发明的糖组合物包括葡萄糖、阿拉伯糖和木糖。满足这些标准的任何糖组合物可在本发明中使用。糖组合物中的任选的糖是半乳糖和甘露糖。在一个优选的实施方式中,糖组合物是一种或多种木质纤维素材料的水解产物。木质纤维素在本文中包括半纤维素和生物质的半纤维素部分。木质纤维素还包括生物质的木质纤维素级分。合适的木质纤维素材料可见以下列表:底料,树丛,磨坊废弃物,城市木材废弃物,市政废弃物,伐木废弃物,森林疏伐废弃物,短期轮种木本作物,工业废弃物,小麦秸,燕麦秸,水稻秸,大麦秸,黑麦秸,亚麻秸,大豆壳,稻壳,水稻秸,玉米谷蛋白饲料,燕麦壳,甘蔗,玉米秸杆,玉米杆,玉米芯,玉米壳,柳枝稷,芒草,高粱,芸苔茎,大豆茎,牧场草,磨擦禾,狐尾草;甜菜浆,柑橘果实浆,种子壳,纤维素动物粪便,草坪修剪废弃物,棉花,海藻,树木,软木材,硬木材,白杨,松树,灌木丛,草,小麦,小麦秸,甘蔗渣,玉米,玉米壳,玉米棒,玉米粒,来自玉米粒的纤维,来自谷物湿磨或干磨的产物和副产物,市政固体废弃物,废纸,庭院废弃物,草本材料,农业残余物,林业残余物,市政固体废弃物,废纸,纸浆,造纸厂残余物,树枝,灌木,甘蔗,玉米,玉米壳,能源作物,森林,水果,鲜花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,灌木丛,柳枝稷,树木,蔬菜,水果皮,藤蔓,甜菜浆,小麦麸皮,燕麦壳,硬木材或软木材,由农业加工产生的有机废弃物材料,林业木材废弃物,或其中任意两种或更多的组合。表I中给出了源自木质纤维素的一些合适的糖组合物和它们的水解产物的糖组合物的概述。列出的木质纤维素包括:玉米芯、玉米纤维、稻壳、瓜壳、甜菜浆、小麦秸、甘蔗洛、木料、草和橄榄压榨物(olive pressings)。表1:来自木质纤维素材料的糖组合物的概述。Gal=半乳糖、Xyl=木糖、Ara=阿拉伯糖、Man=甘露糖、Glu=葡萄糖、Rham=鼠李糖。给出了半乳糖百分比(%Gal)和文献来源。
权利要求
1.在对应于SEQID NO:55的T219的一个或多个位置上具有突变的多肽,其中所述多肽与SEQ ID NO:55具有至少50%的序列同一性,并且其中所述多肽具有通透酶活性。
2.根据权利要求1所述的多肽,其中所述多肽具有取代T219N或T219Q。
3.根据权利要求1或2所述的多肽,其中所述多肽具有取代T219N。
4.根据权利要求1到4中任一项所述的多肽,其中所述多肽具有GAL2活性。
5.根据权利要求1到5中任一项所述的多肽,其包含一个或多个以下的氨基酸或氨基酸序列: I) G90 ; m)G135 ; n)G147 ;ο) G184-X(3)-G188-X(II)-E200-X(2)-P203-X(3)-R207-X (7)-Q215p)Q215 ;q)G345-X(l)-N347 ;r) Y352 ;s) Y446 ;t)E460 ;u)F504 和 / 或;v)E521, 其中所述多肽中a) 到k)中的位置对应于SEQ ID NO:55中的位置。
6.根据权利要求1-6中任一项所述的多肽,其包含序列GXXXGXXXXXXXXXXXXEXXPXXXRXXXXXXXQ。
7.与SEQID NO: 50具有至少50%同一性的多核苷酸,其编码根据权利要求1到6中任一项所述的多肽。
8.包含权利要求7所述多核苷酸的核酸构建体。
9.用权利要求8所述的核酸构建体转化的宿主细胞。
10.根据权利要求9所述的经转化的宿主细胞,其为酵母。
11.根据权利要求10所述的经转化的宿主细胞,其属于Saccharomyces属。
12.根据权利要求11所述的经转化的宿主细胞,其属于Saccharomycescerevisiae种。
13.用于降解木质纤维素或半纤维素材料的方法,其中所述木质纤维素或半纤维素材料与酶组合物接触,其中生产一种或多种糖,并且其中所生产的糖被发酵得到发酵产物,其中所述发酵用根据权利要求9到12中任一项所述的经转化的宿主细胞进行。
14.根据权利要求13所述的方法,其中所述发酵产物是下述一种或多种:乙醇、丁醇、乳酸、塑料、有机酸、溶剂、动物饲料补充物、药物、维生素、氨基酸、酶或化学原料。
全文摘要
本发明涉及在对应于SEQ ID NO:55的T219的一个或多个位置上具有突变的多肽,其中所述多肽与SEQ ID NO:55具有至少50%的序列同一性,并且其中所述多肽具有通透酶活性。
文档编号C12N1/18GK103189505SQ201180049832
公开日2013年7月3日 申请日期2011年10月11日 优先权日2010年10月13日
发明者汉迪瑞克·乌特尔·威塞林克, 安东尼斯·杰若恩·阿迪瑞安·马里斯·范, 雅各布斯·托马斯·普若克, 保罗·克莱斯森, 芮妮·马赛尔·德·钟 申请人:帝斯曼知识产权资产管理有限公司

最新回复(0)