具有增加的n糖基化占位的糖蛋白的生产的制作方法

xiaoxiao2021-2-21  122

具有增加的n糖基化占位的糖蛋白的生产的制作方法
【专利说明】具有増加的N糖基化占位的糖蛋白的生产 发明领域
[0001] 本公开涉及用于在丝状真菌细胞中生产异源蛋白质例如重组抗体的组合物和方 法。
【背景技术】
[0002] 真核生物蛋白质,特别是治疗性蛋白质例如免疫球蛋白的翻译后修饰通常是正确 的蛋白质折叠和功能所必需的。因为标准的原核表达系统缺乏这种修饰所需的适当结构, 生产这些治疗性蛋白质不得不使用替代的表达系统。即使在真核蛋白质不具有翻译后修饰 的情况下,原核生物的表达系统经常缺乏正确折叠所需的必要伴侣蛋白。酵母和真菌是用 于表达蛋白质的有吸引力的选择,因为它们容易在简单介质中大规模生长,这允许低生产 成本,并且酵母和真菌具有翻译后修饰结构和如在哺乳动物细胞中发现的执行类似功能的 伴侣蛋白。此外,可用工具来操作酵母和真菌细胞的相对简单的遗传组成以及更加复杂的 真核细胞例如哺乳动物或昆虫细胞(De Pourcq et al.,Appl Microbiol Biotechnol,87 (5):1617-31)〇
[0003] 然而,酵母和真菌中发生的翻译后修饰仍对于生产重组治疗性蛋白质可能仍然是 问题。尤其是,不充分的N-糖基化是在真菌中生产人应用生物药物中要克服的最大障碍之 〇
[0004] N-糖基化是指将糖分子连接到天冬酰胺侧链的氮原子上,其已经显示调节治疗性 蛋白质的药代动力学和药效学。
[0005] 当重组蛋白质在丝状真菌细胞例如木霉属(Trichoderma)真菌细胞中表达时,实 际上糖基化的N-糖基化位点比例通常低于在哺乳动物系统例如CH0细胞中表达的相同蛋白 质。
[0006] 名称为"用于增加在巴氏毕赤酵母中生产的治疗性糖蛋白上的N-糖基化占位的方 法"的W02011/106389描述了过表达异源单亚基寡转移酶和能够生产具有改进的N-糖基化 的糖蛋白的巴氏毕赤酵母(Pichia pastoris)。
[0007] 同样地,Choi等描述了通过异源单亚基寡转移酶的异源表达改进重组蛋白质的N-糖基化(Choi等,Appl Microbiol Biotechnol,95(3) :671-82) 〇
[0008] 同一作者还在W02013062939中描述了用于在缺乏α-1,3甘露糖基转移酶活性 (A1 g3p破坏)的巴氏毕赤酵母中增加 Ν-聚糖占据和降低杂合Ν-聚糖的方法。
[0009] 目前缺乏表达人样岩藻糖基化的N-聚糖的真菌细胞表达系统的报告。事实上,由 于工业上长时间聚焦于哺乳动物细胞培养技术,没有像哺乳动物细胞培养一样良好建立起 用于生产治疗性蛋白质的真菌细胞表达系统例如木霉属,因此当表达哺乳动物蛋白质时存 在不足。尤其是,本领域仍然需要改进丝状真菌细胞,例如木霉属真菌细胞,其可以优选以 高表达水平稳定生产具有增加的N-糖基化占位的异源蛋白质。
[0010] 发明简述
[0011] 本发明涉及在丝状真菌表达系统中生产具有增加的N-糖基化占位的糖蛋白的改 进方法,更具体地,糖蛋白,例如抗体或相关免疫球蛋白或融合蛋白。
[0012] 本发明部分基于以下意外发现:可以遗传修饰丝状真菌细胞,例如木霉属细胞以 表达寡糖基转移酶活性,而不会对所生产的糖蛋白的产量有不利影响。
[0013] 因此,第一方面,本发明涉及丝状真菌细胞,其包含:
[0014] i. -种或多种突变,其较之不具有所述突变的亲本丝状真菌细胞降低或消除一种 或多种内源蛋白酶活性,
[0015] ii .编码寡糖基转移酶的异源催化亚基的多核苷酸,和
[0016] iii .编码异源糖蛋白的多核苷酸,
[0017]其中所述寡糖基转移酶的催化亚基选自利什曼原虫(Leishmania)寡糖基转移酶 催化亚基。
[0018] 在一个实施方式中,与不具有蛋白酶缺陷突变的亲本丝状真菌细胞相比,所述丝 状真菌细胞的总蛋白酶活性降低至少两倍,优选降低至少三倍,更优选降低至少四倍,至少 降低五倍。
[0019] 在本发明的一个实施方式中,所述丝状真菌细胞是木霉属、链孢霉属 (Neurospora)、毁丝霉属(Myceliophtora)、金抱霉属(Chrysosporium)、曲霉属 (Aspergillus)或镰刀霉属(Fusarium)细胞。
[0020] 在本发明的一个实施方式中,编码寡糖转移酶的异源催化亚基的多核苷酸包含选 自以下的核酸序列:SEQIDN0 :2、SEQIDN0:9、SEQIDN0:88和SEQIDN0:90,或编码与 SEQ ID N0:1、SEQ ID N0:8、SEQ ID N0:89或SEQ ID N0:91 具有至少50%、至少60%、至少 70 %同一性、至少80 %同一性、至少90 %同一性、或至少95 %同一性的功能性变体多肽的多 核苷酸,所述功能性变体多肽具有寡糖基转移酶活性。
[0021] 在另一个实施方式中,所述编码寡糖基转移酶的异源催化亚基的多核苷酸在所述 细胞中用于所述寡糖基转移酶的组成型表达的启动子的控制之下。
[0022] 在本发明的一个实施方式中,在丝状真菌细胞中表达的异源糖蛋白的N-糖基化占 位为至少80%、至少90%、至少95%、至少99%或100%。
[0023] 在具体的实施方式中,异源糖蛋白的N-糖基化占位为至少95%,且Man3、Man5、G0、 G1和/或G2糖型(glycoforms)代表异源糖蛋白的总中性N-聚糖的至少50%。
[0024]在本发明的一个实施方式中,丝状真菌细胞是木霉属细胞,例如里氏木霉 (Trichoderma reesei),且所述细胞包含降低或消除以下酶活性的突变:
[0025]-三个内源蛋白酶pepl、tspl和slpl;
[0026]-三个内源蛋白酶gapl、slpl和pepl;
[0027] -三个内源蛋白酶,选自 pepl、pep2、pep3、pep4、pep5、pep8、pep9、pepll、pepl2、 tspl、slpl、slp2、slp3、slp7、gapl^Pgap2;
[0028] -三到六个蛋白酶,选自 pepl、pep2、pep3、pep4、pep5、tspl、slpl、slp2、slp3、gapl 和gap2;
[0029] t到十个蛋白酶,选自 pepl、pep2、pep3、pep4、pep5、pep7、pep8、pep9、tspl、 slpl、slp2、slp3、slp5、slp6、slp7、slp8、tppl、gapl和gap2〇
[0030] 在一个实施方式中,真菌细胞进一步在编码ALG3的基因中包含突变,所述突变与 不具有这种突变的亲本细胞中的ALG3基因的表达水平相比降低或消除相应的ALG3表达。
[0031] 在一个实施方式中,真菌细胞进一步包含编码N-乙酰葡糖胺基转移酶I催化域和 N-乙酰葡糖胺基转移酶II催化域的多核苷酸。
[0032] 在一个实施方式中,真菌细胞进一步包含一种或多种编码选自以下的多肽的多核 苷酸:
[0033] i.a-l,2甘露糖苷酶;
[0034] ii .N-乙酰葡糖胺基转移酶I催化域;
[0035] iii.a-甘露糖苷酶II;
[0036] iv · N-乙酰葡糖胺基转移酶II催化域;
[0037] ν.β?,4半乳糖基转移酶;和
[0038] vi.岩藻糖基转移酶。
[0039]在本发明的一个实施方式中,异源糖蛋白是哺乳动物糖蛋白。
[0040] 在具体的实施方式中,所述哺乳动物糖蛋白选自抗体、免疫球蛋白或包含免疫球 蛋白Fc片段的蛋白融合。
[0041] 在另一个具体的实施方式中,所述哺乳动物糖蛋白是治疗性抗体。
[0042] 另一方面,本发明还涉及增加丝状真菌宿主细胞中生产的异源糖蛋白的N-糖基化 占位的方法,包括:
[0043] a)提供丝状真菌宿主细胞,例如木霉属细胞,其具有编码寡糖基转移酶催化亚基 的利什曼原虫STT3D基因或其功能性变体,和编码异源糖蛋白的多核苷酸,
[0044] b)在适合表达STT3D基因或其功能性变体、或所述功能性变体,和生产异源糖蛋白 的条件下培养宿主细胞;
[0045] 其中与不表达所述寡糖基转移酶催化亚基的相应亲本丝状真菌细胞表达的异源 糖蛋白相比,所表达的异源糖蛋白表现出增加的N-糖基化占位。
[0046] 本发明还涉及生产具有增加的N-糖基化占位的异源糖蛋白组合物的方法,包括: [0047] a)提供丝状真菌宿主细胞,例如木霉属细胞,其具有编码寡糖基转移酶催化亚基 的利什曼原虫STT3D基因的或其功能性变体,和编码异源糖蛋白的多核苷酸,
[0048] b)在适合表达STT3D基因或其功能性变体,和生产异源糖蛋白组合物的条件下培 养宿主细胞;
[0049 ] c)回收和任选地纯化异源糖蛋白组合物。
[0050] 在本发明方法的某些实施方式中,所述编码寡糖基转移酶催化亚基的利什曼原虫 STT3D基因包含选自下组的核酸序列:SEQIDN0:2、SEQIDN0:9、SEQIDN0 :88和SEQID N0:90,或编码与SEQ ID N0:1、SEQ ID N0:8、SEQ ID N0:89或SEQ ID N0:91 具有至少50%、 至少60%、至少70%同一性、至少80 %同一性、至少90 %同一性、或至少95 %同一性的功能 性变体多肽的多核苷酸,所述功能性变体多肽具有寡糖基转移酶活性。
[0051] 在一个实施方式中,编码所述异源糖蛋白的所述多核苷酸进一步包含编码CBH1催 化域的多核苷酸和作为载体蛋白和/或cbhl启动子的接头。
[0052] 在本发明一个实施方式中,所述培养处于包含蛋白酶抑制剂的介质中。
[0053]在具体的实施方式中,所述培养处于包含一种或两种选自SBTI和抑凝乳蛋白酶素 的蛋白酶抑制剂的介质中。
[0054]在本发明方法的一个实施方式中,所生产的糖蛋白组合物的N-糖基化占位为至少 80%、至少90%、至少95%、至少99%或100%。
[0055] -方面,本发明还涉及可通过上述方法获得的糖蛋白组合物。
[0056] -方面,本发明涉及可通过上述方法获得的抗体组合物。
[0057]在一个实施方式中,本发明涉及上述的抗体组合物,其中N-糖基化占位为至少 80%、至少90%、至少95%、至少99%或100%。
[0058]在一个实施方式中,本发明涉及上述抗体组合物,其中所述抗体组合物进一步包 含以下作为主要糖型:
[0059] i .Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(Man5糖型);
[0060] i i·G1cNAcb2Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(G1cNAcMan5糖 型);
[0061 ] iii .Mana6(Mana3)Manb4GlcNAb4GlcNAc(Man3糖型);
[0062] iv · Mana6 (G1 cNAcb2Mana3 )Manb4G 1 cNAb4G 1 cNAc (G1 cNAcMan3糖型);或
[0063] v.复合型N-聚糖,选自G0、G1或G2糖型。
【附图说明】
[0064] 图1 ·为革巴向木聚糖酶1基因座的硕大利什曼原虫(Leishmania major)STT3而设计 的表达盒不意图。
[0065] 图2.亲本菌株M317(M304的pyr4_)和硕大利什曼原虫STT3克隆26B-a(M421)的示 范谱。K是指赖氨酸。
[0066]图3.STT3表达盒的示意图。
[0067]图4. Aalg3菌株生产的聚糖结构。
[0068] 图5.来自蛋白酶缺失上清液和亲本菌株的培养上清液的标准化蛋白酶活性数据。 在pH 5.5下在最先5个菌株和在pH 4.5下在最后三个缺失菌株中测量蛋白酶活性。蛋白酶 活性对抗荧光性酪蛋白。六个蛋白酶缺失菌株仅具有野生型亲本菌株的6 %和7个蛋白酶缺 失菌株蛋白酶活性比6个蛋白酶缺失菌株活性少约40%。
[0069] 发明详述
[0070] 定义
[0071]如本文所使用,"表达系统"或"宿主细胞"是指遗传修饰以使得目标多肽或蛋白质 (通常是哺乳动物蛋白质)转录、翻译和正确折叠的细胞。
[0072]本文所使用的术语"多核苷酸"或"寡核苷酸"或"核酸"通常是指通过磷酸二酯键 连接在一起的至少两个核苷酸的聚合物,其可以由可引入宿主细胞以遗传修饰这种宿主细 胞的核糖核苷酸或脱氧核苷酸或其衍生物组成。例如,多核苷酸可以编码蛋白质的编码序 列,和/或包含蛋白质编码序列的控制或调节序列,例如增强子或启动子序列或终止子。多 核苷酸可以例如包含基因或其片段的天然编码序列,或已经优化用于特定宿主细胞的最优 基因表达(例如考虑密码子偏倚)的变体序列。
[0073]如本文所使用,关于多核苷酸的"优化"是指已经改变多核苷酸以利用密码子编码 氨基酸序列,所述密码子在生产细胞或生物例如丝状真菌细胞如木霉属细胞中是优选的。 通常优化宿主细胞中转染的异源核苷酸序列以完全或尽可能地保留由初始(非优化的)核 苷酸序列初始编码的氨基酸序列。已经工程改造本文的优化序列以具有相应的生产细胞或 生物例如丝状真菌细胞中优选的密码子。通过优化的核苷酸序列编码的氨基酸序列也可以 成为优化。
[0074] 如本文所使用,"肽"或"多肽"是包括多个连续的聚合的氨基酸残基的氨基酸序 列。肽或多肽可以包括修饰的氨基酸残基、不经密码子编码的天然存在的氨基酸残基和非 天然存在的氨基酸残基。如本文所使用,"蛋白质"可以指肽或多肽或通过共价或非共价键 装配在一起的多于一个肽或多肽的组合。除非另有指出,术语"蛋白质"可以涵盖具有其翻 译后修饰(尤其是〇-甘露糖基化或N-聚糖修饰)的一个或多个氨基酸序列。
[0075] 如本文所使用,术语"糖蛋白"是指包含与蛋白质的至少一个天冬酰胺残基连接的 至少一个N-连接的聚糖,或与形成0-甘露糖基化的至少一个丝氨酸或苏氨酸连接的至少一 个甘露糖的蛋白质。由于宿主细胞表达系统中生产的糖蛋白通常作为不同的糖基化模式的 混合物而生成,术语"糖蛋白"或"糖蛋白组合物"涵盖通过宿主细胞生产、具有不同糖基化 模式的混合物,除非另有明确定义。
[0076] 本文使用的术语"N-糖基化"或"寡糖基转移酶活性"是指多肽的天冬酰胺残基 (Asn)的侧链酰胺氮与至少一个寡糖链的共价连接。
[0077] 如本文所使用,"聚糖"是指可以连接至载体例如氨基酸、肽、多肽、脂质或还原端 偶联物(reducing end conjugate)的寡糖链。在一些实施方式中,本发明涉及通过天冬酰 胺残基(Asn)的侧链酰胺氮的N-连接结合至多肽N-糖基化位点例如-Asn-Xaa-Ser/Thr-的 N-连接的聚糖("N-聚糖"),其中Xaa是除Pro外的任何氨基酸残基。本发明可以进一步涉及 作为长醇-磷酸基-寡糖(Dol-P-P-〇S)前体脂质结构(真核细胞内质网中N-连接聚糖的前 体)的一部分的聚糖。前体寡糖从其还原端连接至长醇脂质的两个磷酸酯残基。例如,α3_甘 露糖转移酶Alg3修饰Ν-聚糖的Dol-P-P-寡糖前体。通常,本文描述的聚糖结构是末端聚糖 结构,其中非还原残基不通过一个或多个其他的单糖残基修饰。
[0078]如本公开全文所使用,糖脂和碳水化合物命名基本上是根据UPAC-IUB Commission on Biochemical Nomenclature(例如碳水化合物Res· 1998,312,167;碳水化 合物Res .1997,297, l;Eur.J.Biochem. 1998,257,29)的建议。假定Gal(半乳糖)、Glc(葡萄 糖)、GlcNAc(N-乙酰氨基葡萄糖)、GalNAc(N-乙酰氨基半乳糖)、Man(甘露糖)和Neu5Ac为D-构型,Fuc为L-构型,且所有单糖单元为吡喃型(0-6 &1?、0-61〇?、0-61〇?嫩〇、0-6&1?嫩(:、0-1&1即、1^11叩、0-如卯54(3)。胺基定义为6 &1嫩(3或61(^(3的2位上的天然半乳糖和葡糖胺。糖 苷键部分以较短命名法显示,部分以较长命名法显示,唾液酸SA/Neu5X-残基α3和α6的键的 意思分别与α2_3和α2_6相同,且对于己糖单糖残基,〇1-3、€11-6、01-2、01-3、01-4和01-6分 别可简称为〇3、〇6、拟、03、04和郎。乙酰乳糖胺是指11型^乙酰基乙酰乳糖胺、6 &10461〇嫩〇 和/或I型Ν-乙酰基乙酰乳糖胺。Galf33GlcNAc和唾液酸(SA)是指Ν-乙酰神经氨酸(Neu5Ac)、 N-轻乙酰神经氨酸(Neu5Gc)、或包括Neu5X衍生物的任何其他天然唾液酸。唾液酸称为 NeuNX 或 Neu5X,其中优选 X 是 Ac 或 Gc。有时 Neu5Ac/Gc/X 可称为 NeuNAc/NeuNGc/NeuNX。
[0079]通常构成哺乳动物糖蛋白中发现的N-聚糖的糖包括,但不限于,N-乙酰氨基葡萄 糖(下文缩写为"GlcNAc")、甘露糖(下文缩写为"Man")、葡萄糖(下文缩写为"Glc")、半乳糖 (下文缩写为"Gal")和唾液酸(下文缩写为"NeuSAc")。^聚糖共有共同的称为"核心"结构 Man3GlcNAc2 (Mana6 (Mana3 )ManP4GlcNA04GlcNAc,称为 Man3)的五糖。
[0080] 在一些实施方式中,Man3聚糖或其衍生物Mana6(GlcNAc02Mana3)ManMGlcNA0 4GlcNAc是主要糖型。当岩藻糖与核心结构连接,优选α6与还原端GlcNAc连接时,N-聚糖或 N-聚糖的核心可表示为MarwGlcNAc2(Fuc)。在一个实施方式中,主要的N-聚糖是Mana3 [Mana 6 (Mana3)Mana6 ]ManMG 1 cNAMG 1 cNAc (Man5)。
[0081 ]优选的杂合型 N-聚糖包含 GlcNAc02Mana3[Mana6(Mana3)Mana6]ManMGlcNA0 4GlcNAc(〃GlcNAcMan5〃)、或其b4-半乳糖基化衍生物GalMGlcNAcMan3、Gl、G2或 GalGlcNAcMan5糖型。
[0082] "复合N-聚糖"是指在核心结构的末端1,3甘露糖臂上具有至少一个GlcNAc残基, 任选GlcNAcf32-残基和在核心结构的末端1,6甘露糖臂上具有至少一个GlcNAc残基,任选 GlcNAcK-残基的N-聚糖。
[0083] 这种复合N-聚糖包括,但不限于,GlcNAc2Man3GlcNAc2(也称为G0糖型)、 GaliGlcNAc2Man3GlcNAc2(也称为 G1 糖型)和 Gal2GlcNAc2Man3GlcNAc2(也称为 G2 糖型),及其 核心岩藻糖化糖型FG0、FG1和FG2,分别为GlcNAc2Man3GlcNAc 2(Fuc)、 GaliGlcNAc2Man3GlcNAc2(Fuc)^PIGal2GlcNAc2Man3GlcNAc2(Fuc)〇
[0084] 如本文所使用,表达"中性N-聚糖"具有其在本领域的一般含义。它是指非唾液酸 化的N-聚糖。相反,唾液酸化的N-聚糖是酸性的。
[0085] "增加"或"降低的内源酶的活性":丝状真菌细胞可以具有增加或降低的各种内源 酶的活性水平。降低的活性水平可通过用抑制剂、抗体等抑制内源酶的活性来提供。在某些 实施方式中,以增加或降低各种内源酶活性的方式来遗传修饰丝状真菌细胞。"遗传修饰" 是指用于产生以升高水平、以降低水平或以突变形式表达多肽的原核或真核宿主细胞的任 何重组DNA或RNA方法。换言之,宿主细胞已经被重组多核苷酸分子转染、转化或转导,因此 被改变以引起细胞改变期望蛋白质的表达。
[0086] 导致基因表达、基因功能或基因产物(即由基因编码的蛋白质)的功能降低或缺陷 的"遗传修饰"可以称为基因表达的失活(完全或部分)、敲除、缺失、破坏、中断、阻断、沉默 或下调或减弱。例如,导致由这种基因编码的蛋白质的功能降低的基因的遗传修饰可以是 基因完全缺失(即,基因不存在,因此蛋白质不存在)、导致蛋白质的不完全(破坏)或无翻译 (例如,蛋白质不表达)的基因突变、或降低或消除蛋白质的天然功能(例如,表达的蛋白质 具有降低的或无酶活性或作用)的基因突变的结果。更具体地,关于本文讨论的降低的蛋白 质作用通常是指所讨论的宿主细胞中导致蛋白质表达和/或功能性(生物活性)降低的任何 遗传修饰,其包括蛋白质的活性降低(例如,催化作用降低)、蛋白质的抑制或降解增加以及 蛋白表达降低或消除。例如,蛋白质的作用或活性可以通过阻断或降低蛋白质的生产、降低 蛋白质的作用或抑制蛋白质的作用来降低。这些修饰的一些组合也是可能的。阻断或降低 蛋白质的生产可以包括将编码蛋白质的基因置于需要生长培养基中存在诱导化合物的启 动子的控制之下。通过建立条件使介质中缺少诱导剂,可以终止(be turned off)编码蛋白 质的基因的表达(以及蛋白质合成)。阻断或降低蛋白质作用也可以包括使用与美国专利 No.4,743,546所描述的那些类似的切除技术方法。为使用该方法,将编码目标蛋白质的基 因克隆至允许从基因组特异性控制切除该基因的特定基因序列之间。切除可以通过例如美 国专利No. 4,743,546的培养物培养温度的变化或通过其它的物理或营养信号来促进。
[0087] 通常,根据本发明,突变体或改性蛋白质的给定特征(例如酶活性)的增加或降低 参考源自相同生物(来自相同来源或亲本序列)的亲本(即正常、非修饰的)蛋白质的相同特 征,所述增加或降低在相同或等效条件下测量或建立。类似地,遗传修饰的宿主细胞的特征 (例如,蛋白质或生产产物的表达和/或生物活性)的增加或降低参考相同种类(优选相同菌 株)的野生型宿主细胞的相同特征在相同或等效的条件下进行。这种条件包括测量蛋白质 活性(例如表达或生物活性)或宿主细胞其他特征的分析或培养条件(例如,介质组分、温 度、pH等)、以及所使用的分析种类、所评价的宿主细胞等。如上所讨论,等效条件是类似但 不必然相同的条件(例如培养条件)(例如,可以接受条件中一些保守的变化),且与在相同 条件下进行的比较相比,所述条件基本上不改变对细胞生长或酶表达或生物活性的影响。
[0088] 优选地,与亲本宿主细胞(其不具有这种遗传修饰)的蛋白质的活性相比,具有增 加或降低(减少)给定蛋白质(例如蛋白酶)的活性的遗传修饰的宿主细胞其蛋白质的活性 或作用(例如,表达、生产和/或生物活性)分别增加或降低至少约5%、更优选至少约10%、 15%、20%、25%、30%、35%、40%、45%、 50%、55、60%、65%、70%、75、80%、85、90%、 95%、或5%至IjlOO%之间以整数表示的任何百分比(例如,6%、7%、8%等)。
[0089] 在本发明的另一方面,与亲本宿主细胞中野生型蛋白质的活性相比,具有增加或 降低(减少)给定蛋白质(例如蛋白酶)的活性的遗传修饰的宿主细胞其蛋白质的活性或作 用(例如,表达、生产和/或生物活性)分别增加或降低至少约2倍、更优选至少约5倍、10倍、 20倍、30倍、25倍、40倍、50倍、75倍、100倍、125倍、150倍、或从至少约2倍起的任何整数增量 (例如,3倍、4倍、5倍、6倍等)。
[0090] 如本文所使用,在两个或更多个核酸或氨基酸序列的情况下,术语"相同"或"同一 性百分比"是指相同的两个或更多个序列或子序列。当在比较窗或指定区域内进行最大对 应的比较和比对时,如利用以下序列比较算法或通过人工比对和目视检查,如果两个序列 具有特定百分比的相同氨基酸残基或核苷酸(即在指定区域内29%同一性、任选30%、 40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或 100% 同一 性,或当未指定时在全部序列内),则这两个序列是"基本上相同的"。任选地,同一性存在于 长度为至少约50个核苷酸(或10个氨基酸)的区域内,或更优选在长度为100到500或1000或 更多个核苷酸(或20、50、200或更多个氨基酸)的区域内。
[0091] 对于序列比较,通常一个序列用作参照序列,测试序列与其相比较。当利用序列比 较算法时,将测试和参照序列输入电脑,如有必要指定子序列坐标,并指定序列算法程序参 数。可以使用默认的程序参数,或可以指定其他参数。然后序列比较算法根据程序参数计算 测试序列相对于参照顺序的百分比序列同一性。当比较两个序列的同一性时,序列不需要 是连续的,但是任何空位将遭受罚分,降低总百分比同一性。对于blastn,默认参数是空位 开放罚分=5和空位延伸罚分=2。对于blastp,默认参数是空位开放罚分=11和空位延伸 罚分=1。
[0092] 本文使用的"比较窗"包括参考任一数目连续位置的片断,所述连续位置包括,但 不限于,20到600,通常为约50到约200,更通常约100到约150,其中在两个序列最佳比对后 将序列与具有相同数目连续位置的参照序列相比。用于对比的序列比对方法是本领域众所 周知的。用于对比的序列的最佳比对可以通过以下来进行:Smi th和Wat erman (1981)的局部 同源性算法、Needleman和Wunsch( 1970) JMol Biol 48(3):443-453的同源性比对算法、 Pearson和Lipman(1988)Proc Natl Acad Sci USA 85(8) :2444-2448的相似性检索方法、 这些算法的计算机化执行(威斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA, Genetics Computer Group,575Science Dr.,Madison,Wl)、或人工比对和目视检查[例如 参见Brent et al.,(2003)Current Protocols in Molecular Biology,John Wiley& Sons,Inc.(Ringbou Ed)]〇
[0093] 适于测定百分比序列同一性和序列相似性的算法的两种实例是BLAST和BLAST 2.0算法,其分别描述于Altschul et al.(1997)Nucleic Acids Res 25(17) :3389-3402和 Altschul et al .(1990) J.Mol Biol215(3)-403-30 410。进行BLAST分析的软件是公众可 从国家生物技术信息中心获得的。BLASTN程序(用于核苷酸序列)默认使用的字长(W)为11、 可能性(E)为10、1=54=-4,并比较两条链。对于氨基酸序列,81^31?程序默认使用的字长 为3、可能性(E)为HKBL0SUM62评分矩阵[参见Henikoff和Henikoff,(1992)Proc Natl Acad Sci USA89(22): 10915-10919]比对(B)为50、可能性(E)为 10、]\1 = 54=-4,并比较两 条链。
[0094] BLAST算法也进行两个序列之间相似性的统计分析(例如参见Karl in and Altschul,(1993)Proc Natl Acad Sci USA 90( 12) :5873-5877)31^511 算法提供的一种相 似性测量是最小和概率(P(N)),其提供两个核苷酸或氨基酸序列之间偶然发生匹配的可能 性的指示。例如,如果测试核酸与参照核酸的比较中最小和概率小于约0.2,更优选小于约 0.01。最优选小于约0.001,则认为该核酸类似于参照序列。
[0095] 本文所使用的"功能性变体"或"功能性同源基因"是指与参照编码序列或蛋白质 具有序列相似性,通常与参照编码序列或蛋白质具有至少30%、40%、50%、60%、70%、 80%、90%或95%同一性,并基本上保留与所述参照编码序列或蛋白质相同功能的编码序 列或蛋白质。功能性变体可以保留相同但活性降低或增加的功能。功能性变体包括天然变 体,例如来自不同种类的同源物或向编码序列引入突变所获得的人工变体。功能性变体可 以是仅具有保守性修饰突变的变体。
[0096] 本文使用的"保守性修饰突变"包括编码的氨基酸序列的单个替换、缺失或增加, 其结果是化学上类似的氨基酸替换氨基酸。提供功能类似的氨基酸的保守性替换表是本领 域众所周知的。这种保守性修饰的变体是本公开之外的多态性变体、种间同源物和等位基 因且不排除本公开的多态性变体、种间同源物和等位基因。以下八组包含彼此间是保守性 替换的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨 酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V); 6)苯丙氨酸(F)、酪氨酸(Υ)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、甲硫 氨酸(M)(例如参见Creighton,Proteins(1984))。
[0097] 丝状真菌细胞
[0098]如本文所使用,"丝状真菌细胞"包括来自真菌亚门和卵菌亚门的所有丝状体的细 胞(如Hawksworth et al ·所定义,In,Ainsworth and Bisby7 s Dictionary of The Fungi ,8th edition,1995,CAB International,University Press,Cambridge,UK) 〇丝状 真菌细胞的特征通常在于菌丝壁由甲壳素、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合 多糖组成。营养生长通过菌丝延伸,碳代谢专性好氧。相反,酵母例如酿酒酵母 (Saccharomyces cerevisiae)的营养生长通过单细胞菌体出芽,碳代谢可以是发酵的。 [0099]优选地,必要核酸序列的转导、随后的蛋白质(例如哺乳动物蛋白质)表达或由此 产生的中间物质不会对丝状真菌细胞产生不利影响。破坏基因和培养丝状真菌细胞的一般 方法公开,例如,对于青霉属(Penicillium),于Kopke et al.(2010)Appl Environ Microbiol .76( 14) :4664-74 .doi :10.1128/AEM. 00670-10;对于曲霉属(Aspergillus),于 Maruyama and lOKitamoto(2011),Methods in Molecular Biology,vol·765,D0M 0.1007/978-1-61779-197-0_27;对于链孢霉属,于Collopy et al.(2010)Methods Mol Biol · 2010; 638:33-40 · doi : 10 · 1007/978-1-60761-611-5_3和对于毁丝霉属或金孢霉属, 于PCT/NL2010/000045和PCT/EP98/06496。
[0?00] 适合的丝状真菌细胞的实例包括,但不限于,来自支顶孢属(Acremonium)、曲霉 属、镰刀霉属、腐殖菌属、毛霉属、毁丝霉属、链孢霉属、青霉属、柱霉属(Scytalidium)、梭孢 壳菌属(1'111613¥13)、弯颈霉属(1'〇17。0〇13(1;[11111)或木霉属/肉座菌属(办。0(^63)菌株的细 胞。
[0101] 在某些实施方式中,丝状真菌细胞来自木霉属、支顶孢属、曲霉属、短梗霉属 (Aureobasidium)、隐球菌属(Cryptococcus)、金抱霉属、Chrysosporium lucknowense、黑 粉酵母属(Filibasidium)、镰刀霉属、赤霉菌属(Gibberella)、梨孢菌属(Magnaporthe)、毛 霉属(111〇01')、毁丝霉属、漆斑菌属(1}^〇1:116〇;[11111)、新考玛脂霉属(如00311;[1]^81:丨1)、链孢 霉属、拟青霉属(Paecilomyces)、青霉属、瘤胃壶菌属(Piromyces)、裂裙菌属 (Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳菌属或 弯颈霉属菌株。
[0102] 在一些实施方式中,丝状真菌细胞是毁丝霉属或金孢霉属、链孢霉属、曲霉属、镰 刀霉属或木霉属菌株。
[0103] 本公开的曲霉属真菌细胞可以包括,但不限于,棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、棒状曲霉(Aspergillus clavatus)、黄曲 霉(Aspergillus flavus)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑 曲霉(Aspergi 1 lus niger)、米曲霉(Aspergi 1 lus oryzae)或土曲霉(Aspergi 1 lus terreus)〇
[0104] 本公开的链孢霉属真菌细胞可以包括,但不限于,粗糙链孢霉(Neurospora crassa)〇
[0105] 本公开的毁丝霉属真菌细胞可以包括,但不限于,嗜热毁丝菌(Myceliophthora thermophila)〇
[0106] 在优选实施方式中,丝状真菌细胞是木霉属真菌细胞。本公开的木霉属真菌细胞 可以源自野生型木霉属菌株或其突变体。适合的木霉属真菌细胞的实例包括,但不限于,哈 茨木霉(Trichoderma harz ianum)、康氏木霉(Trichoderma koningi i )、长梗木霉 (Trichoderma longibrachiatum)、里氏木霉、深绿木霉(Trichoderma atroviride)、绿木 霉(Trichoderma virens)、绿色木霉(Trichoderma viride);和其可选的有性形式(即肉座 菌属)。
[0107] 在更优选的实施方式中,丝状真菌细胞是里氏木霉,和例如源自ATCC 13631(QM 6&)、六了〇: 24449(0163的辐射突变体207)、4了〇:26921(019414 4了〇: 24449的突变体)、 VTT-D-00775(Selinheimo et al.,FEBS J.,10 2006,273:4322-4335)、Rut-C30(ATCC 56765)、RL-P37(NRRL 15709)或哈茨木霉分离株T3(Wolffhechel,H.,1989)的菌株。
[0108] 本文描述的发明涉及丝状真菌细胞,例如选自木霉属、链孢霉属、毁丝霉属或金孢 霉属细胞,例如里氏木霉真菌细胞,包含:
[0109] i. -种或多种突变,其与不具有所述突变的亲本丝状真菌细胞相比降低或消除一 种或多种内源蛋白酶活性,
[0110] ii .编码寡糖基转移酶的异源催化亚基的多核苷酸,和 [0111] iii .编码异源糖蛋白的多核苷酸,
[0112]其中所述寡糖基转移酶的催化亚基选自利什曼原虫寡糖基转移酶催化亚基。
[0113]具有降低活性的蛋白酶
[0114] 已经发现降低蛋白酶活性能够大量增加异源哺乳动物蛋白质的生产。事实上,表 达异源蛋白质的丝状真菌细胞中发现的这种蛋白酶通常催化所表达的重组蛋白质的明显 降解。因此,通过降低表达异源蛋白质的丝状真菌细胞中蛋白酶的活性,所表达的蛋白质的 稳定性增加,导致蛋白质生产水平增加,在一些情况下,提高所生产蛋白质的质量(例如,全 长代替降解)。
[0115] 蛋白酶包括,但不限于,天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、枯草杆菌蛋 白酶、谷氨酸蛋白酶和sedolisin蛋白酶。可以从丝状真菌细胞鉴定和分离,和测试这些蛋 白酶以测定它们的活性降低是否影响丝状真菌细胞中重组多肽的生产。用于鉴定和分离蛋 白酶的方法是本领域技术人员所众所周知的,包括,但不限于,亲和色谱、酶谱分析和凝胶 电泳。然后可以通过以下来测试鉴定的蛋白酶:从表达重组多肽,例如异源或哺乳动物多肽 的丝状真菌细胞中删除编码鉴定的蛋白酶的基因,并测定所述删除是否导致细胞中总蛋白 酶活性的降低和所表达的重组多肽的生产水平增加。删除基因、测量总蛋白酶活性和测量 生产的蛋白质的水平的方法是本领域众所周知的,包括本文描述的方法。
[0116] 天冬氨酸蛋白酶
[0117] 天冬氨酸蛋白酶是使用天冬氨酸残基水解多肽和蛋白质中的肽键的酶。通常,天 冬氨酸蛋白酶在其活性位点包含两种高度保守的天冬氨酸残基,其在酸性pH下活性最大。 来自真核生物例如木霉属真菌的天冬氨酸蛋白酶包括胃蛋白酶、组织蛋白酶和肾素。这些 天冬氨酸蛋白酶具有两个域结构,其被认为由祖先基因复制而产生。与这种复制事件一致, 各结构域的总体折叠相似,尽管两个结构域的序列已经开始变得不同。各结构域贡献一个 催化的天冬氨酸残基。活性部位位于由天冬氨酸蛋白酶的两个结构域形成的裂缝中。真核 生物的天冬氨酸蛋白酶进一步包括保守的二硫键,其可有助于将多肽鉴定为天冬氨酸蛋白 酶。
[0118]已经在木霉属真菌细胞中鉴定了十种天冬氨酸蛋白酶:pepl(tre74156) ;pep2 (tre53961);pep3(trel21133);pep4(tre77579);pep5(tre81004);和pep7(tre58669); p印8(trel22076);p印9(tre79807);p印11(121306);和p印12(trel 19876)。
[0119] 适合的天冬氨酸蛋白酶的实例包括,但不限于,里氏木霉pepl(SEQ ID N0:22),里 氏木霉pep2(SEQIDN0:18)、里氏木霉pep3(SEQIDN0:19);里氏木霉pep4(SEQIDN0 : 20)、里氏木霉pep5(SEQ ID N0:21)和里氏木霉pep7(SEQ ID N0:23)、里氏木霉 EGR48424pep8(SEQ ID N0:85)、里氏木霉pep9(SEQ ID N0:87)、里氏木霉EGR49498pepll (SEQ ID N0:86)、里氏木霉EGR52517pepl2(SEQ ID N0:35)、及其同源物。其他生物中鉴定 的pepl、口6口2、口6口3、口6口4、口6口5、口6口7、口6口8、口6口11和口6口12蛋白酶的同源物的实例也描述于 PCT/EP/2013/050186中、其内容通过引用引入。
[0120]胰蛋白酶样丝氨酸蛋白酶
[0121]胰蛋白酶样丝氨酸蛋白酶是底物特异性与胰蛋白酶类似的酶。胰蛋白酶样丝氨酸 蛋白酶使用丝氨酸残基水解多肽和蛋白质中的肽键。通常,胰蛋白酶样丝氨酸蛋白酶切割 带正电荷的氨基酸残基后面的肽键。来自真核生物例如木霉属真菌的胰蛋白酶样丝氨酸蛋 白酶包括胰蛋白酶1、胰蛋白酶2、和消旋胰蛋白酶。这些胰蛋白酶样丝氨酸蛋白酶通常包含 形成电荷接替的三种氨基酸残基(例如组氨酸、天冬氨酸和丝氨酸)的催化三元组,所述电 荷接替用于使得活性部位丝氨酸亲核。真核生物的胰蛋白酶样丝氨酸蛋白酶进一步包括由 甘氨酸和丝氨酸的主链酰胺氢原子形成的"氧离子洞",其可有助于将多肽鉴定为胰蛋白酶 样丝氨酸蛋白酶。
[0122]已经在木霉属真菌细胞中鉴定了一种胰蛋白酶样丝氨酸蛋白酶:t s p 1 (tre73897)。如PCT/EP/2013/050186所讨论,已经表明tspl对重组糖蛋白例如免疫球蛋白 的表达具有显著影响。
[0123] 适合的tspl蛋白酶的实例包括,但不限于,里氏木霉tspl(SEQ ID N0:24)及其同 源物。在其他生物中鉴定的tspl蛋白酶的同源物描述于PCT/EP/2013/050186中。
[0124]枯草杆囷蛋白酶
[0125]枯草杆菌蛋白酶是底物特异性与枯草杆菌蛋白酶类似的酶。枯草杆菌蛋白酶使用 丝氨酸残基水解多肽和蛋白质中的肽键。通常,枯草杆菌蛋白酶是包含三种氨基酸天冬氨 酸、组氨酸和丝氨酸的催化三元组的丝氨酸蛋白酶。这些催化残基的排列与来自地衣芽孢 杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶共有。来自真核生物例如木霉属真 菌的枯草杆菌蛋白酶包括弗林蛋白酶、MBTPS1和TPP2。真核胰蛋白酶样丝氨酸蛋白酶在氧 离子洞中进一步包括天冬氨酸残基。
[0126]已经在木霉属真菌细胞中鉴定了七种枯草杆菌蛋白酶:slpl(tre51365) ;slp2 (trel23244);slp3(trel23234);slp5(tre64719);slp6(trel21495);slp7(trel23865)和 slp8(tre58698)。枯草杆菌蛋白酶slp7也类似于sedolisin蛋白酶tppl。
[0127] 适合的sip蛋白酶的实例包括,但不限于,里氏木霉slpl(SEQ ID N0:25);slp2 (SEQ ID N0:26);slp3(SEQ ID NO:27);slp5(SEQ ID NO:28);slp6(SEQ ID N0:29);slp7 (SEQ ID N0:30)和slp8(SEQ ID N0:31)及其同源物。其他生物中鉴定的sip蛋白酶的同源 物的实例描述于PCT/EP/2013/050186。
[0128] 谷氨酸蛋白酶
[0129] 谷氨酸蛋白酶是水解多肽和蛋白质中的肽键的酶。谷氨酸蛋白酶对胃酶抑素 A不 敏感,因此有时被称为胃酶抑素不敏感的酸性蛋白酶。尽管谷氨酸蛋白酶之前与天冬氨酸 蛋白酶分为一组并经常合称为酸性蛋白酶,最近已经发现谷氨酸蛋白酶与天冬氨酸蛋白酶 具有非常不同的活性位点残基。
[0130]已经在木霉属真菌细胞中鉴定了两种谷氨酸蛋白酶:gapl (tre69555)和gap2 (trel06661)〇
[0131] 适合的gap蛋白酶的实例包括,但不限于,里氏木霉gapl(SEQ ID N0:32)、里氏木 霉gap2(SEQ ID N0:33)及其同源物。其他生物中鉴定的gap蛋白酶的同源物的实例描述于 PCT/EP/2013/050186。
[0132] Sedol is in蛋白酶和蛋白酶的同源物
[0133] Sedolisin蛋白酶是使用丝氨酸残基水解多肽和蛋白质中的肽键的酶。Sedolisin 蛋白酶通常包含丝氨酸、谷氨酸和天冬氨酸的独特的催化三元组。Sedolisin蛋白酶还在氧 离子洞中包含天冬氨酸残基。来自真核生物例如木霉属真菌的Sedolisin蛋白酶包括三肽 基肽酶。
[0134] 适合的tppl蛋白酶的实例包括,但不限于,里氏木霉tppltre82623(SEQ ID N0: 34)及其同源物。其他生物中鉴定的tppl蛋白酶的同源物的实例描述于PCT/EP/2013/ 050186〇
[0135] 对于蛋白酶,术语"同源物"是指具有蛋白酶活性和与已知的(参照)蛋白酶序列表 现出序列相似性的蛋白质。同源物可以通过本领域已知的任何方法鉴定,优选通过利用 BLAST工具以比较参照序列和单一的第二序列或序列片段或比较参照序列与序列数据库。 如"定义"章节所描述,BLAST将基于百分比同一性和相似性比较序列。
[0136] 优选地,当与上列的蛋白酶序列之一(包括里氏木霉pepl、pep2、pep3、pep4、pep5、 pep7、pep8、pep9、pepll、pepl2、tspl、slpl、slp2、slp3、slp5、slp6、slp7、slp8、tppl、 区&口]^11(183口2)相比时,同源蛋白酶具有至少30%同一"性(在指定区域内任选30 %、40 %、 45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99% 或 100% 同一性,或当 未指定时在全部序列内)。来自粗糙链孢霉和嗜热毁丝菌的相应同源蛋白酶显示于SEQ ID NO:136-169。
[0137] 降低本发明丝状真菌细胞中的蛋白酶活性
[0138] 根据本发明的丝状真菌细胞具有至少一种,通常2种、3种、4种、5种或更多种活性 降低的内源蛋白酶,,从而在所述丝状真菌细胞优选木霉属细胞中提高具有增加的N-糖基 化占位的蛋白质的稳定性和生产。
[0139]总蛋白酶活性可以根据本领域标准方法测量,例如如本文所述利用蛋白酶分析试 剂盒(QuantiCleave protease assay kit,Pierce#23263),其中用琥?白酰化的酪蛋白作为 底物。
[0140] 丝状真菌细胞中发现的蛋白酶活性可以通过本领域技术人员所知的任何方法来 降低。在一些实施方式中,蛋白酶的活性降低通过降低蛋白酶的表达,例如通过启动子修饰 或RNAi来获得。
[0141] 在进一步的实施方式中,蛋白酶表达的降低或消除是对编码每一种蛋白酶的每一 种基因具有特异性的反义多核苷酸或RNAi构建体的结果。在一个实施方式中,RNAi构建体 对编码天冬氨酸蛋白酶例如pep型的蛋白酶、胰蛋白酶样丝氨酸蛋白酶例如tspl、谷氨酸蛋 白酶例如gap型蛋白酶、枯草杆菌蛋白酶例如sip型蛋白酶或Sedolisin蛋白酶例如tppl或 slp7的基因是特异性的。在一个实施方式中,RNAi构建体对编码sip型蛋白酶的基因是特异 性的。在一个实施方式中,RNAi构建体对编码slp2、 slp3、slp5或slp6的基因是特异性的。在 一个实施方式中,RNAi构建体对两种或更多种蛋白酶是特异性的。在一个实施方式中,两种 或更多种蛋白酶是pep型蛋白酶的任何一种、胰蛋白酶样丝氨酸蛋白酶的任何一种、sip型 蛋白酶的任何一种、gap型蛋白酶的任何一种和/或Sedolisin蛋白酶的任何一种。在一个实 施方式中, 两种或更多种蛋白酶是slp2、slp3、slp5和/或slp6。在一个实施方式中,RNAi构 建体包含任何一个以下的核酸序列(也参见PCT/EP/2013/050186)。
[0142]
[0143] 在其他实施方式中,降低的蛋白酶活性通过修饰编码蛋白酶的基因来实现。这种 修饰的实例包括,但不限于突变,例如编码所述内源蛋白酶活性的基因的缺失或破坏。
[0144] 因此,本发明涉及丝状真菌细胞,例如木霉属细胞,其具有与不具有这种蛋白酶缺 陷突变的亲本丝状真菌细胞相比减少或消除至少一种内源蛋白酶活性的突变,所述丝状真 菌细胞进一步包含编码来自利什曼原虫的寡糖基转移酶的异源催化亚基的多核苷酸。
[0145]缺失或破坏突变包括但不限于敲除突变、截断突变、点突变、错义突变、替换突变、 移码突变、插入突变、重复突变、扩增突变、易位突变或反转突变,且其导致相应蛋白酶活性 的降低。在编码目标蛋白酶的基因中生成至少一种突变的方法是本领域众所周知的,且包 括,但不限于,随机诱变和筛选、位点-定向诱变、PCR诱变、插入诱变、化学诱变和辐射。
[0146] 在某些实施方式中,修饰一部分的蛋白酶编码基因,例如编码催化结构域的区域、 编码区或表达编码区所需的控制序列。这种基因的控制序列可以是启动子序列或其功能部 分,即,足以影响基因表达的部分。例如,可以灭活启动子序列,导致启动子不表达或弱表 达,可以替代天然启动子以降低编码序列的表达。用于可能的修饰的其他控制序列包括,但 不限于,前导序列、前肽序列、信号序列、转录终止子和转录激活因子。
[0147] 存在于丝状真菌细胞中的蛋白酶编码基因也可以通过利用基因删除技术以消除 或降低基因表达来修饰。基因删除技术使得部分或完全去除基因,因此消除其表达。在这种 方法中,基因删除可通过利用已经构建为连续包含位于基因侧翼的5'和3'区域的质粒的同 源重组来实现。
[0148] 存在于丝状真菌细胞中的蛋白酶编码基因也可以通过在基因或该基因的转录或 翻译所需的控制序列中引入、替换和/或去除基因中一个或多个核苷酸、来修饰。例如,可以 插入或去除核苷酸以引入终止密码子,去除起始密码子、或使开放阅读框移位。这种修饰可 通过本领域已知的方法完成,包括但不限于,位点-定向诱变和peR产生的诱变(例如参见 Botstein和Shortie,1985,Science 229:4719;Lo et al.,1985,Proceedings of the National Academy of Sciences USA 81:2285;Higuchi et al·,1988,Nucleic Acids Research 16:7351;Shimada,1996,Meth.Mol.Bioi.57:157;Ho et al.,1989,Gene 77:61; Horton et al·,1989,Gene 77:61;以及Sarkar和Sommer,1990,BioTechniques 8:404)〇
[0149] 此外,存在于丝状真菌细胞中的蛋白酶编码基因也可以通过基因破坏技术在基因 中插入破坏性核酸构建体来修饰,所述构建体包含与基因同源的核酸片段,该片段将产生 重复的同源区域并将构建体核酸整合到重复区域之间。如果插入的构建体将基因启动子与 编码区分离,或打断编码序列使得产生无功能的基因产物,则这种基因破坏可以消除基因 表达。破坏性构建体可以简单地是伴随有和基因同源的5'和3'区域的可选择标记基因。可 选择标记能够鉴定包含被破坏的基因的转化体。
[0150] 存在于丝状真菌细胞中的蛋白酶编码基因也可以通过基因转化方法来修饰(例如 参见Iglesias和Trautner,1983,Molecular General Genetics 189:5 73-76)。例如,在基 因转化中,体外诱变对应于基因的核苷酸序列以产生有缺陷的核苷酸序列,然后将其转化 进木霉属菌株以产生缺陷基因。通过同源重组,缺陷的核苷酸序列替换内源基因。可以期望 缺陷的核苷酸序列还包含用于选择包含缺陷基因的转化体的标记。
[0151] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以通过 已建立的反义技术利用与基因的核苷酸序列互补的核苷酸序列来修饰(例如参见,Parish 和Stoker,1997,FEMS Microbiology Letters 154:151-157)。尤其是,丝状真菌细胞的基 因表达可以通过引入与基因的核苷酸序列互补的核苷酸序列来降低或失活,所述与基因的 核苷酸序列互补的核苷酸序列可以在菌株中转录并能够与细胞产生的mRNA杂交。在允许互 补反义核苷酸序列与mRNA杂交的条件下,翻译蛋白质的含量能因此被降低或消除。
[0152] 存在于丝状真菌细胞中的蛋白酶编码基因也可以利用本领域众所周知的方法通 过随机或特异性诱变来修饰,所述方法包括但不限于,化学诱变(例如参见H 〇pW〇〇d,The Isolation of Mutants in Methods in Microbiology(J.R.Norris and D.ff.Ribbons, eds.)pp·363-433,Academic Press,New York,25 1970)。基因修饰可通过使丝状真菌细胞 诱变和筛选其中基因表达已经降低或失活的突变体细胞来进行。特异性或随机诱变可以例 如通过利用适合的物理或化学诱变剂、使用适合的寡核苷酸、使DNA序列进行peR产生诱变 或其任何组合来进行。物理和化学诱变剂的实例包括,但不限于,紫外线(UV)照射、羟胺、N-甲基硝基-N-亚硝基胍(MNNG)、N-甲基亚硝基胍(NTG)、〇-甲胲、亚硝酸、甲基磺酸 乙酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,诱变通常通过以下来进 行:孵育丝状真菌细胞例如木霉属细胞以在所选择的诱变剂的存在下在适合条件下进行诱 变,然后筛选基因表达降低或没有基因表达的突变体。
[0153] 在某些实施方式中,本公开的蛋白酶编码基因中至少一种突变或修饰导致蛋白酶 活性不可检测的改性蛋白酶。在其他实施方式中,本公开的蛋白酶编码基因中至少一种修 饰导致改性蛋白酶的活性比相应的非改性蛋白酶少至少25%、至少50%、至少75%、至少 90%、至少95%或更高百分比。
[0154] 本公开的丝状真菌细胞或木霉属真菌细胞中至少三种或至少四种选自以下的蛋 白酶的蛋白酶活性降低或不可检测:pepl、pep2、pep3、pep4、pep5、pep8、pep9、pepll、 口6卩12、七8。1、8]^1、8]^2、8]^3、8]^5、8]^6、8]^7、83。1和83口2。在优选的实施方式中,根据本 发明的丝状真菌细胞是在至少3或4种内源蛋白酶中具有缺失或破坏的丝状真菌细胞,导致 这种缺失或破坏的内源蛋白酶的活性不可检测,并进一步包含编码来自利什曼原虫的寡糖 基转移酶的异源催化亚基的多核苷酸。
[0155] 在某些实施方式中,丝状真菌细胞或木霉属细胞的pepl、tSpl和slpl蛋白酶活性 降低或不可检测。在其他实施方式中,丝状真菌细胞或木霉属细胞的gapl、slpl和pepl蛋白 酶活性降低或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞的slP2、pepl和 gapl蛋白酶活性降低或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞的slp2、 pepl、gapl和pep4蛋白酶活性降低或不可检测。在某些实施方式中,丝状真菌细胞或木霉属 细胞的8]^2^6口1、83口1^6口4和8]^1蛋白酶活性降低或不可检测。在某些实施方式中,丝状 真菌细胞或木霉属细胞的8]^246口1、83口146口4、8]^1和8]^3蛋白酶活性降低或不可检测。 在某些实施方式中,丝状真菌细胞或木霉属细胞的slp2、pepl、gapl、pep4、slpl、slp3和 pep3蛋白酶活性降低或不可检测的蛋白酶活性。在某些实施方式中,丝状真菌细胞或木霉 属细胞的slp2、pepl、83口146口4、8]^1、8]^346口3和口6口2蛋白酶活性降低或不可检测的蛋 白酶活性。在某些实施方式中,丝状真菌细胞或木霉属细胞的slp2、pepl、gapl、pep4、slpl、 slp3、pep3、pep2和pep5蛋白酶活性降低或不可检测。在某些实施方式中,丝状真菌细胞或 木霉属细胞的slp2、pepl、gapl、pep4、slpl、8]^346口346口246口5和七8口1蛋白酶活性降低 或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞的slp2、pep 1、gapl、pep4、 81口1、8]^3、口6口3、口6口2、口6口5、七8口1和8]^7蛋白酶活性降低或不可检测。在某些实施方式中, 丝状真菌细胞或木霉属细胞的slp2、pepl、gapl、pep4、slpl、slp3、pep3、pep2、pep5、tspl、 slp7和slp8蛋白酶活性降低或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞 的 slp2、pepl、gapl、pep4、slpl、slp3、pep3、pep2、pep5、tspl、81卩7、81卩8和88卩2蛋白酶活性 降低或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞的pepl、pep2、pep3、 pep4、pep5、pep8、pep9、pepll、pepl2、tspl、81卩2、81卩3、81卩7、83卩1和88卩2蛋白酶活性降低 或不可检测。在某些实施方式中,丝状真菌细胞或木霉属细胞的pepl、pep2、pep3、pep4、 口6口5、七8口1、8]^1、8]^2、8]^3、8&口1和83口2蛋白酶活性降低或不可检测。在某些实施方式中, 丝状真菌细胞或木霉属细胞的 pepl、pep2、pep3、pep4、pep5、pep7、pep8、tspl、slpl、slp2、 slp3、slp5、slp6、slp7、slp8、tppl、gapl和gap2蛋白酶活性降低或不可检测。
[0156] 丝状真菌细胞中寡糖基转移酶的异源催化亚基的表达
[0157] 如本文所使用,表达"寡糖基转移酶"或0ST是指将1,4_糖寡糖从长醇转移至新生 蛋白质的酶复合物。它是一种糖基转移酶。糖Glc3Man9GlcNAc2连接至序列Asn-X-Ser或 Asn-X-Thr中的天冬酰胺(Asn)残基,其中X是除脯氨酸之外的任何氨基酸。该序列称为糖基 化序列子。由0ST催化的该反应是N-连接的糖基化途径的重要步骤。
[0158] 大多数真核生物中,0ST是由八种不同蛋白质组成的杂-低聚复合物,其中STT3组 分被认为是催化亚基。
[0159]根据本发明,寡糖基转移酶的异源催化亚基选自利什曼原虫寡糖基转移酶催化亚 基。寄生原生动物利什曼原虫中存在四种STT3旁系同源物,称为STT3A、STT3B、STT3C和 STT3D〇
[0160] 在一个实施方式中,寡糖基转移酶的异源催化亚基是来自硕大利什曼原虫的 STT3D(具有SEQ ID No:l所示的氨基酸序列)。
[0161] 在另一个实施方式中,寡糖基转移酶的异源催化亚基是来自婴儿利什曼原虫 (Leishmania infantum)的STT3D(具有SEQ ID No:8所示的氨基酸序列)。
[0162] 在另一个实施方式中,寡糖基转移酶的异源催化亚基是来自巴西利什曼原虫 (Leishmania braziliensis)的STT3D(具有SEQ ID No:89所不的氨基酸序列)。
[0163] 在另一个实施方式中,寡糖基转移酶的异源催化亚基是来自墨西哥利什曼原虫 (Leishmania mexicana)的STT3D(具有SEQ ID No:91 所不的氨基酸序列)。
[0164] 在又一个实施方式中,寡糖基转移酶的异源催化亚基是与SEQ ID NO: 1、SEQ ID N0:8、SEQ ID N0:89或SEQ ID N0:91具有至少50%、优选至少60%、更优选至少70%、80%、 90 %、95 %同一性的功能性变体多肽。
[0165] 在又一个实施方式中,寡糖基转移酶的异源催化亚基是与SEQ ID NO: 1或SEQ ID NO :8具有至少50 %、优选至少60 %、更优选至少70 %、80 %、90 %、95 %同一性的功能性变体 多肽。
[0166] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 SEQ ID N0:2。
[0167] SEQ ID N0:2是来自硕大利什曼原虫的STT3D基因的密码子优化版本 (gi389594572|ΧΜ_003722461·1)。
[0168] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 SEQ ID N0:9。
[0169] SEQ ID N0:9是来自硕大利什曼原虫的STT3D基因的密码子优化版本 (gi339899220|ΧΜ_003392747·1|)。
[0170] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 SEQ ID N0:88或SEQ ID N0:88的变体,其已经被密码子优化以在丝状真菌细胞例如里氏木 霉中表达。
[0171] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 SEQ ID N0:90或SEQ ID N0:90的变体,其已经被密码子优化以在丝状真菌细胞例如里氏木 霉中表达。
[0172] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 编码来自硕大利什曼原虫、婴儿利什曼原虫、巴西利什曼原虫或墨西哥利什曼原虫的STT3D 的功能性变体多肽的多核苷酸,所述功能性变体多肽与SEQ ID N0:1、SEQ ID N0:8、SEQ ID N0:89或SEQ ID N0:91具有至少50%、优选至少60%、更优选至少70%、80%、90%、95%同 一性。
[0173] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸包含 编码来自硕大利什曼原虫或婴儿利什曼原虫的STT3D的功能性变体多肽的多核苷酸,所述 功能性变体多肽与SEQ ID NO: 1或SEQ ID N0:8具有至少50%、优选至少60%、更优选至少 70%、80%、90%、95% 同一性。
[0174] 在本发明的一个实施方式中,编码寡糖基转移酶的异源催化亚基的多核苷酸在用 于在所述丝状真菌细胞中组成型表达所述寡糖基转移酶的启动子的控制之下。
[0175] 可用于表达寡糖基转移酶的启动子包括组成型启动子例如gpd或cDNAl、内源糖基 化酶和糖苷基转移酶例如在Golgi或ER中合成N-聚糖的甘露糖苷基转移酶的启动子和高产 量内源蛋白质的诱导型启动子例如cbhl启动子。
[0176] 在本发明的一个实施方式中,所述启动子是来自里氏木霉的cDNAl启动子。
[0177] 增加本发明丝状真菌细胞中N-糖基化占位
[0178] 根据本发明的丝状真菌细胞具有增加的寡糖转移酶活性,从而增加N-糖基化占 位。
[0179] N-糖基化占位可以通过本领域标准方法(例如,Schulz和Aebi(2009)Analysis of Glycosylation Site Occupancy Reveals a Role for 0st3p and 0st6p in Site-specific N-Glycosylation Efficiency,Molecular&Cellular Proteomics,8:357-364, 或Millward et al.(2008),Effect of constant and variable domain glycosylation on pharmacokinetics of therapeutic antibodies in mice,Biologicals,36:41_47, Forno等(2004)N-and 〇-linked carbohydrates and glycosylation site occupancy in recombinant human granulocyte-macrophage colony-stimulating factor secreted by a Chinese hamster ovary cell line,Eur.J.Biochem.271:907_919)或本文实施例描 述的方法来测量。
[0180] N-糖基化占位是指相对于丝状真菌细胞生产的异源糖蛋白总数而言,N-糖基化的 异源糖蛋白的摩尔百分率(或mol%)(如以下实施例1所述)。
[0181] 在本发明的一个实施方式中,N-糖基化占位为至少95%,且Man3、Man5、G0、G1和/ 或G2糖型代表异源糖蛋白的总中性N-聚糖的至少50%。
[0182] 各种糖型相对于异源糖蛋白的总中性N-聚糖的百分比可以例如如W02012069593 所述来测量。
[0183] 在一个实施方式中,具有增加的N-糖基化占位的异源蛋白质选自下组:
[0184] a)免疫球蛋白,例如IgG,
[0185] b)免疫球蛋白的轻链或重链,
[0186] c)抗体的重链或轻链,
[0187] d)单链抗体,
[0188] e)骆驼抗体,
[0189] f)单体或多聚体单域抗体,
[0190] g)FAb-片段、FAb2-片段,和,
[0191] h)其抗原结合片段。
[0192] 生产具有增加的N-糖基化占位和哺乳动物样N-聚糖的糖蛋白方法
[0193] 根据本发明的丝状真菌细胞尤其可用于生产具有增加的N-糖基化占位和哺乳动 物样N-聚糖,例如复合N-聚糖的异源糖蛋白组合物,例如抗体组合物。
[0194] 因此,一方面,进一步遗传修饰丝状真菌细胞以生产哺乳动物样N-聚糖,从而能够 在体内生产具有增加的N-糖基化占位和具有作为所述糖蛋白或抗体的主要糖型的哺乳动 物样N-聚糖的糖蛋白或抗体组合物。
[0195] 在某些实施方式中,该方面包括在木霉属细胞中生产具有哺乳动物样N-聚糖的糖 蛋白或抗体的方法。
[0196] 在某些实施方式中,糖蛋白或抗体包含作为主要糖型的哺乳动物样N-聚糖,其具 有式[{Galb4}xGlcNAcb2] zMana3( [ {Galb4}yGlcNAcb2]wMana6)Manb4GlcN Acb[Fuca6] aGlcNAc,其中〇定义了结构中的支链,其中[]或{}定义了线性序列中存在或不存在的聚糖 结构的一部分,和其中a、x、y、z和w独立地是0或1。在一个实施方式中,对于非半乳糖基化G0 结构,w和z是1,且X和y是0;对于G2结构,X和y均是1;和对于G1结构,仅X或y任何一个是1。当 a是1时,该结构是核心岩藻糖基化的例如FG0、FG1或FG2聚糖。
[0197] 在某些实施方式中,糖蛋白或抗体包含选自以下哺乳动物样N-聚糖作为主要糖 型:
[0198] i .Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(Man5糖型);
[0199] i i·G1cNAcb2Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(G1cNAcMan5糖 型);
[0200] iii .Mana6(Mana3)Manb4GlcNAb4GlcNAc(Man3糖型);
[0201 ] iv.Mana6(GlcNAcb2Mana3)Manb4GlcNAb4GlcNAc(GlcNAcMan3)或,
[0202] v.选自G0、G1或G2糖型的复合型N-聚糖。
[0203] 在一个实施方式中,优选通过alg3敲除菌株生产的具有哺乳动物样N-聚糖的糖蛋 白或抗体组合物包括基本上缺乏或缺乏聚糖Mana3[Mana6(Mana3)Mana6] Manb4GlcNAb4GlcNAc(Man5)的糖型。在具体的实施方式中,丝状真菌细胞生产具有作为主 要糖型的三甘露糖苷基N-聚糖结构Mana3[Mana6]Manb4GlcNAcb4GlcNAc的异源糖蛋白或抗 体。在其他实施方式中,丝状真菌细胞生产具有作为主要糖型的G0N-聚糖结构 GlcNAcb2Mana3[GlcNAcb2Mana6]Manb4GlcNAcb4GlcNAc 的异源糖蛋白或抗体。
[0204] 在某些实施方式中,本发明丝状真菌细胞生产具有不同N-聚糖的混合物的糖蛋白 或抗体组合物。
[0205] 在一些实施方式中,Man3GlcNAc2N_ 聚糖(即 Mana3[Mana6]Manb4GlcNAcb4GlcNAc) 代表本发明丝状真菌细胞所表达的异源糖蛋白或抗体的总中性N-聚糖(mol%)的至少 10 %、至少20 %、至少30 %、至少40 %、至少50 %至少60 %、至少70 %、至少80 %、至少90 %或 更多。
[0206] 在其他实施方式中,G1 cNAc2Man3N-聚糖(例如G0G1 cNAcb2Mana3 [G1 cNAcb2Mana6 ] Manb4GlCNAcb4GlcNAC)代表本发明丝状真菌细胞所表达的异源糖蛋白或抗体的总中性N-聚糖(mol%)的至少10%、至少20%、至少30%、至少40%、至少50%至少60%、至少70%、至 少80 %、至少90 %或更多。
[0207] 在其他实施方式中,GalGlcNAc2Man3GlcNAc2N-聚糖(例如G1N-聚糖)代表本发明 丝状真菌细胞所表达的异源糖蛋白或抗体的总中性N-聚糖(mol% )的至少10%、至少20%、 至少30%、至少40%、至少50%至少60%、至少70%、至少80%、至少90%或更多。
[0208] 在其他实施方式中,Gal 2G1 cNAc2Man3Gl cNAc2N-聚糖(例如G2N-聚糖)代表本发明 丝状真菌细胞所表达的异源糖蛋白或抗体的总中性N-聚糖(mol% )的至少10%、至少20%、 至少30%、至少40%、至少50%至少60%、至少70%、至少80%、至少90%或更多。
[0209] 在其他实施方式中,复合型N-聚糖代表本发明丝状真菌细胞所表达的异源糖蛋白 或抗体的总中性N-聚糖(mol % )的至少10 %、至少20%、至少30 %、至少40%、至少50 %至少 60%、至少70%、至少80%、至少90%或更多。
[0210] 在其他实施方式中,杂合型N-聚糖代表本发明丝状真菌细胞所表达的异源糖蛋白 或抗体的总中性N-聚糖(mol % )的至少10 %、至少20%、至少30 %、至少40%、至少50 %至少 60%、至少70%、至少80%、至少90%或更多。
[0211]在其他实施方式中,本发明宿主细胞所生产的异源糖蛋白组合物或抗体组合物中 少于0.5%、0.1 %、0.05%或少于0.01 %的N-聚糖包含半乳糖。在某些实 施方式中,N-聚糖 不包含半乳糖。
[0212] Neu5Gc和Gala-(非还原末端Gala3Galb4GlcNAc)结构是动物细胞例如CH0细胞中 生产的抗体的已知的异种抗原性(动物来源的)修饰。该结构可以是抗原性的,因此甚至在 低浓度时也是有害的。本发明的丝状真菌缺乏生产末端Neu5Gc和Gala-结构的生物合成途 径。在可与之前的实施方式组合的实施方式中,糖蛋白或抗体组合物中少于0.1 %、0.01 %、 0.001 %或0 %的N-聚糖和/或0-聚糖包含Neu5Gc和/或Gala-结构。在可与之前的实施方式 组合的实施方式中,异源糖蛋白或抗体组合物中少于0.1%、0.01%、0.001%或0%的N-聚 糖和/或〇-聚糖包含Neu5Gc和/或Gala-结构。
[0213] 本发明的丝状真菌细胞缺乏生产岩藻糖基化的异源蛋白质的基因。在可与之前的 实施方式组合的实施方式中,糖蛋白或抗体组合物中少于0.1 %、〇. 01 %、〇. 001 %或0%的 N-聚糖包含核心岩藻糖结构。
[0214] 哺乳动物细胞生产的聚糖中N-聚糖的末端Galb4GlcNAc结构影响抗体的生物活 性,且Galb3GlcNAc可以是来自植物细胞生产的蛋白质的异种抗原结构。在可与之前的实施 方式组合的实施方式中,异源糖蛋白或抗体组合物中少于0.1 %、〇. 01 %、〇. 001 %或0%的 N-聚糖包含末端半乳糖表位Galb3/4GlcNAc〇
[0215] 糖基化是由还原糖例如葡萄糖和蛋白质上的伯氨基之间的化学反应产生的蛋白 质常见的翻译后修饰。糖基化通常在中性或弱碱性pH的细胞培养条件下发生,例如,当在 CH0细胞中生产抗体并分析它们时(例如参见,Zhang等(2008)Unveiling a glycation hot spot in a recombinant humanized monoclonal antibody.Anal Chem.80(7):2379-2390)。本发明的丝状真菌通常在酸性pH中培养,糖基化发生率降低。在可与之前的实施方 式组合的实施方式中,少于1.0%、0.5%、0.1%、0.01%、0.001%或0%的异源糖蛋白或抗 体组合物包含糖基化结构。
[0216] 在一个实施方式中,糖蛋白组合物,例如抗体缺乏选自下组的一、二、三、四、五或 六个结构:Neu5Gc、末端6&1&36&]^461。嫩。、末端6&]^461。嫩。、末端6&]^361。嫩。、核心连接 的岩藻糖和糖基化结构。
[0217] 在某些实施方式中,这种具有哺乳动物样N-聚糖的糖蛋白,例如在本发明丝状真 菌细胞中生产的糖蛋白是治疗性蛋白质。治疗性蛋白质可以包括免疫球蛋白、或包含Fc片 段或其他治疗性糖蛋白,例如抗体、促红细胞生成素、干扰素、生长激素、白蛋白或血清白蛋 白、酶或凝血因子的蛋白融合,可用于治疗人或动物。例如,如丝状真菌细胞生产的具有哺 乳动物样N-聚糖的糖蛋白可以是治疗性糖蛋白例如利妥昔单抗。
[0218] 在丝状真菌细胞中生产具有哺乳动物样N-聚糖的糖蛋白的方法也例如描述于 W02012/069593 中。
[0219] 一方面,进一步遗传修饰根据上述本发明的丝状真菌细胞以模拟哺乳动物细胞的 传统通路,从作为GnTI的受体底物的Man5N-聚糖开始,和随后顺次是GnTl、甘露糖苷酶II和 GnTII反应步骤(以下称为生产G0糖型的"传统通路")。在一个变体中,使用包含催化结构域 GnTI和GnT II的单个重组酶。
[0220]或者,在第二方面,进一步遗传修饰根据上述本发明的丝状真菌细胞以降低alg3 的表达,允许生产作为GnTI和GnTII随后反应的受体底物的核心Man3GlcNAc2N-聚糖,而不需 要甘露糖苷酶al,2或甘露糖苷酶II酶(降低的"alg3"通路)。在一个变体中,使用包含催化 结构域GnT I和GnT II的单个重组酶。
[0221 ]在模拟用于生产具有哺乳动物样N-聚糖的传统通路的这种实施方式中,可用GnTI 或GnTII/GnTI融合酶利用随机整合或定点整合至不影响Man5糖基化的已知位点来转化表 达Man^丝状真菌细胞,例如里氏木霉菌株。选择合成GlcNAcMan5N-聚糖用于生产具有杂 合型聚糖的蛋白质的菌株。用能够切割Man5结构以生成GlcNAcMan3的甘露糖苷酶II型甘露 糖苷酶的催化域进一步转化所选菌株,用于生产具有相应GlcNAcMan3糖型的蛋白质或其衍 生物。在某些实施方式中,甘露糖苷酶II型酶属于葡萄糖甙水解酶家族38(ca Zy.org/GH38_ all .html)。特征性的酶包括cazy.org/GH38_characterized.html中所列的酶。特别有用的 酶是切割糖蛋白的Golgi型酶,例如亚族α-甘露糖苷酶II的那些(Man2Al;ManA2)。这种酶的 实例包括人酶AAC50302、黑腹果蝇酶(Van den Elsen J.M.et al(2001)EMB0 J.20:3008-3017)、具有根据PDB-参考1HTY的3D结构的那些和其他参考PDB中的催化领域的那些。对于 细胞质表达,通常将甘露糖苷酶的催化结构域与N-末端靶向肽(例如上文章节中所公开)融 合或与动物或植物甘露糖苷酶Π 酶的内源动物或植物Golgi靶向结构一起表达。用甘露糖 苷酶II型甘露糖苷酶的催化域转化后,选择生产GlcNAcMan3 (如果表达GnTI)的菌株或选择 有效生产GlcNAc2Man3(如果表达GnTI和GnTII的融合)的菌株。对于生产GlcNAcMan3的菌 株,用编码GnTI I催化结构域的多核苷酸进一步转化这种菌株并选择能够生产 GlcNAc2Man3GlcNAc2 的转化菌株。
[0222] 在模拟传统通路的这种实施方式中,丝状真菌细胞是如之前章节所定义的丝状真 菌细胞,并进一步包含一种或多种编码选自下组的多肽的多核苷酸:
[0223] i)al,2甘露糖苷酶,
[0224] i i )N_乙酰葡糖胺基转移酶I催化结构域,
[0225] iii)a甘露糖苷酶II,
[0226] iv)N_乙酰葡糖胺基转移酶II催化结构域,
[0227] v)bl,4半乳糖基转移酶,和
[0228] vi)岩藻糖基转移酶。
[0229]在利用降低的alg3通路的实施方式中,丝状真菌细胞例如木霉属细胞具有与亲本 宿主细胞的活性水平相比降低的长醇-P-Man:Man(5)GlcNAc(2)-PP-长醇甘露糖转移酶的 活性水平。长醇-P-Man:Man(5)G1 cNAc(2)-PP-长醇甘露糖转移酶(EC 2.4.1.130)将α-D-甘 露糖残基从长醇-磷酸D-甘露糖转移至膜脂连接的寡糖。通常,长醇-P-Man:Man(5)GlcNAc (2)-PP-长醇甘露糖转移酶由alg3基因编码。在某些实施方式中,用于生产具有哺乳动物样 N-聚糖的丝状真菌细胞具有与亲本菌株的表达水平相比降低的alg3基因的表达水平。 [0230] 更优选地,丝状真菌细胞包含alg3突变。alg3基因可通过本领域已知的任何手段 突变,例如点突变或删除整个alg3基因。例如,alg3蛋白质的功能通过alg3突变而降低或消 除。在某些实施方式中,将alg3基因从丝状真菌细胞例如木霉属细胞破坏或删除。在某些实 施方式中,丝状真菌细胞是里氏木霉细胞。SEQ ID NOs:36和37分别提供里氏木霉中alg3基 因的核酸和氨基酸序列。在一个实施方式中,丝状真菌细胞用于生产糖蛋白,其中聚糖包含 ]\^11&3[]\^11&6]]\^1^461〇财(^461〇财(3和/或其非还原端伸长的变体,或由]\^11&3[]\^11已6] Manb4GlcNAcb4GlcNAc和/或其非还原端伸长的变体组成。
[0231 ]在某些实施方式中,丝状真菌细胞具有与亲本菌株的活性水平相比降低的α-l,6_ 甘露糖转移酶的活性水平。α-1,6_甘露糖转移酶(EC2.4.1.232)将α-D-甘露糖残基从⑶Ρ- 甘露糖转移入蛋白质连接的寡糖,形成从高尔基体中a-(l_>6)-D-甘露糖基-D-甘露糖键 开始的延伸。通常,a-l,6_甘露糖转移酶由ochl基因编码。在某些实施方式中,丝状真菌细 胞具有与亲本丝状真菌细胞的表达水平相比降低的ochl基因的表达水平。在某些实施方式 中,从丝状真菌细胞中删除ochl基因。
[0232] 用于生产具有哺乳动物样N-聚糖的方法的丝状真菌细胞可以进一步包含编码乙 酰葡糖胺基转移酶I催化结构域(GnTI)的多核苷酸和编码乙酰葡糖胺基转移酶II催化结构 域(GnTII)的多核苷酸,所述乙酰葡糖胺基转移酶I催化结构域催化N-乙酰基葡糖胺转移至 末端Mana3,所述乙酰葡糖胺基转移酶II催化结构域催化N-乙酰基葡糖胺转移至受体聚糖 的末端Mana6残基,以生产复合N-聚糖。在一个实施方式中,连接所述编码GnTI和GnTII的多 核苷酸以便生产包含GnTI和GnTII两个催化结构域的单个蛋白融合。
[0233] 如本文所公开,N-乙酰葡糖胺基转移酶I (GlcNAc-TI; GnTI ;EC2.4.1.101)催化 UDP-N-乙酰基-D-氨基葡萄糖+3-(a-D-甘露糖基)-β-D-甘露糖基-R< = >UDP+3-(2-(N-乙 酰基-β-D-葡萄胺基)-a-D-甘露糖基)-β-D-甘露糖基-R的反应,其中R代表聚糖受体中N-连 接的寡糖的其余部分。N-乙酰葡糖胺基转移酶I催化结构域是能够催化该反应的N-乙酰葡 糖胺基转移酶I酶的任何部分。GnTI酶列于糖苷基转移酶家族13中的CAZy数据库 (cazy · org/GT13_al 1)。酶学特征性的种类包括拟南芥(A· thaliana)AAR78757 · 1 (US6 653 459);秀丽线虫(C.elegans)AAD03023.1(Chen S.et al J.Biol.Chem 1999;274(1):288-97);黑腹果绳(D.melanogaster)AAF57454. l(Sarkar&Schachter Biol Chem.2001Feb;382 (2):209-17);中国仓鼠(C.griseus)AAC52872.1(Puthalakath H.et al J.Biol.Chem 1996 271 (44) :27818-22);智人(H.sapiens)AAA52563.1 (Kumar R.et al Proc Natl Acad Sci U S A.1990Dec;87(24):9948-52);金黄地鼠(M.auratus)AAD04130.1(0pat As et al Biochem J.1998Dec 15;336(Pt 3):593-8)(包括失活突变体的实例);兔;家兔 (0.cuniculus)AAA31493.1(Sarkar Μ等Proc Natl Acad Sci U S A.1991Jan 1;88(1): 234-8)。来自不同生物的N-乙酰葡糖胺基转移酶I酶的氨基酸序列例如描述于PCT/EP2011/ 070956中。特征性的活性酶的其他实施例可以在cazy.org/GT13_characterized中发现。兔 GnTI的催化结构域的3D结构在Unligil UM等ΕΜΒ0 J.20000ctl6; 19(20) :5269-80中通过X-射线单晶衍射定义。GnTI的蛋白质数据库(PDB)结构是1F08、1F09、1F0A、2AM3、2AM4、2AM5和 2APC。在某些实施方式中,N-乙酰葡糖胺基转移酶I催化结构域来自于人N-乙酰葡糖胺基转 移酶頂每(SEQ ID N0:38)或其变体。在某些实施方式中,N-乙酰葡糖胺基转移酶I催化结构 域包含与SEQ ID N0:38的氨基酸残基84-445至少70%、至少75%、至少80%、至少85%、至 少90 %至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列。在一些实 施方式中,较短序列可用作催化结构域(例如人酶的氨基酸残基105-445或兔酶的氨基酸残 基 107-447; Sarkar等(1998)Glycocon jugate J 15:193-197)。可用作GnTI催化结构域的其 他序列包括人酶的从约氨基酸30到445的氨基酸残基或从人酶的氨基酸残基30到105之间 开始并持续至约氨基酸445的任何C末端非催化结构域(stem domain)、或另一个GnTI或催 化活性变体或其突变体的相应同源序列。催化结构域可以包括酶的N-末端部分,例如所有 或部分非催化结构域、跨膜结构域或胞质结构域。
[0234] 如本文所公开,N-乙酰葡糖胺基转移酶II(GlcNAc-TII;GnTn ;EC2.4.1.143)催化 UDP-N-乙酰基-D-葡糖胺+6-(a-D-甘露糖基)-β-D-甘露糖基-R< = >UDP+6-(2-(N-乙酰 基-β-D-葡萄胺基)-α-D-甘露糖基)-β-D-甘露糖苷基-R的反应,其中R代表聚糖受体中N-连 接的寡糖的其余部分。N-乙酰葡糖胺基转移酶II催化结构域是能够催化该反应的N-乙酰葡 糖胺基转移酶II酶的任何部分。来自不同生物的N-乙酰葡糖胺基转移酶II酶的氨基酸序列 列于W02012069593中。在某些实施方式中,N-乙酰葡糖胺基转移酶II催化结构域来自于人 N-乙酰葡糖胺基转移酶II酶(SEQ ID NO:39)或其变体。其他GnTII种类列于糖苷基转移酶 家族16的CAZy数据库(cazy .org/GT16_all)。酶学特征性的种类包括线虫、黑腹果绳、智人 (ΝΡ_002399 · 1)、褐家鼠、野猪(cazy ·org/GT16_characterized)的GnTII。在某些实施方式 中,N-乙酰葡糖胺基转移酶II催化结构域包含与SEQ ID NO:39从约30到约447的氨基酸残 基至少70%、至少75 %、至少80%、至少85 %、至少90%至少95%、至少96 %、至少97%、至少 98%、至少99%或100%相同的序列。催化结构域可以包括酶的N-末端部分,例如所有或部 分非催化结构域、跨膜结构域或胞质结构域。
[0235] 在其中丝状真菌细胞包含本发明融合蛋白的实施方式中,融合蛋白可以进一步包 含N-乙酰葡糖胺基转移酶I催化结构域和N-乙酰葡糖胺基转移酶II催化结构域之间的间隔 区。在某些实施方式中,间隔区是EGIV间隔区、2xG4S间隔区、3xG4S间隔区或CBHI间隔区。在 其他实施方式中,间隔区包含来自非催化结构域的序列。
[0236] 对于ER/Golgi表达,通常将N-乙酰葡糖胺基转移酶I和/或N-乙酰葡糖胺基转移酶 Π 催化结构域与靶向肽或ER或早期Golgi蛋白质的一部分融合,或用动物或植物N-乙酰葡 糖胺基转移酶的内源ER靶向结构一起表达。在某些优选的实施方式中,N-乙酰葡糖胺基转 移酶I和/或N-乙酰葡糖胺基转移酶II催化结构域包含如标题为"靶序列"的章节描述的本 发明任何靶向肽。优选地,将靶向肽与催化结构域的N端连接。在一些实施方式中,靶向肽包 含如标题为"靶序列"的章节描述的本发明任何非催化结构域。在某些优选的实施方式中, 靶向肽是Kre2/Mntl靶向肽。在其他实施方式中,靶向肽进一步包含与非催化结构域的N端 连接的跨膜结构域或与非催化结构域的N端连接的胞质结构域。在其中靶向肽进一步包含 跨膜结构域的实施方式中,靶向肽可以进一步包含与跨膜结构域的N端连接的胞质结构域。
[0237] 丝状真菌细胞还可以包含编码UDP-GlcNAc转运体的多核苷酸。编码UDP-GlcNAc转 运体的多核苷酸可以是宿主细胞中内源的(即天然存在的),或其可以对于丝状真菌细胞而 目是异源的。
[0238] 在某些实施方式中,丝状真菌细胞可以进一步包含编码α-l,2_甘露糖苷酶的多核 苷酸。编码α-1,2_甘露糖苷酶的多核苷酸可以是宿主细胞中内源的,或其可以对于宿主细 胞而言是异源的。异源多核苷酸尤其可用于表达从Golgi转移至ER而没有经过有效的外切-α-2_甘露糖苷酶切割的高甘露糖聚糖的宿主细胞。α-1,2-甘露糖苷酶可以是属于葡萄糖甙 水解酶家族47的甘露糖苷酶I型酶(cazy.org/GH47_all.html)。在某些实施方式中,α-1,2-甘露糖苷酶是列于cazy · org/GH47_characterized ·html中的酶。尤其是,α-l,2_甘露糖苷 酶可以是切割糖蛋白的ER型酶,例如ERa-甘露糖苷酶I EC 3.2.1.113酶的亚族的酶。这种 酶的实例包括人a-2-甘露糖苷酶1B(AAC26169)、哺乳动物ER甘露糖苷酶的组合或丝状真菌 酶例如a-l,2-甘露糖苷酶(MDS1)(里氏木霉AAF34579;Maras M et al J Biotech.77, 2000,255,或Trire 45717)。对于ER表达,通常将甘露糖苷酶的催化结构域与靶向肽例如 HDEL、KDEL或ER或早期Golgi蛋白质的一部分融合,或用动物或植物甘露糖苷酶頂每的内源 ER靶向结构一起表达。
[0239] 在某些实施方式中,丝状真菌细胞还可以进一步包含编码半乳糖基转移酶的多核 苷酸。半乳糖基转移酶将b_连接的半乳糖残基转移至末端N-乙酰基葡糖胺残基。在某些实 施方式中,半乳糖基转移酶是β-l,4-半乳糖基转移酶。通常,β-l,4-半乳糖基转移酶属于 CAZy糖苷基转移酶家族7(cazy · org/GT7_al 1 · html),且包括β-Ν-乙酰基葡糖胺基-糖肽β-1,4-半乳糖基转移酶(EC 2.4.1.38),其也称为Ν-乙酰乳糖胺合酶(EC 2.4.1.90)。有用的 亚族包括 04-6&11!、04-6&11'-11、-111、-1¥、-¥和-¥1,例如哺乳动物或人04-6 &11'1或0 46&11'-11、-111、-1¥、,和,1或其任何组合。04-6&11'1、04-6311'11或04-6311'111尤其可用 于N-聚糖例如61〇嫩〇]\^113、61〇嫩〇2]\&113或61〇嫩〇]\^115上的末端61〇嫩(^2-结构的半乳糖基 化(Guo S.等Glycobiology 2001,11:813-20)。催化域的三维结构是已知的(例如(2006) J.Mol.Biol.357:1619-1633),病且该结构在PDB数据库中用代码2FYD代表。CAZy数据库包 括某些酶的实例。特征性的酶也列于cazy .〇坪/617_〇1^瓜(^61^26(1.111:1111的0427数据库中。 有用的MGalT酶的实例包括MGalTl,例如牛酶AAA30534. 1 (Shaper N. L.等 Proc .Natl .Acad .Sci.U.S.A. 83(6),1573-1577( 1986))、人酶(Guo S.等Glycobiology 2001,11 :813-20 )和小家鼠 (Mus mu s c u 1 u s )酶 AAA3 7 2 9 7 ( Shap e r,Ν · L ·等 1998J.Biol ·Chem. 263(21),10420-10428) ;MGalTII酶例如人MGalTII BAA75819· 1、中国 仓鼠 (Cricetulus griseus ) AAM77195、小家鼠酶BAA34385和日本青鎌鱼(Oryzias latipes)BAH36754;和MGalTIII酶例如人MGalTIII BAA75820.1、中国仓鼠 AAM77196和小 家鼠酶AAF22221。
[0240] 半乳糖基转移酶可以在宿主细胞的质膜中表达。可以使用异源靶向肽,例如 Schwientek J.Biol.Chem 1996 3398中描述的Kre2肽。用于表达半乳糖基转移酶的启动子 包括组成型启动子例如gpd、内源糖基化酶和糖苷基转移酶例如在Golgi或ER中合成N-聚糖 的甘露糖基转移酶的启动子和高产量内源蛋白质的诱导型启动子例如cbhl启动子。
[0241] 在其中丝状真菌细胞包含编码半乳糖基转移酶的多核苷酸的本发明某些实施方 式中,丝状真菌细胞还包含编码UDP-Gal 4异构酶和/或UDP-Gal转运体的多核苷酸。在其中 丝状真菌细胞包含编码半乳糖基转移酶的多核苷酸的本发明某些实施方式中,当培养宿主 细胞时,乳糖可代替葡萄糖用作碳源。培养基的pH可以为4.5-7.0或5.0-6.5。在其中丝状真 菌细胞包含编码半乳糖基转移酶的多核苷酸和编码UDP-Gal 4异构酶和/或UDP-Gal转运体 的多核苷酸的本发明某些实施方式中,可以将二价阳离子例如Mn2+、Ca2+或Mg2+添加至细 胞培养基中。
[0242] 因此,在某些实施方式中,例如选自链孢霉属、木霉属、毁丝霉属、曲霉属、镰刀霉 或金孢霉属细胞、更优选里氏木霉细胞的本发明的丝状真菌细胞可以包含以下特征:
[0243] a)降低或消除所述内源蛋白酶活性、优选降低两种或三种或更多种内源蛋白酶的 蛋白酶活性的至少一种内源蛋白酶中的突变,所述内源蛋白酶例如pepl、tspl、gapl和/或 slpl蛋白酶,从而改进待生产的异源糖蛋白的产量或稳定性,
[0244] b)编码寡糖基转移酶的异源催化亚基的多核苷酸,优选SEQ ID N0:2或N0:9,
[0245] c)编码具有至少一个天冬酰胺的糖蛋白、优选异源糖蛋白例如免疫球蛋白、抗体 或包含免疫球蛋白的Fc片段的蛋白融合的多核苷酸。
[0246] d)任选地,删除或破坏alg3基因,
[0247] e)任选地,编码N-乙酰葡糖胺基转移酶I催化结构域的多核苷酸和编码N-乙酰葡 糖胺基转移酶II催化结构域的多核苷酸,
[0248] f)任选地,编码bl,4半乳糖基转移酶的多核苷酸,
[0249] g)编码UDP-Gal 4异构酶和/或转运体的一个或多个多核苷酸。
[0250] 靶向序列
[0251] 在某些实施方式中,引入丝状真菌细胞的重组酶,例如al,2甘露糖苷酶、GnTI或其 他糖基转移酶包括与催化结构域连接的靶向肽。本文所使用的术语"连接"是指在多肽情况 下氨基酸残基的两个聚合物或在多核苷酸情况下核苷酸的两个聚合物直接彼此偶联或在 相同的多肽或多核苷酸内但通过插入氨基酸残基或核苷酸而分离。如本文所使用,"靶向 肽"是指能够将重组蛋白质定位至宿主细胞内的内质网(ER)或高尔基体(Golgi)的重组蛋 白质的任何数量的连续氨基酸残基。靶向肽可以在催化结构域的N端或C端。在某些实施方 式中,靶向肽在催化结构域的N端。在某些实施方式中,靶向肽提供与ER或Golgi成分的结 合,例如结合至甘露糖苷酶II酶。在其他实施方式中,靶向肽提供与ER或Golgi膜的直接结 合。
[0252] 靶向肽的组分可以来自通常存在于ER或高尔基体中的任何酶。这样的酶包括甘露 糖苷酶、甘露糖基转移酶、糖基转移酶、2型Gol gi蛋白质、和MNN2、MNN4、MNN6、MNN9、MNN10、 丽S1、K RE2、VAN1和0CH1酶。这种酶可以来自酵母或真菌物种,例如支顶孢属、曲霉属、短梗 霉属、隐球菌、金孢霉属、〇1巧80 8口01';[1111111101010¥61186、线黑粉酵母属(?;[1(^38丨(1;[11111)、镰 刀霉属、赤霉菌属)、腐殖菌属、梨孢菌属、毛霉属、毁丝霉属、漆斑菌属、新考玛脂霉属、链孢 霉属、拟青霉属、青霉属、瘤胃壶菌属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳菌属、弯 颈霉属菌株和木霉属。这种酶的序列可以在GenBank序列数据库中发现。
[0253] 在某些实施方式中,靶向肽来自于与重组蛋白质的催化结构域之一相同的酶和生 物。例如,如果重组蛋白质包括人GnTII催化结构域,则重组蛋白质的靶向肽来自于人GnTII 酶。在其他实施方式中,靶向肽可以来自与重组蛋白质的催化结构域不同的酶和/或生物。
[0254] 可以在靶向重组酶中使用的用于将蛋白质靶向至ER或Go 1 gi的各种靶向肽的实例 包括:与半乳糖基转移酶融合的Kre2/MntlN端肽(SchwientekJBC 1996,3398)、用于将甘 露糖苷酶定位至酵母细胞的ER以生产Man5的HDEL(Chiba,JBC 1998,26298-304; Callewaert,FEBS Lett 2001,173-178)、与GnTI催化结构域融合的0CH1 靶向肽(Yoshida et al,Glycobiology 1999,53_8)、与α2_甘露糖苷酶融合的酵母Mnsl的N端肽(Martinet 等,Biotech Lett 1998,1171)、与GnTI或MGalT的催化结构域连接的Kre2的N端部 (Vervecken,Appl .Environ Microb 2004,2639_46)、Wildt和Gerngross综述的各种方法 (Nature Rev Biotech 2005,119)、构巢曲霉中的全长GnTI(Kalsner等,Glycocon.J1995, 360-370)、米曲霉中的全长GnTI (Kasajima等,Biosci Biotech Biochem 2006,2662-8)、曲 霉属中与线虫GnTI融合的酵母Secl2定位结构部分(Kainz等2008)、曲霉属中与人GnTI融合 的酵母Mnn9的N端部(Kainz等2008)、与人GnTI融合的曲霉属MnnlO的N端部(Kainz等, Appl .Environ Microb 2008,1076-86)和里氏木霉中全长人GnTI(Maras等,FEBS Lett 1999,365-70)〇
[0255] 在某些实施方式中,靶向肽是具有氨基酸序列SEQ ID N0:40的Mntl/Kre2靶向肽 的N端部(例如由多核苷酸SEQ ID NO:41编码)。在某些实施方式中,靶向肽选自人GNT2、 KRE2、KRE2-样、0吐1^即1、¥&111,如下表1所示:
[0256] 表1:靶向肽的氨基酸序列
[0257]
[0258」可用于靶向肽的序列的进一步实例包括如W02012/069593所述的靶向序列。
[0259] 可以测试非特征性的序列以用作靶向肽,通过在宿主细胞中表达糖基化通路的 酶,其中酶之一包含非特征性的序列作为唯一的靶向肽,并测量由于聚糖生物合成的胞质 定位而生产的聚糖(例如如Schwientek JBC 1996 3398);或通过表达与祀向肽融合的焚光 报道蛋白质,并通过免疫荧光或通过分馏Golgi的细胞质膜和测量蛋白质的位置来分析 Golgi中蛋白质的位置。
[0260] 生产具有增加的N-糖基化占位的糖蛋白的方法
[0261] 如上所述的丝状真菌细胞可用于生产具有增加的N-糖基化占位的糖蛋白组合物 的方法。
[0262] 因此,另一方面,本发明涉及用于生产具有增加的N-糖基化占位的糖蛋白组合物 的方法,包括:
[0263] a)提供具有编码寡糖基转移酶的催化亚基的利什曼原虫STT3D基因或其功能性变 体和编码异源糖蛋白的多核苷酸的丝状真菌细胞,例如木霉属细胞,,
[0264] b)在适当的条件下培养所述细胞,以表达STT3D基因或其功能性变体,和生产异源 糖蛋白组合物;和
[0265] c)回收所述糖蛋白组合物,和任选纯化异源糖蛋白组合物。
[0266] 在方法的【具体实施方式】中,丝状真菌细胞包含如上所述与不具有所述突变的亲本 丝状真菌细胞相比降低或消除一种或多种内源蛋白酶活性的一个或多个突变。
[0267] 在本发明方法中,某些生长培养基包括,例如,常见的商业制备的培养基例如 Lur i a-Ber tan i (LB)肉汤、Sabouraud葡萄糖(SD)肉汤或酵母培养基(YM)肉汤。也可以使用 其他定义或合成的生长培养基,且用于生长特定的宿主细胞的适当的培养基将是微生物学 或发酵科学领域的技术人员已知的。培养基通常具有里氏木霉基本培养基(Penttim等, 1987,Gene 61,155-164)作为基础,补充有诱导生产启动子的物质,例如乳糖、纤维素、麦糟 (spent grain)或槐糖。适于生长的温度范围和其他条件是本领域已知的(例如参见Bailey and 011isl986)。在某些实施方式中,细胞培养的pH为3.5-7.5、4.0-7.0、4.5-6.5、5-5.5或 为5.5。在某些实施方式中,为生产抗体,在选自4.7-6.5 ;?財.8-6.0;?!14.9-5.9;和?!15.0-5.8的pH范围下培养丝状真菌细胞或木霉属真菌细胞。
[0268] 在本发明的一些实施方式中,所述方法包括在包含一种或两种蛋白酶抑制剂的培 养基中培养。
[0269] 在本发明具体的实施方式中,所述方法包括在包含一种或两种选自SBTI和抑凝乳 蛋白酶素的蛋白酶抑制剂的培养基中培养。
[0270] 在一些实施方式中,糖蛋白是异源糖蛋白,优选哺乳动物糖蛋白。在其他实施方式 中,异源糖蛋白是非哺乳动物糖蛋白。
[0271 ]在某些实施方式中,哺乳动物糖蛋白选自免疫球蛋白、免疫球蛋白或抗体重链或 轻链、单克隆抗体、Fab片段、F(ab')2抗体片段、单链抗体、单体或多聚体单域抗体、骆驼抗 体、或其抗原结合片段。
[0272] 本文使用的蛋白质片段由至少10、20、30、40、50、60、70、80、90、100个参考蛋白的 连续氨基酸组成。
[0273] 如本文所使用,"免疫球蛋白"是指包含共价偶联在一起的重链和轻链并能够特异 性结合抗原的多聚体蛋白。免疫球蛋白分子是包括几种类型的分子例如IgM、IgD、IgG、IgA 和IgE的大的分子家族。
[0274] 如本文所使用,"抗体"是指完整的免疫球蛋白分子及其能够结合抗原的片段。这 些包括杂合的(嵌合的)抗体分子(例如参见Winter等Nature 349 : 293-99225,1991;和 U. S. Pat No. 4,816,567 226);FUV )2分子;非共价的杂二聚物;二聚和三聚抗体片段构建 体;人源化抗体分子(例如参见Riechmann等Nature 332,323_27,1988 ; Verhoeyan等 Science 239,1534-36,1988;和GB 2,276,169);和由这种分子获得的任何功能性片段以及 通过非常规方法例如噬菌体展示或转基因小鼠获得的抗体。优选抗体是具有Fc域的传统抗 体。制备抗体的方法是本领域众所周知的。
[0275] 在进一步的实施方式中,哺乳动物糖蛋白例如抗体的产量为至少0.5、至少1、至少 2、至少3、至少4或至少5克每升。
[0276]在某些实施方式中,哺乳动物糖蛋白是抗体,任选IgGl、IgG2、IgG3或IgG4。在进一 步的实施方式中,抗体的产量为至少0.5、至少1、至少2、至少3、至少4或至少5克每升。在进 一步的实施方式中,哺乳动物糖蛋白是抗体,和抗体包含至少70%、至少80%、至少90%、至 少95%或至少98%的天然抗体C端和N端而无额外的氨基酸残基。在其他实施方式中,哺乳 动物糖蛋白是抗体,和抗体包含至少70%、至少80%、至少90%、至少95%或至少98%的不 缺乏任何C端或N端氨基酸残基的天然抗体C端和N端。
[0277]在其中哺乳动物糖蛋白(例如抗体)由细胞培养纯化的某些实施方式中,包含哺乳 动物糖蛋白的培养物包含质量百分比占所生产多肽质量的小于50%、小于40%、小于30%、 小于20%或小于10%的多肽片段。在某些优选的实施方式中,哺乳动物糖蛋白是抗体,和多 肽片段是重链片段和/或轻链片段。在其中哺乳动物糖蛋白是抗体且抗体由细胞培养纯化 的其他实施方式中,包含抗体的培养物包含质量百分比占所生产多肽质量的小于50%、小 于40 %、小于30 %、小于20 %或小于10 %的游离的重链和/或游离的轻链。测定多肽片段的 质量百分比的方法是本领域众所周知的且包括测量来自SDS-凝胶的信号强度。
[0278] 在其他的实施方式中,具有增加的N-糖基化占位的异源糖蛋白(例如抗体),例如 抗体,包含三甘露糖基N-聚糖结构Mana3[Mana6]Manb4GlcNAcb4GlcNAc。在一些实施方式 中,Mana3[Mana6]Manb4GlcNAcb4GlcNAc结构代表由本发明方法获得的异源糖蛋白(例如抗 体)组合物的总N-聚糖的至少20%、30%、40%、50%、60%、70%、80%(111〇1%)或更多。在其 他实施方式中,异源糖蛋白(例如抗体)包含GON-聚糖结构GlcNAcb2Mana3[GlcNAcb2Mana6] Manb4GlCNAcb4GlcNAC。在其他实施方式中,非岩藻糖基化的GO糖型结构代表由本发明方法 获得的异源糖蛋白(例如抗体)组合物的总N-聚糖至少20%、30%、40%、50%、60%、70%、 80%(mol%)或更多。在其他实施方式中,半乳糖基化的N-聚糖代表(mol%)小于培养物和/ 或具有增加的N-糖基化占位的异源糖蛋白的总N-聚糖的0.5%、0.1%、0.05%、0.01%。在 某些实施方式中,培养物或异源糖蛋白,例如抗体,不包含半乳糖基化的N-聚糖。
[0279] 在任何所公开方法的某些实施方式中,所述方法进一步包括提供一种或多种、两 种或多种、三种或多种、四种或多种或五种或多种蛋白酶抑制剂的步骤。在某些实施方式 中,蛋白酶抑制剂是与哺乳动物糖蛋白共表达的肽。在其他实施方式中,抑制剂抑制至少两 种、至少三种或至少四种选自天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、枯草杆菌蛋白酶 和谷氨酸蛋白酶的蛋白酶家族的蛋白酶。
[0280] 在任何所公开方法的某些实施方式中,丝状真菌细胞或木霉属真菌细胞还包含载 体蛋白。如本文所使用,"载体蛋白"是对于丝状真菌细胞或木霉属真菌细胞而言内源性且 通过丝状真菌细胞或木霉属真菌细胞高度分泌的蛋白质部分。适合的载体蛋白包括,但不 限于,里氏木霉甘露聚糖酶I (Man5A或MANI)、里氏木霉纤维二糖水解酶II (Cel6A或CBHII) (例如参见Paloheimo等Appl .Environ.Microbiol · 2003December;69(12):7073-7082)或里 氏木霉纤维二糖水解酶I (CBHI)。在一些实施方式中,载体蛋白是CBH1。在其他实施方式中, 载体蛋白是截短的里氏木霉CBH1蛋白质,其包含CBH1核心区和CBH1接头区的一部分。在一 些实施方式中,载体例如纤维二糖水解酶或其片段与抗体轻链和/或抗体重链融合。在一些 实施方式中,载体抗体融合多肽包含Kex2切割位点。在某些实施方式中,Kex2或其他载体切 割酶对于丝状真菌细胞而言是内源性的。在某些实施方式中,载体切割蛋白酶对于丝状真 菌细胞而言是异源的,例如,来源于酵母或TEV蛋白酶的另一种Kex2蛋白质。在某些实施方 式中,载体切割酶是过表达的。在某些实施方式中,载体由里氏木霉CBH1蛋白质(GenBank登 录号EGR44817.1)的N端部的约469到478个氨基酸组成。
[0281] 在一个实施方式中,编码异源糖蛋白(例如抗体)的多核苷酸进一步包含编码CBH1 催化结构域和作为载体蛋白的接头和/或CBH1启动子的多核苷酸。
[0282]在某些实施方式中,本发明丝状真菌细胞过表达KEX2蛋白酶。在一个实施方式中, 异源糖蛋白(例如抗体)作为融合构建体表达,所述融合构建体包含内源真菌多肽、蛋白酶 位点例如Kex2切割位点和异源蛋白质例如抗体重链和/或轻链。Kex2切割位点之前的有用 的2-7个氛基酸组合已描述于例如Mikosch等(1996) J.Biotechnol. 52:97-106 ;Goller等 (1998)Appl Environ Microbiol·64:3202-3208;Spencer等(1998)Eur·J·Biochem·258: 107_112;Jalving等(2000)Appl.Environ.Microbiol.66:363-368;Ward等(2004) Appl.Environ.Microbiol.70:2567-2576;Ahn^(2004)Appl.Microbiol.Biotechnol.64: 833-839;Paloheimo等(2007)Appl Environ Microbiol.73:3215-3224;Paloheimo等 (2003)Appl Environ Microbiol.69:7073-7082;和Margolles-Clark等(1996)Eur J Biochem. 237:553-560 中。
[0283] 本发明进一步涉及通过上述公开的方法可获得或获得的糖蛋白组合物,例如抗体 组合物。
[0284] 在其他具体的实施方式中,这种糖蛋白或抗体组合物进一步包含50%、60%、70 % 或80% (mole%中性N-聚糖)的以下糖型:
[0285] (i)Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(Man5糖型);
[0286] (i i )GlcNAcb2Mana3 [Mana6 (Mana3 )Mana6 ]Manb4GlcNAb4Gl cNAc 或其 b4_ 半乳糖基 化变体;
[0287] (iii)Mana6(Mana3)Manb4GlcNAb4GlcNAc;
[0288] (iv)Mana6(GlcNAcb2Mana3)Manb4GlcNAb4GlcNAc、或其4_ 半乳糖基化变体;或
[0289] (v)复合型N-聚糖,选自G0、G1或G2糖型。
[0290] 在一些实施方式中,根据iii-v的N-聚糖糖型包含小于15%、10%、7%、5%、3%、 1 %或0.5 %或不包含上述i)定义的Man5聚糖。
【具体实施方式】
[0291] 功能性分析
[0292] 用于测量本发明细胞总蛋白酶活性的分析
[0293]根据EnzChek蛋白酶分析试剂盒(分子探针#E6638,绿色荧光性干酪素底物)从lx-7x蛋白酶缺陷菌株(在PCT/EP2013/050126中描述)的第2-7天上清液样品测定蛋白质浓度。 简言之,将上清液在柠檬酸钠缓冲液中稀释至等于总蛋白浓度,并将等量稀释的上清液添 加至黑色96孔板,每个样品使用3次重复孔。将柠檬酸钠缓冲液中制备的酪蛋白FL稀释的储 液添加至各包含上清液的孔中,并将板于37°C在塑料袋中覆盖孵育。2、3和4小时后测量孔 的焚光。在Varioskan焚光板读数器上用485nm激发和530nm发射进行读数。一些蛋白酶活性 测量利用琥?白酰化的酪蛋白(QuantiCleave蛋白酶分析试剂盒,Pierce#23263)根据厂商规 定来进行。
[0294] 与野生型Ml24菌株相比,pep 1单个缺失降低蛋白酶活性1.7倍,pepΙ/tspl双缺失 降低蛋白酶活性2倍,pepl/tspl/slpl三缺失降低蛋白酶活性3 · 2倍,pepl/tspl/slpl/gapl 四缺失降低蛋白酶活性7.8倍,pepl/tspl/slpl/gapl/gap2五倍缺失降低蛋白酶活性10倍, pepl/tspl/slpl/gapl/gap2/pep4六倍缺失低蛋白酶活性15.9倍,和pepl/tspl/slpl/ 区&口1/^3口2/^6口4/^6口3七倍缺失降低蛋白酶活性18.2倍。
[0295] 图5图解描述了来自各个蛋白酶缺失上清液(1倍到7倍缺失突变体)和无蛋白酶缺 失的亲本菌株的培养上清液的标准化蛋白酶活性数据。最初5个菌株的蛋白酶活性在pH5.5 下测量,最后三个缺失菌株的蛋白酶活性在PH4.5下测量。蛋白酶活性对抗绿色荧光酪蛋 白。六倍蛋白酶缺失菌株仅具有野生型亲本菌株的6%和七倍蛋白酶缺失菌株蛋白酶活性 比六倍蛋白酶删除菌株活性小约40%。
[0296] 用于测量糖蛋白组合物中N-糖基化占位的分析
[0297] 用 13.4-30U 的 FabRICATOR(Genovis)消化 10-30yg 抗体,+37°C,60 分钟-过夜,每个 抗体分子产生一个F(ab')2片段和一个Fc片段。用Poros R1滤板(Glyken公司)纯化经消化 的样品,并用MALDI-TOF MS分析Fc片段的N-聚糖占位。Fc的占位百分比是两个值的平均:一 个值由峰强度(单电荷和双电荷)获得,另一个值由峰面积(单电荷和双电荷)获得;两个值 均计算为糖基化信号除以非糖基化和糖基化信号之和。
[0298] 实施例1:表达硕大利什曼原虫STT3的里氏木霉的制备
[0299] 将硕大利什曼原虫寡糖基转移酶4D(旧的GenBank号XP_843223.1,新的XP_ 003722509.1;SEQ ID NO: 1)编码序列密码子优化用于里氏木霉表达(密码子优化的核酸序 列SEQ ID N0:2)。将优化的编码序列与cDNAl启动子(SEQ ID N0:3)和TrpC终止子侧翼序列 (SEQ ID N0:4) -起合成。用PacI限制性内切酶消化从优化的克隆载体切除硕大利什曼原 虫STT3基因。表达进入载体也用PacI消化并用牛碱性磷酸酶去磷酸化。用琼脂糖凝胶电泳 分离STT3基因和消化的载体,并用凝胶提取试剂盒(Qiagen)根据制造商的规定从凝胶分离 正确的片段。用T4DNA连接酶将纯化的硕大利什曼原虫STT3基因连接到表达载体。将连接反 应转化至化学感受态的DH5a大肠杆菌并在氨苄青霉素(lOOμg/ml)选择板上生长。从若干菌 落制备小量质粒制剂。硕大利什曼原虫STT3基因插入的存在通过用PacI消化制备的质粒来 检查,并测序若干阳性克隆以验证基因定向。将一个正确定向的克隆选择为最终的载体 pTTv201〇
[0300] 表达盒包含来自里氏木霉的组成型cDNA 1启动子以驱动硕大利什曼原虫STT3的表 达。所述盒包含的终止子序列是来自黑曲霉的TrpC终止子。用基因5'和3'侧翼的木聚糖酶1 序列(SEQ ID N0:5和SEQ ID N0:6)将表达盒靶向至木聚糖酶1基因座(xynl,tre74223)。将 这些序列包括入所述盒以允许所述盒经由同源重组整合入xynl基因座。所述盒包含用于选 择的pyr4环出序列标记。pyr4基因编码里氏木霉的乳清酸苷核-δ'-单磷酸盐(0ΜΡ)脱羧酶 (Smith,J.L.等,1991,Current Genetics 19:27-33)且是尿啼啶核苷合成所需的。不补充 尿嘧啶核苷的情况下,0ΜΡ脱羧酶活性缺陷的菌株不能在基本培养基上生长(即,是尿嘧啶 核苷营养缺陷体)。
[0301] 为制备用于转化的载体,用Pmel切开载体以释放表达盒(图1)。用琼脂糖凝胶电泳 分离消化物,并用凝胶提取试剂盒(Qiagen)根据制造商的规定从凝胶分离正确的片段。然 后将纯化的表达盒DNA(5yg)转化至里氏木霉菌株M317的原生质体(M317已描述于国际专利 申请号PCT/EP2013/050126中;M317是M304的pyr4-且它包含与里氏木霉截短的CBH1载体融 合的具有NVISKR Kex2切割序列的MAB01轻链、与里氏木霉截短的CBH1载体融合的具有ΑΧΕΙ [DGETVVKR]Kex2切割序列的ΜΑΒ01重链、Δ pepl Δ tspl Δ slpl和里氏木霉Kex2的过表达)。 原生质体的制备和转化根据用于pyr4选择的Penttili等(1987,Gene 61:155-164)和 Gruber et al(1990,Curr.Genet· 18:71-76)的方法进行。将转化的原生质体在木霉基本培 养基(TrMM)板上涂板。
[0302] 然后用0.1%TritonX-100将转化体在TrMM板上划线。转化体快速生长,选择性的 划线用表1所列的引物通过PCR筛选。纯化来自菌丝体的DNA并通过PCR分析以观察所述盒的 5'和3'侧翼的整合和木聚糖酶10RF的存在。将所述盒靶向至木聚糖酶1基因座;因此开放阅 读框在阳性整合的转化体中不存在。为筛选5'整合,将5'整合侧翼外部的序列用于生成扩 增xynl侧翼的基因组DNA的正向引物,反向引物由所述盒的cDNA启动子中的序列组成。为检 查3'侧翼中所述盒的正确整合,正向引物由扩增xynl侧翼的基因组DNA的3'整合侧翼外部 的序列组成,反向引物由pyr4标记中的序列组成。因此,一条引物将扩增来自所述盒外部的 基因组DNA的序列和另一条引物将扩增来自所述盒中DNA的序列。引物序列列于表1中。显示 正确整合和缺失xynlorf的四种最后的菌株称为M420-M423。
[0303]将四种生产STT3的菌株(M420-M423)进行摇瓶培养以评价生长特征并提供用于糖 基化占位分析的样品。摇瓶培养在TrMM、40g/1乳糖、20g/1麦糟提取物、9g/1酪蛋白氨基酸、 100mM PIPPS、pH 5.5下进行。当与亲本菌株1304相比时,硕大利什曼原虫3^3的表达对生 长没有负面影响(表2和3)。表达STT3的转化体的细胞干重似乎略高于亲本菌株M304。
[0304] 表1:用于PCR筛选STT3转化体的引物列表
[0305]
[0306]表2:来自大摇瓶培养物的细胞干重 [0307]
[0308]~表3:来自大摇瓶培养物的pH值
' ' '
[0309]
[0310]占位分析
[0311]在摇瓶中培养四种转化体[pTTv201;17A-a(M420),26B-a(M421),65B-a(M422)和 97A-a(M423)]及其亲本菌株(M317),并在时间点第5天和第7天收集样品。用G蛋白HP MultiTrap 96孔板(GE Healthcare)根据制造商的说明书从培养物上清液纯化ΜΑΒ01抗体。 用pH2.6的0.1M柠檬酸盐缓冲液洗脱抗体,并用pH9的2M Tris中和。经由分光光度计的UV吸 光度根据MAB01标准曲线测定浓度。用13.4U的FabRICATOR(Genovis)消化10yg抗体,+37°C, 60分钟,产生一个F (ab')2片段和一个Fc片段。用Poros R1滤板(Glyken公司)纯化经消化的 样品,并用MALDI-TOF MS分析Fc片段的N-聚糖占位(图2)。
[0312] 来自硕大利什曼原虫的STT3的过表达与亲本菌株相比增强了位点覆盖。将最佳克 隆各自在三个平行摇瓶中再培养,分析结果与第一个分析相当。与亲本菌株相比,信号Fc和 Fc+K在STT3克隆中几乎不存在。
[0313] 亲本菌株和来自硕大利什曼原虫的STT3的所有克隆之间的占位差异是明显的(图 2)。因为来自Fc或Fc+K的信号几乎不存在,这些摇瓶培养物中MAB01的N-聚糖占位是100 % (表4) 〇
[0314] 表4:亲本菌株M317和来自硕大利什曼原虫的STT3的四种转化体的占位分析。由来 自三个平行样品的单电荷和双电荷信号的面积和强度计算平均值。
[0315]
[0316]发酵罐培养
[0317] 在发酵罐中培养三个STT3(硕大利什曼原虫)克隆(M420、M421和M422)以及亲本菌 株M304。在时间点第3、4、5、6和7天收集样品并进行纯化抗体的占位分析。将STT3过表达菌 株和各自的对照菌株(M304)在包含2 %酵母提取物、4%纤维素、4%纤维二糖、2 %山梨糖、 5g/L KH2P04和5g/L(NH4)2S04的培养基中分批生长发酵7天。培养pH控制在ρΗ5·5(用NH30H 调节)。处理时间48小时后将温度从28°C变为22°C。在4个平行的2L玻璃容器反应器中进行 发酵,其中培养体积为1L。在运转期间取出培养上清液样品并储存在-20°C。将ΜΑΒ01抗体纯 化,并如上所述用FabRICATOR消化。抗体滴度显示于表5。
[0318] 结果
[0319] 亲本菌株M304中的占位小于60%,但在所有分析的STT3克隆中,占位增加到98% (表6)。
[0320] 表5:LmSTT3菌株M420、M421和M422和其亲本菌株M304的MAB01抗体滴度
[0321]
[0322] 表6:LmSTT3菌株M420、M421和M422和其亲本菌株M304的MAB01抗体的N-糖基化占 位
[0323]
[0324]总之,摇瓶或发酵培养条件下,来自硕大利什曼原虫的STT33D基因的过表达将N-糖基化占位从亲本菌株中的46 %-87 %增加到具有利什曼原虫STT3的转化体的98 %-100%〇
[0325]来自硕大利什曼原虫的STT33D基因的过表达明显增加了将抗体作为异源蛋白质 生产的菌株中的N-糖基化占位。具有STT3的转化体和亲本菌株之间的抗体滴度没有明显变 化。
[0326]实施例2:表达来自阴道毛滴虫(T. vaginalis)、婴儿利什曼原虫或溶组织内阿米 巴(E. histolytica)的里氏木霉菌株的制备
[0327] 将阴道毛滴虫、婴儿利什曼原虫和溶组织内阿米巴寡糖基转移酶的编码序列 (STT3;氨基酸序列阴道毛滴虫SEQIDN0:7;婴儿利什曼原虫SEQIDN0 :8和溶组织内阿米 巴SEQ ID N0:10)密码子优化用于里氏木霉表达(密码子优化的婴儿利什曼原虫核酸序列 SEQIDN0:9)。将优化的编码序列与里氏木霉Cbhl终止子侧翼序列(SEQIDN0 :ll)-起合 成。如W02012/069593所述,通过酵母同源重组克隆具有cbhl终止子、pyr4环出序列标记和 alg3侧翼区(SEQIDN0:12和SEQIDN0:13)的在组成型cDNAl启动子下的包含STT3基因的 质粒。质粒pTTv38的Notl片段用作载体主链。该载体包含基因的alg3(trel04121)5'和3'侧 翼以允许表达盒在里氏木霉中经由同源重组整合入alg3基因座,且质粒描述于W02012/ 069593。
[0328] 用S f i I限制性内切酶消化从克隆载体切除S T T 3基因。分别用质粒p T T v 16 3和 pTTvl66作为模板通过PCR生成cdnal启动子和cbhl终止子片段。通过Notl消化从质粒 pTTvl42提取pyr4环出序列标记(具有与里氏木霉MNT1/KRE2靶向肽融合的人GNT2催化结构 域的质粒pTTvl42描述于W02012/069593中)jyM基因编码里氏木霉的乳清酸苷核-5'-单 磷酸盐(0ΜΡ)脱羧酶(Smith,J.L.等,1991,Current Genetics 19:27-33)且是尿嘧啶核苷 合成所需的。不补充尿嘧啶核苷的情况下,0ΜΡ脱羧酶活性缺乏的菌株不能在基本培养基上 生长(即,是尿嘧啶核苷营养缺陷体)。用于克隆的引物列于表7。用琼脂糖凝胶电泳分离PCR 产物的消化片段,并用凝胶提取试剂盒(Qiagen)根据制造商的规定从凝胶分离正确的片 段。用酵母同源重组方法、利用W02012/069593所述的重叠寡核苷酸以重组pyr4标记和alg3 3'侧翼之间的缺口来构建质粒。从酵母取出质粒DNA并将其转化至电子感受态的T0P10大肠 杆菌,其在氨苄青霉素(l〇〇μg/ml)选择板上生长。从若干菌落制备小量质粒制剂。阴道毛滴 虫和婴儿利什曼原虫STT3基因的存在通过用Bglll-Kpnl消化制备的质粒来证实,而溶组织 内阿米巴质粒用Hindlll-Kpnl消化。测序阳性克隆以验证质粒序列。选择一个正确的阴道 毛滴虫克隆作为最终载体pTTv321,并分别选择婴儿利什曼虫和溶组织内阿米巴的正确克 隆作为PTIV322和PTIV323载体。用于测序载体的引物列于表8。
[0329] 表7:用于克隆载体pTTv321、pTTv322和pTTv323的引物列表
[0330]
[0331]
[0332] 表8:用于测序载体pTTv321、pTTv322和pTTv323的引物列表
[0333]
[0334]
[0335] 为制备用于转化的载体,用Pmel切开载体以释放表达盒(图3)。用琼脂糖凝胶电泳 分离片段,并用凝胶提取试剂盒(Qiagen)根据制造商的规定从凝胶分离正确的片段。然后 将纯化的表达盒DNA转化至里氏木霉菌株M317的原生质体。原生质体的制备和转化基本上 根据用于pyr4选择的 PenttHi彳等(1987,Gene 61:155-164)和Gruber et al( 1990, Curr.Genet. 18:71-76)的方法进行。将转化的原生质体在包含山梨醇的木霉属基本培养基 (TrMM)板上涂板。
[0336] 然后用0.1 %TritonX-100将转化体在TrMM板上划线。转化体快速生长,因为选择 性的划线用表9所列的引物通过PCR筛选。纯化来自菌丝体的DNA并通过PCR分析以观察所述 盒的5'和3'侧翼的整合和alg30RF的存在。将所述盒靶向至alg3基因座;因此开放阅读框在 阳性整合的转化体中不存在,并纯化为单细胞克隆。为筛选5'整合,将5'整合侧翼外部的序 列用于生成扩增alg3侧翼的基因组DNA的正向引物,反向引物由所述盒的cDNA启动子中的 序列组成。为检查3'侧翼中所述盒的正确横河,正向引物由扩增alg3侧翼的基因组DNA的3' 整合侧翼外部的序列组成和反向引物由pyr4标记中的序列组成。因此,一条引物将扩增来 自所述盒外部的基因组DNA的序列,另一条引物将扩增来自所述盒中DNA的序列。
[0337] 表9:用于PCR筛选里氏木霉转化体的引物列表
[0338]
[0339]
[0340] 在大摇瓶中在补充有40g/l乳糖、20g/l麦糟提取物、9g/l酪蛋白氨基酸和lOOmM PIPPS、pH 5.5的TrMM培养基中各自生长具有正确整合和alg30RF缺失的四种最终菌株。 pTTv321和pTTv323菌株的生长比亲本菌株M304略慢(表10)。四个婴儿利什曼原虫pTTv322 克隆中的三个的生长略好于亲本菌株。
[0341] 表10:亲本菌株M304和表达STT3的菌株的细胞干重测量(g/L)
[0342]
[0343] 占位和聚糖分析
[0344] 用G蛋白HP MultiTrap 96孔板(GE Healthcare)根据制造商的说明书从第5天上 清液样品纯化MAB01。装载约1.4ml培养物上清液,且洗脱体积是230μ1。经由UV吸光度根据 ΜΑΒ01标准曲线测定抗体浓度。
[0345] 对于占位分析,取出16_20yg纯化的ΜΑΒ01抗体,并如实施例1所述将抗体消化、纯 化和分析。婴儿利什曼原虫STT3克隆60-6、60-12和60-14获得100%占位(表11)。阴道毛滴 虫和溶组织内阿米巴STT3转化体中,占位较低,且在后者中,抗体似乎被降解,导致一个菌 株不能分析占位。
[0346] 表11:第5天来自STT3变体和亲本M304的抗体的N-糖基化占位
[0347]
[0348] 这些结果显示婴儿利什曼原虫催化亚基的过表达能够将丝状真菌细胞中的N-糖 基化占位增加至100%。
[0349] 相反,来自阴道毛滴虫或溶组织内阿米巴的STT3基因不导致高的N-糖基化占位。 [0350]分析三个婴儿利什曼原虫STT3克隆的N-聚糖。如实施例所述,用20yg的MAB01进行 PNGase F反应,并用MALDI-TOF MS分析释放的N-聚糖。三个菌株产生约25%的与MAB01相连 的Man3N-聚糖,而Hex6糖型代表约60%的与MAB01相连的N-聚糖(表12)。
[0351] 表12:第5天来自婴儿利什曼原虫STT3克隆的MAB01的中性N-聚糖和占位分析
[0352]
[0353] 这表明Man3、G0、Gl和/或G2糖型代表过表达婴儿利什曼原虫STT3的3种不同克隆 中MAB01的总中性N-聚糖的至少25%。图4显示Aalg3菌株中生产的Man3、Man4、Man5和Hex6 的聚糖结构。"Fc"是指Fc片段(无任何N-聚糖)和"Fc+Gn"是指具有相连的N-乙酰葡糖胺的 Fc片段(可能的Endo Τ'酶活性可以切割Fc的N-聚糖,产生Fc+Gn)。
[0354] 实施例3:表达MAB01菌株的Aalg3菌株的制备
[0355] 将pTTv38alg3缺失质粒的乙酰胺标记变为pyr4标记。用Notl消化pTTv38和 PTIV142载体并用琼脂糖凝胶电泳分离片段。用凝胶提取试剂盒(Qiagen)根据制造商的规 定从凝胶分离正确的片段。用T4DNA连接酶将来自pTTvl42的纯化的pyr4环出序列标记连接 到pTTv38质粒中。将连接反应转化至电子感受态的T0P10大肠杆菌,并在氨苄青霉素 (100μ g/ml)选择板上生长。从若干菌落制备小量质粒制剂。标记的定向通过用表13所列引物测序 克隆来证实。选择具有反向标记的克隆作为最后的载体PTIV324。
[0356] 表13:用于测序载体pTTv324的引物列表
[0357]
[0358] 如国际专利申请号PCT/EP2013/050126所述,通过5-F0A选择将pyr4标记环出来制 备表达硕大利什曼原虫STT3的菌株M420的pyr 4-菌株。一个pyr4-菌株命名为M602。
[0359] 为制备用于转化的载体,用Pmel切开载体以释放缺失盒。用琼脂糖凝胶电泳分离 片段,并用凝胶提取试剂盒(Qiagen)根据制造商的规定从凝胶分离正确的片段。然后将纯 化的缺失盒DNA转化至里氏木霉菌株M317和M60 2的原生质体。原生质体的制备、转化和原生 质体涂板如上述进行。
[0360] 然后用0.1 %TritonX-100将转化体在TrMM板上划线。转化体快速生长,因为选择 性的划线用表14所列的引物通过PCR筛选。纯化来自菌丝体的DNA并通过PCR分析以观察所 述盒的5'和3'侧翼的整合和alg30RF的存在。将所述盒靶向至alg3基因座;因此开放阅读框 在阳性整合的转化体中不存在,并纯化为单细胞克隆。为筛选5'整合,将5'整合侧翼外部的 序列用于生成扩增a 1 g3侧翼的基因组DNA的正向引物,反向引物由所述盒的pyr4标记中的 序列组成。为检查3'侧翼中所述盒的正确整合,反向引物由扩增alg3侧翼的基因组DNA的3' 整合侧翼外部的序列组成,正向引物由pyr4标记中的序列组成。因此,一条引物将扩增来自 所述盒外部的基因组DNA的序列和另一条引物将扩增来自所述盒中DNA的序列。
[0361] 表14:用于PCR筛选里氏木霉转化体的引物列表
[0362]
[0363] 在大摇瓶中在补充有40g/l乳糖、20g/l麦糟提取物、9g/l酪蛋白氨基酸和lOOmM PIPPS、pH 5.5的TrMM培养基中生长具有正确整合和alg30RF缺失的两个M602菌株和七个 M317菌株(表15)。将M317菌株19.13和19.20分别命名为1697和]?698号,将1602菌株1.22和 11.18分别命名为M699和M700号。
[0364] 表15:亲本菌株M304和表达STT3的菌株M420和alg3缺失转化体的细胞干重测量 (g/1)
[0365] LUJGG」 和莱榍甘仉
[0367] 在摇瓶中在4%乳糖、2%麦糟提取物、0.9%酪蛋白氨基酸、lOOmM PIPPS、pH 5.5 的TrMM中培养来自alg3缺失菌株中过表达硕大利什曼原虫STT3的两个转化体[pTTv324; 1 ·22(Μ699)和11 ·18(Μ700)]和alg3缺失的七个转化体[M317,pyr4-0f M304;克隆 19.1、 19.5、19.6、19.13(]\1697)、19.20(]\1698)、19.43和19.44]和其亲本菌株]\1420和]\004。如实施 例1所述,从第5天从培养物上清液纯化并分析MAB01抗体,除了用80.4U的FabRICATOR (Genovis)、+37°C,过夜消化30yg抗体以生产F(ab')2和Fc片段。
[0368] 在具有alg3缺失和LmSTT3过表达的两个克隆中,占位是100% (表16)。无 LmSTT3的 情况下,alg3缺失克隆中位点覆盖为56-71%。与1304相比,亲本菌株1420中也显示增加的 占位,两者均具有野生型糖基化。
[0369] 表16:摇瓶样品的占位。M317克隆19.5和19.6中的分析失败。
[0370]
[0371] ~对于N-聚糖分析,如上所述,从第7天的培养物上清液纯化MAB01,且在+37°C的过_ 夜反应中利用pH7.3、20mM磷酸钠缓冲液中的PNGase F(Prozyme)将N-聚糖从EtOH沉淀的和 SDS变性的抗体中释放。用Hypersep C18和Hypersep Hypercarb(Thermo Scientific)纯化 释放的N-聚糖并用MALDI-TOF MS分析。
[0372] Man3水平为21-49%,而M602和M317克隆中的主要糖型是Hex6(表17)。表达野生型 糖基化(M304)和LmSTT3(M420)的菌株中Man5水平为约73%。
[0373] 表17:来自M602和M317克隆和亲本菌株M420和M304的纯化抗体中中性N-聚糖的相 对比例
[0374]
[0375] 发酵和占位
[0376] 在2%YE、4%纤维素、8%纤维二糖、4%山梨糖中发酵硕大利什曼原虫STT3alg3缺 失菌株]\1699化1'1>324 ;克隆1.22)和3183缺失菌株]\1698[]\〇17,]\〇04的口714-;克隆19.20]及 其亲本菌株M304。在第3、4、5和6天收获样品。如实施例1所述,从第5天从培养物上清液纯化 并分析MAB01抗体,除了用80.4U的FabRICATOR(Genovis)、+37°C,过夜消化30yg抗体以生产 F(ab')2 和 Fc 片段。
[0377] 结果
[0378] 所有时间点中菌株M699占位为大于90% (表18).无 LmSTT3的情况下,菌株M698中 的位点覆盖为29-37%。亲本菌株M304中,位点覆盖为45-57%。在第6天,M699和M698的 MAB01滴度分别为1.2和1.3g/L,亲本菌株M304中为1.8g/L。
[0379] 表18:发酵菌株M699和M698和亲本菌株M304的MAB01抗体滴度和占位分析结果
[0380]
[0381] 总之,利什曼原虫STT3的催化亚基的过表达能够将Aalg3丝状真菌细胞中N-糖基 化占位增加至91.5-100%。
[0382] 下表19概括了用于实施例的不同菌株:
[0383]
[0384]
【主权项】
1.丝状真菌细胞,包含:1. 一种或多种突变,其较之不具有所述突变的亲本丝状真菌细胞降低或消除一种或多 种内源蛋白酶活性, i i.编码寡糖基转移酶的异源催化亚基的多核苷酸,和 iii.编码异源糖蛋白的多核苷酸, 其中所述寡糖基转移酶的催化亚基选自利什曼原虫寡糖基转移酶催化亚基。2. 权利要求1所述的丝状真菌细胞,其中所述丝状真菌细胞是木霉属、链孢霉属、毁丝 霉属、金孢霉属、曲霉属或镰刀霉属细胞。3. 前述权利要求任一项的真菌细胞,其中所述编码寡糖转移酶的异源催化亚基的多核 苷酸包含选自以下的核酸:SEQIDN0:2、SEQIDN0:9、SEQIDN0:88和SEQIDN0:90,或 编码与SEQIDN0:1、SEQIDN0:8、SEQIDN0:89或SEQIDN0:91 具有至少50%、至少 60%、至少70%同一性、至少80%同一性、至少90%同一性、或至少95%同一性的功能性变 体多肽的多核苷酸,所述功能性变体多肽具有寡糖基转移酶活性。4. 前述权利要求任一项的丝状真菌细胞,其中所述异源糖蛋白的N-糖基化占位为至少 95%,且1&1113、1&1115、60、61和/或62糖型代表异源糖蛋白的总中性1聚糖的至少50%。5. 前述权利要求任一项的丝状真菌细胞,其中所述细胞是木霉属细胞,例如里氏木霉 (Trichodermareesei),且所述细胞包含降低或消除以下酶活性的突变: -三个内源蛋白酶pepl、tspl和slpl; -三个内源蛋白酶gapl、slpl和pepl; -三个内源蛋白酶,选自pepl、pep2、pep3、pep4、pep5、pep8、pep9、pepll、pepl2、tspl、slpl、slp2、slp3、slp7、gapl^Pgap2; -三到六个蛋白酶,选自pepl、pep2、pep3、pep4、pep5、tspl、slpl、slp2、slp3、gap]^PI gap2; h到十个蛋白酶,选自pepl、pep2、pep3、pep4、pep5、pep7、pep8、pep9、tspl、slpl、slp2、slp3、slp5、slp6、slp7、slp8、tppl、gapl和gap2〇6. 前述权利要求任一项的丝状真菌细胞,其中所述真菌细胞在编码ALG3的基因中进一 步包含突变,所述突变与不具有这种突变的亲本细胞中的ALG3基因的表达水平相比降低或 消除相应的ALG3表达。7. 前述权利要求任一项的丝状真菌细胞,进一步包含编码N-乙酰葡糖胺基转移酶I催 化结构域和N-乙酰葡糖胺基转移酶II催化结构域的多核苷酸。8. 前述权利要求任一项的丝状真菌细胞,进一步包含一种或多种编码选自以下的多肽 的多核苷酸: i.a-l,2甘露糖苷酶; ii .N-乙酰葡糖胺基转移酶I催化结构域; iii.a-甘露糖苷酶II; iv.N-乙酰葡糖胺基转移酶II催化结构域; ν.β?,4半乳糖基转移酶;和 vi.岩藻糖基转移酶。9. 生产具有增加的N-糖基化占位的异源糖蛋白或抗体组合物的方法,包括: a) 提供具有编码寡糖基转移酶催化亚基的利什曼原虫STT3D基因或其功能性变体和编 码异源糖蛋白的多核苷酸的丝状真菌宿主细胞,例如木霉属细胞, b) 在适当的条件下培养宿主细胞,以表达STT3D基因或其功能性变体,生产异源糖蛋白 组合物; c) 回收和任选纯化异源糖蛋白组合物。10. 权利要求9所述的方法,其中所述丝状真菌宿主细胞包含一种或多种与不具有所述 突变的亲本丝状真菌细胞相比降低或消除一种或多种内源蛋白酶活性的突变。11. 权利要求9-10任一项所述的方法,其中所述丝状真菌宿主细胞是权利要求1-8任一 项所定义的细胞。12. 权利要求9-11任一项所述的方法,其中所述编码寡糖基转移酶的催化亚基的利什 曼原虫STT3D基因包含选自以下的核酸序列:SEQIDNO:2、SEQIDNO:9、SEQIDNO:88和 SEQIDN0:90,或编码与SEQIDNO:l、SEQIDNO:8、SEQIDNO:89或SEQIDNO:91 具有至 少50%、至少60%、至少70%同一性、至少80%同一性、至少90%同一性、或至少95%同一性 的功能性变体多肽的多核苷酸,所述功能性变体多肽具有寡糖基转移酶活性。13. 权利要求9-12任一项所述的方法,其中所生产的糖蛋白组合物的N-糖基化占位为 至少80 %。14. 可通过权利要求9-13任一项所述的方法获得的糖蛋白或抗体组合物。15. 权利要求14所述的糖蛋白或抗体组合物,其中所述抗体组合物进一步包含以下作 为主要糖型: i .Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(Man5糖型); ii ·GlcNAcb2Mana3[Mana6(Mana3)Mana6]Manb4GlcNAb4GlcNAc(GlcNAcMan5糖型); iii .Mana6(Mana3)Manb4GlcNAb4GlcNAc(Man3糖型); iv .Mana6(GlcNAcb2Mana3)Manb4GlcNAb4GlcNAc(GlcNAcMan3糖型);或 v.复合型N-聚糖,选自GO、G1或G2糖型。
【专利摘要】本公开涉及用于在丝状真菌细胞例如木霉属细胞中生产具有增加的N-糖基化占位的异源蛋白质的组合物和方法。更具体地,本发明提供丝状真菌细胞,包含:i.一种或多种突变,其较之不具有所述突变的亲本丝状真菌细胞降低或消除一种或多种内源蛋白酶活性,ii.编码寡糖基转移酶的异源催化亚基的多核苷酸,和iii.编码异源糖蛋白的多核苷酸,其中所述寡糖基转移酶的催化亚基选自利什曼原虫寡糖基转移酶催化亚基。
【IPC分类】C12N9/10, C12P21/00
【公开号】CN105492620
【申请号】CN201480039008
【发明人】J·纳蒂南, C·兰道斯基, M·萨洛埃莫, C·奥斯特梅尔, B·P·索默, R·瓦尔
【申请人】诺华股份有限公司, 格利科斯芬兰公司
【公开日】2016年4月13日
【申请日】2014年7月10日
【公告号】CA2916899A1, EP3019621A1, US20160153019, WO2015004239A1

最新回复(0)