改良的酰基转移酶多核苷酸、多肽、及其使用方法

xiaoxiao2020-10-23  18

改良的酰基转移酶多核苷酸、多肽、及其使用方法
【技术领域】
[0001] 本发明涉及操纵细胞脂质产生和/或细胞脂质组成的组合物和方法。
【背景技术】
[0002] 植物油不仅能广泛用于食品工业以及作为饲料成分的一部分,还广泛地用作生物 燃料或用于各种保健食品和工业产品的制备中,因此,植物油是一种经济上重要的产品。在 植物自身内部,油是对于进行生长发育(特别是在种子萌发和早期植物生长阶段)至关重 要的一系列新陈代谢所必需的。考虑到其价值,生物技术领域对提高植物油产生并使其供 应更加可持续的研宄兴趣愈加增长。
[0003] 植物油的主要成分为三酰甘油(TAG)。其为油料种子中储存脂质的主要形式以及 种子萌发和幼苗发育所需能量的主要来源。通过Kennedy途径的TAG生物合成包括从前体 sn-甘油-3-磷酸(G3P)开始的连续酰基化步骤。首先,G3P在由3-磷酸甘油酰基转移酶 (GPAT,EC2. 3. 1. 15)催化的反应中被乙酰CoA酯化形成溶血磷脂酸(LPA)。然后由溶血磷 脂酸酰基转移酶(LPAT;EC2. 3. 1. 51)催化第二酰基化步骤形成磷脂酸(PA),其为甘油脂 生物合成的关键中间体。然后PA由磷脂酸磷酸酶(PAP;EC3. 1. 3. 4)脱磷酸化释放TAG的 中间前体sn-l,2-二酰基甘油(DAG)。最后DAG的sn-3位被二酰基甘油酰基转移酶(DGAT: EC2. 3. 1. 20)酰基化形成TAG。
[0004] 由于最后的催化作用是TAG生物合成中唯一的特有步骤,DGAT被称为指定用于三 酰甘油形成的酶。由于DAG位于TAG和膜磷脂生物合成之间的分支点,DGAT可能在调节甘 油脂合成途径中TAG的形成起到了决定性作用(Lung和Weselake, 2006,Lipids.Dec2006; 41 (12): 1073-88)。DGAT蛋白有两个不同家族。DGAT蛋白的第一家族("DGAT1")与乙酰 辅酶A:胆固醇酰基转移酶("ACAT")有关,并且在美国申请Nos. 6, 100, 077和6, 344, 548 中有所描述。DGAT蛋白的第二家族("DGAT2")与DGAT1无关,并且在2004年2月5日公 开的PCT专利公开W0 2004/011671中有描述。DGAT基因及其在植物中的用途的其他参考 文献包括PCT公开No.W02004/011, 671、W01998/055, 631 和W02000/001, 713,以及US专利 公开No. 20030115632。
[0005]DGAT1通常是种子和衰老叶片中主要的TAG合成酶(Kaup等,2002,Plant Physiol. 129(4) : 1616-26 ;综述参见Lung和Weselake2006,Lipids. ;41 (12) : 1073-88 ; Cahoon等,2007,CurrentOpinioninPlantBiology. 10:236-244 ;以及Li等, 2010,Lipids. 45:145-157)。
[0006] 几十年来,提高油料作物(油菜、向日葵、红花、大豆、玉米、棉花、亚麻子、亚麻等) 的产量已经成为农业产业的主要目标。人们已经尝试了许多方法(包括传统育种和突变育 种以及遗传工程),通常收效甚微(Xu等,2008,PlantBiotechnolJ. ,6:799-818及其参考 文献)。
[0007] 尽管液态型生物燃料提供了很大的前景,但是利用生物原料的现实受到竞争用 途和可用量的限制。因此,对植物和微生物进行基因改造以克服上述缺陷成为众多研宄 小组的重点;特别是三酰甘油(TAG)在植物组织、产油酵母和细菌中的积聚(Fortman等, 2008,TrendsBiotechnol26,375-381;0hlrogge等,2009,Science324,1019_1020)〇 TAG是纤维素能量密度的两倍的中性脂质并且能用于生产生物柴油。所述生物柴油是一 种具有最简单和最有效的制备工艺中的一者的高能量密度的理想生物燃料。目前已经通 过各种策略改造叶子中TAG的积聚使得其积聚量比野生型提高5-20倍,这些策略包括: 过表达种子发育转录基因(LEC1、LEC2和WRI1) ;APS沉默(涉及淀粉生物合成的关键基 因);CGI-58突变(中性脂质积聚的调节子);以及在植物也在酵母中上调TAG合成酶 DGAT(二酰基甘油-0-酰基转移酶,EC2. 3. 1. 20)(Andrianov等,2009,PlantBiotechJ 8, 1-11;Mu等,2008,PlantPhysiol148, 1042-1054;Sanjaya等,2011,PlantBiotechJ 9,874-883;Santos_Mendoza等,2008,PlantJ54,608-620;James等,2010,ProcNatl AcadSciUSA107, 17833 - 17838;Beopoulos等,2011,ApplMicrobiolBiotechnol 90, 1193-1206 ;Bouvier_Nav6 等,2000,EurJBiochem267,85-96;Durrett等,2008,Plant J54,593-607)。然而,人们普遍认为要进一步提高TAG,抑制其在非产油组织以及一系 列发育阶段中的分解代谢可能是至关重要的(Yang和Ohlrogge, 2009,PlantPhysiol 150, 1981 - 1989)。
[0008] 在真核生物中上调三酰甘油(TAG)的产量和品质是很难实现的。在Kennedy途径 的酶中,二酰基甘油-0-酰基转務酶0GAT)的比活性最低,并且它被认为是TAG合成中的 "瓶颈"。
[0009] 人们已经试图通过生物技术方法提高DGAT1,但收效甚微。例如Nykiforuk 等(2002,BiochimicaetBiophysicaActa1580:95-109)报导 了甘蓝型油菜 (Brassicanapus)DGATl的N端截短体,但是报导了大约50 %的低活性。McFie等 (2010,JBC.,285:37377-37387)报导了小鼠DGAT1的N端截断导致酶的比活性升高,但是也 报导了蛋白积聚水平大幅度降低。
[0010]近来,Xu等(2008,PlantBiotechnologyJournal, 6:799-818)在旱金 莲(Tropaeolummajus)(园艺旱金莲)DGAT1 (TmDGATl)序列内鉴别出共有序列 (X-Leu-X-Lys-X-X-Ser-X-X-X-Val),作为SNF1 相关蛋白激酶-1 (SnRKl)的成员特有 的革巴向基序,其中Ser为用于磷酸化的残基。SnRKl蛋白为一类Ser/Thr蛋白激酶,其 已经日益参与到植物的碳代谢的全面调节中,例如通过磷酸化作用使磷酸蔗糖合酶灭 活(Halford&Hardie1998,PlantMolBiol. 37:735-48?综述)。Xu等(2008,Plant BiotechnologyJournal, 6:799-818)在TmDGATl酶的六个推定的功能区/基序进行了 定向位点突变。在推定的SnRKl靶点的丝氨酸残基(S197)的突变使得DGAT1活性提高 38% -80%,并且拟南芥(Arabidopsis)中突变使得TmDGATl的过表达使得油含量以每一 种子计增加20-50%。
[0011]提供DGAT1的改良形式是有益的,这能够克服现有技术中的一个或多个缺陷,并 且也可用于提高细胞内的油产量。
[0012]本发明的一个目的在于提供增强的DGAT1蛋白,以及利用它们从而改变细胞脂质 产生和细胞脂质组成的至少一者的方法,并且/或是至少为公众提供有益的选择。

【发明内容】

[0013] 本发明的发明人已经示出了可以制备相比于用于制备嵌合体DGAT1蛋白的亲代 DGAT1分子具有更优良性能的嵌合体DGAT1蛋白。本发明的嵌合体DGAT1蛋白可以在细胞 中表达以改变细胞或含有所述细胞的有机体中脂质含量和脂质组成。
[0014] 编码多肽的多核苷酸
[0015] 在第一方面,本发明提供了编码嵌合体DGAT1蛋白的分离的多核苷酸,所述嵌合 体DGAT1蛋白包括:
[0016] a)在其N末端处的第一DGAT1蛋白的N端部分,以及
[0017] b)在其C末端处的第二DGAT1蛋白的C端部分。
[0018] 在一个实施方案中,与第一DGAT1蛋白、第二DGAT1蛋白、或第一DGAT1蛋白和第 二DGAT1蛋白这二者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0019] i)增强的DGAT1活性;
[0020] ii)提高的稳定性;
[0021] iii)改变的低聚性;
[0022] iv)大体上正常的细胞内积聚性;
[0023] V)大体上正常的细胞内定位性。
[0024] 在另一个实施方案中,与第一DGAT1蛋白相比,所述嵌合体DGAT1蛋白具有以下至 少一者:
[0025] i)增强的DGAT1活性;
[0026] ii)提高的稳定性;
[0027]iii)改变的低聚性;
[0028]iv)大体上正常的细胞内积聚性;
[0029]v)大体上正常的细胞内定位性。
[0030] 在另一个实施方案中,与第二DGAT 1蛋白相比,所述嵌合体DGAT 1蛋白具有以下至 少一者:
[0031]i)增强的DGAT1活性;
[0032]ii)提高的稳定性;
[0033]iii)改变的低聚性;
[0034]iv)大体上正常的细胞内积聚性;
[0035]V)大体上正常的细胞内定位性。
[0036] 在另一个实施方案中,与第一DGAT 1蛋白和第二DGAT 1蛋白这二者相比,所述嵌合 体DGAT1蛋白具有以下至少一者:
[0037]i)增强的DGAT1活性;
[0038]ii)提高的稳定性;
[0039]iii)改变的低聚性;
[0040]iv)大体上正常的细胞内积聚性;
[0041]v)大体上正常的细胞内定位性。
[0042] 在一个实施方案中,第一DGAT1蛋白的N端部分为第一DGAT1蛋白的N端胞质 区。在一个实施方案中,第一DGAT1蛋白的N端胞质区从第一DGAT1蛋白的N端延伸至第 一DGAT1蛋白的乙酰CoA结合域的末尾。在另一个实施方案中,第一DGAT1蛋白的N端胞 质区为第一跨膜结构域上游的区域。
[0043] 图3示出了多个DGAT1蛋白的乙酰CoA结合域和第一跨膜结构域的位置。
[0044] 在一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分之 间的连接位于第一跨膜结构域的上游。
[0045] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点中。
[0046] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点的对应位置。
[0047] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端 部分之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点的保守 LSS (Leu-Ser-Ser)内。
[0048] 在一个优选的实施方案中,所述嵌合体DGAT1具有完整的乙酰CoA结合位点。
[0049] 在一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一DGAT1蛋 白内的乙酰CoA结合位点的长度相同。
[0050] 在另一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第二DGAT1 蛋白内的乙酰CoA结合位点的长度相同。
[0051] 在一个优选的实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一 DGAT1蛋白和第二DGAT1蛋白内的乙酰CoA结合位点的长度相同。
[0052] 在另一个实施方案中,在细胞中表达时,本发明的多肽与第一DGAT1蛋白和第二 DGAT1蛋白中至少一者相比底物特异性改变。
[0053] 构建体
[0054] 在另一个实施方案中,本发明提供了一种遗传构建体,其包含本发明的多核苷酸。
[0055] 细胞
[0056] 在另一个实施方案中,本发明提供了一种细胞,其包含本发明的多核苷酸。
[0057] 在另一个实施方案中,本发明提供了一种细胞,其包含本发明的遗传构建体。
[0058] 在一个优选的实施方案中,所述细胞表达嵌合体DGAT1。
[0059] 在一个实施方案中,在细胞中表达时,与第一DGAT1、第二DGAT1,或第一DGAT1蛋 白和第二DGAT1蛋白这二者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0060] i)增强的DGAT1活性;
[0061] ii)提尚的稳定性;
[0062] iii)改变的低聚性;
[0063] iv)大体上正常的细胞内积聚性;以及
[0064] V)大体上正常的细胞内定位性。
[0065] 在一个实施方案中,在细胞中表达时,与第一DGAT1蛋白相比,所述嵌合体DGAT1 蛋白具有以下至少一者:
[0066] i)增强的DGAT1活性;
[0067] ii)提高的稳定性;
[0068] iii)改变的低聚性;
[0069] iv)大体上正常的细胞内积聚性;
[0070] v)大体上正常的细胞内定位性。
[0071] 在一个实施方案中,在细胞中表达时,与第二DGAT1蛋白相比,所述嵌合体DGAT1 蛋白具有以下至少一者:
[0072] i)增强的DGAT1活性;
[0073] ii)提高的稳定性;
[0074] iii)改变的低聚性;
[0075] iv)大体上正常的细胞内积聚性;
[0076] v)大体上正常的细胞内定位性。
[0077] 在另一个实施方案中,在细胞中表达时,与第一DGAT1蛋白和第二DGAT1蛋白这二 者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0078]i)增强的DGAT1活性;
[0079] ii)提高的稳定性;
[0080] iii)改变的低聚性;
[0081] iv)大体上正常的细胞内积聚性;
[0082]V)大体上正常的细胞内定位性。
[0083] 在另一个实施方案中,与对照细胞相比,所述细胞产生更多的脂质。
[0084] 在一个实施方案中,与对照细胞相比,所述细胞产生至少多5 %、优选至少多 10%、优选至少多15%、优选至少多20%、优选至少多25%、优选至少多30%、优选至少多 35%、优选至少多40%、优选至少多45%、优选至少多50%、优选至少多55%、优选至少多 60%、优选至少多65%、优选至少多70%、优选至少多75%、优选至少多80%、优选至少多 85%、优选至少多90%、优选至少多95%、优选至少多100%、优选至少多105%、优选至少 多110 %、优选至少多115 %、优选至少多120 %、优选至少多125 %、优选至少多130 %、优选 至少多135%、优选至少多140%、优选至少多145%、优选至少多150%的脂质。
[0085] 在另一个实施方案中,与对照细胞相比,所述细胞的脂质组成改变。
[0086] 在一个实施方案中,与对照细胞相比,所述细胞中三酰甘油中16:0的比例改变。
[0087] 在一个实施方案中,与对照细胞相比,所述细胞中三酰甘油中16:0的比例改变至 少1 %、优选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、 更优选至少7 %、更优选至少8 %、更优选至少9 %、更优选至少10 %、更优选至少11 %、更优 选至少12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优 选至少17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0088] 在另一个实施方案中,改变的脂质组成中三酰甘油中16:0的比例在6%至16%的 范围内。在该实施方案中,三酰甘油中16:0的比例的改变在6%至16%的范围内。
[0089] 在另一个实施方案中,相比于对照细胞,所述细胞中三酰甘油中18:0的比例改 变。
[0090]在一个实施方案中,相比于对照细胞,所述细胞中三酰甘油中18:0的比例改变至 少1 %、优选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、 更优选至少7 %、更优选至少8 %、更优选至少9 %、更优选至少10 %、更优选至少11 %、更优 选至少12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优 选至少17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0091] 在另一个实施方案中,改变的脂质组成中三酰甘油中18:0的比例在7%至15%的 范围内。在该实施方案中,三酰甘油中18:0的比例的改变在7%至15%的范围内。
[0092] 在另一个实施方案中,相比于对照细胞,所述细胞中三酰甘油中18:1的比例改 变。
[0093] 在一个实施方案中,相比于对照细胞,所述细胞中三酰甘油中18:1的比例改变至 少1 %、优选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、 更优选至少7 %、更优选至少8 %、更优选至少9 %、更优选至少10 %、更优选至少11 %、更优 选至少12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优 选至少17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0094] 在另一个实施方案中,改变的脂质组成中三酰甘油中18:1的比例在39%至55% 的范围内。在该实施方案中,三酰甘油中18:1的比例的改变在39%至55%的范围内。
[0095] 对照细胞可以为未用本发明的多核苷酸或构建体转化以表达嵌合体DGAT1的相 同类型的任意细胞。
[0096] 在一个实施方案中,所述对照细胞为未转化细胞。在另一个实施方案中,所述对照 细胞为表达第一DGAT1的转化细胞。在另一个实施方案中,所述对照细胞为表达第二DGAT1 的转化细胞。
[0097] 细胞也被转化以表达油质蛋白
[0098] 在一个实施方案中,所述细胞也被转化以表达以下至少一者:油质蛋白、油体 固醇蛋白、油体钙蛋白、聚油质蛋白、以及包括至少一个人工引入的半胱氨酸的油质蛋白 (W02011/053169)。
[0099]植物
[0100] 在另一个实施方案中,本发明提供了一种植物,其包含本发明的多核苷酸。
[0101] 在另一个实施方案中,本发明提供了一种植物,其包含本发明的遗传构建体。
[0102] 在一个优选的实施方案中,所述植物表达嵌合体DGAT1。
[0103] 在一个实施方案中,在植物中表达时,与所述第一DGAT1、所述第二DGAT1或所述 第一DGAT1和所述第二DGAT1这两者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0104]i)增强的DGAT1活性;
[0105]ii)提高的稳定性;
[0106]iii)改变的低聚性;
[0107]iv)大体上正常的细胞内蛋白积聚性;以及
[0108]V)大体上正常的细胞内定位性。
[0109] 在一个实施方案中,在植物中表达时,与第一DGAT1相比,所述嵌合体DGAT1蛋白 具有以下至少一者:
[0110]i)增强的DGAT1活性;
[0111] ii)提尚的稳定性;
[0112] iii)改变的低聚性;
[0113]iv)大体上正常的细胞内蛋白积聚性;以及
[0114]V)大体上正常的细胞内定位性。
[0115] 在一个实施方案中,在植物中表达时,与第二DGAT1相比,所述嵌合体DGAT1蛋白 具有以下至少一者:
[0116]i)增强的DGAT1活性;
[0117]ii)提尚的稳定性;
[0118]iii)改变的低聚性;
[0119]iv)大体上正常的细胞内蛋白积聚性;以及
[0120] V)大体上正常的细胞内定位性。
[0121]在一个实施方案中,在植物中表达时,与第一DGAT1和第二DGAT1这两者相比,所 述嵌合体DGAT1蛋白具有以下至少一者:
[0122] i)增强的DGAT1活性;
[0123]ii)提尚的稳定性;
[0124]iii)改变的低聚性;
[0125]iv)大体上正常的细胞内蛋白积聚性;以及
[0126] V)大体上正常的细胞内定位性。
[0127]在一个实施方案中,在植物中表达时,与第一DGAT1和第二DGAT1这两者相比,所 述嵌合体DGAT1蛋白具有以下至少一者:
[0128]i)增强的DGAT1活性;
[0129]ii)提尚的稳定性;
[0130]iii)改变的低聚性;
[0131]iv)大体上正常的细胞内蛋白积聚性;以及
[0132]V)大体上正常的细胞内定位性。
[0133]在另一个实施方案中,与对照植物中的相应组织或其部分相比,所述植物在其组 织或其部分的至少一者中产生更多的脂质。
[0134]在一个实施方案中,与对照细胞相比,所述植物产生至少多5%、优选至少多 10%、优选至少多15%、优选至少多20%、优选至少多25%、优选至少多30%、优选至少多 35%、优选至少多40%、优选至少多45%、优选至少多50%、优选至少多55%、优选至少多 60%、优选至少多65%、优选至少多70%、优选至少多75%、优选至少多80%、优选至少多 85%、优选至少多90%、优选至少多95%、优选至少多100%、优选至少多105%、优选至少 多110 %、优选至少多115 %、优选至少多120 %、优选至少多125 %、优选至少多130 %、优选 至少多135%、优选至少多140%、优选至少多145%、优选至少多150%的脂质。
[0135]在一个实施方案中,所述组织为营养组织。在一个实施方案中,所述部分为叶。在 一个实施方案中,所述部分为根。在另一个实施方案中,所述部分为块茎。在另一个实施方 案中,所述部分为球茎。在另一个实施方案中,所述部分为柄。在另一个实施方案中,所述 部分为单子叶植物的柄。在另一个实施方案中,所述部分为稻杆(柄和叶片)。
[0136]在一个优选的实施方案中,所述组织为种子组织。在一个优选的实施方案中,所述 部分为种子。在一个优选的实施方案中,所述组织为胚乳组织。
[0137]在另一个实施方案中,所述植物整体比对照植物整体产生更多的脂质。
[0138]在另一个实施方案中,与对照植物相比,所述植物在其组织或其部分的至少一者 中脂质改变。
[0139]在一个实施方案中,与对照植物相比,三酰甘油中16:0的比例改变。
[0140] 在一个实施方案中,与对照细胞相比,三酰甘油中16:0的比例改变至少1%、优 选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、更优选至 少7%、更优选至少8%、更优选至少9%、更优选至少10%、更优选至少11%、更优选至少 12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优选至少 17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0141] 在一个实施方案中,改变的脂质组成中三酰甘油中16:0的比例在6%至16%的范 围内。在该实施方案中,三酰甘油中16:0的比例的改变在6%至16%的范围内。
[0142] 在另一个实施方案中,与对照植物相比,三酰甘油中18:0的比例改变。
[0143] 在一个实施方案中,与对照细胞相比,三酰甘油中18:0的比例改变至少1%、优 选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、更优选至 少7%、更优选至少8%、更优选至少9%、更优选至少10%、更优选至少11%、更优选至少 12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优选至少 17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0144] 在一个实施方案中,改变的脂质组成中三酰甘油中18:0的比例在7%至15%的范 围内。在该实施方案中,三酰甘油中18:0的比例的改变在7%至15%的范围内。
[0145] 在另一个实施方案中,与对照植物相比,三酰甘油中18:1的比例改变。
[0146] 在一个实施方案中,与对照细胞相比,三酰甘油中18:1的比例改变至少1%、优 选至少2%、更优选至少3%、更优选至少4%、更优选至少5%、更优选至少6%、更优选至 少7%、更优选至少8%、更优选至少9%、更优选至少10%、更优选至少11%、更优选至少 12 %、更优选至少13 %、更优选至少14 %、更优选至少15 %、更优选至少16 %、更优选至少 17%、更优选至少18%、更优选至少19%、更优选至少20%。
[0147] 在一个实施方案中,改变的脂质组成中三酰甘油中18:1的比例在39%至55%的 范围内。在该实施方案中,三酰甘油中18:1的比例的改变在39%至55%的范围内。
[0148] 在一个实施方案中,所述组织为营养组织。在一个实施方案中,所述部分为叶。在 一个实施方案中,所述部分为根。在另一个实施方案中,所述部分为块茎。在另一个实施方 案中,所述部分为球茎。在另一个实施方案中,所述部分为柄。在另一个实施方案中,所述 部分为单子叶植物的柄。在另一个实施方案中,所述部分为稻杆(柄和叶片)。
[0149] 在一个优选的实施方案中,所述组织为种子组织。在一个优选的实施方案中,所述 部分为种子。在一个优选的实施方案中,所述组织为胚乳组织。
[0150] 在另一个实施方案中,所述植物整体比对照植物整体产生更多的脂质。
[0151] 对照植物可以为未用本发明的多核苷酸或构建体转化以表达嵌合体DGAT1的相 同类型的任意植物。
[0152] 在一个实施方案中,所述对照植物为未转化植物。在另一个实施方案中,所述对照 植物为表达第一DGAT1的转化植物。在另一个实施方案中,所述对照植物为表达第二DGAT1 的转化植物。
[0153] 植物也被转化以表达油质蛋白
[0154] 在一个实施方案中,所述植物也被转化以表达以下至少一者:油质蛋白、油体 固醇蛋白、油体钙蛋白、聚油质蛋白、以及包括至少一个人工引入的半胱氨酸的油质蛋白 (W02011/053169)。
[0155] 多肽
[0156] 在另一个方面,本发明提供了嵌合体DGAT1蛋白,包括:
[0157] a)其N末端处的第一DGAT1蛋白的N端部分,以及
[0158] b)其C末端处的第二DGAT1蛋白的C端部分。
[0159] 在一个实施方案中,与第一DGAT1蛋白、第二DGAT1蛋白、或第一DGAT1蛋白和第 二DGAT1蛋白这二者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0160] i)增强的DGAT1活性;
[0161] ii)提尚的稳定性;
[0162] iii)改变的低聚性;
[0163] iv)大体上正常的细胞内积聚性;
[0164] V)大体上正常的细胞内定位性。
[0165] 在另一个实施方案中,与第一DGAT1蛋白相比,所述嵌合体DGAT1蛋白具有以下至 少一者:
[0166] i)增强的DGAT1活性;
[0167] ii)提高的稳定性;
[0168] iii)改变的低聚性;
[0169] iv)大体上正常的细胞内积聚性;
[0170]V)大体上正常的细胞内定位性。
[0171] 在另一个实施方案中,与第二DGAT1蛋白相比,所述嵌合体DGAT1蛋白具有以下至 少一者:
[0172]i)增强的DGAT1活性;
[0173]ii)提高的稳定性;
[0174]iii)改变的低聚性;
[0175]iv)大体上正常的细胞内积聚性;
[0176]V)大体上正常的细胞内定位性。
[0177] 在另一个实施方案中,与第一DGAT1蛋白和第二DGAT1蛋白这二者相比,所述嵌合 体DGAT1蛋白具有以下至少一者:
[0178]i)增强的DGAT1活性;
[0179]ii)提高的稳定性;
[0180]iii)改变的低聚性;
[0181]iv)大体上正常的细胞内积聚性;
[0182]V)大体上正常的细胞内定位性。
[0183] 在一个实施方案中,第一DGAT1蛋白的N端部分为第一DGAT1蛋白的N端胞质 区。在一个实施方案中,第一DGAT1蛋白的N端胞质区从第一DGAT1蛋白的N端延伸至第 一DGAT1蛋白的乙酰CoA结合域的末尾。在另一个实施方案中,第一DGAT1蛋白的N端胞 质区为第一跨膜结构域上游的区域。
[0184] 图3示出了多个DGAT1蛋白的乙酰CoA结合域和第一跨膜结构域的位置。
[0185] 在一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分之 间的连接位于第一跨膜结构域的上游。
[0186] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点。
[0187] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点中的对应位置。
[0188] 在一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端 部分之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点的保守 LSS (Leu-Ser-Ser)内。
[0189] 在一个优选的实施方案中,所述嵌合体DGAT1具有完整的乙酰CoA结合位点。
[0190] 在一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一DGAT1蛋 白内的乙酰CoA结合位点的长度相同。
[0191] 在另一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第二DGAT1 蛋白内的乙酰CoA结合位点的长度相同。
[0192] 在一个优选的实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一 DGAT1蛋白和第二DGAT1蛋白内的乙酰CoA结合位点的长度相同。
[0193] 嵌合体DGAT1的制备方法
[0194] 在另一个方面,本发明提供了一种制备嵌合体DGAT1的方法,该方法包括组合:
[0195] a)第一DGAT1蛋白的N端部分,和
[0196] b)第二DGAT1蛋白的C端部分。
[0197] 在一个优选的实施方案中,嵌合体DGAT1包括:
[0198] a)其N末端处的第一DGAT1蛋白的N端部分,以及
[0199] b)其C末端处的第二DGAT1蛋白的C端部分。
[0200] 在一个实施方案中,与第一DGAT1蛋白、第二DGAT1蛋白、或第一DGAT1蛋白和第 二DGAT1蛋白这二者相比,所述嵌合体DGAT1蛋白具有以下至少一者:
[0201] i)增强的DGAT1活性;
[0202] ii)提高的稳定性;
[0203] iii)改变的低聚性;
[0204] iv)大体上正常的细胞内积聚性;
[0205] V)大体上正常的细胞内定位性。
[0206] 在另一个实施方案中,与第一DGAT1蛋白相比,所述嵌合体DGAT1蛋白具有以下至 少一者:
[0207] i)增强的DGAT1活性;
[0208] ii)提高的稳定性;
[0209] iii)改变的低聚性;
[0210] iv)大体上正常的细胞内积聚性;
[0211] V)大体上正常的细胞内定位性。
[0212] 在另一个实施方案中,与第二DGAT 1蛋白相比,所述嵌合体DGAT 1蛋白具有以下至 少一者:
[0213] i)增强的DGAT1活性;
[0214] ii)提尚的稳定性;
[0215] iii)改变的低聚性;
[0216] iv)大体上正常的细胞内积聚性;
[0217] V)大体上正常的细胞内定位性。
[0218] 在另一个实施方案中,与第一DGAT1蛋白和第二DGAT1蛋白这二者相比,所述嵌合 体DGAT1蛋白具有以下至少一者:
[0219] i)增强的DGAT1活性;
[0220] ii)提高的稳定性;
[0221] iii)改变的低聚性;
[0222] iv)大体上正常的细胞内积聚性;
[0223] V)大体上正常的细胞内定位性。
[0224] 在另一个实施方案中,所述方法包括检测所述嵌合体DGAT1蛋白的以下至少一 者:
[0225] i)活性,
[0226] ii)稳定性,
[0227] iii)低聚性,
[0228] iv)细胞内蛋白积聚性,
[0229] V)细胞内定位性。
[0230] 在另一个实施方案中,所述方法包括选择与第一DGAT1蛋白、第二DGAT1蛋白、或 第一DGAT1蛋白和第二DGAT1蛋白这二者相比,具有以下至少一者的嵌合体DGAT1蛋白的 步骤:
[0231]i)增强的DGAT1活性;
[0232] ii)提高的稳定性;
[0233]iii)改变的低聚性;
[0234]iv)大体上正常的细胞内积聚性;以及
[0235]V)大体上正常的细胞内定位性。
[0236] 在另一个实施方案中,所述方法包括选择与第一DGAT1蛋白相比具有以下至少一 者的嵌合体DGAT1蛋白的步骤:
[0237]i)增强的DGAT1活性;
[0238]ii)提高的稳定性;
[0239]iii)改变的低聚性;
[0240]iv)大体上正常的细胞内积聚性;以及
[0241]V)大体上正常的细胞内定位性。
[0242] 在另一个实施方案中,所述方法包括选择与第二DGAT1蛋白相比,具有以下至少 一者的嵌合体DGAT1蛋白的步骤:
[0243]i)增强的DGAT1活性;
[0244]ii)提尚的稳定性;
[0245]iii)改变的低聚性;
[0246]iv)大体上正常的细胞内积聚性;以及
[0247]V)大体上正常的细胞内定位性。
[0248] 在另一个实施方案中,所述方法包括选择与第一DGAT1蛋白和第二DGAT1蛋白这 二者相比,具有以下至少一者的嵌合体DGAT1蛋白的步骤:
[0249] i)增强的DGAT1活性;
[0250] ii)提尚的稳定性;
[0251] iii)改变的低聚性;
[0252] iv)大体上正常的细胞内积聚性;以及
[0253] V)大体上正常的细胞内定位性。
[0254] 在一个实施方案中,第一DGAT1蛋白的N端部分为第一DGAT1蛋白的N端胞质 区。在一个实施方案中,第一DGAT1蛋白的N端胞质区从第一DGAT1蛋白的N端延伸至第 一DGAT1蛋白的乙酰CoA结合域的末尾。在另一个实施方案中,第一DGAT1蛋白的N端胞 质区为第一跨膜结构域上游的区域。
[0255] 图3示出了多个DGAT1蛋白的乙酰CoA结合域和第一跨膜结构域的位置。
[0256] 在一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分之 间的连接位于第一跨膜结构域的上游。
[0257] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点。
[0258] 在另一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端部分 之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点中的对应位置。
[0259] 在一个实施方案中,第一DGAT1蛋白的N端部分和第二DGAT1蛋白的C端 部分之间的连接位于第一DGAT1蛋白和第二DGAT1蛋白的乙酰CoA结合位点的保守 LSS (Leu-Ser-Ser)内。
[0260] 在一个优选的实施方案中,所述嵌合体DGAT1具有完整的乙酰CoA结合位点。
[0261] 在一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一DGAT1蛋 白内的乙酰CoA结合位点的长度相同。
[0262] 在另一个实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第二DGAT1 蛋白内的乙酰CoA结合位点的长度相同。
[0263] 在一个优选的实施方案中,嵌合体DGAT1内的乙酰CoA结合位点的长度与第一 DGAT1蛋白和第二DGAT1蛋白内的乙酰CoA结合位点的长度相同。
[0264] 植物部分
[0265] 在另一个实施方案中,本发明提供了本发明植物的部分、繁殖体或子代。
[0266] 在一个优选的实施方案中,所述部分、繁殖体或子代包含本发明的多核苷酸、构建 体或多肽中的至少一者。
[0267] 在一个优选的实施方案中,所述部分、繁殖体或子代表达本发明的多核苷酸、构建 体或多肽中的至少一者。
[0268] 在一个优选的实施方案中,所述部分、繁殖体或子代表达本发明的嵌合体DGAT1 蛋白。
[0269] 在另一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、 繁殖体或子代相比,所述部分、繁殖体或子代产生更多的脂质。
[0270] 在一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、繁 殖体或子代相比,所述部分、繁殖体或子代产生至少多5%、优选至少多10%、优选至少多 15%、优选至少多20%、优选至少多25%、优选至少多30%、优选至少多35%、优选至少多 40%、优选至少多45%、优选至少多50%、优选至少多55%、优选至少多60%、优选至少多 65%、优选至少多70%、优选至少多75%、优选至少多80%、优选至少多85%、优选至少多 90%、优选至少多95%、优选至少多100%、优选至少多105%、优选至少多110%、优选至少 多115 %、优选至少多120 %、优选至少多125 %、优选至少多130 %、优选至少多135 %、优选 至少多140%、优选至少多145%、优选至少多150%的脂质。
[0271] 在另一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、 繁殖体或子代相比,所述部分、繁殖体或子代的脂质组成改变。
[0272] 在一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、繁 殖体或子代相比,三酰甘油中16:0的比例改变。
[0273] 在一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、繁 殖体或子代相比,三酰甘油中16:0的比例改变至少1 %、优选至少2%、更优选至少3%、更 优选至少4 %、更优选至少5 %、更优选至少6 %、更优选至少7 %、更优选至少8 %、更优选至 少9%、更优选至少10%、更优选至少11%、更优选至少12%、更优选至少13%、更优选至少 14 %、更优选至少15 %、更优选至少16 %、更优选至少17 %、更优选至少18 %、更优选至少 19%、更优选至少20%。
[0274] 在另一个实施方案中,改变的脂质组成中三酰甘油中16:0的比例在6%至16%的 范围内。在该实施方案中,三酰甘油中16:0的比例的改变在6%至16%的范围内。
[0275] 在另一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、 繁殖体或子代相比,三酰甘油中18:0的比例改变。
[0276] 在一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、繁 殖体或子代相比,三酰甘油中18:0的比例改变至少1 %、优选至少2%、更优选至少3%、更 优选至少4 %、更优选至少5 %、更优选至少6 %、更优选至少7 %、更优选至少8 %、更优选至 少9%、更优选至少10%、更优选至少11%、更优选至少12%、更优选至少13%、更优选至少 14 %、更优选至少15 %、更优选至少16 %、更优选至少17 %、更优选至少18 %、更优选至少 19%、更优选至少20%。
[0277] 在另一个实施方案中,改变的脂质组成中三酰甘油中18:0的比例在7%至15%的 范围内。在该实施方案中,三酰甘油中18:0的比例的改变在7%至15%的范围内。
[0278] 在另一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、 繁殖体或子代相比,三酰甘油中18:1的比例改变。
[0279] 在一个实施方案中,与对照部分、对照繁殖体或对照子代或是对照植物的部分、繁 殖体或子代相比,三酰甘油中18:1的比例改变至少1 %、优选至少2%、更优选至少3%、更 优选至少4 %、更优选至少5 %、更优选至少6 %、更优选至少7 %、更优选至少8 %、更优选至 少9%、更优选至少10%、更优选至少11%、更优选至少12%、更优选至少13%、更优选至少 14 %、更优选至少15 %、更优选至少16 %、更优选至少17 %、更优选至少18 %、更优选至少 19%、更优选至少20%。
[0280] 在另一个实施方案中,改变的脂质组成中三酰甘油中18:1的比例在39%至55% 的范围内。在该实施方案中,三酰甘油中18:1的比例的改变在39%至55%的范围内。
[0281] 对照植物可以为未用本发明的多核苷酸或构建体转化以表达嵌合体DGAT1的相 同类型的任意植物。
[0282] 在一个实施方案中,所述对照植物为未转化植物。在另一个实施方案中,所述对照 植物为表达第一DGAT1蛋白的转化植物。在另一个实施方案中,所述对照植物为表达第二 DGAT1蛋白的转化植物。
[0283] 优选地,所述对照部分、对照繁殖体或对照子代来自如上所述的对照植物。
[0284] 在一个实施方案中,所述部分来自营养组织。在一个实施方案中,所述部分为叶。 在另一个实施方案中,所述部分为根。在另一个实施方案中,所述部分为块茎。在另一个实 施方案中,所述部分为球茎。在另一个实施方案中,所述部分为柄。在另一个实施方案中, 所述部分为单子叶植物的柄。在另一个实施方案中,所述部分为秸杆(柄和叶片)。
[0285] 在另一个实施方案中,所述部分来自繁殖性组织。在另一个实施方案中,所述部分 为种子。在一个优选的实施方案中,所述部分来自或包括胚乳组织。
[0286] 动物饲料
[0287] 在另一个方面,本发明提供了一种动物饲料,其包含本发明的多核苷酸、构建体、 细胞、植物细胞、植物部分、繁殖体和子代中的至少一者。
[0288] 生物燃料原料
[0289] 在另一个方面,本发明提供了一种生物燃料原料,其包含本发明的多核苷酸、构建 体、细胞、植物细胞、植物部分、繁殖体和子代中的至少一者。
[0290] 脂质
[0291] 在一个实施方案中,所述脂质为油。在另一个实施方案中,所述脂质为三酰甘油 (TAG)〇
[0292] 脂质的制备方法
[0293] 在另一个方面,本发明提供了一种制备脂质的方法,该方法包括在植物中表达本 发明的嵌合体DGAT1蛋白。
[0294] 在一个优选的实施方案中,在植物中表达本发明的嵌合体DGAT1蛋白使得植物中 产生脂质。
[0295] 在一个实施方案中,所述方法包括用本发明的编码嵌合体DGAT1蛋白的多核苷酸 转化植物细胞或植物的步骤。
[0296] 在另一个实施方案中,所述方法包括从细胞、植物细胞、或植物、或是从该植物的 部分、繁殖体或子代中提取脂质的步骤。
[0297] 在一个实施方案中,所述脂质为油。在另一个实施方案中,所述脂质为三酰甘油 (TAG)〇
[0298] 在另一个实施方案中,所述脂质被加工为以下的至少一种:
[0299] a)燃料,
[0300] b)油化学品,
[0301] c)营养油,
[0302] d)化妆油,
[0303]e)多不饱和脂肪酸(PUFA),和
[0304]f)a)至e)的任意组合。
[0305] 在另一个方面,本发明提供了制备脂质的方法,该方法包括从本发明的细胞、植物 细胞、植物、植物部分、繁殖体和子代的至少一者中提取脂质。
[0306] 在一个实施方案中,所述脂质为油。在另一个实施方案中,所述脂质为三酰甘油 (TAG)〇
[0307] 在另一个实施方案中,所述脂质被加工为以下的至少一种:
[0308] a)燃料,
[0309] b)油化学品,
[0310] c)营养油,
[0311]d)化妆油,
[0312]e)多不饱和脂肪酸(PUFA),和
[0313]f)a)至e)的任意组合。
[0314] 发明详述
[0315] 在本说明书中,在提及专利说明书、其它外部文献或其它信息来源的情况下,这通 常是为了提供论述本发明特征的背景的目的。除非另外特别说明,否则对所述外部文献的 提及不应解释为以任何权限承认所述文献或所述信息来源为现有技术或构成本领域的一 般常识的一部分。
[0316] 在本说明书中所用的术语"包含"是指"至少部分地由...组成"。当解释本说明 书中包括术语"包含"的各句时,不同于以该术语为前言的一项或多项特征的特征也可能存 在。诸如"包含"等相关术语欲以相同方式解释。在一些实施方案中,术语"包含"(以及 "包含"等相关术语)可用"由?…组成"(以及"由?…组成"等相关术语)来替代。
[0317] 定义
[0318] 本文中所用的术语"DGAT1"是指乙酰CoA:二酰基甘油酰基转移酶(EC 2. 3. 1. 20)〇
[0319]DGAT1在种子和衰老的叶中通常为主要的TAG合成酶(Kaup等,2002,Plant Physiol. 129 (4) : 1616-26 ;综述参见Lung和Weselake2006,Lipids. ;41 (12) : 1073-88 ; Cahoon等,2007,CurrentOpinioninPlantBiology. 10:236-244 ;以及Li等, 2010,Lipids. 45:145-157)。
[0320]DGAT1含有大约500个氨基酸并且具有10个预测的跨膜结构域,而DGAT2仅有320 个氨基酸并且据预测其仅含有2个跨膜结构域;预测这二者均在胞质内具有其N端和C端 (Shockey等,2006,PlantCell18:2294-2313)。DGAT1 和DGAT2 在动物和真菌中都具有直 系同源,并且为位于ER的跨膜蛋白。
[0321] 在大部分双子叶植物中,DGAT1和DGAT2似乎为单拷贝基因,然而在草类中它们通 常为两个版本,其大概在草类基因组复制时出现(Salse等,2008,PlantCell, 20:11-24)。
[0322] 本文所用的术语"第一DGAT1蛋白"或"第二DGAT1蛋白"通常是指天然存在的或 天然的DGAT1。在一些情况下,DGAT1序列可以由基因组中的序列组装,但可能在植物中不 表达。因此,在一个实施方案中,第一或第二DGAT1蛋白可以不为从自然界分离的DGAT1。
[0323]在一个实施方案中,所述"第一DGAT1蛋白"或"第二DGAT1蛋白"具有SEQIDN0:1 至29或其变体中任一者的序列。优选地,所述变体与SEQIDNO: 1至29中任一者具有至 少70%同一性。在另一个实施方案中,所述"第一DGAT1蛋白"或"第二DGAT1蛋白"具有 SEQIDNO: 1至29任一者的序列。
[0324] 在一个实施方案中,"第一DGAT1蛋白"或"第二DGAT1蛋白"是由包含SEQID N0:30至58或其变体中任一者的序列的多核苷酸序列编码的。优选地,所述变体与SEQID N0:30至58中任一者具有至少70%同一性。在另一个实施方案中,"第一DGAT1蛋白"或 "第二DGAT1蛋白"是由包含SEQIDN0:30至58中任一者的序列的多核苷酸序列编码的。
[0325] 在一个实施方案中,嵌合体DGAT1序列包含SEQIDN 0:59至94或其变体中任一 者的序列。优选地,所述变体与SEQIDN0:59至94中的任一者有至少70%同一性。在另 一个实施方案中,嵌合体DGAT1序列具有SEQIDN0:59至94中任一者的序列。
[0326] 在另一个实施方案中,嵌合体DGAT1多肽序列具有SEQIDN0:59、61、66、68、 70-72、74-76、78、79、82、84-86、88-90、92和93或其变体的任一者的序列。优选地,所述变 体与SEQIDN0:59、61、66、68、70-72、74-76、78、79、82、84-86、88-90、92 和 93 中任一者具 有至少70%同一性。在另一个实施方案中,嵌合体DGAT1序列具有SEQIDN0:59、61、66、 68、70-72、74-76、78、79、82、84-86、88-90、92 和 93 中任一者的序列。
[0327] 尽管并非优选,本发明的嵌合体DGAT1还包括在以下至少一者处的修饰:
[0328]a)第一DGAT1蛋白的N端部分,以及
[0329] b)第二DGAT1蛋白的C端部分。
[0330] 优选地,本发明的嵌合体DGAT1包括功能性乙酰CoA结合位点。
[0331] 按照惯例,术语上游和下游分别表示朝向多肽N端以及朝向多肽C端。
[0332] 乙酰CoA结合位点
[0333] 图3示出了多个DGAT1序列中乙酰CoA结合位点的位置。
[0334] 保守基序ESPLSS
[0335] 在一个优选的实施方案中,乙酰CoA结合位点包含保守基序ESPLSS。
[0336] 乙酰CoA结合位点通式
[0337] 在一个优选的实施方案中,嵌合体DGAT1中乙酰CoA结合位点具有下式:
[0338]XXXESPLSSXXIFXXXHA,
[0339] 其中X为任意氨基酸。
[0340] 在一个优选的实施方案中,嵌合体DGAT1中乙酰CoA结合位点具有下式:
[0341]XXXESPLSSXXIFXXSHA,
[0342] 其中X为任意氨基酸。
[0343] 在一个优选的实施方案中,嵌合体DGAT1中乙酰CoA结合位点具有下式:
[0344]X1X2X3ESPLSSX4X5IFX6X7X8HA,
[0345]其中X1=R、K、V、T、A、S或G;X2=A、T、V、I、N、R、S或L;X3=R或K;X4=D或 G;X5=A、T、N或L;X6=K或R;X7=Q或H;并且X8=S或不存在。
[0346] 在一个优选的实施方案中,嵌合体DGAT1中乙酰CoA结合位点具有下式:
[0347]X1X2X3ESPLSSX4X5IFX6X7SHA,
[0348]其中X1=R、K、V、T、A、S或G;X2=A、T、V、I、N、R、S或L;X3=R或K;X4=D或 G;X5=A、T、N或L;X6=K或R;并且X7=Q或H。
[0349] 嵌合体DGAT1蛋白的制备方法
[0350] 嵌合体蛋白、或编码它们的多核苷酸的制备方法是本领域技术人员熟知的。可以 通过使用诸如限制酶切和连接等标准分子生物技术组合编码DGAT1的蛋白、然后表达所述 嵌合体DGAT1蛋白来方便地制备嵌合体DGAT1蛋白。或者,可以方便地合成编码嵌合体 DGAT1蛋白的多核苷酸序列,并且由合成序列表达嵌合体蛋白。为了制备多个嵌合体DGAT1 蛋白,可以合成编码序列,其包括不改变表达蛋白的氨基酸序列的限制酶切位点。可以利用 这些限制酶切位点来组合序列从而用于嵌合体蛋白的制备和表达。制备嵌合体蛋白的这些 方法和类似方法是本领域技术人员知晓的。
[0351] 可以从本发明公开的序列中选择第一DGAT1蛋白和第二DGAT1蛋白序列、以及编 码多核苷酸从而制备本发明的嵌合体DGAT1蛋白。或者通过本领域技术人员熟知的方法鉴 定其他DGAT1序列,所述方法包括生物信息学数据库搜索以及物理克隆方法。第一DGAT1 蛋白和第二DGAT1蛋白序列可以来自任意物种,包括植物、动物和微生物。
[0352] 术语"增强的DGAT1活性"是指与第一和/或DGAT1蛋白相比,其比活性增强。
[0353] 本领域熟练技术员知晓如何检测嵌合体DGAT1的"比活性"。如Xu等 ((2008),PlantBiotechnologyJournal. 6:799-818)所述,这通常可通过分离、富集和对 重组DGAT1定量,然后使用该物质确定三酰甘油形成的速率和/或前体底物的消失速率 (包括各种形式的乙酰CoA和DAG)来实现。
[0354] 术语"提高的稳定性"是指当在细胞中表达时,嵌合体DGAT1蛋白比第一和/或第 二DGAT1蛋白更稳定。与第一和/或第二DGAT1在细胞中表达时相比,这可能导致活性嵌 合体DGAT1在细胞中表达时积聚增加。
[0355] 本领域技术人员知晓如何检测嵌合体DGAT1的"稳定性"。这通常包括在单个细胞 或细胞群中表达嵌合体DGAT1,并在相同类型的单个独立细胞或细胞群中表达第一或第二 DGAT1。然后通过(例如)免疫印迹和/或ELISA测量各细胞中的嵌合体、以及第一或第二 DGAT1蛋白的积聚。在同一时间点,嵌合体DGAT1蛋白的积聚水平高于第一或第二DGAT1的 水平,这表明嵌合体DGAT1的稳定性提高。可选地,也可通过免疫印迹分析确定蛋白的三级 结构,从而确定稳定性。
[0356] 术语"改变的低聚性"是指与第一和/或第二DGAT1相比,嵌合体DGAT1形成低聚 物的方式或程度改变。
[0357] 本领域技术人员知晓如何检测嵌合体DGAT1的"低聚性",这通常是通过免疫印迹 分析或尺寸排阻色谱法完成的。
[0358] 术语"大体上正常的细胞内蛋白积聚性"是指本发明的嵌合体DGAT1在细胞中表 达时,大体上保留了与第一和/或第二DGAT1相同的蛋白积聚。也即,在相同细胞类型中分 别表达时,嵌合体DGAT1的积聚不少于第一和/或第二DGAT1的积聚。
[0359] 本领域技术人员知晓如何检测嵌合体DGAT1的"细胞内蛋白积聚性"。这通常包括 在单个细胞或细胞群中表达嵌合体DGAT1,并在相同类型的单个独立细胞或细胞群中表达 第一和/或第二DGAT1。然后通过(例如)免疫印迹和/或ELISA测量各细胞中的嵌合体 以及第一和/或第二DGAT1的积聚。在同一时间点,嵌合体DGAT1蛋白的积聚水平与第一 和/或第二DGAT1的积聚水平大体上类似,这表明嵌合体DGAT1的"大体上正常的细胞内蛋 白积聚性"升尚。
[0360] 术语"大体上正常的亚细胞内定位性"是指本发明的嵌合体DGAT1在细胞中表达 时,大体上保留了与第一和/或第二DGAT1相同的亚细胞内定位。也即,在相同细胞类型中 分别表达时,嵌合体DGAT1与第一和/或第二DGAT1定位在同样的亚细胞小室内。
[0361] 本领域技术人员知晓如何检测嵌合体DGAT1的"亚细胞内定位性"。这通常包括在 单个细胞或细胞群中表达嵌合体DGAT1,并在相同类型的单个独立细胞或细胞群中表达第 一或第二DGAT1。通过(例如)超速离心法分开并分离单个亚细胞部分,然后确定各部分 中DGAT1的水平,从而对各细胞中嵌合体、以及第一或第二DGAT1蛋白的亚细胞定位进行评 价。在同一时间点,嵌合体DGAT1蛋白与第一或第二DGAT1有大体上类似的"亚细胞定位", 这表明嵌合体DGAT1具有"大体上正常的亚细胞内定位性"。
[0362] 脂质
[0363] 在一个实施方案中,所述脂质为油。在另一个实施方案中,所述脂质为三酰甘油 (TAG)〇
[0364] 脂质产生
[0365] 在某些实施方案中,本发明的单个细胞、细胞群、组织、植物和植物部分比对照细 胞群、对照组织、对照植物和对照植物部分产生更多的脂质。
[0366] 本领域技术人员熟知测量脂质产生的方法。这通常是通过脂肪酸甲酯气相色谱质 谱定量分析(FAMESGC-MS)完成的。本说明书实施例的部分中也描述了合适的方法。
[0367] 底物特异性
[0368] 在某些实施方案中,与亲代DGAT1蛋白相比,本发明的多肽的底物特异性改变。植 物DGAT1蛋白在其能够利用以产生TAG的脂肪酸底物和DAG种类方面相对混乱。因此,它们 被认为具有相对较低的底物特异性。然而,可以经过修饰使得某些脂肪酸变成比其它脂肪 酸优选的底物,这导致TAG中优选脂肪酸的比例升高,并且非优选脂肪酸种类比例的降低。 如Xu等((2008),PlantBiotechnologyJournal. 6:799-818)所述,可以通过体外定量分 析TAG的生成,然后向已知量的重组DGAT中添加特异的已知量的纯化底物,从而确定底物 特异性。
[0369] 脂质组成
[0370] 在另一个实施方案中,与对照细胞群、对照组织、对照植物和对照植物部分相比, 本发明的单个细胞、细胞群、组织、植物和植物部分的脂质组成改变。
[0371] 本领域技术人员熟知评估脂质组成的方法。这可能包括评估脂质中存在的16:0、 16 :l、18:0、18:lc9脂肪酸种类中的任一者的比例或百分比。这通常是通过脂肪酸甲酯 (FAME)分析法(Browse等,1986,Anal.Biochem. 152, 141-145)完成的。本说明书实施例的 部分中也描述了合适的方法。
[0372] 细胞
[0373] 本发明的嵌合体DGAT1或用于本发明所述方法中的嵌合体DGAT1可在任意细胞类 型中表达。
[0374] 在一个实施方案中,所述细胞为原核细胞。在另一个实施方案中,所述细胞为真核 细胞。在一个实施方案中,所述细胞选自细菌细胞、酵母细胞、真菌细胞、昆虫细胞、藻类细 胞及植物细胞。在一个实施方案中,所述细胞为细菌细胞。在另一个实施方案中,所述细胞 为酵母细胞。在一个实施方案中,所述酵母细胞为酿酒酵母(S.ceriviseae)细胞。在一个 实施方案中,所述细胞为真菌细胞。在另一个实施方案中,所述细胞为昆虫细胞。在另一个 实施方案中,所述细胞为藻类细胞。在另一个实施方案中,所述细胞为植物细胞。
[0375] 在一个实施方案中,所述细胞为非植物细胞。在一个实施方案中,所述非植物细胞 选自大肠杆菌(E.coli)、毕赤酵母(P. pastoris)、酿酒酵母(S.ceriviseae)、盐生杜氏藻 (D. salina)和莱茵衣藻(C. reinhardtii)。在另一个实施方案中,所述非植物选自毕赤酵 母、酿酒酵母、盐生杜氏藻和莱茵衣藻。
[0376] 在一个实施方案中,所述细胞为微生物细胞。在另一个实施方案中,所述微生 物细胞为绿藻门(绿藻)、红藻门(红藻)、褐藻门(褐藻)、硅藻门(硅藻)或沟鞭藻 门(沟鞭藻)中的藻类细胞。在另一个实施方案中,所述微生物细胞为以下物种中的藻 类细胞:衣藻属(Chlamydomonas)、杜氏藻属(Dunaliella)、葡萄藻属(Botrycoccus)、 小球藻属(Chlorella)、隐甲藻属(Crypthecodinium)、江蓠属(Gracilaria)、马尾藻 属(Sargassum)、颗石藻属(Pleurochrysis)、紫球藻属(Porphyridium)、褐指藻属 (Phaeodactylum)、红球藻属(Haematococcus)、球等鞭金藻属(Isochrysis)、栅藻属 (Scenedesmus)、单胞藻属(Monodus)、小环藻属(Cyclotella)、菱形藻属(Nitzschia)或雪 藻属(Parietochloris)。在另一个实施方案中,所述藻类细胞为莱茵衣藻(Chlamydomonas reinhardtii)。在另一个实施方案中,所述细胞选自耶罗威亚酵母属(Yarrowia)、假丝 酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵 母属(Cryptococcus)、丝孢酵母属(Trichosporon)、油脂酵母属(Lipomyces)、腐霉属 (Pythium)、裂殖壶菌属(Schizochytrium)、破囊壶菌属(Thraustochytrium)、或吾肯氏壶 藻属(Ulkenia)。在另一个实施方案中,所述细胞为选自红球菌属(Rhodococcus)、大肠杆 菌属(Escherichia)或蓝藻(cyanobacterium)的细菌。在另一个实施方案中,所述细胞为 酵母细胞。在另一个实施方案中,所述细胞为合成细胞。
[0377] 植物
[0378] 可以制备嵌合体DGAT1序列的第一和/或第二DGAT1序列可以为天然存在的 DGAT1序列。优选地,所述第一和/或第二DGAT1序列来源于植物。在某些实施方案中,嵌 合体DGAT1蛋白在来源于植物的细胞中表达。在另一些实施方案中,嵌合体DGAT1蛋白在 植物中表达。
[0379] 第一和/或第二DGAT1蛋白来源的植物细胞、植物细胞来源的植物、以及表达嵌合 体DGAT1蛋白的植物可来自任何植物物种。
[0380] 在一个实施方案中,所述植物细胞或植物源自裸子植物物种。
[0381] 在另一个实施方案中,所述植物细胞或植物源自被子植物物种。
[0382] 在另一个实施方案中,所述植物细胞或植物源自双子叶植物物种。
[0383] 在另一个实施方案中,所述植物细胞或植物源自单子叶植物物种。
[0384] 其它优选的植物为来自包括、但不限于以下各属的草料植物物种:玉蜀黍属 (Zea)、黑麦草属(Lolium)、大麦属(Hordium)、芒属(Miscanthus)、甘鹿属(Saccharum)、 羊茅属(Festuca)、鸡脚茅属(Dactylis)、雀麦属(Bromus)、偃麦草属(Thinopyrum)、三 叶草属(Trifolium)、苜蓿属(Medicago)、梯牧草属(Pheleum)、金丝雀草属(Phalaris)、 绒毛草属(Holcus)、大豆属(Glycine)、莲属(Lotus)、车前草属(Plantago)及菊苣属 (Cichorium)〇
[0385] 其它优选的植物为豆科植物。豆科植物或其部分可涵盖在豆科(Leguminosae或 Fabaceae)植物科中的任何植物。例如,所述植物可选自草料豆科(legumes),包括苜蓿草、 三叶草;银合欢;谷物豆科,包括豆、小扁豆、羽扇豆、豌豆、花生、大豆;开花豆科,包括羽扇 豆;药用或工业用豆科;及休耕或绿肥豆科物种。
[0386] 特别优选的属为三叶草属。优选的三叶草物种包括白三叶草(Trifolium repens);兔足三叶草(Trifolium arvense);亲和三叶草(Trifolium affine);及类白三 叶草(Trifolium occidentale)。尤其优选的三叶草物种为白三叶草。
[0387] 另一个优选的属为苜蓿属。优选的苜蓿物种包括紫苜蓿(Medicago sativa)及蒺 藜苜蓿(Medicago truncatula)。尤其优选的苜蓿物种为紫苜蓿,常称为苜蓿草。
[0388] 另一个优选的属为大豆属。优选的大豆物种包括大豆(Glycine max)及爪哇大豆 (Glycine wightii)(也称为爪卩圭大豆(Neonotonia wightii))。尤其优选的大豆物种为大 豆(Glycine max),常称为大豆(soy bean)。尤其优选的大豆物种为爪哇大豆,常称为多年 生大ii (perennial soybean)〇
[0389] 另一个优选的属为豇豆属(Vigna)。尤其优选的豇豆物种为豇豆(Vigna unguiculata),常称为豆工豆(cowpea)。
[0390] 另一个优选的属为黧豆属(Mucana)。优选的黧豆物种包括刺毛黧豆(mucana pruniens)。尤其优选的黧豆物种为刺毛黧豆,常称为黧豆(velvetbean)。
[0391] 另一个优选的属为花生属(Arachis)。尤其优选的花生物种为多年生花生 (Arachis glabrata),常称为多年生花生(perennial peanut)。
[0392] 另一个优选的属为豌豆属(Pisum)。优选的豌豆物种为豌豆(Pisum sativum),常 称为豌豆(pea)。
[0393] 另一个优选的属为莲属(Lotus)。优选的莲物种包括百脉根(Lotus corniculatus)、长柄百脉根(Lotus pedunculatus)、窄叶百脉根(Lotus glabar)、细叶百 脉根(Lotus tenuis)及大百脉根(Lotus uliginosus)。优选的莲物种为百脉根,常称为角 果百脉根(Birdsfoot Trefoil)。另一优选的莲物种为窄叶百脉根,常称为窄叶角果百脉 根。另一优选的莲物种为长柄百脉根,常称为湿地百脉根(Big trefoil)。另一优选的莲物 种为细叶百脉根,常称为细长百脉根(Slender trefoil)。
[0394] 另一个优选的属为芸苔属(Brassica)。优选的芸苔物种为羽衣甘蓝(Brassica oleracea),常称为草料甘蓝菜(forage kale)及甘蓝(cabbage)。优选的芸苔属为亚麻# (Camelina)。优选的亚麻养种为亚麻养(Camelina sativa)。
[0395] 其它优选的物种为含油种子作物,包括、但不限于以下各属:芸苔属、红花属 (Carthumus)、向日葵属、玉蜀黍属及芝麻属(Sesamum)。
[0396] 优选的含油种子属为芸苔属。优选的含油种子物种为甘蓝型油菜(Brassica napus)〇
[0397] 优选的含油种子属为芸苔属。优选的含油种子物种为羽衣甘蓝(Brassica oleraceae)〇
[0398] 优选的含油种子属为红花属。优选的含油种子物种为红花籽草(Carthamus tinctorius)〇
[0399] 优选的含油种子属为向日葵属。优选的含油种子物种为向日葵(Helianthus annuus)〇
[0400] 优选的含油种子属为玉蜀黍属。优选的含油种子物种为玉米(Zea mays)。
[0401] 优选的含油种子属为芝麻属。优选的含油种子物种为芝麻(Sesamumindicum)。
[0402] 优选的青料属为玉蜀黍属。优选的青料物种为玉米。
[0403] 优选的谷物生产属为大麦属(Hordeum)。优选的谷物生产物种为大麦(Hordeum vulgare)〇
[0404] 优选的牧草属为黑麦草属。优选的牧草物种为黑麦草(Loliumperenne)。
[0405] 优选的牧草属为黑麦草属。优选的牧草物种为黑麦草(Loliumarundinaceum)。
[0406] 优选的牧草属为三叶草属。优选的牧草物种为白三叶草。
[0407] 优选的牧草属为大麦属。优选的牧草物种为大麦。
[0408] 优选的植物也包括草料,或动物原料植物。所述植物包括、但不限于以下各属:芒 属、甘鹿属、黍属(Panicum)。
[0409] 优选的生物燃料属为芒属。优选的生物燃料物种为巨芒(Miscanthus giganteus)〇
[0410] 优选的生物燃料属为甘鹿属。优选的生物燃料物种为甘鹿(Saccharum officinarum)〇
[0411] 优选的生物燃料属为黍属。优选的生物燃料物种为柳枝稷(Panicumvirgatum)。
[0412] 植物部分、繁殖体和子代
[0413] 术语"植物"意欲包括整个植物,植物的任何部分,植物的种子、果实、繁殖体及子 代。
[0414] 术语"繁殖体"是指植物中可用于繁殖或增殖的任何部分,其为有性或无性的,包 括种子及插枝。
[0415] 可培养本发明的植物,并使其自交或与不同植物品系杂交,获得的包含本发明的 多核苷酸或构建体,和/或是能够表达本发明的嵌合体DGAT1序列的子代,也构成本发明的 一个方面。
[0416] 优选地,所述植物、植物部分、繁殖体和子代包含本发明的多核苷酸或构建体,和/ 或是能够表达本发明的嵌合体DGAT1序列。
[0417] 多核苷酸和片段
[0418] 本文中所用术语"多核苷酸"是指,任意长度但优选至少15个核苷酸的单链或双 链脱氧核糖核苷酸或核糖核苷酸聚合物,包括以下非限制性实例:编码及非编码的基因序 列、有义及反义互补序列、外显子、内含子、基因组DNA、cDNA、pre_mRNA、mRNA、rRNA、siRNA、 miRNA、tRNA、核酶、重组多肽、分离和纯化的天然存在的DNA或RNA序列、合成的RNA和DNA 序列、核酸探针、引物和片段。
[0419] 本文中提供的多核苷酸序列的"片段"是指连续核苷酸的子序列。
[0420] 术语"引物"是指,通常具有游离3' 0H基团的短多核苷酸,其与模板杂交,且用于 引发与靶物互补的多核苷酸的聚合。
[0421] 术语"探针"是指,在基于杂交的试验中,用于检测与探针互补的多核苷酸序列的 短多核苷酸。所述探针可由如本文所定义的多核苷酸的"片段"组成。
[0422] 多肽和片段
[0423] 本文中所用术语"多肽"包括任意长度但优选至少5个氨基酸的氨基酸链,包括全 长蛋白,其中氨基酸残基通过共价肽键相连。本发明的多肽或用于本发明方法中的多肽可 为纯化的天然产物,或可使用重组或合成技术部分地或整体地生产。
[0424] 多肽的"片段"为多肽的子序列,其优选地执行所述多肽的功能和/或提供多肽的 三维结构。该术语可指能够执行上述酶活性的多肽、多肽的聚集体(诸如二聚体或其它多 聚体)、融合多肽、多肽片段、多肽变体或其衍生物。
[0425] 当用于本文中所公开的多核苷酸或多肽序列时,术语"分离的"用于指从它们的天 然细胞环境中取出的序列。可通过任何方法或方法的组合获得分离的分子,所述方法包括 生物化学技术、重组技术及合成技术。
[0426] 术语"重组的"是指,从多核苷酸序列的天然背景所包围的序列中取出的多核苷酸 序列,和/或与在其天然背景下不存在的序列重组。
[0427] 通过从"重组的"多核苷酸序列翻译,制备"重组的"多肽序列。
[0428] 就源自特定属或种的本发明的多核苷酸或多肽而言,术语"源自"是指,所述多核 苷酸或多肽具有与在该属或种中天然发现的多核苷酸或多肽相同的序列。源自特定属或种 的多核苷酸或多肽因此可以合成制备或重组制备。
[0429] 变体
[0430] 本文中所用术语"变体"是指,不同于特别鉴别出的序列的多核苷酸或多肽序列, 其中缺失、置换或添加了一个或多个核苷酸或氨基酸残基。变体可为天然存在的等位基因 变体或非天然存在的变体。变体可来自同一物种或来自其它物种,且可包括同系物、旁系同 源物及直系同源物。在某些实施方案中,本发明多肽的变体具有与本发明多肽相同或类似 的生物活性。就多肽而言,术语"变体"包括所有形式的多肽和如本文所定义的多肽。
[0431] 多核苷酸变体
[0432] 变体多核苷酸序列优选地与本发明的序列表现出至少50%、更优选至少51%、更 优选至少52%、更优选至少53%、更优选至少54%、更优选至少55%、更优选至少56%、更 优选至少57%、更优选至少58%、更优选至少59%、更优选至少60%、更优选至少61%、更 优选至少62 %、更优选至少63 %、更优选至少64 %、更优选至少65 %、更优选至少66 %、更 优选至少67%、更优选至少68%、更优选至少69%、更优选至少70%、更优选至少71%、更 优选至少72%、更优选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更 优选至少77%、更优选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更 优选至少82 %、更优选至少83 %、更优选至少84 %、更优选至少85 %、更优选至少86 %、更 优选至少87%、更优选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更 优选至少92 %、更优选至少93 %、更优选至少94 %、更优选至少95 %、更优选至少96 %、更 优选至少97%、更优选至少98%和最优选至少99%同一性。在本发明的多核苷酸的至少 20个核苷酸位置、优选至少50个核苷酸位置、更优选至少100个核苷酸位置且最优选整个 长度的比较窗上,发现同一性。
[0433] 可以如下方式测定多核苷酸序列同一性。在bl2seq(TatianaA.Tatusova,Thomas L .Madden(1999),"Blast2sequences-anewtoolforcomparingproteinand nucleotidesequences",FEMSMicrobiolLett. 174:247-250)中,使用BLASTN(来自BLAST 程序套件,2. 2. 5版[2002年11月]),将主题多核苷酸序列与候选多核苷酸序列进行比较, 所述bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。除应关闭对低复杂 性部分的过滤以外,利用bl2seq的默认参数。
[0434] 可使用以下Unix命令行参数检验多核苷酸序列的同一性:
[0435]bl2seq-inucleotideseql-jnucleotideseq2 -FF-pblastn
[0436] 参数_FF关闭对低复杂性区段的过滤。参数_p为序列对选出适当算法。bl2seq 程序在"Identities="行中将序列同一性报告为相同核苷酸的数量及百分比。
[0437]使用总体序列比对程序(例如Needleman,S.B.*Wunsch,C.D.(1970)J.Mol. Biol. 48, 443-453),也可以在候选序列与主题多核苷酸序列之间的重叠部分的整个长度上 计算多核苷酸序列同一性。Needleman-Wunsch总体比对算法的一个完整实现,参见EMBOSS 套件(Rice,P.Longden,I.andBleasby,A.EMBOSS:TheEuropeanMolecularBiologyOpen SoftwareSuite,TrendsinGeneticsJune2000,第 16 卷,第 6 期,第 276-277 页)中的 needle程序。该EMBOSS套件可从http://www.hgmp.mrc.ac.uk/Software/EMBOSS/ 得到。 EuropeanBioinformaticsInstitute月艮务器也在http:/www.ebi.ac.uk/emboss/align/ 上在线提供执行两个序列之间的EMBOSS-needle总体比对的工具。
[0438] 或者,可使用GAP程序,其计算两个序列在无处罚末端空隙的情况下的最佳总体 比对。GAP描述在以下论文中:Huang,X. (1994)0nGlobalSequenceAlignment.Computer ApplicationsintheBiosciences10, 227-235。
[0439] 计算多核苷酸%序列同一,性的优选方法是基于使用ClustalX(Jeanmougin等 人,1998,TrendsBiochem.Sci. 23, 403-5.)对比待比较的序列。
[0440] 本发明的多核苷酸变体也涵盖这样的变体:所述变体展现与可能保留那些序列的 功能等效性的一个或多个特别鉴别的序列的相似性,且不能合理地预期随机发生。使用从 来自NCBI网站(ftp://ftp.ncbi.nih.gov/blast/)上的BLAST程序套件(2. 2. 5 版[2002 年11月])可公开获得的bl2seq程序,可以测定有关多肽的这种序列相似性。
[0441] 可使用以下unix命令行参数检验多核苷酸序列的相似性:
[0442]bl2seq-inucleotideseql-jnucleotideseq2 -FF-ptblastx
[0443] 参数_FF关闭对低复杂性区段的过滤。参数_p为序列对选出适当算法。该程序 发现序列之间的相似性区域,且为每个这样的区域报导一个"E值",所述E值为预期在含有 随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。此数据库的尺寸是由 bl2seq程序中的默认值设定。对于远小于1的小E值而言,E值大致为这样的随机匹配的 机率。
[0444] 当与任一特别鉴别的序列相比较时,变体多核苷酸序列优选地表现出小于1x10' 更优选地小于1x10'更优选地小于lxl(T12、更优选地小于lxl(T15、更优选地小于lxl(T18、更 优选地小于lxl(T21、更优选地小于lxl(T3°、更优选地小于lxl(T4°、更优选地小于lxl(T5°、更 优选地小于lxl〇_6°、更优选地小于lxl〇_7°、更优选地小于lxl〇_8°、更优选地小于lxl〇_9°和最 优选地小于lXl〇_1(l°的E值。
[0445] 或者,本发明的变体多核苷酸或用于本发明方法中的变体多核苷酸在严谨条件下 与指定的多核苷酸序列或其互补序列杂交。
[0446] 术语"在严谨条件下杂交"及其语法等效描述是指,多核苷酸分子在限定的温度及 盐浓度条件下与靶多核苷酸分子(诸如固定于DNA或RNA印迹(诸如DNA印迹或RNA印 迹)上的靶多核苷酸分子)杂交的能力。通过最初在更低严谨性条件下杂交,随后将严谨 性增加至希望的严谨性,可以测定在严谨杂交条件下杂交的能力。
[0447] 关于长度大于约100个碱基的多核苷酸分子,典型的严谨杂交条件为,比天然 双链体的解链温度(Tm)低不超过25至30°C(例如10°C)(-般参见,Sambrook等人 编,1987,MolecularCloning,ALaboratoryManual,第 2版?ColdSpringHarborPress; Ausubel等人,1987,CurrentProtocolsinMolecularBiology,GreenePublishing)。 大于约100个碱基的多核苷酸分子的Tm可通过下式来计算:Tm= 81. 5+0. 41 % (G+C_log(Na+) ? (Sambrook等人,Eds, 1987,MolecularCloning,ALaboratoryManual,第 2版.ColdSpringHarborPress;BoltonandMcCarthy, 1962,PNAS84:1390)。长度大 于100个碱基的多核苷酸的典型严谨条件是这样的杂交条件,诸如在6XSSC、0. 2%SDS的 溶液中预洗涤;在65°C,在6XSSC、0. 2%SDS中杂交过夜;随后在1XSSC、0. 1%SDS中在 65°C进行两次各30分钟的洗涤,并在0. 2XSSC、0. 1%SDS中在65°C进行两次各30分钟的 洗绦。
[0448] 关于长度小于100个碱基的多核苷酸分子,示例性的严谨杂交条件是,比Tm低5 至10°C。平均而言,长度小于100碱基对的多核苷酸分子的Tm降低大约(500/寡核苷酸长 度)。。。
[0449] 关于称为肽核酸(PNA)的DNA模拟物(Nielsen等人,Science. 1991年12月6日; 254 (5037) : 1497-500),Tm值高于DNA-DNA或DNA-RNA杂交物的Tm值,且可使用Giesen等 人,NucleicAcidsRes. 1998年11月1日;26 (21): 5004-6中所述的公式来计算。长度小 于100个碱基的DNA-PNA杂交物的示例性的严谨杂交条件为,比Tm低5至10°C。
[0450] 本发明的变体多核苷酸或用于本发明方法中的变体多核苷酸也涵盖这样的多核 苷酸:其不同于本发明的序列,但因遗传密码的简并性而编码具有与由本发明的多核苷酸 所编码的多肽相似的活性的多肽。不改变多肽的氨基酸序列的序列变化是"沉默变异"。除 ATG(甲硫氨酸)和TGG(色氨酸)以外,同一氨基酸的其它密码子可通过本领域认可的技术 发生改变,例如,以优化在特定宿主有机体中的密码子表达。
[0451]引起编码的多肽序列中的一个或若干个氨基酸的保守置换但不显著改变其生物 活性的多核苷酸序列变化,也包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换 的方法(参见,例如,Bowie等人,1990, Science 247, 1306)〇
[0452]使用从NCBI (ftp://ftp. ncbi. nih. gov/blast/)公开获得的来自BLAST程序套件 (2. 2. 5版[2002年11月])的bl2seq程序,通过先前所述的tblastx算法,可以测定由于 编码的多肽序列中的沉默变异及保守置换而产生的变体多核苷酸。
[0453] 多肽变体
[0454] 就多肽而言,术语"变体"涵盖天然存在的、重组地和合成地生产的多肽。变体多 肽序列优选地与本发明的序列表现出至少50%、更优选至少51%、更优选至少52%、更优 选至少53%、更优选至少54%、更优选至少55%、更优选至少56%、更优选至少57%、更优 选至少58%、更优选至少59%、更优选至少60%、更优选至少61%、更优选至少62%、更优 选至少63 %、更优选至少64 %、更优选至少65 %、更优选至少66 %、更优选至少67 %、更优 选至少68%、更优选至少69%、更优选至少70%、更优选至少71%、更优选至少72%、更优 选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优 选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优 选至少83 %、更优选至少84 %、更优选至少85 %、更优选至少86 %、更优选至少87 %、更优 选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优 选至少93 %、更优选至少94 %、更优选至少95 %、更优选至少96 %、更优选至少97 %、更优 选至少98 %和最优选至少99%同一,性。在本发明的多肽的至少20个氨基酸位置、优选至 少50个氨基酸位置、更优选至少100个氨基酸位置且最优选整个长度的比较窗上,发现同 一性。
[0455] 多肽序列同一性可以如下方式测定。在bl2seq中使用BLASTP(来自BLAST程序 套件,2. 2. 5版[2002年11月])将主题多肽序列与候选多肽序列进行比较,bl2seq可从 NCBI (ftp://ftp. ncbi. nih. gov/blast/)公开获得。除应关闭对低复杂性区域的过滤以外, 利用bl2seq的默认参数。
[0456] 使用总体序列比对程序,也可在候选序列与主题多核苷酸序列之间的重叠部分的 整个长度上计算多肽序列同一性。如上文所论述的EMB0SS_needle(可获自111^口:/\¥¥¥. ebi.ac.uk/emboss/align/)及GAP (Huang. X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235.),也是适用于计算多肽序列同 一性的总体序列比对程序。
[0457] 用于计算多肽%序列同一,性的优选方法,是基于使用Clustal X(Jeanmougin等 人,1998, Trends Biochem. Sci. 23, 403-5)比对待比较的序列。
[0458] 本发明的多肽变体或用于本发明方法中的多肽变体也涵盖这样的多肽变体:其展 现与可能保留序列的功能等效性的一个或多个特别鉴别的序列的相似性,且不能合理地预 期随机发生。使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得的来自BLAST程序 套件(2. 2. 5版[2002年11月])的bl2seq程序,可以测定有关多肽的这种序列相似性。可 使用以下unix命令行参数检验多肽序列的相似性:
[0459] bl2seq - i peptideseql -jpeptideseq2_F F - p blastp
[0460] 当与任一特别鉴别的序列相比较时,变体多肽序列优选地表现出小于1x10'更优 选地小于lxl0_9、更优选地小于lxl0_12、更优选地小于lxl0_15、更优选地小于lxl0_18、更优选 地小于lxl(T21、更优选地小于lxl(T3°、更优选地小于lxl(T4°、更优选地小于lxl(T5°、更优选 地小于lxl(T6°、更优选地小于lxl(T7°、更优选地小于lxl(T8°、更优选地小于lxl(T9°和最优选 地小于1x10%°的E值。
[0461] 参数-FF关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。该程序 发现序列之间的相似性区域,且为每一个这样的区域报导一个"E值",所述E值为预期在含 有随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。对于远小于1的小E 值而言,E值大致为该随机匹配的机率。
[0462] 所述多肽序列的一个或若干个氨基酸的保守置换(不显著改变其生物活性)也 包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换的方法(参见,例如,Bowie等 人,1990, Science 247, 1306)〇
[0463] 构建体、载体及其组分
[0464] 术语"遗传构建体"是指多核苷酸分子,通常为双链DNA,其中可能已插入另一个多 核苷酸分子(插入多核苷酸分子),例如,但不限于,cDNA分子。遗传构建体可含有允许转 录所述插入多核苷酸分子且任选地将转录物翻译为多肽的必需元件。所述插入多核苷酸分 子可源自宿主细胞,或可源自不同细胞或有机体,和/或可为重组多核苷酸。一旦在宿主细 胞内,遗传构建体则可整合进宿主染色体DNA中。所述遗传构建体可连接至载体上。
[0465] 术语"载体"是指多核苷酸分子,通常为双链DNA,其用于将遗传构建体转运至宿主 细胞中。所述载体可能能够在至少一个额外宿主系统(诸如大肠杆菌)中复制。
[0466] 术语"表达构建体"是指这样的遗传构建体:其包括允许转录所述插入多核苷酸分 子且任选地将转录物翻译为多肽的必需元件。表达构建体通常在5'至3'方向包含:
[0467]a)在宿主细胞(构建体将转化进其中)中具有功能的启动子,
[0468]b)待表达的多核苷酸,和
[0469]c)在宿主细胞(构建体将转化进其中)中具有功能的终止子。
[0470] 术语"编码区"或"开放读码框"(0RF)是指,能够在适当调控序列控制下生产转录 产物和/或多肽的基因组DNA序列或cDNA序列的有义链。在某些情况下,可通过5'翻译 起始密码子和3'翻译终止密码子的存在来鉴别编码序列。当插入遗传构建体中时,"编码 序列"在可操作地连接至启动子及终止子序列的情况下能够被表达。
[0471]"可操作地连接"是指,将待表达的序列放置在调控元件的控制下,所述调控元件 包括启动子、组织特异性调控元件、临时调控元件、增强子、抑制子及终止子。
[0472] 术语"非编码区"是指,在翻译起始位点的上游并在翻译终止位点的下游的非翻译 序列。这些序列也分别称为5'UTR和3'UTR。这些区域包括转录起始及终止、mRNA稳定性 及调节翻译效率所需的元件。
[0473] 终止子为终止转录的序列,且见于翻译序列的下游基因的3'不翻译端。终止子为 mRNA稳定性的重要决定因素,且在有些情况下,已发现具有空间调节功能。
[0474] 术语"启动子"是指,在编码区上游的调苄基因转录的非转录顺式调控元件。启动 子包含指定转录起始位点的顺式引发元件及保守盒(诸如TATA盒),及被转录因子结合的 基序。编码序列内的内含子也可调节转录,且影响转录后加工(包括剪接、加帽及聚腺苷酸 化)。
[0475]启动子可与待表达的多核苷酸同源。这意味着,在自然界中发现启动子与多核苷 酸可操作地连接。
[0476] 或者,启动子可与待表达的多核苷酸异源。这意味着,在自然界中未发现启动子与 多核苷酸可操作地连接。
[0477] 在某些实施方案中,本发明的嵌合体DGAT1多核苷酸/多肽可以在如下所述的选 定启动子序列的控制下有利地表达。
[0478] 营养组织特异性启动子
[0479] 营养特异性的启动子的实例参见:US6, 229, 067;和US7, 629, 454;和US 7, 153, 953;和US6, 228, 643。
[0480] 花粉特异性启动子
[0481] 花粉特异性的启动子的实例参见:US7, 141,424;和US5, 545, 546;和US 5, 412, 085;和US5, 086, 169;和US7, 667, 097。
[0482] 种子特异性启动子
[0483] 种子特异性的启动子的实例参见:US6, 342, 657;和US7, 081,565;和US 7, 405, 345;和US7, 642, 346;和US7, 371,928。优选的种子特异性启动子是甘蓝型油菜中 油菜籽蛋白的启动子(Josefsson等,1987,JBiolChem. 262(25) : 12196-201 ;Ellerstr6m 等,1996,PlantMolecularBiology,第 32 卷,第 6 期,第 1019-1027 页)。
[0484] 果实特异性启动子
[0485] 果实特异性的启动子的实例参见:US5, 536, 653;和US6, 127, 179;和US 5, 608, 150;和US4, 943, 674。
[0486] 非光合组织偏好性启动子
[0487] 非光合组织偏好性启动子包括在植物的非光合组织/器官中偏好性表达的那些 启动子。
[0488] 非光合组织偏好性启动子也可包括光抑制性的启动子。
[0489] 光抑制性的启动子
[0490] 光抑制性的启动子的实例参见:US5, 639, 952和US5, 656, 496。
[0491] 根特异性启动子
[0492] 根特异性启动子的实例参见:US5, 837, 848;和US2004/0067506和US 2001/0047525。
[0493] 块茎特异性启动子
[0494] 块茎特异性启动子的实例参见US6, 184, 443。
[0495] 鳞茎特异性启动子
[0496]鳞茎特异性启动子的实例参见"Smeets等,(1997)PlantPhysiol. 113:765-771"。
[0497] 根莖偏好性启动子
[0498] 根茎偏好性启动子的实例参见"SeongJang等,(2006)Plant Physiol. 142:1148-1159"。
[0499] 胚乳特异性启动子
[0500] 胚乳特异性启动子的实例参见US7, 745, 697。
[0501] 球茎启动子
[0502] 球茎中能够启动表达的启动子的实例参见"Schenk等,(2001)PlantMolecular Biology, 47:399-412"。
[0503] 光合组织偏好性启动子
[0504] 光合组织偏好性启动子包括在植物的光合组织中偏好性表达的那些。植物的光合 组织包括叶、茎、芽和地面以上的部分。光合组织偏好性启动子包括光调节性启动子。
[0505] 光调节性启动子
[0506] 许多光调节性启动子是本领域技术人员已知的,包括(例如)叶绿素a/b(Cab)结 合蛋白启动子和核酮糖-1,5_二磷酸羧化酶(Rubisco)小亚基(SSU)启动子。光调节性启 动子的实例参见US5, 750, 385。在本文中光调节是指光可诱导的或光诱导的。
[0507] "转基因"是这样的多核苷酸:其取自一种有机体,且通过转化引入不同的有机体 中。转基因可源自与引入该转基因的有机体物种相同的物种或不同的物种。
[0508] 宿主细胞
[0509] 宿主细胞可源自例如细菌、真菌、酵母、昆虫、哺乳动物、藻类或植物有机体。宿主 细胞也可为合成细胞。优选的宿主细胞为真核细胞。特别优选的宿主细胞为植物细胞,尤 其是在植物营养组织中的植物细胞。
[0510] "转基因植物"是指,含有经遗传操纵或转化而生产的新遗传物质的植物。所述新 遗传物质可源自与所得转基因植物相同物种或不同物种的植物。
[0511] 分离或制备多核苷酸的方法
[0512] 使用本领域普通技术人员已知的多种技术,可以分离本发明的多核苷 酸分子。作为实例,通过使用在Mullis等人编,1994版,ThePolymeraseChain Reaction,Birkhauser(通过引用并入本文)中所述的聚合酶链式反应(PCR),可以分离这 样的多肽。使用源自本发明的多核苷酸序列的如本文所定义的引物,可以扩增本发明的多 肽。
[0513] 用于分离本发明的多核苷酸的其它方法包括:使用具有本文所述的序列的所有或 部分多肽作为杂交探针。使标记的多核苷酸探针与固定在固体支持物(诸如硝化纤维素滤 膜或尼龙膜)上的多核苷酸杂交的技术,可以用于筛选基因组或cDNA文库。示例性的杂交 及洗涤条件为:在65°C,在5.OXSSC、0. 5%十二烷基硫酸钠、IX登哈特溶液中杂交20小时; 在1.0XSSC、1% (w/v)十二烷基硫酸钠中洗涤(在55°C进行三次各20分钟的洗涤),和任 选地在60°C、在0. 5XSSC、1% (w/v)十二烷基硫酸钠中洗涤一次(20分钟)。可选的进一 步洗涤(20分钟)可在60°C、在0. 1XSSC、1% (w/v)十二烷基硫酸钠的条件下进行。
[0514] 通过本领域中熟知的技术,诸如限制性核酸内切酶消化、寡核苷酸合成及PCR扩 增,可以生产本发明的多核苷酸片段。
[0515] 可在本领域熟知的方法中使用部分多核苷酸序列来鉴别相应的全长多核 苷酸序列。这样的方法包括基于PCR的方法、5'RACE(FrohmanMA, 1993,Methods Enzymol. 218:340-56)及基于杂交的方法、基于计算机/数据库的方法。此外,举例来说,反 向PCR允许获取未知序列,所述序列侧接本文中所公开的多核苷酸序列,从基于已知区域 的引物起始(Triglia等人,1998,NucleicAcidsRes16,8186,通过引用并入本文)。该 方法使用若干限制酶,以在基因的已知区域中产生合适的片段。随后通过分子内连接环化 该片段,且将其用作PCR模板。从已知区域设计不同引物。为了以物理方式装配全长克隆, 可利用标准分子生物学方法(Sambrook等,MolecularCloning:ALaboratoryManual,第 2 版,ColdSpringHarborPress, 1987)。
[0516] 当从特定物种生产转基因植物时,有益地用源自该物种的一个或多个序列转化这 样的植物。所述益处可以是,减少公众对于生产转基因有机体中的跨物种转化的关注。另 外,当基因减量调节是希望的结果时,可能必须利用与需要减少其表达的植物中的序列相 同(或至少高度相似)的序列。尤其出于这些原因,希望能够在若干不同植物物种中鉴别 及分离特定基因的直系同源物。
[0517] 可通过描述的方法来鉴别变体(包括直系同源物)。
[0518] 鉴别变体的方法
[0519] 物理方法
[0520] 变体多肽可使用基于PCR的方法来鉴别(Mullis等人编,1994ThePolymerase ChainReaction,Birkhauser)〇
[0521] 通常,引物的多核苷酸序列用于通过PCR扩增本发明的多核苷酸分子的变体,所 述引物的多核苷酸序列可以是基于编码相应氨基酸序列的保守区的序列。
[0522] 或者,可使用本领域技术人员熟知的文库筛选法(Sambrook等人,Molecular Cloning:ALaboratoryManual,第 2 版,ColdSpringHarborPress, 1987)。当鉴别探针 序列的变体时,通常相对地降低杂交和/或洗涤严谨性,直至找到确切序列匹配。
[0523] 也可通过物理方法鉴别多肽变体,例如使用针对本发明多肽产生的抗体筛选表达 文库(Sambrook等人,MolecularCloning:ALaboratoryManual,第 2 版,ColdSpring HarborPress, 1987),或借助于这样的抗体鉴别来自天然来源的多肽。
[0524] 基于计算机的方法
[0525] 通过本领域技术人员熟知的基于计算机的方法,使用公共域序列比对算法及用于 搜寻序列数据库的序列相似性搜寻工具(公共域数据库包括Genbank、EMBL、Swiss-Prot、 PIR和其它),也可以鉴别本发明的变体序列(包括多核苷酸及多肽变体)。关于在线资源 的实例,参见,例如,NucleicAcidsRes. 29:1-10和11-16, 2001。相似性搜寻会检索及比 对目标序列,以供与待分析的序列(即,查询序列)进行比较。序列比较算法使用计分矩阵 来为每一比对指派总分。
[0526] 可用于鉴别序列数据库中的变体的程序的 一个示例性家族为BLAST程序套件 (2. 2. 5 版[2002 年 11 月]),包括BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX,它们 可从( ftp://ftp.ncbi.nih.gov/blast/)或国家生物技术信息中心(NationalCenter forBiotechnologyInformation,NCBI)、国立医学图书馆(NationalLibraryof Medicine,Building38A,Room8N805,Bethesda,MD20894USA)公开获得。NCBI服务器也 提供了使用程序来筛选许多可公开获得的序列数据库的设施。BLASTN对照核苷酸序列数据 库比较核苷酸查询序列。BLASTP对照蛋白序列数据库比较氨基酸查询序列。BLASTX对照 蛋白序列数据库比较在所有阅读框架中翻译的核苷酸查询序列。tBLASTN对照核苷酸序列 数据库比较在所有阅读框架中动态翻译的蛋白查询序列。tBLASTX对照核苷酸序列数据库 的六种框架翻译物比较核苷酸查询序列的六种框架翻译物。BLAST程序可以默认参数来使 用,或可视需要改变参数以改进筛选。
[0527]BLAST算法家族(包括BLASTN、BLASTP及BLASTX)的应用,描述于Altschul等 人,NucleicAcidsRes. 25:3389-3402, 1997 的出版物中。
[0528] 通过BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTX或相似算法产生的查询序列对一 个或多个数据库序列的"命中",会比对及鉴别序列的相似部分。以相似性程度及序列重叠 部分的长度的顺序,排列命中。命中一个数据库序列,一般表不仅在查询序列的一小部分序 列长度上具有重叠。
[0529]BLASTN、BLASTP、BLASTX、tBLASTN及tBLASTX算法也产生比对的"预期"值。预期 值(E)指示,当搜寻含有随机邻接序列的相同尺寸的数据库时,可"预期"偶然见到的命中 数目。预期值系用作判定命中数据库是否表明真正相似性的有效阈值。例如,指派给多核 苷酸命中的〇. 1的E值解释为是指,在所筛选数据库的尺寸的数据库中,可能预期在具有相 似分数的序列的比对部分上仅偶然见到〇. 1匹配。对于在比对及匹配部分上具有〇. 01或 小于0. 01的E值的序列而言,使用BLASTN、BLASTP、BLASTX、tBLASTN或tBLASTX算法发现 数据库中偶然匹配的机率为1%或1%以下。
[0530]可以用CLUSTALW(Thompson,J.D.,Higgins,D.G.andGibson,T.J. (1994) CLUSTALff:improvingthesensitivityofprogressivemultiplesequencealignment throughsequenceweighting,positions-specificgappenaltiesandweightmatrix choice.NucleicAcidsResearch, 22:4673-4680,http://www-igbmc.u~strasbg.fr/ BioInfo/ClustalW/Top.html)或T-COFFEE(CedricNotredame,DesmondG.Higgins,Jaap Heringa,T-Coffee:Anovelmethodforfastandaccuratemultiplesequence alignment,J.Mol.Biol. (2000)302:205-217)),或使用渐进成对比对的PILEUP(Feng和 Doolittle, 1987,J.Mol.Evol. 25, 351),进行一组相关序列的多重序列比对。
[0531] 可利用图样识别软件应用来找到基序或标签序列。例如,MEME(用于基序引出的 多个Em)在一组序列中找到基序及标签序列,且MAST(基序比对及搜寻工具)使用这些基 序在查询序列中鉴别相似或相同基序。提供MAST结果作为与适当统计资料及所找到基序 的目视全览的一系列比对。MEME和MAST由圣地亚哥的加利福尼亚大学(Universityof California,SanDiego)开发。
[0532]PROSITE(Bairoch和Bucher, 1994,NucleicAcidsRes.22,3583;Hofmann等 人,1999,NucleicAcidsRes. 27,215)是鉴别从基因组或cDNA序列翻译的未表征蛋白的 功能的方法。PR0SITE数据库(www.expasy.org/prosite)含有生物学显著图样及特性,且 被设计成使得其可与适当计算工具一起使用,以向已知蛋白家族指派新序列或判定哪个已 知域存在于该序列中(Falquet等人,2002,NucleicAcidsRes. 30, 235)。Prosearch是能 够以既定序列图样或标签搜寻SWISS-PR0T及EMBL数据库的工具。
[0533] 分离多肽的方法
[0534] 本发明的多肽或用于本发明方法中的多肽(包括变体多肽)可使用本领域 中熟知的肽合成方法来制备,诸如使用固相技术进行直接肽合成(例如Stewart等 人,1969,Solid-PhasePeptideSynthesis,WHFreemanCo,SanFranciscoCalifornia), 或例如使用AppliedBiosystems431A肽合成仪(FosterCity,California)进行自动合 成。多肽的突变形式也可在所述合成期间产生。
[0535] 本发明的多肽及变体多肽或用于本发明方法中的多肽及变体多肽也可使用本领 域中熟知的多种技术(例如〇61^8(:1161'编,1990,]^1:11〇(18;[11£112:71]1〇1〇87,第182卷,6111(16 toProteinPurification)从天然来源纯化。
[0536] 或者,本发明的多肽及变体多肽或用于本发明方法中的多肽及变体多肽可在合适 的宿主细胞中重组表达,并与细胞分离,如下文所论述。
[0537] 制备构建体及载体的方法
[0538] 本发明的遗传构建体包含一个或多个本发明的多核苷酸序列和/或编码本发明 的多肽的多核苷酸,且可用于转化例如细菌、真菌、昆虫、哺乳动物或植物有机体。本发明的 遗传构建体意欲包括如本文中所定义的表达构建体。
[0539] 制备及使用遗传构建体及载体的方法是本领域中熟知的,且一般描述于: Sambrook等人,MolecularCloning:ALaboratoryManual,第 2 版,ColdSpring HarborPress, 1987;Ausubel等人,CurrentProtocolsinMolecularBiology,Greene Publishing, 1987 中。
[0540]制备包含多核苷酸、构建体或载体的宿主细胞的方法
[0541] 本发明提供了一种宿主细胞,其包含本发明的遗传构建体或载体。
[0542] 包含本发明的遗传构建体(诸如表达构建体)的宿主细胞可用于本领域熟知的方 法中(例如Sambrook等人,MolecularCloning:ALaboratoryManual,第2版ColdSpring HarborPress, 1987;Ausubel等人,CurrentProtocolsinMolecularBiology,Greene Publishing,1987),用于重组制备本发明的多肽。这样的方法可能包括,在适用于或有助 于表达本发明的多肽的条件下,在适当介质中培养宿主细胞。随后,通过本领域熟知的方 法(例如Deutscher编,1990,MethodsinEnzymology,第 182 卷,GuidetoProtein Purification),可以将表达的重组多肽(其可以任选地分泌至培养物中)与介质、宿主细 胞或培养基分尚。
[0543] 制备包含构建体及载体的植物细胞及植物的方法
[0544] 本发明另外提供了包含本发明的遗传构建体的植物细胞,及经修饰以改变本发明 多核苷酸或多肽的表达的植物细胞、或用于本发明方法的植物细胞。包含这样的细胞的植 物也形成本发明的一个方面。
[0545] 用多肽转化植物细胞、植物及其部分的方法,参见:Draper等人,1988,Plant GeneticTransformationandGeneExpression.ALaboratoryManual二BlackwellSci. Pub.Oxford,第 365 页;Potrykus和Spangenburg, 1995,GeneTransfertoPlants. Springer-Verlag,Berlin.;和Gelvin等人,1993,PlantMolecularBiol.Manual. KluwerAcad.Pub.Dordrecht。对转基因植物(包括转化技术)的综述,参见:Galun和 Breiman, 1997,TransgenicPlants.ImperialCollegePress,London。
[0546] 植物的遗传操纵方法
[0547]可利用许多植物转化策略(例如,Birch, 1997,AnnRevPlantPhysPlantMol Biol,48,297,HellensRP,等人(2000)PlantMolBiol42:819-32,HellensR等人Plant Meth1:13)。例如,策略可设计成增加多核苷酸/多肽在通常表达所述多核苷酸/多肽的 植物细胞、器官中和/或在特定发育阶段的表达,或在通常不表达所述多核苷酸/多肽的细 胞、组织、器官中和/或在特定发育阶段异位表达所述多核苷酸/多肽。表达的多核苷酸/ 多肽可源自待转化的植物物种,或可源自不同植物物种。
[0548] 转化策略可设计成减少多核苷酸/多肽在通常表达所述多核苷酸/多肽的植物细 胞、组织、器官中或在特定发育阶段的表达。这样的策略称为基因沉默策略。
[0549] 用于在转基因植物中表达基因的遗传构建体通常包括:用于驱动一个或多个克隆 的多核苷酸的表达的启动子、终止子、及用于检测遗传构建体在转化植物中的存在的选择 标记序列。
[0550] 适用于本发明的构建体中的启动子在单子叶植物或双子叶植物的细胞、组织或器 官中具有功能,且包括细胞特异性的、组织特异性的及器官特异性的启动子、细胞周期特异 性的启动子、时间启动子、诱导型启动子、在大多数植物组织中具有活性的组成型启动子、 及重组启动子。在必要时,启动子的选择将取决于克隆的多核苷酸的时间及空间表达。启 动子可为通常与目标转基因有关的启动子,或源自其它植物、病毒及植物病原性细菌及真 菌的基因的启动子。本领域技术人员无需过多实验就能够选出适用于使用包含本发明的多 核苷酸序列的遗传构建体改良及调节植物特性的启动子。组成型植物启动子的实例包括: CaMV35S启动子、胆脂碱合酶启动子及章鱼碱合酶启动子、及来自玉蜀黍的Ubi1启动子。 在特定组织中具有活性的植物启动子,会对内部发育信号或外部非生物的或生物的应激做 出响应,这描述于科学文献中。示例性的启动子描述于例如W0 02/00894和W02011/053169 中,该文献通过引用并入本文中。
[0551] 常用于植物转化遗传构建体中的示例性的终止子包括,例如,花椰菜花叶病毒 (CaMV)35S终止子、根癌土壤杆菌(Agrobacteriumtumefaciens)胆脂碱合酶或章鱼碱合 酶终止子、玉蜀黍zein基因终止子、水稻(Oryzasativa)ADP_葡萄糖焦磷酸化酶终止子及 马铃薯(Solanumtuberosum)PI-II终止子。
[0552] 常用于植物转化中的选择标记包括:赋予卡那霉素抗性的新霉素磷酸转移酶 II基因(NPTII)、赋予壮观霉素及链霉素抗性的aadA基因、赋予Ignite(AgrEv〇)及 BastaOtoechst)抗性的草胺膦乙酰转移酶(bar基因)及赋予潮霉素抗性的潮霉素磷酸转 移酶基因(hpt)。
[0553] 也预见到遗传构建体的应用,所述遗传构建体包含可用于植物及植物组织 中的启动子表达分析的报告基因(表达对于宿主而言外来的活性、通常为酶活性 和/或可见信号(例如荧光素酶、GUS、GFP)的编码序列)。报告基因文献论述于 Herrera-Estrella等人,1993,Nature303,209,和Schrott, 1995,见:GeneTransferto Plants(Potrykus,T.,Spangenberg编)SpringerVerlag.Berline,第 325-336 页。
[0554] 下面是公开了可用于遗传转化以下植物物种的遗传转化方案的代表性出版物: 稻米(Alam等,1999,PlantCellRep. 18, 572);苹果(Yao等,1995,PlantCellReports 14, 407-412);玉米(美国专利第5, 177, 010号及第5, 981,840号);小麦(Ortiz等, 1996,PlantCellR印? 15, 1996, 877);番茄(美国专利第 5, 159, 135 号)、马铃薯 (Kumar等人,1996PlantJ. 9,:821);木薯(Li等,1996Nat.Biotechnology14, 736); 萬苣(Michelmore等,1987,PlantCellRep. 6,439);烟草(Horsch等,1985,Science 227,1229);棉花(美国专利第5,846,797号及第5,004,863号)、草类(美国专利第 5, 187, 073 号及第 6, 020, 539 号);薄荷(Niu等人,1998,PlantCellR印? 17, 165);橘类 植物(Pena等,1995,PlantSci.104,183);香菜(Krens等,1997,PlantCellRep,17,39); 香蕉(美国专利第5, 792, 935号);大豆(美国专利第5, 416, 011号、第5, 569, 834号、第 5, 824, 877号、第5, 563, 04455号及第5, 968, 830);菠萝(美国专利第5, 952, 543号)、杨树 (美国专利第4, 795, 855号)、单子叶统称(美国专利第5, 591,616号及第6, 037, 522号)、 芸苔属(美国专利第5, 188, 958号、第5, 463, 174号及第5, 750, 871号)、谷类(美国专利 第 6,074,877 号);梨〇\&^811(^等,2005,?131^〇6111?印.24(1):45-51);李属(1^1116811 等,2006PlantCellRep. 25(8) :821_8;SongandSink2005PlantCellRep. 2006; 25(2):117-23;GonzalezPadilla等,2003PlantCellR印.22(l):38-45);草莓(Oosumi 等,2006Planta.223(6):1219-30;Folta等,2006PlantaApr14;PMID:16614818)、 玫瑰(Li等,2003)、树莓(Graham等,1995MethodsMolBiol. 1995;44:129-33)番 茄(Dan等,2006,PlantCellReportsV25:432-441)、苹果(Yao等,1995,PlantCell Rep.l4,4〇7_4l2)、芥花(大油菜(BrassicanapusL.).(CardozaandStewart, 2〇〇6 MethodsMolBiol. 343:257-66)、红花(Orlikowska等,1995,PlantCellTissueand OrganCulture40:85-91)、黑麦草(Altpeter等,2004DevelopmentsinPlantBreeding 11 (7) :255-250)、稻米(Christou等,1991NatureBiotech. 9:957-962)、玉米(Wang等, 2009In:HandbookofMaizepp. 609-639)及毛花称猴桃(Actinidiaeriantha) (Wang等, 2006,PlantCellR印.25, 5:425-31)。本发明也涵盖其它物种的转化。合适的方法及方案 可获自科学文献中。
【附图说明】
[0555] 图 1 示出了拟南芥(Arabidopsisthaliana)DGATl转录区(SEQIDN0:128)的核 酸序列和三联体密码子框(threeframetranslation)翻译。外显子编码序列用粗体、下 划线、灰色模块示出。
[0556] 图2示出了玉米(Zeamays)短DGAT1转录区(SEQIDN0:129)的核酸序列和三 联体密码子框翻译。与本专利中实际使用的cDNA(EU039830)和肽(ABV91586)序列相比, 该基因组序列中删除了F469并添加了Q67。外显子编码序列用粗体、下划线、灰色模块示 出。
[0557] 图3示出了多个植物(来源于草以及来自双子叶植物的例子)DGAT1的N端胞质 区的肽序列,其包括长的版本和短的版本。左手框表示乙酰CoA结合位点(Nykiforuk等, 2002,BiochimicaetBiophysicaActa1580:95-109)。右手框表不第一跨膜区(McFie 等,2010,JBC.,285:37377-37387)。左手箭头表示外显子1和外显子2之间的界限。右 手箭头表示外显子2和外显子3之间的界限。所述序列为AtDGATl(SEQIDN0:130)、 BjDGATl(SEQIDNO: 131),BnDGATl-AF(SEQIDNO: 132),BjDGATl(SEQIDNO: 133), TmajusDGATl(SEQIDNO: 134),EpDGATl(SEQIDNO: 135),VgDGATl(SEQIDNO: 136), NtDGATl(SEQIDNO: 137),PfDGATl(SEQIDNO: 138),ZmL(SEQIDNO: 139),SbDGATl(SEQ IDN0:140)、0sL(SEQIDN0:141)、0sS(SEQIDN0:142)、SbDGATl(SEQIDN0:143)、 ZmS(SEQIDNO: 144),PpDGATl(SEQIDNO: 145),SmDGATl(SEQIDNO: 146),EaDGATl(SEQ IDNO: 147),VvDGATl(SEQIDNO: 148),GmDGATl(SEQIDNO: 149),GmDGATl(SEQID N0:150)、LjDGATl(SEQIDN0:151)、MtDGATl(SEQIDN0:152)、JcDGATl(SEQIDN0:153)、 VfDGATl(SEQIDNO: 154) ,RcDGATl(SEQIDNO: 155),PtDGATl(SEQIDN0:156),Pt DGAT1(SEQIDNO:157)〇
[0558] 图4示出了赖氨酸(K)和精氨酸(R)残基的键线式结构。 实施例
[0559] 实施例1 :植物DGAT1序列选择以及剪接位点预测
[0560] 植物I型DGAT的大部分核酸序列和多肽序列可通过登录号在公共文库中找到 (表 1)。我们使用ClustalW(Thompson等,1994,NucleicAcidsRes.,22, 4673-4680)创 建初始比对;对其进行人工编辑并用于创建模型,从而使用HMMER2包(HMMER2. 3. 2(0ct 2003)Copyright? 1992-2003HHMI/WashingtonUniversitySchoolofMedicine,可 从http://hmmer.org得到)搜索DGAT序列。使用GeneWise包(Birney等,2004,Genome Res. 14:988-995)对蛋白序列和基因组DNA进行初始配对以及剪接位点预测。其中一些检 索的序列似乎存在错误;特别是错误地预测到的剪接位点,其将导致内部缺失,从而很可能 得到无功能蛋白。双子叶和单子叶I型DGAT均具有16个外显子,而在剪接位置中有一些 差另U。双子叶DGAT1基因中的外显子8对应于单子叶DGAT1基因中的外显子8和9,而单子 叶基因中的外显子14对应于双子叶基因中的外显子13和14。我们已经发现由基因组数 据确定可能的真实编码序列的最精确方法是使用VectorNTIAdvance(TM) 11. 0(^_ 2008 InvitrogenCorporation),以正向三联体密码子阅读框翻译基因组然后将其与合适的源 自双子叶或单子叶物种的已经证实的功能性DGAT1比对(例如拟南芥cDNANM_127503、蛋 白NP_179535以及玉米cDNAEU039830、蛋白ABV91586)。图1和2中分别示出了拟南芥中编 码NP_179535以及玉米中编码ABV91586的基因组序列和对应的外显子/内含子界限位置, 其可以作为模板用于确定其他植物的DGAT编码区。示出了该模板用于确定玉米DGAT1SEQ 10勵:10和5£〇10勵:39的用途的实例。
[0561]表1
[0562]
[0563]
[0564] 实施例2 :制备嵌合体DGAT1蛋白以供在细胞中表达
[0565] 对编码氨基酸序列3£〇10勵:30、34、39、41、42和44(表1)的核酸构建体进行优 化以供在GeneArtAG公司(德国)的酿酒酵母中表达。对这些序列进行工程改造使其在 编码保守N端乙酰Co结合区的外显子1 (由Weselake在2006年鉴定)内部具有内部Xhol 位点,而不改变亮氨酸-丝氨酸-丝氨酸(LSS)的氨基酸序列。
[0566] 图3示出了多个来自植物的DGAT1序列的比对。左手框示出了乙酰CoA结合位点 的位置。
[0567] 经工程改造在5'编码序列的上游插入EcoRI位点并在3'终止密码子下游设置 Xbal位点。内部Xhol以及侧翼的EcoRI和Xbal位点用于在各个原始DGAT1克隆之间产 生嵌合体;基本上这将一个DGAT1的N端所谓的胞质区(基于Weselake等,2006和McFie 等,2010)与另一不同的DGAT1的C端ER腔区域融合。在一些组合中,这使得经工程改造的Xhol位点下游的剩余胞质区中一个氨基酸发生改变。在Xhol位点下游,拟南芥DGAT1、旱 金莲DGAT1、玉米-LDGAT1和水稻-LDGAT1的推定的乙酰Co结合区具有一致的氨基酸序列 (LSSDAIFSQSHA)。玉米-SDGAT1和水稻-SDGAT1中的赖氨酸(]〇残基被精氨酸(E)残基 取代(LSSDAIFSQSHA)。由于该残基的位置位于由LLS编码的Xhol位点的3',源自含有赖 氨酸亲本和含有精氨酸亲本的嵌合体将有效地导致该残基的置换。由于赖氨酸和精氨酸均 为分别在脂肪侧链含有一个具有胺基或胍基的较大的、带正电的、亲水的碱性氨基酸(图 4),因此,认为上述置换干扰程度最小。表2中示出了N端区域/C端区域的结构域交换构 建体的全部列表,以及其分别对应的SEQIDN0:59-94。
[0568] 表2
[0569]
[0570]
[0571] 通过GENEARTAG公司(德国)或GeneScript公司(美国)合成序列。为了在酿酒 酵母中表达而优化所述序列,并在其侧翼添加合适的限制位点以利于将其克隆入PYES2. 1 载体(Invitrogen公司)。
[0572] 实施例3 :嵌合体DGAT1序列在细胞中的表达
[0573] 构建体在酿酒酵母中的表达
[0574] 将亲代DGAT1构建体和嵌合体DGAT1构建体置入半乳糖诱导的酵母表达载体 pYESZ.l/VS-HisTOPC^ (Invitrogen公司)中。结果添加了框内C端V5表位和6x组氨 酸标签。表2中示出了嵌合体构建体以及其对应肽序列的编号。
[0575] 酿酒酵母四倍突变体(H1246)中,所有4个中性脂质生物合成基因被干扰 (Sandager等,2002,TheJournalofBiologicalChemistry, 277:6478-6482),如 Elble(1992,BioTechniques13, 18-20),转化上述酿酒酵母并且通过其在尿喃啶的缺乏下 能够生长的能力进行筛选。通常,酿酒酵母在含有0. 67%YNB、不含尿嘧啶且含有2%葡萄 糖的合成培养基(SC-U)中需氧过夜生长。将来自过夜培养物的细胞接种在200mL的诱导培 养基(含有2%半乳糖和1%棉子糖的5^)中,至初始00_为0.4。使细胞继续在30°〇、 200rpm转速振动下生长直到稳定期后期,通常是48小时。在1500xg下离心5分钟收获细 胞 ,然后用蒸馏水洗涤细胞团,可直接用于后续分析或保留在_80°C下备用。用于中性脂质 提取的细胞团经冷冻干燥48小时并储存在-20°C的冰箱内下备用。
[0576] 酿酒酵母的脂质分析
[0577] 精确称量大约10mg的冻干酵母细胞原料,然后用玻璃珠涡旋混合1分钟使其裂 解。在热的氯化氢的甲醇溶液中提取裂解物用于脂肪酸甲酯(FAME)分析(Browse等, 1986,Anal.Biochem. 152, 141-145)〇
[0578] 为了进行FA组成分析,将大约50mg的冻干酵母置于13-mm螺旋盖试管中,加入 等体积的玻璃珠,然后高速涡旋混合3次,每次1分钟。然后加入50 y g的19:0TAG内标、 2. 4mL的溶于MeOH的0. 17M NaCl,将所述混合物进行涡旋混合15秒,然后加入4. 8mL的庚 烷,并混合全体内容物。
[0579] 然后在80°C水浴中孵育溶液2小时,期间不晃动。孵育后,使溶液冷却至室温。冷 却后,将上层(脂质层)转移至新的螺旋盖试管中,并在氮蒸汽下蒸发至干燥。然后将经干 燥的残余物溶于lml庚烧中并彻底混合用于TAG SPE分离,所述分离使用Strata Si-1娃 胶柱(Phenomenwx,8B-S012_EAK)〇
[0580] 用甲醇预处理并用庚烷平衡硅胶柱,使lmLTAG提取物(包括50yg17: 0TAG内 标)通过该预平衡的柱子,接着是1.2mL的庚烷,然后是2mL的氯仿:庚烷(l:9v/v),收集 洗脱液。收集到的全部洗脱液在氮蒸汽下蒸发至干燥,并且残余物用于FAME提取。
[0581]提取的TAG的FAME
[0582]向上述的TAG残余物中加入10yL的内标15:OFA(4mg/mL溶于庚烷),以及lmL含 有5% 2, 2-二甲氧基丙烷(作为去水剂)的氯化氢的甲醇溶液(1N)。
[0583] 然后用氮气吹扫所述试管,然后直接用聚四氟乙烯内衬盖密封,并在80°C水浴中 加热1小时。冷却后,加入0. 6mL庚烷和1.OmL的0. 9 % (w/v)NaCl,然后以500rpm涡旋混 合所述混合物1分钟。
[0584] 从顶部庚烷层收集100yL,并转移到小瓶中的平底玻璃插瓶,以供FAMESGC/MS 分析。
[0585] 蛋白提取和胰蛋白酶消化
[0586] 用裂解液(50mM磷酸钠、pH7. 4、lmMEDTA、5%甘油、ImMPMSF)洗涤酵母细胞团, 然后重悬于500yL裂解缓冲液中,加入玻璃珠并以中速涡旋混合2次,每次30秒,由此破 坏细胞。细胞碎片在l〇〇〇Xg下离心5分钟形成小团,将上清液转移到新试管中,并将全部 细胞膜通过在100, 〇〇〇xg下超速离心法离心1小时形成小团。用或不用去垢剂(1%十二烷 基麦芽糖苷)将膜蛋白重悬于裂解缓冲液中,并使用QubitIT定量试剂盒在Qubit荧光计 上定量。
[0587] 向50yL的蛋白提取物中加入胰蛋白酶,使酶的终浓度达到25yg/mL,然后所述 混合物在30°C下孵育30分钟。加入来自大豆的胰蛋白酶抑制剂(Sigma-Aldrich目录 号#T6414)直至终浓度达到0. 4yg/yL从而终止反应。加入胰蛋白酶抑制剂后,加入4x SDS上样染料和10x还原剂(Invitrogen公司),在70°C下孵育所述蛋白质10分钟,然后 进行SDS-PAGE,之后进行免疫印迹。所述印迹用下述两者之一作为探针:以1:2500稀释 的抗V5-HRP抗体(目录号#1?96125,Invitrogen公司)、或在兔(SC-33630,SantaCruz Biotechnology公司)中产生的以1:200稀释的抗Kar2(y-115)抗体。抗Kar2用于检测酵 母蛋白Kar2,该蛋白为内质网腔内定位蛋白(Rose等,1989,Cell57, 1211-1221),并作为 对照以示出完整微粒体的存在。
[0588] 实施例4 :嵌合体DGAT1在甘蓝型油菜中的表达
[0589] 使用实施例2中所述的相同策略产生多种嵌合体DGAT1构建体以供在甘蓝型油 菜的种子中表达。通过对包括旱金莲DGAT1、玉米-LDGAT1和玉米-SDGAT1 (分别为表1 中的氨基酸序列3£〇10勵:34、39和44)的亲代06411进行优化以供在6£呢41^46提供 的甘蓝型油菜中表达。旱金莲构建体经工程改造后包含单点突变S197A(Xu等,2008,Plant BiotechnologyJournal, 6:799-818)。如下表3所示,所有构建体经工程改造使其具有优 化的Kozak、拟南芥UBQ10内含子以及四核苷酸终止密码子,如Scott等所述(2010,Plant BiotechnologyJournal, 8:912-917)〇
[0590] 表 3
[0591]
[0592] 对甘蓝型油菜优化的构建体使用与生成在酿酒酵母中表达的嵌合体所用的相同 消化方式(实施例2)以产生构建体1'111-21115 ;1'111-21^;21115-1'111(517(^);21^-1'111(51894) ;得到 表4所列出的肽序列(在甘蓝型油菜中表达的区域1DGAT1嵌合体)
[0593]表 4
[0594]
[0595] 将亲代DGAT以及它们的嵌合体转入GatewayK兼容二元载体pMD107(来自Dr MarkSmith的惠赠,NRCSaskatoon,SK,Canada,S7N0W9),使它们受到种子特异性油菜 籽蛋白启动子(Ellerstr6m等,1996,PlantMolecularBiology,第 32 卷,第 6 期,第 1019-1027页)的控制。
[0596] 植物转化
[0597] 使用子叶共培养方法(得自Maloney等,1989,PlantCellR印.8, 238-242),通过 根瘤土壤杆菌(GV3101)转化甘蓝型油菜(cv.DH12075)。对照株系含有空载体,并且在鉴定 时,无姊妹株的株系随后可用作真实对照。
[0598] 得到大约200种I;转化株系,并且通过GC分析其相应的Ti自交种子中的油含量。 根据油含量或种子重量(8株),选择大约50个独立的转基因株系(包括对照株系)用于下 一代(10个植物/株系)。
[0599] 培植植物,并通过PCR筛选拷贝数和鉴别无姊妹株的株系。通过NMR分析T2种 子中的油含量,每份重复三次。
[0600] 实施例5 :亚麻荠中嵌合体DGAT1的表达
[0601] 上述策略也可用于产生多种嵌合的DGAT1构建体以在亚麻荠和其他植物的种子 中表达。
[0602] 通过GENEARTAG(德国)或GeneScript(美国)合成具有修饰的序列。为了 在芸苔属中表达而优化所述序列,并且该序列包括来自拟南芥DGAT1的内含子(SEQID NO: 105)-内含子3。每个序列侧翼添加了合适的attL重组位点使其能够克隆入克隆 Gateway?适应载体(Invitrogen公司)。
[0603]表5
[0604]
[0605]将亲代DGAT及其改良形式转入GatewayK -兼容性二元pRShlGateway适应性二 元载体(Winichayakul等,2009,Biotechnol.Appl.Biochem. 53, 111 - 122),用甘蓝型油菜 油菜籽蛋白启动子(SEQIDN0:127)置换CaMV35S启动子以修饰所述序列。
[0606] 亚麻荠转化
[0607]使用花序浸渍法(floral-dip)(由Clough和Bent, 1998,PlantJ. 16 (6) : 735-745 的方法更改),通过根瘤农杆菌(GV3101)转化亚麻荠(参照Calena)。基本上,在受控环境 下,将种子播种在l〇cm盆的栽培基质中,种植大约6周后,在真空(70-80英寸Hg)下在合 适的农杆菌GV3101细胞的过夜培养物(重悬于花序浸渍缓冲液中)中浸渍花5-14分钟。 真空转化后,通过黑色塑料膜部分覆盖从而在低光照条件下保留植物24小时。大约每隔 10-12天(对应于开花期)重复进行真空转化三次。在受控环境(日长16小时、21-24°C、 65-70%相对湿度)下,使植物在栽培基质中生长。
[0608] 收集产生的种子,并在22°C下用连续光照使其在半强度MS培养基(pH5. 6)筛 选平板(含有1% (w/v)蔗糖、300mg/L特美汀和25mg/LDL-草丁膦)上发芽并并且使秧 苗生长以筛选抗除草剂的转化株。也可用免疫印迹法筛选T2g交种子群体中V5表位是否 存在。
[0609] 可通过GC分析T2自交种子中的油含量。基于油含量或种子重量选择大约50个 独立的转基因株系(包括对照株系)用于下一代(10个植物/株系)。可以种植!^植物, 并用PCR筛选拷贝数和鉴定无姊妹株的株系。通过NMR或GC/MS分析T2种子中的油含量, 每份重复三次。
[0610] 结果
[0611] 交换植物DGAT1的N端区域提高了酿酒酵母中的脂质产生
[0612] 可在不同植物DGAT1之间交换N端胞质区以提高脂质产率。表5-11示出了多种 嵌合体DGAT1的脂质产率,其中N端胞质区来自一种植物DGAT1而该蛋白的剩余部分来自 另一种植物DGAT1。脂质产率用每升所产生的脂质的克数(由此补偿生长速度的差异)表 示、或是用已经校正处理为对应未改良的亲代DGAT1的脂质产率的百分比。
[0613] 表5比较了亲代DGAT1和使用一种供体亲代的N端区域以及不同亲代的C端区域 制备的嵌合体DGAT1。32小时的脂质产率已经相对最高脂质产率的亲代(玉米-L)进行了 校正处理,并且以升序排列。
[0614] 表6比较了旱金莲亲代DGAT1和使用旱金莲作为N端区域的供体亲代或作为C端 区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对C端区域的亲代DGAT1 的脂质产率进行了校正处理。
[0615] 表7比较了水稻-L亲代DGAT1和使用水稻-L作为N端区域的供体亲代或作为C 端区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对C端区域的亲代DGAT1 的脂质产率进行了校正处理。NA表示得不到。
[0616] 表8比较了玉米-L亲代DGAT1和使用玉米-L作为N端区域的供体亲代或作为C 端区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对2-4区域的亲代DGAT1 的脂质产率进行了校正处理。NA表示得不到。
[0617] 表9比较了水稻-S亲代DGAT1和使用水稻-S作为N端区域的供体亲代或作为C 端区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对C端区域的亲代DGAT1 的脂质产率进行了校正处理。NA表示得不到。
[0618] 表10比较了玉米-S亲代DGAT1和使用玉米-S作为N端区域的供体亲代或作为 C端区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对亲代DGAT1的C端 区域的脂质产率进行了校正处理。NA表示得不到。
[0619] 表11比较了拟南芥亲代DGAT1和使用拟南芥作为N端区域的供体亲代或作为C端 区域的供体亲代制备的嵌合体DGAT1。32小时的脂质产率已经相对C端区域的亲代DGAT1 的脂质产率进行了校正处理。NA表示得不到。
[0620]表5
[0621]
[0622]表6

[0636] 交换植物DGAT1的N端区域改变底物特异性
[0637] 表12示出了通过交换N端区域能够改变植物DGAT1的底物特异性,这证明了从过 表达植物DGAT1的酿酒酵母细胞中提取的TAG的脂质组成主要由N端区域的供体决定。在 实施例中特别见于表达N端区域来自拟南芥的DGAT1的细胞,从所述细胞中提取的TAG中 16:0和18:0相对含量高而18:lc9相对含量低。与此相反,在表达N端区域来自水稻-L的 DGAT1的细胞中,TAG中16:0和18:0相对含量低而18:lc9相对含量高。在表达N端区域 来自旱金莲的DGAT1的细胞中,TAG中16:0、18:0和18:lc9的含量适中。
[0638] 表 12
[0639]
[0640] 交换植物DGAT1的N端区域提高了甘蓝型油菜中的脂质产生
[0641] 可以在不同植物DGAT1之间交换N端区域,从而提高甘蓝型油菜种子中的油含量。 表13-14示出了多种含有嵌合体DGAT1的转基因植物的种子油含量,其中嵌合体DGAT1的 N端区域来自一种植物DGAT1而该蛋白的剩余部分(C端区域)来自另一植物DGAT1。在表 13中,种子中的油含量用干物质(DM)的%、以及经校正化处理为对应未修饰DGAT1亲代的 种子油含量的百分比来表不。
[0642]表 13
[0643]
[0644] 在表14中,种子中的油含量用相对于干物质(DM)的%、以及经校正化处理为对应 的分离无姊妹株(NullSib)的种子油含量的百分比来表不。
[0645] 表 14
[0646]
[0647]
[0648] 讨论
[0649] 因此,申请人已经示出了本发明的嵌合体DGAT1蛋白可以用于操纵细胞脂质积聚 和细胞脂质组成。更具体而言,与未改变的DAGT1蛋白相比,本发明的嵌合体DGAT1蛋白 可在真核细胞中实现更高的脂质积聚水平。申请人也示出了通过选择表达特异的嵌合体 DGAT1蛋白,不仅能提高真核细胞的脂质含量也改变了积聚的TAG中的脂质组成。
[0650]US2012/0156360A1中讨论了制备嵌合体植物DGAT1。在实施例11中,作者描 述了使用来自玉米DGAT1的N端和来自榛子DGAT1的C端的两个嵌合体。然而,该嵌合 体的连接位于推定的跨膜结构域,其也位于本申请的申请人所述的嵌合体连接处的下游。 此外,US2012/0156360A1中没有公开关于嵌合体植物DGAT1活性方面的数据。因此,US 2012/0156360A1没有公开本发明的嵌合体DGAT1分子,或者改变的比活性,或使用本发明 的嵌合体产生本文所述的效果的用途。
【主权项】
1. 一种编码嵌合体DGATl蛋白的分离的多核苷酸,所述嵌合体DGATl蛋白包括: a) 在其N末端处的第一DGATl蛋白的N端部分,以及 b) 在其C末端处的第二DGATl蛋白的C端部分。2. 权利要求1所述的多核苷酸,其中与所述第一DGATl蛋白、所述第二DGATl蛋白、或 所述第一DGATl蛋白和所述第二DGATl蛋白这二者相比,所述嵌合体DGATl蛋白具有以下 至少一者: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内积聚性; V)大体上正常的细胞内定位性。3. 权利要求1或2所述的多核苷酸,其中第一DGATl蛋白的N端部分为所述第一DGATl 蛋白的N端胞质区。4. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端胞质区 从第一DGATl蛋白的N端延伸至第一DGATl蛋白的乙酰CoA结合域的末尾。5. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端胞质区 为第一跨膜结构域上游的区域。6. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端部分和 第二DGATl蛋白的C端部分之间的连接位于第一跨膜结构域的上游。7. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端部分和 第二DGATl蛋白的C端部分之间的连接位于第一DGATl蛋白和第二DGATl蛋白的乙酰CoA 结合位点中。8. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端部分和 所述第二DGATl蛋白的C端部分位于第一DGATl蛋白和第二DGATl蛋白的乙酰CoA结合位 点中的对应位置。9. 权利要求1至3中任一项所述的多核苷酸,其中所述第一DGATl蛋白的N端部分和 所述第二DGATl蛋白的C端部分之间的连接位于第一DGATl蛋白和第二DGATl蛋白的乙酰 CoA结合位点中的保守LSS(Leu-Ser-Ser)内。10. 权利要求1至9中任一项所述的多核苷酸,其中所述嵌合体DGATl具有完整的乙酰 CoA结合位点。11. 权利要求1至9中任一项所述的多核苷酸,其中所述嵌合体DGATl内的乙酰CoA结 合位点的长度与第一DGATl蛋白内的乙酰CoA结合位点的长度相同。12. 权利要求1至9中任一项所述的多核苷酸,其中所述嵌合体DGATl内的乙酰CoA结 合位点的长度与第二DGATl蛋白内的乙酰CoA结合位点的长度相同。13. 权利要求1至9中任一项所述的多核苷酸,其中所述嵌合体DGATl内的乙酰CoA结 合位点的长度与第一DGATl蛋白和第二DGATl蛋白内的乙酰CoA结合位点的长度相同。14. 权利要求1至9中任一项所述的多核苷酸,其中在细胞中表达时,所述嵌合体 DAGTl蛋白与第一DGATl蛋白和第二DGATl蛋白中至少一者相比,底物特异性改变。15. -种遗传构建体,其包含权利要求1至15中任一项所述的多核苷酸。16. -种细胞,包含权利要求1至15中任一项所述的多核苷酸。17. 权利要求16所述的细胞,其表达所述嵌合体DGATl。18. 权利要求14所述的细胞,其中与所述第一DGATl、所述第二DGATl、或所述第一 DGATl和所述第二DGATl这二者相比,所述嵌合体DGATl蛋白具有以下至少一者: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内积聚性;以及 V)大体上正常的亚细胞定位性。19. 权利要求16至18中任一项所述的细胞,其比对照细胞产生更多的脂质。20. 权利要求16至18中任一项所述的细胞,该细胞与对照细胞相比,具有改变的脂质 组成。21. 权利要求16至20中任一项所述的细胞,该细胞也被转化以表达以下至少一者:油 质蛋白、油体固醇蛋白、油体钙蛋白、聚油质蛋白、以及包括至少一个人工引入的半胱氨酸 的油质蛋白。22. -种植物,其包含权利要求1至14中任一项所述的多核苷酸。23. 权利要求22所述的的植物,其表达所述嵌合体DGATl。24. 权利要求23所述的植物,其中在所述植物中表达时,与所述第一DGAT1、所述第二 DGATl或所述第一DGATl和所述第二DGATl这两者相比,所述嵌合体DGATl蛋白具有以下至 少一者: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内蛋白积聚性;以及 V)大体上正常的亚细胞定位性。25. 权利要求22至24中任一项所述的植物,与对照植物相比,所述植物在其组织或其 部分的至少一者中、或作为整体产生更多的脂质。26. 权利要求22至25中任一项所述的植物,与对照植物相比,所述植物在其组织或其 部分的至少一者中、或作为整体具有改变的脂质组成。27. 权利要求22至26中任一项所述的植物,该植物也被转化以表达以下至少一者:油 质蛋白、油体固醇蛋白、油体钙蛋白、聚油质蛋白、以及包括至少一个人工引入的半胱氨酸 的油质蛋白。28. -种嵌合体DGATl蛋白,包括: a) 在其N末端处的第一DGATl蛋白的N端部分,以及 b) 在其C末端处的第二DGATl蛋白的C端部分。29. 权利要求28所述的嵌合体DGATl蛋白,其中与所述第一DGAT1、所述第二DGATl或 所述第一DGATl和所述第二DGATl这两者相比,所述嵌合体DGATl蛋白具有以下至少一者: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内积聚性; V)大体上正常的细胞内定位性。30. 权利要求29所述的嵌合体DGATl蛋白,其中所述嵌合体DGATl如权利要求1至14 中任一项所述。31. -种制备嵌合体DGATl蛋白的方法,所述方法包括将以下两者组合: a) 第一DGATl蛋白的N端部分,以及 b) 第二DGATl蛋白的C端部分。32. 权利要求31所述的方法,其中制得的所述嵌合体DGATl蛋白包括: a) 在其N末端处的第一DGATl蛋白的N端部分,以及 b) 在其C末端处的第二DGATl蛋白的C端部分。33. 权利要求31或32所述的方法,其中所述嵌合体DGATl如权利要求1至14中任一 项所述。34. 权利要求31或33中任一项所述的方法,其中与所述第一DGAT1、所述第二DGATl或所述第一DGATl和所述第二DGATl这两者相比,所述嵌合体DGATl蛋白具有以下至少一 者: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内积聚性; V)大体上正常的细胞内定位性。35. 权利要求31或34中任一项所述的方法,其中所述方法包括检测所述嵌合体DGATl 蛋白的以下至少一者的步骤: i) 活性, ii) 稳定性, iii) 低聚性, iv) 细胞内蛋白积聚性, V)细胞内定位性。36. 权利要求31或35中任一项所述的方法,其中所述方法包括选择与所述第一 DGATl、所述第二DGATl或所述第一DGATl和所述第二DGATl这两者相比具有以下至少一者 的嵌合体DGATl蛋白的步骤: i) 增强的DGATl活性; ii) 提尚的稳定性; iii) 改变的低聚性; iv) 大体上正常的细胞内积聚性;以及 V)大体上正常的细胞内定位性。37. 权利要求22至23中任一项所述的植物的部分、繁殖体或子代。38. 权利要求37所述的部分、繁殖体或子代,包含权利要求1至14中任一项所述的多 核苷酸、或权利要求28至30中任一项所述的嵌合体DGATl蛋白中的至少一者。39. 权利要求37或38所述的部分、繁殖体或子代,其与对照部分、对照繁殖体或对照子 代或对照植物的部分、繁殖体或子代相比,产生更多的脂质。40. 权利要求37至39中任一项所述的部分、繁殖体或子代,其与对照部分、对照繁殖体 或对照子代或对照植物的部分、繁殖体或子代相比,脂质组成改变。41. 一种动物饲料,其包含权利要求1至30以及37至40中任一项所述的多核苷酸、构 建体、嵌合体DGATl蛋白、细胞、植物细胞、植物部分、繁殖体和子代中的至少一者。42. -种生物燃料原料,其包含权利要求1至30以及37至40中任一项所述的多核苷 酸、构建体、嵌合体DGATl蛋白、细胞、植物细胞、植物部分、繁殖体和子代中的至少一者。43. -种产生脂质的方法,所述方法包括在植物中表达修饰的权利要求28至30中任一 项所述的DGATl蛋白。44. 权利要求43所述的方法,在植物中表达所述修饰的DGATl蛋白导致所述植物中脂 质的产生。45. 权利要求43或44所述的方法,其中所述方法包括用编码所述修饰的DGATl蛋白的 权利要求1至14中任一项所述的多核苷酸转化植物细胞或植物的步骤。46. 权利要求43至45中任一项所述的方法,包括从所述细胞、植物细胞、或植物、或是 从所述植物的部分、繁殖体或子代中提取脂质的步骤。47. -种制备脂质的方法,所述方法包括从权利要求16至27以及37至40中任一项所 述的细胞、植物细胞、植物、植物部分、繁殖体和子代的至少一者中提取脂质。48. 权利要求43至47中任一项所述的方法,其中所述脂质被加工为以下的至少一种: a) 燃料, b) 油化学品, c) 营养油, d) 化妆油, e) 多不饱和脂肪酸(PUFA),和 f) a)至e)的任意组合。
【专利摘要】本发明提供了嵌合体DGAT1蛋白,包括:a)在其N末端处的第一DGAT1蛋白的N端部分,以及b)在其C末端处的第二DGAT1蛋白的C端部分。与第一DGAT1蛋白和第二DGAT1蛋白中至少一者相比,所述嵌合体DGAT1蛋白示出了增强的活性。本发明的嵌合体DGAT1蛋白可以在细胞中表达从而增加细胞内脂质积聚和/或改变细胞内脂质组成。本发明也提供了编码所述嵌合体DGAT1蛋白的多核苷酸、含有所述多核苷酸或嵌合体DGAT1蛋白的细胞和组合物、以及使用所述嵌合体蛋白制备油的方法。
【IPC分类】C12P7/64, C12N15/29
【公开号】CN104903451
【申请号】CN201380069478
【发明人】尼古拉斯·约翰·罗伯茨, 艾米·克里斯蒂安·柯伦, 宋路泰·威尼查亚库, 玛丽萨·罗丹, 理查德·威廉·斯科特, 大卫·查尔斯·泰勒, 伊丽莎白-弗朗斯·马里利亚
【申请人】农业研究有限公司, 加拿大国家研究委员会
【公开日】2015年9月9日
【申请日】2013年10月22日
【公告号】CA2889985A1, EP2914726A2, US20150284736, WO2014068439A2, WO2014068439A3

最新回复(0)