人g蛋白偶联受体的内源性和非内源性形式的制作方法

xiaoxiao2020-6-24  30

专利名称:人g蛋白偶联受体的内源性和非内源性形式的制作方法
技术领域
本发明涉及跨膜受体,在某些实施方案中,涉及G蛋白偶联受体且,在某些优选实施方案中,涉及被改变从而确立或提高受体组成型活性的内源性GPCR。在某些实施方案中,组成型活化的GPCR可用于直接鉴定作为受体激动剂或反向激动剂的侯选化合物,所述受体激动剂或反向激动剂适于用作治疗剂。
背景技术
虽然人类中存在很多种类的受体,但最丰富而且与治疗最相关的是G蛋白偶联受体(GPCR)。据估计,人类基因组内有大约30,000-40,000个基因,而这些基因中,大约有2%编码GPCR。已经鉴定其内源性配体的受体,包括GPCR被称为“已知”受体,而尚未鉴定其内源性配体的受体被称作“孤独”受体。
GPCR代表了药物产品研发的一个重要领域全部处方药物的大约60%是从100个已知GPCR的大约20个中研发出来的。例如,1999年,在主要的100个商标名处方药物中,下列药物与GPCR相互作用(所治疗的疾病和/或病症在括号中说明)Claritin(过敏) Prozac(抑郁) Vasotec(高血压)Paxil(抑郁) Zoloft(抑郁) Zyprexa(精神病)Cozaar(高血压) Imitrex(偏头痛)Zantac(反流)Propulsid(反流疾病) Risperdal(精神分裂症) Serevent(哮喘)Pepcid(反流) Gaster(溃疡) Atrovent(支气管痉挛)Effexor(抑郁)Depakote(癫痫) Cardura(前列腺肥大)Allegra(过敏)Lupron(前列腺癌) Zoladex(前列腺癌)Diprivan(麻醉) BuSpar(焦虑) Ventolin(支气管痉挛)Hytrin(高血压) Wellbutrin(抑郁) Zyrtec(鼻炎)Palvix(MI/中风) Toprol-XL(高血压) Tenormin(心绞痛)Xalatan(青光眼) Singulair(哮喘)Diovan(高血压)Harnal(前列腺增生)(Med Ad News 1999的数据)。
GPCR共有一个共同的结构基元,它们有7个由22-24个疏水氨基酸组成的序列,形成7个α螺旋,每个螺旋都跨膜(每个跨膜区是用数字表示的,即,跨膜-1(TM-1),跨膜-2(TM-2),等)。跨膜螺旋通过细胞膜外部,或“胞外”侧的跨膜-2和跨膜-3,跨膜-4和跨膜-5,及跨膜-6和跨膜-7之间的氨基酸链连接(这些分别被称作“胞外”区1,2和3(EC-1,EC-2和EC-3))。跨膜螺旋也可通过细胞膜内部,或“胞内”侧的跨膜-1和跨膜-2,跨膜-3和跨膜-4,及跨膜-5和跨膜-6之间的氨基酸链连接(这些分别被称作“胞内”区1,2和3(IC-1,IC-2和IC-3))。受体的“羧基”(“C”)末端位于细胞内的胞内空间,受体的“氨基”(“N”)末端位于细胞外的胞外空间。
通常,当内源性配体与受体结合(有时也称作受体的“活化”)时,胞内区的构象发生改变,使胞内区和胞内“G-蛋白”之间偶联。据报道,GPCR对G蛋白而言是“混杂的”,即,GPCR可与不止一个G蛋白相互作用。见,Kenakin,T.,43 Life Sciences 1095(1988)。虽然还存在其它G蛋白,但目前已经鉴定的G蛋白是Gq,Gs,Gi,Gz和Go。配体活化的CPCR与G-蛋白的偶联可引发信号级联放大过程(也称作“信号转导”)。在正常条件下,信号转导最终导致细胞活化或细胞抑制。虽然不希望受到理论的束缚,但据推测IC-3环及受体的羧基末端都与G蛋白相互作用。
在生理条件下,GPCR以两个不同构象“非活性”状态和“活性”状态之间平衡的形式存在于细胞膜中。非活性状态的受体不能与胞内信号转导途径连接,从而引发产生生物反应的信号转导。受体构象到活性状态的改变可(经由G蛋白)与转导途径连接,并产生生物反应。
受体可通过配体或化合物,如药物而被稳定在活性状态。近来发现,除了配体或药物之外,还可提供其它促进并使受体稳定在活性状态构象的方法,包括但不限制于对受体的氨基酸序列进行修饰。这些方法通过模拟配体与受体的结合作用而有效地将受体稳定在活性状态。通过这种配体非依赖性方式进行的稳定被称作“组成型受体活化”。
发明概述此处公开的是人GPCR的内源性和非内源性形式及其用途。
本发明某些实施方案涉及由SEQ ID NO.2的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO63的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.62的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.4的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO65的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.64的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.6的氨基酸序列编码的G蛋白偶联受体,它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.5的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.8的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO67,SEQ ID NO.69,SEQ ID NO.71和SEQ ID NO.73的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.66,SEQ IDNO.68,SEQ ID NO.70和SEQ ID NO.72的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.10的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO75和SEQ ID NO.77的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.74和SEQ IDNO.76的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.12的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO79和SEQ ID NO.81的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.78和SEQ IDNO.80的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.14的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO83的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.82的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.16的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO85的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.84的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.18的氨基酸序列编码的G蛋白偶联受体,由SEQ ID NO87的氨基酸序列编码的它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.86的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.84的cDNA的质粒,及含有它们的宿主细胞。
本发明某些实施方案涉及由SEQ ID NO.98的氨基酸序列编码的G蛋白偶联受体,它们的非内源性组成型活化形式,及含有它们的宿主细胞。
本发明某些实施方案涉及含有载体和SEQ ID NO.97的cDNA的质粒,及含有它们的宿主细胞。
附图简述

图1是基于细胞的第二信使环AMP测定结果的图示,其中提供了内源性组成型活性的FPRL-2(“FPRL-2wt”),与Gs/Gi融合蛋白构建体融合的FPRL-2的非内源性组成型活化形式(“FPRL-2(L240K)”)和对照组(“Gs/Gi”)的组成型信号传递的比较结果。
图2提供与对照组(“CMV”)相比,内源性STRL33与非内源性组成型活化的STRL33(“STRL33(L230K)”的比较分析图示结果,它们是在293T细胞中,利用8XCRE-Luc报道分子测定法得到的。
图3提供与对照组(“CMV”)相比,内源性靶受体GPR45(“GPR45wt”)与非内源性TSHR(A632I)(“信号增强子”)共转染的比较分析图示结果,它们是在293细胞中,利用基于细胞的腺苷酸环化酶测定法得到的。该测定法包括TSH,即TSHR内源性配体的加入。
图4提供内源性靶受体mGluR7(“mGluR7wt”)和非内源性TSHR(A623I)(“信号增强子”)的共转染与靶受体mGluR7的非内源性组成型活化形式(“W590S”,“R659H”,“T771C”和“I790K”)和非内源性TSHR(A623I)共转染的比较分析图示结果,它们是在293细胞中,利用基于细胞的腺苷酸环化酶测定法得到的。该测定法包括TSH,即TSHR内源性配体的加入。
图5提供内源性靶受体mGluR7(“mGluR7wt”)和非内源性TSHR(A623I)(“信号增强子”)的共转染与靶受体mGluR7的非内源性组成型活化形式(“W590S”,“R659H”,“T771C”和“I790K”)和非内源性TSHR(A623I)共转染的比较分析图示结果,它们是在RGT细胞中,利用基于细胞的腺苷酸环化酶测定法得到的。该测定法包括TSH,即TSHR内源性配体的加入。
图6提供在有和没有谷氨酸盐存在的情况下,与“Gq(缺失)”和“Gq(缺失)/Gi”相比,与Gq蛋白非内源性形式,即“Gq(缺失)”和“Gq(缺失)/Gi”共转染的非内源性mGluR7,“T771C”的第二信使IP3产生的图示。
图7是SRE报道分子测定法中,内源性非-组成型活性的GPR37(“wt”)与GPR37的非内源性组成型活化形式(“C543Y”和“L352R”)的比较分析,其中对照组是表达载体(“CMV”)。
图8是Gs/Gi融合构建体和内源性靶受体GPR37(“GPR37wt”)的共-转染与Gs/Gi融合构建体和靶受体GPR37的非内源性组成型活化形式(“C543Y”和“L352R”)共转染的比较分析,其中利用的是全细胞第二信使cAMP测定法。
图9是在用毛喉素处理过的大鼠施旺氏细胞中表达的GPR37的RNA分析。细胞分化维持在20uM毛喉素。
图10是在压碎的大鼠坐骨神经中表达的GPR37的RNA分析。GPR37在压碎后七(7)天被高度上调节。
图11是IP3测定法中,内源性非组成型活性的HF1948(“wt”)与HF1948的非内源性组成型活化形式(“I281F”)的比较分析,其中对照组是表达载体(“pCMV”)。
图12是内源性靶受体HF1948(“HF1948wt”)和非内源性TSHR(A623I)(“信号增强子”)的共转染与靶受体HF1948的非内源性组成型活化形式(“I281F和“E135N”)和非内源性TSHR-A623I共转染的比较分析,其中利用了全细胞腺苷酸环化酶测定法。该测定法包括TSH,TSHR内源性配体的加入。
图13是使用多个胰细胞系进行的GPR66 RNA印迹结果的照片复制品。
图14提供内源性GPR35与非内源性组成型活化的GPR35(“GPR35(A216K)”)比较分析的图形结果,它们是在293A细胞中,利用E2F-Luc报道分子测定法进行的。
图15是使用多个组织(人)的cDNA进行的GPR35 RNA印迹结果的照片复制品。
图16提供内源性ETBR-LP2(“WT”)和非内源性TSHR-A623I(“TSHR-A623I”)(有和没有TSH)的共转染与非内源性组成型活化的ETBR-LP2(“N358K”)与突变的TSHR-A623I(有和没有TSH)共转染的比较分析,利用的是腺苷酸环化酶测定法。
图17提供内源性ETBR-LP2(“WT”)与非内源性组成型活化的ETBR-LP2(“N358K”)比较分析的图形结果,利用的是AP1报道分子测定系统。
图18是在毛喉素处理过的大鼠施旺氏细胞中表达的ETBR-LP2的RNA分析。细胞分化维持在20uM毛喉素。
图19是在压碎的大鼠坐骨神经中表达的ETBR-LP2的RNA分析。ETBR-LP2在压碎后七(7)天被高度上调节。
图20A和20B提供人ETBR-LP2的推定氨基酸序列(“hETBRLP2p”)与人GPR37的报道氨基酸序列(“hGPR37p”)之间的序列比对报告。
详细描述围绕受体引出的科学文献曾使用很多术语来称呼对受体具有各种作用的配体。为了清楚而且一致,本专利文件将自始至终使用下列定义。当这些定义与这些术语的其它定义相矛盾时,应参照下列定义激动剂是指与受体结合时,可激活胞内反应,或提高GTP与膜结合的物质(例如,配体,候选化合物)。在某些实施方案中,激动剂是与受体结合时,激活胞内反应或提高GTP与膜结合的先前未知的那些物质。
此处所用的氨基酸缩写在表A中列出
表A
拮抗剂是指与激动剂在同一位点竞争性结合受体的物质(例如,配体,侯选化合物),但它不会激活由受体活性形式引发的胞内反应,并可因此抑制由激动剂所致的胞内反应。在没有激动剂存在的情况下,拮抗剂不会使基础胞内反应减弱。在某些实施方案中,拮抗剂是与受体结合时,激活胞内反应或提高GTP与膜结合的先前未知的那些物质。
侯选化合物是指经筛选技术检验的分子(例如,但不限制于,化合物)。优选,短语“侯选化合物”不包括公众已知的化合物,例如通过间接鉴定方法事先确定的受体反向激动剂,激动剂或拮抗剂(“间接鉴定的化合物”);更优选,不包括先前已经确定对至少一种哺乳动物有治疗效果的间接鉴定的化合物;且,最优选,不包括先前已经确定对人具有治疗作用的间接鉴定的化合物。
组合物是指含有至少一个组分的物质;“药物组合物”是组合物的例子。
化合物的效力是指化合物抑制或刺激受体功能性的能力,即,与受体结合亲和力相反的,激活/抑制信号转导途径的能力的测量值。检测化合物效力的代表性方法在本专利文件的实施例部分中公开。
密码子是指3个一组的核苷酸(或核苷酸等价物),它通常包括与磷酸基团偶联的核苷(腺苷(A),鸟苷(G),胞苷(C),尿苷(U)和胸苷(T)),当被翻译时,编码氨基酸。
组成型活化的受体是指经过组成型受体活化的受体。组成型活化的受体可以是内源性的或非内源性的。
组成型受体活化是指利用除了使受体与其配体或化学等价物结合之外的其它方法将受体稳定在活性状态。
接触是指在体外系统或体内系统中,使至少两个部分在一起。
直接鉴定或直接鉴定的,在涉及短语“侯选化合物”时,是指对侯选化合物进行组成型活化受体,优选组成型活化的孤独受体,更优选组成型活化的G蛋白偶联细胞表面孤独受体的筛选,并评估这个化合物的效力。这个短语在任何情况下,都不能被解释或理解为包括短语“间接鉴定”或“间接鉴定的”,或被它们包括在内。
内源性是指哺乳动物天然产生的物质。例如,但不限制于,相对于术语“受体”而言,内源性是指由哺乳动物(例如,但不限制于,人)或病毒天然产生的。相反,本文中的术语非内源性的是指不是由哺乳动物(例如,但不限制于,人)或病毒天然产生的。例如,但不限制于,其内源性形式的受体不是组成型活性的,但对它进行操作,使它成为组成型活性时,最优选称其为“非内源性组成型活化的受体”。两个术语都可用于描述“体内”和“体外”系统。例如,但不限制于,在筛选方法中,内源性或非内源性受体都可用于体外筛选系统中。作为又一个例子,而且不是限制,当对哺乳动物基因组进行操作,使其含有非内源性组成型活化的受体时,可以利用体内系统筛选侯选化合物。
G蛋白偶联受体融合蛋白和GPCR融合蛋白,在此处公开的本发明范围内,是指非内源性蛋白,它含有内源性组成型活化的GPCR或非内源性组成型活化的GPCR,所述非内源性组成型活化的GPCR与至少一个G蛋白,更优选这种G蛋白的α亚单位(结合GTP的亚单位)融合,所述G蛋白的类型优选与内源性孤独GPCR天然偶联的G蛋白相同。例如,但没有限制,在内源性状态,如果G蛋白“Gsα”是与GPCR偶联的优势G蛋白,那么基于特定GPCR的GPCR融合蛋白则是含有与Gsα融合的GPCR的非内源性蛋白;在某些情况下,如下面所述,非-优势G蛋白也可与GPCR融合。G蛋白可与组成型活性GPCR的C-末端直接融合,或两个之间存在间隔区。
宿主细胞是指其中能够插入质粒和/或载体的细胞。对于原核宿主细胞而言,当宿主细胞复制时,质粒通常作为自主分子被复制(通常在复制后,质粒被分离出来,然后引入到真核宿主细胞中);对于真核宿主细胞而言,质粒被整合到宿主细胞的细胞DNA中,这样当真核宿主细胞复制时,质粒也复制。在某些实施方案中,宿主细胞是真核的,更优选哺乳动物,最优选选自293,293T和COS-7细胞。
间接鉴定或间接鉴定的是指发现药物的传统方法,包括鉴定对内源性受体特异的内源性配体,对候选化合物进行受体筛选,确定干扰和/或竞争配体-受体相互反应的那些化合物,并评估化合物影响至少一个与活化受体有关的第二信使途径的效力。
抑制,相对于术语“反应”而言,是指与没有化合物存在的情况相反,在有化合物存在的情况下,反应降低或被阻碍。
反向(inverse)激动剂是指与受体的内源性形式或受体的组成型活化形式结合的物质(例如,配体,候选化合物),它们可抑制由受体活性形式引发的基础胞内反应,直到低于标准活性基础水平,所述标准活性基础水平是在无激动剂存在的情况下观察的,或它们可降低GTP与膜的结合。优选与没有反向激动剂存在情况下的基础反应相比,在有反向激动剂存在的情况下,基础胞内反应被抑制至少30%,至少50%,至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少92%,至少94%,至少95%,至少96%,至少97%,至少98%,最优选至少99%。
已知受体是指其特异性内源性配体已被鉴定的内源性受体。
配体是指对天然存在的受体特异的分子。
突变体或突变,相对于内源性受体的核酸和/或氨基酸序列而言,是指对这种内源性序列进行特定的一种或多种改变,从而使内源性非组成型活化的受体显示受体的组成型活化。对于特定序列的等价物而言,人受体后来的突变形式被认为与人受体的第一次突变等价,条件是(a)人受体后来的突变形式的组成型活化水平与受体第一次突变的水平基本相同,和(b)受体后来的突变形式与受体第一次突变之间的序列(氨基酸和/或核酸)同源性百分比为至少80%,至少85%,至少90%,至少92%,至少94%,至少95%,至少96%,至少97%,至少98%,最优选至少99%。在某些实施方案中,由于此处公开用于实现组成型活化的某些优选盒在GPCR的内源性和非内源性形式之间具有单一氨基酸和/或密码子的改变,因此优选序列同源性的百分比应至少为98%。
非-孤独受体是指对所鉴定配体特异的,内源性天然存在的分子,其中配体与受体的结合可激活胞内信号传递途径。
孤独受体是指对其特异的配体还未鉴定或未知的内源性受体。
药物组合物是指含有至少一个活性成分的组合物,并因此可以在哺乳动物(例如,但不限制于,人)中研究特定,有效的结果。本领域那些普通技术人员应当能够理解并正确评价适于确定活性成分是否具有技术人员所需的有效结果的技术。
质粒是指载体与cDNA的结合。通常,为了复制和/或使cDNA表达为蛋白,而将质粒引入到宿主细胞中。
第二信使是指受体活化产生的胞内反应。第二信使可以包括,例如,肌醇三磷酸(IP3),二酰甘油(DAG),环AMP(cAMP),和环GMP(cGMP)。测量第二信使的反应可用于测定受体活化。此外,测量第二信使的反应还可用于直接鉴定侯选化合物,包括,例如,反向激动剂,激动剂,和拮抗剂。
信噪比是指响应活化,扩增,或刺激时产生的信号高于背景噪声或响应未活化,未扩增,或未刺激时的基础水平。
间隔区是指位于基因,例如目标GPCR最后的密码子或氨基酸之后,目标G蛋白的起始密码子或起始区之前的翻译氨基酸数,其中所述翻译氨基酸位于目标G蛋白起始区的读框中。翻译氨基酸数可根据技术人员的需要特制,通常约为1个氨基酸,优选2个氨基酸,更优选3个氨基酸,更优选4个氨基酸,更优选5个氨基酸,更优选6个氨基酸,更优选7个氨基酸,更优选8个氨基酸,更优选9个氨基酸,更优选10个氨基酸,更优选11个氨基酸,甚至更优选12个氨基酸。
刺激,相对于术语“反应”而言,是指与没有化合物存在的情况相反,在有化合物存在的情况下,反应增加。
基本上是指结果在对照组结果的40%之内,优选35%之内,更优选30%之内,更优选25%之内,更优选20%之内,更优选15%之内,更优选10%之内,更优选5%之内,更优选2%之内,最优选1%之内。例如,就受体功能性而言,如果使用此处教导的方法或技术人员已知的相似方法测量的转导信号在对照组所产生信号的40%之内,那么试验受体显示与对照受体基本相似的结果。
载体,相对于cDNA而言,是指能将至少一个cDNA插入到宿主细胞中的环状DNA。
下列部分的顺序是为了描述效果而排列的,而不能解释为对下面公开或权利要求的限制。
A.引言受体的传统研究通常是根据先前假定(以历史为基础)进行的,即,在发现可影响受体的拮抗剂和其它分子之前,首先必须鉴定内源性配体。即使在事先已经知道拮抗剂的情况下,也应该立即开展寻找内源性配体的研究。甚至在发现组成型活化受体之后,在受体研究中,仍然要坚持这种思维模式。在此之前还没有认识到,受体的活性状态对于发现受体的激动剂和反向激动剂才是最有用的。对于由活性过高受体或活性较低受体导致的那些疾病而言,我们希望治疗药物是分别可使受体活性状态降低,或提高受体活性的化合物,而不希望该药物是内源性配体的拮抗剂。这是因为,降低或提高活性受体状态活性的化合物无需与内源性配体在同一位点结合。因此,根据本发明方法的教导,寻找治疗化合物的任何研究都应通过针对配体-非依赖性活性状态筛选化合物开始。
B.人GPCR的鉴定人类基因组计划的实施鉴定了位于人类基因组内的有关核酸序列的大量信息;经过这种努力,即使对任一特定基因组序列是否含有翻译人类蛋白的可读框信息不了解或没有认识,我们也可获得遗传序列信息。鉴定人类基因组内核酸序列的很多方法都是本领域那些普通技术人员已知的。
受体同源性可用于了解受体在人体内所起的作用。本专利文件对使这些受体突变的技术进行了改进,从而确定这些受体的非内源性组成型活化形式。
此处公开的技术还可应用于本领域已知的其它人GPCR,这对于本领域那些技术人员而言是显而易见的。
C.受体的筛选对候选化合物进行此处公开的GPCR的非内源性组成型活化形式的筛选可直接鉴定作用于细胞表面受体的候选化合物,而且无需使用受体的内源性配体。使用常规并且通常可商购的技术可确定此处公开的人GPCR内源性形式在体内表达和/或过量-表达的区域。受体在特定组织中的表达位置可为科学家提供确定受体生理功能作用的能力。使用这些技术还可确定与受体表达和/或过量表达有关的相关疾病/病症状况,这种方法在本专利文件中公开。此外,受体在病变器官中的表达可帮助人们确定受体临床关联性的大小。
此处公开的GPCR的组成型活化是以距离脯氨酸残基的距离为基础的,据推测所述脯氨酸残基位于GPCR的TM6内;该算法技术在共同未决的,而且通常已转让的专利文件PCT申请号PCT/US99/23938,即2000年4月20日公开的WO 00/22129,和此处所列的其它专利文件中公开,它们全部引入此处作为参考。该算法技术不是根据传统的序列“比对”来预测的,而是根据距离上述TM6脯氨酸残基(或,这种脯氨酸残基的内源性组成型替代物)的特定距离来预测的。通过使距离该残基16个氨基酸残基处的氨基酸(据推测,位于受体的IC3区中)突变为,最优选赖氨酸残基,可获得受体的组成型活化。其它氨基酸残基在此位置的突变也可达到此目的。
D.疾病/病症的鉴定和/或选择正如下面将要更详细描述的,非内源性组成型活化的GPCR的反向激动剂和激动剂可通过本发明的方法鉴定。这种反向激动剂和激动剂是用于治疗与该受体有关疾病的药物发现计划中先导化合物的理想候选者。因为可直接鉴定GPCR的反向激动剂,因此可研究用于治疗与GPCR有关的疾病和病症的药物组合物。受体在特定组织中的表达位置可为科学家提供确定受体生理功能的能力。例如,筛选病变和正常组织样品中GPCR的存在,现在不仅是学术研究的需要,而且还是鉴定特定GPCR的内源性配体的需要。组织检测可在多种健康和病变组织中进行。这种组织检测为把特定受体与疾病和/或病症联系起来提供了可能的第一步。此外,受体在病变器官中的表达可帮助人们确定受体临床关联性的大小。根据本发明公开的内容,一旦把受体定位在特定的组织或区域,相信技术人员就能够推断GPCR的功能。
GPCR的DNA序列可用于制造探针/引物。在某些优选实施方案中,所述DNA序列可用于制造探针,而该探针则用于(a)针对组织-mRNA进行斑点印迹分析,和/或(b)受体在组织样品中表达的RT-PCR鉴定。组织或病变组织中受体的存在,或与正常组织相比,病变组织中所存在受体水平的提高,可用于把位置与功能联系起来,并预示受体的生理作用/功能,并建立治疗方案,包括但不限制于,治疗与该功能/作用有关的疾病。受体还可通过该技术而被定位在器官的区域中。以受体在其中定位的特定组织的已知或假定作用/功能,可推断受体的推定生理功能。例如但不限制于,在丘脑区域中定位/表达的蛋白与感觉运动过程和觉醒有关(见,Goodman & Gilman’s,The PharmacologicalBasis of Therapeutics,9thEdition,第465页(1996))。在海马或施旺氏细胞中表达的蛋白分别与认知和记忆,以及周围神经的髓鞘形成有关(见,Kandel,E.等,Essentials of Neural Science andBehavior,分别在第657,680和28页(1995))。在某些实施方案中,探针和/或引物可用于检测和/或诊断疾病和/或病症,包括但不限制于,在下面实施例6中鉴定的那些疾病和病症。生产这种引物和/或探针的方法及使用引物和/或探针检测疾病和/或病症的方法为本领域那些技术人员熟知。
E.候选化合物的筛选1.一般的GPCR筛选测定技术当G蛋白受体变为组成型活性时,它与G蛋白(例如,Gq,Gs,Gi,Gz,Go)结合,并刺激GTP与G蛋白的结合。然后G蛋白起GTP酶的作用,把GTP水解为GDP,由此受体在正常情况下失活。然而,组成型活化的受体继续把GDP交换成GTP。GTP的不可水解类似物[35S]GTPγS可用于监测与膜的结合是否提高,该膜表达组成型活化的受体。据报道[35S]GTPγS可用于监测有和没有配体存在的情况下,G蛋白与膜的偶联。在本领域那些技术人员熟知而且有效的其它实施例之中,这种监测的其中一个实施例由Traynor和Nahorski于1995年报道。这种测定系统的使用通常是为了初步筛选候选化合物,这是因为本系统通常可用于所有G蛋白偶联受体,和与受体胞内域相互作用的特定G蛋白无关。
2.特定的GPCR筛选测定技术当使用“一般”G蛋白偶联受体测定法(即,选择是激动剂或反向激动剂的化合物的测定法)鉴定候选化合物时,优选进行进一步筛选,以证实化合物已经在受体位点相互作用。例如,由“一般”测定法鉴定的化合物可能不与受体结合,但可仅从胞内域与G蛋白“解偶联”。
a.Gs,Gz和GiGs刺激腺苷酸环化酶。另一方面,Gi(和Gz以及Go)则抑制腺苷酸环化酶。腺苷酸环化酶可催化ATP向cAMP转化;因此,与Gs蛋白偶联的组成型活化GPCR与细胞cAMP水平的增加有关。另一方面,与Gi(或Gz,Go)蛋白偶联的组成型活化GPCR与细胞cAMP水平的降低有关。通常,见,“Indirect Mechanisms of SynapticTransmission”,Chpt.8,From Neuron To Brain(3rdEd.)Nichols,J.G.等编辑,Sinauer Associates,Inc.(1992)。因此,检测cAMP的测定法也可用于确定候选化合物是否是受体的反向激动剂(即,这种化合物是否可降低cAMP的水平)。可利用本领域已知的各种方法测量cAMP;最优选的方法是在基于ELISA的形式中使用抗-cAMP抗体。可利用的其它类型的测定法是全细胞第二信使报道分子系统测定法。基因上的启动子可驱动特定基因编码的蛋白的表达。环AMP通过促进cAMP-反应性DNA结合蛋白或转录因子(CREB)的结合而驱动基因表达,其中所述转录因子(CREB)在特定位点(cAMP反应元件)与启动子结合并驱动基因的表达。构建报道分子系统,使其具有启动子,而该启动子在报道基因,例如β-半乳糖苷酶或荧光素酶之前含有多个cAMP反应元件。因此,组成型活化的Gs-连接受体可引起cAMP累积,然后激活基因并导致报道基因蛋白的表达。报道蛋白,如β-半乳糖苷酶或荧光素酶可使用标准生化测定法检测(Chen等,1995)。
b.Go和GqGq和Go与磷脂酶C的活化有关,它们依次水解磷脂PIP2,释放两个胞内信使二酰甘油(DAG)和肌醇1,4,5-三磷酸(IP3)。IP3的逐渐累积与Gq和Go-相关受体的活化有关。通常见,“IndirectMechanisms of Synaptic Transmission”,Chpt.8,From Neuron ToBrain(3rdEd.)Nichols,J.G.等编辑,Sinauer Associates,Inc.(1992)。检测IP3累积的测定法可用于确定候选化合物是否是Gq或Go相关受体的反向激动剂(即,这种化合物是否可降低IP3的水平)。Gq相关受体还可使用AP1报道分子测定法检测,其中Gq依赖性磷脂酶C可引起含AP1元件的基因的活化;因此,活化的Gq相关受体可使这种基因的表达增加,因此,其反向激动剂可证明这种表达的降低,激动剂则证明这种表达的增加。进行这种检测的测定法在商业上是可行的。
3.GPCR融合蛋白内源性组成型活化的GPCR或非内源性组成型活化的GPCR用于筛选侯选化合物,直接鉴定反向激动剂、激动剂的用途为筛选提出了一个有趣的问题,即,在没有内源性配体与之结合的情况下,受体也是有活性的。因此,为了区分有侯选化合物存在情况下的非内源性受体和没有该化合物存在情况下的非内源性受体,这种区分的目的是为了解这种化合物是否是反向激动剂或激动剂或对这种受体根本没有影响,优选所用的方法可提高这种区分。优选方法使用GPCR融合蛋白。
通常,一旦使用上述(及其它)测定技术确定了非内源性GPCR是组成型活化的,就可确定与内源性GPCR偶联的优势G蛋白。G蛋白与GPCR的偶联提供了可评估的信号传递途径。在某些实施方案中,优选筛选是使用哺乳动物表达系统进行的,希望这个系统中有内源性G蛋白。因此,在这个系统中,非内源性组成型活化的GPCR将持续发出信号。在某些实施方案中,优选加强信号,这样在有受体反向激动剂存在的情况下,可更容易区分与反向激动剂接触的受体,特别是在筛选时。
GPCR融合蛋白可提高与非内源性GPCR偶联的G蛋白的效力。GPCR融合蛋白优选用于筛选内源性组成型活性的GPCR或非内源性组成型活化的GPCR,这是因为这种方法可增加在这种筛选技术中使用的信号。促进显著的“信噪比”非常重要;这种显著的信噪比优选用于筛选此处公开的侯选化合物。
用于GPCR融合蛋白表达的构建体的构建是本领域那些技术人员已知的。市售的表达载体和系统提供了各种方法,可满足研究人员的特殊需要。构建这种GPCR融合蛋白构建体的重要标准包括但不限制于,内源性GPCR序列和G蛋白序列都符合读框(优选,内源性GPCR的序列位于G蛋白序列的上游),而且GPCR的“终止”密码子被缺失或替换,这样在GPCR表达时,G蛋白也被表达。其它实施方案包括其中的内源性GPCR序列和G蛋白序列不符合读框和/或“终止”密码子未被缺失或替换的构建体。GPCR可与G蛋白直接连接,或两者之间存在间隔残基(虽然这个数字可由本领域普通技术人员很容易地确定,但优选不超过约12个)。为方便起见,优选使用间隔区。优选,在构建GPCR融合蛋白构建体之前,鉴定与非内源性GPCR偶联的G蛋白。因为只有少数G蛋白已鉴定,因此优选含有G蛋白序列(即,通用的G蛋白构建体(见实施例))的构建体中可插入内源性GPCR序列;这样就可有效地,大规模筛选具有不同序列的各种不同的内源性GPCR。
如上所述,预期与Gi,Gz和Go偶联的组成型活化的GPCR可抑制cAMP的形成,这就使得以这些类型GPCR为基础的测定法具有挑战性(即,cAMP信号在活化后降低,从而直接鉴定例如反向激动剂(它可进一步降低该信号))。正如此处所公开的,我们已经确定,对于这些类型的受体而言,可生产不是以GPCR内源性G蛋白为基础的GPCR融合蛋白,努力建立可行的,以环化酶为基础的测定法。因此,例如,内源性Gi偶联受体可与Gs蛋白融合-这种融合构建体在表达时,可“驱动”或“推动”内源性GPCR与例如Gs,而不是“天然”Gi蛋白偶联,这样就可建立以环化酶为基础的测定法。因此,对于Gi,Gz和Go偶联受体而言,在某些实施方案中,优选当使用GPCR融合蛋白,而且测定法是以腺苷酸环化酶活性的检测为基础时,使用Gs(或刺激腺苷酸环化酶形成的等同G蛋白)建立融合构建体。
利用Gq蛋白与Gs,Gi,Gz或Go蛋白融合的G蛋白融合构建体同样有效。在某些实施方案中,优选的融合构建体可使用Gq蛋白获得,其中G-蛋白α-亚单位(“Gαq”)的前六(6)个氨基酸被缺失,Gαq C-末端的后五(5)个氨基酸被目标G蛋白Gα的相应氨基酸替换。例如,融合构建体可以是Gq(6个氨基酸缺失)与Gi蛋白的融合,得到“Gq/Gi融合构建体”。该融合构建体可推动内源性Gi偶联受体与其非内源性G蛋白Gq偶联,这样就可测量第二信使,例如,肌醇三磷酸或二酰甘油而不是cAMP的产生。
4.靶Gi偶联的GPCR与信号增强子Gs偶联的GPCR的共转染(基于cAMP的测定法)已知Gi偶联受体可抑制腺苷酸环化酶,并因此降低cAMP产生的水平,这就不容易评估cAMP的水平。作为活化后主要偶联Gi的受体组成型活化的指示,测量所产生cAMP降低的有效技术可通过使信号增强子,例如,活化后主要与Gs偶联的非内源性组成型活化受体(例如,下面公开的TSHR-A623I)与Gi连接的GPCR共转染而实现。显然,Gs偶联受体的组成型活化可根据所产生cAMP的增加测定。Gi偶联受体的组成型活化可导致所产生cAMP的降低。因此,共转染方法意在有效利用这些“相反”的作用。例如,非内源性组成型活化的Gs偶联受体(“信号增强子”)与内源性Gi偶联受体(“靶受体”)的共转染提供了基础cAMP信号(即,虽然Gi偶联受体可降低cAMP水平,但这种“降低”是相对于由组成型活化的Gs偶联信号增强子建立的cAMP水平大量增加而言的)。然后,通过使信号增强子与靶受体的组成型活化形式共转染,而预期cAMP会进一步降低(相对于基础水平),这是因为Gi靶的功能活性增加了(即降低cAMP)。
然后,使用基于cAMP的测定法筛选侯选化合物,相对于使用内源性受体/G-蛋白融合,发生了两处‘改变’首先,相对于Gi偶联的靶受体而言,会产生“相反的”作用,即,Gi偶联的靶受体的反向激动剂使所测cAMP信号增加,而Gi偶联的靶受体的激动剂则使该信号降低;第二,很明显,使用这种方法直接鉴定的侯选化合物应单独评估,以确保这些候选化合物不会针对信号增强受体(这可在对共转染受体进行筛选之前或之后完成)。
F.药物化学通常,但不总是如此,侯选化合物的直接鉴定是与通过组合化学技术产生的化合物联合进行的,由此,随机制备上千种化合物进行这种分析。通常,这种筛选的结果是具有独特核心结构的化合物;此后,围绕优选的核心结构对这些化合物进行其它化学修饰,从而进一步提高其药物性质。这种技术对于本领域那些技术人员而言是已知的,无需在本专利文件中详细描述。
G.药物组合物为进行进一步的研究,可使用本领域那些技术人员熟知的技术,把所选择的侯选化合物配制成药物组合物。适宜的药学上可接受的载体是本领域可得到的那些;例如,见Remington’s PharmaceuticalSciences,16thEdition,1980,Mack Publishing Co.,(Osol等编辑)。
H.其它用途虽然此处公开的GPCR非内源性形式的优选用途是直接鉴定作为反向激动剂或激动剂(优选用作药剂)的侯选化合物,但GPCR的这些形式还有其它用途。例如,掺入GPCR的体外和体内系统可用于进一步说明并了解这些受体在正常人和病人中所起的作用,并了解把它用于理解信号级联放大时,组成型活化的作用。在某些实施方案中,内源性受体优选是“孤独受体”,即还没有鉴定出该受体的内源性配体。因此在某些实施方案中,在鉴定内源性配体之前,修饰过的非内源性GPCR可用于了解内源性受体在人体中所起的作用。这种受体还可用于进一步说明已知受体及它们转导信号的途径。在本发明文件的基础上,所公开受体的其它用途对于本领域那些技术人员而言是显而易见的。
实施例下列提出的实施例是为了说明,而不是对本发明的限制。当此处公开了特定的核酸和氨基酸序列时,本领域那些普通技术人员可对这些序列进行较小的修饰,同时获得与下面所报道的相同或基本相似的结果。应用或了解从一个序列到另一个序列(例如,从大鼠受体到人受体,或从人受体A到人受体B)的序列盒的传统方法通常是以序列比对技术为基础进行预测,由此通过把序列进行对比而确定共同区域。此处公开的突变方法不依赖于这种方法,而是以算法和距离人GPCR的TM6区中保守脯氨酸残基的位置远近为基础的。一旦这种方法可靠,本领域那些技术人员就可对其进行较小的修饰,从而获得与此处公开(即,组成型活化)的基本相同的结果。这种修饰方法被认为落在本公开的范围之内。
实施例11.内源性人GPCR下列cDNA受体是利用这部分描述的技术克隆的,见下文。表B列出了本专利申请公开的受体,内源性GPCR的可读框,核酸及氨基酸序列(表B)。
表B
2.全长克隆方案a.FPRL-2(Seq.Id.Nos.1&2)FPRL-2是1992年,由Bao,L.等,13(2)Genomics 437-40(1992)克隆并测序的。据报道,FPRL-2位于染色体19上,它与N-甲酰基肽受体样-1(FPR-1)的序列相似,它们二者与N-甲酰基肽受体(FPR)共有显著的相似性。FPR的内源性配体是甲酰基肽,然而,FPR的两个同系物,FPRL-1和FPRL-2,不与同一配体结合,但很可能是趋化受体。13(2)Genomics 437-40(1992)。据报道,趋化受体参与炎症。FPRL-2是具有编码353氨基酸蛋白的,1062bp可读框的GPCR。
PCR是以基因组cDNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件是94℃1分钟,64℃1分20秒和72℃2分钟循环30次。5’PCR含具有下列序列的EcoRI位点5’-AAAGATTCAGGTGTGGGAAGATGGAAACC-3’(SEQ ID NO.19)而3’引物含具有下列序列的ApaI位点5’-AAAGGATCCCCGACCTCACATTGCTTGTA-3’(SEQ ID NO.20)PCR片段是用EcoRI和ApaI消化的,并被克隆到CMV表达载体的EcoRI-ApaI位点中。此后,测定并证实人FPRL-2的核酸(SEQ IDNO.1)及氨基酸(SEQ ID NO.2)序列。
b.STLR33(Seq.Id.Nos.3&4)PCR是以基因组cDNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件是94℃1分钟,62℃1分20秒和72℃2分钟循环30次。5’PCR含具有下列序列的EcoRI位点5’-CAGGAATTCATCAGAACAGACACCATGGCA-3’(SEQ ID NO.21)而3’引物含具有下列序列的BamHI位点5’-GCAGGATCCAGAGCAGTTTTTTCGAAACCCT-3’(SEQ ID NO.22)PCR片段是用EcoRI和BamHI消化的,并被克隆到CMV表达载体的EcoRI-BamHI位点中。此后,测定并证实人STRL33的核酸(SEQ IDNO.3)及氨基酸(SEQ ID NO.4)序列。
c.GPR45(Seq.Id.Nos.5&6)PCR是以基因组cDNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件如下96℃2分钟,96℃30秒,55℃20秒,72℃1分20秒,和72℃5分钟,其中第2-4轮重复35次。5’PCR含具有下列序列的HindIII位点5’-TCCAAGCTTCAAGGGTCTCTCCACGATGGCCTG-3’(SEQ ID NO.23)而3’引物含具有下列序列的EcoRI位点5’-TGCGAATTCTCTGTGGCCCCCTGACCCCCTAAA-3’(SEQ ID NO.24)PCR片段是用HindIII和EcoRI消化的,并被克隆到CMV表达载体的HindIII-EcoRI位点中。此后测定并证实人GPR45的核酸(SEQ IDNO.5)及氨基酸(SEQ ID NO.6)序列。
然后,通过使用pfu PCR再次亚克隆到V5-His载体中而用V5标记cDNA,所用的两个引物具有下列序列5’-GGTAAGCTTACCATGGCCTGCAACAGCACGTCCCTT-3’(SEQ ID NO.25)和5’-GACGAATTCAACCGCAGACTGGTTTTCATTGCA-3’(SEQ ID NO.26)。
循环条件为94℃1分钟,60℃2分钟和72℃2分钟循环30次。
d.mGluR7(Seq.Id.Nos.7&8)
谷氨酸是一种兴奋性神经递质,它在哺乳动物的脑中大量存在。见,Dingledine,R.等,130(4S Suppl)Nutr.1039S(2000)。谷氨酸受体有两类,离子化的(配体-门控离子通道)和代谢向性的(metabotropic(GPCR))。代谢向性的谷氨酸受体是GPCR的异源家族,与若干第二信使途径有关,可调节神经元的兴奋性和突触传导。(见,Philips,T.等,57(1)Brain Res Mol Brain Res 132(1998))。据报道,7型代谢向性的谷氨酸盐受体(mGluR7)在脑中表达,在海马,大脑皮质和小脑中的表达水平最高。见,Makoff,A.等,40(1)Brain Res Mol Brain Res 165(1996)。根据受体在脑中定位的区域,可推断受体的推定功能作用。例如,尽管不希望受任何特定理论的束缚,推测mGluR7可在抑郁,焦虑,肥胖,阿尔茨海默氏病,疼痛和中风中发挥作用。
mGluR7的cDNA是由Elizabeth Hoffman,Ph.D.慷慨提供的。mGluR7所用的载体是pRcCMV(mGluR7的编码区被亚克隆到pCMV载体的EcoRI-ClaI位点)。见,mGluR7的核酸序列SEQ ID NO.7和推断的氨基酸序列SEQ ID NO.8。
e.GPR37(Seq.Id.Nos.9&10)本发明还涉及人的GPR37。GPR37是1997年,由Marazziti,D.等,45(1)Genomics 68-77(1997)克隆并测序的。GPR37是具有编码613氨基酸蛋白的,1839bp可读框的孤独GPCR。据报道,GPR37与B型-内皮素样受体同源,并在人的脑组织,特别是胼胝体,髓质,壳核,和尾状核中表达。
PCR是以脑cDNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件是94℃1分钟,62℃1分钟和72℃2分钟循环30次。5’PCR含具有下列序列的HindIII位点5’-GCAAGCTTGTGCCCTCACCAAGCCATGCGAGCC-3’(SEQ ID NO.27)而3’引物含具有下列序列的EcoRI位点5’-CGGAATTCAGCAATGAGTTCCGACAGAAGC-3’(SEQ ID NO.28)1.9kb的PCR片段是用HindIII和EcoRI消化的,并被克隆到CMVp表达载体的HindIII-EcoRI位点中。此后,测定并证实人GPR37的核酸(SEQ ID NO.9)及氨基酸(SEQ ID NO.10)序列。
f.HF1948(Seq.Id.Nos.11&12)HF1948的cDNA是由Elizabeth Hoffman,Ph.D.慷慨提供的。HF1948所用的载体是pRcCMV(HF1948的编码区被亚克隆到pCMV载体的HindIII-BamHI位点)。见,HF1948的核酸序列SEQ ID NO.11和推断的氨基酸序列SEQ ID NO.12。
g.GPR66(Seq.Id.Nos.13&14)人GPR66的cDNA(GenBank登记号AF044600和AF044601)是如下产生并被克隆到pCMV表达载体中的PCR是以基因组DNA为模板进行的,第一轮PCR使用的是TaqPlus Precision聚合酶(Stratagene),第二轮PCR使用的是pfu聚合酶(Stratagene),还使用了由制造商提供的缓冲液系统,0.25μM的每种引物,0.2mM(TaqPlus Precision)或0.5mM(pfu)的4种核苷酸。当使用pfu时,缓冲液中含有10%DMSO。循环条件为94℃1分钟,65℃1分钟和72℃时(a)第一轮PCR1分钟;(b)第二轮PCR2分钟,循环30次。因为编码区中存在内含子,因此,分别使用两组引物生产重叠的5’和3’片段。5’片段的PCR引物是5’-ACCATGGCTTGCAATGGCAGTGCGGCCAGGGGGCACT-3’(外部有义)(SEQ ID NO.29)和5’-CGACCAGGACAAACAGCATCTTGGTCACTTGTCTCCGGC-3’(内部反义)(SEQ ID NO.30)3’片段的PCR引物是5’-GACCAAGATGCTGTTTGTCCTGGTCGTGGTGTTTGGCAT-3’(内部有义)(SEQ ID NO.31)和5’-CGGAATTCAGGATGGATCGGTCTCTTGCTGCGCCT-3’(具有EcoRI位点的外部反义)(SEQ ID NO.32)5’和3’片段是通过用第一轮PCR产物作为模板,并使用激酶化的外部有义引物和外部反义引物进行第二轮PCR而连接在一起的。1.2kb的PCR片段是用EcoRI消化的,并被克隆到pCMV表达载体的平端-EcoRI位点。此后,测定并证实人GPR66的核酸(SEQ ID NO.13)及氨基酸(SEQ ID NO.14)序列。
h.GPR35(Seq.Id.Nos.15&16)GPR35是具有309个氨基酸的序列,GPR35的内源性配体未知(O’Dowd B.等,47(2)Genomics 310(1998))。经测定,GPR35与特异性转录因子,如E2F相互作用,其对于引发DNA复制及最终细胞增殖而言是必需的。在细胞内,E2F与肿瘤抑制基因偶联,如成视网膜细胞瘤。在该转录因子构建体磷酸化后,E2F从Rb基因释放出来,然后进入细胞核。在核内,E2F与基因,如DNA聚合酶结合,引发DNA复制,导致细胞增殖。
PCR是以基因组DNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件是94℃1分钟,62℃1分钟和72℃1分20秒,循环30次。5’PCR引物是用下列序列激酶化的5’-GCGAATTCCGGCTCCCTGTGCTGCCCCAGG-3’(SEQ ID NO.33)而3’引物含具有下列序列的BamHI位点5’-GCGGATCCCGGAGCCCCCGAGACCTGGCCC-3’(SEQ ID NO.34)1kb的PCR片段是用BamHI消化的,并被克隆到CMVp表达载体的EcoRV-BamHI位点中。进行测序的全部6个克隆都含有潜在的多态性,包括氨基酸294从Arg到Ser的改变。此后,测定并证实人GPR35的核酸(SEQ ID NO.15)及氨基酸(SEQ ID NO.16)序列。
i.ETBR-LP2(Seq.Id.Nos.17&18)ETBR-LP2是1998年,由Valdenaire O.等,424(3)FEBS Lett.193(1998)克隆并测序的,推断的核酸及氨基酸序列见Valdenaire的图1。ETBR-LP2具有编码613氨基酸蛋白的,1839bp的可读框。据报道,ETBR-LP2与B型内皮素受体(ETBR-LP)同源。此外,ETBR-LP2与人GPR37的氨基酸序列大约47%同源。据报道,ETBR-LP2在人中枢神经系统中表达(例如,大脑皮质,内囊纤维和伯格曼神经胶质(424FEBS Lett at 196))。
PCR是以脑cDNA作为模板,使用rTth聚合酶(Perkin Elmer)和制造商提供的缓冲液系统,0.25μM的每种引物,和0.2mM的4种核苷酸进行的。循环条件是94℃1分钟,65℃1分钟和72℃1.5分钟,循环30次。5’PCR含具有下列序列的EcoRI位点5’-CTGGAATTCTCCTGCTCATCCAGCCATGCGG-3’(SEQ ID NO.35)而3’引物含具有下列序列的BamHI位点5’-CCTGGATCCCCACCCCTACTGGGGCCTCAG-3’(SEQ ID NO.36)
所得1.5kb的PCR片段是用EcoRI和BamHI消化的,并被克隆到pCMV表达载体的EcoRI-BamHI位点中。此后,测定并证实人ETBR-LP2的核酸(SEQ ID NO.17)及氨基酸(SEQ ID NO.18)序列。
j.GPR26(Seq.Id.Nos.97&98)EST克隆HIBB055,一个3,400bp的PCR片段,用于筛选人基因组λ-II文库(Stratagene目录的特定顺序)。筛选条件如下55℃时,滤器在甲酰胺杂交溶液中杂交过夜。洗涤条件是65℃用2XSSC/1%SDS洗涤两次,65℃用.2X SSC/.1%SDS洗涤两次,每次20分钟。把滤器放置在薄膜上,-80℃曝光过夜,第二天显影。通过在相同条件下,从原始填料第二轮筛选噬菌体而进一步表征阳性噬斑。
然后用250bp的探针探测人胎儿脑cDNA库Uni-ZAP XP载体(目录#937227,Stratagene),所述探针是从来源于基因组库筛选的新序列产生的。250bp的探针是利用Taqplus Precision PCR系统(Stratagene #600210)和制造商提供的缓冲液系统,通过PCR产生的。循环参数如下95℃45秒,55℃40秒和72℃1分钟,循环30次,最后延伸10分钟。所用引物如下5’-CGAGAAGGTGCTCAAGGTGGC-3’(SEQ ID NO.99)和5’-GAGAAGAGCTCCACTAGCCTGGTGATCACA-3’(SEQ ID NO.100)。
人胎儿脑cDNA文库是在与基因组文库相同的条件下,使用相同的250bp PCR片段探测的,只是杂交温度为42℃。阳性原始填料是在相同条件下,在55℃的杂交温度时,通过第二轮筛选进一步表征的。阳性噬斑是利用Sanger方法,通过序列进行分析的,起始密码子是从其中一个阳性克隆得到的。
然后使用PfuTurbo DNA聚合酶(Stratagene#600250)通过PCR生产人GPR26的全长克隆,参数如下95℃45秒,62℃1分钟和72℃1.2分钟,循环40次,最后延伸10分钟。所用模板为人胎儿脑cDNA(Clonetech#7402-1),引物如下5’-GAATTCATGAACTCGTGGGACGCGGGCCTGGCGGGC-3’(SEQ ID NO.101)和5’-CTCGAGTCACTCAGACACCGGCAGAATGTTCT-3’(SEQ ID NO.102)。
所产生的片段具有一个5’EcoR1接头和一个3’Xho1接头。PCR产物是用已知的连接酶消化的,并使用快速连接试剂盒(Roche#1635379)被亚克隆到表达载体pcDNA3.1(+)(Invitrogen#V790-20)的EcoR1/XhoI位点。此后,确定并证实人GPR26的核酸(SEQ IDNO.97)及氨基酸(SEQ ID NO.98)序列。
实施例2非内源性组成型活化的GPCR的制备本领域那些技术人员有能力选择核酸序列的突变技术。下面提出的是用于生产上面公开的人GPCR若干非内源性形式的方法。下面公开的突变是以算法为基础的,保守脯氨酸(或其内源性的保守置换)残基(位于GPCR的TM6区中,接近TM6/IC3界面)的第16个氨基酸(位于GPCR的IC3区)发生突变,优选突变成丙氨酸,组氨酸,精氨酸或赖氨酸残基,最优选突变成赖氨酸残基。
1.定点诱变非内源性人GPCR的制备是根据制造商的指导,使用TransformerSite-DirectedTM诱变试剂盒(Clontech)或QuickChangeTMSite-DirectedTM诱变试剂盒(Stratagene,根据制造商的指导)在人GPCR上进行的。使用指定的序列引物(表C),按照上述方法使下列GPCR突变。为简便起见,还以标准形式标注了插入到人GPCR中的密码子突变(表C)
表C
1.生产非内源性人GPCR的可选择方法非内源性组成型活化的人GPR35受体的制备是通过建造A216K突变完成的。诱变是按照制造商的指导,使用Transformer Site-DirectedTM诱变试剂盒(Clontech)进行的。(见,核酸序列SEQ IDNO.84,氨基酸序列SEQ ID NO.85)。所用的两个诱变引物是赖氨酸诱变寡核苷酸,和选择标记寡核苷酸,它们具下列序列5’-GCCACCCGCAAGGCTAAACGCATGGTCTGG-3’(SEQ ID NO.60,有义)5’-CTCCTTCGGTCCTCCTATCGTTGTCAGAAGT-3’(SEQ ID NO.61,反义)对于第一轮PCR而言,SEQ ID NO.33和SEQ ID NO.61用于生产5,700bp的片段,而SEQ ID NO.34和SEQ ID NO.60用于生产3,350bp的片段。PCR是以内源性GPR35的GDNA作为模板,使用pfu聚合酶(Stratagene)和制造商提供的,补充了10%DMSO的缓冲液系统,0.25μM的每种引物,和0.5mM的4种核苷酸进行的。循环条件是94℃30秒,65℃1分钟和72℃2分20秒,循环25次。然后使用第一轮PCR的5’和3’PCR片段作为共同的模板进行第二轮PCR,其中所用引物是寡核苷酸1和2,聚合酶是上述pfu,只是退火温度为55℃,延伸时间为2分钟。然后按照内源性cDNA所述,消化所得PCR片段,并把它亚克隆到pCMV中。
然后对非内源性人GPCR进行测序,衍生和证实的核酸及氨基酸序列在本专利文件的附件“序列表”中列出,在下面的表D中概括
表D
实施例3受体表达虽然本领域很多细胞都可表达蛋白,但优选使用哺乳动物细胞。据推测,主要原因在于可行性,即,表达GPCR的酵母细胞的使用可能会引入非-哺乳动物细胞,其可能(事实上,对于酵母而言,确实)不包括受体-偶联,遗传-机理和分泌途径,而这些经过发展已经用于哺乳动物系统-因此,在非-哺乳动物细胞中获得的结果,虽然可能有用,但不如使用哺乳动物细胞获得的那些结果好。虽然可根据技术人员的特殊需要预测所用的特定哺乳动物细胞,但在哺乳动物细胞中,COS-7,293和293T细胞是特别优选的。
a.293细胞的瞬时转染第一天,以6×106个细胞/10cm培养皿的密度接种293细胞。第二天,准备两支反应试管(每个平板一支试管)试管A是通过把4μg DNA(例如,pCMV载体;具有受体cDNA的pCMV载体等)混合在0.5ml没有血清的DMEM(Gibco BRL)中制备的;试管B是通过把24μl脂转染胺(Gibco BRL)混合在0.5ml没有血清的DMEM中制备的。然后把试管A和B翻转(几次)混合,室温孵育30-45分钟。该混合物被称作“转染混合物”。用1XPBS洗涤铺板的293细胞,然后加入5ml没有血清的DMEM。把1ml转染混合物加入到细胞中,37℃/5%CO2孵育4小时。通过抽吸除去转染混合物,加入10ml DMEM/10%胎牛血清。37℃/5%CO2孵育细胞。孵育48小时后,采集细胞,并进行分析。
b.稳定的293细胞系把大约12×106个293细胞铺板到15cm的组织培养平板上,使它们在含有10%胎牛血清和1%丙酮酸钠,L-谷氨酰胺和抗生素的DME高浓度葡萄糖培养基中生长。293细胞在铺板24小时后(大约-80%汇合),使用12μg DNA转染细胞。所述12μg DNA与60μl脂转染胺和2mL没有血清的DME高浓度葡萄糖培养基混合。把培养基从平板中吸出,用没有血清的培养基洗涤细胞一次。然后把DNA,脂转染胺,和培养基混合物连同10mL没有血清的培养基一起加到平板中。37℃孵育4-5小时后,吸出培养基,加入25ml含血清的培养基。转染24小时后,再次吸出培养基,加入含血清的新鲜培养基。转染48小时后,吸出培养基,加入含血清的培养基,其中还含有终浓度为500μg/mL的遗传霉素(G418药物)。然后选择含有G418抗性基因的阳性转染细胞。进行选择时每4-5天更换培养基。在选择过程中,细胞生长产生稳定的集合体,或分裂进行稳定的克隆选择。
c.RGT细胞(用于mGluR7)RGT细胞是从腺病毒转化的叙利亚仓鼠细胞系(AV12-664)得到的,其中稳定转染了谷氨酸盐-天门冬氨酸盐转运蛋白。
第一天,以5×106个细胞/10cm培养皿的密度接种RGT细胞。第二天,向试管中加入91μl没有血清的培养基,接着加入9μl Fugene 6(Roche)。向相同的混合物中加入3μgDNA(0.5μg/μl)。轻轻混合该混合物,室温孵育15分钟,然后,把该混合物逐滴加入DMEM/10%FBS中生长的细胞,37℃/5%CO2孵育48小时。孵育48小时后,采集细胞并进行分析。
实施例4用于测定非内源性GPCR的组成型活性的测定法有很多方法都可用来评估非内源性人GPCR的组成型活性。下面是举例说明;本领域那些普通技术人员有能力确定对技术人员的需要最有益的那些技术。
1.膜结合测定法[35S]GTPγS测定法当G蛋白偶联受体处于活性状态时,作为配体结合或组成型活化的结果,受体与G蛋白偶联,并刺激GDP的释放及随后GPT与G蛋白的结合。G蛋白-受体复合体的α亚单位可起GTP酶的作用,并缓慢把GTP水解为GDP,受体通常在该点失活。组成型活化的受体继续把GDP交换成GTP。不可水解的GTP类似物[35S]GTPγS可用于证实[35S]GTPγS与表达组成型活化受体的膜的结合提高。使用[35S]GTPγS结合测量组成型活化的优点包括但不限制于(a)可通用于所有G蛋白偶联受体;(b)它接近膜表面,不太可能选出影响胞内级联的分子。
该测定法利用了G蛋白偶联受体刺激[35S]GTPγS与表达相关受体的膜结合的能力。因此,该测定法可用于直接鉴定的方法中,筛选组成型活化的G蛋白偶联受体的候选化合物。该测定法比较普遍,可用于所有G蛋白偶联受体的药物发现。GTPγS测定法是在20mM HEPES和1-约20mM MgCl2(虽然优选20mM,但为使结果最佳,可对该量进行调整)pH7.4,具有约0.3-1.2nM[35S]GTPγS的结合缓冲液(虽然优选1.2,但为使结果最佳,可对该量进行调整),12.5-75μg膜蛋白(例如,表达Gs融合蛋白的293细胞;为使结果最佳,可对该量进行调整)和10μM GDP(为使结果最佳,可对该量进行调整)中孵育1小时。然后加入小麦胚凝集素珠(25μl;Amersham),室温再孵育该混合物30分钟。然后室温时,以1500xg将试管离心5分钟,在闪烁计数器中计数。
2.基于细胞的cAMP测定法可以改进为基于细胞的测定法设计的Flash PlateTM腺苷酸环化酶试剂盒(New England Nuclear,Cat.No.SMP004A),从而用于粗质膜。闪烁平板的孔可含有闪烁涂层,其中还含有识别cAMP的特异性抗体。孔中产生的cAMP可通过与放射性cAMP示踪剂竞争结合cAMP抗体而量化。下列是测量表达受体的全细胞中cAMP水平的改变而进行的简要方案。
在瞬时转染后大约2 4小时采集转染的细胞。小心吸出培养基并弃去。向每个细胞培养皿中轻轻加入10ml PBS,然后小心吸出。向各平板中加入1ml Sigma细胞解离缓冲液和3ml PBS。把细胞从平板中吸出,将细胞混悬液收集到50ml锥形离心管中。室温1,100rpm把细胞离心5分钟。把细胞沉淀物小心重悬浮在适当体积的PBS中(大约3ml/平板)。然后用血细胞计数器给细胞计数,加入额外的PBS至得到适宜的细胞数(至大约50μl/孔的终体积)。
cAMP标准和检测缓冲液(11ml检测缓冲液含1μCi示踪剂[125IcAMP(50μl)])是根据制造商的指导制备并维持的。用于筛选的测定缓冲液是新鲜制备的,并含有50μl刺激缓冲液,3μl试验化合物(12μM终测定浓度)和50μl细胞,测定缓冲液在冰上贮存备用。该测定法是通过向适当的孔中加入50μl cAMP标准,接着向孔H-11和H-12中加入50μl PBSA而开始的。向所有孔中加入50μl刺激缓冲液。使用能够分散3μl化合物溶液的针状工具将DMSO(或选择的候选化合物)加入到适当的孔中,试验化合物的终测定浓度为12μM,总测定体积为100μl。然后把细胞加入到孔中,室温孵育60分钟。向孔中加入100μl含示踪剂cAMP的检测混合物。将平板再孵育2小时,接着在WallacMicroBetaTM闪烁计数器中计数。然后根据各测定平板的标准cAMP曲线推断cAMP/孔的值。
3.Gi偶联的FPRL-2与Gs/Gi融合蛋白构建体的共转染含FPRL-2和Gs/Gi融合蛋白构建体的转染混合物(实施例3A)是通过抽吸除去的,然后加入10ml DMEM/10%胎牛血清。37℃/5%CO2孵育该细胞。孵育48小时后,采集细胞并进行分析。然后按照上面实施例4(2)的方案进行基于细胞的cAMP检测。
由于认为内源性FPRL-2主要与活性状态的Gi蛋白偶联,因此所产生cAMP的降低预示所公开FPRL-2的非内源性形式是组成型活性的。因此,通过增加cAMP信号而影响FPRL-2受体的候选化合物是反向激动剂,而FPRL-2激动剂可降低cAMP信号。见,图1。
图1显示与Gs/Gi相比,FPRL-2的活性增加了大约4倍。当把FPRL-2的内源性形式与非内源性形式进行比较时,与对照组Gs/Gi相比,非内源性FPRL-2(“FPRL-2(“FPRL-2(L240K)”))的受体活性增加了约3倍。因此,该数据表明,FPRL-2的内源性和非内源性形式是组成型活性的。
参考图9。在图9中,与GPR37(“GPR37wt”)的内源性形式相比,非内源性GPR37(L352R)产生的cAMP增加了约354%,而与GPR37wt相比,GPR37(C543Y)产生的cAMP增加了约189%。该数据表明,GPR37的非内源性L352R和C543Y形式都是组成型活化的。
4.Gi偶联靶GPCR的基于细胞的cAMPTSHR是一种Gs偶联的GPCR,活化后可引起cAMP累积。TSHR是通过使氨基酸残基623突变(即,丙氨酸残基变为异亮氨酸残基)而被组成型活化的。预期Gi偶联受体可抑制腺苷酸环化酶,并因此降低cAMP的产生水平,这就难以评估cAMP的水平。作为Gi偶联受体组成型活化的指示,测量cAMP产生降低的有效技术可通过使“信号增强子”,例如最优选非内源性组成型活化的TSHR(TSHR-A623I)(或内源性组成型活性的Gs偶联受体)与Gi连接的靶GPCR共转染,建立cAMP的基础水平而实现。在生产Gi偶联受体的非内源性形式后,使靶GPCR的非内源性形式与信号增强子共转染,该物质可用于进行筛选。当使用cAMP测定法时,该方法可用于有效产生信号;该方法优选针对Gi偶联受体直接鉴定候选化合物。应当指出,对于Gi偶联的GPCR而言,当使用此方法时,靶GPCR的反向激动剂增加cAMP信号,激动剂则降低cAMP信号。
细胞是按照上面实施例3A转染的。在瞬时转染约24小时后,采集转染的细胞。然后按照上面实施例4(2)中的方案进行基于细胞的cAMP检测。
优选,而且正如先前指出的,为确保小分子候选化合物针对Gi偶联的靶受体,而不是例如TSHR(A623I),优选在没有靶受体存在的情况下,针对信号增强子直接筛选鉴定候选化合物。
参考图3。图3是293细胞中,内源性GPR45(“GPR45wt”)与对照组(“CMV”)的比较分析。内源性靶受体GPR45与信号增强子TSHR(A623I)共转染。与对照组(CMV)相比,在没有TSH,TSH受体的内源性配体存在的情况下,TSHR(A623I)与内源性GPR45的共转染显示cAMP的产生降低了大约96%。与对照组(CMV)相比,在有TSH存在的情况下,内源性GPR45(“GPR45wt”)显示cAMP的产生降低了约73%。该数据表明,GPR45是内源性组成型活性的,并通过Gi蛋白偶联。
参考图4和表E。表E是图4的概括,它是在293细胞中,内源性mGluR7(“mGluR7wt”)与若干mGluR7的非内源性形式(“W590S”,“R659H”,“T711C”和“I790K”)及对照组(“pCMV”)的比较分析。表E概括了在没有内源性配体(即,TSH)存在的情况下,载体cAMP的产生,所述载体含有信号增强子受体(即,TSHR(A623I))和靶受体(mGluR7);在有TSH存在的情况下,信号增强子与靶受体共转染产生的cAMP降低的百分比(%);在有TSH存在的情况下,与TSHR(A623I)共转染的mGluR7的内源性形式和非内源性形式之间cAMP的产生。该数据显示,与内源性mGluR7相比,mGluR7的非内源性形式(“W590S”,“R659H”,“T771C”和“I790K”)可降低cAMP的产生,并因此通过上面公开的方法被组成型活化。
表E
在RGT细胞中转染的mGluR 7形式支持了上述数据。参考图5。在图5中,与mGluR7受体的内源性形式相比,W590S显示cAMP的产生降低了约52%,R659H显示降低了约43%;T771C显示降低了约5%;I790K显示cAMP的产生降低了约28%。
因为mGluR7主要与活性状态的Gi偶联,因此cAMP产生的降低预示所公开的mGluR7的非内源性形式是组成型活性的。因此,通过增加cAMP信号而影响mGluR7受体的候选化合物是反向激动剂,而mGluR7激动剂则降低cAMP信号。以图5和6的数据为基础,当在293和RGT细胞中使用cAMP测定法,并用于TSHR组成型活化的共转染方法中时,“W590S”,“R659H”,“T711C”和“I790K”是优选的mGluR7非内源性形式,最优选“W590S”。
参考图12。在图12中,与HF1948(“wt”)的内源性形式相比,HF1948的非内源性形式(“I281F”和“E135N”)分别显示cAMP的产生降低了约18%和39%。该数据表明,HF1948的非内源性I281F和E135N形式都是组成型活化的。cAMP的这种降低进一步表明这些形式是Gi-偶联的。除了是Gi-偶联的之外,图11还表明,HF1948的内源性I281F形式还可与GqG蛋白偶联(见,下面的实施例4(5)(f))。
参考图16。图16显示,与内源性ETBR-LP2(“WT”)(102.59pmolcAMP/孔)和TSHR-A623I的共转染相比,非内源性组成型活化的ETBR-LP2(“N358K”)(65.96pmol cAMP/孔)与TSHR-A623I(“TSHR-A623I”)(在有TSH存在的情况下)共转染时,细胞产生的cAMP降低了约36%。当相对于pCMV与TSHR-A623I(290.75pmolcAMP/孔)的共转染,把ETBR-LP2(“N358K”)与TSHR-A623I的共转染和ETBR-LP2(“WT”)与TSHR-A623I的共转染进行比较时,它们cAMP的产生分别降低了约77%和65%。优选,该方法用于筛选增加信号的反向激动剂,而激动剂应降低信号。为了证实小分子结合ETBR-LP2,而不结合TSHR-A623I构建体,优选在没有ETBR-LP2存在的情况下,针对该构建体筛选小分子。
5.基于受体的测定法a.Cre-Luc报道分子测定法(Gs-相关受体)把293和293T细胞以2×104个细胞/孔的密度铺于96孔平板上,第二天按照制造商的指导,使用脂转染胺试剂(BRL)转染。如下制备DNA/脂类混合物用于6-孔转染把100μl DMEM中的260ng质粒DNA与100μl DMEM中的2μl脂类(260ng质粒DNA由200ng 8xCRE-Luc受体质粒,50ng pCMV,其中含内源性受体或非内源性受体或只含pCMV,和10ng GPRS表达质粒(GPRS在pcDNA3中(Invitrogen)))轻轻混合。8XCRE-Luc受体质粒是如下制备的载体SRIF-β-gal是通过在pβgal-Basic载体(Clontech)中的BglV-HindIII位点克隆大鼠促生长素抑制素启动子(-71/+51)得到的。cAMP反应元件的八(8)个拷贝是通过PCR从腺病毒模板AdpCF126CCRE8(见,7 HumanGene Therapy 1883(1996))获得的,并被克隆到SRIF-β-gal载体的Kpn-BalV位点,产生8xCRE-β-gal报道分子载体。8xCRE-Luc报道分子质粒是通过用pGL3-basic载体(Promega)中HindIII-BamHI位点的荧光素酶基因替换8xCRE-β-gal报道分子载体中的β-半乳糖苷酶基因而产生的。室温孵育30分钟后,用400μl DMEM稀释DNA/脂类混合物,并向各孔中加入100μl稀释的混合物。在细胞培养孵育箱中孵育4小时后,向各孔中加入100μl含有10%FCS的DMEM。第二天,用含10%FCS的DMEM以200μl/孔更换转染的细胞。8小时后,用PBS洗涤一次之后,把孔更换为100μl/孔没有酚红的DMEM。第二天,按照制造商的指导使用LucLiteTM报道基因测定试剂盒(Packard)测量荧光素酶的活性,并在1450 MicroBetaTM闪烁发光计数器(Wallac)上读数。
参考图2。图2显示在12.5ng STRL33报道分子的情况下,与对照组(CMV)相比,STRL33的活性降低了约50%。在12.5ng蛋白的情况下,把STRL33的内源性形式和非内源性形式进行比较,非内源性STRL33(“STRL33(L230K)”)显示报道分子的活性降低了约30%,在25ng蛋白的情况下,降低了约40%。该数据表明,STRL33报道分子的非内源性形式是组成型活性的,而且可与G蛋白Gi偶联。
b.AP1报道分子测定法(Gq相关受体)检测Gq刺激的方法取决于Gq-依赖性磷脂酶C的已知性质,它可引起启动子中含AP1元件的基因活化。按照上述CREB报道分子测定法所述的方案,使用PathdetectTMAP-1顺式-报道系统(Stratagene,目录#219073),只是磷酸钙沉淀的组分为410ng pAP1-Luc,80ng pCMV-报道分子表达质粒,和20ng CMV-SEAP。
参考图17。图17显示与内源性ETBR-LP2(862个相对光单位)相比,人ETBR-LP2的非内源性组成型活化形式(“N358K”)(2203个相对光单位)的活性增加了61.1%。该数据表明,ETBR-LP2受体的非内源性形式是组成型活性的,而且可与G蛋白Gi偶联。
c.SRF-Luc报道分子测定法(Gq相关受体)检测Gq刺激的方法取决于Gq-依赖性磷脂酶C的已知性质,它可引起启动子中含血清反应因子的基因活化。PathdetectTMSRF-Luc-报道系统(Stratagene)可用于测定COS7细胞中的Gq偶联活性。细胞是按照制造商的指导,使用哺乳动物转染TM试剂盒(Stratagene,Catalogue #200285),和系统的质粒成分及编码内源性或非内源性GPCR的表达质粒转染的。简单地说,按照制造商的指导,把410ngSRF-Luc,80ng pCMV-受体表达质粒和20ng CMV-SEAP(分泌型碱性磷酸酶表达质粒;碱性磷酸酶活性是在转染细胞的培养基中测量的,从而控制样品之间转染效率的变化)结合在磷酸钙沉淀中。沉淀的一半平均分布在96孔平板的3个孔中,细胞在没有血清的培养基中保持24小时。最后5小时,用1μM血管紧张素培养细胞。然后溶解细胞,按照制造商的指导,使用LucliteTM试剂盒(Packard,Cat.#6016911)和“Trilux 1450 Microbeta”液体闪烁发光计数器(Wallac)测定荧光素酶的活性。该数据可使用GraphPad PrismTM2.0a(GraphPadSoftware Inc.)分析。
d.SRE报道分子测定法在293细胞中利用SRE-Luc报道基因(Mer cury荧光素酶系统3的组分,Clontech Catalogue #K2053-1)。细胞是按照制造商的指导,使用脂转染胺试剂(Gibco/BRL,Catalogue #18324-012),和系统的质粒成分及编码内源性或非内源性受体的表达质粒转染的。简单地说,按照制造商的指导,把420ng SRE-Luc,50ng CMV(含GPR37受体)和30ng CMV-SEAP(分泌型碱性磷酸酶表达质粒;碱性磷酸酶的活性是在转染细胞的培养基中测量的,从而控制样品之间转染效率的变异)结合在阳离子脂类-DNA沉淀中。用Optimem(Vendor)补充至最终体积为25μl。它被称作“模板混合物”。把模板混合物与脂转染胺混合在聚苯乙烯试管中,孵育30分钟。在孵育过程中,用100μlOptimem洗涤细胞。孵育后,把200μl 0ptimem加入到混合物中,40μl-50μl/孔。细胞在混合物中过夜。第二天早上,以130μl/孔加入DMEM/没有酚红/1%FBNS,用新鲜培养基更换培养基。然后按照制造商的指导,使用LucliteTM试剂盒(Packard,Cat.#6016911)和“Trilux1450 Microbeta”液体闪烁发光计数器(Wallac)测定细胞的荧光素酶活性。使用GraphPad PrismTM2.0a(GraphPad Software Inc.)分析数据。
参考图7。在图7中,当比较GPR37的非内源性形式(“C543Y”)和内源性形式(“wt”)时,C543Y突变较之wt形式显示cAMP的产生增加了约316%,而非内源性形式“L352R”较之wt形式显示cAMP的产生增加了约178%。该数据表明,GPR37的非内源性形式C543Y和L352R都是组成型活化的。
e.E2F-Luc报道分子测定法在293A细胞中使用pE2F-Luc报道分子(Mercury荧光素酶系统3的组分,Clontech Catalogue #K2053-1)。细胞是按照制造商的指导,使用脂转染胺试剂(Gibco/BRL,Catalogue #18324-012),和系统的质粒成分及编码内源性或非内源性受体的表达质粒转染的。简单地说,按照制造商的指导,把400ng pE2F-Luc,80ng CMV(含GPR35受体)和20ng CMV-SEAP(分泌型碱性磷酸酶表达质粒;碱性磷酸酶的活性是在转染细胞的培养基中测量的,从而控制样品之间转染效率的变化)结合在阳离子脂类-DNA沉淀中。沉淀的一半平均分布在96-孔平板的3个孔中,细胞保持过夜,第二天用新鲜培养基替换。开始转染后四十八(48)小时,处理细胞,并按照制造商的指导,使用LucliteTM试剂盒(Packard,Cat.#6016911)和“Trilux 1450Microbeta”液体闪烁发光计数器(Wallac)测定荧光素酶的活性。使用GraphPad PrismTM2.0a(GraphPad Software Inc.)分析数据。
参考图14。图14显示,与内源性GPR35(24.97个相对光单位)相比,人GPR35的非内源性组成型活性形式(A216K)(607.13个相对光单位)的活性增加了约100%。该数据表明,GPR35(A216K)与转录因子E2F相互作用,驱动荧光素酶蛋白的表达。与E2F的这种相互作用,连同GPR35在结肠癌细胞中的表达进一步表明,GPR35可在癌细胞增殖中起作用。因此,以这些数据为基础,影响GPR35受体的优选侯选化合物是反向激动剂。该数据表明,GPR35的反向激动剂可用于治疗癌症,特别是结肠癌。
f.胞内IP3累积测定法(Gq相关受体)第1天,通常以1×105个细胞/孔(虽然可优化该数字)的密度在2 4孔平板上铺板含受体(内源性和/或非内源性)的细胞。第2天,首先通过在50μl没有血清的DMEM/孔中混合0.25μg DNA和2μl脂转染胺而把细胞转染。将溶液轻轻混合,室温孵育15-30分钟。细胞用0.5ml PBS洗涤,然后把400μl没有血清的培养基与转染培养基混合,加入到细胞中。细胞在37℃/5%CO2孵育3-4小时,除去转染培养基,用1ml/孔的常规生长培养基替换。第3天,用3H-肌醇标记细胞。简单地说,除去培养基,用0.5ml PBS洗涤细胞。然后向每孔加入0.5ml没有肌醇/没有血清的培养基(GIBCO-BRL)和0.25μCi的3H-肌醇,37℃/5%CO2孵育细胞16-18小时过夜。第4天,用0.5ml PBS洗涤细胞,加入0.45ml测定培养基,其中含有没有肌醇/没有血清的培养基,10μM帕吉林,10mM氯化锂,或0.4ml测定咯养基。然后在37℃孵育细胞30分钟。用0.5ml PBS洗涤细胞,向每孔加入200μl新鲜/冰冷的终止溶液(1M KOH;18mM硼酸钠;3.8mM EDTA)。该溶液在冰上放置5-10分钟(或直到细胞溶解),然后用200μl新鲜/冰冷的中和溶液(7.5%HCl)中和。把溶解产物转移到1.5ml Eppendorf试管中,每支试管中加入1ml氯仿/甲醇(1∶2)。溶液涡旋15秒,把上层相上样到Biorad AG1-X8TM离子交换树脂(100-200目)上。首先,以1∶1.25W/V的水洗树脂,并把0.9ml上层相上样到柱上。然后用10ml5mM的肌醇和10ml 5m硼酸钠/60mM甲酸钠洗柱子。把肌醇三磷酸洗脱到闪烁小瓶中,其中含有10ml闪烁鸡尾酒和2ml 0.1M甲酸/1M甲酸铵。通过用10ml 0.1M甲酸/3M甲酸铵洗涤,并用dd H2O冲洗两次而使柱子再生,贮存在4℃的水中。
参考图6。在图6中,用含有6个氨基酸缺失的Gq蛋白“Gq(缺失)”;与Gi蛋白融合的Gq蛋白“Gq(缺失)/Gi”,和非内源性mGluR7,T771C加之Gq(缺失)“T771C+Gq(缺失)”及T771C与Gq(缺失)/Gi“T771C+Gq(缺失)/Gi”转染293细胞。在有和没有谷氨酸存在的情况下测量肌醇三磷酸。在有谷氨酸盐存在的情况下,与Gq(缺失)/Gi相比,mGluR7的非内源性形式与Gq(缺失)/Gi的共转染显示大约增加了1850倍;在有谷氨酸盐存在的情况下,与T771C+Gq(缺失)/Gi相比,增加了大约860倍。这些数据表明,mGluR7,一种Gi偶联受体,可通过Gq蛋白活化。因此,Gq(缺失)/Gi融合构建体可与GPCR共转染,用作筛选侯选化合物的工具。
参考图11。在图11中,当比较HF1948的非内源性形式(“I281F”)与内源性形式(“wt”)时,I281F突变较之wt形式使IP3累积增加了大约361%。该数据表明,HF1948的非内源性I281F形式是组成型活化且Gq-偶联的。
实施例5融合蛋白的制备a.GPCRGs融合构建体组成型活化的GPCR-G蛋白融合构建体的设计如下进行对大鼠G蛋白Gsα(较长形式;Itoh,H.等,83 PNAS 3776(1986))5’和3’末端进行工程化,使其含有HindIII(5’-AAGCTT-3’)序列。在确认了正确的序列之后(含有侧翼HindIII序列),利用该载体的HindIII限制性位点通过亚克隆把整个序列插入到pcDNA3.1(-)(Invitrogen,cat.no.V795-20)中。Gsα序列的正确方向在亚克隆到pcDNA3.1(-)中后确定。然后证实在HindIII序列上含有大鼠Gsα基因的修饰pcDNA3.1(-);该载体可被用作“通用的”Gsα蛋白载体。pcDNA3.1(-)载体在HindIII位点的上游含有各种熟知的限制性位点,因此可有利地在Gs蛋白上游插入内源性组成型活性的GPCR编码序列。同样的方法还可用于生产其它“通用的”G蛋白载体,当然,也可使用技术人员已知的其它市售或专有载体。在某些实施方案中,重要的标准在于GPCR序列位于G蛋白的上游,而且与G蛋白的序列符合读框。
G蛋白和GPCR之间限制性位点中的间隔区是任选的。有义和反义引物分别含有XbaI和EcoRV限制性位点,这样在G蛋白和GPCR之间就会存在间隔区(属于限制性位点)。
然后,利用PCR使各受体序列在上述Gsα通用载体内融合,方法如下把100ng GPCR的cDNA加入到单独的试管中,每个试管中含有2μl引物(有义和反义),3μl 10mM的dNTPs,10μl10XTaqPlusTMPrecision缓冲液,1μl TaqPlusTMPrecision聚合酶(Stratagene#600211),和80μl水。GPCR的反应温度和循环次数如下94℃1分钟;94℃30秒;62℃20秒;72℃1分40秒;和72℃5分钟,第2-4个循环步骤重复35次。使PCR产物经过1%琼脂糖凝胶,然后纯化。纯化产物用XbaI和EcoRV消化,所需插入片段纯化后,与Gs通用载体的各限制性位点连接。转化后分离阳性克隆,并通过限制性酶消化来测定;使用293细胞表达是按照上述方法完成的。对GPCR-Gs融合蛋白的每个阳性克隆进行测序,以证实正确性。
b.Gq(6个氨基酸缺失)/Gi融合构建体Gq(缺失)/Gi融合构建体的设计是如下进行的Gαq-亚单位具有TLESIM(SEQ ID NO.88)序列的N-末端六(6)个氨基酸(氨基酸2-7)被缺失,具有EYNLV(SEQ ID NO.89)序列的C-末端五(5)个氨基酸被具有序列DCGLF(SEQ ID NO.90)的Gαi蛋白的相应氨基酸替换。该融合构建体是使用下列引物通过PCR获得的5’-gatcAAGCTTCCATGGCGTGCTGCCTGAGCGAGG-3’(SEQ ID NO.91)和5’gatcGGATCCTTAGAACAGGCCGCAGTCCTTCAGGTTCAGCTGCAGGATGGTG-3’(SEQ ID NO.92),其中以含有小鼠Gαq-野生型的质粒63313作为模板,小鼠Gαq-野生型具有血细胞凝集素标记。小写的核苷酸作为间隔区。
使用TaqPlus Precision DNA聚合酶(Stratagene)扩增,循环条件如下95℃2分钟;95℃20秒;56℃20秒;72℃2分钟;和72℃7分钟,第2-4步重复35次。把PCR产物克隆到pCRII-TOPO载体(Invitrogen)中,使用ABI Big染料终止子试剂盒(P.E.Biosystems)进行测序。通过2步克隆,把含有融合构建体序列的TOPO克隆的插入片段插入到表达载体pcDNA3.1(+)的HindIII/BamHI位点中。
c.Gs/Gi融合蛋白构建体Gs/Gi融合蛋白构建体的设计如下进行Gαs-亚单位具有序列5’-QYELL-3’(SEQ ID NO.93)的C-末端五(5)个氨基酸被缺失,并用Gαi蛋白具有序列5’-DCGLF-3’(SEQ ID NO.94)的相应氨基酸替换。该蛋白融合构建体是使用5’和3’寡核苷酸,通过PCR获得的。
使用TaqPlusPrecision DNA聚合酶(Stratagene)进行扩增,循环条件如下98℃2分钟;98℃30秒;60℃30秒;72℃2分钟;和72℃5分钟,第2-4步重复25次。把PCR产物克隆到pCRII-TOPO载体(Invitrogen)中,使用ABI Big染料终止子试剂盒(P.E.Biosystems)进行测序。把含有蛋白融合构建体序列的TOPO克隆的插入片段插入到表达载体pcDNA3.1(+)的限制性位点中。然后测定Gs/Gi蛋白融合构建体的核酸序列。见核酸序列SEQ ID NO.95和氨基酸序列SEQ ID NO.96。
实施例6施旺氏细胞的制备把2L新生大鼠幼畜(Sprague Dawley)(产后第2天-产后第3天)放在冰上致死。移走幼鼠,切掉头部,使血液排出。把它腹部向下放在解剖台上,用70%乙醇清洗消毒。使用解剖刀除去大腿区域的皮肤,直到露出坐骨神经(或直到看见从脊髓到膝部延伸的细白“线”)。把神经放在DMEM培养基中,然后吸出,接着用DMEM培养基补充至2.4ml体积,加入300μL 10X胶原酶(0.3%,Sigma Cat.#C-9891)和300μL 10X胰蛋白酶(0.25%,GIBCO Cat.#25095-019)进行解离。然后37℃孵育神经15分钟,1,000rpm离心5分钟,除去培养基(重复2次)。加入1mL DMEM-HEPES和1mL DMEM/10%FBS,然后转移到50mL锥形试管中。用下列规格的针头剪切试管内含物18G一次,21G两次,23G两次。把内含物放在Falcon细胞渗滤器上,低速(大约1200rpm)旋转。用DEME/10%FBS补充至总体积为10mL,铺板于聚-L-赖氨酸处理过的10cm平板(Sigma,Cat.#P-1274)上。在37℃,7%CO2的湿润孵育箱中孵育过夜。加入含有100X ARA C(10mM,Sigma,Cat.#C-1768)的新鲜培养基,再培养48小时。然后用PBS洗涤细胞(3次),除去ARA C,加入DMEM/10%FBS,100%乙醇中不同浓度(2μM,5μM,10μM,20μM和50μM)的毛喉素(Calbiochem,Cat#344270),PBS和0.1%BSA中的80μg垂体提取物(Sigma,#P-1167),然后细胞在37℃,7%CO2的加湿器中生长30小时。采集细胞,分离RNA并进行分析。
抗体选择是如下进行的首先用1X PBS洗涤聚-L-赖氨酸处理过的平板(3次),用1mL 0.5%胰蛋白酶-EDTA进行胰蛋白酶消化约1分钟,然后用9mL DMEM-HEPES缓冲液和10%FBS中和。1200rpm离心细胞5分钟,重悬浮在3mL DMEM-HEPES中,洗出胰蛋白酶,1200rpm旋转5分钟。然后把细胞重悬浮在600μL DMEM-HEPES中,旋转之后剩下的一些培养基具有单一的细胞。加入1∶1000稀释的Thyl.1抗体(单克隆抗体,Sigma,Cat.#P-1274)。
37℃孵育细胞20分钟,每2分钟轻轻摇动试管一次。使用它之前,融解20μL豚鼠补体(GIBCO,Cat.#19195-015),然后通过把补体加入到含有抗体的细胞中至终体积1mL。在37℃水浴孵育细胞约20-30分钟,加入10mL DMEM-HEPES,1200rpm时旋转5分钟。把细胞重悬浮在5mL DMEM/10%FBS中,并加入到聚-L-赖氨酸处理过的平板中,该平板含有垂体提取物和毛喉素。使细胞恢复24-48小时,重复该免疫选择过程2次。
实施例7压碎的大鼠坐骨神经的制备使麻醉(iso-florene)成年(10-13周)Sprague-Dawley大鼠的坐骨神经暴露于坐骨神经切口。用平头镊子用力压坐骨神经切口处的坐骨神经2次,每次10秒,使神经压碎;该技术可导致轴突退化,但也可使轴突再生。在神经损伤后的不同时间,通过CO2吸入使动物死亡,除去远侧的神经残株,修剪最近处的2-3mm。对于压碎的神经来说,收集整个远侧神经。把神经立即冷冻在液氮中-80℃贮藏。未受损的坐骨神经是从不同年龄的动物获得的,P0(压碎后)-P13。
实施例8公开的人GPCR的组织分布1.RT-PCRRT-PCR可用于证实表达并测定若干新的人GPCR的组织分布。所用的寡核苷酸是GPCR-特异性的,并以人多个组织的cDNA(MTC,Clontech)作为模板。按照制造商的指导,在40μl反应物中,使用Taq DNA聚合酶(Stratagene)进行扩增。把20μl反应物上样到1.5%琼脂糖凝胶上,分析RT-PCR产物。
2.斑点印迹使用市售人-组织斑点-印迹形式的内源性GPCR探测,以确定受体定位的区域。实施例1的PCR片段用作探针放射性标记的探针是按照制造商的指导,使用该片段和Prime-It IITM随机引物标记试剂盒(Stratagene,#300385)生产的。使人RNA Master BlotTM(Clontech,#7770-1)与GPCR放射性标记的探针杂交,并按照制造商的指导,在严格条件下洗涤。-80℃时,使印迹在Kodak BioMax放射自显影胶片上曝光过夜。下面的表F列出了受体和在其中表达的组织。与受体有关的代表性疾病/病症在实施例6中讨论。
表F
3.RNA印迹a.GPR37按照制造商的指导,利用RNAzol B试剂(TelTest Inc.,Cat.#CS-104)收集实施例6的RNA。在1%琼脂糖/甲醛凝胶中进行电泳后,使用10X SSC通过毛细管作用把RNA转移到尼龙膜(SachleicherSchull)上。按照制造商的指导,使用与GPR37的3’末端准确对应的DNA片段和High Prime标记试剂盒(Roche MolecularBiochemical)合成32P-标记的GPR37 DNA探针。使用补充了100μg/ml鲑鱼精子DNA的ExpressHyb溶液(Clontech,Cat.#8015-2)如下进行杂交。首先在65℃时,用ExpressHyb溶液孵育含有分离RNA样品的薄膜过夜。32P-标记的GPR37 DNA探针通过沸腾2分钟而变性,把它在冰上放置5分钟,然后转移到浸润薄膜的ExpressHyb溶液中。65℃过夜孵育后,除去杂交溶液中的薄膜,65℃时在2XSSC/1%SDS中洗涤4次,每次15分钟,接着于255℃时,在0.2XSSC/1%SDS中洗涤2次,每次15分钟。轻轻振摇除去印迹的多余水分,然后把印迹包在塑料纸中,-80℃时,在胶片上曝光过夜。
参考图9。图9显示GPR37在施旺氏细胞中表达,这样髓鞘形成可在20μM毛喉素维持。
图10显示GPR37在压碎的大鼠坐骨神经中被上调,特别是在神经压碎后七(7)天。这样的数据与图9提出的数据相一致,即,GPR37通过刺激施旺氏细胞中髓鞘形成的过程而对神经再生起作用。
GPR37在人中枢神经系统,特别是脑中表达。已经进一步确定了GPR37在施旺氏细胞中表达。当轴突(或神经)受损时,施旺氏细胞通过在轴突周围形成髓鞘而使神经再生,其提供髓鞘形式的“隔层”。髓鞘形成的过程很重要,这是因为作用可能性快速运行,由此保存代谢能量。施旺氏细胞及其前体对于影响构成周围神经的其它细胞的存活和分化起了重要的作用。此外,已经确定GPR37在压碎的大鼠坐骨神经中表达。这样的数据支持了GPR37在神经细胞再生中起作用的证据。以受体定位的特异性组织的已知功能为基础,可推断受体的推定功能。因此,在髓鞘形成过多(例如,肿瘤发生)的情况下,优选GPR37的反向激动剂,而当发生髓鞘形成过少(例如,变性疾病,如糖尿病)时,激动剂是优选的。
b.GPR66按照制造商的指导,使用TRIzol试剂(Gibco/BRL,Cat#15596-018)分离若干胰细胞系(例如,HIT,ARIP,Tu6,RINαTC,STC,NIT,和EcR-CHO)的总RNA。在1%琼脂糖/甲醛凝胶中进行电泳后,使用标准方案把RNA转移到尼龙薄膜上。按照制造商的指导,使用与整个编码序列准确对应的DNA片段和Prime It II随机引物标记试剂盒(Stratagene,Cat.#300385)合成32P-标记的GPR66探针。杂交是使用补充了100μg/ml鲑鱼精子DNA的ExpressHyb溶液(Clontech,Cat.#8015-2)进行的。首先在65℃时,用ExpressHyb溶液孵育含有分离RNA样品的薄膜1小时。32P-标记的GPR66 DNA探针通过沸腾2分钟而变性,把它在冰上放置5分钟,然后转移到浸润薄膜的ExpressHyb溶液中。65℃过夜孵育后,除去杂交溶液中的薄膜,65℃时,在2XSSC/1%SDS中洗涤4次,每次15分钟,然后55℃时,在0.1XSSC/0.5%SDS中洗涤2次,每次15分钟。轻轻振摇除去印迹中的多余水分,然后把印迹包在塑料纸中,-80℃时,在胶片上曝光过夜。
参考图13。RNA印迹的结果(见,图13)连同斑点-印迹的数据显示,GPR66在胰腺中表达,表明GPR66在所有胰岛细胞系和ARIP细胞,即一种胰导管细胞系中大量表达。不希望受任何理论的束缚,GPR66在胰细胞系中的表达表明GPR66可在胰岛新生中起作用。
c.GPR35按照制造商的指导,利用TRIzol试剂(Gibco/BRL,Cat#15596-018)分离若干癌细胞系(例如,RIN-5AH,HEP-G2,A549,HELA,MOLT-4,HL-60和SW480细胞,全部是市售的)的总RNA。在1%琼脂糖/甲醛凝胶中进行电泳后,使用标准方案把RNA转移到尼龙薄膜上。按照制造商的指导,使用与整个编码序列准确对应的DNA片段和Prime It II随机引物标记试剂盒(Stratagene,Cat.#300385)合成32P-标记的GPR35探针。杂交是使用补充了100μg/ml鲑鱼精子DNA的ExpressHyb溶液(Clontech,Cat.#8015-2)进行的。首先在65℃时,用ExpressHyb溶液孵育含有分离RNA样品的薄膜1小时。32P-标记的GPR35 DNA探针通过沸腾2分钟而变性,把它在冰上放置5分钟,然后转移到浸润薄膜的ExpressHyb溶液中。65℃过夜孵育后,除去杂交溶液中的薄膜,65℃时,在2XSSC/1%SDS中洗涤4次,每次15分钟,然后于55℃时,在0.1XSSC/0.5%SDS中洗涤2次,每次15分钟。轻轻振摇除去印迹中的多余水分,然后把印迹包在塑料纸中,-80℃时,在胶片上曝光过夜。
参考图15。RNA印迹的结果(见,图15)显示,GPR35在结直肠癌细胞系SW480中大量表达。这样的数据表明,GPR35可在结直肠癌发生中起作用。通过下面所讨论方法鉴定的侯选化合物最优选反向激动剂。预期GPR35的反向激动剂可减少DNA复制,从而抑制癌细胞的细胞增殖。GPR35在大肠和小肠中表达。确定GPR35在结直肠癌细胞系(例如,HELA,MOLT-4和SW480)中表达后,检查了若干癌细胞系。该数据表明,GPR35可在结肠癌发生中起作用。结肠癌是结肠或直肠的恶性肿瘤。大肠癌是在男性和女性中发现的第二普遍的癌症形式。
d.ETBR-LP2按照制造商的指导,利用RNAzol B试剂(TelTest Inc.,Cat.#CS-104)采集实施例6的RNA。在1%琼脂糖/甲醛凝胶中进行电泳后,使用10X SSC通过毛细管作用把RNA转移到尼龙薄膜上(Sachleicher Schull)。按照制造商的指导,使用与ETBR-LP2的3’末端准确对应的DNA片段和High Prime标记试剂盒(Roche MolecularBiochemical)合成32P-标记的ETBR-LP2 DNA探针。杂交是使用补充了100μg/ml鲑鱼精子DNA的ExpressHyb溶液(Clontech,Cat.#8015-2)如下进行的。首先在65℃时,用Express Hyb溶液孵育含有分离RNA样品的薄膜过夜。32P-标记的ETBR-LP2 DNA探针通过沸腾2分钟而变性,把它在冰上放置5分钟,然后转移到浸润薄膜的ExpressHyb溶液中。65℃过夜孵育后,除去杂交溶液中的薄膜,65℃时,在2XSSC/1%SDS中洗涤4次,每次15分钟,然后于55℃时,在0.2XSSC/0.1%SDS中洗涤2次,每次15分钟。轻轻振摇除去印迹中的多余水分,然后把印迹包在塑料纸中,-80℃时,在胶片上曝光过夜。
参考图18。图18显示ETBR-LP2在施旺氏细胞中表达,这样髓鞘形成就可在20μM毛喉素时维持。
参考图19。图19显示ETBR-LP2在压碎的大鼠坐骨神经中被上调节,特别是在把神经压碎后七(7)天。这样的数据与图18提出的数据相一致,即,ETBR-LP2通过刺激施旺氏细胞中髓鞘形成的过程而在神经再生中起作用。
以这些数据为基础,ETBR-LP2在施旺氏细胞中表达。当轴突(或神经)受损时,施旺氏细胞通过在轴突周围形成髓鞘而使神经再生,其提供髓鞘形式的“隔层”。髓鞘形成过程很重要,这是因为作用的可能性快速运行,由此保存代谢能量。施旺氏细胞及其前体对于影响构成周围神经的其它细胞的存活和分化起着重要的作用。此外,已经确定ETBR-LP2在压碎的大鼠坐骨神经中表达。这样的数据支持了ETBR-LP2可在神经细胞再生中起作用的证据。以受体定位的特异性组织的已知功能为基础,可推断受体的推定功能。因此,在髓鞘形成过多(例如,肿瘤发生)的情况下,优选ETBR-LP2的反向激动剂,而当发生髓鞘形成过少(例如,变性疾病,如糖尿病)时,激动剂是优选的。
与位于这些组织或区域中的受体有关的疾病和病症包括,但不限制于,心脏疾病和病症(例如,血栓形成,心肌梗塞,动脉粥样硬化,心肌病);肾疾病/病症(例如,肾衰竭,肾小管酸中毒,肾性糖尿,肾原性尿崩症,胱氨酸尿,多囊肾);嗜曙红细胞增多;白细胞增多;白细胞减少;卵巢癌;性机能障碍;多囊卵巢综合征;胰腺炎和胰腺癌;应激性肠综合征;结肠癌;克罗恩氏病;溃疡性结膜炎;憩室炎;慢性梗阻性肺疾病(COPD);囊纤维化;肺炎;肺动脉高血压;肺结核和肺癌;帕金森氏病;运动疾病和运动失调;认知和记忆疾病;进食疾病(例如,厌食,食欲过盛等);肥胖;癌;胸腺瘤;重症肌无力;循环疾病;前列腺癌;前列腺炎;肾疾病/病症(例如,肾衰竭,肾小管酸中毒,肾性糖尿,肾原性尿崩症,胱氨酸尿,多囊肾);感觉运动过程和觉醒疾病;强迫观念与行为疾病;睾丸癌;阴茎异常勃起;前列腺炎;疝气;内分泌疾病;性机能障碍;过敏;抑郁;精神病;偏头痛;反流;精神分裂症;溃疡;支气管痉挛;癫痫;前列腺肥大;焦虑;鼻炎;绞痛和青光眼。因此,本发明方法还可用于诊断和/或治疗这些及其它疾病和病症。
实施例7方案直接鉴定反向激动剂和激动剂A.[35S]GTPγS测定法虽然内源性组成型活性的GPCR已经用于直接鉴定侯选化合物,例如,反向激动剂,但由于还不完全了解的原因,测定内的差异加剧。在某些实施方案中,上面公开的GPCR融合蛋白还可与非内源性组成型活化的GPCR一起使用。当使用这种蛋白时,测定内的差异似乎基本上稳定,由此获得有效的信噪比。这更有利于鉴定侯选化合物。因此,在某些优选实施方案中,优选使用GPCR融合蛋白直接鉴定,而且在使用它时,利用下列测定方案。
1.膜的制备含有目标组成型活性的孤独GPCR融合蛋白,并用于直接鉴定作为反向激动剂或激动剂的侯选化合物薄膜是如下制备的a.材料“膜刮取缓冲液”由20mM HEPES和10mM EDTA组成,pH7.4;“膜洗涤缓冲液”由20mM HEPES和0.1mM EDTA组成,pH7.4;“结合缓冲液”由20mM HEPES,100mM NaCl,和10mM MgCl2组成,pH7.4。
b.过程整个过程中,所有材料都在冰上保存。首先,从汇合的细胞单层中吸出培养基,接着用10ml冷的PBS洗涤,然后吸出。此后,加入5ml膜刮取缓冲液提取细胞;然后把细胞提取物转移到50ml离心管中(4℃时,20,000rpm离心17分钟)。之后吸出上清液,把沉淀重悬浮在30ml膜洗涤缓冲液中,接着在4℃时,20,000rpm离心17分钟。然后吸出上清液,把沉淀重悬浮在结合缓冲液中。使用Brinkman PolytronTM均化器均化重悬浮的沉淀(15-20秒脉冲,直到物质处于混悬液的状态)。此处称之为“膜蛋白”。
2.布来得福特蛋白测定法均化后,使用布来得福特蛋白测定法测定膜的蛋白浓度(蛋白稀释到约1.5mg/ml,等分,冷冻(-80℃)备用;冷冻状态下,所用方案如下在测定当天,室温融化冷冻的膜蛋白,接着旋转,然后用Polytron以约12×1,000rpm均化大约5-10秒;应当指出的是,对于多次制备而言,在不同制剂均化之间,应彻底清洗均化器)。
a.材料按照制造商(Biorad,cat.no.500-0006)的指导,使用结合缓冲液(如上所述);布来得福特染料试剂;布来得福特蛋白标准品。
b.过程准备两个试管,一个含有该膜,另一个作为“空白”对照。每个都含有800μl结合缓冲液。之后,向每个试管中加入10μl布来得福特蛋白标准品(1mg/ml),然后在其中一个试管(不是空白试管)中加入10μl膜蛋白。之后,向每个试管中加入200μl布来得福特染料试剂,然后涡旋。5分钟后,把试管再次涡旋,把其中的物质转移到比色杯中。然后使用CECIL 3041分光光度计,在595波长阅读比色杯。
3.直接鉴定法a.材料GDP缓冲液由37.5ml结合缓冲液和2mg GDP(Sigma,cat.no.G-7127)组成,接着用结合缓冲液进行一系列稀释,得到0.2μM GDP(每孔中GDP的终浓度为0.1μM GDP);每孔含有一个侯选化合物,终体积为200μl,其中包括100μl GDP缓冲液(终浓度,0.1μM GDP),50μl溶于结合缓冲液中的膜蛋白,和50μl溶于结合缓冲液中的[35S]GTPγS(0.6nM)(2.5μl[35S]GTPγS/10ml结合缓冲液)。
b.过程优选使用96-孔平板筛选侯选化合物(可在-80℃冷冻)。把膜蛋白(或具有表达载体,表达载体中没有GPCR融合蛋白的膜,作为对照)简单均化至混悬状态。然后使用上述布来得福特测定法测定蛋白浓度。用结合缓冲液把膜蛋白(和对照组)稀释到0.25mg/ml(终测定浓度,12.5μg/孔)。之后,向Wallac ScintistripTM(Wallac)的每个孔中加入100μl GDP缓冲液。使用5μl针状-工具把5μl侯选化合物转移到这样的孔中(即,5μl在200μl总测定体积中的比例为1∶40,这样侯选化合物的终筛选浓度为10μM)。再有,为防止污染,在每次转移步骤之后,把针状工具在贮器中清洗3次,该贮器中含有水(1X),乙醇(1X)和水(2X)-过量的液体在每次清洗后从工具中甩掉,用纸和Kim擦干燥工具。之后,把50μl膜蛋白加入到各孔中(还可使用含有薄膜的对照孔,薄膜中没有GPCR融合蛋白),室温预孵育5-10分钟。之后,把50μl溶于结合缓冲液中的[35S]GTPγS(0.6nM)加入到各孔中,室温振荡孵育60分钟(在这个实施例中,用箔覆盖平板)。22℃时,通过4000RPM旋转平板15分钟而终止测定。然后用8道支管吸净平板,并用平板的盖密封。然后用设置在“Prot.#37”档的Wallac 1450阅读平板(按照制造商的指导)。
B.环AMP测定法直接鉴定侯选化合物的另一个测定法是利用基于环化酶的测定法完成的。除了直接鉴定之外,该测定法还可作为独立的方法证实上述[35S]GTPγS方法的结果。
优选按照下列方案,使用改进的Flash PlateTM腺苷酸环化酶试剂盒(New England Nuclear;Cat.No.SMP004A)直接鉴定作为GPCR反向激动剂和激动剂的侯选化合物。
转染后大约3天采集转染的细胞。通过在含有20mM HEPES,pH7.4和10mM MgCl2的缓冲液中均化悬浮的细胞而制备膜。均化是使用Brinkman PolytronTM在冰上进行大约10秒。4℃时,以49,000Xg离心所得的匀浆15分钟。然后把所得沉淀重悬浮在含20mM HEPES,pH7.4和0.1mM EDTA的缓冲液中,均化10秒,然后4℃时,49,000Xg离心15分钟。把得到的沉淀在-80℃贮藏备用。在进行直接鉴定筛选的当天,室温缓慢融化膜沉淀,在含有20mM HEPES,pH7.4和10mM MgCl2的缓冲液中重悬浮,产生终浓度0.60mg/ml的蛋白(把重悬浮的膜放在冰上备用)。
按照制造商的指导,制备并维持cAMP标准品和检测缓冲液(11ml检测缓冲液中含有2μCi示踪剂[125I cAMP(100μl)]))。新鲜制备用于筛选的测定缓冲液,它含有20mM HEPES,pH7.4,10mM MgCl2,20mM磷酸肌酸(Sigma),0.1单位/ml肌酸磷酸激酶(Sigma),5 0μM GTP(Sigma),和0.2mM ATP(Sigma);测定缓冲液在冰上贮存备用。
优选把上述鉴定的侯选化合物(如果处于冷冻状态,在室温融化),以及40μl膜蛋白(30μg/孔)和50μl测定缓冲液加入到96孔平板孔中(3μl/孔;12μM终测定浓度)。室温时,轻轻振荡孵育该混合物30分钟。
孵育后,向每孔中加入100μl检测缓冲液,培养2-24小时。然后(按照制造商的指导)使用“Prot.#31”档在Wallac MicroBetaTM中对平板计数。
C.黑素细胞筛选测定法鉴定GPCR侯选激动剂或反向激动剂的方法可通过引入色素细胞系的试验细胞进行,其中色素细胞系能够反应于特定刺激而分散并聚集色素,并表达编码GPCR的外源性克隆。刺激物,例如,光,可设置色素分布的最初状态,其中色素在试验细胞内聚集,如果激活GPCR,可诱导色素分散。然而,用刺激物刺激细胞从而设置色素分散的色素分布的最初状态时,如果激活GPCR,可诱导色素聚集。然后使试验细胞与化合物接触,并确定细胞中的色素分布是否从色素分布的最初状态发生了改变。由于侯选化合物与GPCR偶联,因此在陪替氏培养皿中,色素细胞分散处显得比较暗,色素细胞聚集处则显得比较亮。
材料和方法在美国专利号5,462,856和美国专利号6,051,386中公开,它们全部引入此处作为参考。
虽然对于本领域那些技术人员而言,可以使用各种表达载体,但对于内源性和非内源性人GPCR而言,在某些实施方案中,优选使用pCMV载体。按照用于专利程序的微生物保藏布达佩斯条约,该载体于1998年10月13日在美国典型培养物保藏中心(ATCC)(10801University Blvd.,Manassas,VA 20110-2209 USA)保藏。DNA由ATCC试验,并确定是存活的。ATCC给出了下列保藏号pCMVATCC#203351。
除非另有说明,本专利文件中引证的参考文献,包括尚未批准的有关专利申请全部引入此处作为参考。技术人员权限内的,对所公开发明进行的改进和扩展也包括在上述公开和权利要求的范围之内。
序列表<110>阿伦纳药品公司<120>人G蛋白偶联受体的内源性和非内源性形式<130>AREN-0321<160>102<170>PatentIn version 3.1<210>1<211>1062<212>DNA<213>人(Homo sapiens)<400>1atggaaacca acttctccat tcctctgaat gaaactgagg aggtgctccc tgagcctgct60ggccacaccg ttctgtggat cttctcattg ctagtccacg gagtcacctt tgtcttcggg120gtcctgggca atgggcttgt gatctgggtg gctggattcc ggatgacacg cacagtcaac180accatctgtt acctgaacct ggccctagct gacttctctt tcagtgccat cctaccattc240cgaatggtct cagtcgccat gagagaaaaa tggccttttg gctcattcct atgtaagtta300gttcatgtta tgatagacat caacctgttt gtcagtgtct acctgatcac catcattgct360ctggaccgct gtatttgtgt cctgcatcca gcctgggccc agaaccatcg caccatgagt420ctggccaaga gggtgatgac gggactctgg attttcacca tagtccttac cttaccaaat480ttcatcttct ggactacaat aagtactacg aatggggaca catactgtat tttcaacttt540gcattctggg gtgacactgc tgtagagagg ttgaacgtgt tcattaccat ggccaaggtc600tttctgatcc tccacttcat tattggcttc agcgtgccta tgtccatcat cacagtctgc660tatgggatca tcgctgccaa aattcacaga aaccacatga ttaaatccag ccgtccctta720cgtgtcttcg ctgctgtggt ggcttctttc ttcatctgtt ggttccctta tgaactaatt780ggcattctaa tggcagtctg gctcaaagag atgttgttaa atggcaaata caaaatcatt840cttgtcctga ttaacccaac aagctccttg gcctttttta acagctgcct caacccaatt900
ctctacgtct ttatgggtcg taacttccaa gaaagactga ttcgctcttt gcccactagt960ttggagaggg ccctgactga ggtccctgac tcagcccaga ccagcaacac agacaccact1020tctgcttcac ctcctgagga gacggagtta caagcaatgt ga 1062<210>2<211>353<212>PRT<213>人<400>2Met Glu Thr Asn Phe Ser Ile Pro Leu Asn Glu Thr Glu Glu Val Leu1 5 10 15Pro Glu Pro Ala Gly His Thr Val Leu Trp Ile Phe Ser Leu Leu Val20 25 30His Gly Val Thr Phe Val Phe Gly Val Leu Gly Asn Gly Leu Val Ile35 40 45Trp Val Ala Gly Phe Arg Met Thr Arg Thr Val Asn Thr Ile Cys Tyr50 55 60Leu Asn Leu Ala Leu Ala Asp Phe Ser Phe Ser Ala Ile Leu Pro Phe65 70 75 80Arg Met Val Ser Val Ala Met Arg Glu Lys Trp Pro Phe Gly Ser Phe85 90 95Leu Cys Lys Leu Val His Val Met Ile Asp Ile Asn Leu Phe Val Ser100 105 110Val Tyr Leu Ile Thr Ile Ile Ala Leu Asp Arg Cys Ile Cys Val Leu115 120 125His Pro Ala Trp Ala Gln Asn His Arg Thr Met Ser Leu Ala Lys Arg
130 135 140Val Met Thr Gly Leu Trp Ile Phe Thr Ile Val Leu Thr Leu Pro Asn145 150 155 160Phe Ile Phe Trp Thr Thr Ile Ser Thr Thr Asn Gly Asp Thr Tyr Cys165 170 175Ile Phe Asn Phe Ala Phe Trp Gly Asp Thr Ala Val Glu Arg Leu Asn180 185 190Val Phe Ile Thr Met Ala Lys Val Phe Leu Ile Leu His Phe Ile Ile195 200 205Gly Phe Ser Val Pro Met Ser Ile Ile Thr Val Cys Tyr Gly Ile Ile210 215 220Ala Ala Lys Ile His Arg Asn His Met Ile Lys Ser Ser Arg Pro Leu225 230 235 240Arg Val Phe Ala Ala Val Val Ala Ser Phe Phe Ile Cys Trp Phe Pro245 250 255Tyr Glu Leu Ile Gly Ile Leu Met Ala Val Trp Leu Lys Glu Met Leu260 265 270Leu Asn Gly Lys Tyr Lys Ile Ile Leu Val Leu Ile Asn Pro Thr Ser275 280 285Ser Leu Ala Phe Phe Asn Ser Cys Leu Asn Pro Ile Leu Tyr Val Phe290 295 300Met Gly Arg Asn Phe Gln Glu Arg Leu Ile Arg Ser Leu Pro Thr Ser305 310 315 320Leu Glu Arg Ala Leu Thr Glu Val Pro Asp Ser Ala Gln Thr Ser Asn
325 330 335Thr Asp Thr Thr Ser Ala Ser Pro Pro Glu Glu Thr Glu Leu Gln Ala340 345 350Met<210>3<211>1029<212>DNA<213>人<400>3atggcagagc atgattacca tgaagactat gggttcagca gtttcaatga cagcagccag60gaggagcatc aagccttcct gcagttcagc aaggtctttc tgccctgcat gtacctggtg120gtgtttgtct gtggtctggt ggggaactct ctggtgctgg tcatatccat cttctaccat180aagttgcaga gcctgacgga tgtgttcctg gtgaacctac ccctggctga cctggtgttt240gtctgcactc tgcccttctg ggcctatgca ggcatccatg aatgggtgtt tggccaggtc300atgtgcaaaa gcctactggg catctacact attaacttct acacgtccat gctcatcctc360acctgcatca ctgtggatcg tttcattgta gtggttaagg ccaccaaggc ctacaaccag420caagccaaga ggatgacctg gggcaaggtc accagcttgc tcatctgggt gatatccctg480ctggtttcct tgccccaaat tatctatggc aatgtcttta atctcgacaa gctcatatgt540ggttaccatg acgaggcaat ttccactgtg gttcttgcca cccagatgac actggggttc600ttcttgccac tgctcaccat gattgtctgc tattcagtca taatcaaaac actgcttcat660gctggaggct tccagaagca cagatctcta aagatcatct tcctggtgat ggctgtgttc720ctgctgaccc agatgccctt caacctcatg aagttcatcc gcagcacaca ctgggaatac780tatgccatga ccagctttca ctacaccatc atggtgacag aggccatcgc atacctgagg840gcctgcctta accctgtgct ctatgccttt gtcagcctga agtttcgaaa gaacttctgg900aaacttgtga aggacattgg ttgcctccct taccttgggg tctcacatca atggaaatct960
tctgaggaca attccaagac tttttctgcc tcccacaatg tggaggccac cagcatgttc1020cagttatag1029<210>4<211>342<212>PRT<213>人<400>4Met Ala Glu His Asp Tyr His Glu Asp Tyr Gly Phe Ser Ser Phe Asn1 5 10 15Asp Ser Ser Gln Glu Glu His Gln Ala Phe Leu Gln Phe Ser Lys Val20 25 30Phe Leu Pro Cys Met Tyr Leu Val Val Phe Val Cys Gly Leu Val Gly35 40 45Asn Ser Leu Val Leu Val Ile Ser Ile Phe Tyr His Lys Leu Gln Ser50 55 60Leu Thr Asp Val Phe Leu Val Asn Leu Pro Leu Ala Asp Leu Val Phe65 70 75 80Val Cys Thr Leu Pro Phe Trp Ala Tyr Ala Gly Ile His Glu Trp Val85 90 95Phe Gly Gln Val Met Cys Lys Ser Leu Leu Gly Ile Tyr Thr Ile Asn100 105 110Phe Tyr Thr Ser Met Leu Ile Leu Thr Cys Ile Thr Val Asp Arg Phe115 120 125Ile Val Val Val Lys Ala Thr Lys Ala Tyr Asn Gln Gln Ala Lys Arg130 135 140
Met Thr Trp Gly Lys Val Thr Ser Leu Leu Ile Trp Val Ile Ser Leu145 150 155 160Leu Val Ser Leu Pro Gln Ile Ile Tyr Gly Asn Val Phe Asn Leu Asp165 170 175Lys Leu Ile Cys Gly Tyr His Asp Glu Ala Ile Ser Thr Val Val Leu180 185 190Ala Thr Gln Met Thr Leu Gly Phe Phe Leu Pro Leu Leu Thr Met Ile195 200 205Val Cys Tyr Ser Val Ile Ile Lys Thr Leu Leu His Ala Gly Gly Phe210 215 220Gln Lys His Arg Ser Leu Lys Ile Ile Phe Leu Val Met Ala Val Phe225 230 235 240Leu Leu Thr Gln Met Pro Phe Asn Leu Met Lys Phe Ile Arg Ser Thr245 250 255His Trp Glu Tyr Tyr Ala Met Thr Ser Phe His Tyr Thr Ile Met Val260 265 270Thr Glu Ala Ile Ala Tyr Leu Arg Ala Cys Leu Asn Pro Val Leu Tyr275 280 285Ala Phe Val Ser Leu Lys Phe Arg Lys Asn Phe Trp Lys Leu Val Lys290 295 300Asp Ile Gly Cys Leu Pro Tyr Leu Gly Val Ser His Gln Trp Lys Ser305 310 315 320Ser Glu Asp Asn Ser Lys Thr Phe Ser Ala Ser His Asn Val Glu Ala325 330 335
Thr Ser Met Phe Gln Leu340<210>5<211>1119<212>DNA<213>人<400>5atggcctgca acagcacgtc ccttgaggct tacacatacc tgctgctgaa caccagcaac60gcctcagact cggggtccac ccagttgccc gcacccctca ggatctcctt ggccatagtg120atgctgctga tgaccgtggt ggggttcctg ggcaacactg tggtctgcat catcgtgtac180cagaggccgg ctatgcgctc ggccatcaac ctgctgctgg ccaccctggc cttctccgac240atcatgctgt ccctctgctg catgcccttc accgccgtca ccctcatcac cgtgcgctgg300cactttgggg accacttctg ccgcctctca gccacgctct actggttttt tgtcctggag360ggcgtggcca tcctgctcat catcagcgtg gaccgcttcc tcatcatcgt ccagcgccag420gacaagctga acccgcgcag ggccaaggtg atcatcgcgg tctcctgggt gctgtccttc480tgcatcgcgg ggccctcgct cacgggctgg acgctggtgg aggtgccggc gcgggcccca540cagtgcgtgc tgggctacac ggagctcccc gctgaccgcg catacgtggt caccttggtg600gtggccgtgt tcttcgcgcc ctttggcgtc atgctgtgcg cctacatgtg catcctcaac660acggtccgca agaacgccgt gcgcgtgcac aaccagtcgg acagcctgga cctgcggcag720ctcaccaggg cgggcctgcg gcgcctgcag cggcagcaac aggtcagcgt ggacttgagc780ttcaagacca aggccttcac caccatcctg atcctcttcg tgggcttctc cctctgctgg840ctgccccact ccgtctacag cctcctgtct gtgtttagcc agcgctttta ctgcggttcc900tccttctacg ccaccagcac ctgcgtcctg tggttcagtt acctcaagtc cgtcttcaac960cccatcgtct actgctggag aatcaaaaaa ttccgcgagg cctgcataga gttgctgccc1020cagaccttcc aaatcctccc caaagtgcct gagcggatcc gaaggagaat ccagccaagc1080acagtatacg tgtgcaatga aaaccagtct gcggtttag 1119
<210>6<211>372<212>PRT<213>人<400>6Met Ala Cys Asn Ser Thr Ser Leu Glu Ala Tyr Thr Tyr Leu Leu Leu1 5 10 15Asn Thr Ser Asn Ala Ser Asp Ser Gly Ser Thr Gln Leu Pro Ala Pro20 25 30Leu Arg Ile Ser Leu Ala Ile Val Met Leu Leu Met Thr Val Val Gly35 40 45Phe Leu Gly Asn Thr Val Val Cys Ile Ile Val Tyr Gln Arg Pro Ala50 55 60Met Arg Ser Ala Ile Asn Leu Leu Leu Ala Thr Leu Ala Phe Ser Asp65 70 75 80Ile Met Leu Ser Leu Cys Cys Met Pro Phe Thr Ala Val Thr Leu Ile85 90 95Thr Val Arg Trp His Phe Gly Asp His Phe Cys Arg Leu Ser Ala Thr100 105 110Leu Tyr Trp Phe Phe Val Leu Glu Gly Val Ala Ile Leu Leu Ile Ile115 120 125Ser Val Asp Arg Phe Leu Ile Ile Val Gln Arg Gln Asp Lys Leu Asn130 135 140Pro Arg Arg Ala Lys Val Ile Ile Ala Val Ser Trp Val Leu Ser Phe145 150 155 160
Cys Ile Ala Gly Pro Ser Leu Thr Gly Trp Thr Leu Val Glu Val Pro165 170 175Ala Arg Ala Pro Gln Cys Val Leu Gly Tyr Thr Glu Leu Pro Ala Asp180 185 190Arg Ala Tyr Val Val Thr Leu Val Val Ala Val Phe Phe Ala Pro Phe195 200 205Gly Val Met Leu Cys Ala Tyr Met Cys Ile Leu Asn Thr Val Arg Lys210 215 220Asn Ala Val Arg Val His Asn Gln Ser Asp Ser Leu Asp Leu Arg Gln225 230 235 240Leu Thr Arg Ala Gly Leu Arg Arg Leu Gln Arg Gln Gln Gln Val Ser245 250 255Val Asp Leu Ser Phe Lys Thr Lys Ala Phe Thr Thr Ile Leu Ile Leu260 265 270Phe Val Gly Phe Ser Leu Cys Trp Leu Pro His Ser Val Tyr Ser Leu275 280 285Leu Ser Val Phe Ser Gln Arg Phe Tyr Cys Gly Ser Ser Phe Tyr Ala290 295 300Thr Ser Thr Cys Val Leu Trp Phe Ser Tyr Leu Lys Ser Val Phe Asn305 310 315 320Pro Ile Val Tyr Cys Trp Arg Ile Lys Lys Phe Arg Glu Ala Cys Ile325 330 335Glu Leu Leu Pro Gln Thr Phe Gln Ile Leu Pro Lys Val Pro Glu Arg340 345 350
Ile Arg Arg Arg Ile Gln Pro Ser Thr Val Tyr Val Cys Asn Glu Asn355 360 365Gln Ser Ala Val370<210>7<211>2748<212>DNA<213>人<400>7atggtccagc tgaggaagct gctccgcgtc ctgactttga tgaagttccc ctgctgcgtg60ctggaggtgc tcctgtgcgc gctggcggcg gcggcgcgcg gccaggagat gtacgccccg120cactcaatcc ggatcgaggg ggacgtcacc ctcggggggc tgttccccgt gcacgccaag180ggtcccagcg gagtgccctg cggcgacatc aagagggaaa acgggatcca caggctggaa240gcgatgctct acgccctgga ccagatcaac agtgatccca acctactgcc caacgtgacg300ctgggcgcgc ggatcctgga cacttgttcc agggacactt acgcgctcga acagtcgctt360actttcgtcc aggcgctcat ccagaaggac acctccgacg tgcgctgcac caacggcgaa420ccgccggttt tcgtcaagcc ggagaaagta gttggagtga ttggggcttc ggggagttcg480gtctccatca tggtagccaa catcctgagg ctcttccaga tcccccagat tagttatgca540tcaacggcac ccgagctaag tgatgaccgg cgctatgact tcttctctcg cgtggtgcca600cccgattcct tccaagccca ggccatggta gacattgtaa aggccctagg ctggaattat660gtgtctaccc tcgcatcgga aggaagttat ggagagaaag gtgtggagtc cttcacgcag720atttccaaag aggcaggtgg actctgcatt gcccagtccg tgagaatccc ccaggaacgc780aaagacagga ccattgactt tgatagaatt atcaaacagc tcctggacac ccccaactcc840agggccgtcg tgatttttgc caacgatgag gatataaagc agatccttgc agcagccaaa900agagctgacc aagttggcca ttttctttgg gtgggatcag acagctgggg atccaaaata960aacccactgc accagcatga agatatcgca gaaggggcca tcaccattca gcccaagcga1020
gccacggtgg aagggtttga tgcctacttt acgtcccgta cacttgaaaa caacagaaga1080aatgtatggt ttgccgaata ctgggaggaa aacttcaact gcaagttgac gattagtggg1140tcaaaaaaag aagacacaga tcgcaaatgc acaggacagg agagaattgg aaaagattcc1200aactatgagc aggagggtaa agtccagttc gtgattgacg cagtctatgc tatggctcac1260gcccttcacc acatgaacaa ggatctctgt gctgactacc ggggtgtctg cccagagatg1320gagcaagctg gaggcaagaa gttgctgaag tatatacgca atgttaattt caatggtagt1380gctggcactc cagtgatgtt taacaagaac ggggatgcac ctgggcgtta tgacatcttt1440cagtaccaga ccacaaacac cagcaacccg ggttaccgtc tgatcgggca gtggacagac1500gaacttcagc tcaatataga agacatgcag tggggtaaag gagtccgaga gatacccgcc1560tcagtgtgca cactaccatg taagccagga cagagaaaga agacacagaa aggaactcct1620tgctgttgga cctgtgagcc ttgcgatggt taccagtacc agtttgatga gatgacatgc1680cagcattgcc cctatgacca gaggcccaat gaaaatcgaa ccggatgcca ggatattccc1740atcatcaaac tggagtggca ctccccctgg gctgtgattc ctgtcttcct ggcaatgttg1800gggatcattg ccaccatctt tgtcatggcc actttcatcc gctacaatga cacgcccatt1860gtccgggcat ctgggcggga actcagctat gttcttttga cgggcatctt tctttgctac1920atcatcactt tcctgatgat tgccaaacca gatgtggcag tgtgttcttt ccggcgagtt1980ttcttgggct tgggtatgtg catcagttat gcagccctct tgacgaaaac aaatcggatt2040tatcgcatat ttgagcaggg caagaaatca gtaacagctc ccagactcat aagcccaaca2100tcacaactgg caatcacttc cagtttaata tcagttcagc ttctaggggt gttcatttgg2160tttggtgttg atccacccaa catcatcata gactacgatg aacacaagac aatgaaccct2220gagcaagcca gaggggttct caagtgtgac attacagatc tccaaatcat ttgctccttg2280ggatatagca ttcttctcat ggtcacatgt actgtgtatg ccatcaagac tcggggtgta2340cccgagaatt ttaacgaagc caagcccatt ggattcacta tgtacacgac atgtatagta2400tggcttgcct tcattccaat tttttttggc accgctcaat cagcggaaaa gctctacata2460
caaactacca cgcttacaat ctccatgaac ctaagtgcat cagtggcgct ggggatgcta2520tacatgccga aagtgtacat catcattttc caccctgaac tcaatgtcca gaaacggaag2580cgaagcttca aggcggtagt cacagcagcc accatgtcat cgaggctgtc acacaaaccc2640agtgacagac ccaacggtga ggcaaagacc gagctctgtg aaaacgtaga cccaaacagc2700cctgctgcaa aaaagaagta tgtcagttat aataacctgg ttatctaa 2748<210>8<211>915<212>PRT<213>人<400>8Met Val Gln Leu Arg Lys Leu Leu Arg Val Leu Thr Leu Met Lys Phe1 5 10 15Pro Cys Cys Val Leu Glu Val Leu Leu Cys Ala Leu Ala Ala Ala Ala20 25 30Arg Gly Gln Glu Met Tyr Ala Pro His Ser Ile Arg Ile Glu Gly Asp35 40 45Val Thr Leu Gly Gly Leu Phe Pro Val His Ala Lys Gly Pro Ser Gly50 55 60Val Pro Cys Gly Asp Ile Lys Arg Glu Asn Gly Ile His Arg Leu Glu65 70 75 80Ala Met Leu Tyr Ala Leu Asp Gln Ile Asn Ser Asp Pro Asn Leu Leu85 90 95Pro Asn Val Thr Leu Gly Ala Arg Ile Leu Asp Thr Cys Ser Arg Asp100 105 110Thr Tyr Ala Leu Glu Gln Ser Leu Thr Phe Val Gln Ala Leu Ile Gln
115 120 125Lys Asp Thr Ser Asp Val Arg Cys Thr Asn Gly Glu Pro Pro Val Phe130 135 140Val Lys Pro Glu Lys Val Val Gly Val Ile Gly Ala Ser Gly Ser Ser145 150 155 160Val Ser Ile Met Val Ala Asn Ile Leu Arg Leu Phe Gln Ile Pro Gln165 170 175Ile Ser Tyr Ala Ser Thr Ala Pro Glu Leu Ser Asp Asp Arg Arg Tyr180 185 190Asp Phe Phe Ser Arg Val Val Pro Pro Asp Ser Phe Gln Ala Gln Ala195 200 205Met Val Asp Ile Val Lys Ala Leu Gly Trp Asn Tyr Val Ser Thr Leu210 215 220Ala Ser Glu Gly Ser Tyr Gly Glu Lys Gly Val Glu Ser Phe Thr Gln225 230 235 240Ile Ser Lys Glu Ala Gly Gly Leu Cys Ile Ala Gln Ser Val Arg Ile245 250 255Pro Gln Glu Arg Lys Asp Arg Thr Ile Asp Phe Asp Arg Ile Ile Lys260 265 270Gln Leu Leu Asp Thr Pro Asn Ser Arg Ala Val Val Ile Phe Ala Asn275 280 285Asp Glu Asp Ile Lys Gln Ile Leu Ala Ala Ala Lys Arg Ala Asp Gln290 295 300Val Gly His Phe Leu Trp Val Gly Ser Asp Ser Trp Gly Ser Lys Ile
305 310 315 320Asn Pro Leu His Gln His Glu Asp Ile Ala Glu Gly Ala Ile Thr Ile325 330 335Gln Pro Lys Arg Ala Thr Val Glu Gly Phe Asp Ala Tyr Phe Thr Ser340 345 350Arg Thr Leu Glu Asn Asn Arg Arg Asn Val Trp Phe Ala Glu Tyr Trp355 360 365Glu Glu Asn Phe Asn Cys Lys Leu Thr Ile Ser Gly Ser Lys Lys Glu370 375 380Asp Thr Asp Arg Lys Cys Thr Gly Gln Glu Arg Ile Gly Lys Asp Ser385 390 395 400Asn Tyr Glu Gln Glu Gly Lys Val Gln Phe Val Ile Asp Ala Val Tyr405 410 415Ala Met Ala His Ala Leu His His Met Asn Lys Asp Leu Cys Ala Asp420 425 430Tyr Arg Gly Val Cys Pro Glu Met Glu Gln Ala Gly Gly Lys Lys Leu435 440 445Leu Lys Tyr Ile Arg Asn Val Asn Phe Asn Gly Ser Ala Gly Thr Pro450 455 460Val Met Phe Asn Lys Asn Gly Asp Ala Pro Gly Arg Tyr Asp Ile Phe465 470 475 480Gln Tyr Gln Thr Thr Asn Thr Ser Asn Pro Gly Tyr Arg Leu Ile Gly485 490 495Gln Trp Thr Asp Glu Leu Gln Leu Asn Ile Glu Asp Met Gln Trp Gly
500 505 510Lys Gly Val Arg Glu Ile Pro Ala Ser Val Cys Thr Leu Pro Cys Lys515 520 525Pro Gly Gln Arg Lys Lys Thr Gln Lys Gly Thr Pro Cys Cys Trp Thr530 535 540Cys Glu Pro Cys Asp Gly Tyr Gln Tyr Gln Phe Asp Glu Met Thr Cys545 550 555 560Gln His Cys Pro Tyr Asp Gln Arg Pro Asn Glu Asn Arg Thr Gly Cys565 570 575Gln Asp Ile Pro Ile Ile Lys Leu Glu Trp His Ser Pro Trp Ala Val580 585 590Ile Pro Val Phe Leu Ala Met Leu Gly Ile Ile Ala Thr Ile Phe Val595 600 605Met Ala Thr Phe Ile Arg Tyr Asn Asp Thr Pro Ile Val Arg Ala Ser610 615 620Gly Arg Glu Leu Ser Tyr Val Leu Leu Thr Gly Ile Phe Leu Cys Tyr625 630 635 640Ile Ile Thr Phe Leu Met Ile Ala Lys Pro Asp Val Ala Val Cys Ser645 650 655Phe Arg Arg Val Phe Leu Gly Leu Gly Met Cys Ile Ser Tyr Ala Ala660 665 670Leu Leu Thr Lys Thr Asn Arg Ile Tyr Arg Ile Phe Glu Gln Gly Lys675 680 685Lys Ser Val Thr Ala Pro Arg Leu Ile Ser Pro Thr Ser Gln Leu Ala
690 695 700Ile Thr Ser Ser Leu Ile Ser Val Gln Leu Leu Gly Val Phe Ile Trp705 710 715 720Phe Gly Val Asp Pro Pro Asn Ile Ile Ile Asp Tyr Asp Glu His Lys725 730 735Thr Met Asn Pro Glu Gln Ala Arg Gly Val Leu Lys Cys Asp Ile Thr740 745 750Asp Leu Gln Ile Ile Cys Ser Leu Gly Tyr Ser Ile Leu Leu Met Val755 760 765Thr Cys Thr Val Tyr Ala Ile Lys Thr Arg Gly Val Pro Glu Asn Phe770 775 780Asn Glu Ala Lys Pro Ile Gly Phe Thr Met Tyr Thr Thr Cys Ile Val785 790 795 800Trp Leu Ala Phe Ile Pro Ile Phe Phe Gly Thr Ala Gln Ser Ala Glu805 810 815Lys Leu Tyr Ile Gln Thr Thr Thr Leu Thr Ile Ser Met Asn Leu Ser820 825 830Ala Ser Val Ala Leu Gly Met Leu Tyr Met Pro Lys Val Tyr Ile Ile835 840 845Ile Phe His Pro Glu Leu Asn Val Gln Lys Arg Lys Arg Ser Phe Lys850 855 860Ala Val Val Thr Ala Ala Thr Met Ser Ser Arg Leu Ser His Lys Pro865 870 875 880Ser Asp Arg Pro Asn Gly Glu Ala Lys Thr Glu Leu Cys Glu Asn Val
885 890 895Asp Pro Asn Ser Pro Ala Ala Lys Lys Lys Tyr Val Ser Tyr Asn Asn900 905 910Leu Val Ile915<210>9<211>1842<212>DNA<213>人<400>9atgcgagccc cgggcgcgct tctcgcccgc atgtcgcggc tactgcttct gctactgctc60aaggtgtctg cctcttctgc cctcggggtc gcccctgcgt ccagaaacga aacttgtctg120ggggagagct gtgcacctac agtgatccag cgccgcggca gggacgcctg gggaccggga180aattctgcaa gagacgttct gcgagcccga gcacccaggg aggagcaggg ggcagcgttt240cttgcgggac cctcctggga cctgccggcg gccccgggcc gtgacccggc tgcaggcaga300ggggcggagg cgtcggcagc cggacccccg ggacctccaa ccaggccacc tggcccctgg360aggtggaaag gtgctcgggg tcaggagcct tctgaaactt tggggagagg gaaccccacg420gccctccagc tcttccttca gatctcagag gaggaagaga agggtcccag aggcgctggc480atttccgggc gtagccagga gcagagtgtg aagacagtcc ccggagccag cgatcttttt540tactggccaa ggagagccgg gaaactccag ggttcccacc acaagcccct gtccaagacg600gccaatggac tggcggggca cgaagggtgg acaattgcac tcccgggccg ggcgctggcc660cagaatggat ccttgggtga aggaatccat gagcctgggg gtccccgccg gggaaacagc720acgaaccggc gtgtgagact gaagaacccc ttctacccgc tgacccagga gtcctatgga780gcctacgcgg tcatgtgtct gtccgtggtg atcttcggga ccggcatcat tggcaacctg840gcggtgatgt gcatcgtgtg ccacaactac tacatgcgga gcatctccaa ctccctcttg900gccaacctgg ccttctggga ctttctcatc atcttcttct gccttccgct ggtcatcttc960
cacgagctga ccaagaagtg gctgctggag gacttctcct gcaagatcgt gccctatata1020gaggtcgctt ctctgggagt caccaccttc accttatgtg ctctgtgcat agaccgcttc1080cgtgctgcca ccaacgtaca gatgtactac gaaatgatcg aaaactgttc ctcaacaact1140gccaaacttg ctgttatatg ggtgggagct ctattgttag cacttccaga agttgttctc1200cgccagctga gcaaggagga tttggggttt agtggccgag ctccggcaga aaggtgcatt1260attaagatct ctcctgattt accagacacc atctatgttc tagccctcac ctacgacagt1320gcgagactgt ggtggtattt tggctgttac ttttgtttgc ccacgctttt caccatcacc1380tgctctctag tgactgcgag gaaaatccgc aaagcagaga aagcctgtac ccgagggaat1440aaacggcaga ttcaactaga gagtcagatg aactgtacag tagtggcact gaccatttta1500tatggatttt gcattattcc tgaaaatatc tgcaacattg ttactgccta catggctaca1560ggggtttcac agcagacaat ggacctcctt aatatcatca gccagttcct tttgttcttt1620aagtcctgtg tcaccccagt cctccttttc tgtctctgca aacccttcag tcgggccttc1680atggagtgct gctgctgttg ctgtgaggaa tgcattcaga agtcttcaac ggtgaccagt1740gatgacaatg acaacgagta caccacggaa ctcgaactct cgcctttcag taccatacgc1800cgtgaaatgt ccacttttgc ttctgtcgga actcattgct ga 1842<210>10<211>613<212>PRT<213>人<400>10Met Arg Ala Pro Gly Ala Leu Leu Ala Arg Met Ser Arg Leu Leu Leu1 5 10 15Leu Leu Leu Leu Lys Val Ser Ala Ser Ser Ala Leu Gly Val Ala Pro20 25 30Ala Ser Arg Asn Glu Thr Cys Leu Gly Glu Ser Cys Ala Pro Thr Val
35 40 45Ile Gln Arg Arg Gly Arg Asp Ala Trp Gly Pro Gly Asn Ser Ala Arg50 55 60Asp Val Leu Arg Ala Arg Ala Pro Arg Glu Glu Gln Gly Ala Ala Phe65 70 75 80Leu Ala Gly Pro Ser Trp Asp Leu Pro Ala Ala Pro Gly Arg Asp Pro85 90 95Ala Ala Gly Arg Gly Ala Glu Ala Ser Ala Ala Gly Pro Pro Gly Pro100 105 110Pro Thr Arg Pro Pro Gly Pro Trp Arg Trp Lys Gly Ala Arg Gly Gln115 120 125Glu Pro Ser Glu Thr Leu Gly Arg Gly Asn Pro Thr Ala Leu Gln Leu130 135 140Phe Leu Gln Ile Ser Glu Glu Glu Glu Lys Gly Pro Arg Gly Ala Gly145 150 155 160Ile Ser Gly Arg Ser Gln Glu Gln Ser Val Lys Thr Val Pro Gly Ala165 170 175Ser Asp Leu Phe Tyr Trp Pro Arg Arg Ala Gly Lys Leu Gln Gly Ser180 185 190His His Lys Pro Leu Ser Lys Thr Ala Asn Gly Leu Ala Gly His Glu195 200 205Gly Trp Thr Ile Ala Leu Pro Gly Arg Ala Leu Ala Gln Asn Gly Ser210 215 220Leu Gly Glu Gly Ile His Glu Pro Gly Gly Pro Arg Arg Gly Asn Ser
225 230 235 240Thr Asn Arg Arg Val Arg Leu Lys Asn Pro Phe Tyr Pro Leu Thr Gln245 250 255Glu Ser Tyr Gly Ala Tyr Ala Val Met Cys Leu Ser Val Val Ile Phe260 265 270Gly Thr Gly Ile Ile Gly Asn Leu Ala Val Met Cys Ile Val Cys His275 280 285Asn Tyr Tyr Met Arg Ser Ile Ser Asn Ser Leu Leu Ala Asn Leu Ala290 295 300Phe Trp Asp Phe Leu Ile Ile Phe Phe Cys Leu Pro Leu Val Ile Phe305 310 315 320His Glu Leu Thr Lys Lys Trp Leu Leu Glu Asp Phe Ser Cys Lys Ile325 330 335Val Pro Tyr Ile Glu Val Ala Ser Leu Gly Val Thr Thr Phe Thr Leu340 345 350Cys Ala Leu Cys Ile Asp Arg Phe Arg Ala Ala Thr Asn Val Gln Met355 360 365Tyr Tyr Glu Met Ile Glu Asn Cys Ser Ser Thr Thr Ala Lys Leu Ala370 375 380Val Ile Trp Val Gly Ala Leu Leu Leu Ala Leu Pro Glu Val Val Leu385 390 395 400Arg Gln Leu Ser Lys Glu Asp Leu Gly Phe Ser Gly Arg Ala Pro Ala405 410 415Glu Arg Cys Ile Ile Lys Ile Ser Pro Asp Leu Pro Asp Thr Ile Tyr
420 425 430Val Leu Ala Leu Thr Tyr Asp Ser Ala Arg Leu Trp Trp Tyr Phe Gly435 440 445Cys Tyr Phe Cys Leu Pro Thr Leu Phe Thr Ile Thr Cys Ser Leu Val450 455 460Thr Ala Arg Lys Ile Arg Lys Ala Glu Lys Ala Cys Thr Arg Gly Asn465 470 475 480Lys Arg Gln Ile Gln Leu Glu Ser Gln Met Asn Cys Thr Val Val Ala485 490 495Leu Thr Ile Leu Tyr Gly Phe Cys Ile Ile Pro Glu Asn Ile Cys Asn500 505 510Ile Val Thr Ala Tyr Met Ala Thr Gly Val Ser Gln Gln Thr Met Asp515 520 525Leu Leu Asn Ile Ile Ser Gln Phe Leu Leu Phe Phe Lys Ser Cys Val530 535 540Thr Pro Val Leu Leu Phe Cys Leu Cys Lys Pro Phe Ser Arg Ala Phe545 550 555 560Met Glu Cys Cys Cys Cys Cys Cys Glu Glu Cys Ile Gln Lys Ser Ser565 570 575Thr Val Thr Ser Asp Asp Asn Asp Asn Glu Tyr Thr Thr Glu Leu Glu580 585 590Leu Ser Pro Phe Ser Thr Ile Arg Arg Glu Met Ser Thr Phe Ala Ser595 600 605Val Gly Thr His Cys
610<210>11<211>1086<212>DNA<213>人<400>11atgtcccctg aatgcgcgcg ggcagcgggc gacgcgccct tgcgcagcct ggagcaagcc60aaccgcaccc gctttccctt cttctccgac gtcaagggcg accaccggct ggtgctggcc120gcggtggaga caaccgtgct ggtgctcatc tttgcagtgt cgctgctggg caacgtgtgc180gccctggtgc tggtggcgcg ccgacgacgc cgcggcgcga ctgcctgcct ggtactcaac240ctcttctgcg cggacctgct cttcatcagc gctatccctc tggtgctggc cgtgcgctgg300actgaggcct ggctgctggg ccccgttgcc tgccacctgc tcttctacgt gatgaccctg360agcggcagcg tcaccatcct cacgctggcc gcggtcagcc tggagcgcat ggtgtgcatc420gtgcacctgc agcgcggcgt gcggggtcct gggcggcggg cgcgggcagt gctgctggcg480ctcatctggg gctattcggc ggtcgccgct ctgcctctct gcgtcttctt tcgagtcgtc540ccgcaacggc tccccggcgc cgaccaggaa atttcgattt gcacactgat ttggcccacc600attcctggag agatctcgtg ggatgtctct tttgttactt tgaacttctt ggtgccagga660ctggtcattg tgatcagtta ctccaaaatt ttacagatca caaaggcatc aaggaagagg720ctcacggtaa gcctggccta ctcggagagc caccagatcc gcgtgtccca gcaggacttc780cggctcttcc gcaccctctt cctcctcatg gtctccttct tcatcatgtg gagccccatc840atcatcacca tcctcctcat cctgatccag aacttcaagc aagacctggt catctggccg900tccctcttct tctgggtggt ggccttcaca tttgctaatt cagccctaaa ccccatcctc960tacaacatga cactgtgcag gaatgagtgg aagaaaattt tttgctgctt ctggttccca1020gaaaagggag ccattttaac agacacatct gtcaaaagaa atgacttgtc gattatttct1080ggctaa 1086
<210>12<211>361<212>PRT<213>未知<220>
<223>新序列<400>12Met Ser Pro Glu Cys Ala Arg Ala Ala Gly Asp Ala Pro Leu Arg Ser1 5 10 15Leu Glu Gln Ala Asn Arg Thr Arg Phe Pro Phe Phe Ser Asp Val Lys20 25 30Gly Asp His Arg Leu Val Leu Ala Ala Val Glu Thr Thr Val Leu Val35 40 45Leu Ile Phe Ala Val Ser Leu Leu Gly Asn Val Cys Ala Leu Val Leu50 55 60Val Ala Arg Arg Arg Arg Arg Gly Ala Thr Ala Cys Leu Val Leu Asn65 70 75 80Leu Phe Cys Ala Asp Leu Leu Phe Ile Ser Ala Ile Pro Leu Val Leu85 90 95Ala Val Arg Trp Thr Glu Ala Trp Leu Leu Gly Pro Val Ala Cys His100 105 110Leu Leu Phe Tyr Val Met Thr Leu Ser Gly Ser Val Thr Ile Leu Thr115 120 125Leu Ala Ala Val Ser Leu Glu Arg Met Val Cys Ile Val His Leu Gln130 135 140Arg Gly Val Arg Gly Pro Gly Arg Arg Ala Arg Ala Val Leu Leu Ala145 150 155 160
Leu Ile Trp Gly Tyr Ser Ala Val Ala Ala Leu Pro Leu Cys Val Phe165 170 175Phe Arg Val Val Pro Gln Arg Leu Pro Gly Ala Asp Gln Glu Ile Ser180 185 190Ile Cys Thr Leu Ile Trp Pro Thr Ile Pro Gly Glu Ile Ser Trp Asp195 200 205Val Ser Phe Val Thr Leu Asn Phe Leu Val Pro Gly Leu Val Ile Val210 215 220Ile Ser Tyr Ser Lys Ile Leu Gln Ile Thr Lys Ala Ser Arg Lys Arg225 230 235 240Leu Thr Val Ser Leu Ala Tyr Ser Glu Ser His Gln Ile Arg Val Ser245 250 255Gln Gln Asp Phe Arg Leu Phe Arg Thr Leu Phe Leu Leu Mer Val Ser260 265 270Phe Phe Ile Met Trp Ser Pro Ile Ile Ile Thr Ile Leu Leu Ile Leu275 280 285Ile Gln Asn Phe Lys Gln Asp Leu Val Ile Trp Pro Ser Leu Phe Phe290 295 300Trp Val Val Ala Phe Thr Phe Ala Asn Ser Ala Leu Asn Pro Ile Leu305 310 315 320Tyr Asn Met Thr Leu Cys Arg Asn Glu Trp Lys Lys Ile Phe Cys Cys325 330 335Phe Trp Phe Pro Glu Lys Gly Ala Ile Leu Thr Asp Thr Ser Val Lys340 345 350
Arg Asn Asp Leu Ser Ile Ile Ser Gly355 360<210>13<211>1212<212>DNA<213>人<400>13atggcttgca atggcagtgc ggccaggggg cactttgacc ctgaggactt gaacctgact60gacgaggcac tgagactcaa gtacctgggg ccccagcaga cagagctgtt catgcccatc120tgtgccacat acctgctgat cttcgtggtg ggcgctgtgg gcaatgggct gacctgtctg180gtcatcctgc gccacaaggc catgcgcacg cctaccaact actacctctt cagcctggcc240gtgtcggacc tgctggtgct gctggtgggc ctgcccctgg agctctatga gatgtggcac300aactacccct tcctgctggg cgttggtggc tgctatttcc gcacgctact gtttgagatg360gtctgcctgg cctcagtgct caacgtcact gccctgagcg tggaacgcta tgtggccgtg420gtgcacccac tccaggccag gtccatggtg acgcgggccc atgtgcgccg agtgcttggg480gccgtctggg gtcttgccat gctctgctcc ctgcccaaca ccagcctgca cggcatccgg540cagctgcacg tgccctgccg gggcccagtg ccagactcag ctgtttgcat gctggtccgc600ccacgggccc tctacaacat ggtagtgcag accaccgcgc tgctcttctt ctgcctgccc660atggccatca tgagcgtgct ctacctgctc attgggctgc gactgcggcg ggagaggctg720ctgctcatgc aggaggccaa gggcaggggc tctgcagcag ccaggtccag atacacctgc780aggctccagc agcacgatcg gggccggaga caagtgacca agatgctgtt tgtcctggtc840gtggtgtttg gcatctgctg ggccccgttc cacgccgacc gcgtcatgtg gagcgtcgtg900tcacagtgga cagatggcct gcacctggcc ttccagcacg tgcacgtcat ctccggcatc960ttcttctacc tgggctcggc ggccaacccc gtgctctata gcctcatgtc cagccgcttc1020cgagagacct tccaggaggc cctgtgcctc ggggcctgct gccatcgcct cagaccccgc1080
cacagctccc acagcctcag caggatgacc acaggcagca ccctgtgtga tgtgggctcc1140ctgggcagct gggtccaccc cctggctggg aacgatggcc cagaggcgca gcaagagacc1200gatccatcct ga1212<210>14<211>403<212>PRT<213>人<400>14Met Ala Cys Asn Gly Ser Ala Ala Arg Gly His Phe Asp Pro Glu Asp1 5 10 15Leu Asn Leu Thr Asp Glu Ala Leu Arg Leu Lys Tyr Leu Gly Pro Gln20 25 30Gln Thr Glu Leu Phe Met Pro Ile Cys Ala Thr Tyr Leu Leu Ile Phe35 40 45Val Val Gly Ala Val Gly Asn Gly Leu Thr Cys Leu Val Ile Leu Arg50 55 60His Lys Ala Met Arg Thr Pro Thr Asn Tyr Tyr Leu Phe Ser Leu Ala65 70 75 80Val Ser Asp Leu Leu Val Leu Leu Val Gly Leu Pro Leu Glu Leu Tyr85 90 95Glu Met Trp His As nTyr Pro Phe Leu Leu Gly Val Gly Gly Cys Tyr100 105 110Phe Arg Thr Leu Leu Phe Glu Met Val Cys Leu Ala Ser Val Leu Asn115 120 125Val Thr Ala Leu Ser Val Glu Arg Tyr Val Ala Val Val His Pro Leu130 135 140
Gln Ala Arg Ser Met Val Thr Arg Ala His Val Arg Arg Val Leu Gly145 150 155 160Ala Val Trp Gly Leu Ala Met Leu Cys Ser Leu Pro Asn Thr Ser Leu165 170 175His Gly Ile Arg Gln Leu His Val Pro Cys Arg Gly Pro Val Pro Asp180 185 190Ser Ala Val Cys Met Leu Val Arg Pro Arg Ala Leu Tyr Asn Met Val195 200 205Val Gln Thr Thr Ala Leu Leu Phe Phe Cys Leu Pro Met Ala Ile Met210 215 220Ser Val Leu Tyr Leu Leu Ile Gly Leu Arg Leu Arg Arg Glu Arg Leu225 230 235 240Leu Leu Met Gln Glu Ala Lys Gly Arg Gly Ser Ala Ala Ala Arg Ser245 250 255Arg Tyr Thr Cys Arg Leu Gln Gln His Asp Arg Gly Arg Arg Gln Val260 265 270Thr Lys Met Leu Phe Val Leu Val Val Val Phe Gly Ile Cys Trp Ala275 280 285Pro Phe His Ala Asp Arg Val Met Trp Ser Val Val Ser Gln Trp Thr290 295 300Asp Gly Leu His Leu Ala Phe Gln His Val His Val Ile Ser Gly Ile305 310 315 320Phe Phe Tyr Leu Gly Ser Ala Ala Asn Pro Val Leu Tyr Ser Leu Met325 330 335
Ser Ser Arg Phe Arg Glu Thr Phe Gln Glu Ala Leu Cys Leu Gly Ala340 345 350Cys Cys His Arg Leu Arg Pro Arg His Ser Ser His Ser Leu Ser Arg355 360 365Met Thr Thr Gly Ser Thr Leu Cys Asp Val Gly Ser Leu Gly Ser Trp370 375 380Val His Pro Leu Ala Gly Asn Asp Gly Pro Glu Ala Gln Gln Glu Thr385 390 395 400Asp Pro Ser<210>15<211>930<212>DNA<213>人<400>15atgaatggca cctacaacac ctgtggctcc agcgacctca cctggccccc agcgatcaag60ctgggcttct acgcctactt gggcgtcctg ctggtgctag gcctgctgct caacagcctg120gcgctctggg tgttctgctg ccgcatgcag cagtggacgg agacccgcat ctacatgacc180aacctggcgg tggccgacct ctgcctgctg tgcaccttgc ccttcgtgct gcactccctg240cgagacacct cagacacgcc gctgtgccag ctctcccagg gcatctacct gaccaacagg300tacatgagca tcagcctggt cacggccatc gccgtggacc gctatgtggc cgtgcggcac360ccgctgcgtg cccgcgggct gcggtccccc aggcaggctg cggccgtgtg cgcggtcctc420tgggtgctgg tcatcggctc cctggtggct cgctggctcc tggggattca ggagggcggc480ttctgcttca ggagcacccg gcacaatttc aactccatgc ggttcccgct gctgggattc540tacctgcccc tggccgtggt ggtcttctgc tccctgaagg tggtgactgc cctggcccag600
aggccaccca ccgacgtggg gcaggcagag gccacccgca aggctgcccg catggtctgg660gccaacctcc tggtgttcgt ggtctgcttc ctgcccctgc acgtggggct gacagtgcgc720ctcgcagtgg gctggaacgc ctgtgccctc ctggagacga tccgtcgcgc cctgtacata780accagcaagc tctcagatgc caactgctgc ctggacgcca tctgctacta ctacatggcc840aaggagttcc aggaggcgtc tgcactggcc gtggctcccc gtgctaaggc ccacaaaagc900caggactctc tgtgcgtgac cctcgcctaa 930<210>16<211>309<212>PRT<213>人<400>16Met Asn Gly Thr Tyr Asn Thr Cys Gly Ser Ser Asp Leu Thr Trp Pro1 5 10 15Pro Ala Ile Lys Leu Gly Phe Tyr Ala Tyr Leu Gly Val Leu Leu Val20 25 30Leu Gly Leu Leu Leu Asn Ser Leu Ala Leu Trp Val Phe Cys Cys Arg35 40 45Met Gln Gln Trp Thr Glu Thr Arg Ile Tyr Met Thr Asn Leu Ala Val50 55 60Ala Asp Leu Cys Leu Leu Cys Thr Leu Pro Phe Val Leu His Ser Leu65 70 75 80Arg Asp Thr Ser Asp Thr Pro Leu Cys Gln Leu Ser Gln Gly Ile Tyr85 90 95Leu Thr Asn Arg Tyr Met Ser Ile Ser Leu Val Thr Ala Ile Ala Val100 105 110
Asp Arg Tyr Val Ala Val Arg His Pro Leu Arg Ala Arg Gly Leu Arg115 120 125Ser Pro Arg Gln Ala Ala Ala Val Cys Ala Val Leu Trp Val Leu Val130 135 140Ile Gly Ser Leu Val Ala Arg Trp Leu Leu Gly Ile Gln Glu Gly Gly145 150 155 160Phe Cys Phe Arg Ser Thr Arg His Asn Phe Asn Ser Met Arg Phe Pro165 170 175Leu Leu Gly Phe Tyr Leu Pro Leu Ala Val Val Val Phe Cys Ser Leu180 185 190Lys Val Val Thr Ala Leu Ala Gln Arg Pro Pro Thr Asp Val Gly Gln195 200 205Ala Glu Ala Thr Arg Lys Ala Ala Arg Met Val Trp Ala Asn Leu Leu210 215 220Val Phe Val Val Cys Phe Leu Pro Leu His Val Gly Leu Thr Val Arg225 230 235 240Leu Ala Val Gly Trp Asn Ala Cys Ala Leu Leu Glu Thr Ile Arg Arg245 250 255Ala Leu Tyr Ile Thr Ser Lys Leu Ser Asp Ala Asn Cys Cys Leu Asp260 265 270Ala Ile Cys Tyr Tyr Tyr Met Ala Lys Glu Phe Gln Glu Ala Ser Ala275 280 285Leu Ala Val Ala Pro Arg Ala Lys Ala His Lys Ser Gln Asp Ser Leu290 295 300
Cys Val Thr Leu Ala305<210>17<211>1446<212>DNA<213>人<400>17atgcggtggc tgtggcccct ggctgtctct cttgctgtga ttttggctgt ggggctaagc60agggtctctg ggggtgcccc cctgcacctg ggcaggcaca gagccgagac ccaggagcag120cagagccgat ccaagagggg caccgaggat gaggaggcca agggcgtgca gcagtatgtg180cctgaggagt gggcggagta cccccggccc attcaccctg ctggcctgca gccaaccaag240cccttggtgg ccaccagccc taaccccgac aaggatgggg gcaccccaga cagtgggcag300gaactgaggg gcaatctgac aggggcacca gggcagaggc tacagatcca gaaccccctg360tatccggtga ccgagagctc ctacagtgcc tatgccatca tgcttctggc gctggtggtg420tttgcggtgg gcattgtggg caacctgtcg gtcatgtgca tcgtgtggca cagctactac480ctgaagagcg cctggaactc catccttgcc agcctggccc tctgggattt tctggtcctc540tttttctgcc tccctattgt catcttcaac gagatcacca agcagaggct actgggtgac600gtttcttgtc gtgccgtgcc cttcatggag gtctcctctc tgggagtcac gactttcagc660ctctgtgccc tgggcattga ccgcttccac gtggccacca gcaccctgcc caaggtgagg720cccatcgagc ggtgccaatc catcctggcc aagttggctg tcatctgggt gggctccatg780acgctggctg tgcctgagct cctgctgtgg cagctggcac aggagcctgc ccccaccatg840ggcaccctgg actcatgcat catgaaaccc tcagccagcc tgcccgagtc cctgtattca900ctggtgatga cctaccagaa cgcccgcatg tggtggtact ttggctgcta cttctgcctg960cccatcctct tcacagtcac ctgccagctg gtgacatggc gggtgcgagg ccctccaggg1020aggaagtcag agtgcagggc cagcaagcac gagcagtgtg agagccagct caacagcacc1080gtggtgggcc tgaccgtggt ctacgccttc tgcaccctcc cagagaacgt ctgcaacatc1140
gtggtggcct acctctccac cgagctgacc cgccagaccc tggacctcct gggcctcatc1200aaccagttct ccaccttctt caagggcgcc atcaccccag tgctgctcct ttgcatctgc1260aggccgctgg gccaggcctt cctggactgc tgctgctgct gctgctgtga ggagtgcggc1320ggggcttcgg aggcctctgc tgccaatggg tcggacaaca agctcaagac cgaggtgtcc1380tcttccatct acttccacaa gcccagggag tcacccccac tcctgcccct gggcacacct1440tgctga 1446<210>18<211>481<212>PRT<213>人<400>18Met Arg Trp Leu Trp Pro Leu Ala Val Ser Leu Ala ValIle Leu Ala1 5 10 15Val Gly Leu Ser Arg Val Ser Gly Gly Ala Pro Leu His Leu Gly Arg20 25 30His Arg Ala Glu Thr Gln Glu Gln Gln Ser Arg Ser Lys Arg Gly Thr35 40 45Glu Asp Glu Glu Ala Lys Gly Val Gln Gln Tyr Val Pro Glu Glu Trp50 55 60Ala Glu Tyr Pro Arg Pro Ile His Pro Ala Gly Leu Gln Pro Thr Lys65 70 75 80Pro Leu Val Ala Thr Ser Pro Asn Pro Asp Lys Asp Gly Gly Thr Pro85 90 95Asp Ser Gly Gln Glu Leu Arg Gly Asn Leu Thr Gly Ala Pro Gly Gln100 105 110
Arg Leu Gln Ile Gln Asn Pro Leu Tyr Pro Val Thr Glu Ser Ser Tyr115 120 125Ser Ala Tyr Ala Ile Met Leu Leu Ala Leu Val Val Phe Ala Val Gly130 135 140Ile Val Gly Asn Leu Ser Val Met Cys Ile Val Trp His Ser Tyr Tyr145 150 155 160Leu Lys Ser Ala Trp Asn Ser Ile Leu Ala Ser Leu Ala Leu Trp Asp165 170 175Phe Leu Val Leu Phe Phe Cys Leu Pro Ile Val Ile Phe Asn Glu Ile180 185 190Thr Lys Gln Arg Leu Leu Gly Asp Val Ser Cys Arg Ala Val Pro Phe195 200 205Met Glu Val Ser Ser Leu Gly Val Thr Thr Phe Ser Leu Cys Ala Leu210 215 220Gly Ile Asp Arg Phe His Val Ala Thr Ser Thr Leu Pro Lys Val Arg225 230 235 240Pro Ile Glu Arg Cys Gln Ser Ile Leu Ala Lys Leu Ala Val Ile Trp245 250 255Val Gly Ser Met Thr Leu Ala Val Pro Glu Leu Leu Leu Trp Gln Leu260 265 270Ala Gln Glu Pro Ala Pro Thr Met Gly Thr Leu Asp Ser Cys Ile Met275 280 285Lys Pro Ser Ala Ser Leu Pro Glu Ser Leu Tyr Ser Leu Val Met Thr290 295 300
Tyr Gln Asn Ala Arg Met Trp Trp Tyr Phe Gly Cys Tyr Phe Cys Leu305 310 315 320Pro Ile Leu Phe Thr Val Thr Cys Gln Leu Val Thr Trp Arg Val Arg325 330 335Gly Pro Pro Gly Arg Lys Ser Glu Cys Arg Ala Ser Lys His Glu Gln340 345 350Cys Glu Ser Gln Leu Asn Ser Thr Val Val Gly Leu Thr Val Val Tyr355 360 365Ala Phe Cys Thr Leu Pro Glu Asn Val Cys Asn Ile Val Val Ala Tyr370 375 380Leu Ser Thr Glu Leu Thr Arg Gln Thr Leu Asp Leu Leu Gly Leu Ile385 390 395 400Asn Gln Phe Ser Thr Phe Phe Lys Gly Ala Ile Thr Pro Val Leu Leu405 410 415Leu Cys Ile Cys Arg Pro Leu Gly Gln Ala Phe Leu Asp Cys Cys Cys420 425 430Cys Cys Cys Cys Glu Glu Cys Gly Gly Ala Ser Glu Ala Ser Ala Ala435 440 445Asn Gly Ser Asp Asn Lys Leu Lys Thr Glu Val Ser Ser Ser Ile Tyr450 455 460Phe His Lys Pro Arg Glu Ser Pro Pro Leu Leu Pro Leu Gly Thr Pro465 470 475 480Cys
<210>19<211>29<212>DNA<213>未知<220>
<223>新序列<400>19aaagattcag gtgtgggaag atggaaacc29<210>20<211>29<212>DNA<213>未知<220>
<223>新序列<400>20aaaggatccc cgacctcaca ttgcttgta29<210>21<211>30<212>DNA<213>未知<220>
<223>新序列<400>21caggaattca tcagaacaga caccatggca 30<210>22<211>31<212>DNA<213>未知<220>
<223>新序列<400>22gcaggatcca gagcagtttt ttcgaaaccc t 31
<210>23<211>33<212>DNA<213>未知<220>
<223>新序列<400>23tccaagcttc aagggtctct ccacgatggc ctg33<210>24<211>33<212>DNA<213>未知<220>
<223>新序列<400>24tgcgaattct ctgtggcccc ctgaccccct aaa33<210>25<211>36<212>DNA<213>未知<220>
<223>新序列<400>25ggtaagctta ccatggcctg caacagcacg tccctt 36<210>26<211>33<212>DNA<213>未知<220>
<223>新序列<400>26gacgaattca accgcagact ggttttcatt gca33
<210>27<211>33<212>DNA<213>未知<220>
<223>新序列<400>27gcaagcttgt gccctcacca agccatgcga gcc 33<210>28<211>30<212>DNA<213>未知<220>
<223>新序列<400>28cggaattcag caatgagttc cgacagaagc 30<210>29<211>37<212>DNA<213>未知<220>
<223>新序列<400>29accatggctt gcaatggcag tgcggccagg gggcact 37<210>30<211>39<212>DNA<213>未知<220>
<223>新序列<400>30cgaccaggac aaacagcatc ttggtcactt gtctccggc 39
<210>31<211>39<212>DNA<213>未知<220>
<223>新序列<400>31gaccaagatg ctgtttgtcc tggtcgtggt gtttggcat 39<210>32<211>35<212>DNA<213>未知<220>
<223>新序列<400>32cggaattcag gatggatcgg tctcttgctg cgcct 35<210>33<211>30<212>DNA<213>未知<220>
<223>新序列<400>33gcgaattccg gctccctgtg ctgccccagg30<210>34<211>30<212>DNA<213>未知<220>
<223>新序列<400>34gcggatcccg gagcccccga gacctggccc30
<210>35<211>31<212>DNA<213>未知<220>
<223>新序列<400>35ctggaattct cctgctcatc cagccatgcg g31<210>36<211>30<212>DNA<213>未知<220>
<223>新序列<400>36cctggatccc cacccctact ggggcctcag 30<210>37<211>29<212>DNA<213>未知<220>
<223>新序列<400>37tccagccgtc ccaaacgtgt cttcgctgc29<210>38<211>31<212>DNA<213>未知<220>
<223>新序列<400>38ctccttcggt cctcctatcg ttgtcagaag t 31
<210>39<211>33<212>DNA<213>未知<220>
<223>新序列<400>39cagaagcaca gatcaaaaaa gatcatcttc ctg 33<210>40<211>31<212>DNA<213>未知<220>
<223>新序列<400>40acaggaatca cagccgaggg ggagtgccac t 31<210>41<211>32<212>DNA<213>未知<220>
<223>新序列<400>41tgtgttcttt ccggcatgtt ttcttgggct tg32<210>42<211>32<212>DNA<213>未知<220>
<223>新序列<400>42caagcccaag aaaacatgcc ggaaagaaca ca32
<210>43<211>33<212>DNA<213>未知<220>
<223>新序列<400>43ctcatggtca catgttgtgt gtatgccatc aag33<210>44<211>33<212>DNA<213>未知<220>
<223>新序列<400>44cttgatggca tacacacaac atgtgaccat gag33<210>45<211>34<212>DNA<213>未知<220>
<223>新序列<400>45acgaagccaa gcccaaggga ttcactatgt acac 34<210>46<211>34<212>DNA<213>未知<220>
<223>新序列<400>46gtgtacatag tgaatccctt gggcttggct ccgt 34
<210>47<211>35<212>DNA<213>未知<220>
<223>新序列<400>47gtcaccacct ttcacccgat gtgctctgtg catag 35<210>48<211>35<212>DNA<213>未知<220>
<223>新序列<400>48ctatgcacag agcacatcgg gtgaaaggtg gtgac 35<210>49<211>36<212>DNA<213>未知<220>
<223>新序列<400>49ccttttgttc tttaagtcct atgtcacccc agtcct36<210>50<211>36<212>DNA<213>未知<220>
<223>新序列<400>50aggactgggg tgacatagga cttaaagaac aaaagg36
<210>51<211>31<212>DNA<213>未知<220>
<223>新序列<400>51atgtggagcc ccatcttcat caccatcctc c 31<210>52<211>31<212>DNA<213>未知<220>
<223>新序列<400>52ggaggatggt gatgaagatg gggctccaca t 31<210>53<211>33<212>DNA<213>未知<220>
<223>新序列<400>53gccgcggtca gcctgaatcg catggtgtgc atc33<210>54<211>33<212>DNA<213>未知<220>
<223>新序列<400>54gatgcacacc atgcgattca ggctgaccgc ggc33
<210>55<211>29<212>DNA<213>未知<220>
<223>新序列<400>55ggccggagac aagtgaaaag atgctgttt29<210>56<211>30<212>DNA<213>未知<220>
<223>新序列<400>56aaacagcatc tttttcactt gtctccggcc 30<210>57<211>27<212>DNA<213>未知<220>
<223>新序列<400>57gagagccagc tcaagagcac cgtggtg 27<210>58<211>31<212>DNA<213>未知<220>
<223>新序列<400>58ctccttcggt cctcctatcg ttgtcagaag t 31
<210>59<211>31<212>DNA<213>未知<220>
<223>新序列<400>59agtggcactc cccctcggct gtgattcctg t 31<210>60<211>30<212>DNA<213>未知<220>
<223>新序列<400>60gccacccgca aggctaaacg catggtctgg 30<210>61<211>31<212>DNA<213>未知<220>
<223>新序列<400>61ctccttcggt cctcctatcg ttgtcagaag t 31<210>62<211>1062<212>DNA<213>未知<220>
<223>新序列<400>62atggaaacca acttctccat tcctctgaat gaaactgagg aggtgctccc tgagcctgct60ggccacaccg ttctgtggat cttctcattg ctagtccacg gagtcacctt tgtcttcggg120
gtcctgggca atgggcttgt gatctgggtg gctggattcc ggatgacacg cacagtcaac180accatctgtt acctgaacct ggccctagct gacttctctt tcagtgccat cctaccattc240cgaatggtct cagtcgccat gagagaaaaa tggccttttg gctcattcct atgtaagtta300gttcatgtta tgatagacat caacctgttt gtcagtgtct acctgatcac catcattgct360ctggaccgct gtatttgtgt cctgcatcca gcctgggccc agaaccatcg caccatgagt420ctggccaaga gggtgatgac gggactctgg attttcacca tagtccttac cttaccaaat480ttcatcttct ggactacaat aagtactacg aatggggaca catactgtat tttcaacttt540gcattctggg gtgacactgc tgtagagagg ttgaacgtgt tcattaccat ggccaaggtc600tttctgatcc tccacttcat tattggcttc agcgtgccta tgtccatcat cacagtctgc660tatgggatca tcgctgccaa aattcacaga aaccacatga ttaaatccag ccgtcccaaa720cgtgtcttcg ctgctgtggt ggcttctttc ttcatctgtt ggttccctta tgaactaatt780ggcattctaa tggcagtctg gctcaaagag atgttgttaa atggcaaata caaaatcatt840cttgtcctga ttaacccaac aagctccttg gcctttttta acagctgcct caacccaatt900ctctacgtct ttatgggtcg taacttccaa gaaagactga ttcgctcttt gcccactagt960ttggagaggg ccctgactga ggtccctgac tcagcccaga ccagcaacac agacaccact1020tctgcttcac ctcctgagga gacggagtta caagcaatgt ga 1062<210>63<211>353<212>PRT<213>未知<220>
<223>新序列<400>63Met Glu Thr Asn Phe Ser Ile Pro Leu Asn Glu Thr Glu Glu Val Leu1 5 10 15
Pro Glu Pro Ala Gly His Thr Val Leu Trp Ile Phe Ser Leu Leu Val20 25 30His Gly Val Thr Phe Val Phe Gly Val Leu Gly Asn Gly Leu Val Ile35 40 45Trp Val Ala Gly Phe Arg Met Thr Arg Thr Val Asn Thr Ile Cys Tyr50 55 60Leu Asn Leu Ala Leu Ala Asp Phe Ser Phe Ser Ala Ile Leu Pro Phe65 70 75 80Arg Met Val Ser Val Ala Met Arg Glu Lys Trp Pro Phe Gly Ser Phe85 90 95Leu Cys Lys Leu Val His Val Met Ile Asp Ile Asn Leu Phe Val Ser100 105 110Val Tyr Leu Ile Thr Ile Ile Ala Leu Asp Arg Cys Ile Cys Val Leu115 120 125His Pro Ala Trp Ala Gln Asn His Arg Thr Met Ser Leu Ala Lys Arg130 135 140Val Met Thr Gly Leu Trp Ile Phe Thr Ile Val Leu Thr Leu Pro Asn145 150 155 160Phe Ile Phe Trp Thr Thr Ile Ser Thr Thr Asn Gly Asp Thr Tyr Cys165 170 175Ile Phe Asn Phe Ala Phe Trp Gly Asp Thr Ala Val Glu Arg Leu Asn180 185 190Val Phe Ile Thr Met Ala Lys Val Phe Leu Ile Leu His Phe Ile Ile195 200 205
Gly Phe Ser Val Pro Met Ser Ile Ile Thr Val Cys Tyr Gly Ile Ile210 215 220Ala Ala Lys Ile His Arg Asn His Met Ile Lys Ser Ser Arg Pro Lys225 230 235 240Arg Val Phe Ala Ala Val Val Ala Ser Phe Phe Ile Cys Trp Phe Pro245 250 255Tyr Glu Leu Ile Gly Ile Leu Met Ala Val Trp Leu Lys Glu Met Leu260 265 270Leu Asn Gly Lys Tyr Lys Ile Ile Leu Val Leu Ile Asn Pro Thr Ser275 280 285Ser Leu Ala Phe Phe Asn Ser Cys Leu Asn Pro Ile Leu Tyr Val Phe290 295 300Met Gly Arg Asn Phe Gln Glu Arg Leu Ile Arg Ser Leu Pro Thr Ser305 310 315 320Leu Glu Arg Ala Leu Thr Glu Val Pro Asp Ser Ala Gln Thr Ser Asn325 330 335Thr Asp Thr Thr Ser Ala Ser Pro Pro Glu Glu Thr Glu Leu Gln Ala340 345 350Met<210>64<211>1029<212>DNA<213>未知<220>
<223>新序列
<400>64atggcagagc atgattacca tgaagactat gggttcagca gtttcaatga cagcagccag60gaggagcatc aagccttcct gcagttcagc aaggtctttc tgccctgcat gtacctggtg120gtgtttgtct gtggtctggt ggggaactct ctggtgctgg tcatatccat cttctaccat180aagttgcaga gcctgacgga tgtgttcctg gtgaacctac ccctggctga cctggtgttt240gtctgcactc tgcccttctg ggcctatgca ggcatccatg aatgggtgtt tggccaggtc300atgtgcaaaa gcctactggg catctacact attaacttct acacgtccat gctcatcctc360acctgcatca ctgtggatcg tttcattgta gtggttaagg ccaccaaggc ctacaaccag420caagccaaga ggatgacctg gggcaaggtc accagcttgc tcatctgggt gatatccctg480ctggtttcct tgccccaaat tatctatggc aatgtcttta atctcgacaa gctcatatgt540ggttaccatg acgaggcaat ttccactgtg gttcttgcca cccagatgac actggggttc600ttcttgccac tgctcaccat gattgtctgc tattcagtca taatcaaaac actgcttcat660gctggaggct tccagaagca cagatcaaaa aagatcatct tcctggtgat ggctgtgttc720ctgctgaccc agatgccctt caacctcatg aagttcatcc gcagcacaca ctgggaatac780tatgccatga ccagctttca ctacaccatc atggtgacag aggccatcgc atacctgagg840gcctgcctta accctgtgct ctatgccttt gtcagcctga agtttcgaaa gaacttctgg900aaacttgtga aggacattgg ttgcctccct taccttgggg tctcacatca atggaaatct960tctgaggaca attccaagac tttttctgcc tcccacaatg tggaggccac cagcatgttc1020cagttatag1029<210>65<211>342<212>PRT<213>未知<220>
<223>新序列<400>65
Met Ala Glu His Asp Tyr His Glu Asp Tyr Gly Phe Ser Ser Phe Asn1 5 10 15Asp Ser Ser Gln Glu Glu His Gln Ala Phe Leu Gln Phe Ser Lys Val20 25 30Phe Leu Pro Cys Met Tyr Leu Val Val Phe Val Cys Gly Leu Val Gly35 40 45Asn Ser Leu Val Leu Val Ile Ser Ile Phe Tyr His Lys Leu Gln Ser50 55 60Leu Thr Asp Val Phe Leu Val Asn Leu Pro Leu Ala Asp Leu Val Phe65 70 75 80Val Cys Thr Leu Pro Phe Trp Ala Tyr Ala Gly Ile His Glu Trp Val85 90 95Phe Gly Gln Val Met Cys Lys Ser Leu Leu Gly Ile Tyr Thr Ile Asn100 105 110Phe Tyr Thr Ser Met Leu Ile Leu Thr Cys Ile Thr Val Asp Arg Phe115 120 125Ile Val Val Val Lys Ala Thr Lys Ala Tyr Asn Gln Gln Ala Lys Arg130 135 140Met Thr Trp Gly Lys Val Thr Ser Leu Leu Ile Trp Val Ile Ser Leu145 150 155 160Leu Val Ser Leu Pro Gln Ile Ile Tyr Gly Asn Val Phe Asn Leu Asp165 170 175Lys Leu Ile Cys Gly Tyr His Asp Glu Ala Ile Ser Thr Val Val Leu180 185 190
Ala Thr Gln Met Thr Leu Gly Phe Phe Leu Pro Leu Leu Thr Met Ile195 200 205Val Cys Tyr Ser Val Ile Ile Lys Thr Leu Leu His Ala Gly Gly Phe210 215 220Gln Lys His Arg Ser Lys Lys Ile Ile Phe Leu Val Met Ala Val Phe225 230 235 240Leu Leu Thr Gln Met Pro Phe Asn Leu Met Lys Phe Ile Arg Ser Thr245 250 255His Trp Glu Tyr Tyr Ala Met Thr Ser Phe His Tyr Thr Ile Met Val260 265 270Thr Glu Ala Ile Ala Tyr Leu Arg Ala Cys Leu Asn Pro Val Leu Tyr275 280 285Ala Phe Val Ser Leu Lys Phe Arg Lys Asn Phe Trp Lys Leu Val Lys290 295 300Asp Ile Gly Cys Leu Pro Tyr Leu Gly Val Ser His Gln Trp Lys Ser205 310 315 320Ser Glu Asp Asn Ser Lys Thr Phe Ser Ala Ser His Asn Val Glu Ala325 330 335Thr Ser Met Phe Gln Leu340<210>66<211>2748<212>DNA<213>未知<220>
<223>新序列
<400>66atggtccagc tgaggaagct gctccgcgtc ctgactttga tgaagttccc ctgctgcgtg60ctggaggtgc tcctgtgcgc gctggcggcg gcggcgcgcg gccaggagat gtacgccccg120cactcaatcc ggatcgaggg ggacgtcacc ctcggggggc tgttccccgt gcacgccaag180ggtcccagcg gagtgccctg cggcgacatc aagagggaaa acgggatcca caggctggaa240gcgatgctct acgccctgga ccagatcaac agtgatccca acctactgcc caacgtgacg300ctgggcgcgc ggatcctgga cacttgttcc agggacactt acgcgctcga acagtcgctt360actttcgtcc aggcgctcat ccagaaggac acctccgacg tgcgctgcac caacggcgaa420ccgccggttt tcgtcaagcc ggagaaagta gttggagtga ttggggcttc ggggagttcg480gtctccatca tggtagccaa catcctgagg ctcttccaga tcccccagat tagttatgca540tcaacggcac ccgagctaag tgatgaccgg cgctatgact tcttctctcg cgtggtgcca600cccgattcct tccaagccca ggccatggta gacattgtaa aggccctagg ctggaattat660gtgtctaccc tcgcatcgga aggaagttat ggagagaaag gtgtggagtc cttcacgcag720atttccaaag aggcaggtgg actctgcatt gcccagtccg tgagaatccc ccaggaacgc780aaagacagga ccattgactt tgatagaatt atcaaacagc tcctggacac ccccaactcc840agggccgtcg tgatttttgc caacgatgag gatataaagc agatccttgc agcagccaaa900agagctgacc aagttggcca ttttctttgg gtgggatcag acagctgggg atccaaaata960aacccactgc accagcatga agatatcgca gaaggggcca tcaccattca gcccaagcga1020gccacggtgg aagggtttga tgcctacttt acgtcccgta cacttgaaaa caacagaaga1080aatgtatggt ttgccgaata ctgggaggaa aacttcaact gcaagttgac gattagtggg1140tcaaaaaaag aagacacaga tcgcaaatgc acaggacagg agagaattgg aaaagattcc1200aactatgagc aggagggtaa agtccagttc gtgattgacg cagtctatgc tatggctcac1260gcccttcacc acatgaacaa ggatctctgt gctgactacc ggggtgtctg cccagagatg1320gagcaagctg gaggcaagaa gttgctgaag tatatacgca atgttaattt caatggtagt1380gctggcactc cagtgatgtt taacaagaac ggggatgcac ctgggcgtta tgacatcttt1440
cagtaccaga ccacaaacac cagcaacccg ggttaccgtc tgatcgggca gtggacagac1500gaacttcagc tcaatataga agacatgcag tggggtaaag gagtccgaga gatacccgcc1560tcagtgtgca cactaccatg taagccagga cagagaaaga agacacagaa aggaactcct1620tgctgttgga cctgtgagcc ttgcgatggt taccagtacc agtttgatga gatgacatgc1680cagcattgcc cctatgacca gaggcccaat gaaaatcgaa ccggatgcca ggatattccc1740atcatcaaac tggagtggca ctccccctcg gctgtgattc ctgtcttcct ggcaatgttg1800gggatcattg ccaccatctt tgtcatggcc actttcatcc gctacaatga cacgcccatt1860gtccgggcat ctgggcggga actcagctat gttcttttga cgggcatctt tctttgctac1920atcatcactt tcctgatgat tgccaaacca gatgtggcag tgtgttcttt ccggcgagtt1980ttcttgggct tgggtatgtg catcagttat gcagccctct tgacgaaaac aaatcggatt2040tatcgcatat ttgagcaggg caagaaatca gtaacagctc ccagactcat aagcccaaca2100tcacaactgg caatcacttc cagtttaata tcagttcagc ttctaggggt gttcatttgg2160tttggtgttg atccacccaa catcatcata gactacgatg aacacaagac aatgaaccct2220gagcaagcca gaggggttct caagtgtgac attacagatc tccaaatcat ttgctccttg2280ggatatagca ttcttctcat ggtcacatgt actgtgtatg ccatcaagac tcggggtgta2340cccgagaatt ttaacgaagc caagcccatt ggattcacta tgtacacgac atgtatagta2400tggcttgcct tcattccaat tttttttggc accgctcaat cagcggaaaa gctctacata2460caaactacca cgcttacaat ctccatgaac ctaagtgcat cagtggcgct ggggatgcta2520tacatgccga aagtgtacat catcattttc caccctgaac tcaatgtcca gaaacggaag2580cgaagcttca aggcggtagt cacagcagcc accatgtcat cgaggctgtc acacaaaccc2640agtgacagac ccaacggtga ggcaaagacc gagctctgtg aaaacgtaga cccaaacagc2700cctgctgcaa aaaagaagta tgtcagttat aataacctgg ttatctaa 2748<210>67<211>915
<212>PRT<213>未知<220>
<223>新序列<400>67Met Val Gln Leu Arg Lys Leu Leu Arg Val Leu Thr Leu Met Lys Phe1 5 10 15Pro Cys Cys Val Leu Glu Val Leu Leu Cys Ala Leu Ala Ala Ala Ala20 25 30Arg Gly Gln Glu Met Tyr Ala Pro His Ser Ile Arg Ile Glu Gly Asp35 40 45Val Thr Leu Gly Gly Leu Phe Pro Val His Ala Lys Gly Pro Ser Gly50 55 60Val Pro Cys Gly Asp Ile Lys Arg Glu Asn Gly Ile His Arg Leu Glu65 70 75 80Ala Met Leu Tyr Ala Leu Asp Gln Ile Asn Ser Asp Pro Asn Leu Leu85 90 95Pro Asn Val Thr Leu Gly Ala Arg Ile Leu Asp Thr Cys Ser Arg Asp100 105 110Thr Tyr Ala Leu Glu Gln Ser Leu Thr Phe Val Gln Ala Leu Ile Gln115 120 125Lys Asp Thr Ser Asp Val Arg Cys Thr Asn Gly Glu Pro Pro Val Phe130 135 140Val Lys Pro Glu Lys Val Val Gly Val Ile Gly Ala Ser Gly Ser Ser145 150 155 160
Val Ser Ile Met Val Ala Asn Ile Leu Arg Leu Phe Gln Ile Pro Gln165 170 175Ile Ser Tyr Ala Ser Thr Ala Pro Glu Leu Ser Asp Asp Arg Arg Tyr180 185 190Asp Phe Phe Ser Arg Val Val Pro Pro Asp Ser Phe Gln Ala Gln Ala195 200 205Met Val Asp Ile Val Lys Ala Leu Gly Trp Asn Tyr Val Ser Thr Leu210 215 220Ala Ser Glu Gly Ser Tyr Gly Glu Lys Gly Val Glu Ser Phe Thr Gln225 230 235 240Ile Ser Lys Glu Ala Gly Gly Leu Cys Ile Ala Gln Ser Val Arg Ile245 250 255Pro Gln Glu Arg Lys Asp Arg Thr Ile Asp Phe Asp Arg Ile Ile Lys260 265 270Gln Leu Leu Asp Thr Pro Asn Ser Arg Ala Val Val Ile Phe Ala Asn275 280 285Asp Glu Asp Ile Lys Gln Ile Leu Ala Ala Ala Lys Arg Ala Asp Gln290 295 300Val Gly His Phe Leu Trp Val Gly Ser Asp Ser Trp Gly Ser Lys Ile305 310 315 320Asn Pro Leu His Gln His Glu Asp Ile Ala Glu Gly Ala Ile Thr Ile325 330 335Gln Pro Lys Arg Ala Thr Val Glu Gly Phe Asp Ala Tyr Phe Thr Ser340 345 350
Arg Thr Leu Glu Asn Asn Arg Arg Asn Val Trp Phe Ala Glu Tyr Trp355 360 365Glu Glu Asn Phe Asn Cys Lys Leu Thr Ile Ser Gly Ser Lys Lys Glu370 375 380Asp Thr Asp Arg Lys Cys Thr Gly Gln Glu Arg Ile Gly Lys Asp Ser385 390 395 400Asn Tyr Glu Gln Glu Gly Lys Val Gln Phe Val Ile Asp Ala Val Tyr405 410 415Ala Met Ala His Ala Leu His His Met Asn Lys Asp Leu Cys Ala Asp420 425 430Tyr Arg Gly Val Cys Pro Glu Met Glu Gln Ala Gly Gly Lys Lys Leu435 440 445Leu Lys Tyr Ile Arg Asn Val Asn Phe Asn Gly Ser Ala Gly Thr Pro450 455 460Val Met Phe Asn Lys Asn Gly Asp Ala Pro Gly Arg Tyr Asp Ile Phe465 470 475 480Gln Tyr Gln Thr Thr Asn Thr Ser Asn Pro Gly Tyr Arg Leu Ile Gly485 490 495Gln Trp Thr Asp Glu Leu Gln Leu Asn Ile Glu Asp Met Gln Trp Gly500 505 510Lys Gly Val Arg Glu Ile Pro Ala Ser Val Cys Thr Leu Pro Cys Lys515 520 525Pro Gly Gln Arg Lys Lys Thr Gln Lys Gly Thr Pro Cys Cys Trp Thr530 535 540
Cys Glu Pro Cys Asp Gly Tyr Gln Tyr Gln Phe Asp Glu Met Thr Cys545 550 555 560Gln His Cys Pro Tyr Asp Gln Arg Pro Asn Glu Asn Arg Thr Gly Cys565 570 575Gln Asp Ile Pro Ile Ile Lys Leu Glu Trp His Ser Pro Ser Ala Val580 585 590Ile Pro Val Phe Leu Ala Met Leu Gly Ile Ile Ala Thr Ile Phe Val595 600 605Met Ala Thr Phe Ile Arg Tyr Asn Asp Thr Pro Ile Val Arg Ala Ser610 615 620Gly Arg Glu Leu Ser Tyr Val Leu Leu Thr Gly Ile Phe Leu Cys Tyr625 630 635 640Ile Ile Thr Phe Leu Met Ile Ala Lys Pro Asp Val Ala Val Cys Ser645 650 655Phe Arg Arg Val Phe Leu Gly Leu Gly Met Cys Ile Ser Tyr Ala Ala660 665 670Leu Leu Thr Lys Thr Asn Arg Ile Tyr Arg Ile Phe Glu Gln Gly Lys675 680 685Lys Ser Val Thr Ala Pro Arg Leu Ile Ser Pro Thr Ser Gln Leu Ala690 695 700Ile Thr Ser Ser Leu Ile Ser Val Gln Leu Leu Gly Val Phe Ile Trp705 710 715 720Phe Gly Val Asp Pro Pro Asn Ile Ile Ile Asp Tyr Asp Glu His Lys725 730 735
Thr Met Asn Pro Glu Gln Ala Arg Gly Val Leu Lys Cys Asp Ile Thr740 745 750Asp Leu Gln Ile Ile Cys Ser Leu Gly Tyr Ser Ile Leu Leu Met Val755 760 765Thr Cys Thr Val Tyr Ala Ile Lys Thr Arg Gly Val Pro Glu Asn Phe770 775 780Asn Glu Ala Lys Pro Ile Gly Phe Thr Met Tyr Thr Thr Cys Ile Val785 790 795 800Trp Leu Ala Phe Ile Pro Ile Phe Phe Gly Thr Ala Gln Ser Ala Glu805 810 815Lys Leu Tyr Ile Gln Thr Thr Thr Leu Thr Ile Ser Met Asn Leu Ser820 825 830Ala Ser Val Ala Leu Gly Met Leu Tyr Met Pro Lys Val Tyr Ile Ile835 840 845Ile Phe His Pro Glu Leu Asn Val Gln Lys Arg Lys Arg Ser Phe Lys850 855 860Ala Val Val Thr Ala Ala Thr Met Ser Ser Arg Leu Ser His Lys Pro865 870 875 880Ser Asp Arg Pro Asn Gly Glu Ala Lys Thr Glu Leu Cys Glu Asn Val885 890 895Asp Pro Asn Ser Pro Ala Ala Lys Lys Lys Tyr Val Ser Tyr Asn Asn900 905 910Leu Val Ile915
<210>68<211>2748<212>DNA<213>未知<220>
<223>新序列<400>68atggtccagc tgaggaagct gctccgcgtc ctgactttga tgaagttccc ctgctgcgtg60ctggaggtgc tcctgtgcgc gctggcggcg gcggcgcgcg gccaggagat gtacgccccg120cactcaatcc ggatcgaggg ggacgtcacc ctcggggggc tgttccccgt gcacgccaag180ggtcccagcg gagtgccctg cggcgacatc aagagggaaa acgggatcca caggctggaa240gcgatgctct acgccctgga ccagatcaac agtgatccca acctactgcc caacgtgacg300ctgggcgcgc ggatcctgga cacttgttcc agggacactt acgcgctcga acagtcgctt360actttcgtcc aggcgctcat ccagaaggac acctccgacg tgcgctgcac caacggcgaa420ccgccggttt tcgtcaagcc ggagaaagta gttggagtga ttggggcttc ggggagttcg480gtctccatca tggtagccaa catcctgagg ctcttccaga tcccccagat tagttatgca540tcaacggcac ccgagctaag tgatgaccgg cgctatgact tcttctctcg cgtggtgcca600cccgattcct tccaagccca ggccatggta gacattgtaa aggccctagg ctggaattat660gtgtctaccc tcgcatcgga aggaagttat ggagagaaag gtgtggagtc cttcacgcag720atttccaaag aggcaggtgg actctgcatt gcccagtccg tgagaatccc ccaggaacgc780aaagacagga ccattgactt tgatagaatt atcaaacagc tcctggacac ccccaactcc840agggccgtcg tgatttttgc caacgatgag gatataaagc agatccttgc agcagccaaa900agagctgacc aagttggcca ttttctttgg gtgggatcag acagctgggg atccaaaata960aacccactgc accagcatga agatatcgca gaaggggcca tcaccattca gcccaagcga1020gccacggtgg aagggtttga tgcctacttt acgtcccgta cacttgaaaa caacagaaga1080aatgtatggt ttgccgaata ctgggaggaa aacttcaact gcaagttgac gattagtggg1140tcaaaaaaag aagacacaga tcgcaaatgc acaggacagg agagaattgg aaaagattcc1200
aactatgagc aggagggtaa agtccagttc gtgattgacg cagtctatgc tatggctcac1260gcccttcacc acatgaacaa ggatctctgt gctgactacc ggggtgtctg cccagagatg1320gagcaagctg gaggcaagaa gttgctgaag tatatacgca atgttaattt caatggtagt1380gctggcactc cagtgatgtt taacaagaac ggggatgcac ctgggcgtta tgacatcttt1440cagtaccaga ccacaaacac cagcaacccg ggttaccgtc tgatcgggca gtggacagac1500gaacttcagc tcaatataga agacatgcag tggggtaaag gagtccgaga gatacccgcc1560tcagtgtgca cactaccatg taagccagga cagagaaaga agacacagaa aggaactcct1620tgctgttgga cctgtgagcc ttgcgatggt taccagtacc agtttgatga gatgacatgc1680cagcattgcc cctatgacca gaggcccaat gaaaatcgaa ccggatgcca ggatattccc1740atcatcaaac tggagtggca ctccccctgg gctgtgattc ctgtcttcct ggcaatgttg1800gggatcattg ccaccatctt tgtcatggcc actttcatcc gctacaatga cacgcccatt1860gtccgggcat ctgggcggga actcagctat gttcttttga cgggcatctt tctttgctac1920atcatcactt tcctgatgat tgccaaacca gatgtggcag tgtgttcttt ccggcatgtt1980ttcttgggct tgggtatgtg catcagttat gcagccctct tgacgaaaac aaatcggatt2040tatcgcatat ttgagcaggg caagaaatca gtaacagctc ccagactcat aagcccaaca2100tcacaactgg caatcacttc cagtttaata tcagttcagc ttctaggggt gttcatttgg2160tttggtgttg atccacccaa catcatcata gactacgatg aacacaagac aatgaaccct2220gagcaagcca gaggggttct caagtgtgac attacagatc tccaaatcat ttgctccttg2280ggatatagca ttcttctcat ggtcacatgt actgtgtatg ccatcaagac tcggggtgta2340cccgagaatt ttaacgaagc caagcccatt ggattcacta tgtacacgac atgtatagta2400tggcttgcct tcattccaat tttttttggc accgctcaat cagcggaaaa gctctacata2460caaactacca cgcttacaat ctccatgaac ctaagtgcat cagtggcgct ggggatgcta2520tacatgccga aagtgtacat catcattttc caccctgaac tcaatgtcca gaaacggaag2580cgaagcttca aggcggtagt cacagcagcc accatgtcat cgaggctgtc acacaaaccc2640
agtgacagac ccaacggtga ggcaaagacc gagctctgtg aaaacgtaga cccaaacagc2700cctgctgcaa aaaagaagta tgtcagttat aataacctgg ttatctaa 2748<210>69<211>915<212>PRT<213>未知<220>
<223>新序列<400>69Met Val Gln Leu Arg Lys Leu Leu Arg Val Leu Thr Leu Met Lys Phe1 5 10 15Pro Cys Cys Val Leu Glu Val Leu Leu Cys Ala Leu Ala Ala Ala Ala20 25 30Arg Gly Gln Glu Met Tyr Ala Pro His Ser Ile Arg Ile Glu Gly Asp35 40 45Val Thr Leu Gly Gly Leu Phe Pro Val His Ala Lys Gly Pro Ser Gly50 55 60Val Pro Cys Gly Asp Ile Lys Arg Glu Asn Gly Ile His Arg Leu Glu65 70 75 80Ala Met Leu Tyr Ala Leu Asp Gln Ile Asn Ser Asp Pro Asn Leu Leu85 90 95Pro Asn Val Thr Leu Gly Ala Arg Ile Leu Asp Thr Cys Ser Arg Asp100 105 110Thr Tyr Ala Leu Glu Gln Ser Leu Thr Phe Val Gln Ala Leu Ile Gln115 120 125
Lys Asp Thr Ser Asp Val Arg Cys Thr Asn Gly Glu Pro Pro Val Phe130 135 140Val Lys Pro Glu Lys Val Val Gly Val Ile Gly Ala Ser Gly Ser Ser145 150 155 160Val Ser Ile Met Val Ala Asn Ile Leu Arg Leu Phe Gln Ile Pro Gln165 170 175Ile Ser Tyr Ala Ser Thr Ala Pro Glu Leu Ser Asp Asp Arg Arg Tyr180 185 190Asp Phe Phe Ser Arg Val Val Pro Pro Asp Ser Phe Gln Ala Gln Ala195 200 205Met Val Asp Ile Val Lys Ala Leu Gly Trp Asn Tyr Val Ser Thr Leu210 215 220Ala Ser Glu Gly Ser Tyr Gly Glu Lys Gly Val Glu Ser Phe Thr Gln225 230 235 240Ile Ser Lys Glu Ala Gly Gly Leu Cys Ile Ala Gln Ser Val Arg Ile245 250 255Pro Gln Glu Arg Lys Asp Arg Thr Ile Asp Phe Asp Arg Ile Ile Lys260 265 270Gln Leu Leu Asp Thr Pro Asn Ser Arg Ala Val Val Ile Phe Ala Asn275 280 285Asp Glu Asp Ile Lys Gln Ile Leu Ala Ala Ala Lys Arg Ala Asp Gln290 295 300Val Gly His Phe Leu Trp Val Gly Ser Asp Ser Trp Gly Ser Lys Ile305 310 315 320
Asn Pro Leu His Gln His Glu Asp Ile Ala Glu Gly Ala Ile Thr Ile325 330 335Gln Pro Lys Arg Ala Thr Val Glu Gly Phe Asp Ala Tyr Phe Thr Ser340 345 350Arg Thr Leu Glu Asn Asn Arg Arg Asn Val Trp Phe Ala Glu Tyr Trp355 360 365Glu Glu Asn Phe Asn Cys Lys Leu Thr Ile Ser Gly Ser Lys Lys Glu370 375 380Asp Thr Asp Arg Lys Cys Thr Gly Gln Glu Arg Ile Gly Lys Asp Ser385 390 395 400Asn Tyr Glu Gln Glu Gly Lys Val Gln Phe Val Ile Asp Ala Val Tyr405 410 415Ala Met Ala His Ala Leu His His Met Asn Lys Asp Leu Cys Ala Asp420 425 430Tyr Arg Gly Val Cys Pro Glu Met Glu Gln Ala Gly Gly Lys Lys Leu435 440 445Leu Lys Tyr Ile Arg Asn Val Asn Phe Asn Gly Ser Ala Gly Thr Pro450 455 460Val Met Phe Asn Lys Asn Gly Asp Ala Pro Gly Arg Tyr Asp Ile Phe465 470 475 480Gln Tyr Gln Thr Thr Asn Thr Ser Asn Pro Gly Tyr Arg Leu Ile Gly485 490 495Gln Trp Thr Asp Glu Leu Gln Leu Asn Ile Glu Asp Met Gln Trp Gly500 505 510
Lys Gly Val Arg Glu Ile Pro Ala Ser Val Cys Thr Leu Pro Cys Lys515 520 525Pro Gly Gln Arg Lys Lys Thr Gln Lys Gly Thr Pro Cys Cys Trp Thr530 535 540Cys Glu Pro Cys Asp Gly Tyr Gln Tyr Gln Phe Asp Glu Met Thr Cys545 550 555 560Gln His Cys Pro Tyr Asp Gln Arg Pro Asn Glu Asn Arg Thr Gly Cys565 570 575Gln Asp Ile Pro Ile Ile Lys Leu Glu Trp His Ser Pro Trp Ala Val580 585 590Ile Pro Val Phe Leu Ala Met Leu Gly Ile Ile Ala Thr Ile Phe Val595 600 605Met Ala Thr Phe Ile Arg Tyr Asn Asp Thr Pro Ile Val Arg Ala Ser610 615 620Gly Arg Glu Leu Ser Tyr Val Leu Leu Thr Gly Ile Phe Leu Cys Tyr625 630 635 640Ile Ile Thr Phe Leu Met Ile Ala Lys Pro Asp Val Ala Val Cys Ser645 650 655Phe Arg His Val Phe Leu Gly Leu Gly Met Cys Ile Ser Tyr Ala Ala660 665 670Leu Leu Thr Lys Thr Asn Arg Ile Tyr Arg Ile Phe Glu Gln Gly Lys675 680 685Lys Ser Val Thr Ala Pro Arg Leu Ile Ser Pro Thr Ser Gln Leu Ala690 695 700
Ile Thr Ser Ser Leu Ile Ser Val Gln Leu Leu Gly Val Phe Ile Trp705 710 715 720Phe Gly Val Asp Pro Pro Asn Ile Ile Ile Asp Tyr Asp Glu His Lys725 730 735Thr Met Asn Pro Glu Gln Ala Arg Gly Val Leu Lys Cys Asp Ile Thr740 745 750Asp Leu Gln Ile Ile Cys Ser Leu Gly Tyr Ser Ile Leu Leu Met Val755 760 765Thr Cys Thr Val Tyr Ala Ile Lys Thr Arg Gly Val Pro Glu Asn Phe770 775 780Asn Glu Ala Lys Pro Ile Gly Phe Thr Met Tyr Thr Thr Cys Ile Val785 790 795 800Trp Leu Ala Phe Ile Pro Ile Phe Phe Gly Thr Ala Gln Ser Ala Glu805 810 815Lys Leu Tyr Ile Gln Thr Thr Thr Leu Thr Ile Ser Met Asn Leu Ser820 825 830Ala Ser Val Ala Leu Gly Met Leu Tyr Met Pro Lys Val Tyr Ile Ile835 840 845Ile Phe His Pro Glu Leu Asn Val Gln Lys Arg Lys Arg Ser Phe Lys850 855 860Ala Val Val Thr Ala Ala Thr Met Ser Ser Arg Leu Ser His Lys Pro865 870 875 880Ser Asp Arg Pro Asn Gly Glu Ala Lys Thr Glu Leu Cys Glu Asn Val885 890 895
Asp Pro Asn Ser Pro Ala Ala Lys Lys Lys Tyr Val Ser Tyr Asn Asn900 905 910Leu Val Ile915<210>70<211>2748<212>DNA<213>未知<220>
<223>新序列<400>70atggtccagc tgaggaagct gctccgcgtc ctgactttga tgaagttccc ctgctgcgtg60ctggaggtgc tcctgtgcgc gctggcggcg gcggcgcgcg gccaggagat gtacgccccg120cactcaatcc ggatcgaggg ggacgtcacc ctcggggggc tgttccccgt gcacgccaag180ggtcccagcg gagtgccctg cggcgacatc aagagggaaa acgggatcca caggctggaa240gcgatgctct acgccctgga ccagatcaac agtgatccca acctactgcc caacgtgacg300ctgggcgcgc ggatcctgga cacttgttcc agggacactt acgcgctcga acagtcgctt360actttcgtcc aggcgctcat ccagaaggac acctccgacg tgcgctgcac caacggcgaa420ccgccggttt tcgtcaagcc ggagaaagta gttggagtga ttggggcttc ggggagttcg480gtctccatca tggtagccaa catcctgagg ctcttccaga tcccccagat tagttatgca540tcaacggcac ccgagctaag tgatgaccgg cgctatgact tcttctctcg cgtggtgcca600cccgattcct tccaagccca ggccatggta gacattgtaa aggccctagg ctggaattat660gtgtctaccc tcgcatcgga aggaagttat ggagagaaag gtgtggagtc cttcacgcag720atttccaaag aggcaggtgg actctgcatt gcccagtccg tgagaatccc ccaggaacgc780aaagacagga ccattgactt tgatagaatt atcaaacagc tcctggacac ccccaactcc840agggccgtcg tgatttttgc caacgatgag gatataaagc agatccttgc agcagccaaa900agagctgacc aagttggcca ttttctttgg gtgggatcag acagctgggg atccaaaata960
aacccactgc accagcatga agatatcgca gaaggggcca tcaccattca gcccaagcga1020gccacggtgg aagggtttga tgcctacttt acgtcccgta cacttgaaaa caacagaaga1080aatgtatggt ttgccgaata ctgggaggaa aacttcaact gcaagttgac gattagtggg1140tcaaaaaaag aagacacaga tcgcaaatgc acaggacagg agagaattgg aaaagattcc1200aactatgagc aggagggtaa agtccagttc gtgattgacg cagtctatgc tatggctcac1260gcccttcacc acatgaacaa ggatctctgt gctgactacc ggggtgtctg cccagagatg1320gagcaagctg gaggcaagaa gttgctgaag tatatacgca atgttaattt caatggtagt1380gctggcactc cagtgatgtt taacaagaac ggggatgcac ctgggcgtta tgacatcttt1440cagtaccaga ccacaaacac cagcaacccg ggttaccgtc tgatcgggca gtggacagac1500gaacttcagc tcaatataga agacatgcag tggggtaaag gagtccgaga gatacccgcc1560tcagtgtgca cactaccatg taagccagga cagagaaaga agacacagaa aggaactcct1620tgctgttgga cctgtgagcc ttgcgatggt taccagtacc agtttgatga gatgacatgc1680cagcattgcc cctatgacca gaggcccaat gaaaatcgaa ccggatgcca ggatattccc1740atcatcaaac tggagtggca ctccccctgg gctgtgattc ctgtcttcct ggcaatgttg1800gggatcattg ccaccatctt tgtcatggcc actttcatcc gctacaatga cacgcccatt1860gtccgggcat ctgggcggga actcagctat gttcttttga cgggcatctt tctttgctac1920atcatcactt tcctgatgat tgccaaacca gatgtggcag tgtgttcttt ccggcgagtt1980ttcttgggct tgggtatgtg catcagttat gcagccctct tgacgaaaac aaatcggatt2040tatcgcatat ttgagcaggg caagaaatca gtaacagctc ccagactcat aagcccaaca2100tcacaactgg caatcacttc cagtttaata tcagttcagc ttctaggggt gttcatttgg2160tttggtgttg atccacccaa catcatcata gactacgatg aacacaagac aatgaaccct2220gagcaagcca gaggggttct caagtgtgac attacagatc tccaaatcat ttgctccttg2280ggatatagca ttcttctcat ggtcacatgt tgtgtgtatg ccatcaagac tcggggtgta2340cccgagaatt ttaacgaagc caagcccatt ggattcacta tgtacacgac atgtatagta2400
tggcttgcct tcattccaat tttttttggc accgctcaat cagcggaaaa gctctacata2460caaactacca cgcttacaat ctccatgaac ctaagtgcat cagtggcgct ggggatgcta2520tacatgccga aagtgtacat catcattttc caccctgaac tcaatgtcca gaaacggaag2580cgaagcttca aggcggtagt cacagcagcc accatgtcat cgaggctgtc acacaaaccc2640agtgacagac ccaacggtga ggcaaagacc gagctctgtg aaaacgtaga cccaaacagc2700cctgctgcaa aaaagaagta tgtcagttat aataacctgg ttatctaa 2748<210>71<211>915<212>PRT<213>未知<220>
<223>新序列<400>71Met Val Gln Leu Arg Lys Leu Leu Arg Val Leu Thr Leu Met Lys Phe1 5 10 15Pro Cys Cys Val Leu Glu Val Leu Leu Cys Ala Leu Ala Ala Ala Ala20 25 30Arg Gly Gln Glu Met Tyr Ala Pro His Ser Ile Arg Ile Glu Gly Asp35 40 45Val Thr Leu Gly Gly Leu Phe Pro Val His Ala Lys Gly Pro Ser Gly50 55 60Val Pro Cys Gly Asp Ile Lys Arg Glu Asn Gly Ile His Arg Leu Glu65 70 75 80Ala Met Leu Tyr Ala Leu Asp Gln Ile Asn Ser Asp Pro Asn Leu Leu85 90 95
Pro Asn Val Thr Leu Gly Ala Arg Ile Leu Asp Thr Cys Ser Arg Asp100 105 110Thr Tyr Ala Leu Glu Gln Ser Leu Thr Phe Val Gln Ala Leu Ile Gln115 120 125Lys Asp Thr Ser Asp Val Arg Cys Thr Asn Gly Glu Pro Pro Val Phe130 135 140Val Lys Pro Glu Lys Val Val Gly Val Ile Gly Ala Ser Gly Ser Ser145 150 155 160Val Ser Ile Met Val Ala Asn Ile Leu Arg Leu Phe Gln Ile Pro Gln165 170 175Ile Ser Tyr Ala Ser Thr Ala Pro Glu Leu Ser Asp Asp Arg Arg Tyr180 185 190Asp Phe Phe Ser Arg Val Val Pro Pro Asp Ser Phe Gln Ala Gln Ala195 200 205Met Val Asp Ile Val Lys Ala Leu Gly Trp Asn Tyr Val Ser Thr Leu210 215 220Ala Ser Glu Gly Ser Tyr Gly Glu Lys Gly Val Glu Ser Phe Thr Gln225 230 235 240Ile Ser Lys Glu Ala Gly Gly Leu Cys Ile Ala Gln Ser Val Arg Ile245 250 255Pro Gln Glu Arg Lys Asp Arg Thr Ile Asp Phe Asp Arg Ile Ile Lys260 265 270Gln Leu Leu Asp Thr Pro Asn Ser Arg Ala Val Val Ile Phe Ala Asn275 280 285
Asp Glu Asp Ile Lys Gln Ile Leu Ala Ala Ala Lys Arg Ala Asp Gln290 295 300Val Gly His Phe Leu Trp Val Gly Ser Asp Ser Trp Gly Ser Lys Ile305 310 315 320Asn Pro Leu His Gln His Glu Asp Ile Ala Glu Gly Ala Ile Thr Ile325 330 335Gln Pro Lys Arg Ala Thr Val Glu Gly Phe Asp Ala Tyr Phe Thr Ser340 345 350Arg Thr Leu Glu Asn Asn Arg Arg Asn Val Trp Phe Ala Glu Tyr Trp355 360 365Glu Glu Asn Phe Asn Cys Lys Leu Thr Ile Ser Gly Ser Lys Lys Glu370 375 380Asp Thr Asp Arg Lys Cys Thr Gly Gln Glu Arg Ile Gly Lys Asp Ser385 390 395 400Asn Tyr Glu Gln Glu Gly Lys Val Gln Phe Val Ile Asp Ala Val Tyr405 410 415Ala Met Ala His Ala Leu His His Met Asn Lys Asp Leu Cys Ala Asp420 425 430Tyr Arg Gly Val Cys Pro Glu Met Glu Gln Ala Gly Gly Lys Lys Leu435 440 445Leu Lys Tyr Ile Arg Asn Val Asn Phe Asn Gly Ser Ala Gly Thr Pro450 455 460Val Met Phe Asn Lys Asn Gly Asp Ala Pro Gly Arg Tyr Asp Ile Phe465 470 475 480
Gln Tyr Gln Thr Thr Asn Thr Ser Asn Pro Gly Tyr Arg Leu Ile Gly485 490 495Gln Trp Thr Asp Glu Leu Gln Leu Asn Ile Glu Asp Met Gln Trp Gly500 505 510Lys Gly Val Arg Glu Ile Pro Ala Ser Val Cys Thr Leu Pro Cys Lys515 520 525Pro Gly Gln Arg Lys Lys Thr Gln Lys Gly Thr Pro Cys Cys Trp Thr530 535 540Cys Glu Pro Cys Asp Gly Tyr Gln Tyr Gln Phe Asp Glu Met Thr Cys545 550 555 560Gln His Cys Pro Tyr Asp Gln Arg Pro Asn Glu Asn Arg Thr Gly Cys565 570 575Gln Asp Ile Pro Ile Ile Lys Leu Glu Trp His Ser Pro Trp Ala Val580 585 590Ile Pro Val Phe Leu Ala Met Leu Gly Ile Ile Ala Thr Ile Phe Val595 600 605Met Ala Thr Phe Ile Arg Tyr Asn Asp Thr Pro Ile Val Arg Ala Ser610 615 620Gly Arg Glu Leu Ser Tyr Val Leu Leu Thr Gly Ile Phe Leu Cys Tyr625 630 635 640Ile Ile Thr Phe Leu Met Ile Ala Lys Pro Asp Val Ala Val Cys Ser645 650 655Phe Arg Arg Val Phe Leu Gly Leu Gly Met Cys Ile Ser Tyr Ala Ala660 665 670
Leu Leu Thr Lys Thr Asn Arg Ile Tyr Arg Ile Phe Glu Gln Gly Lys675 680 685Lys Ser Val Thr Ala Pro Arg Leu Ile Ser Pro Thr Ser Gln Leu Ala690 695 700Ile Thr Ser Ser Leu Ile Ser Val Gln Leu Leu Gly Val Phe Ile Trp705 710 715 720Phe Gly Val Asp Pro Pro Asn Ile Ile Ile Asp Tyr Asp Glu His Lys725 730 735Thr Met Asn Pro Glu Gln Ala Arg Gly Val Leu Lys Cys Asp Ile Thr740 745 750Asp Leu Gln Ile Ile Cys Ser Leu Gly Tyr Ser Ile Leu Leu Met Val755 760 765Thr Cys Cys Val Tyr Ala Ile Lys Thr Arg Gly Val Pro Glu Asn Phe770 775 780Asn Glu Ala Lys Pro Ile Gly Phe Thr Met Tyr Thr Thr Cys Ile Val785 790 795 800Trp Leu Ala Phe Ile Pro Ile Phe Phe Gly Thr Ala Gln Ser Ala Glu805 810 815Lys Leu Tyr Ile Gln Thr Thr Thr Leu Thr Ile Ser Met Asn Leu Ser820 825 830Ala Ser Val Ala Leu Gly Met Leu Tyr Met Pro Lys Val Tyr Ile Ile835 840 845Ile Phe His Pro Glu Leu Asn Val Gln Lys Arg Lys Arg Ser Phe Lys850 855 860
Ala Val Val Thr Ala Ala Thr Met Ser Ser Arg Leu Ser His Lys Pro865 870 875 880Ser Asp Arg Pro Asn Gly Glu Ala Lys Thr Glu Leu Cys Glu Asn Val885 890 895Asp Pro Asn Ser Pro Ala Ala Lys Lys Lys Tyr Val Ser Tyr Asn Asn900 905 910Leu Val Ile915<210>72<211>2748<212>DNA<213>未知<220>
<223>新序列<400>72atggtccagc tgaggaagct gctccgcgtc ctgactttga tgaagttccc ctgctgcgtg60ctggaggtgc tcctgtgcgc gctggcggcg gcggcgcgcg gccaggagat gtacgccccg120cactcaatcc ggatcgaggg ggacgtcacc ctcggggggc tgttccccgt gcacgccaag180ggtcccagcg gagtgccctg cggcgacatc aagagggaaa acgggatcca caggctggaa240gcgatgctct acgccctgga ccagatcaac agtgatccca acctactgcc caacgtgacg300ctgggcgcgc ggatcctgga cacttgttcc agggacactt acgcgctcga acagtcgctt360actttcgtcc aggcgctcat ccagaaggac acctccgacg tgcgctgcac caacggcgaa420ccgccggttt tcgtcaagcc ggagaaagta gttggagtga ttggggcttc ggggagttcg480gtctccatca tggtagccaa catcctgagg ctcttccaga tcccccagat tagttatgca540tcaacggcac ccgagctaag tgatgaccgg cgctatgact tcttctctcg cgtggtgcca600cccgattcct tccaagccca ggccatggta gacattgtaa aggccctagg ctggaattat660gtgtctaccc tcgcatcgga aggaagttat ggagagaaag gtgtggagtc cttcacgcag720
atttccaaag aggcaggtgg actctgcatt gcccagtccg tgagaatccc ccaggaacgc780aaagacagga ccattgactt tgatagaatt atcaaacagc tcctggacac ccccaactcc840agggccgtcg tgatttttgc caacgatgag gatataaagc agatccttgc agcagccaaa900agagctgacc aagttggcca ttttctttgg gtgggatcag acagctgggg atccaaaata960aacccactgc accagcatga agatatcgca gaaggggcca tcaccattca gcccaagcga1020gccacggtgg aagggtttga tgcctacttt acgtcccgta cacttgaaaa caacagaaga1080aatgtatggt ttgccgaata ctgggaggaa aacttcaact gcaagttgac gattagtggg1140tcaaaaaaag aagacacaga tcgcaaatgc acaggacagg agagaattgg aaaagattcc1200aactatgagc aggagggtaa agtccagttc gtgattgacg cagtctatgc tatggctcac1260gcccttcacc acatgaacaa ggatctctgt gctgactacc ggggtgtctg cccagagatg1320gagcaagctg gaggcaagaa gttgctgaag tatatacgca atgttaattt caatggtagt1380gctggcactc cagtgatgtt taacaagaac ggggatgcac ctgggcgtta tgacatcttt1440cagtaccaga ccacaaacac cagcaacccg ggttaccgtc tgatcgggca gtggacagac1500gaacttcagc tcaatataga agacatgcag tggggtaaag gagtccgaga gatacccgcc1560tcagtgtgca cactaccatg taagccagga cagagaaaga agacacagaa aggaactcct1620tgctgttgga cctgtgagcc ttgcgatggt taccagtacc agtttgatga gatgacatgc1680cagcattgcc cctatgacca gaggcccaat gaaaatcgaa ccggatgcca ggatattccc1740atcatcaaac tggagtggca ctccccctgg gctgtgattc ctgtcttcct ggcaatgttg1800gggatcattg ccaccatctt tgtcatggcc actttcatcc gctacaatga cacgcccatt1860gtccgggcat ctgggcggga actcagctat gttcttttga cgggcatctt tctttgctac1920atcatcactt tcctgatgat tgccaaacca gatgtggcag tgtgttcttt ccggcgagtt1980ttcttgggct tgggtatgtg catcagttat gcagccctct tgacgaaaac aaatcggatt2040tatcgcatat ttgagcaggg caagaaatca gtaacagctc ccagactcat aagcccaaca2100tcacaactgg caatcacttc cagtttaata tcagttcagc ttctaggggt gttcatttgg2160
tttggtgttg atccacccaa catcatcata gactacgatg aacacaagac aatgaaccct2220gagcaagcca gaggggttct caagtgtgac attacagatc tccaaatcat ttgctccttg2280ggatatagca ttcttctcat ggtcacatgt actgtgtatg ccatcaagac tcggggtgta2340cccgagaatt ttaacgaagc caagcccaag ggattcacta tgtacacgac atgtatagta2400tggcttgcct tcattccaat tttttttggc accgctcaat cagcggaaaa gctctacata2460caaactacca cgcttacaat ctccatgaac ctaagtgcat cagtggcgct ggggatgcta2520tacatgccga aagtgtacat catcattttc caccctgaac tcaatgtcca gaaacggaag2580cgaagcttca aggcggtagt cacagcagcc accatgtcat cgaggctgtc acacaaaccc2640agtgacagac ccaacggtga ggcaaagacc gagctctgtg aaaacgtaga cccaaacagc2700cctgctgcaa aaaagaagta tgtcagttat aataacctgg ttatctaa 2748<210>73<211>915<212>PRT<213>未知<220>
<223>新序列<400>73Met Val Gln Leu Arg Lys Leu Leu Arg Val Leu Thr Leu Met Lys Phe1 5 10 15Pro Cys Cys Val Leu Glu Val Leu Leu Cys Ala Leu Ala Ala Ala Ala20 25 30Arg Gly Gln Glu Met Tyr Ala Pro His Ser Ile Arg Ile Glu Gly Asp35 40 45Val Thr Leu Gly Gly Leu Phe Pro Val His Ala Lys Gly Pro Ser Gly50 55 60
Val Pro Cys Gly Asp Ile Lys Arg Glu Asn Gly Ile His Arg Leu Glu65 70 75 80Ala Met Leu Tyr Ala Leu Asp Gln Ile Asn Ser Asp Pro Asn Leu Leu85 90 95Pro Asn Val Thr Leu Gly Ala Arg Ile Leu Asp Thr Cys Ser Arg Asp100 105 110Thr Tyr Ala Leu Glu Gln Ser Leu Thr Phe Val Gln Ala Leu Ile Gln115 120 125Lys Asp Thr Ser Asp Val Arg Cys Thr Asn Gly Glu Pro Pro Val Phe130 135 140Val Lys Pro Glu Lys Val Val Gly Val Ile Gly Ala Ser Gly Ser Ser145 150 155 160Val Ser Ile Met Val Ala Asn Ile Leu Arg Leu Phe Gln Ile Pro Gln165 170 175Ile Ser Tyr Ala Ser Thr Ala Pro Glu Leu Ser Asp Asp Arg Arg Tyr180 185 190Asp Phe Phe Ser Arg Val Val Pro Pro Asp Ser Phe Gln Ala Gln Ala195 200 205Met Val Asp Ile Val Lys Ala Leu Gly Trp Asn Tyr Val Ser Thr Leu210 215 220Ala Ser Glu Gly Ser Tyr Gly Glu Lys Gly Val Glu Ser Phe Thr Gln225 230 235 240Ile Ser Lys Glu Ala Gly Gly Leu Cys Ile Ala Gln Ser Val Arg Ile245 250 255
Pro Gln Glu Arg Lys Asp Arg Thr Ile Asp Phe Asp Arg Ile Ile Lys260 265 270Gln Leu Leu Asp Thr Pro Asn Ser Arg Ala Val Val Ile Phe Ala Asn275 280 285Asp Glu Asp Ile Lys Gln Ile Leu Ala Ala Ala Lys Arg Ala Asp Gln290 295 300Val Gly His Phe Leu Trp Val Gly Ser Asp Ser Trp Gly Ser Lys Ile305 310 315 320Asn Pro Leu His Gln His Glu Asp Ile Ala Glu Gly Ala Ile Thr Ile325 330 335Gln Pro Lys Arg Ala Thr Val Glu Gly Phe Asp Ala Tyr Phe Thr Ser340 345 350Arg Thr Leu Glu Asn Asn Arg Arg Asn Val Trp Phe Ala Glu Tyr Trp355 360 365Glu Glu Asn Phe Asn Cys Lys Leu Thr Ile Ser Gly Ser Lys Lys Glu370 375 380Asp Thr Asp Arg Lys Cys Thr Gly Gln Glu Arg Ile Gly Lys Asp Ser385 390 395 400Asn Tyr Glu Gln Glu Gly Lys Val Gln Phe Val Ile Asp Ala Val Tyr405 410 415Ala Met Ala His Ala Leu His His Met Asn Lys Asp Leu Cys Ala Asp420 425 430Tyr Arg Gly Val Cys Pro Glu Met Glu Gln Ala Gly Gly Lys Lys Leu435 440 445
Leu Lys Tyr Ile Arg Asn Val Asn Phe Asn Gly Ser Ala Gly Thr Pro450 455 460Val Met Phe Asn Lys Asn Gly Asp Ala Pro Gly Arg Tyr Asp Ile Phe465 470 475 480Gln Tyr Gln Thr Thr Asn Thr Ser Asn Pro Gly Tyr Arg Leu Ile Gly485 490 495Gln Trp Thr Asp Glu Leu Gln Leu Asn Ile Glu Asp Met Gln Trp Gly500 505 510Lys Gly Val Arg Glu Ile Pro Ala Ser Val Cys Thr Leu Pro Cys Lys515 520 525Pro Gly Gln Arg Lys Lys Thr Gln Lys Gly Thr Pro Cys Cys Trp Thr530 535 540Cys Glu Pro Cys Asp Gly Tyr Gln Tyr Gln Phe Asp Glu Met Thr Cys545 550 555 560Gln His Cys Pro Tyr Asp Gln Arg Pro Asn Glu Asn Arg Thr Gly Cys565 570 575Gln Asp Ile Pro Ile Ile Lys Leu Glu Trp His Ser Pro Trp Ala Val580 585 590Ile Pro Val Phe Leu Ala Met Leu Gly Ile Ile Ala Thr Ile Phe Val595 600 605Met Ala Thr Phe Ile Arg Tyr Asn Asp Thr Pro Ile Val Arg Ala Ser610 615 620Gly Arg Glu Leu Ser Tyr Val Leu Leu Thr Gly Ile Phe Leu Cys Tyr625 630 635 640
Ile Ile Thr Phe Leu Met Ile Ala Lys Pro Asp Val Ala Val Cys Ser645 650 655Phe Arg Arg Val Phe Leu Gly Leu Gly Met Cys Ile Ser Tyr Ala Ala660 665 670Leu Leu Thr Lys Thr Asn Arg Ile Tyr Arg Ile Phe Glu Gln Gly Lys675 680 685Lys Ser Val Thr Ala Pro Arg Leu Ile Ser Pro Thr Ser Gln Leu Ala690 695 700Ile Thr Ser Ser Leu Ile Ser Val Gln Leu Leu Gly Val Phe Ile Trp705 710 715 720Phe Gly Val Asp Pro Pro Asn Ile Ile Ile Asp Tyr Asp Glu His Lys725 730 735Thr Met Asn Pro Glu Gln Ala Arg Gly Val Leu Lys Cys Asp Ile Thr740 745 750Asp Leu Gln Ile Ile Cys Ser Leu Gly Tyr Ser Ile Leu Leu Met Val755 760 765Thr Cys Thr Val Tyr Ala Ile Lys Thr Arg Gly Val Pro Glu Asn Phe770 775 780Asn Glu Ala Lys Pro Lys Gly Phe Thr Met Tyr Thr Thr Cys Ile Val785 790 795 800Trp Leu Ala Phe Ile Pro Ile Phe Phe Gly Thr Ala Gln Ser Ala Glu805 810 815Lys Leu Tyr Ile Gln Thr Thr Thr Leu Thr Ile Ser Met Asn Leu Ser820 825 830
Ala Ser Val Ala Leu Gly Met Leu Tyr Met Pro Lys Val Tyr Ile Ile835 840 845Ile Phe His Pro Glu Leu Asn Val Gln Lys Arg Lys Arg Ser Phe Lys850 855 860Ala Val Val Thr Ala Ala Thr Met Ser Ser Arg Leu Ser His Lys Pro865 870 875 880Ser Asp Arg Pro Asn Gly Glu Ala Lys Thr Glu Leu Cys Glu Asn Val885 890 895Asp Pro Asn Ser Pro Ala Ala Lys Lys Lys Tyr Val Ser Tyr Asn Asn900 905 910Leu Val Ile915<210>74<211>1842<212>DNA<213>未知<220>
<223>新序列<400>74atgcgagccc cgggcgcgct tctcgcccgc atgtcgcggc tactgcttct gctactgctc60aaggtgtctg cctcttctgc cctcggggtc gcccctgcgt ccagaaacga aacttgtctg120ggggagagct gtgcacctac agtgatccag cgccgcggca gggacgcctg gggaccggga180aattctgcaa gagacgttct gcgagcccga gcacccaggg aggagcaggg ggcagcgttt240cttgcgggac cctcctggga cctgccggcg gccccgggcc gtgacccggc tgcaggcaga300ggggcggagg cgtcggcagc cggacccccg ggacctccaa ccaggccacc tggcccctgg360aggtggaaag gtgctcgggg tcaggagcct tctgaaactt tggggagagg gaaccccacg420gccctccagc tcttccttca gatctcagag gaggaagaga agggtcccag aggcgctggc480
atttccgggc gtagccagga gcagagtgtg aagacagtcc ccggagccag cgatcttttt540tactggccaa ggagagccgg gaaactccag ggttcccacc acaagcccct gtccaagacg600gccaatggac tggcggggca cgaagggtgg acaattgcac tcccgggccg ggcgctggcc660cagaatggat ccttgggtga aggaatccat gagcctgggg gtccccgccg gggaaacagc720acgaaccggc gtgtgagact gaagaacccc ttctacccgc tgacccagga gtcctatgga780gcctacgcgg tcatgtgtct gtccgtggtg atcttcggga ccggcatcat tggcaacctg840gcggtgatgt gcatcgtgtg ccacaactac tacatgcgga gcatctccaa ctccctcttg900gccaacctgg ccttctggga ctttctcatc atcttcttct gccttccgct ggtcatcttc960cacgagctga ccaagaagtg gctgctggag gacttctcct gcaagatcgt gccctatata1020gaggtcgctt ctctgggagt caccaccttc acccgatgtg ctctgtgcat agaccgcttc1080cgtgctgcca ccaacgtaca gatgtactac gaaatgatcg aaaactgttc ctcaacaact1140gccaaacttg ctgttatatg ggtgggagct ctattgttag cacttccaga agttgttctc1200cgccagctga gcaaggagga tttggggttt agtggccgag ctccggcaga aaggtgcatt1260attaagatct ctcctgattt accagacacc atctatgttc tagccctcac ctacgacagt1320gcgagactgt ggtggtattt tggctgttac ttttgtttgc ccacgctttt caccatcacc1380tgctctctag tgactgcgag gaaaatccgc aaagcagaga aagcctgtac ccgagggaat1440aaacggcaga ttcaactaga gagtcagatg aactgtacag tagtggcact gaccatttta1500tatggatttt gcattattcc tgaaaatatc tgcaacattg ttactgccta catggctaca1560ggggtttcac agcagacaat ggacctcctt aatatcatca gccagttcct tttgttcttt1620aagtcctgtg tcaccccagt cctccttttc tgtctctgca aacccttcag tcgggccttc1680atggagtgct gctgctgttg ctgtgaggaa tgcattcaga agtcttcaac ggtgaccagt1740gatgacaatg acaacgagta caccacggaa ctcgaactct cgcctttcag taccatacgc1800cgtgaaatgt ccacttttgc ttctgtcgga actcattgct ga 1842
<210>75<211>613<212>PRT<213>未知<220>
<223>新序列<400>75Met Arg Ala Pro Gly Ala Leu Leu Ala Arg Met Ser Arg Leu Leu Leu1 5 10 15Leu Leu Leu Leu Lys Val Ser Ala Ser Ser Ala Leu Gly Val Ala Pro20 25 30Ala Ser Arg Asn Glu Thr Cys Leu Gly Glu Ser Cys Ala Pro Thr Val35 40 45Ile Gln Arg Arg Gly Arg Asp Ala Trp Gly Pro Gly Asn Ser Ala Arg50 55 60Asp Val Leu Arg Ala Arg Ala Pro Arg Glu Glu Gln Gly Ala Ala Phe65 70 75 80Leu Ala Gly Pro Ser Trp Asp Leu Pro Ala Ala Pro Gly Arg Asp Pro85 90 95Ala Ala Gly Arg Gly Ala Glu Ala Ser Ala Ala Gly Pro Pro Gly Pro100 105 110Pro Thr Arg Pro Pro Gly Pro Trp Arg Trp Lys Gly Ala Arg Gly Gln115 120 125Glu Pro Ser Glu Thr Leu Gly Arg Gly Asn Pro Thr Ala Leu Gln Leu130 135 140Phe Leu Gln Ile Ser Glu Glu Glu Glu Lys Gly Pro Arg Gly Ala Gly145 150 155 160
Ile Ser Gly Arg Ser Gln Glu Gln Ser Val Lys Thr Val Pro Gly Ala165 170 175Ser Asp Leu Phe Tyr Trp Pro Arg Arg Ala Gly Lys Leu Gln Gly Ser180 185 190His His Lys Pro Leu Ser Lys Thr Ala Asn Gly Leu Ala Gly His Glu195 200 205Gly Trp Thr Ile Ala Leu Pro Gly Arg Ala Leu Ala Gln Asn Gly Ser210 215 220Leu Gly Glu Gly Ile His Glu Pro Gly Gly Pro Arg Arg Gly Asn Ser225 230 235 240Thr Asn Arg Arg Val Arg Leu Lys Asn Pro Phe Tyr Pro Leu Thr Gln245 250 255Glu Ser Tyr Gly Ala Tyr Ala Val Met Cys Leu Ser Val Val Ile Phe260 265 270Gly Thr Gly Ile Ile Gly Asn Leu Ala Val Met Cys Ile Val Cys His275 280 285Asn Tyr Tyr Met Arg Ser Ile Ser Asn Ser Leu Leu Ala Asn Leu Ala290 295 300Phe Trp Asp Phe Leu Ile Ile Phe Phe Cys Leu Pro Leu Val Ile Phe305 310 315 320His Glu Leu Thr Lys Lys Trp Leu Leu Glu Asp Phe Ser Cys Lys Ile325 330 335Val Pro Tyr Ile Glu Val Ala Ser Leu Gly Val Thr Thr Phe Thr Arg340 345 350
Cys Ala Leu Cys Ile Asp Arg Phe Arg Ala Ala Thr Asn Val Gln Met355 360 365Tyr Tyr Glu Met Ile Glu Asn Cys Ser Ser Thr Thr Ala Lys Leu Ala370 375 380Val Ile Trp Val Gly Ala Leu Leu Leu Ala Leu Pro Glu Val Val Leu385 390 395 400Arg Gln Leu Ser Lys Glu Asp Leu Gly Phe Ser Gly Arg Ala Pro Ala405 410 415Glu Arg Cys Ile Ile Lys Ile Ser Pro Asp Leu Pro Asp Thr Ile Tyr420 425 430Val Leu Ala Leu Thr Tyr Asp Ser Ala Arg Leu Trp Trp Tyr Phe Gly435 440 445Cys Tyr Phe Cys Leu Pro Thr Leu Phe Thr Ile Thr Cys Ser Leu Val450 455 460Thr Ala Arg Lys Ile Arg Lys Ala Glu Lys Ala Cys Thr Arg Gly Asn465 470 475 480Lys Arg Gln Ile Gln Leu Glu Ser Gln Mer Asn Cys Thr Val Val Ala485 490 495Leu Thr Ile Leu Tyr Gly Phe Cys Ile Ile Pro Glu Asn Ile Cys Asn500 505 510Ile Val Thr Ala Tyr Met Ala Thr Gly Val Ser Gln Gln Thr Met Asp515 520 525Leu Leu Asn Ile Ile Ser Gln Phe Leu Leu Phe Phe Lys Ser Cys Val530 535 540
Thr Pro Val Leu Leu Phe Cys Leu Cys Lys Pro Phe Ser Arg Ala Phe545 550 555 560Met Glu Cys Cys Cys Cys Cys Cys Glu Glu Cys Ile Gln Lys Ser Ser565 570 575Thr Val Thr Ser Asp Asp Asn Asp Asn Glu Tyr Thr Thr Glu Leu Glu580 585 590Leu Ser Pro Phe Ser Thr Ile Arg Arg Glu Met Ser Thr Phe Ala Ser595 600 605Val Gly Thr His Cys610<210>76<211>1842<212>DNA<213>人<400>76atgcgagccc cgggcgcgct tctcgcccgc atgtcgcggc tactgcttct gctactgctc60aaggtgtctg cctcttctgc cctcggggtc gcccctgcgt ccagaaacga aacttgtctg120ggggagagct gtgcacctac agtgatccag cgccgcggca gggacgcctg gggaccggga180aattctgcaa gagacgttct gcgagcccga gcacccaggg aggagcaggg ggcagcgttt240cttgcgggac cctcctggga cctgccggcg gccccgggcc gtgacccggc tgcaggcaga300ggggcggagg cgtcggcagc cggacccccg ggacctccaa ccaggccacc tggcccctgg360aggtggaaag gtgctcgggg tcaggagcct tctgaaactt tggggagagg gaaccccacg420gccctccagc tcttccttca gatctcagag gaggaagaga agggtcccag aggcgctggc480atttccgggc gtagccagga gcagagtgtg aagacagtcc ccggagccag cgatcttttt540tactggccaa ggagagccgg gaaactccag ggttcccacc acaagcccct gtccaagacg600
gccaatggac tggcggggca cgaagggtgg acaattgcac tcccgggccg ggcgctggcc660cagaatggat ccttgggtga aggaatccat gagcctgggg gtccccgccg gggaaacagc720acgaaccggc gtgtgagact gaagaacccc ttctacccgc tgacccagga gtcctatgga780gcctacgcgg tcatgtgtct gtccgtggtg atcttcggga ccggcatcat tggcaacctg840gcggtgatgt gcatcgtgtg ccacaactac tacatgcgga gcatctccaa ctccctcttg900gccaacctgg ccttctggga ctttctcatc atcttcttct gccttccgct ggtcatcttc960cacgagctga ccaagaagtg gctgctggag gacttctcct gcaagatcgt gccctatata1020gaggtcgctt ctctgggagt caccaccttc accttatgtg ctctgtgcat agaccgcttc1080cgtgctgcca ccaacgtaca gatgtactac gaaatgatcg aaaactgttc ctcaacaact1140gccaaacttg ctgttatatg ggtgggagct ctattgttag cacttccaga agttgttctc1200cgccagctga gcaaggagga tttggggttt agtggccgag ctccggcaga aaggtgcatt1260attaagatct ctcctgattt accagacacc atctatgttc tagccctcac ctacgacagt1320gcgagactgt ggtggtattt tggctgttac ttttgtttgc ccacgctttt caccatcacc1380tgctctctag tgactgcgag gaaaatccgc aaagcagaga aagcctgtac ccgagggaat1440aaacggcaga ttcaactaga gagtcagatg aactgtacag tagtggcact gaccatttta1500tatggatttt gcattattcc tgaaaatatc tgcaacattg ttactgccta catggctaca1560ggggtttcac agcagacaat ggacctcctt aatatcatca gccagttcct tttgttcttt1620aagtcctatg tcaccccagt cctccttttc tgtctctgca aacccttcag tcgggccttc1680atggagtgct gctgctgttg ctgtgaggaa tgcattcaga agtcttcaac ggtgaccagt1740gatgacaatg acaacgagta caccacggaa ctcgaactct cgcctttcag taccatacgc1800cgtgaaatgt ccacttttgc ttctgtcgga actcattgct ga 1842<210>77<211>613<212>PRT<213>未知
<220>
<223>新序列<400>77Met Arg Ala Pro Gly Ala Leu Leu Ala Arg Met Ser Arg Leu Leu Leu1 5 10 15Leu Leu Leu Leu Lys Val Ser Ala Ser Ser Ala Leu Gly Val Ala Pro20 25 30Ala Ser Arg Asn Glu Thr Cys Leu Gly Glu Ser Cys Ala Pro Thr Val35 40 45Ile Gln Arg Arg Gly Arg Asp Ala Trp Gly Pro Gly Asn Ser Ala Arg50 55 60Asp Val Leu Arg Ala Arg Ala Pro Arg Glu Glu Gln Gly Ala Ala Phe65 70 75 80Leu Ala Gly Pro Ser Trp Asp Leu Pro Ala Ala Pro Gly Arg Asp Pro85 90 95Ala Ala Gly Arg Gly Ala Glu Ala Ser Ala Ala Gly Pro Pro Gly Pro100 105 110Pro Thr Arg Pro Pro Gly Pro Trp Arg Trp Lys Gly Ala Arg Gly Gln115 120 125Glu Pro Ser Glu Thr Leu Gly Arg Gly Asn Pro Thr Ala Leu Gln Leu130 135 140Phe Leu Gln Ile Ser Glu Glu Glu Glu Lys Gly Pro Arg Gly Ala Gly145 150 155 160Ile Ser Gly Arg Ser Gln Glu Gln Ser Val Lys Thr Val Pro Gly Ala165 170 175
Ser Asp Leu Phe Tyr Trp Pro Arg Arg Ala Gly Lys Leu Gln Gly Ser180 185 190His His Lys Pro Leu Ser Lys Thr Ala Asn Gly Leu Ala Gly His Glu195 200 205Gly Trp Thr Ile Ala Leu Pro Gly Arg Ala Leu Ala Gln Asn Gly Ser210 215 220Leu Gly Glu Gly Ile His Glu Pro Gly Gly Pro Arg Arg Gly Asn Ser225 230 235 240Thr Asn Arg Arg Val Arg Leu Lys Asn Pro Phe Tyr Pro Leu Thr Gln245 250 255Glu Ser Tyr Gly Ala Tyr Ala Val Met Cys Leu Ser Val Val Ile Phe260 265 270Gly Thr Gly Ile Ile Gly Asn Leu Ala Val Met Cys Ile Val Cys His275 280 285Asn Tyr Tyr Met Arg Ser Ile Ser Asn Ser Leu Leu Ala Asn Leu Ala290 295 300Phe Trp Asp Phe Leu Ile Ile Phe Phe Cys Leu Pro Leu Val Ile Phe305 310 315 320His Glu Leu Thr Lys Lys Trp Leu Leu Glu Asp Phe Ser Cys Lys Ile325 330 335Val Pro Tyr Ile Glu Val Ala Ser Leu Gly Val Thr Thr Phe Thr Leu340 345 350Cys Ala Leu Cys Ile Asp Arg Phe Arg Ala Ala Thr Asn Val Gln Met355 360 365
Tyr Tyr Glu Met Ile Glu Asn Cys Ser Ser Thr Thr Ala Lys Leu Ala370 375 380Val Ile Trp Val Gly Ala Leu Leu Leu Ala Leu Pro Glu Val Val Leu385 390 395 400Arg Gln Leu Ser Lys Glu Asp Leu Gly Phe Ser Gly Arg Ala Pro Ala405 410 415Glu Arg Cys Ile Ile Lys Ile Ser Pro Asp Leu Pro Asp Thr Ile Tyr420 425 430Val Leu Ala Leu Thr Tyr Asp Ser Ala Arg Leu Trp Trp Tyr Phe Gly435 440 445Cys Tyr Phe Cys Leu Pro Thr Leu Phe Thr Ile Thr Cys Ser Leu Val450 455 460Thr Ala Arg Lys Ile Arg Lys Ala Glu Lys Ala Cys Thr Arg Gly Asn465 470 475 480Lys Arg Gln Ile Gln Leu Glu Ser Gln Met Asn Cys Thr Val Val Ala485 490 495Leu Thr Ile Leu Tyr Gly Phe Cys Ile Ile Pro Glu Asn Ile Cys Asn500 505 510Ile Val Thr Ala Tyr Met Ala Thr Gly Val Ser Gln Gln Thr Met Asp515 520 525Leu Leu Asn Ile Ile Ser Gln Phe Leu Leu Phe Phe Lys Ser Tyr Val530 535 540Thr Pro Val Leu Leu Phe Cys Leu Cys Lys Pro Phe Ser Arg Ala Phe545 550 555 560
Met Glu Cys Cys Cys Cys Cys Cys Glu Glu Cys Ile Gln Lys Ser Ser565 570 575Thr Val Thr Ser Asp Asp Asn Asp Asn Glu Tyr Thr Thr Glu Leu Glu580 585 590Leu Ser Pro Phe Ser Thr Ile Arg Arg Glu Met Ser Thr Phe Ala Ser595 600 605Val Gly Thr His Cys610<210>78<211>1086<212>DNA<213>未知<220>
<223>新序列<400>78atgtcccctg aatgcgcgcg ggcagcgggc gacgcgccct tgcgcagcct ggagcaagcc60aaccgcaccc gctttccctt cttctccgac gtcaagggcg accaccggct ggtgctggcc120gcggtggaga caaccgtgct ggtgctcatc tttgcagtgt cgctgctggg caacgtgtgc180gccctggtgc tggtggcgcg ccgacgacgc cgcggcgcga ctgcctgcct ggtactcaac240ctcttctgcg cggacctgct cttcatcagc gctatccctc tggtgctggc cgtgcgctgg300actgaggcct ggctgctggg ccccgttgcc tgccacctgc tcttctacgt gatgaccctg360agcggcagcg tcaccatcct cacgctggcc gcggtcagcc tggagcgcat ggtgtgcatc420gtgcacctgc agcgcggcgt gcggggtcct gggcggcggg cgcgggcagt gctgctggcg480ctcatctggg gctattcggc ggtcgccgct ctgcctctct gcgtcttctt tcgagtcgtc540ccgcaacggc tccccggcgc cgaccaggaa atttcgattt gcacactgat ttggcccacc600attcctggag agatctcgtg ggatgtctct tttgttactt tgaacttctt ggtgccagga660
ctggtcattg tgatcagtta ctccaaaatt ttacagatca caaaggcatc aaggaagagg720ctcacggtaa gcctggccta ctcggagagc caccagatcc gcgtgtccca gcaggacttc780cggctcttcc gcaccctctt cctcctcatg gtctccttct tcatcatgtg gagccccatc840ttcatcacca tcctcctcat cctgatccag aacttcaagc aagacctggt catctggccg900tccctcttct tctgggtggt ggccttcaca tttgctaatt cagccctaaa ccccatcctc960tacaacatga cactgtgcag gaatgagtgg aagaaaattt tttgctgctt ctggttccca1020gaaaagggag ccattttaac agacacatct gtcaaaagaa atgacttgtc gattatttct1080ggctaa 1086<210>79<211>361<212>PRT<213>未知<220>
<223>新序列<400>79Met Ser Pro Glu Cys Ala Arg Ala Ala Gly Asp Ala Pro Leu Arg Ser1 5 10 15Leu Glu Gln Ala Asn Arg Thr Arg Phe Pro Phe Phe Ser Asp Val Lys20 25 30Gly Asp His Arg Leu Val Leu Ala Ala Val Glu Thr Thr Val Leu Val35 40 45Leu Ile Phe Ala Val Ser Leu Leu Gly Asn Val Cys Ala Leu Val Leu50 55 60Val Ala Arg Arg Arg Arg Arg Gly Ala Thr Ala Cys Leu Val Leu Asn65 70 75 80Leu Phe Cys Ala Asp Leu Leu Phe Ile Ser Ala Ile Pro Leu Val Leu
85 90 95Ala Val Arg Trp Thr Glu Ala Trp Leu Leu Gly Pro Val Ala Cys His100 105 110Leu Leu Phe Tyr Val Met Thr Leu Ser Gly Ser Val Thr Ile Leu Thr115 120 125Leu Ala Ala Val Ser Leu Glu Arg Met Val Cys Ile Val His Leu Gln130 135 140Arg Gly Val Arg Gly Pro Gly Arg Arg Ala Arg Ala Val Leu Leu Ala145 150 155 160Leu Ile Trp Gly Tyr Ser Ala Val Ala Ala Leu Pro Leu Cys Val Phe165 170 175Phe Arg Val Val Pro Gln Arg Leu Pro Gly Ala Asp Gln Glu Ile Ser180 185 190Ile Cys Thr Leu Ile Trp Pro Thr Ile Pro Gly Glu Ile Ser Trp Asp195 200 205Val Ser Phe Val Thr Leu Asn Phe Leu Val Pro Gly Leu Val Ile Val210 215 220Ile Ser Tyr Ser Lys Ile Leu Gln Ile Thr Lys Ala Ser Arg Lys Arg225 230 235 240Leu Thr Val Ser Leu Ala Tyr Ser Glu Ser His Gln Ile Arg Val Ser245 250 255Gln Gln Asp Phe Arg Leu Phe Arg Thr Leu Phe Leu Leu Met Val Ser260 265 270Phe Phe Ile Met Trp Ser Pro Ile Phe Ile Thr Ile Leu Leu Ile Leu
275 280 285Ile Gln Asn Phe Lys Gln Asp Leu Val Ile Trp Pro Ser Leu Phe Phe290 295 300Trp Val Val Ala Phe Thr Phe Ala Asn Ser Ala Leu Asn Pro Ile Leu305 310 315 320Tyr Asn Met Thr Leu Cys Arg Asn Glu Trp Lys Lys Ile Phe Cys Cys325 330 335Phe Trp Phe Pro Glu Lys Gly Ala Ile Leu Thr Asp Thr Ser Val Lys340 345 350Arg Asn Asp Leu Ser Ile Ile Ser Gly355 360<210>80<211>1086<212>DNA<213>未知<220>
<223>新序列<400>80atgtcccctg aatgcgcgcg ggcagcgggc gacgcgccct tgcgcagcct ggagcaagcc60aaccgcaccc gctttccctt cttctccgac gtcaagggcg accaccggct ggtgctggcc120gcggtggaga caaccgtgct ggtgctcatc tttgcagtgt cgctgctggg caacgtgtgc180gccctggtgc tggtggcgcg ccgacgacgc cgcggcgcga ctgcctgcct ggtactcaac240ctcttctgcg cggacctgct cttcatcagc gctatccctc tggtgctggc cgtgcgctgg300actgaggcct ggctgctggg ccccgttgcc tgccacctgc tcttctacgt gatgaccctg360agcggcagcg tcaccatcct cacgctggcc gcggtcagcc tgaatcgcat ggtgtgcatc420gtgcacctgc agcgcggcgt gcggggtcct gggcggcggg cgcgggcagt gctgctggcg480
ctcatctggg gctattcggc ggtcgccgct ctgcctctct gcgtcttctt tcgagtcgtc540ccgcaacggc tccccggcgc cgaccaggaa atttcgattt gcacactgat ttggcccacc600attcctggag agatctcgtg ggatgtctct tttgttactt tgaacttctt ggtgccagga660ctggtcattg tgatcagtta ctccaaaatt ttacagatca caaaggcatc aaggaagagg720ctcacggtaa gcctggccta ctcggagagc caccagatcc gcgtgtccca gcaggacttc780cggctcttcc gcaccctctt cctcctcatg gtctccttct tcatcatgtg gagccccatc840atcatcacca tcctcctcat cctgatccag aacttcaagc aagacctggt catctggccg900tccctcttct tctgggtggt ggccttcaca tttgctaatt cagccctaaa ccccatcctc960tacaacatga cactgtgcag gaatgagtgg aagaaaattt tttgctgctt ctggttccca1020gaaaagggag ccattttaac agacacatct gtcaaaagaa atgacttgtc gattatttct1080ggctaa 1086<210>81<211>361<212>PRT<213>未知<220>
<223>新序列<400>81Met Ser Pro Glu Cys Ala Arg Ala Ala Gly Asp Ala Pro Leu Arg Ser1 5 10 15Leu Glu Gln Ala Asn Arg Thr Arg Phe Pro Phe Phe Ser Asp Val Lys20 25 30Gly Asp His Arg Leu Val Leu Ala Ala Val Glu Thr Thr Val Leu Val35 40 45Leu Ile Phe Ala Val Ser Leu Leu Gly Asn Val Cys Ala Leu Val Leu50 55 60
Val Ala Arg Arg Arg Arg Arg Gly Ala Thr Ala Cys Leu Val Leu Asn65 70 75 80Leu Phe Cys Ala Asp Leu Leu Phe Ile Ser Ala Ile Pro Leu Val Leu85 90 95Ala Val Arg Trp Thr Glu Ala Trp Leu Leu Gly Pro Val Ala Cys His100 105 110Leu Leu Phe Tyr Val Met Thr Leu Ser Gly Ser Val Thr Ile Leu Thr115 120 125Leu Ala Ala Val Ser Leu Asn Arg Met Val Cys Ile Val His Leu Gln130 135 140Arg Gly Val Arg Gly Pro Gly Arg Arg Ala Arg Ala Val Leu Leu Ala145 150 155 160Leu Ile Trp Gly Tyr Ser Ala Val Ala Ala Leu Pro Leu Cys Val Phe165 170 175Phe Arg Val Val Pro Gln Arg Leu Pro Gly Ala Asp Gln Glu Ile Ser180 185 190Ile Cys Thr Leu Ile Trp Pro Thr Ile Pro Gly Glu Ile Ser Trp Asp195 200 205Val Ser Phe Val Thr Leu Asn Phe Leu Val Pro Gly Leu Val Ile Val210 215 220Ile Ser Tyr Ser Lys Ile Leu Gln Ile Thr Lys Ala Ser Arg Lys Arg225 230 235 240Leu Thr Val Ser Leu Ala Tyr Ser Glu Ser His Gln Ile Arg Val Ser245 250 255
Gln Gln Asp Phe Arg Leu Phe Arg Thr Leu Phe Leu Leu Met Val Ser260 265 270Phe Phe Ile Met Trp Ser Pro Ile Ile Ile Thr Ile Leu Leu Ile Leu275 280 285Ile Gln Asn Phe Lys Gln Asp Leu Val Ile Trp Pro Ser Leu Phe Phe290 295 300Trp Val Val Ala Phe Thr Phe Ala Asn Ser Ala Leu Asn Pro Ile Leu305 310 315 320Tyr Asn Met Thr Leu Cys Arg Asn Glu Trp Lys Lys Ile Phe Cys Cys325 330 335Phe Trp Phe Pro Glu Lys Gly Ala Ile Leu Thr Asp Thr Ser Val Lys340 345 350Arg Asn Asp Leu Ser Ile Ile Ser Gly355 360<210>82<211>1212<212>DNA<213>未知<220>
<223>新序列<400>82atggcttgca atggcagtgc ggccaggggg cactttgacc ctgaggactt gaacctgact60gacgaggcac tgagactcaa gtacctgggg ccccagcaga cagagctgtt catgcccatc120tgtgccacat acctgctgat cttcgtggtg ggcgctgtgg gcaatgggct gacctgtctg180gtcatcctgc gccacaaggc catgcgcacg cctaccaact actacctctt cagcctggcc240gtgtcggacc tgctggtgct gctggtgggc ctgcccctgg agctctatga gatgtggcac300
aactacccct tcctgctggg cgttggtggc tgctatttcc gcacgctact gtttgagatg360gtctgcctgg cctcagtgct caacgtcact gccctgagcg tggaacgcta tgtggccgtg420gtgcacccac tccaggccag gtccatggtg acgcgggccc atgtgcgccg agtgcttggg480gccgtctggg gtcttgccat gctctgctcc ctgcccaaca ccagcctgca cggcatccgg540cagctgcacg tgccctgccg gggcccagtg ccagactcag ctgtttgcat gctggtccgc600ccacgggccc tctacaacat ggtagtgcag accaccgcgc tgctcttctt ctgcctgccc660atggccatca tgagcgtgct ctacctgctc attgggctgc gactgcggcg ggagaggctg720ctgctcatgc aggaggccaa gggcaggggc tctgcagcag ccaggtccag atacacctgc780aggctccagc agcacgatcg gggccggaga caagtgaaaa agatgctgtt tgtcctggtc840gtggtgtttg gcatctgctg ggccccgttc cacgccgacc gcgtcatgtg gagcgtcgtg900tcacagtgga cagatggcct gcacctggcc ttccagcacg tgcacgtcat ctccggcatc960ttcttctacc tgggctcggc ggccaacccc gtgctctata gcctcatgtc cagccgcttc1020cgagagacct tccaggaggc cctgtgcctc ggggcctgct gccatcgcct cagaccccgc1080cacagctccc acagcctcag caggatgacc acaggcagca ccctgtgtga tgtgggctcc1140ctgggcagct gggtccaccc cctggctggg aacgatggcc cagaggcgca gcaagagacc1200gatccatcct ga1212<210>83<211>403<212>PRT<213>未知<220>
<223>新序列<400>83Met Ala Cys Asn Gly Ser Ala Ala Arg Gly His Phe Asp Pro Glu Asp1 5 10 15Leu Asn Leu Thr Asp Glu Ala Leu Arg Leu Lys Tyr Leu Gly Pro Gln
20 25 30Gln Thr Glu Leu Phe Met Pro Ile Cys Ala Thr Tyr Leu Leu Ile Phe35 40 45Val Val Gly Ala Val Gly Asn Gly Leu Thr Cys Leu Val Ile Leu Arg50 55 60His Lys Ala Met Arg Thr Pro Thr Asn Tyr Tyr Leu Phe Ser Leu Ala65 70 75 80Val Ser Asp Leu Leu Val Leu Leu Val Gly Leu Pro Leu Glu Leu Tyr85 90 95Glu Met Trp His Asn Tyr Pro Phe Leu Leu Gly Val Gly Gly Cys Tyr100 105 110Phe Arg Thr Leu Leu Phe Glu Met Val Cys Leu Ala Ser Val Leu Asn115 120 125Val Thr Ala Leu Ser Val Glu Arg Tyr Val Ala Val Val His Pro Leu130 135 140Gln Ala Arg Ser Met Val Thr Arg Ala His Val Arg Arg Val Leu Gly145 150 155 160Ala Val Trp Gly Leu Ala Met Leu Cys Ser Leu Pro Asn Thr Ser Leu165 170 175His Gly Ile Arg Gln Leu His Val Pro Cys Arg Gly Pro Val Pro Asp180 185 190Ser Ala Val Cys Met Leu Val Arg Pro Arg Ala Leu Tyr Asn Met Val195 200 205Val Gln Thr Thr Ala Leu Leu Phe Phe Cys Leu Pro Met Ala Ile Met
210 215 220Ser Val Leu Tyr Leu Leu Ile Gly Leu Arg Leu Arg Arg Glu Arg Leu225 230 235 240Leu Leu Met Gln Glu Ala Lys Gly Arg Gly Ser Ala Ala Ala Arg Ser245 250 255Arg Tyr Thr Cys Arg Leu Gln Gln His Asp Arg Gly Arg Arg Gln Val260 265 270Lys Lys Met Leu Phe Val Leu Val Val Val Phe Gly Ile Cys Trp Ala275 280 285Pro Phe His Ala Asp Arg Val Met Trp Ser Val Val Ser Gln Trp Thr290 295 300Asp Gly Leu His Leu Ala Phe Gln His Val His Val Ile Ser Gly Ile305 310 315 320Phe Phe Tyr Leu Gly Ser Ala Ala Asn Pro Val Leu Tyr Ser Leu Met325 330 335Ser Ser Arg Phe Arg Glu Thr Phe Gln Glu Ala Leu Cys Leu Gly Ala340 345 350Cys Cys His Arg Leu Arg Pro Arg His Ser Ser His Ser Leu Ser Arg355 360 365Met Thr Thr Gly Ser Thr Leu Cys Asp Val Gly Ser Leu Gly Ser Trp370 375 380Val His Pro Leu Ala Gly Asn Asp Gly Pro Glu Ala Gln Gln Glu Thr385 390 395 400Asp Pro Ser
<210>84<211>930<212>DNA<213>未知<220>
<223>新序列<400>84atgaatggea cctacaacac ctgtggctcc agcgacctca cctggccccc agcgatcaag60ctgggcttet acgcctactt gggcgtcctg ctggtgctag gcctgctgct caacagcctg120gcgctctggg tgttctgctg ccgcatgcag cagtggacgg agacccgcat ctacatgacc180aacctggcgg tggccgacct ctgcctgctg tgcaccttgc ccttcgtgct gcactccctg240cgagacacct cagacacgcc gctgtgccag ctctcccagg gcatctacct gaccaacagg300tacatgagca tcagcctggt cacggccatc gccgtggacc gctatgtggc cgtgcggcac360ccgctgcgtg cccgcgggct gcggtccccc aggcaggctg cggccgtgtg cgcggtcctc420tgggtgctgg tcatcggctc cctggtggct cgctggctcc tggggattca ggagggcggc480ttctgcttca ggagcacccg gcacaatttc aactccatgc ggttcccgct gctgggattc540tacctgcccc tggccgtggt ggtcttctgc tccctgaagg tggtgactgc cctggcccag600aggccaccca ccgacgtggg gcaggcagag gccacccgca aggctaaacg catggtctgg660gccaacctcc tggtgttcgt ggtctgcttc ctgcccctgc acgtggggct gacagtgcgc720ctcgcagtgg gctggaacgc ctgtgccctc ctggagacga tccgtcgcgc cctgtacata780accagcaagc tctcagatgc caactgctgc ctggacgcca tctgctacta ctacatggcc840aaggagttcc aggaggcgtc tgcactggcc gtggctcccc gtgctaaggc ccacaaaagc900caggactctc tgtgcgtgac cctcgcctaa 930<210>85<211>309<212>PRT
<213>未知<220>
<223>新序列<400>85Met Asn Gly Thr Tyr Asn Thr Cys Gly Ser Ser Asp Leu Thr Trp Pro1 5 10 15Pro Ala Ile Lys Leu Gly Phe Tyr Ala Tyr Leu Gly Val Leu Leu Val20 25 30Leu Gly Leu Leu Leu Asn Ser Leu Ala Leu Trp Val Phe Cys Cys Arg35 40 45Met Gln Gln Trp Thr Glu Thr Arg Ile Tyr Met Thr Asn Leu Ala Val50 55 60Ala Asp Leu Cys Leu Leu Cys Thr Leu Pro Phe Val Leu His Ser Leu65 70 75 80Arg Asp Thr Ser Asp Thr Pro Leu Cys Gln Leu Ser Gln Gly Ile Tyr85 90 95Leu Thr Asn Arg Tyr Met Ser Ile Ser Leu Val Thr Ala Ile Ala Val100 105 110Asp Arg Tyr Val Ala Val Arg His Pro Leu Arg Ala Arg Gly Leu Arg115 120 125Ser Pro Arg Gln Ala Ala Ala Val Cys Ala Val Leu Trp Val Leu Val130 135 140Ile Gly Ser Leu Val Ala Arg Trp Leu Leu Gly Ile Gln Glu Gly Gly145 150 155 160Phe Cys Phe Arg Ser Thr Arg His Asn Phe Asn Ser Met Arg Phe Pro
165 170 175Leu Leu Gly Phe Tyr Leu Pro Leu Ala Val Val Val Phe Cys Ser Leu180 185 190Lys Val Val Thr Ala Leu Ala Gln Arg Pro Pro Thr Asp Val Gly Gln195 200 205Ala Glu Ala Thr Arg Lys Ala Lys Arg Met Val Trp Ala Asn Leu Leu210 215 220Val Phe Val Val Cys Phe Leu Pro Leu His Val Gly Leu Thr Val Arg225 230 235 240Leu Ala Val Gly Trp Asn Ala Cys Ala Leu Leu Glu Thr Ile Arg Arg245 250 255Ala Leu Tyr Ile Thr Ser Lys Leu Ser Asp Ala Asn Cys Cys Leu Asp260 265 270Ala Ile Cys Tyr Tyr Tyr Met Ala Lys Glu Phe Gln Glu Ala Ser Ala275 280 285Leu Ala Val Ala Pro Arg Ala Lys Ala His Lys Ser Gln Asp Ser Leu290 295 300Cys Val Thr Leu Ala305<210>86<211>1446<212>DNA<213>未知<220>
<223>新序列<400>86
atgcggtggc tgtggcccct ggctgtctct cttgctgtga ttttggctgt ggggctaagc60agggtctctg ggggtgcccc cctgcacctg ggcaggcaca gagccgagac ccaggagcag120cagagccgat ccaagagggg caccgaggat gaggaggcca agggcgtgca gcagtatgtg180cctgaggagt gggcggagta cccccggccc attcaccctg ctggcctgca gccaaccaag240cccttggtgg ccaccagccc taaccccgac aaggatgggg gcaccccaga cagtgggcag300gaactgaggg gcaatctgac aggggcacca gggcagaggc tacagatcca gaaccccctg360tatccggtga ccgagagctc ctacagtgcc tatgccatca tgcttctggc gctggtggtg420tttgcggtgg gcattgtggg caacctgtcg gtcatgtgca tcgtgtggca cagctactac480ctgaagagcg cctggaactc catccttgcc agcctggccc tctgggattt tctggtcctc540tttttctgcc tccctattgt catcttcaac gagatcacca agcagaggct actgggtgac600gtttcttgtc gtgccgtgcc cttcatggag gtctcctctc tgggagtcac gactttcagc660ctctgtgccc tgggcattga ccgcttccac gtggccacca gcaccctgcc caaggtgagg720cccatcgagc ggtgccaatc catcctggcc aagttggctg tcatctgggt gggctccatg780acgctggctg tgcctgagct cctgctgtgg cagctggcac aggagcctgc ccccaccatg840ggcaccctgg actcatgcat catgaaaccc tcagccagcc tgcccgagtc cctgtattca900ctggtgatga cctaccagaa cgcccgcatg tggtggtact ttggctgcta cttctgcctg960cccatcctct tcacagtcac ctgccagctg gtgacatggc gggtgcgagg ccctccaggg1020aggaagtcag agtgcagggc cagcaagcac gagcagtgtg agagccagct caagagcacc1080gtggtgggcc tgaccgtggt ctacgccttc tgcaccctcc cagagaacgt ctgcaacatc1140gtggtggcct acctctccac cgagctgacc cgccagaccc tggacctcct gggcctcatc1200aaccagttct ccaccttctt caagggcgcc atcaccccag tgctgctcct ttgcatctgc1260aggccgctgg gccaggcctt cctggactgc tgctgctgct gctgctgtga ggagtgcggc1320ggggcttcgg aggcctctgc tgccaatggg tcggacaaca agctcaagac cgaggtgtcc1380tcttccatct acttccacaa gcccagggag tcacccccac tcctgcccct gggcacacct1440
tgctga 1446<210>87<211>481<212>PRT<213>未知<220>
<223>新序列<400>87Met Arg Trp Leu Trp Pro Leu Ala Val Ser Leu Ala Val Ile Leu Ala1 5 10 15Val Gly Leu Ser Arg Val Ser Gly Gly Ala Pro Leu His Leu Gly Arg20 25 30His Arg Ala Glu Thr Gln Glu Gln Gln Ser Arg Ser Lys Arg Gly Thr35 40 45Glu Asp Glu Glu Ala Lys Gly Val Gln Gln Tyr Val Pro Glu Glu Trp50 55 60Ala Glu Tyr Pro Arg Pro Ile His Pro Ala Gly Leu Gln Pro Thr Lys65 70 75 80Pro Leu Val Ala Thr Ser Pro Asn Pro Asp Lys Asp Gly Gly Thr Pro85 90 95Asp Ser Gly Gln Glu Leu Arg Gly Asn Leu Thr Gly Ala Pro Gly Gln100 105 110Arg Leu Gln Ile Gln Asn Pro Leu Tyr Pro Val Thr Glu Ser Ser Tyr115 120 125Ser Ala Tyr Ala Ile Met Leu Leu Ala Leu Val Val Phe Ala Val Gly130 135 140
Ile Val Gly Asn Leu Ser Val Met Cys Ile Val Trp His Ser Tyr Tyr145 150 155 160Leu Lys Ser Ala Trp Asn Ser Ile Leu Ala Ser Leu Ala Leu Trp Asp165 170 175Phe Leu Val Leu Phe Phe Cys Leu Pro Ile Val Ile Phe Asn Glu Ile180 185 190Thr Lys Gln Arg Leu Leu Gly Asp Val Ser Cys Arg Ala Val Pro Phe195 200 205Met Glu Val Ser Ser Leu Gly Val Thr Thr Phe Ser Leu Cys Ala Leu210 215 220Gly Ile Asp Arg Phe His Val Ala Thr Ser Thr Leu Pro Lys Val Arg225 230 235 240Pro Ile Glu Arg Cys Gln Ser Ile Leu Ala Lys Leu Ala Val Ile Trp245 250 255Val Gly Ser Met Thr Leu Ala Val Pro Glu Leu Leu Leu Trp Gln Leu260 265 270Ala Gln Glu Pro Ala Pro Thr Met Gly Thr Leu Asp Ser Cys Ile Met275 280 285Lys Pro Ser Ala Ser Leu Pro Glu Ser Leu Tyr Ser Leu Val Met Thr290 295 300Tyr Gln Asn Ala Arg Met Trp Trp Tyr Phe Gly Cys Tyr Phe Cys Leu305 310 315 320Pro Ile Leu Phe Thr Val Thr Cys Gln Leu Val Thr Trp Arg Val Arg325 330 335
Gly Pro Pro Gly Arg Lys Ser Glu Cys Arg Ala Ser Lys His Glu Gln340 345 350Cys Glu Ser Gln Leu Lys Ser Thr Val Val Gly Leu Thr Val Val Tyr355 360 365Ala Phe Cys Thr Leu Pro Glu Asn Val Cys Asn Ile Val Val Ala Tyr370 375 380Leu Ser Thr Glu Leu Thr Arg Gln Thr Leu Asp Leu Leu Gly Leu Ile385 390 395 400Asn Gln Phe Ser Thr Phe Phe Lys Gly Ala Ile Thr Pro Val Leu Leu405 410 415Leu Cys Ile Cys Arg Pro Leu Gly Gln Ala Phe Leu Asp Cys Cys Cys420 425 430Cys Cys Cys Cys Glu Glu Cys Gly Gly Ala Ser Glu Ala Ser Ala Ala435 440 445Asn Gly Ser Asp Asn Lys Leu Lys Thr Glu Val Ser Ser Ser Ile Tyr450 455 460Phe His Lys Pro Arg Glu Ser Pro Pro Leu Leu Pro Leu Gly Thr Pro465 470 475 480Cys<210>88<211>6<212>PRT<213>未知<220>
<223>新序列
<400>88Thr Leu Glu Ser Ile Met1 5<210>89<211>5<212>PRT<213>未知<220>
<223>新序列<400>89Glu Tyr Asn Leu Val1 5<210>90<211>5<212>PRT<213>未知<220>
<223>新序列<400>90Asp Cys Gly Leu Phe1 5<210>91<211>34<212>DNA<213>未知<220>
<223>新序列<400>91gatcaagctt ccatggcgtg ctgcctgagc gagg 34<210>92
<211>53<212>DNA<213>未知<220>
<223>新序列<400>92gatcggatcc ttagaacagg ccgcagtcct tcaggttcag ctgcaggatg gtg 53<210>93<211>5<212>PRT<213>未知<220>
<223>新序列<400>93Gln Tyr Glu Leu Leu1 5<210>94<211>5<212>PRT<213>未知<220>
<223>新序列<400>94Asp Cys Gly Leu Phe1 5<210>95<211>1185<212>DNA<213>未知<220>
<223>新序列<400>95
atgggctgcc tcggcaacag taagaccgag gaccagcgca acgaggagaa ggcgcagcgc60gaggccaaca aaaagatcga gaagcagctg cagaaggaca agcaggtcta ccgggccacg120caccgcctgc tgctgctggg tgctggagag tctggcaaaa gcaccattgt gaagcagatg180aggatcctac atgttaatgg gtttaacgga gagggcggcg aagaggaccc gcaggctgca240aggagcaaca gcgatggtga gaaggccacc aaagtgcagg acatcaaaaa caacctgaag300gaggccattg aaaccattgt ggccgccatg agcaacctgg tgccccccgt ggagctggcc360aaccctgaga accagttcag agtggactac attctgagcg tgatgaacgt gccaaacttt420gacttcccac ctgaattcta tgagcatgcc aaggctctgt gggaggatga gggagttcgt480gcctgctacg agcgctccaa cgagtaccag ctgatcgact gtgcccagta cttcctggac540aagattgatg tgatcaagca ggccgactac gtgccaagtg accaggacct gcttcgctgc600cgcgtcctga cctctggaat ctttgagacc aagttccagg tggacaaagt caacttccac660atgttcgatg tgggcggcca gcgcgatgaa cgccgcaagt ggatccagtg cttcaatgat720gtgactgcca tcatcttcgt ggtggccagc agcagctaca acatggtcat ccgggaggac780aaccagacca accgtctgca ggaggctctg aacctcttca agagcatctg gaacaacaga840tggctgcgta ccatctctgt gatcctcttc ctcaacaagc aagatctgct tgctgagaag900gtcctcgctg ggaaatcgaa gattgaggac tactttccag agttcgctcg ctacaccact960cctgaggatg cgactcccga gcccggagag gacccacgcg tgacccgggc caagtacttc1020atccgggatg agtttctgag aatcagcact gctagtggag atggacgtca ctactgctac1080cctcacttta cctgcgccgt ggacactgag aacatccgcc gtgtcttcaa cgactgccgt1140gacatcatcc agcgcatgca tcttcgcgac tgcgggctgt tttaa1185<210>96<211>393<212>PRT<213>未知<220>
<223>新序列
<400> 96Met Gly Cys Leu Gly Asn Ser Lys Thr Glu Asp Gln Arg Asn Glu Glu1 5 10 15Lys Ala Gln Arg Glu Ala Asn Lys Lys Ile Glu Lys Gln Leu Gln Lys20 25 30Asp Lys Gln Val Tyr Arg Ala Thr His Arg Leu Leu Leu Leu Gly Ala35 40 45Gly Glu Ser Gly Lys Ser Thr Ile Val Lys Gln Met Arg Ile Leu His50 55 60Val Asn Gly Phe Asn Gly Glu Gly Gly Glu Glu Asp Pro Gln Ala Ala65 70 75 80Arg Ser Asn Ser Asp Gly Glu Lys Ala Thr Lys Val Gln Asp Ile Lys85 90 95Asn Asn Leu Lys Glu Ala Ile Glu Thr Ile Val Ala Ala Ser Asn Leu100 105 110Val Pro Pro Val Glu Leu Ala Asn Pro Glu Asn Gln Phe Arg Val Asp115 120 125Tyr Ile Leu Ser Val Met Asn Val Pro Asn Phe Asp Phe Pro Pro Glu130 135 140Phe Tyr Glu His Ala Lys Ala Leu Trp Glu Asp Glu Gly Val Arg Ala145 150 155 160Cys Tyr Glu Arg Ser Asn Glu Tyr Gln Leu Ile Asp Cys Ala Gln Tyr165 170 175Phe Leu Asp Lys Ile Asp Val Ile Lys Gln Ala Asp Tyr Val Pro Ser
180 185 190Asp Gln Asp Leu Leu Arg Cys Arg Val Leu Thr Ser Gly Ile Phe Glu195 200 205Thr Lys Phe Gln Val Asp Lys Val Asn Phe His Met Phe Asp Val Gly210 215 220Gly Gln Arg Asp Glu Arg Arg Lys Trp Ile Gln Cys Phe Asn Asp Val225 230 235 240Thr Ala Ile Ile Phe Val Val Ala Ser Ser Ser Tyr Asn Met Val Ile245 250 255Arg Glu Asp Asn Gln Thr Asn Arg Leu Gln Glu Ala Leu Asn Leu Phe260 265 270Lys Ser Ile Trp Asn Asn Arg Trp Leu Arg Thr Ile Ser Val Ile Leu275 280 285Phe Leu Asn Lys Gln Asp Leu Leu Ala Glu Lys Val Leu Ala Gly Lys290 295 300Ser Lys Ile Glu Asp Tyr Phe Pro Glu Phe Ala Arg Tyr Thr Thr Pro305 310 315 320Glu Asp Ala Thr Pro Glu Pro Gly Glu Asp Pro Arg Val Thr Arg Ala325 330 335Lys Tyr Phe Ile Arg Asp Glu Phe Leu Arg Ile Ser Thr Ala Ser Gly340 345 350Asp Gly Arg His Tyr Cys Tyr Pro His Phe Thr Cys Ala Val Asp Thr355 360 365Glu Asn Ile Arg Arg Val Phe Asn Asp Cys Arg Asp Ile Ile Gln Arg
370 375380Met His Leu Arg Asp Cys Gly Leu Phe385 390<210>97<211>1014<212>DNA<213>人<400>97atgaactcgt gggacgcggg cctggcgggg ctactggtgg gcacgatggg cgtctcgctg60ctgtccaacg cgctggtgct gctctgcctg ctgcacagcg cggacatccg ccgccaggcg120ccggcgctct tcaccctgaa cctcacgtgc gggaacctgc tgtgcaccgt ggtcaacatg180ccgctcacgc tggccggcgt cgtggcgcag cggcagccgg cgggcgaccg cctgtgccgc240ctggctgcct tcctcgacac cttcctggct gccaactcca tgctcagcat ggccgcgctc300agcatcgacc gctgggtggc cgtggtcttc ccgctgagct accgggccaa gatgccgcct360ccgagatgcg cgctcatcct ggcctacacg tggctgcacg cgctcacctt cccagccgcc420gcgctcgccc tgtcctggct cggcttccac cagctgtacg cctcgtgcac gctgtgcagc480cggcggccgg acgagcgcct gcgcttcgcc gtattcactg gcgccttcca cgctctcagc540ttcctgctct ccttcgtcgt gctctgctgc acgtacctca aggtgctcaa ggtggcccgc600ttccattgca agcgcatcga cgtgatcacc atgcagacgc tcgtgctgct ggtggacctg660caccccagtg tgcgggaacg ctgtctggag gagcagaagc ggaggcgaca gcgagccacc720aagaagatca gcaccttcat agggaccttc cttgtgtgct tcgcgcccta tgtgatcacc780aggctagtgg agctcttctc cacggtgccc atcggctccc actggggggt gctgtccaag840tgcttggcgt acagcaaggc cgcatccgac ccctttgtgt actccttact gcgacaccag900taccgcaaaa gctgcaagga gattctgaac aggctcctgc acagacgctc catccactcc960tctggcctca caggcgactc tcacagccag aacattctgc cggtgtctga gtga 1014
<210>98<211>337<212>PRT<213>人<400>98Met Asn Ser Trp Asp Ala Gly Leu Ala Gly Leu Leu Val Gly Thr Met1 5 10 15Gly Val Ser Leu Leu Ser Asn Ala Leu Val Leu Leu Cys Leu Leu His20 25 30Ser Ala Asp Ile Arg Arg Gln Ala Pro Ala Leu Phe Thr Leu Asn Leu35 40 45Thr Cys Gly Asn Leu Leu Cys Thr Val Val Asn Met Pro Leu Thr Leu50 55 60Ala Gly Val Val Ala Gln Arg Gln Pro Ala Gly Asp Arg Leu Cys Arg65 70 75 80Leu Ala Ala Phe Leu Asp Thr Phe Leu Ala Ala Asn Ser Met Leu Ser85 90 95Met Ala Ala Leu Ser Ile Asp Arg Trp Val Ala Val Val Phe Pro Leu100 105 110Ser Tyr Arg Ala Lys Met Pro Pro Pro Arg Cys Ala Leu Ile Leu Ala115 120 125Tyr Thr Trp Leu His Ala Leu Thr Phe Pro Ala Ala Ala Leu Ala Leu130 135 140Ser Trp Leu Gly Phe His Gln Leu Tyr Ala Ser Cys Thr Leu Cys Ser145 150 155 160Arg Arg Pro Asp Glu Arg Leu Arg Phe Ala Val Phe Thr Gly Ala Phe
165 170 175His Ala Leu Ser Phe Leu Leu Ser Phe Val Val Leu Cys Cys Thr Tyr180 185 190Leu Lys Val Leu Lys Val Ala Arg Phe His Cys Lys Arg Ile Asp Val195 200 205Ile Thr Met Gln Thr Leu Val Leu Leu Val Asp Leu His Pro Ser Val210 215 220Arg Glu Arg Cys Leu Glu Glu Gln Lys Arg Arg Arg Gln Arg Ala Thr225 230 235 240Lys Lys Ile Ser Thr Phe Ile Gly Thr Phe Leu Val Cys Phe Ala Pro245 250 255Tyr Val Ile Thr Arg Leu Val Glu Leu Phe Ser Thr Val Pro Ile Gly260 265 270Ser His Trp Gly Val Leu Ser Lys Cys Leu Ala Tyr Ser Lys Ala Ala275 280 285Ser Asp Pro Phe Val Tyr Ser Leu Leu Arg His Gln Tyr Arg Lys Ser290 295 300Cys Lys Glu Ile Leu Asn Arg Leu Leu His Arg Arg Ser Ile His Ser305 310 315 320Ser Gly Leu Thr Gly Asp Ser His Ser Gln Asn Ile Leu Pro Val Ser325 330 335Glu<210>99
<211>21<212>DNA<213>未知<220>
<223>新序列<400>99cgagaaggtg ctcaaggtgg c 21<210>100<211>30<212>DNA<213>未知<220>
<223>新序列<400>100gagaagagct ccactagcct ggtgatcaca30<210>101<211>36<212>DNA<213>未知<220>
<223>新序列<400>101gaattcatga actcgtggga cgcgggcctg gcgggc 36<210>102<211>32<212>DNA<213>未知<220>
<223>新序列<400>102ctcgagtcac tcagacaccg gcagaatgtt ct 3权利要求
1.一种由SEQ ID NO.2的氨基酸序列编码的G蛋白偶联受体。
2.权利要求1所述的G蛋白偶联受体的非内源性组成型活化形式。
3.一种含有载体和SEQ ID NO.1的cDNA的质粒。
4.一种含有权利要求3所述质粒的宿主细胞。
5.一种由SEQ ID NO.4的氨基酸序列编码的G蛋白偶联受体。
6.权利要求5所述的G蛋白偶联受体的非内源性组成型活化形式。
7.一种含有载体和SEQ ID NO.3的cDNA的质粒。
8.一种含有权利要求7所述质粒的宿主细胞。
9.一种由SEQ ID NO.6的氨基酸序列编码的G蛋白偶联受体。
10.权利要求9所述的G蛋白偶联受体的非内源性组成型活化形式。
11.一种含有载体和SEQ ID NO.5的cDNA的质粒。
12.一种含有权利要求11所述质粒的宿主细胞。
13.一种由SEQ ID NO.8的氨基酸序列编码的G蛋白偶联受体。
14.权利要求13所述的G蛋白偶联受体的非内源性组成型活化形式。
15.一种含有载体和SEQ ID NO.7的cDNA的质粒。
16.一种含有权利要求15所述质粒的宿主细胞。
17.一种由SEQ ID NO.10的氨基酸序列编码的G蛋白偶联受体。
18.权利要求17所述的G蛋白偶联受体的非内源性组成型活化形式。
19.一种含有载体和SEQ ID NO.9的cDNA的质粒。
20.一种含有权利要求19所述质粒的宿主细胞。
21.一种由SEQ ID NO.12的氨基酸序列编码的G蛋白偶联受体。
22.权利要求21所述的G蛋白偶联受体的非内源性组成型活化形式。
23.一种含有载体和SEQ ID NO.11的cDNA的质粒。
24.一种含有权利要求23所述质粒的宿主细胞。
25.一种由SEQ ID NO.14的氨基酸序列编码的G蛋白偶联受体。
26.权利要求25所述的G蛋白偶联受体的非内源性组成型活化形式。
27.一种含有载体和SEQ ID NO.13的cDNA的质粒。
28.一种含有权利要求27所述质粒的宿主细胞。
29.一种由SEQ ID NO.16的氨基酸序列编码的G蛋白偶联受体。
30.权利要求29所述的G蛋白偶联受体的非内源性组成型活化形式。
31.一种含有载体和SEQ ID NO.15的cDNA的质粒。
32.一种含有权利要求31所述质粒的宿主细胞。
33.一种由SEQ ID NO.18的氨基酸序列编码的G蛋白偶联受体。
34.权利要求33所述的G蛋白偶联受体的非内源性组成型活化形式。
35.一种含有载体和SEQ ID NO.17的cDNA的质粒。
36.一种含有权利要求35所述质粒的宿主细胞。
全文摘要
本专利文件公开的发明涉及具有显著活性的跨膜受体,更具体而言,涉及人G蛋白偶联受体和人GPCR的突变(非内源性)形式。
文档编号C12N15/09GK1516706SQ02808787
公开日2004年7月28日 申请日期2002年2月26日 优先权日2001年2月26日
发明者廖王蓁, D·T·查尔默斯, D·P·贝汉, D·马切耶夫斯基-莱尼奥尔, J·N·莱昂纳德, 林伊玲, D·奥尔图诺, 寂, 幸 蛩够 莱尼奥尔, 查尔默斯, 莱昂纳德, 贝汉 申请人:阿伦纳药品公司

最新回复(0)