用于测量生物标记概况的系统和方法

xiaoxiao2020-7-22  9

专利名称:用于测量生物标记概况的系统和方法
用于测量生物标记概况的系统和方法本申请含有2009年8月25日创建、大小148,658字节、以电子形式作为文件名 71021-W0-PCT_SequenceListing_ST25. txt提交的序列表。序列表在此整体引入作为参考。
1发明领域本发明提供了通过概况分析且比较相对于患病受试者的在对照受试者中基因的 mRNA表达水平,鉴定在患有病症的受试者中的转录概况的方法和组合物。本发明进一步提供了通过测定与此类受试者中的生物标记相关的转录概况,用于预测和诊断受试者中的病症例如情感障碍的方法和组合物。背景技术
本申请自始至终通过在括号内引用提及各种出版物。这些出版物的公开内容整体在此引入本申请内作为参考,以便更全面地描述本发明所属领域状态。目前精神病诊断分类,特别是用于情感障碍的那些,缺乏独特的临床描述,并且不包括生物学特征以描绘一种诊断实体与另一种。尽管今天的分类法允许进一步指定情感障碍例如主要性抑郁障碍的临床特征,但标准仍是主要讨论的问题且不一定遵循生物学原理 (Parker,等人 Am. J. Psychiatry 2000,157(8) :1195-1203)。在情感障碍中,存在许多临床分割,例如双相型障碍I和II、精神抑郁症和主要性抑郁障碍,包括精神病性抑郁症、重度与轻度或中度抑郁症比较、忧郁症与非典型抑郁症比较等。像这样,对于这些分割没有描述独特的生物学标记或生物标记。此外,缺乏关于特定病症的分割可以具有治疗牵涉。此外,共病对于无法描绘2种病症存在的医生是成问题的。总的来说,精神病学中的临床评估和非特异性临床诊断标准突出了关于生物学标记的需要,以便识别共享类似生物学的需要。这看起来是关于情感障碍的特定困境,因为存在关于显示临床差异和独特生物学特征的亚型的新出现证据(Gold和Chrousos,Mol. Psychiatry 2002,7(3) :254-275) 0然而,迄今为止,没有生物学标记一致地显示描绘就情感障碍而言的患者群体的分割。先前研究已探索了测量具有抑郁症的受试者与对照受试者比较,或在治疗前和后的受试者中的生物学改变的测试,例如地塞米松/促肾上腺皮质素释放激素(DEX/CRH)测试。然而,此类测试已在少量患者中进行检查,仍未再现,和/或仍未使生物学读数与特
(Ising, Μ.等)κ, Biol. Psychiatry, 2006 Nov 20, e-pub ahead of print ; Kunugi, H.等人,Neuropsychopharm. 2006,31 (1) :212-20)。这是适当的,因为临床上相关的生物标记必须与特定生物学和特定表型相关,并且理想地,应通过治疗回到正常水平。对于糖尿病、阿尔茨海默氏病和癌症已鉴定了蛋白质生物标记(参见例如,美国专利号7,125,663 ;7, 097,989 ;7, 074,576 ;和6,925,389。)然而,用于检测蛋白质生物标记的方法,例如质谱法和与抗体特异性结合,通常获得不能再现的数据,并且这些方法不利于高流通量使用。使用微阵列的高流通量表达分析方法已用于评估基因表达改变,具有混合结果或无关结果(Brenner,S.等人 Nat Biotechnol. 2000,18(6) 597-8 ;Schena 等人Science. 1995,270(5235) :467-70 ;Velculescu, V. Ε.等人,Science. 1995,270(5235) 484-7)。由于测量的基因表达与受试者数目的大量比,并且考虑到抑郁性病症的异质性,对于微阵列数据预期大量假阳性。(关于综述,参见Iwamoto K和Kato T., Neuroscientist 2006,12(4) :349-61 ;Bunney WE, ^A, Am J Psychiatry2003,160(4) 657-66 ;和 Iga J, Ueno S 和 Ohmori T.,Ann Med 2008,40(5) :336_42。)Sibille 等人 (Neuropsychopharm. 2004,29(2) :351-61)执行了大规模基因组分析,然而,未发现关于与抑郁症和自杀相关的分子差异证据,并且无法再现关于先前发现与抑郁症相关的基因在表达水平中的改变。因为此类困难,一致概况仍未得到鉴定。关于多重相关基因的聚焦阵列和qPCR已用于鉴定应激相关基因,但这些研究仍未鉴定与抑郁症相关的诊断概况(Rokutan等人,J.Med. Invest. 2005,52 (3-4) :137-44; Ohmori等人,J. Med. Invest. 2005, 52 (Suppl) :266-71)。在大鼠脑区域中,特定基因的转录改变已牵涉情绪和焦虑的控制,然而,这些改变与人血样无关(W02007106685A2)。3发明概述本发明提供了诊断测试受试者中的情感障碍的方法,该方法包括评估测试受试者的生物标记概况中的多个生物标记的多个特征是否满足值集合,其中满足该值集合预测测试受试者具有所述情感障碍,并且其中多个特征是多个生物标记的可测量方面,多个生物标记包含表IA中列出的至少2个生物标记。本发明还提供了计算机程序产品,其中所述计算机程序产品包含计算机可读存储介质和其中嵌入的计算机程序机制,所述计算机程序机制包含用于执行诊断方法的指令。本发明的一个方面提供了计算机,所述计算机包含一个或多个处理器和与一个或多个处理器连接的存储器,所述存储器存储用于执行诊断方法的指令。本发明的另一个方面提供了测定测试受试者显示出情感障碍症状的可能性的方法,该方法包括评估测试受试者的生物标记概况中的多个生物标记的多个特征是否满足值集合,其中满足该值集合提供了测试受试者显示出情感障碍症状的所述可能性,并且其中多个特征是多个生物标记的可测量方面,所述多个生物标记包含表IA中列出的至少2个生物标记。在另一个方面,本发明提供了其为关于从多个对照受试者中收集的每种生物样品的转录分析测量的转录概况。例如,本发明提供了其为关于从多个抑郁、严重抑郁或双相型受试者中收集的每种生物样品的转录分析测量的转录概况。本发明进一步提供了其为关于从多个边缘型人格障碍受试者中收集的每种生物样品的转录分析测量的转录概况。本发明还提供了其为关于从多个PTSD受试者中收集的每种生物样品的转录分析测量的转录概况。本发明还提供了包含存储在例如数据库中的第一批多个对照受试者的集体测量的转录概况。使用分类算法使包含第二批多个受试者例如患病受试者的集体测量的转录概况与第一批多个对照受试者的转录概况比较。分类算法提供了使受试者各自分类的输出。本发明提供了用于诊断情感障碍的方法,通过鉴定患者中的转录概况,使此类转录概况与对照受试者或对照受试者组的概况比较,从而基于转录概况中改变的存在或不存在诊断患者的情感障碍。本发明的一个方面提供了用于诊断具有情感障碍的受试者的方法,其包括
(a)从多个对照受试者和多个患病受试者中获得生物样品;(b)测量在多个对照受试者和多个患病受试者样品中基因的mRNA表达水平,其中所述基因选自 ADA、ARRB1、ARRB2、CD8a、CD8b、CREB1、CREB2、DPP4、ERK1、ERK2、Gi2、Gs、GR、 IL1 b、IL6、IL8、INDO、MAPK14、MAPK8、MKP1、MR、ODC1、P2X7、PBR、PREP、RGS2、S1OOA10、SERT 禾口 VMAT2 ;(c)收集关于来自多个对照受试者和多个患病受试者的每种基因的mRNA表达水平且将其作为mRNA数据存储在计算机介质中;(d)借助于分类算法加工此类mRNA数据;和(e)提供使受试者分类的输出数据,从而诊断受试者具有情感障碍。本发明进一步提供了用于预测受试者对情感障碍的易感性的方法,通过使受试者选自下述的基因转录概况与多个对照受试者的基因转录概况比较来进行ADA、ARRBU ARRB2、CD8a、CD8b、CREBl、CREB2、DPP4、ERKl、ERK2、Gi2、Gs、GR、ILlb、IL6、IL8、INDO、 MAPK14、MAPK8、MKP1、MR、0DC1、P2X7、PBR、PREP、RGS2, S100A10、SERT 和 VMAT2。本发明的一个方面提供了用于预测受试者显示出情感障碍症状的可能性的方法, 其包括(a)从多个对照受试者和多个患病受试者中获得生物样品;(b)测量在多个对照受试者和多个患病受试者样品中基因的mRNA表达水平,其中所述基因选自 ADA、ARRB1、ARRB2、CD8a、CD8b、CREB1、CREB2、DPP4、ERK1、ERK2、Gi2、Gs、GR、 IL1 b、IL6、IL8、INDO、MAPK14、MAPK8、MKP1、MR、ODC1、P2X7、PBR、PREP、RGS2、S1OOA10、SERT 禾口 VMAT2 ;(c)收集关于来自多个对照受试者和多个患病受试者的每种基因的mRNA表达水平且将其作为mRNA数据存储在计算机介质中;(d)借助于分类算法加工此类mRNA数据;和(e)提供使受试者分类的输出数据,从而预测受试者显示出情感障碍症状的可能性。4附图简述

图1是依照本发明的一个实施方案的计算机系统举例说明。图2A和2B。如通过qPCR方法经由拷贝/ng⑶R测量的(ρ < 0. 001 ;曼-怀二氏 (Mann Whitney)检验),分别显示在对照受试者与抑郁受试者比较中ARRBl ( β -抑制蛋白 1)和Gi2(鸟嘌呤核苷酸结合蛋白ai2)的相对mRNA水平的散点图。图3A和;3B。如通过qPCR方法经由拷贝/ng CDR测量的(ρ < 0. 001 ;曼-怀二氏检验),分别显示在对照受试者与抑郁受试者比较中ΜΑΡΚ14(ρ38丝裂原活化蛋白激酶14) 和ODCl (鸟氨酸脱羧酶1)的相对mRNA水平的散点图。图4A、4B和4C。如通过qPCR方法经由拷贝/ng CDR测量的(ρ < 0. 001 ;曼-怀二氏检验),分别显示在对照受试者与严重抑郁受试者比较中ERKl (细胞外信号调节激酶1)、 Gi2(鸟嘌呤核苷酸结合蛋白ai2)和MAPK14(p38丝裂原活化蛋白激酶14)的相对mRNA水平的散点图。图5A、5B和5C。如通过qPCR方法经由拷贝/ng CDR测量的(ρ < 0. 001 ;曼-怀二氏检验),分别显示在对照受试者与严重抑郁/双相型受试者比较中Gi2 (鸟嘌呤核苷酸结合蛋白ai2)、GR(a-糖皮质激素受体)和MAPK14 (p38丝裂原活化蛋白激酶14)的相对 mRNA水平的散点图。图6A、6B和6C。如通过qPCR方法经由拷贝/ng CDR测量的(ρ < 0. 001 ;曼-怀二氏检验),分别显示在对照受试者与边缘型人格障碍受试者比较中Gi2(鸟嘌呤核苷酸结合蛋白ai2)、MAPK14(p38丝裂原活化蛋白激酶14)和MR(盐皮质激素受体)的相对mRNA 水平的散点图。图7A、7B和7C。如通过qPCR方法经由拷贝/ng CDR测量的(ρ < 0. 001 ;曼-怀二氏检验),分别显示在196个对照受试者与66个急性PTSD受试者比较中ARRB2 ( β -抑制蛋白2)、ERK2 (细胞外信号调节激酶2)和RGS2 (G蛋白信号调节剂2)的相对mRNA水平的散点图。图8A和8B。图8A是执行SLR算法的举例说明,所述SLR算法执行基因选择和训练,在抑郁受试者与对照比较的分类中评分为93%的准确度、PPV = 93%和NPV = 94%。 在RF基因选择前,支持向量机(Support Vector Machine) (SVM)分类器在抑郁受试者与对照比较的分类中评分为88%的准确度、PPV = 89%和NPV = 88%。图8B显示基于在抑郁受试者与对照比较的分类中每种方法的统计参数,随机森林(Random Forest) (RF)从表IA 中选择14种基因,并且逐步逻辑回归(St印wise Logistic Regression) (SLR)选择17种基因。在分类过程的选择步骤时通过RF和SLR方法选择的重叠基因以灰色显示。图9。图9描述了关于其平均表达水平(转录值)在严重抑郁患者和对照之间显著不同(P < 0. 05)的基因。这些基因根据计算的-Log(P)值量级进行排序,如表5A中可见的。图10。图10表示对于每个受试者根据由ERKl和MAPK14组成的转录概况的严重抑郁受试者和对照受试者分布。严重抑郁受试者由空心圆圈(〇)表示,并且对照受试者由实心三角(▲)表示。X和Y轴分别描述了关于ERKl和MAPK14的转录值(拷贝/ng cDNA)。图11。图11表示对于每个受试者根据由Gi2和ILlb组成的转录概况的严重抑郁受试者和对照受试者分布。严重抑郁受试者由空心圆圈(〇)表示,并且对照受试者由实心三角(▲)表示。X和Y轴分别描述了关于Gi2和ILlb的转录值(拷贝/ng cDNA)。图12。图12表示对于每个受试者根据由ERKl和ILlb组成的转录概况的严重抑郁受试者和对照受试者分布。严重抑郁受试者由空心圆圈(〇)表示,并且对照受试者由实心三角(▲)表示。X和Y轴分别描述了关于ERKl和ILlb的转录值(拷贝/ng cDNA)。图13。图13表示对于每个受试者根据由ARRBl和MAPK14组成的转录概况的严重抑郁受试者和对照受试者分布。严重抑郁受试者由空心圆圈(〇)表示,并且对照受试者由实心三角(▲)表示。X和Y轴分别描述了关于ARRBl和MAPK14的转录值(拷贝/ng cDNA)。5发明详述本发明允许通过评估生物标记概况中的生物标记特征快速且准确诊断情感障碍。 这些生物标记概况从受试者的生物样品构建。5.1 定义
如本文使用的,“情感障碍”应意指特征在于一致、普遍的情绪改变且影响思维、情绪和行为的精神障碍。情感障碍的例子包括但不限于抑郁性障碍、焦虑症、双相型障碍、精神抑郁症和分裂情感性障碍。焦虑症包括但不限于广泛性焦虑症、惊恐障碍、强迫性障碍、 恐怖症和创伤后应激障碍。抑郁性障碍包括但不限于主要性抑郁障碍(MDD)、紧张性抑郁症、忧郁性抑郁症、非典型抑郁症、精神病性抑郁症、产后忧抑郁症、双相型抑郁症和轻度、 中度或重度抑郁症。人格障碍包括但不限于偏执型、反社会型和边缘型人格障碍。“生物标记”是事实上任何可检测的化合物,例如蛋白质、肽、蛋白聚糖、糖蛋白、脂蛋白、碳水化合物、脂质、核酸(例如DNA,例如cDNA或扩增的DNA,或RNA例如mRNA)、有机或无机化学制品、天然或合成聚合物、小分子(例如代谢产物),或前述任何的区别分子或区别片段,其存在于或衍生自生物样品,或客观测量且评估为正常生物学过程、致病性过程或对于治疗干预的药理学应答指示剂,或其指示的任何其他特征。参见Atkinson,A.J., ^A Biomarkers and Surrogate Endpoints :Preferred Definitions and Conceptual Framework, Clinical Pharm. &Therapeutics,2001 March ;69 (3) :89_95。如这个内容中使用的“衍生自”指当检测时指示存在于生物样品中的特定分子的化合物。例如,特定cDNA的检测可以指示特定RNA转录物在生物样品中的存在。作为另一个例子,与特定抗体结合的检测可以指示生物样品中特定抗原(例如,蛋白质)的存在。此处,区别分子或片段是当检测时指示上文鉴定化合物的存在或丰度的分子或片段。生物标记可以例如从生物样品中分离,在生物样品中直接测量,或在生物样品中检测或在生物样品中待测定。生物标记可以例如是功能的、部分功能的或无功能的。在一个实施方案中,分离且使用生物标记,例如以产生可以促进各种诊断测定中的生物标记检测的特异性结合抗体。任何免疫测定可以使用能够结合生物标记分子(例如,Fab、F(ab' )2、 Fv或scFv片段)的任何抗体、抗体片段或其衍生物。此类免疫测定是本领域众所周知的。 此外,如果生物标记是蛋白质或其片段,那么它可以进行测序,并且可以使用充分确定的技术克隆其编码基因。如本文使用的,术语“生物标记种类”指本文描述的生物标记的任何区别部分或区别片段,例如本文描述的特定基因的剪接变体(例如,下文表IA中列出的基因)。此处,区别部分或区别片段是当检测时指示上文鉴定的转录物、cDNA、扩增核酸或蛋白质的存在或丰度的分子部分或片段。“生物标记概况”包含多个一种或多种类型的生物标记(例如,mRNA分子、cDNA分子、蛋白质和/或碳水化合物或其指示等),连同生物标记的特征例如可测量方面(例如丰度)。生物标记概况包含至少2个此类生物标记,其中生物标记可以在相同或不同类别中, 例如核酸和碳水化合物。生物标记概况还可以包含至少2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95 或100个或更多个生物标记。在一个实施方案中,生物标记概况包含数百个或甚至数千个生物标记。生物标记概况可以进一步包含一种或多种对照或内部标准。在一个实施方案中, 生物标记概况包含充当内部标准的至少一个生物标记。如本文在这个内容中使用的,术语 “指示”仅指其中生物标记概况含有关于核酸、mRNA分子、cDNA分子、蛋白质和/或碳水化合物、或任何其他形式的生物标记,而不是生物标记分子实体其自身的标志、数据、缩写或其他相似标记的情况。例如,本发明的示例性生物标记概况包含表IA中的基因名称。
生物标记概况中的每个生物标记包括相应“特征”。如本文使用的,“特征”指生物标记的可测量方面。特征可以包括例如如示例性生物标记概况1中举例说明的,来自受试者的生物样品中生物标记的存在或不存在示例性生物标记概况权利要求
1.一种诊断测试受试者中的情感障碍的方法,所述方法包括评估所述测试受试者的生物标记概况中的多个生物标记的多个特征是否满足值集合, 其中满足所述值集合预测所述测试受试者具有所述情感障碍,并且其中所述多个特征是所述多个生物标记的可测量方面,所述多个生物标记包含表IA中列出的至少2个生物标记。
2.权利要求1的方法,所述方法进一步包括将所述测试受试者是否具有所述情感障碍的诊断输出至用户界面装置、监测器、可触摸计算机可读存储介质、或局部或远程计算机系统;或以用户可读形式显示所述测试受试者是否具有所述情感障碍的诊断。
3.权利要求1的方法,其中所述多个生物标记由表IA中列出的2- 个生物标记组成。
4.权利要求1的方法,其中所述多个生物标记由表IA中列出的3-20个生物标记组成。
5.权利要求1的方法,其中所述多个生物标记包含表IA中列出的至少2个生物标记。
6.权利要求1的方法,其中所述多个生物标记包含表IA中列出的至少3个生物标记。
7.权利要求1的方法,其中所述多个生物标记包含表IA中列出的至少4个生物标记。
8.权利要求1的方法,其中所述多个特征由对应于表IA中列出的2- 个生物标记的2-29个特征组成。
9.权利要求1的方法,其中所述多个特征由对应于表IA中列出的3-15个生物标记的3-15个特征组成。
10.权利要求1的方法,其中所述多个生物标记包含对应于表IA中列出的至少2个生物标记的至少2个特征。
11.权利要求1的方法,其中所述多个生物标记包含ERKl和MAPK14。
12.权利要求1的方法,其中所述多个生物标记包含Gi2和IL-lb。
13.权利要求1的方法,其中所述多个生物标记包含ARRBl和MAPK14。
14.权利要求1的方法,其中所述多个生物标记包含ERKl和ILlb。
15.权利要求1的方法,其中所述多个生物标记包含ARRBl、IL6和⑶8a。
16.权利要求1的方法,其中所述多个生物标记包含ARRB1、ODCl和P2X7。
17.权利要求1的方法,其中所述多个生物标记中的每个生物标记是核酸。
18.权利要求1的方法,其中所述多个生物标记中的每个生物标记是DNA、cDNA、扩增的 DNA、RNA 或 mRNA。
19.权利要求1的方法,其中所述测试受试者的生物标记概况中的所述多个生物特征中的特征是所述多个生物标记中的生物标记的可测量方面,并且关于所述特征的特征值使用 得自所述测试受试者的生物样品进行测定。
20.权利要求19的方法,其中所述特征是所述生物标记在生物样品中的丰度,并且所述生物样品是全血。
21.权利要求1的方法,所述方法进一步包括在评估步骤前构建所述第一个值集合。
22.权利要求21的方法,其中所述构建步骤包含将数据分析算法应用于得自群体成员的特征。
23.权利要求22的方法,其中所述群体包含来自不具有情感障碍的第一批多个对照受试者的第一批多个生物样品,和来自具有情感障碍的第二批多个受试者的第二批多个生物样品。
24.权利要求22的方法,其中所述数据分析算法是决策树、微阵列预测分析、多重累计回归树、神经网络、聚类算法、主成分分析、最近邻分析、线性判别分析、二次判别分析、支持向量机、进化法、相关向量机、遗传算法、投影追踪或加权表决。
25.权利要求21的方法,其中所述构建步骤生成决策规则,并且其中所述评估步骤包含将所述决策规则应用于所述多个特征,以便测定它们是否满足所述第一个值集合。
26.权利要求25的方法,其中所述决策规则将所述群体中的受试者分类为(i)不具有情感障碍的受试者和(ii)的确具有情感障碍的受试者,其准确度70%或更大。
27.权利要求25的方法,其中所述决策规则将所述群体中的受试者分类为(i)不具有情感障碍的受试者和(ii)的确具有情感障碍的受试者,其准确度90%或更大。
28.权利要求1的方法,其中所述情感障碍是双相型障碍I、双相型障碍II、心境恶劣障碍或抑郁障碍。
29.权利要求1的方法,其中所述情感障碍是轻度抑郁症、中度抑郁症、重度抑郁症、非典型抑郁症、忧郁抑郁症或边缘型人格障碍。
30.一种计算机程序产品,其中所述计算机程序产品包含计算机可读存储介质和其中嵌入的计算机程序机制,所述计算机程序机制包含用于执行权利要求1的方法的指令。
31.权利要求30的计算机程序产品,其中所述计算机程序机制进一步包含指令用于将所述测试受试者是否具有所述情感障碍的诊断输出至用户界面装置、监测器、可触摸计算机可读存储介质、或局部或远程计算机系统;或以用户可读形式显示所述测试受试者是否具有所述情感障碍的诊断。
32.—种计算机,其包含一个或多个处理器;与所述一个或多个处理器连接的存储器,所述存储器存储用于执行权利要求1的方法的指令。
33.权利要求32的计算机,其中所述存储器进一步包含指令用于将所述测试受试者是否具有所述情感障碍的诊断输出至用户界面装置、监测器、可触摸计算机可读存储介质、或局部或远程计算机系统;或以用户可读形式显示所述测试受试者是否具有所述情感障碍的诊断。
34.一种测定测试受试者显示出情感障碍症状的可能性的方法,所述方法包括评估所述测试受试者的生物标记概况中的多个生物标记的多个特征是否满足值集合, 其中满足所述值集合提供了所述测试受试者显示出情感障碍症状的所述可能性,并且其中所述多个特征是所述多个生物标记的可测量方面,所述多个生物标记包含表IA中列出的至少2个生物标记。
35.权利要求34的方法,所述方法进一步包括将所述测试受试者显示出情感障碍症状的可能性输出至用户界面装置、监测器、可触摸计算机可读存储介质、或局部或远程计算机系统;或以用户可读形式显示所述测试受试者显示出情感障碍症状的可能性。
全文摘要
本发明涉及用于诊断具有情感障碍的患者的方法和系统。该方法也用于预测受试者中对于情感障碍的易感性。
文档编号G06F19/24GK102224256SQ200980142889
公开日2011年10月19日 申请日期2009年8月27日 优先权日2008年8月27日
发明者C·P·G·格拉尔, I·安东尼耶维克, J·B·维斯蒂森, J·塔姆, R·阿泰米什恩 申请人:H.隆德贝克有限公司

最新回复(0)