用于帕金森氏病的新诊断MiRNA标志物的制作方法
【专利说明】用于帕金森氏病的新诊断MiRNA标志物
[0001] 本发明涉及用于帕金森氏病(PD)的新标志物。
[0002] 发明背景
[0003] 新近,分子诊断学的重要性已经日趋增加。已经发现了进入疾病的临床诊断中 (特别是传染性病原体的检测、基因组的突变的检测、患病细胞的检测和易患病体质的风险 因子的鉴定)。
[0004] 特别地,通过测定组织中的基因表达,核酸分析在疾病的研宄和诊断中打开了非 常有希望的新可能性。
[0005] 待检测的感兴趣核酸包括基因组DNA、表达的mRNA和其它RNA,诸如微小RNA (缩 写为miRNA)。miRNA是具有各种生物学功能的新一类小RNA (A. Kel ler et al.,Nat Methods. 20118(10) : 841-3)。它们是发现于真核细胞中的短(平均具有20-24个核苷酸) 核糖核酸(RNA)分子。已经在哺乳动物中鉴定出几百个不同种类的微小RNA(即,几百种不 同序列)。它们对于转录后基因调控是重要的,并且与靶信使RNA转录物(mRNA)上的互补 序列结合,这能导致翻译阻抑或靶物降解和基因沉默。因此,它们还可用作研宄、诊断和治 疗目的的生物学标志物。
[0006] 帕金森氏病(Parkinson's disease, P)是一种中枢神经系统的变性性病症。帕金 森氏病的运动症状源自神经系统中多巴胺生成细胞的死亡;此细胞死亡的原因是未知的。
[0007] 经常误认早期症状是年龄相关问题。帕金森氏病影响运动,产生运动症状,并且可 以引起情绪、认知、行为或思想变化。帕金森氏病的诊断基于医学史和神经学检查。没有能 清楚鉴定所述疾病的实验室测试,但是有时使用成像形式来排除其它病症。
[0008] 症状(诸如虚弱和运动症状)可以与其它神经学病症类似。诊断可以是费时的, 昂贵的且困难的。特别地,基于非侵入性分子生物标志物的可靠且早期的帕金森诊断仍然 是一项挑战。
[0009] 因此,存在着对有效、简单、可靠的ro诊断测试的未满足需要。
[0010] 定义
[0011] 除非另有定义,本文中使用的技术和科学术语与本发明所属领域普通技术人员的 通常理解具有相同的含义。
[0012] 如本文中使用的,术语"预测疾病的结果"意在包括预测经历给定疗法的患者的结 果和预后不治疗的患者两者。
[0013] 本发明的含义内的"结果"是在疾病的进程中获得的限定状况。此疾病结果可以 例如是临床状况诸如"疾病的复发"、"疾病的消退"、"对治疗的响应",疾病阶段或等级等。
[0014] "风险"理解为受试者或患者形成或达到某种疾病结果的可能性。在本发明的上下 文中,术语"风险"并不意在指就患者的健康而言携带任何积极或消极含义,而仅指发生或 形成给定事件或状况的可能性或概率。
[0015] 术语"临床数据"指关于患者的健康状况的可用数据和信息的总体,包括但不限于 年龄、性别、重量、绝经期/激素状况、疾病发生学数据、既往病例(anamnesis)数据、通过体 外诊断方法诸如血液或尿液测试获得的数据、通过成像方法获得的数据,诸如x-射线、计 算机断层摄影术、1則、?£1\邓6(^、超声、电生理学数据、遗传分析、基因表达分析、活组织检 查评估、术中发现。
[0016] 如本文中使用的,术语患者的"样品的分类"指所述样品与至少两类中至少一种的 关联。这些种类可以是例如"高风险"和"低风险";或高、中等和低风险;其中风险是在某个 时期中发生某个事件的可能性,例如,疾病的发生、疾病的进程等。它可进一步意为疾病的 有利的或不利的临床结果、对给定治疗的响应性或非响应性等的种类。可以通过利用算法 (尤其是判别函数)实施分类。算法的简单例子是根据第一定量参数的分类,例如,高于或 低于某个阈值的感兴趣核酸的表达水平。患者样品的分类可用于预测疾病的结果或发生疾 病的风险。代替利用感兴趣的单一核酸的表达水平,可使用感兴趣的几种核酸的组合评分。 此外,可将额外的数据与第一定量参数组合使用。所述额外的数据可以是来自患者的临床 数据,诸如性别、年龄、患者的重量、疾病分级等。
[0017] "判别函数"是用于分类对象或事件的一组变数的函数。因此,判别函数允许根 据从患者、样品或事件可获得的数据或参数将所述患者、样品或事件分类为一个种类或多 个种类。此种分类是技术人员公知的统计学分析的标准手段。例如,根据从所述患者、样 品或事件中获得的数据可将患者分类为"高风险"或"低风险"、"需要治疗"或"不需要治 疗"或其它种类。分类不限于"高对低",而是可以实施到多个种类、分级等中。允许分类的 判别函数的例子包括但不限于由支持向量仪(support vector machine, SVM)、k-最近邻 (k-nearest-neighbor,kNN)、(朴素(naive))贝叶斯模型定义的判别函数,或分段定义的 函数,诸如例如在子集发现、决策树、数据的逻辑分析(LAD)等中。
[0018] 术语"表达水平"指例如感兴趣核酸的测定水平表达。术语"表达水平的样式 (pattern)"指与来自参照核酸(例如来自对照)比较,或与计算的平均表达值(例如在DNA 芯片分析中)比较的测定表达水平。样式不限于两种基因的比较,而且还涉及基因与参照 基因或样品的多重比较。某个"表达水平样式"也可作为结果(result)并通过下文公开的 几种感兴趣核酸的比较和测量来测定,并展示出这些转录物彼此的相对丰度。表达水平还 可相对于不同组织,患者对健康对照等中的表达来评估。
[0019]本发明的含义中的"参照表达水平样式"应理解为可用于与另一表达水平样式比 较的任何表达水平样式。在本发明的一个优选的实施方案中,参照表达水平样式是例如在 充当参照组的一组健康或患病个体中观察到的平均表达水平样式。
[0020] 在本发明的上下文中,"样品"或"生物样品"是源自生物学生物体或已经与生物学 生物体接触的样品。生物样品的例子是:细胞、组织、体液、活组织检查样本、血液、尿液、唾 液、痰液、血浆、血清、细胞培养上清液等。
[0021] "探针"是能够与特定生物分子特异性结合或相互作用的分子或物质。术语"引 物"、"引物对"或"探针"应具有分子生物学领域技术人员已知的这些术语的常规含义。在 本发明的一个优选的实施方案中,"引物"、"引物对"和"探针"指具有下述序列的寡核苷酸 或多核苷酸分子,所述序列与待检测或定量的靶分子或靶序列的区域相同、互补、作为该区 域的同源物、或同源,从而引物、引物对或探针可特异性结合靶分子(例如,待检测或待定 量的靶核酸、尺隱、0隱、〇0嫩、基因、转录物、肽、多肽或蛋白质)。如本文中理解的,引物可自 身发挥探针功能。如本文中理解的,"探针"还可包含例如引物对和内部标记探针的组合,其 是许多商品化qPCR方法中所常见的。
[0022] "基因"是含有以受控方式产生功能性RNA产物必需的信息的核酸区段区。"基因 产物"是通过基因转录或表达产生的生物分子,例如mRNA或翻译蛋白。
[0023] "miRNA"是短的、天然存在的RNA分子,并且应当具有本领域技术人员所理解的 一般含义。"源自miRNA的分子"是以化学方法或酶促方法自miRNA模板获得的分子,诸如 cDNA〇
[0024] 术语"阵列"指装置(例如芯片装置)上可寻址位置的排列。位置的数目可从几个 变化到至少几百或几千个。每个位置代表独立的反应位点。阵列包括但不限于核酸阵列、 蛋白质阵列和抗体阵列。"核酸阵列"指含有核酸探针(诸如寡核苷酸、多核苷酸或基因的 较大部分)的阵列。阵列上的核酸优选为单链的。"微阵列"指生物芯片或生物学芯片,即 具有至少约100/cm 2的含有固定探针的离散区域密度的区域的阵列。
[0025] "基于PCR的方法"指包含聚合酶链式反应PCR的方法。这是通过利用一种、两种或 更多种引物在体外酶促复制指数扩增核酸(例如DNA或RNA)的方法。对于RNA扩增,可使 用逆转录作为第一步。基于PCR的方法包含动力学或定量PCR(qPCR),其特别适宜于分析表 达水平。当其实现表达水平的测定时,可以例如使用基于PCR的方法以检测给定mRNA的存 在,其通过(1)在酶逆转录酶的帮助下将完整的mRNA库(所谓的转录物组)逆转录为cDNA, 并(2)在相应引物的帮助下检测给定cDNA的存在。此方法通常称为逆转录酶PCR(rtPCR)。 术语"基于PCR的方法"包含端点PCR应用及应用特殊的荧光团或嵌入染料的动力学/实时 PCR技术两者,所述荧光团或嵌入染料发射荧光信号作为扩增靶标的函数,并允许靶标的监 测和定量。定量方法根据外部标准曲线或相对于比较性内部标准品可以是绝对的。
[0026] 术语"下一代测序"或"高通量测序"指使测序方法平行化,一次产生几千个或 几百万个序列的高通量测序技术。例子包括大规模平行标签测序(Massively Parallel Signature Sequencing, MPSS)、Polony 测序、454 焦磷酸测序、Illumina(Solexa)测 序、SOLiD测序、离子半导体测序、DNA纳米球测序、Helioscope (TM)单分子测序、单分子 SMRT(TM)测序、单分子实时(RNAP)测序、纳米孔DNA测序。
[0027] 术语"标志物"或"生物标志物"指其存在或浓度可进行检测并与已知的状况(诸 如疾病状态)或临床结果(诸如对治疗的响应)相关联的生物分子,例如核酸、肽、蛋白质、 激素等。
[0028]发明目的
[0029] 本发明根本的技术问题是提供允许诊断、筛查或监测帕金森氏病、预测形成
帕金 森氏病的风险或预测帕金森氏病的结果的生物学标志物。
[0030] 发明概述
[0031] 在详细描述本发明前,应理解本发明不限于所描述的方法的过程步骤的特定组成 部分,因为此类方法可以变化。还应理解的是,本文所用的术语仅用于描述特定的实施方案 的目的,并不意图是限制的。必须注意的是,除非上下文另外清楚叙述,如本说明书和所附 权利要求书中所用的,单数形式"一个/种"、"该/所述"包括单数和/或复数指代物。还 应理解的是,除非文中另外清楚叙述,复数形式包括单数和/或复数指代物。此外,应理解 的是,在给出由数值划定的参数范围的情况下,该范围视为包括这些限度值。
[0032] 概括而言,本发明涉及可用于帕金森氏病的诊断、预后和预测的miRNA标志物集 合。
[0033] 具体地,本发明涉及一种分类患有或有风险形成帕金森氏病的患者的样品的方 法,其中所述样品是血液样品,所述方法包括下列步骤:
[0034] a)在所述样品中测定选自下组的至少一种miRNA的表达水平:具有序列SEQ ID NO 69、SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID NO 58 和 SEQ ID NO 65 的 miRNA ;
[0035] b)比较步骤a)中测定的表达水平样式与一种或几种参照表达水平样式;并
[0036] c)自步骤b)中比较的结果将所述患者的样品分类成至少两类之一。
[0037]这些序列对应于以下 miRNA :miR-1285-5p(SEQ IDN0:69)、miR-151-3p(SEQ ID N0:58)、hsa-let-7f(SEQ IDN0:2)和 miR-5010(SEQ IDN0:65)及新发现的 miRNA,即 脑-mir-112(SEQ IDN0:59)和脑-mir-161(SEQ IDN0:142)。
[0038] 例如,可以通过在至少一名健康受试者中测定选自下组的至少一种miRNA的表达 水平获得参照表达水平样式:具有序列SEQ ID N0 69、SEQ ID N0 142、SEQ ID N0 2、SEQ ID NO 59、SEQ ID NO 58 和 SEQ ID NO 65 的 miRNA。
[0039] 例如,可以通过在至少一名具有另一种神经学疾病的患者中测定选自下组的至少 一种miRNA的表达水平进一步获得参照表达水平样式:具有序列SEQ ID N0 69、SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID NO 58 和 SEQ ID NO 65 的 miRNA。其它神 经学疾病的例子包括阿尔茨海默氏病(Alzheimer' s Disease, AD)、认知障碍(Cognitive Impairement, MCI)、多发性硬化(本文中又称为临床孤立综合征(Clinically Isolated Syndrome), CIS)、轻度抑郁(n = 15)、双相型障碍(Bipolar Disorder, BD)、和精神分裂症 (Schizophrenia, Schiz)〇
[0040] 在本发明范围内的是将数值归入步骤a)中测定的至少一种miRNA的表达水平。
[0041] 进一步在本发明范围内的是以数学方式组合表达水平值以获得步骤(b)中的表 达水平样式,例如通过应用算法以获得相对于参照表达水平样式的标准化表达水平。
[0042] 在另一个方面,本发明涉及一种用于在患有或有风险形成帕金森氏病的患者中诊 断帕金森氏病,预测形成帕金森氏病的风险,或预测帕金森氏病的结果的方法,所述方法包 括下列步骤:
[0043] a)在来自所述患者的血液样品中测定选自下组的至少一种miRNA的表达水平:具 有序列 SEQ ID NO 69、SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID N0 58 和 SEQ ID NO 65 的 miRNA;
[0044] b)比较步骤a)中测定的表达水平样式与一种或几种参照表达水平样式;并
[0045] c)自步骤b)中比较的结果诊断帕金森氏病,预测形成帕金森氏病的风险,或预测 帕金森氏病的结果。
[0046] 依照本发明的一个方面,所述至少一种miRNA选自下组:具有序列SEQ ID N0 69、 SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID NO 58 和 SEQ ID NO 65 的 miRNA。
[0047] 依照本发明的一个方面,以表达水平值测定多个miRNA的表达水平,并且步骤(b) 包括以数学方式组合所述多个miRNA的表达水平值。
[0048] 在本发明范围内的是对步骤a)中测定的至少一种miRNA的表达水平的数值应用 算法以获得疾病得分,从而容许分类样品或诊断、预后或预测形成帕金森氏病的风险,或预 测帕金森氏病的结果。此类算法的一个非限制性例子是比较表达水平的数值与阈值数值以 将结果分类成两类之一,诸如高风险/低风险,患病/健康等。此类算法的另一个非限制 性例子是组合多个表达水平数值(例如通过求和),以获得组合得分。可以通过乘以代表 miRNA表达水平的数值或因数、代表临床数据的数值或其他因数将单独的被加数标准化或 加权。
[0049] 在本发明的范围内的是应用判别函数以将结果分类、诊断疾病、预测结果或风险。
[0050] 依照本发明的一个方面,通过使用选自下组的方法获得步骤(a)中的表达水平: 基于测序的方法、基于阵列的方法和基于PCR的方法。
[0051] 依照本发明的一个方面,测定至少2、3、4、5、或6种miRNA的表达水平以获得表达 水平样式。
[0052] 本发明进一步涉及一种用于实施本发明方法的试剂盒,所述试剂盒包含:
[0053]-用于在来自所述患者的所述血液样品中测定选自下组的至少一种miRNA的表达 水平的手段:具有序列 SEQ ID NO 69、SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID NO 58 和 SEQ ID NO 65 的 miRNA。
[0054] 用于测定所述至少一种miRNA的表达水平的手段可以包含用于检测或扩增所述 至少一种miRNA的寡核苷酸探针,用于以基于阵列的方法、基于PCR的方法、基于测序的方 法为基础测定表达水平的手段或用于测定表达水平的任何其它适宜的手段。
[0055] 依照本发明的一个方面,试剂盒还包含用于与来自所述样品的至少一种miRNA的 表达水平比较的至少一种参照表达水平样式。参照表达样式可以包括至少一种数字或数值 信息,且可以以任何可读的或电子可读的形式(包括但不限于印刷形式、计算机可读介质 上的电子存储形式,如CD、智能卡)提供,或以可下载形式(例如在计算机网络诸如因特网 中)提供。
[0056] 本发明进一步涉及可用于实施本发明方法的计算机程序产品,其包含:
[0057]-用于接收代表患者血液样品中选自下组的至少一种miRNA的表达水平的数据的 手段:具有序列 SEQ ID NO 69、SEQ ID NO 142、SEQ ID NO 2、SEQ ID NO 59、SEQ ID N0 58 和 SEQ ID NO 65 的 miRNA,
[0058]-用于接收代表至少一种参照表达水平样式的数据以与来自所述样品的所述至少 一种miRNA的表达水平比较的手段,
[0059] -用于比较代表患者样品中的所述至少一种miRNA的表达水平的所述数据的手 段,和
[0060] -任选地,用于自步骤b)中比较的结果测定帕金森氏病的诊断、形成帕金森氏病 的风险预测或帕金森氏病的结果预测的手段。
[0061] 计算机程序产品可以在可存储电子介质(如固态存储器、磁盘、CD等)上提供。它 可在计算机上当地存储。它可以作为基于网络的程序或应用(包括基于网络或基于因特网 的应用)执行。它可以在诊断装置(如分析器仪器)中执行。它可以可操作连接于用于输 出信息的装置,如显示器、打印机等。
[0062] 发明详述
[0063] 本发明的目的的其它细节、特征、特点和优点在以下的描述和相应实施例的附图 中进一步公开,其以示例的方式显示本发明的优选实施方案。然而,这些实施例绝不应当理 解为限制本发明的范围。
[0064]本发明涉及用于利用miRNA标志物诊断帕金森氏病的方法。
[0065] 帕金森氏病的诊断在呈现出一般年龄相关症状(诸如健忘)的患者中可以是挑战 性的。特别地,难以诊断疾病的最早阶段。然而,特别需要的是对于该疾病阶段的可靠的诊 断测试,因为治疗和社会干预的机会在此早期疾病阶段期间是改善的。
[0066] 这里,已经在无偏差方法(unbiased approach)中与健康对照和罹患其它神经 病症的患者比较帕金森氏病患者的血液样品中的miRNA的丰度。此方法涉及从样品中测 序miRNA的大量工作且从而引领了现有技术中尚未描述的新标志物的发现。此外,血液样 品作为miRNA标志物的表达信息来源的用途已经具有几项切实进步,其在其他样品来源 (诸如血清或组织)中不可获得,如易于样品获得和操作、样品制备和表达样式的稳健性 (robustness)和一致性。
[0067] 附图简述
[0068] 在附图中:
[0069] 图1显示了本发明的新核酸分子miRNA标志物(a)对已知的miRNA标志物(b)在 血液中的分布;
[0070] 图2显示了具有不同神经元病症的患者和对照的样品中本发明的第一
种例示性 新核酸分子miRNA标志物(脑-mir-112)的delta CT值;
[0071] 图3显示了具有不同神经元病症的患者和对照的样品中本发明的另一种例示性 新核酸分子miRNA标志物(脑-mir-161)的delta CT值;
[0072] 图4显不了具有帕金森氏病、不同神经兀病症(ND)的患者和健康对照的不同样品 中6种miRNA标志物的delta CT值;
[0073] 图5显示了具有帕金森氏病的患者对具有不同神经元病症(ND)的患者和健康对 照的不同样品中6种miRNA标志物的t-检验值;
[0074]图6显示了7种疾病仏0、]\?:1、?0、0£?、(:15、501、和80及对照)中12种11^隱的确 认。12种miRNA是(分别以柱1-12表示)hsa-let-7f-5p、hsa-miR-1285-5p、hsa-miR-107、 hsa-miR-103a-3p、hsa-miR-26b-3p、hsa-miR-26a-5p、hsa-miR-532-5p、hsa-miR-151a-3p、 脑-mir-161、hsa-let-7d_3p、脑-mir-112、和hsa-miR-501〇-3p ;
[0075] 图7显示了对于所有疾病的7-miRNA标签(signature)脑-mir-112、 hsa-miR-5010_3p、hsa-miR-103a_3p、hsa-miR-107、hsa-let-7d_3p、hsa-miR-532_5p、和 脑-mir-161的组合得分。使用定量RT PCR获得组合得分(y轴);及
[0076]图8显示了对于所有疾病的12-miRNA标签hsa-let-7f-5p、hsa-miR-1285-5p、 hsa-miR-107、hsa-miR-103a_3p、hsa-miR-26b_3p、hsa-miR-26a_5p、hsa-miR-532_5p、 hsa-miR-151a_3p、脑-mir-161、hsa-let-7d_3p、脑-mir-112、和hsa-miR-5010_3p的组合 得分。使用定量RT PCR获得组合得分(y轴)。
[0077] 材料和方法
[0078]患者分组(cohort)
[0079] 通过NGS或者通过qRT-PCR或两者测定总共219名患者和健康对照的外周血中 miRNA的表达。自具有帕金森氏病(PD)的患者(n = 9),具有阿尔茨海默氏病(AD)的患 者(n = 106),具有轻度认知障碍(MCI)的患者(n = 21),具有多发性硬化(临床孤立综合 征,CIS)的患者(n = 17),具有轻度抑郁(DEP)的患者(n = 15),具有双相型障碍(BD)的 患者(n = 15)、精神分裂症(Schiz)的患者(n = 14)、和健康对照(n = 22)获得血液。
[0080] 首先,通过下一代测序分析了来自AD患者(n = 48)、MCI患者(n = 20)和健康对 照(n = 22)的样品。为了验证的目的,若可获得足够的RNA,则利用qRT-PCR在与NGS所 用相同的样品中分析单一1^8嫩的表达。通过来自患有八0、(:15、?0、0£?、80和5(*匕的患 者的进一步样品进一步扩大样品的数目,产生通过qRT-PCR分析的总共205个样品。具体 地,分析来自AD患者的总共95个样品、来自MCI患者的19个样品、来自CIS患者的17个 样品、来自患者的9个样品、来自DEP患者的15个样品、来自BD患者的15个样品、来自 Schiz患者的14个样品和来自健康对照的21个样品。
[0081] RNA分离
[0082] 利用PAXgene血液miRNA试剂盒(Qiagen)按照制造商的推荐分离包含miRNA的 总RNA。将分离的RNA于-80°C贮存。利用Bioanalyzer 2100 (Agilent)分析RNA完整性 并利用NanoDrop 2000 (Thermo Scientific)测量浓度和纯度。总共4个样品(3个对照和 1个RRMS)不符合质量标准,并且排除在研宄之外。
[0083] 实骀宰制各和下一代测序
[0084] 对于实验室制备,每样品使用了 200ng的总RNA,如在生物分析仪 (Bioanalyzer)2100(Agilent)上利用 RNA 6000Nano Chip 测定的。按照 TruSeq Small RNA Sample Prep Kit(Illumina)的方案实施制备。在生物分析仪上利用DNA 1000芯 片测量已经制备好的文库的浓度。然后,将文库在相等量的6个样品的批次中合并,并 利用cBot (Illumina)在每个单一阅读流动池1道中以9pmol的浓度聚簇。在HiSeq 2000(Illumina)上实施50个循环的测序。利用CASAVA v. 1. 8. 2进行原始测序数据的去多 重化(demultiplexing)和fastq文件的生成。
[0085]NGS数据分析
[0086]首先使用来自 FASTX-Toolkit (http://hannonlab. cshl. edu/fastx_toolkit/) 的程序fastx_clipper通过切割3'接头序列预处理原始Illumina读段。除去剪取 (clipping)后短于18nt的读段。对每份样品将剩余的读段简化成独特读段(unique read) 及其频率以使得定位(mapping)步骤更具时效性。对于剩余的步骤,我们使用了 miRDeep2 流水线(pipeline)。这些步骤由以下组成:相对于基因组(hgl9)定位读段,相对于来自 mirbase vl8版的miRNA前体序列定位读段,将样品的计数相加,并预测新miRNA。由于 miRDeep2流水线预测每份样品的新miRNA,随后如下合并miRNA :首先,提取每份样品的具 有超过10的信噪比的新miRNA。随后,仅合并位于相同染色体上的那些新miRNA,且它们成 熟的形式都共享至少11个核苷酸的重叠。
[0087] 具体地,对6种miRNA标志物选择其区分和(健康)对照及和其它神经学 疾病的能力。在NGS结果中,选择这6种miRNA,因为它们在具有帕金森氏病的患者和具有 其它神经学疾病的患者之间的比较以及具有帕金森氏病的患者和健康个体之间的比较两 者中是失调的。6 种 miRNA 中的 4 种,即 miR-1285-5p(SEQ ID N0:69)、miR-151-3p(SEQ ID N0:58)、hsa-let-7f(SEQ ID N0:2)和 miR-5010(SEQ ID N0:65)是 miRBase 中包括的已知 成熟砧1?隱,2种11111?隱,即脑1111-112(5£〇10勵:59)和脑1111-161(5£〇10勵:142)是 新鉴定的并且尚未纳入miRBase中。
[0088]使用 miScript PCR System (Qiagen)进行逆转录和 qRT-PCR。使用 miScript 逆 转录试剂盒根据生产商的方案将总共200ng RNA转化为cDNA。对于每种RNA,我们另外制 备了含有200ng RNA和4 y 1的5x miScript RT缓冲液但无miScript逆转录酶混合物的 5 y 1反应物,作为逆转录的阴性对照(RT-对照)。根据生产商的方案在含1 y 1 cDNA的每 次反应20 y 1总体积中利用miScriptSYBR?Green PCR Kit实施qRT-PCR。对于每个 miScript引物测定法,我们另外利用水替代cDNA制备PCR阴性对照(非模板对照,NTC)。 [0089] 牛物信息学分析
[0090] 首先使用标准的分位数标准化将读段计数标准化。将具有少于50个读段计数 的所有miRNA从进一步考虑中排除。接着,我们对每种miRNA计算接受者工作特征曲线 (receiver operator characteristic curve)下面积(AUC)、倍数变化、和使用 t_检验的显 著性值(P值)。利用Benjamini Hochberg方法调节所有显著性值以进行多重测试。使用免 费可用的工具R实施生物信息学分析。此外,我们使用TAM工具(http://202. 38. 126. 151/ hmdd/tools/tam. html)实施 miRNA 富集分析。
[0091] 计筧组合得分
[0092] 简言之,为了计算n个上调的标志物和m个下调的标志物的组合表达得分,测定患 者的表达值x(a)和所有对照的平均表达值y之间的差d。对于下调的标志物,可以将差乘 以(-1),如此产生正值。可以将n个标志物的差相加以产生组合得分Z,从而
[0093] Z(a) = E d (1_n)(上调)+ E (-1) d(1_m)(下调)
[0094] 其中
[0095] d = x(a)_ U。
[0096] 为了使不同的标志物得分之间组合的得分可比较(例如为了比较(n+m) = 7个标 志物得分与(n+m) = 12个标志物得分,可将组合得分除以(n+m) :Zcomp = l/(n+m) ( E dQ_n) (上调)+E (-l)d(1_m)(下调))。
[0097] 可以将其它因子应用于组合得分的单个被加数d或作为整体的组合得分Z。
[0098] 结果
[0099] 最丰富的miRNA是具有映射到该miRNA处的13, 886, 676个平均读段计数和总共 12亿个读段的hsa-miR-486-5p,具有映射到该miRNA处的平均575, 359个读段和总共5200 万个读段的hsa-miR-92a-3p和具有映射到该miRNA处的平均135
, 012个读段和总共1200 万个读段的miR-451a。
[0100] 本发明提供了血液细胞中存在的非常罕见的miRNA变体。虽然常见的变体已经被 发现并且与自组织活组织检查发现的miRNA大量重叠,但是预期miRNA的很大部分仍然是 未知的。在本文中,表征患有神经学病症(包括轻度认知障碍、阿尔茨海默病或多发性硬 化)的患者及未受累对照。产生约20亿个来自患者和对照样品的序列,其中14亿左右匹配 已知或预测的新miRNA。如图1中详述的,绝大多数这些序列匹配已知的miRNA(99. 9% ), 而仅0. 1%左右匹配预测的新miRNA,指出为何不得不使用巨大的测序能力。已经发现了可 以使用这些新的miRNA作为指示疾病(诸如神经元疾病,例如帕金森氏病)的诊断性标志 物。
[0101] 然而,与已知的人miRNA相比,这些miRNA候选物一般是丰度少得多的。
[0102] 在图2和图3中,具有不同神经学疾病AD(两个分组)、BD、CIS、DEP、MCIjP Schiz (柱1,3-8)的患者和对照(柱2)的样品中本发明的第一种例示性新核酸分子miRNA 标志物脑-mir-112和本发明的另一种例示性新核酸分子miRNA标志物脑-mir-161的 delta CT 值。
[0103] 在增补的表2中给出了本文中描述的所有miRNA分子列表,该表2中含有miRNA 标志物的概述,包括序列信息。
[0104] 注意到,成熟的miRNa源自120个碱基左右的长度的miRNA前体分子。存在着几 个例子,其中miRNA前体彼此有所变化,而属于成熟miRNA的20个碱基左右的子集是相同 的。如此,新的成熟miRNA可以具有相同的序列但不同的SEQ ID N0标识符。
[0105] miRNA标志物以其常用名称来表示(例如has-miR-144-5p或hsa-let7f-5p),且 在公众可用的数据库中是可搜索的。在本发明中,还存在描述的新miRNA标志物,其以始于 前缀"脑-miR"的名字命名。它们与其序列和其SEQ ID N0根据序列方案列于补充表1中。
[0106] 除了单一标志物外,多种标志物的组合已经证明了改善诊断准确性的潜力。我 们选择仅6标志物的标签,6种中的4种已知标志物(即miR-1285-5p(SEQ ID N0:69)、 miR-151-3p(SEQ ID N0:58)、hsa-let-7f(SEQ ID N0:2)和 miR-5010(SEQ ID N0:65))及 新的标志物脑-mir-112(SEQ ID N0:59)和脑-mir-161(SEQ ID N0:142)。为了在一个得分 中组合6种miRNA的数值,可以计算平均z-得分,如材料和方法部分中详述的。6种标志物 的组合给出ro对对照及ro对其它神经学疾病的改善的区分。
[0107] 其灾神经学病症的得分
[0108] 接着,询问的问题是其它神经学病症的分组是否显示与对照类似的显著偏 差。我们在 7 种 miRNA 的标签(即 hsa-miR-5010-3p、hsa-miR-103a-3p、hsa-miR-107、 hsa-let-7d_3p、hsa-miR-532_5p、脑-mir-112 和脑-mir-161)方面测量帕金森氏病、阿尔 茨海默氏病、轻度认知障碍、精神分裂症、双相型障碍、多发性硬化(CIS)和抑郁患者的患 者样品。在图11中,存在所有疾病和所有miRNA的条图。这里,阿尔茨海默患者得分设置 为〇,如早期描述的,我们具有用于对照的4种下调的和3种上调的miRNA。对于轻度认知 障碍患者,相同的4种miRNA是下调的,并且相同的3种miRNA是上调的,提供了与AD相比 MCI标签与对照接近得多的强烈证据。对于CIS患者,仅2种miRNA是下调的,而第三种不 是失调的,并且剩余的3种是强烈上调的。对于帕金森氏病,前5种miRNA是下调的,而剩余 的2种是强烈上调的。对于精神分裂症和双相疾病,几乎所有miRNA是强烈上调的,相反, 对于抑郁,所有miRNA是显著下调的。总之,结果预示AD不仅能与对照区分,而且还非常好 地与其它神经学病症区分。当然,可以对阿尔茨海默和对照患者应用相同的基于z-得分的 方法以得到每个分组的总体得分。
[0109]在表1和2中,显示了 ro患者以及其它神经学疾病患者和健康对照中miR-1285-5p(SEQIDN0:69)、miR-151-3p(SEQIDN0:58)、hsa-let-7f(SEQIDN0:2)、 miR-5010(SEQIDN0:65)、脑-mir-112(SEQIDN0:59)、和脑-mir-161(SEQIDN0:142)的 表达值的评估。
[0110] 表 1 :脑-mir-112 脑-mir-161 hsa_let_7f 的表达值的评估
[0111]
[0112] 表 2 :miR-1285-5p miR-151-3p miR-5010-3p 的表达值的评估
[0113]
[0114] 较大分组中miRNA的聚焦分析和与其它神经学疾病的比较容许改善miRNA标志物 或标志物组合的特异性。这使ro患者能够通过体外诊断学鉴定。追踪标志物表达样式的 变化容许监测疾病进展和对疗法的响应。
[0115] 本文中描述的miRNA也是帕金森患者的高度特异性疗法的潜在靶物。
[0116] 补充表1,新发现的miRNA标志物
[0117]
[0118]
[0119] 补充表2 :miRNA标志物的概述,包括序列信息
[0120]
[0121]
[0122]
[012jj
[0124]
[0125]
[0126]
【主权项】
1. 一种分类患有或有风险形成帕金森氏病的患者的样品的方法,其中所述样品是血液 样品,所述方法包括下列步骤: a) 在所述样品中测定选自下组的至少一种miRNA的表达水平:具有序列SEQIDNO 69、SEQIDNO142、SEQIDNO2、SEQIDNO59、SEQIDN058 和SEQIDNO65 的miRNA; b) 比较步骤a)中测定的表达水平样式与一种或几种参照表达水平样式;并 c) 自步骤b)中比较的结果将所述患者的样品分类成至少两类之一。2. -种用于在患有或有风险形成帕金森氏病的患者中诊断帕金森氏病,预测形成帕金 森氏病的风险,或预测帕金森氏病的结果的方法,所述方法包括下列步骤: a) 在来自所述患者的血液样品中测定选自下组的至少一种miRNA的表达水平:具有序 列SEQIDNO69、SEQIDNO142、SEQIDNO2、SEQIDN059、SEQIDNO58 和SEQIDNO 65 的miRNA; b) 比较步骤a)中测定的表达水平样式与一种或几种参照表达水平样式;并 c) 自步骤b)中比较的结果诊断帕金森氏病,预测形成帕金森氏病的风险,或预测帕金 森氏病的结果。3. 根据权利要求1或2所述的方法,其中所述至少一种miRNA选自下组:具有序列SEQ IDNO69、SEQIDNO142、SEQIDNO2、SEQIDNO59、SEQIDNO58 和SEQIDNO65 的 miRNA〇4. 根据前述权利要求中任一项所述的方法,其中以表达水平值测定多个miRNA的表达 水平,并且步骤(b)包括以数学方式组合所述多个miRNA的表达水平值。5. 根据前述权利要求中任一项所述的方法,其中通过使用选自下组的方法来获得步骤 a)中表达水平的测定:基于测序的方法、基于阵列的方法和基于PCR的方法。6. 根据前述权利要求中任一项所述的方法,其中测定至少2、3、4、5、或6种miRNA的表 达水平测定以获得表达水平样式。7. -种用于实施根据权利要求1至6中任一项所述的方法的试剂盒,所述试剂盒包 含: -用于在来自所述患者的所述血液样品中测定选自下组的至少一种miRNA的表达水平 的手段:具有序列SEQIDNO69、SEQIDNO142、SEQIDNO2、SEQIDNO59、SEQIDNO 58 和SEQIDNO65 的miRNA。8. 权利要求7的试剂盒,其还包括至少一种参照表达水平样式以与来自所述样品的至 少一种miRNA的表达水平比较。9. 一种可用于实施根据权利要求1至6中任一项所述的方法的计算机程序产品,其包 含: -用于接收代表患者血液样品中选自下组的至少一种miRNA的表达水平的数据的手 段:具有序列SEQIDNO69、SEQIDNO142、SEQIDNO2、SEQIDNO59、SEQIDNO58 和SEQIDNO65 的miRNA, _用于接收代表至少一种参照表达水平样式的数据以与来自所述样品的所述至少一种miRNA的表达水平比较的手段, -用于比较代表患者样品中的所述至少一种miRNA的表达水平的所述数据的手段,和 -用于自步骤b)中比较的结果测定帕金森氏病的诊断、形成帕金森氏病的风险预测或 帕金森氏病的结果预测的手段。
【专利摘要】本发明涉及用于用miRNA标志物诊断帕金森氏病(PAD)的方法。为了鉴定用于诊断PD的生物标志物,获得miRNA表达样式的广泛分析。鉴定出显著失调的miRNA。
【IPC分类】C12Q1/68
【公开号】CN104903468
【申请号】CN201380069445
【发明人】A.凯勒, C.F.斯塔勒, J.柯尔斯滕, E.米斯, C.巴克斯, P.莱丁格
【申请人】西门子公司
【公开日】2015年9月9日
【申请日】2013年7月26日
【公告号】US20150315641, WO2014075822A1