一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法

xiaoxiao2020-10-23  21

一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法
【技术领域】
[0001] 本发明具体涉及一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法。
【背景技术】
[0002] 钻井作业风险预测是指依据以前的钻井作业数据运用一定的方法对钻井作业中 存在的风险进行预测,以达到预防和控制的目的。近年来石油和数学领域专家利用序贯高 斯同为协同模拟,模糊专家系统,案例推理技术,支持向量机和ARIMA模型等研宄手段对钻 井风险预测问题进行了比较深入的研宄。但是研宄贝叶斯网络在石油钻井方面运用的文章 还非常的少,研宄还处于比较新的阶段。
[0003] 钻井作业具有十分复杂的流程,其过程中存在许多不确定性因素的的影响。所以 对钻井过程中的影响因素进行风险预测就十分重要,有效的分析结果对现场作业具有重大 的指导意义。目前许多石油和数学领域的专家学者都在不同程度地研宄这个课题。Nima Khakzad等用蝴蝶结和贝叶斯网络方法对钻井风险进行了定量分析;ZhaoQuanmin等研 宄了在油汽钻井作业过程中人的风险因素量化方法;MajeedAbimbola等提出了一种基 于蝴蝶结方法的动态钻井风险分析方法;MariaGierczak对水平井钻井风险进行了定性 评估JialinLiu等提出了一种针对科学钻探工程的模糊动态风险评估方法。JonEspen Skogdalen等提出了海上石油钻井平台防止井喷的安全指标体系;FranciscoSdnchez等 建立了模型来证明风险分析在套管随钻技术上的应用;NimaKhakzad等研宄了运用蝴蝶 结和贝叶斯网络方法对钻井风险进行定量分析;S.M.MiriLavasani等提出了一种基于层 次分析和证据推理相结合的方法来估计海上石油钻井风险;综合在石油钻井风险方面的调 研发现其主要工作还是集中在对风险的定性定量描述与分析,而在风险预测方面的文献不 多。马尔科夫链在随机事件的预测方面应用广泛,预测效果显著。LisaM.Sweeney等运用 马尔科夫蒙特卡洛仿真方法建立了一个生物数学模型来描述煤炭工人肺部的长期保留颗 粒物。JavanD.等运用随机模型中马尔科夫链的形式开发了一种有效的方法来模拟和分析 多分散颗粒系统的整体动态;HenriBerthiaux等提出了运用马尔科夫链方法来模拟粒子 技术中的不同进程。贝叶斯网络是一种将概率论知识和图论相结合的表示事件之间的不确 定性影响的网络结构。目前,在风险分析和预测方面应用较为广泛。C.F.Flegbede等基于 贝叶斯网络理论提出了一种原始的方法来优化样本计划以监测由过敏症患者食用的产品 的过敏源;YitYinWee等建立贝叶斯网络模型来分析时间的根本原因。ZhongxingL等在 其论文中提出了一种基于贝叶斯网络的汽车轴承故障诊断方法。YitYinWee等提出了针 对飞机引擎的贝叶斯网络和分布式粒子群故障诊断方法。上述文献均应用贝叶斯网络进行 故障诊断,找到故障发生的本质因素。MariaH&minen,等建立了基于贝叶斯网络的海事 安全管理模型;〇zan1((^&(1391|等提出了一种进化的蒙特卡洛方法来训练贝叶斯网络以进 行时间序列预测[18],这两篇文章运用贝叶斯网络进行风险预测,不足之处在于贝叶斯网 络是基于概率的预测方法,期预测结果是一个概率分布。

【发明内容】

[0004] (一)要解决的技术问题
[0005] 为了解决上述问题,本发明提出了一种基于马尔科夫链和贝叶斯网络的钻井风险 预测方法;其运用马尔科夫链和贝叶斯网络从纵横两个方面对钻井风险做了比较全面的分 析和预测,创新性的处理了马尔科夫链在处理上层指标确缺失这个方面的不足。贝叶斯网 的一个巨大优点在于其不仅有比较可靠地预测功能还具备推理功能,这使得我们在得出预 测结构后可以对风险发生率较高的指标进行"靶验证"得到具体主要影响本指标的其他指 标。
[0006] (二)技术方案
[0007] -种基于马尔科夫链和贝叶斯网络的钻井风险预测方法,其运用马尔科夫链和贝 叶斯网络从纵横两个方面对钻井风险做了比较全面的分析和预测;马尔科夫链是探索由样 本所决定的在未来时间里变量的概率分布,是一种纵向预测的方法;贝叶斯网络则展示出 指标之间的相互影响关系,是一种横向预测方法;其具体步骤如下:
[0008] (1)马尔科夫链预测方法:
[0009] a.马尔科夫链:定义设{xt(?),tGT}pc/?1)为定义在概率空间⑷,F,P)而 取值于可测空间(E,B)的随机过程;如果对任意有穷多个&<…<tn,tiGT,任意AGB, 有概率
[0011] 那么称此过程为马尔科夫过程,性质(1. 1)称为马尔科夫性;具有马尔科夫性的 随机过程就叫马尔科夫链;
[0012] 若在xn=k,记E在下一时刻处于状态xn+1=j的概率为pij;在"第m步时位于i" 的条件下,经k步后转移到j的条件概率P(Xm+k=j|Xm=i)简记为,并记矩阵
[0013] mP(k)= (y%) (i,j= 0,1,2,…)(1.2)
[0014] 称为转移概率矩阵;
[0015] 若{xn}的转移矩阵概率与m无关,称马氏链{xn}为齐次的油j)%的定义,显然 有:
[0017] 在实际应用中,人们主要研宄的是齐次马尔科夫链;
[0018] 引理1.对任意正整数k及1,有
[0020] 或采用矩阵记号
[0021] fflp(k+1)=fflp(k)*ffl+kp(1), (1.4)
[0022] 称等式(1. 3)或(1. 4)为Kolmogorov-Chapman方程;这个公式就是计算k步概率 转移矩阵的理论支持;
[0023] b.马尔科夫链预测步骤:
[0024] ①.检验数据是否具有马尔科夫性;若有,转第二步,否则不能用马尔科夫理论处 理数据;
[0025] ②.计算每个指标的转移概率矩阵并建立预测模型;
[0026] ③.基于第二部计算得的转移概率矩阵,选取初始状态进行预测;
[0027] ④.结果与误差分析;
[0028] (2)贝叶斯网络预测方法:
[0029] a.贝叶斯网络结构:建立贝叶斯网络,采用手工学习的方法建立三层贝叶斯网 络,其中"物的因素"指标是底层指标,也就是事件的最终结果,"安全防护缺陷"、"设备设施 缺陷"、"作业环境不良"与"自然环境不良"四个指标作为中间层,其余七个指标作为顶层指 标即原因指标;由于不能确保同一层指标间的独立性,所以采用机器学习的方法对同层网 络进彳T训练;
[0030] b.贝叶斯网络参数:确定了贝叶斯网络结构,就可以进行贝叶斯网络参数学习 了,贝叶斯网络参数学习可以采用最大似然估计和贝叶斯估计两种方法;
[0031] 一个由n个变量X= {Xi,X2,…,XJ组成的贝叶斯网络;;设其中的节点Xi* 有巧个取值1,2,…,ri,其父节点的取值共有qif组合,1,2,…,qi;如果Xi没有 父节点则1= 1.则网络参数可以表示为:
[0032] 9 ijk=sumP(X!=k|Jr(XJ=j)
[0033] 其中i的取值范围是1~n,对于一个固定的i,j和k的取值范围分别是从1~ qi及1~ri用0表示所有0ijk组成的向量;
[0034] 设
1是一组关于|的完整i.i.d数据,则0的对数似然函数 为
[0036] 为了得到关于logP(Di| 0 )的表达式,定义样本h的特征函数
[0038] 那么有
[0040] 定义
[0042] 即mijk是数据中满足Xi=k且Jr(X) =j的样本数量;于是
[0043]
[0044]这里{mijk|i= 1,2,???]!;j= 1,2,…qi;k= 1,2,???!J是充分统计量;
[0045] 定理1:对于满足
的非负函数f(X),定义概率分布P#(X)为
[0047] 那么对于任意其他的概率分布P(X)有
[0049] 其中当且仅当P#=P的时候等号成立;
[0050] 对于任意固定的i和j,由于
,根据定理1,当Qijk取值如下时
[0052]表达式
的值达到最大,从而L(0I? )达到最大;0;;是9 ijk的最 大似然估计;直观上有
[0054]c.贝叶斯网络推理:贝叶斯网络推理问题本质是计算条件概率分布;设证据变量 集为E,查询变量集为Q,那么贝叶斯网络推理即是在给定证据变量集合E=e的情况下,计 算查询变量Q的后验概率分布,可形式描述为:
[0056] d.贝叶斯网络预测步骤:
[0057] ①.建立贝叶斯网络要求完整的i.i.d数据,所以首先要检验数据样本是否具有 独立同分布性质。
[0058] ②.进行贝叶斯网络结构学习,可以采用纯数据推动的"机器学习"或者依靠先验 知识的"手工建网"。
[0059] ③.进行贝叶斯网络参数学习,通常在进行"机器学习"的过程中同时进行参数学 习,但如果网络结构是纯手工建立,则需单独进行参数学习。
[0060] ④.设置"证据数据"进行预测推理并论证网络模型的合理性。
[0061] (3)马尔科夫链和贝叶斯网络融合的预测方法
[0062] 现将样本Xk(xVxk2~xkn)作为马尔科夫预测的一组初始值,Px为样本所对应的概 率矩阵,做三步预测有:
[0063] XK+1=XK*Px3 (3. 1)
[0064] 这里XK+1就是下一个状态各变量的分布列,可以根据这个分布列判断某一指标在 未来状态下发生的概率大小;
[0065] 同时,贝叶斯网络也可以做到这一点,贝叶斯网络具有横向推理的重要功能;将马 尔科夫链的预测结果作为一组证据输入贝叶斯网络中经过训练网络参数就能够达到预测 其他指标分布的效果;基于马尔科夫链和贝叶斯网络的预测步骤:
[0066] ①基于原始i.i.d数据(数据具有马尔科夫),建立贝叶斯网络并进行参数学习;[0067] ②运用马尔科夫链方法选取初始状态进行预测;
[0068] ③将预测结果作为证据输入贝叶斯网络;
[0069] ④进行贝叶斯网络推理,预测。
[0070](三)有益效果
[0071] 本发明提出了一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法,与现有技 术相比较,其具有以下有益效果:本发明相比较于传统的工艺处理有很多的优点:运用马 尔科夫链和贝叶斯网络从纵横两个方面对钻井风险做了比较全面的分析和预测,创新性的 处理了马尔科夫链在处理上层指标确缺失这个方面的不足。贝叶斯网的一个巨大优点在于 其不仅有比较可靠地预测功能还具备推理功能,这使得我们在得出预测结构后可以对风险 发生率较高的指标进行"靶验证"得到具体主要影响本指标的其他指标。
【附图说明】
[0072] 图1是贝叶斯网络模型示意图。
[0073] 图2是2012年8月27日风险发生的概率大小示意图。
【具体实施方式】
[0074] -种基于马尔科夫链和贝叶斯网络的钻井风险预测方法,其运用马尔科夫链和贝 叶斯网络从纵横两个方面对钻井风险做了比较全面的分析和预测;马尔科夫链是探索由样 本所决定的在未来时间里变量的概率分布,是一种纵向预测的方法;贝叶斯网络则展示出 指标之间的相互影响关系,是一种横向预测方法;其具体步骤如下:
[0075] (1)马尔科夫链预测方法:
[0076] a?马尔科夫链:定义设|xt(?),tGT} (rcz/?1)为定义在概率空间⑷,F,P)而 取值于可测空间(E,B)的随机过程;如果对任意有穷多个&<…<tn,tiGT,任意AGB, 有概率
[0078] 那么称此过程为马尔科夫过程,性质(1. 1)称为马尔科夫性;具有马尔科夫性的 随机过程就叫马尔科夫链;
[0079] 若在xn=k,记E在下一时刻处于状态xn+1=j的概率为pij;在"第m步时位于i" 的条件下,经k步后转移到j的条件概率P(Xm+k=j|Xm=i)简记为,并记矩阵
[0080] mP(k)= (y'O(i,j= 0,1,2,…)(1.2)
[0081] 称为转移概率矩阵;
[0082] 若{xn}的转移矩阵概率与m无关,称马氏链{xn}为齐次的油j/%的定义,显然 有:
[0084] 引理1.对任意正整数k及1,有
[0086] 或采用矩阵记号
[0087] fflp(k+1)=fflp(k)*ffl+kp(1), (1.4)
[0088] 称等式(1. 3)或(1. 4)为Kolmogorov-Chapman方程;这个公式就是计算k步概率 转移矩阵的理论支持;
[0089] b.马尔科夫链预测步骤:
[0090] ①.检验数据是否具有马尔科夫性;若有,转第二步,否则不能用马尔科夫理论处 理数据;
[0091] ②.计算每个指标的转移概率矩阵并建立预测模型;
[0092] ③.基于第二部计算得的转移概率矩阵,选取初始状态进行预测;
[0093] ④?结果与误差分析;
[0094] (2)贝叶斯网络预测方法:
[0095]a.贝叶斯网络结构:建立贝叶斯网络,采用手工学习的方法建立三层贝叶斯网 络,其中"物的因素"指标是底层指标,也就是事件的最终结果,"安全防护缺陷"、"设备设施 缺陷"、"作业环境不良"与"自然环境不良"四个指标作为中间层,其余七个指标作为顶层指 标即原因指标;由于不能确保同一层指标间的独立性,所以采用机器学习的方法对同层网 络进彳T训练;
[0096]b.贝叶斯网络参数:确定了贝叶斯网络结构,就可以进行贝叶斯网络参数学习 了,贝叶斯网络参数学习可以采用最大似然估计和贝叶斯估计两种方法;
[0097] -个由n个变量X={XpX2,…,XJ组成的贝叶斯网络況;设其中的节点 有巧个取值1,2,…,ri,其父节点的取值共有qif组合,1,2,…,qi;如果Xi没有 父节点则1= 1.则网络参数可以表示为:
[0098] 9 ijk=sumP(X!=k|Jr(XJ=j)
[0099] 其中i的取值范围是1~n,对于一个固定的i,j和k的取值范围分别是从1~ qi及1~ri用0表示所有0ijk组成的向量;
[0100]
是一组关于|的完整i.i.d数据,则0的对数似然函数 为
[0102] 为了得到关于logPOd0 )的表达式,定义样本Di的特征函数
[0104] 那么有
[0106] 定义
[0108] 即mijk是数据中满足Xi=k且Jr(X) =j的样本数量;于是
[0110]这里{mijk|i= 1,2,...n;j= 1,2,…qi;k= 1,2,...rJ是充分统计量;
[0111] 定理1:对于满足
1的非负函数f(x),定义概率分布P#(X)为
[0113] 那么对于任意其他的概率分布P(X)有
[0115] 其中当且仅当p*=p的时候等号成立;
[0116] 对于任意固定的i和j,由于
,根据定理1,当Qijk取值如下时
tons] 表达式
的值达到最大,从而厶(0|1))达到最大;6C是0ijk的最 大似然估计;直观上有
[0120]c.贝叶斯网络推理:贝叶斯网络推理问题本质是计算条件概率分布;设证据变量 集为E,查询变量集为Q,那么贝叶斯网络推理即是在给定证据变量集合E=e的情况下,计 算查询变量Q的后验概率分布,可形式描述为:
[0122]d.贝叶斯网络预测步骤:
[0123] ①.建立贝叶斯网络要求完整的i.i.d数据,所以首先要检验数据样本是否具有 独立同分布性质。
[0124] ②.进行贝叶斯网络结构学习,可以采用纯数据推动的"机器学习"或者依靠先验 知识的"手工建网"。
[0125] ③.进行贝叶斯网络参数学习,通常在进行"机器学习"的过程中同时进行参数学 习,但如果网络结构是纯手工建立,则需单独进行参数学习。
[0126] ④.设置"证据数据"进行预测推理并论证网络模型的合理性。
[0127] (3)马尔科夫链和贝叶斯网络融合的预测方法
[0128] 现将样本XkUVxk2~xkn)作为马尔科夫预测的一组初始值,Px为样本所对应的概 率矩阵,做三步预测有:
[0129] XK+1=XK*Px3 (3. 1)
[0130] 这里XK+1就是下一个状态各变量的分布列,可以根据这个分布列判断某一指标在 未来状态下发生的概率大小;
[0131] 同时,贝叶斯网络也可以做到这一点,贝叶斯网络具有横向推理的重要功能;将马 尔科夫链的预测结果作为一组证据输入贝叶斯网络中经过训练网络参数就能够达到预测 其他指标分布的效果;基于马尔科夫链和贝叶斯网络的预测步骤:
[0132] ①基于原始i.i.d数据(数据具有马尔科夫),建立贝叶斯网络并进行参数学习;
[0133] ②运用马尔科夫链方法选取初始状态进行预测;
[0134] ③将预测结果作为证据输入贝叶斯网络;
[0135] ④进行贝叶斯网络推理,预测。
[0136] 本例运用马尔科夫链和贝叶斯网络结合的方法分析一组来自钻井现场的数据,并 对风险作出预测。底层指标体系和整理后的部分数据如表1,表2所示,底层指标与上层指 标的关系是指已经确定的指标间的父子关系(从左到右是各层之间的对应节点的父子关 系),这种关系是用手工的方式融入到贝叶斯网络模型的。
[0137] 表 1

[0140]表 2
[0142] (1)钻井风险的马尔科夫链预测
[0143] a对数据进行"马氏性检验"
[0144] 因为钻井风险各指标并非0-1变量,本例将其分为四个级别即:极低,低,中,高。 针对指标XiS义矩阵:
[0146] 为指标的频数转移矩阵,其中以Sn为例,表示本指标在第k个样本处于极低状态 而且第k+1个样本也处于极低状态的频数,其中k= 1,2…n-1。再对频数转移矩阵的每一 行进行单位化,就可以得到\的概率转移矩阵:
[0147]
[0148]其中:
[0150] 以此类推。
[0151] 构造统计量x2以检验数据是否具有"马氏性":
[0153] 不难计算x2是以自由度为1的x2分布为极限分布,故认为数据具有马尔科夫 性。同理,对其余各个指标的数据进行处理,结果显示其余各指标亦具马尔科夫性。接下来 本文用马尔科夫链建立预测模型。
[0154] (b)马尔科夫链模型
[0155] 运用马尔科夫链预测要求我们将X /变量的四种取值状态定义为矩阵形式有:极低 =[1 0 0 0];低=[0 1 0 0];中=[0 0 1 0];高=[0 0 0 1];所以我们将实际测得的 输入状态与概率转移矩阵做矩阵乘法就得到一步预测结果,一般而言,预测步数在三至五 步是比较好的,五步以上已经没有多大意义;故本文选取三步作为预测范围。记初始值为矩 阵A,转移矩阵为B。则可以将三步预测公式表示为:
[0156] A(麵值)=A(初始值)XB3
[0157] (1. 3)
[0158] (c)预测及模型检验:
[0159] 我们选取2012年8月25日这一样本作为输入值预测2012年8月26日的风险发 生概率分布见表3并将预测结果处理后与实际值比较见表4 :
[0160]表3

[0163]表 4
[0165] 实验结果显示,马尔科夫链的预测效果十分好,吻合程度也相当高。
[0166] (2)钻井风险的新方法预测
[0167] a.贝叶斯网络模型
[0168] 建立贝叶斯网络结构采用的是机器-手工相结合的方式,需要说明的一点是建立 网络结构和进行参数训练的时候上层指标的数据来自于下层指标数据的累加,这样就容易 使网络过度拟合造成上下层之间形成闭合的影响关系,对全部节点进行机器学习的过程中 强制要求:上下级节点之间不允许出现的关系即强制要求子节点不能成为父节点或、"父节 点的兄弟节点"和"祖先节点"的父节点。贝叶斯网络模型如图1所示。
[0169]b.马尔科夫链预测
[0170] 用贝叶斯网络模型中的模型以2012年8月26日底层指标的取值作为初始值,预 测2012年8月27日的风险分布见表5。
[0171]表 5
[0174] 将马尔科夫链预测的结果作为一组证据输入贝叶斯网络,以预测上层指标在2012 年8月27日风险发生的概率大小如图2所示。
[0175] 预测结果显示:"物的安全因素"这一个顶层指标在以用马尔科夫链做出2012年 8月27日底层指标分布为证据的情况下,发生为极低的概率为50%,发生为低的概率为 38 %,发生为中的概率为6 %,发生为高的概率为5 %。其他指标以此类推见表6。
[0176]表6

[0178] 贝叶斯网络不仅拥有强大的预测能力,还具有优越的反推功能。如我们假设宏观 指标(上层指标)中的"物安全因素"发生为高的概率为100%,则直接将其设定为证据对 网络进行训练,观察其他指标的概率分布变化,如果"高"的取值概率发生了较大的增长,则 说明在需要进宏观调控以减小"物的安全因素"取值为"高"的发生概率时主要针对这些指 标进行改善。表7表明主要影响"物的安全因素"的指标是"c-g.设备设施缺陷",所以我 们总结:在钻井风险作业现场风险的最大隐患来自于设备设施的缺陷,如果风险的发生概 率过大,就应该首先考虑是由于设备设施缺陷带来的影响。
[0179] 表 7

[0181] 上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的构 思和范围进行限定。在不脱离本发明设计构思的前提下,本领域普通人员对本发明的技术 方案做出的各种变型和改进,均应落入到本发明的保护范围,本发明请求保护的技术内容, 已经全部记载在权利要求书中。
【主权项】
1. 一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法,其运用马尔科夫链和贝叶 斯网络从纵横两个方面对钻井风险做了比较全面的分析和预测;马尔科夫链是探索由样本 所决定的在未来时间里变量的概率分布,是一种纵向预测的方法;贝叶斯网络则展示出指 标之间的相互影响关系,是一种横向预测方法;其具体步骤如下: (1) 马尔科夫链预测方法: a. 马尔科夫链:定义设为定义在概率空间(Q,F,P)而取值于可 测空间(E,B)的随机过程;如果对任意有穷多个^ <~<K_ ,任意A e B,有概率 尸(?',"·,'-,)=pkeA 丨气 _,), (1· D 此过程为马尔科夫过程,性质(1.1)称为马尔科夫性;具有马尔科夫性的随机过程就 叫马尔科夫链; 在\= k,记Σ在下一时刻处于状态xn+1= j的概率为Pij;在"第m步时位于i"的条 件下,经k步后转移到j的条件概率P(xm+k= j|xm= i)简记为mp(k^,并记矩阵 mP(k)= (j/%) (i,j = 0,1,2,…)(1.2) 称为转移概率矩阵; {xj的转移矩阵概率与m无关,称马氏链{xn}为齐次的;由"^(%的定义,有:引理1.对任意正整数k及1,有(1.3) 或采用矩阵记号 mp(k+1)= mp(k)*m+kp(1), (1·4) 称等式(I. 3)或(I. 4)为Kolmogorov-Chapman方程;这个公式就是计算k步概率转移 矩阵的理论支持; b. 马尔科夫链预测步骤: ① .检验数据是否具有马尔科夫性;若有,转第二步,否则不能用马尔科夫理论处理数 据; ② .计算每个指标的转移概率矩阵并建立预测模型; ③ .基于第二部计算得的转移概率矩阵,选取初始状态进行预测; ④ .结果与误差分析; (2) 贝叶斯网络预测方法: a. 贝叶斯网络结构:建立贝叶斯网络,采用手工学习的方法建立三层贝叶斯网络,其 中"物的因素"指标是底层指标,也就是事件的最终结果,"安全防护缺陷"、"设备设施缺 陷"、"作业环境不良"与"自然环境不良"四个指标作为中间层,其余七个指标作为顶层指标 即原因指标;由于不能确保同一层指标间的独立性,所以采用机器学习的方法对同层网络 进行训练; b. 贝叶斯网络参数:确定了贝叶斯网络结构,就可以进行贝叶斯网络参数学习了,贝 叶斯网络参数学习可以采用最大似然估计和贝叶斯估计两种方法; 一个由η个变量X = (X1, X2,…,XJ组成的贝叶斯网络;设其中的节点Xi共有Ti个取值1,2,···,!>其父节点Ji(Xi)的取值共有qif组合,1,2,"^q i;如果有父节 点则qi= 1.则网络参数可以表示为: Θ iJk= sumP(X i = k| π (X i) = j) 其中i的取值范围是1~η,对于一个固定的i,j和k的取值范围分别是从1~ 1~:^用Θ表示所有Θ ijk组成的向量; 设!)=(Z)pD2,···!),")是一组关于f的完整i.i.d数据,则Θ的对数似然函数为为了得到关于IogPQ1I Θ)的表达式,定义样本D1的特征函数即mijk是数据中满足X i= k且π (X J = j的样本数量;于是这里 ImijkIi = I, 2,···]!;」=1,2,…qi;k=l,2,"Tj 是充分统计量; 定理1 :对于满足的非负函数f(X),定义概率分布K(X)为那么对于任意其他的概率分布P(X)有其中当且仅当K= P的时候等号成立; 对于任意固定的i和j,由于,根据定理1,当Θ ijk取值如下时表达式的值达到最大,从而)达到最大;6^是Θ.的最大似 然估计;直观上有c. 贝叶斯网络推理:贝叶斯网络推理本质是计算条件概率分布;设证据变量集为Ε,查 询变量集为Q,那么贝叶斯网络推理即是在给定证据变量集合E = e的情况下,计算查询变 量Q的后验概率分布,可形式描述为:d. 贝叶斯网络预测步骤: ① .建立贝叶斯网络要求完整的i. i. d数据,首先要检验数据样本是否具有独立同分 布性质; ② .进行贝叶斯网络结构学习,可以采用纯数据推动的"机器学习"或者依靠先验知识 的"手工建网"; ③ .进行贝叶斯网络参数学习,通常在进行"机器学习"的过程中同时进行参数学习, 但如果网络结构是纯手工建立,则需单独进行参数学习; ④ .设置"证据数据"进行预测推理并论证网络模型的合理性; (3)马尔科夫链和贝叶斯网络融合的预测方法 现将样本XkUk1, X1V-Xkn)作为马尔科夫预测的一组初始值,&为样本所对应的概率矩 阵,做三步预测有: 这里χκ+1就是下一个状态各变量的分布列,可以根据这个分布列判断某一指标在未来 状态下发生的概率大小;同时,贝叶斯网络也可以做到这一点,贝叶斯网络具有横向推理的重要功能;将马尔科 夫链的预测结果作为一组证据输入贝叶斯网络中经过训练网络参数就能够达到预测其他 指标分布的效果;基于马尔科夫链和贝叶斯网络的预测步骤: ① 基于原始i.i.d数据(数据具有马尔科夫),建立贝叶斯网络并进行参数学习; ② 运用马尔科夫链方法选取初始状态进行预测; ③ 将预测结果作为证据输入贝叶斯网络; ④ 进行贝叶斯网络推理,预测。
【专利摘要】本发明公开了一种基于马尔科夫链和贝叶斯网络的钻井风险预测方法,运用马尔科夫链和贝叶斯网络从纵横两个方面对钻井风险做了比较全面的分析和预测,创新性的处理了马尔科夫链在处理上层指标确缺失这个方面的不足。马尔科夫链是探索由样本所决定的在未来时间里变量的概率分布,是一种纵向预测的方法。贝叶斯网络则展示出指标之间的相互影响关系,是一种横向预测方法。结合这两种方法有一个优势在于可以解决多层指标体系的非底层指标数据缺乏的问题,以实现宏观意义上的风险预测。贝叶斯网络的反推功能也为风险控制提供了基础。
【IPC分类】G06Q10/04, G06K9/62, G06K9/66
【公开号】CN104899664
【申请号】CN201510336740
【发明人】王兵, 赵春兰, 肖斌, 李建
【申请人】西南石油大学
【公开日】2015年9月9日
【申请日】2015年6月17日

最新回复(0)