高炉铁水硅含量四分类趋势预报模型的建立方法及应用
【技术领域】
[0001] 本发明涉及一种高炉冶炼过程中铁水硅含量趋势预报模型的建立方法及应用,属 于自动化检测技术领域。
【背景技术】
[0002] 铁水硅含量是表征高炉炼铁过程炉温及其变化趋势的关键信息,也是反应铁水质 量、能耗等指标的重要物理量。但铁水硅含量及其变化趋势无法直接在线检测,导致对炉况 调控不及时或者盲目,致使炉温大幅波动、炉况不顺,若炉温过低,则铁水物理热不足,炉缸 热储备不够,不仅铁水质量差,且容易造成严重的炉缸冻结事故;若炉温过高,则炉内煤气 流太过旺盛,导致悬料、崩料等事故,严重影响高炉的焦比、排放。因此研宄如何实时预报铁 水硅含量及其变化趋势,对稳定高炉热状态、减少炉况的波动、提高生铁质量和降低焦比等 具有重要意义。
[0003] 目前,对高炉铁水硅含量的预测可分为两大方向,一是利用检测得到的大量数据 建立基于数据驱动的数值预测模型,也称为黑箱模型。常用的黑箱模型有:时间序列预测模 型、神经网络预测模型、混沌模型、SVM预测模型、非线性动力学理论预测模型等。二是通过 将高炉铁水硅含量的数值转变为上升和下降的趋势变化,进而建立铁水硅含量的二分类趋 势预报。目前,关于铁水硅含量趋势预报方面的文献还比较少,而实际应用中,高炉工厂一 般根据经验判断炉温的变化趋势,进而进行操作调节。
[0004] 基于数据驱动的预测模型以铁水硅含量为高炉炉温的衡量标准,研宄高炉冶炼过 程参数与硅含量的函数关系,是一种仅依赖于系统输入输出的黑箱模型方法,对高炉铁水 硅含量的预报有一定的效果,但是仍存在自身局限性,如时间序列模型更适应于炉况平稳 的情形;神经网络能够获得比时间序列更好的预测效果,但是在实际应用中学习时间长且 容易产生拟合现象;SVM的预测模型具有很好的泛化性能,在大多数情况下能获得优于其 他方法的预测效果。
[0005] 然而,上述的数据驱动模型主要集中在铁水硅含量的数值预测上,很少关注趋势 的变化。尽管数值预测给出了铁水硅含量直接的结果,但是数值预测结果有时候会对铁水 硅含量趋势的变化无法做出诊断或者做出错误的诊断。例如,在连续的两炉铁水中硅含量 数值的变化很小,甚至比评价是否成功命中的临界值都小,这种情况下没有必要去构建数 值预测模型,因为单一的预测模型卜S7j(/ +1) =LS/j(〇完全依据目标命中率来评判,而此时的 命中率虽然显示成功命中,却无法表针硅含量的这种微小变化,从这一点也可以得到,预测 高炉炉缸热状态,也就是预测高炉铁水硅含量的趋势变化至关重要。
[0006] 目前,对铁水硅含量的趋势变化的研宄主要集中在二分类预报问题(即铁水硅含 量上升和下降),但是二分类的预报只能得到趋势变化的方向,无法得到这种方向变化的幅 度。
[0007] 中国专利申请公布号CN103160629A,申请公布日2013. 06. 19,公开了一种预报 高炉趋热的方法,其综合考虑了整个炼铁工艺中影响铁水硅含量的因素。通过建立三个预 测模型,分别为:高炉铁水中的Si含量的RBF神经网络计算模型、高炉料速计算模型、理论 燃烧温度计算模型,然后利用这三个模型对高炉趋热结果的判断,最终得到高炉是否趋热。 但是该方法仅仅可以预测高炉是否趋热,对于其他变化趋势无法得到判断,比如高炉是否 趋冷,或者趋热趋冷的程度等等,都无法得到准确的信息。
[0008] 中国专利申请公布号CN103160626A,申请公布日2013. 06. 19,公开了一种判断高 炉炉缸过凉的方法,该方法与CN103160629A类似,不同点在于该方法揭示了一种判断高 炉炉缸过凉的方法。分别从物理传热、化学传热、历史数据等影响高炉向凉发展的角度出 发,建立了三个预测模型,分别为:高炉铁水中的Si含量的RBF神经网络计算模型、高炉料 速计算模型、理论燃烧温度计算模型。综合三个模型所得结果判断高炉炉缸是否过凉。但 是该方法也是只能判断一种炉温变化情况,无法获取炉温是否趋热、以及趋冷趋热程度的 变化信息。另外,三个模型得到的数值对铁水硅含量影响的权重判断无法准确划分,这对预 报结果的命中率有一定影响。
[0009] 中国专利申请公布号CN10211383A,申请公布日2008. 7. 2,公开了一种高炉铁水 硅含量的特征分析预报方法,该方法建立了一种高炉铁水硅含量的预报模型,采取改进的 动态独立成分分析方法对输入变量的样本数据进行特征提取,提取了测量对象的高阶统计 信息,通过小样本建模设计的基于遗传算法优化的最小二乘支持向量机方法建立铁水硅含 量预报回归模型。但是该方法只能预测得到下一炉铁水硅含量的数值,无法准确判断炉温 的变化,更无法获取炉温趋势的变化程度,可以反馈给高炉操作者的信息少,可靠性不高。
[0010] 中国专利申请公布号CN102031319A,申请公布日20011. 04. 27,公开了一种高炉 铁水硅含量的预报方法,该方法将炉况分为小波动和大波动两种情况分别建模,分别对炉 况稳定和波动都进行了预报,当炉况波动较小时主要依靠均线系统,在炉况波动大时自动 加入风口理论燃烧温度以及前次铁水含硫量,达到预测铁水硅含量的目的。该方法虽然综 合考虑了炉况稳定和异常两种情况,但是在实际应用中,无法提前预判何时出现异常炉况, 进而也就无法及时更换预测模型,对结果的命中率有一定影响。
[0011] 综上所述,现有的各种预测炉温的方法,或无法全面预报,或只能预报数值,而对 于炉温趋势预报的方法较少。
【发明内容】
[0012] 本发明的目的是提出一种高炉铁水硅含量四分类趋势预报模型的建立方法及应 用,根据与高炉铁水硅含量有密切关系的可控以及不可控变量的历史数据,利用极限学习 机(extremelearningmachine,ELM)建立四分类趋势预报模型,优选并采用状态转移算 法优化模型参数,进而利用所建模型来预报未来一段时间硅含量的变化趋势。利用本发明 所建立的模型不仅可以预报硅含量变化的趋势,同时可以得到趋势变化的幅度大小,即可 以预报得到下一炉铁水硅含量是大幅上升、小幅上升、大幅下降、小幅下降的四分类趋势情 况。这对高炉操作者提早判断炉况,并采取小调、早调等措施,避免炉况发生急剧变化有很 好的指导。
[0013] 本发明目的是通过以下技术方案实现的,一种高炉铁水硅含量四分类趋势预报模 型的建立方法,包括:采集历史数据;进行数据预处理,以确定模型输入变量(即铁水硅含 量影响因子)和输出变量;优选结合时滞分析和\或专家经验分析确定模型输入变量;依 据模糊均值聚类的方法对铁水硅含量样本有效的聚类,达到对数据集进行正确的分类,获 取模型输出变量一一铁水硅含量的四类趋势变化区间的划分标准,即大幅上升、小幅上升、 大幅下降、小幅下降的评判指标;利用极限学习机建立四分类趋势预报模型即ELM分类器; 优选采用状态转移算法优化所述预报模型参数。
[0014] 具体地,所述高炉铁水硅含量四分类趋势预报模型的建立方法,包括以下步骤:
[0015] S1、采集历史数据
[0016] 所述采集历史数据为采集整个炼铁过程中影响铁水硅含量变化的变量及铁水硅 含量数据。
[0017] 由于高炉内部的复杂物理化学反应,其间接影响铁水硅含量变化的变量有很多, 包括上部的布料方式、原料性质,下部的控制参数如风量、风温等。常用的变量数据有富 氧率、透气性指数、标准风速、富氧流量、冷风流量、喷煤量、铁水成分、煤气成分、顶压、全压 差、热风压力、实际风速、冷风压力、理论燃烧温度、热风温度、鼓风动能、富氧流量、富氧压 力、炉腹煤气量等等。
[0018] S2、数据预处理
[0019] 所述数据预处理即通过对现场炼铁工艺了解,对可采集到的历史数据进行分析, 获得时间点对应的时间序列样本、剔除异常数据、确定模型输入变量(即与铁水硅含量相 关性强的变量)和输出变量、归一化处理及差分处理。具体包括以下步骤:
[0020] S21、获得时间点对应的时间序列样本;
[0021] 采集历史数据时,不同变量有不同的采样周期(或间隔),因此在数据预处理之前 需要折中考虑。以一个变量的时间间隔为参照(例如以采样周期最长的变量的时间间隔, 本发明的一种【具体实施方式】为lh),依据时间点对应对所有变量进行匹配,最终得到所需时 间序列样本。比如:铁水成分(如:Si,Ti,S,P,Mn)的采集周期大概为40min,煤气成分 (如:H2,CO,C02)的采集周期为ls,喷煤量的采集周期为30min,而一些控制变量(喷煤量、 热风温度、富氧量、风量等)和状态变量(透气性指数、炉顶温度)的采集周期为lh。在建 立本发明所述模型时,需要相同时间点对应的各个变量值作为模型的一个输入样本。本发 明的一种实施方式中以最长的采集周期lh为参照,通过时间点对应对所有变量进行匹配, 最终提取时间序列样本。
[0022] S22、剔除异常数据;
[0023] 在采样过程中,受到高温高压等环境影响或者高炉休风、减风等非正常状况,数据 存在异常值。这些异常数据在一定程度上会改变数据的变化趋势,影响模型建立的准确性, 因此需要对异常数据进行剔除。
[0024] 本发明通过3〇准则进行异常值(和缺失值)处理,剔除异常数据,即若残差|V」 > 3〇,则该数据为异常数据,该样本为异常样本,予以剔除。重复使用该方法剔除异常数 据,直至没有异常数据为止。
[0025] 其中:
[0027]Xi为所处理的数据,N为样本个数。
,为\的残差。
[0028] S23、确定模型输入变量和输出变量;
[0029] 对所有采集到的影响铁水硅含量变化的变量与铁水硅含量之间进行相关性分析, 以与铁水硅含量的变化相关性强的变量,作为本发明所述模型的输入变量;以铁水硅含量 作为输出变量。由于高炉内部的复杂物理化学反应,其间接影响铁水硅含量的因素有很多, 包括上部的布料方式、原料性质,下部的控制参数如风量、风温等。本发明在建立所述模型 时,将影响铁水硅含量的变化强的变量作为模型输入变量,将铁水硅含量作为模型输出变 量。铁水中硅含量的变化与固体原料,包含铁矿石、烧结矿和焦炭;待加热的气态物质,包含 空气和一些辅助燃料;以及下部的风量、风温等参数的变化有密切的关系。表1列出了 20 个待选变量。过多的输入
变量会增加模型的复杂度,而过少的输入变量又会降低模型精度。 因此,在建立模型时有必要删除待选变量中与铁水硅含量相关性不强的变量。本发明在一 种【具体实施方式】中,通过SPSS(StatisticalProductandServiceSolutions,S卩"统计产 品与服务解决方案"软件),计算了所有待选变量与铁水硅含量的相关系数,结果如表1所 不〇
[0030] 值得说明的是,虽然透气性指数与硅含量的相关性系数不高,但在实际高炉调控 中,它是现场操作者判断铁水硅含量变化的重要依据之一,因此,本发明在建模时也将其作 为模型输入变量。
[0031] 同时,由于高炉自身特点所决定,高炉的工艺参数对高炉炉温[Si]具有时滞影 响,即存在一定的滞后性,及存在滞后时间。所谓的滞后时间指的是某一参数的变化将在n 小时或n分钟之后才会导致高炉炉温[Si]发生变化。那么所谓的滞后时间也可以这样理 解,某一时刻的高炉炉温[Si]受n小时或n分钟以前的工艺参数的影响,对应着那一段时 间的工艺参数,相关性是最大的,也是最密切的。因此,要确定相关变量的滞后时间,需要借 助于高炉现场专家人员的经验及相关性分析的手段。具体地,本发明通过SPSS进行时滞分 析,得到上一炉铁水硅含量与本炉铁水硅含量有很强的相关性,因此,将上一炉铁水硅含量 也作为待选变量进行选择。本发明在建模时也将时滞(即上一炉铁水硅含量)作为模型输 入变量。同时,专家经验具有重要参考价值,也是值得考虑的重要因素。优选地,本发明同时 结合时滞分析和/或专家经验确定模型输入变量。综上,在本发明的一种【具体实施方式】中, 结合相关性分析、时滞分析以及专家经验得到一种优选的方案是选取富氧率、透气性指数、 鼓风动能、全压差、热风温度、喷煤量、利用系数、冷风流量以及上一炉铁水硅含量共9个变 量作为模型的输入变量。
[0032] 表1输入变量与娃含量相关性系数
[0033]
[0034] S24、归一化处理;
[0035] 即将各输入变量分别归一化处理;优选地,将输出变量(即铁水硅含量)也进行归 一化处理。因选取的各输入变量量纲不同,对模型的收敛速度和复杂度有很大影响,在建模 前需要对其分别进行归一化处理。通过数值变换来消除变量间的量纲影响。方法如下:
[0037] 其中Xi,足分别为第i个变量归一化前、后取值,max(Xi),min(Xi)分别为第i个变 量归一化前的最大值、最小值。
[0038] S25、差分处理;
[0039] 即分别对各输入变量和输出变量进行差分处理(例如进行前向差分)得到所有变 量的变化率;这样处理可以更好的与趋势变化相吻合。前向差分公式如下:
[0040] Axi=xi_xi_1,i=1, 2,???,n(III)
[0041] 经差分处理分别得到所有输入变量的变化率,组成输入样本;得到所有输出变量 (即铁水硅含量)的变化率,组成输出样本。
[0042] S3、数据分类
[0043] 所述数据分类即将所述输出样本依据模糊均值聚类算法划分为四类区间;具体包 括以下步骤:
[0044] S31、以零为边界将所述输出样本划分为两大类,大于零的样本划分为第一类,简 称为正类样本,小于零的样本划分为第二类,简称为负类样本。本发明将等于零的样本划分 为正类样本。
[0045] S32、在所述正类样本中获取两个聚类中6Cl、c2,在所述负类样本中获取两个聚类 c'i、C' 2,以这四个聚类中心得到两个边界值:
[0046] S33、根据步骤S32所述边界值,将所述正类样本和负类样本划分为四类区间:
;这四类区间依次代表四类变化趋势: 大幅下降、小幅下降、小幅上升、大幅上升。
[0047]所述S32在正类样本中获取两个聚类中心Cl、c2,在负类样本中获取两个聚类 c'pc' 2,具体包括以下步骤:
[0048] S321、初始化算法参数;具体方法如下:
[0049] 初始化聚类个数c、模糊指数m、误差e、算法迭代次数T,初始化聚类中心V= [Vl,v2,. . .,v。]。在[0, 1]范围内随机初始化隶属度矩阵U,使Uij满足公式(IV)约束条件
[0051] 其中C是聚类个数,n为样本数,Xi为聚类样本,v渾类中心向量,u为第i个样 本属于第j个中心的隶属度,m为模糊指数,用来控制聚类的模糊程度。
[0052] S322、根据式(VII)计算K(Xi,v」),式(VIII)计算参数P;具体方法如下:
[0053] 构建模糊C均值聚类算法的目标函数如下:
[0055] 式(V)中,
[0056] | | 伞(Xi)-伞(Vj) | | =K(x"Xi)+K(Vj,Vj) -2K(xi;Vj) (VI)
[0057] K(x"Vj) =exp{_ (| |x「Vj| |2) /p2} (VII)
[0059] 依据S321和S322将所述正类样本和所述负类样本初步划分在不同类别中,然而, 这种初步划分准确性不高。因此,通过如下公式更新聚类中心和隶属度,为步骤S324的进 一步划分提供条件。
[0060] S323、依据式(VI)、式(VII)更新聚类中心V和隶属度矩阵U;具体方法如下:
[0061] 分别对JJU,)关于U,V求偏导,得到新的聚类中心和隶属度,公式如下:
[0064] S324、依据算法目标函数进行算法迭代;即依据S323更新一次聚类中心和隶属 度,带入式(V)便得到一个新的目标函数值。
[0065] 迭代终止的条件如下:
[0067] 即更新前后目标函数值的差值小于给定误差或者达到给定的最大迭代次数时算 法结束,否则继续更新。
[0068] 算法迭代结束即可以在所述正类样本中获得两个聚类中心Cl、c2;在所述负类样 本中获取两个聚类c'pC' 2。
[0069] S4、建立预报模型
[0070] 即依据所述步骤S3对所述输出样本的四类区间划分标准,将所述输出样本进行 二进制编码;然后结合所述输入样本利用极限学习机建立预报模型。所述建立预报模型具 体包括以下步骤:
[0071] S41、编码;
[0072] 即依据上述步骤S3对对输出样本的四类区间划分标准,将所有输出 样本进行二进制编码。所述输出样本的四类区间划分标准为:
;这四类区间依次代表四类变化趋势:大幅下降、小幅 下降、小幅上升、大幅上升。
[0073] 也就是说,对所有样本(Xj,tp的输出tj进行二进制编码。x』指输入变量;t」指 输出变量(即铁水硅含量变化率)。对c类分类问题,需要[log2c]个字节编码c个不同的 类。本发明中的四分类问题,输出编码如下表1所示:
[0074] 表1四分类编码
[0076] 其中:f2代表趋势变化方向,该列中"-1"代表下降,"1"代表上升;fl代表趋势变 化幅度,该列中"-1"代表小幅变化," 1"代表大幅变化。因此得到编码矩阵:
[0078] 通过如上编码,将所有输出样本tj(即铁水硅含量)按编码的不同依次划分在各 自的类中。例如其中每一个输出值\都由两个编码字节组成。
[0079] S42、利用极限学习机(ELM)建立预报模型;所述建立好的预报模型也称ELM分类 器;具体过程包括:经过上述编码,对于N个不同样本(X」,tj),其中Xj=[x&xj2,…,xjn]TGRn,tj=[tM,tj2,…,tjm]TGRm,m=log2c,tj= {-1,1},具有K个隐含层神经元数目, 并且激励函数为g(x)的ELM模型可以表示为:
[0081] 式中%= [?n,《2i,…,《ni]是连接输入神经元和第i个隐含层神经元的ELM模型输入权值也是第i个隐元偏差;0i= [0 n,0 i2,…,0im]T是连接第i个隐含层神经 元和输出神经元的ELM模型输出权值;?Xj表示《河xj的内积,激励函数g(x)选用 sigmoid函数,即:
[0084]使得:
[0086]其中:h(Xi) = [g(a而+b),…,g(aKXi+BK)],| | i;1,…,|i,」1是样本 应输出的训练误差,依据KKT条件(库恩塔克条件,S卩Karush-Kuhn-TuckerConditions), 训练ELM等价于解决如下的对偶优化问题:引入拉格朗日乘子ai(i= 1,2,…n):
[0088] 其中,每个拉格朗日乘子ai对应第i个训练样本。0』连接隐含层节点到第j个 输出节点的向量,0 ,…,0m],相应的KKT的优化条件如下:
[0092] 将(XVII)、(XVIII)式带入(XIX)式,得到如下方程:
[0094]其中:
[0096] 将(XX)带入(XVII)式,得到隐元偏置:
[0098]其中:
[0100] 通过式(XXII)计算得到的隐层权值0,将结果带入式(XII),得到(测试样本) 对应的输出。
[0101] ELM的网络结构图1所示。
[0102] 优选地,本发明所述高炉铁水硅含量四分类趋势预报模型的建立方法还包括解码 的步骤;所述解码是指对建立好的预报模型(即ELM分类器)的输出进行解码,即对步骤 S42得到的(测试样本)输出进行解码。
[0103] 优选地,所述建立预报模型还包括训练和测试的步骤;
[0104] 所述测试样本就是用来检测模型准确性的样本。也就是说,先用一大批历史数据 (称为训练样本,包含输入变量和输出变量,都是已知的)对上述建立好的预报模型进行训 练,训练好之后就需要用另一批数据(称为测试样本,也包含输入变量和输出变量)对所训 练好的所述模型进行测试。测试的时候只需将输入变量带入所述模型,该模型会得到相应 的输出,然后用该模型得到的输出与实际的输出比较,进而得到结果的准确性,如果准确性 高,说明所建模型好,可以用于现场对高炉铁水硅含量进行预测,如果不高,则继续修正模 型参数。
[0105] 以下以测试样本为例,对解码步骤进行描述:
[0106] 如图2所示,测试样本指图2中的②对应的那部分数据,测试样本的输出即由本发 明预报模型(上述步骤S42
所建立的ELM分类器)计算得到的铁水硅含量变化趋势。
[0107] 给定测试样本X,依据上述建立好的预报模型(ELM分类器),得到m=log2c维的 输出向量:
[0108] f(x) = (fm(x), - .^(x)) (XXIV)
[0109] 这些输出需要解码才能得到样本x最终所属的类。在此,运用基于损失函数的解 码方法对ELM分类器的输出进行解码。在这种解码方法中,如要样本x被标签为i类,样本 (X,i)的总损失函数值最小。样本(X,i)的总损失函数定义为:
[0111] M(i)指的是编码矩阵c*m的第i个行向量,表示为:M⑴=(M(i,m), ?'MQ, 1))。
[0112] 基于上述损失函数(方程(XXV)),训练样本x最终的类输出为:
[0114] 式(XXVI)也称决策函数。
[0115] 依据上述描述得到如下ELM分类过程:
[0116] 输入:训练集Xtrain;输出:训练集Ytrain;
[0117] 输入:测试集Xtest;输出:测试集Ytest;
[0118] St印1 :编码过程,依据编码矩阵对训练集类别YtMin进行编码;
[0119] Step2 :训练过程,得到隐含层输出矩阵H以及连接隐含层节点和输出层节点的权 值0,即完成图2中的①部分;
[0120] Step3 :测试过程,输入测试集,即图2中的②部分,基于上述参数,获得ELM的输 出,即图2中的③部分;
[0121] Step4 :解码过程,将上述输出依据式(XXV)的损失函数以及式(XXVI)的决策函数 得到测试集所属的类别。
[0122] 建立所述预报模型(即ELM分类器)时,由于模型的输入权值和隐元偏差理论上 可以随机赋值得到,这无疑是ELM的一个较大的缺陷,使得预报结果出现了很大的不稳定 性,对高炉炼铁过程中铁水硅含量的趋势预报带来了很大的影响。因此,如何设置影响算法 性能的关键参数,对预测模型的学习精度和泛化能力的好坏起着决定性作用。优选地,本发 明用状态转移算法(STA)优化得到输入权值和隐元偏差,不仅可以提高模型稳定性,而且 使得模型的预测结果更可靠。具体流程如下:
[0123] 输入:随机产生ELM的输入权值《K#n和隐元偏差0 K%1;
[0124] 输出:最优ELM输入权值和隐元偏差;
[0125] Stepl:初始化搜索力度SE,问题维数Dim,搜索范围,迭代次数,极限学习机中的 输入权值和隐元偏差以及隐含层节点数K;
[0126] Step2:引入STA算法,将初始化得到的输入权值和隐元偏差作为STA的输入样本, 均方根误差MSE作为STA算法的目标函数;
[0127] Step3:如果算法满足收敛精度或是达到了最大的迭代次数,转step6,否则转 step4 ;
[0128] Step4 :对STA算法中的样本执行:
[0129] Step4:l扩张转变(expendtransformation)
[0130] xk+1 =xk+yRcxk (XXVII)
[0131] 其中,y是一个正常数,称为扩张因子;R。^RW是一个随机对角矩阵,其中每一 个元素都服从高斯分布。扩张转变的功能是将xk的范围扩张到[-<-,+ <-],即在整个空 间搜索。
[0132] Step42 旋转转变(rotationtransformation)
[0134] 其中,xkeRn,a代表正常数,称为旋转因子。R,eR*是一个随机矩阵,服从 [-1,1]的均匀分布,II?I|2代表二范数。旋转转变可以在超平面进行搜索。
[0135] Step43 压缩转变(axesiontransformation)
[0136] xk+1 =xk+8Raxk (XXIX)
[0137]其中,S是一个正常数,称为压缩因子;RaGR_是一个随机对角矩阵,其中每一 个元素都服从高斯分布,并且只有一个随机位置是非零值。压缩转变目的是搜索中心,增强 单维搜索。
[0138] St印5:判断算法是否满足运行的终止条件,一般终止条件为最大的迭代次数以及 算法的精度,若是满足,转step6,否则g=g+1,转step4 ;
[0139] St印6 :输出STA算法的最优值,即ELM的输入权值和隐元偏差。
[0140] 本发明还包括按上述方法所建立的预报模型在高炉铁水硅含量四分类趋势预报 方面的应用。
[0141] 进一步,本发明还提供一种高炉铁水硅含量四分类趋势预报方法,包括按上述方 法建立高炉铁水硅含量四分类趋势预报模型,选取一组变量数据作为输入变量,输入到所 述预报模型,得到高炉铁水硅含量四分类趋势预报结果;优选地,选取的输入到所述预报模 型的输入变量与建立所述预报模型时采用的输入变量相同;所述变量相同是指变量名称相 同,并非指变量数据相同;例如,建立所述预报模型时选取的变量为富氧率、透气型指数、鼓 风动能、全压差、热风温度、喷煤、利用系数、冷风流量以及上一炉铁水硅含量共9个变量, 那么在利用所述模型进行实际预报时也选取这9个变量,将其具体数据输入所述模进行预 报;优选地,按上述方法对所述预报模型的输出进行解码,得到该输出所属的类别,即可得 到该输出的四分类趋势。
[0142] 本发明所述高炉铁水硅含量四分类趋势是指大幅上升、小幅上升、大幅下降、小幅 下降。
[0143] 本发明的关键点
[0144] 1、本发明通过分析高炉内部的复杂物理化学反应以及高炉炼铁原理,获取了影响 铁水硅含量的各种变量在一段时间内的数据,这些变量包括上部的布料方式、原料性质,下 部的风温、风量等变量。通过时间点对应选取所需样本,依据拉伊达准则进行异常值处理, 通过SPSS分析采集到的各变量与铁水硅含量之间的相关性系数以及时滞影响,得到与铁 水硅含量有强相关性的变量作为所建模型的输入变量。
[0145] 2、本发明采用模糊均值聚类算法确定区间划分依据,首先对历史数据进行聚类划 分,形成若干个子样本集,其次对模型输出样本集进行区间划分,最终确定了模型输出变化 趋势的四类区间的划分依据。
[0146] 3.本发明采用二进制代码对上述四类进行编码,得到编码矩阵。用编码区分不同 的类,更容易建立模型,也更容易识别输出类别。在对模型输出进行解码时,运用汉明距离 来衡量模型输出与编码矩阵之间的相似程度,进而确定模型输出所属的类。
[0147] 4、采用极限学习机对样本集进行建模,将经过异常值处理后的样本划分为训练集 和测试集。为了避免极限学习机在参数选取上的随机性,进而造成结果的不稳定,本发明通 过状态转移算法优化极限学习机的输入权值和隐元偏差。通过训练集对模型进行训练,获 得铁水硅含量趋势变化幅度的分类器。再通过测试集进行铁水硅含量四分类趋势变化的准 确性验证。
[0148] 本发明的效果
[0149] 本发明基于采样数据以及炼铁工艺的特点,以每炉次出铁时间为周期,时间点对 应的方式选取数据样本,采用SPSS选取模型输入变量,并用模糊均值聚类的方法确定了模 型输出变量的四分类趋势变化的控制边界。通过STA-ELM建模方法实现铁水硅含量四分类 趋势预测的目的,本发明充分利用高炉可检测到的影响铁水硅含量的数据,使得铁水硅含 量的趋势预测结果命中率更高,对高炉操作现场有更好的指导作用。
【附图说明】
[0150] 图1为本发明ELM网络结构图。
[0151] 图2为本发明STA-ELM趋势预测流程图。
[0152] 图3为本发明模糊均值聚类划分区间图。
[0153] 图4为本发明STA-ELM模型优化过程示意图。
[0154] 图5为本发明实施例2样本实际铁水硅含量变化趋势图。
[0155] 图6为本发明实施例2样本预测铁水硅含量变化趋势图。
[0156] 图5和图6中:纵轴"1" "2" "3" "4"分别代表大幅下降、小幅下降、大幅上升、小 幅上升;横轴代表炉次。
【具体实施方式】
[0157] 以下实施例用于说明本发明,但不用来限制本发明的范围。
[0158] 实施例1
[0159] 本实施例在某钢厂2650m3高炉进行试验测试。
[0160] 一种高炉铁水硅含量四分类趋势预报模型的建立方法,具体包括如下步骤:
[0161] 1)采集历史数据。通过自动化系统的组态软件实现炼铁过程控制及数据采集。所 述的自动化系统包括高炉本体、上料系统、热风炉系统、喷煤系统组成。其中来自高炉本体 的数据主要由:炉顶压力、热风压力、炉顶温度等相关数据。来自热风炉系统的数据主要有: 高炉煤气量、送风、炉顶温度、烟道温度等送风相关数据。来自喷煤系统的数据主要有:喷吹 压力、喷吹流量等喷煤有关的数据。
[0162] 2)数据预处理。将上述采集到的数据进行数据预处理。具体包括:
[0163] ①获得时间点对应的时间序列样本,即通过时间点对应选取样本。以最长的采集 周期lh为参照,通过时间点对应对所有采集到的变量进行时间点匹配,提取时间序列样 本,本实施例最终提取931个时间序列样本。
[0164] ②利用3 〇准则删除异常数据。通过异常值处理,本实施例共剔除31个异常数据。
[0165] ③确定模型输入变量和输出变量。本实施例通过SPSS选取的模型输入变量为:富 氧率、透气型指数、鼓风动能、全压差、热风温度、喷煤、利用系数、冷风流量以及上一炉铁水 硅含量共9个变量作为模型的输入变量。
[0166] ④归一化处理。
[0167] ⑤差分处理。本实施例通过前向差分对所有变量进行差分,得到变化率。所有输 入变量的变化率,组成输入样本;所有输出变量的变化率,组成输出样本。
[0168] 3)模糊均值聚类得到趋势变化区间。通过模糊均值聚类对输出样本(铁水 硅含量)进行聚类划分,最终确定四个趋势变化区间为
,这四个区间分别对应趋势变化的:大幅下降、小幅下降、
[0169] 小幅上升、大幅上升。
[0170] 4)建立预报模型
[0171] ①
编码:对数据预处理之后的输出样本通过编码矩阵进行二进制编码。
[0172] ②建立预报模型。利用状态转移算法优化极限学习机的输入权值和隐元偏差,建 立优化极限学习机的预报模型。将数据预处理后的900组样本划分为训练样本和测试样 本,选取前700组作为训练样本,用来训练模型参数,后200组作为测试样本,用来验证模型 准确性。通过不断修正模型参数,得到最优的预报模型。
[0173] 实施例2
[0174] 本实施例涉及一种利用实施例1所建立高炉铁水硅含量四分类趋势预报模型对 高炉铁水硅含量四分类趋势预报方法,具体为选取一组变量数据作为输入变量,输入到所 述预报模型,对预报模型的输出结果进行解码,得到最终的硅含量变化趋势(高炉铁水硅 含量四分类趋势预报结果)。
[0175] 具体而言,选取了从2013年1月9号21:00到2013年2月27号10:00总共1166 组数据利用实施例1所述数据处理方法进行处理。其中200组测试样本对应的实际铁水硅 含量变化趋势如图5所示,由图5可知,变化趋势大多都落在小幅上升和小幅下降的区间 内,只有小部分样本落在大幅上升和大幅下降的区间,这也说明炉况比较稳定,符合现场实 际情况。利用实施例1所建立的高炉铁水硅含量四分类趋势预报模型进行预报,预报结果 如图6所示。对比图5和图6,可见大多炉次趋势预测都准确,表明本实施例预报结果与实 际值相吻合,符合实际要求,取得了满意的预报效果。
[0176] 虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在 本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因 此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
【主权项】
1. 一种高炉铁水硅含量四分类趋势预报模型的建立方法,包括以下步骤: 51、 采集历史数据;即采集整个炼铁过程中影响铁水硅含量变化的变量及铁水硅含量 数据; 52、 数据预处理;包括获得时间点对应的时间序列样本、剔除异常数据、确定模型输入 变量和输出变量、归一化处理及差分处理;经差分处理分别得到所有输入变量的变化率,组 成输入样本;得到所有输出变量的变化率,组成输出样本; 53、 数据分类;即将所述输出样本依据模糊均值聚类算法划分为四类区间; 54、 建立预报模型;即依据所述步骤S3对所述输出样本的四类区间划分标准,将所述 输出样本进行二进制编码;然后结合所述输入样本利用极限学习机建立预报模型。2. 根据权利要求1所述的建立方法,其特征在于,所述获得时间点对应的时间序列样 本是指以一个变量的时间间隔为参照依据时间点对应对所有变量进行匹配,最终得到所需 时间序列样本。3. 根据权利要求1-2任一项所述的建立方法,其特征在于,所述确定模型输入变量的 方法为通过相关性分析,以与铁水硅含量的变化相关性强的变量作为所述模型输入变量; 优选结合时滞分析和/或专家经验确定模型输入变量。4. 根据权利要求1-3任一项所述的建立方法,其特征在于,所述S3数据分类具体包括 以下步骤: 531、 以零为边界将所述输出样本划分为两大类,大于零和等于零的样本划分为正类样 本,小于零的样本划分为负类样本; 532、 在所述正类样本中获取两个聚类中心Cl、C2,在所述负类样本中获取两个聚类 W i、(^ 2,以这四个聚类中心得到两个边界值:533、 根据步骤S32所述边界值,将所述正类样本和负类样本划分为四类区间:;这四类区间依次代表四类变化趋势: 大幅下降、小幅下降、小幅上升、大幅上升。5. 根据权利要求4所述的建立方法,其特征在于,所述S32在正类样本中获取两个聚类 中心Cl、c2,在负类样本中获取两个聚类c' i、C' 2,具体包括以下步骤: S321、初始化算法参数;具体方法如下: 初始化聚类个数c、模糊指数m、误差ε、算法迭代次数T,初始化聚类中心V = [Vl,ν2, ...,ν。]。在[0, 1]范围内随机初始化隶属度矩阵U,使Uij满足公式(IV )约束条件其中c是聚类个数,η为样本数,Xi为聚类样本,V 1聚类中心向量,u υ为第i个样本属 于第j个中心的隶属度,m为模糊指数,用来控制聚类的模糊程度; 5322、 根据式(VII)计算K(Xi,'),式(VIII)计算参数P ;具体方法如下,构建模糊C 均值聚类算法的目标函数如下:5323、 依据式(VI)、式(VII)更新聚类中心V和隶属度矩阵U ;具体方法如下: 分别对Jlt (U,V)关于U,V求偏导,得到新的聚类中心和隶属度,公式如下:5324、 依据算法目标函数进行算法迭代;即依据S323更新一次聚类中心和隶属度,带 入式(V)得到一个新的目标函数值; 迭代终止的条件如下:即更新前后目标函数值的差值小于给定误差或者达到给定的最大迭代次数时算法结 束,否则继续更新;算法迭代结束即在所述正类样本中获得两个聚类中心Cl、C2;在所述负 类样本中获取两个聚类c' i、c' 2。6. 根据权利要求1-5任一项所述的建立方法,其特征在于,所述依据步骤S3对所述输 出样本的四类区间划分标准,将所述输出样本进行二进制编码即对所有样本(\,tp的输 出h进行二进制编码;X j旨输入变量;t j旨输出变量;编码矩阵如下:7. 根据权利要求1-6任一项所述的建立方法,其特征在于,所述利用极限学习机建立 预报模型的过程包括:将所述输出样本进行二进制编码后,对于N个不同样本(Xj,tp,其中 Xj= [X j" Xj2,…,xjn]Te Rn,tj= [t J1, tj2,…,tjm]Te Rm,rn = log2c,tj= {-1,1},具有 K 个 隐含层神经元数目,并且激励函数为g(x)的ELM模型表示为:(XII) 式中Qi= [ω π,ω2?,…,ωη?]是连接输入神经元和第i个隐含层神经元的ELM模型输 入权值也是第i个隐元偏差;β F [β η,β i2,…,β im]T是连接第i个隐含层神经元和输 出神经元的ELM模型输出权值;CJi · Xj表示ω jP X』的内积,激励函数g(X)选用sigmoid 函数,即:其中:Ii(Xi) = [g(a 而+bJ,…,g(a κΧ?+Βκ)],ξ i= [ ξ i;1,…,ξ L1Jt是样本 X 3寸应 输出的训练误差,依据KKT条件,训练ELM等价于解决如下的对偶优化问题:引入拉格朗日 乘子 a i Q = 1,2,…η):其中,每个拉格朗日乘子a i对应第i个训练样本;连接隐含层节点到第j个输出 节点的向量,β = [β u…,|3m],相应的KKT的优化条件如下:将(XVII)、(XVIII)式带入(XIX)式,得到如下方程:将(XX)带入(XVII)式,得到隐元偏置:其中:通过式(XXII)计算得到的隐层权值β,将结果带入式(XII),得到样本对应的输出。8. 根据权利要求7所述的建立方法,其特征在于,还包括对所述预报模型的输出进行 解码的步骤;优选的解码过程如下:给定样本X,依据所述预报模型,得到m= Iog2C维的输 出向量: f (X) = (fm (X),…,(X)) (XXIV) 样本(X,i)的总损失函数定义为:M(i)指编码矩阵c*m的第i个行向量,表示为:M(i) = (M(i,m), 1)); 基于上述损失函数,样本x最终的类输出为:9. 根据权利要求1-8任一项所述的建立方法,其特征在于,用状态转移算法对所述预 报模型的输入权值和隐元偏差进行优化,得到最优的输入权值和隐元偏差;优选所述优化 具体流程如下: 输入:随机产生ELM的输入权值ωκ#η和隐元偏差β κ%ι; 输出:最优ELM输入权值和隐元偏差; Stepl :初始化搜索力度SE,问题维数Dim,搜索范围,迭代次数,极限学习机中的输入 权值和隐元偏差以及隐含层节点数K ; Step2:引入STA算法,将初始化得到的输入权值和隐元偏差作为STA的输入样本,均方 根误差MSE作为STA算法的目标函数; Step3:如果算法满足收敛精度或是达到了最大的迭代次数,转step6,否则转step4 ; Step4 :对STA算法中的样本执行: St印41扩张转变 Xk+1= x k+ T Rcxk (XXVII) 其中,γ是一个正常数,称为扩张因子;Rc^ RW是一个随机对角矩阵, 其中每一个元素都服从高斯分布; St印42旋转转变其中,Xke Rn,α代表正常数,称为旋转因子;艮e RW是一个随机矩阵,服从[-1,1] 的均匀分布,11 · 112代表二范数; Step43压缩转变 Xk+i= Xk+ 5 RaXk (XXIX) 其中,S是一个正常数,称为压缩因子;RaeR_是一个随机对角矩阵, 其中每一个元素都服从高斯分布,并且只有一个随机位置是非零值; St印5 :判断算法是否满足运行的终止条件,终止条件为最大的迭代次数以及算法的精 度,若是满足,转step6,否则g = g+Ι,转step4 ; Step6 :输出STA算法的最优值,即ELM的输入权值和隐元偏差。10. -种高炉铁水硅含量四分类趋势预报方法,包括按权利要求1-9任一项所述方法 建立高炉铁水硅含量四分类趋势预报模型,选取一组变量数据作为输入变量,输入到所述 预报模型,得到高炉铁水硅含量四分类趋势预报结果;优选地,选取的输入到所述预报模型 的输入变量与建立所述预报模型时采用的输入变量相同。
【专利摘要】本发明涉及一种高炉铁水硅含量四分类趋势预报模型的建立方法及应用,属于自动化检测技术领域。所述模型的建立方法包括采集历史数据;进行数据预处理;确定模型输入变量和输出变量;依据模糊均值聚类的方法对铁水硅含量样本有效的聚类,获取模型输出变量四类趋势变化区间的划分标准;利用极限学习机建立四分类趋势预报模型。利用本发明所建立的模型不仅可以预报硅含量变化的趋势,同时可以得到趋势变化的幅度大小,即可以预报得到下一炉铁水硅含量是大幅上升、小幅上升、大幅下降、小幅下降的四分类趋势变化情况。这对高炉操作者提早判断炉况,并采取小调、早调等措施,避免炉况发生急剧变化有很好的指导。
【IPC分类】G06F19/00
【公开号】CN104899463
【申请号】CN201510340996
【发明人】蒋朝辉, 尹菊萍, 桂卫华, 阳春华, 谢永芳
【申请人】中南大学
【公开日】2015年9月9日
【申请日】2015年6月18日