用于监控工艺的系统及方法
【技术领域】
[0001] 本发明设及一种用于工艺监控的系统及方法。特别地,本发明设及一种诊断工艺 运行条件的新颖系统及方法。 现有技术
[0002] 美国专利2010/0036529关于使用多元统计方法W检测工艺中异常事件的技术。
【背景技术】
[0003]
[0004] 对正在运行的工厂中的异常事件发生的早期检测和诊断对于确保工厂安全及维 持产品质量是非常重要的。先进仪器领域的进步使得能够每几秒测量数百个与工艺相关的 变量。运些测量产生关于工厂运行状态有用的识别标志。
[000引该文献已提出用于检测故障的多种技术。运些技术广义上可分为基于模型的方法 和基于历史数据的统计方法。虽然基于模型的方法能够用于检测和隔离表示异常运行的信 号,但是对于大型复合化学系统,此定量或定性的因-果模型难W从一开始就开发。
[0006] 人工神经网络(Ar^N)
[0007] 神经网络是由神经系统中处理信息的方式所启发的计算机算法。
[0008] 人工神经网络(ANN)已显现成为非线性建模的有用工具,特别是在开发唯象的或 传统的回归模型变得不切实际或麻烦的情况中。ANN是计算机建模方法,其经由迭代而从实 例中学习,不需要先知道工艺参数的关系。因此,Ar^N能够适用于变化的环境。也能够处理不 确定性、噪声数据W及非线性关系。
[0009] A順建模方法称为"不费力计算",并且由于它们复合决策处理的无需模型的近似 能力而被广泛便利地使用。
[0010] 基于Ar^N的模型的优点如下:
[0011] (i)其可单独地从历史工艺输入-输出数据(实例集)建立,
[0012] (i i)模型开发不需要详细知道工艺现象,
[0013] (iii)由于其准确预测用于新输入数据集的输出的能力,而容易将适当训练的模 型归纳,W及
[0014] (iv巧至多输入-多输出(MIMO)非樂性关系能被同时地及容易地近似。
[0015] 归功于它们吸引人的特性,Ar^N已被广泛用于化学工程应用,例如稳态及动态工艺 建模、工艺识别、产量最大化、非线性控制、及故障检测和诊断,例如,参见LaMri,S.K.and (ihanta K.C,2008,Lahiri'S.K.and 趾alfe N,2010,Tambe et.al.1996,Bulsari 1994, Himng 2003曰nd Stephsnopoulos 曰nd Han 1996。
[0016] 最广泛使用的ANN范例为多层感知器(MLP),其将输入数据集任艺自变量)及对应 的输出数据集(因变量)之间的非线性关系近似化。容纳有足够大数目的节点(也称为神经 元或处理元)的单一中间(隐藏)层的S层MLP能W高准确度近似或映射任何非线性可计算 的函数。经由称为"网络训练"的数值程序而取得或"教导"的近似,其中迭代调整网络参数 或权重,使得网络准确地再生对应的输出W回应实例集中的输出样式。
[0017] 存在众多的算法-均具有某些有利的特点-W训练MLP网络,例如,最受欢迎的误差 反向传播化BP)、快速传播W及弹性反向传播(RPROP) (Rei血i 11 er,1993)。
[0018] Ar^N的训练设及最小化具有多个局部最小值的非线性误差函数(例如,均方根误 差,RISE)。因此,变成需要采用试探程序,试探程序设及多训练回合W取得最佳的AN饰莫型, 其参数或权重对应于误差函数的全局或最深的局部最小值。
[0019] 网络架构
[0020] 模型开发中使用的MLP网络如图1所示:前馈神经网络架构。如图所示,网络通常由 =层节点组成。称为输入层、隐藏层和输出层的运些层分别包括R、SW及K数目的处理节点。 输入层中的各个节点链接至隐藏层中的所有节点,隐藏中的各个节点使用加权链接而链接 至输出层中的所有节点。除了 R数目的输入节点及縫义目的隐藏节点外,MLP架构也在其输入 和隐藏层中提供偏差节点(分别具有R+US+1的固定输出)(未示出)。运些偏差节点也连接 至后续层中的所有节点W及提供额外的可调参数或权重W用于模型拟合。在MLP网络输入 层中的节点R的数目等于工艺中的输入数目,而输出节点K的数目等于工艺输出的数目。然 而,隐藏节点S的数目为可调参数,其量值可由各种因素决定,例如期望的网络模型的近似 及归纳能力。
[00引]网络训练
[0022] 训练网络由一迭代过程组成,其中网络被给予所期望的输入W及用于运些输入的 对应输出。其接着寻找改变其权重W尝试及产生正确的输出(在合理的误差容限内)。如果 其成功,则其学习到训练集并且准备好基于先前未见过的数据执行。如果其未成功产生正 确的输出,则其重读输入并且再度尝试产生对应的输出。在经过被称为训练循环的训练集 直至建立适当权重为止的每个迭代期间,稍微调整运些权重。取决于要学习的任务的复杂 度,对于网络,可能需要数W千计的训练循环W正确识别训练集。一旦输出是正确的,则在 相同网络权重能用在未见过的数据上,W评估其会执行得多好。
[0023] 反向传播算法(BPA)
[0024] 在反向传播算法网络中,修改权重W使网络的期望输出和实际输出之间的均方根 误差最小化。反向传播使用受监督的学习,其中使用已知的输入数据与已知的期望输出数 据的数据训练网络。一旦被训练,网络权重被维持或冻结并且能被用于计算新输入取样的 输出值。前馈过程设及递交输入数据给输入层神经元,输入层神经元将输入值传给第一隐 藏层。计算加权的输入总和的每一隐藏层节点使总和通过其激励函数并且将结果呈交给输 出层。目的是寻找到使均方根误差最小化的权重集。典型的反向传播算法如下所述:
[0025] MLP网络是确定K维非线性函数向量f的非线性映射装置,其中f:X-^Y。其中,X为N 维输入向量集(X=Up} ;p=l,2,. . .,P及x=[xl,x2,. . .,xn,. . .,xN]t),W及Y为对应的K 维输出向量(Y={yp};P = l,2,???,P,其中y=[yl,y2,...,yk,...,;yK]T)。映射f由下述确 定:
[0026] (i)网络拓扑,
[0027] (ii)用于计算隐藏及输出节点的激励函数的选择,W及
[0028] (iii)分别与输入节点及隐藏节点之间的权重、W及隐藏节点与输出节点有关的 网络权重矩阵wH及。因此,非线性映射f能表示如下:
[0029] f:y = y(x;W) (1)
[0030] 其中,W={WH,'\f}。
[0031] 此方程显示y是X的函数,由W参数化。现在能够将由立层肥口近似的输入-输出关系 的封闭形式写成如下:
巧)
[0033] 注意,在方程2中,偏差节点在个别层中被索引为第0节点。
[0034] 为了使MLP网络能够将存在于程序输入及输出之间的非线性关系近似化,其需要 W预指定的误差函数最小化的方式被训练。基本上,MLP训练程序目标在于获得网络权重矩 阵WH和(其最小化误差函数)的最佳集W。通常使用的误差函数是定义如下的平均相对误差 绝对值(AARE):
(3)
[0036] 最广泛使用的AARE最小化的形式是误差反向传播化BP)算法,其利用称为归纳差 量规则(GDR)的梯度下降技术。在邸P方法中,权重矩阵集W最初是随机的。之后,来自训练集 的输入向量应用到网络的输入节点,并且计算隐藏节点和输出节点的输出。
[0037] 计算输出如下:首先评估所有特定节点输入的加权总和,接着使用非线性激励函 数(例如逻辑S形(Sigmoid)函数)转换加权总和。来自输出节点的输出接着与它们的目标值 比较,并且差值用于计算方程3中的ARRE。一旦构成AARE,使用GDR架构更新权重矩阵WH及胖0。 对训练集中余留的输入样式重复程序,而完成一个网络训练迭代。对于AARE最小化,多个训 练迭代通常是必要的。
[003引归纳性
[0039] 仅在系统能很好地执行系统尚未受训的测试数据时,神经训练才会被视为是成功 的。网络的此能力称为归纳力。给定大网络时,重复的训练迭代成功地改进网络在训练数据 上的表现,例如通过"记忆"训练采样,但是结果的网络可能对测试数据(即未见的数据)表 现不佳。此现象称为"过度训练"。提出的解决方案是不断地监控网络对测试数据的表现。
[0040] Hecht-Nielsen(1990)提出了应仅根据训练集来调整权重,但是应对测试集监控 误差。在运里我们应用相同的策略:只要在测试集上的误差持续降低则训练继续,W及如果 在测试集上的误差增加则训练结束。即使对训练集的网络表现继续改进,训练仍然可因此 中止。
[0041] 主成分分析(PCA)
[0042] 由于有大量的W每几秒测量数W千计的程序变量的仪器,所W在现代复杂程序工 业中,监控工厂条件通常是耗时的。运导致"数据过载",并由于缺乏适当的分析,目前很少 使用运种信息财富。在现代的化工厂中,给定目前工艺控制计算机系统(DCS,线上分析器W 及自动品质控制实验室),通常要每几秒或分钟测量数W百计的线上工艺变量,W及每几分 钟或小时测量数十个产品变量。
[0043] 虽然可W测量大量的变量,但是它们几乎从不独立;相反地,它们通常是非常高度 相关的。工艺移动空间的真正维度总是远低于测量的数目。幸运地是,在具有很多变量的数 据集中,由于不止一个变量正在测量用于控制其系统表现的同一驱动原理,所W变量组通 常一起移动。在许多石化系统中,仅有少数的此驱动力。但是大量的仪器允许我们测量很多 系统变量。
[0044] 当此发生时,可W利用此信息冗余。例如,通过使用单一新变量,可W简化问题。对 于实现此简化,PCA为定量上严格的方法。如PCA(主成分分析)等多变量统计方法能够将信 息向下压缩成一低维空间,该低维空间保留大部分信息。该方法产生新的变量集,称为主成 分。各主成分是原始变量的线性组合。所有主成分彼此正交,W至于仅有少许或没有冗余信 息。
[004引主成分分析包括提取正交的、独立的坐标轴或主成分的集合,该集合是数据集变 量的线性组合,W及被提取或计算使得在数据内的变化量的最大范围由尽可能少的主成分 包围。计算第一主成分W考虑数据中的最大变化量;然后计算第二主成分W考虑与第一主 成分正交的数据中的最大变化量,计算第=主成分W考虑与前两个主成分正交的数据中的 最大变化量,等等。对于所提取的各主成分,越来越少的变化量被考虑。最后,进一步主成分 的提取不再考虑数据内显著的额外变化量。通过运种方式,多维或多变量的数据集减少至 更少的维度或主成分,而在结果数据内仍然保留尽可能多的有用信息,运大幅简化工艺数 据的分析。
[0046] 沿着给定主成分的数据点位置被称为其"得分"。用于给定主成分的变量加权被称 为其"载称'。
【发明内容】
[0047] 本发明的目的在于提供用于使用实时工艺数据监控工艺的装置,该装置根据对随 时间在工艺数据中出现的波动的所述监控而检测工艺的异常行为。
[0048] 根据本发明的一方面,一种用于监控工艺的系统,所述工艺由与工艺输入-输出数 据有关的多维工艺数据域中的工艺数据集所确定,所述系统包括:用于获取多个历史工艺 数据集的装置;用于通过执行多变量数据分析来获取从所述多维工艺数据域至较低维度的 模型数据域的转换的装置;W及用于将当前工艺数据集转换至模型数据集W监控所述工艺 的装置。
[0049] 根据本发明的一方面,一种计算机程序产品,包括非暂时性的计算机可读介质,其 为程序指令的体现,该程序指令用于使系统执行步骤:获取多个历史工艺数据集;通过执行 多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域的转换;W及将当前 工艺数据集转换至模型数据集W监控所述工艺。
【附图说明】
[0050] 图1表示了前馈人工神经网络的架构;
[0051] 图2表示了显示作为氯化物浓度函数的催化剂选择性的曲线图;
[0052] 图3表示了环氧乙烧反应器的实例;
[0053] 图4表示了连接至装载有PCA及ANN软件的专用PC的数据历史服务器;
[0054] 图5a表示了分别相对于主成分坐标轴PCl和PC2的PCA得分图;
[005引图化和5c分别表示了T2和残差图;
[0056] 图6绘制了对于所选取的得分数据点,PCA输入变量相对于第一主成分的贡献;
[0057] 图7表示了示例性的PCA得分图,其表示代表正常工厂运行的区域和代表异常工厂 运行的多个区域;
[0058] 图8a至8f表示了PCA得分图,其显示在各种运行条件下所得到的得分点;
[0059] 图9表示了随时间的实际工艺输出W及AN饰莫型预测输出的曲线图;
[0060] 图10表示了根据本发明的ANN及PCA故障诊断系统的架构。
【具体实施方式】
[0061] 受监控工艺的实例
[0062] 例如,乙締氧化W产生环氧乙烧或EO是化工产业中乙二醇的合成的重要反应。商 业上,EO产生于壳及管式EO反应器中,在高溫和高压下,在银基的催化剂存在下,使氧气与 乙締反应。乙締的氧化包含产生EO的主反应及产生二氧化碳或C〇2的非所需的副反应。
[0063] 要求的主反应
[0064] 乙締+氧气一环氧乙烧
[0065] 非所需的副反应
[0066] 乙締+氧气一二氧化碳+水
[0067] 通过用于产生EO的乙締与用于产生EO及C〇2的总的乙締的百分比来计算选择性, W测量反应的表现。间接地,选择性测量第一反应相比第二反应的程度。选择性对效率具有 深远的影响,因而对乙二醇厂的整体经济有深远的影响。
[0068] EO反应器可W建成如壳及管式热交换器。可放置银催化剂作为管侧的固定床。由 于两种反应都是放热的,所W水流经壳侧循环W移除反应产生的热。乙締对EO的转换很低, 因此,如图3所示,回收乙締和氧气。
[0069] 图3:E0反应器及相关单元的原理图显示了典型的环氧乙烧反应器与下游的环氧 乙烧洗涂器、二氧化碳接触器及清洗区。如图3所示,气体混合物即循环气体从顶部馈送至 环氧乙烧反应器(1),W及连续地,纯氧(13)、乙締(14)和甲烧(11)馈送至循环气体系统。反 应器可W建成如壳及管式热交换器,其中可加载高选择性催化剂颗粒作为在管侧的填充 床。冷却液循环流经壳侧W移除反应器产生的热,并因此在蒸汽鼓(4)中产生蒸汽。乙締和 氧气在催化剂床中部分地反应,产生环氧乙烧化0)、二氧化碳和水。反应器出口气体在气体 冷却器(2)和气体对气体交换器(3)中被进一步冷却,并且被馈送至环氧乙烧洗涂器(5) W 由水吸收E0。来自EO洗涂器顶部的循环气体被馈送至C〇2接触器(6) W由碳酸盐溶液吸收二 氧化碳,最后馈送至清洗区(7) W清洗任何残留的碳酸盐粒子。来自清洗区顶部的循环气体 被馈送至分离鼓(8),W移除任何液体,并最终经过循环气体压缩机(9)而被循环回EO反应 器。氯化物活化剂(14),优选二氯化乙締邸C或氯乙烧EC,小量地连续馈送至循环气体,在EO 反应系统中作为活化剂W及选择性促进剂。来自活化剂的小量氯化物(ppm等级)足W增加 催化剂的选择性W及活性。EDC或制燃烧反应,即比环氧化反应(即第一反应)更大程度 的第二反应。通过运种方式,EDC或EC促进EO的选择性。小于抑制剂的最佳数量会降低选择 性并且产生更多的二氧化碳。因此,在反应器入口的抑制剂浓度的最佳值对于最大化EO产 量是重要的。剂量过多和剂量不足的活性剂会大幅降低催化剂选择性并且导致异常的情 形。因此,活性剂的最佳剂量对于一直维持最高选择性是必要的。然而,最佳剂量比例不是 固定的,可W随着例如催化剂年龄、来自系统的氯化物损失W及反应器溫度而变化。
[0070] 由于工艺的复杂动态,非常难W理论地计算氯化物剂量比例。高选择性催化剂对 于氯化物剂量比例是非常敏感的,与最佳剂量的任何偏离对于选择性W及工艺的整体经济 性具有不利的影响。
[0071] 典型地,有与运样一种工艺相关的大约20个自变量W及35个因变量,它们并非全 部都在本实例中示出。测得的自变量包括:例如由线上分析器(17)测得的氧气、乙締、甲烧、 乙烧、二氧化碳、水、环氧乙烧、氮气及氣气等循环气体入口合成物的9种成分,W及循环气 体流量(16)、压力(19)、冷却液溫度(18)、在反应器入口处气体的氯化物浓度(即不同的氯 化物种类,例如由线上氯化物分析器(29)测得的二氯乙烧、氯乙烧、氯乙締、氯甲烧、氯丙 締)、甲烧流量(23)、乙締流量(24)、氧气流量(25)、EDC流量(26)、EO洗涂器顶部溫度(28)、 清洗塔顶部溫度(28)等。因变量的实例包括循环气体出口合成物(由分析器(20)测量的如 上所述的9种成分)、催化剂的选择性(21KE0E产量(计算的)、蒸汽鼓(22)中的蒸汽产生等。 如图3所示,所有的传感器和计量器都与线上实时历史数据库(15)相连接。
[0072] 获取历史工艺数据集W建立AN饰莫型
[0073] 数据收集
[0074] 由于神经元学习主要基于运些数据,所W数据的质量和数量在MN建模中是重要 的。在监控工艺的实例中,在稳态下约六个月地收集实际工厂运行数据的每小时平均值。一 般来说,在现代乙二醇工厂中,所有的实时工艺数据从各种传感器和发送器连续地送至控 制计算机系统或DCS控制台。而且,工厂DCS可适用于将所有的实时数据收集并且保存在工 厂历史数据库中(例如,PI系统、IP21或Exaquantum等商业上可取得的历史数据库实例),使 得运些数据可在往后的日期中与标记在其上的时间一起被取出。运些历史数据库适用于下 载任何历史日期和时间的电子表格中的所有工艺数据。此特征可W用来收集工厂的稳态数 据。
[0075] 在实例中,从明显的不准确度中检查出数据和清除,并且保留那些代表稳定状态 和平顺的工厂运行的数据。最后,约4000记录合格用于神经元建模。收集的数据范围包括从 80 %容量开始到110 %设计容量(即如所设计的工厂容量)的在不同容量下的工厂运行数 据。而且,运些数据包括在不同的催化剂寿命年龄的工厂运行期间收集的数据。
[0076] 输入及输出参数的选取准则
[OOW]为了选择适当的输入和输出参数W用于神经元建模,进行下面的论述。示例性的 神经元模型可用于至少下述目的:
[0078] 1)监控反应器条件W及快速诊断任何异常
[0079] 2)确保氯化物添加比例是最佳的W及使选择性最大化
[0080 ] 3)监控催化剂选择性W及活性
[0081]基于上述准则,根据一个实施例,选择输出参数W监控反应器性能,并且参数包括 下述群组中一个或多个、或由下述群组中的一个或多个组成:如表1中所示的氧气转换、催 化剂馈送选择性(馈送选择性)W及反应器冷却液溫度。运些输出参数可W视工厂配置而改 变。可W根据本发明的一个方面而选择额外的参数。根据本发明的一个实施例,输出参数包 括如也在表1中给出的上述输出参数或是由其组成。
[0082]表1:基于Ar^N的EO反应器模型的输入和输出参数
[0084] 根据EO反应区的运行经验和试验工厂研究经验,选择输出参数。运S个参数可W 预示EO反应器的效率。第一个参数是氧气转换,代表发生在EO反应器中的反应量(需要的和 不需要的),并因此间接代表催化剂被使用的有多广泛。第二个参数是馈送选择性,代表催 化剂效率,即相比较于不需要的反应,催化剂促进所需反应的效率有多高。第=个参数是反 应器冷却液溫度,即反应器溫度,代表催化剂活性。对于给定的EO生产率而言,较高的溫度 意为催化剂较不活跃,反之亦然。
[0085] 根据乙二醇工厂中的运行经验,影响氧气转换、馈送选择性W及反应器溫度的所 有物理参数被置于所谓的"愿望清单"中W用于进一步的考虑。
[0086] 在"愿望清单"中登陆的数目之外,执行大规模的试验工厂研究W及微反应器测 试,W将影响如上所述的模型输出参数的输入参数列入候选清单。
[0087] 接着,A順回归可用于建立已选输入的最佳集,其描述反应行为。下述准则引导输 入集的选择:
[0088] ?输入的数目应尽可能低。
[0089] ?各输入应与输出参数高度交叉关联。
[0090] ?输入之间应彼此弱交叉关联。
[0091] ?选取的输入集应给与最佳的输出预测,通过使用统计分析来检查,例如通过平 均相对误差绝对值(AARE)、标准偏差、交叉关联系数。
[0092] ?在神经元网络架构中,应具有低复杂度,即低数目的隐藏层。
[0093] 上面提到的准则接着用于识别最恰当的输入参数集。根据上述分析,如表1中所 示,识别出10个输入参数W预测输出参数氧气转换、馈送选择性W及反应器溫度。根据本发 明的一个实施例,输入参数包括下述组成的群组中的一个或多个、或由下述组成的群组中 的一个或多个组成:如表1所示的反应器化入口浓度(入口氧气浓度)、C2H4入口浓度(入口乙 締浓度)、C〇2入口浓度(入口二氧化碳浓度)、气体每小时的空间速度、EO差量(遍及反应 器)、工作率、累积的EO产量(每m 3的催化剂)、总氯化物浓度、洗涂器顶部溫度化0洗涂器顶 部溫度)W及清洗塔顶部溫度。运些输入参数可W视工厂配置而改变。可W根据本发明的一 个方面,可W选择额外的参数。根据本发明的一个实施例,输入参数包括如也在表1中给出 的上述输入参数或是由其组成。
[0094] 建立基于MN的EO反应器模型
[0095] EO反应器建模的复杂度
[0096] 到目前为止,在先前技术中尚未发现能准确预测工业EO反应器的输出的主模型。 特别是,对于工业情形中的EO反应时氯化物相互影响的研究是很有限的。
[0097] 因此,需要建立可靠的主模型W用于工业EO反应器,其考虑下述复杂度:
[0098] ^EO反应器模型是高度非线性的
[0099 ] ?催化剂选择性W及活性随催化剂的年龄改变。
[0100] ?对于催化剂选择性W及催化剂活性的反应输入参数的敏感度(如氯化物浓度、 氧气、乙締浓度等等)可随时间改变。此改变在高选择性及中度选择性催化剂中更加明显。 例如,一个单位的氯化物改变将在催化剂寿命的不同年龄不同地改变催化剂的选择性。 [0101 ] ?模型方程和/或模型系数可W随着催化剂特性改变。
[0102] ?任何静态模型,如为了一次数据而建立的DMC模型,对于整个催化剂寿命可能不 是有效或成功的。其需要周期性地重建或再训练。
[0103] 模型建立
[0104] 参考用于建模目的的表1,反应运行条件输入参数可W视为大小为(4000*10)的输 入矩阵X的实例,并且对应的反应运行条件输出数据可视为大小为(4000*3)的输出矩阵(Y) 的实例。为了ANN训练,X的各列代表十维的输入向量X =[X1,x2,…,X10 ],W及矩阵Y
的对应 列代表立维所需的或目标输出向量y= [yl,y2,y3]。由于输入和输出的量值彼此大幅地不 同,所W,它们WO-I比例归一化。为了避免上述的'过度训练'现象,随机选取80%的总数据 集W用于训练,鉴于验证及测试,选取剩下20%的总数据集。
[0105] 在实例中,识别出10个参数作为用于MN的输入参数,而氧气转换、馈送选择性W 及反应器溫度被指定为输出参数或目标。运些数据接着用于建立如上所述的AN饰莫型。
[0106] 基于Ar^N建模的优点在于可W对于所有工艺输出,即氧气转换(yl)、催化剂选择性 (y2) W及反应器溫度(y3),建立综合的多输入多输出(MIMO)模型。
[0107] 虽然在网络权重的基于EBP的迭代更新的实例中使用训练集,但是相同的测试集 用于同时监控MLP模型的归纳(generalization) eMLP架构包括十个输入(N= 10) W及S个 输出化=3)节点。
[0108] 在开发最佳MLP模型的实例中,系统地改变了其结构参数,即隐藏节点化)的数目、 输入层W及输出层中的激励函数、学习率W及MN算法。为了选择整体最佳的网络模型,选 取具有最低AARE的模型W用于测试集(参见下述)。
[0109] ANN模型的表现评估
[0110] 有不同的测量用于评估ANN表现(performance ),验证W及留一法(leave-one- out)误差评估是最常使用的,可W将全部可取得的数据分成训练数据(80%的数据)和测试 数据(随机选取20 %的数据)。在训练数据上训练Ar^N算法,但测试数据上评估ANN表现。
[0111] ANN预测的统计分析可基于下述表现准则:
[0112] 1.测试数据的平均相对误差绝对值(AARE)应是最小的
[0114] 2.测试数据误差的标准差应是最小的
[0116] 3.在输入与输出之间的交叉关联的系数(R)应约等于一 (unity)。
[0118] 如果系统能很好地执行系统尚未受训的测试数据,训练则被视为是成功的。
[0119] 在AN饰莫型调谐参数的优化后,取得的模型输出在表2中概述。在所有的可能之外, 在隐藏层中具有十个数目的节点W及在输入层和输出层有双曲正切及线性函数的莱文伯 格-马夸特(Ma;rquard Levenburg)算法(Gill ,1981)被选为用于本情形的优选的解决方案 (具有最低的AARE)。氧气转换、选择性W及反应器溫度的低AARE分别为0.4、0.05W及 0.48%,并且被视为考虑对EO反应现象的较差不甚理解的优良预测表现,W及用于训练的 大数据库包括各种生产容量和不同催化剂年龄。
[0120] 表2:基于Ar^N的EO反应器模型的预测误差
[0121]
[0122] 使用AN饰莫型W用于故障检测
[0123] 一旦开发出离线Ar^N模型,其可被用于根据工厂的实时输入来预测实时输出。模型 预测输出接着与实际输出比较。由于在训练阶段期间,在实际输出和模型预测输出之间的 误差%是非常小的,所W在正常操作期间,也预测线上Ar^N模型产生非常小的误差% (通常 小于1%)。但是如果在工艺中发生任何异常事件时,此预测误差%将急剧上升,并且因此产 生故障信号。通过运种方式,使用AN饰莫型W实时监测工艺中的故障。
[0124] 一旦已建立令人满意的称为离线模型的ANN EO反应器模型时,此模型接着用于线 上实时系统。参见图2,在线上实时系统中,实时Ar^N输入数据从历史数据库馈送至装载有 ANN软件的计算机。图2表示了对于高度及中度选择性催化剂的选择性相对于氯化物浓度的 曲线图。MN模型可W立即计算3个MN输出参数,W及借助于MN模型立即计算出误差百分 比。
[0125] 如图9所示,W实时为基础地绘出实际输出和预测输出的参数值。图9:实时的MN 预测表现,表示了按照实际工厂数据的ANN模型预测的良好性。只要3个输出的预测误差百 分比是在阔值范围内(在此情形中为3%),则该工艺被认为是正常。如果在任何时间点,预 测误差百分比增加至它们的最大极限值之外,产生故障信号并且作出发生异常事件的结 论。
[0126] 在EO反应系统中观察到的异常事件
[0127] 从全世界过去20年各种E0/EG工厂的经验,取得反应系统中可能的异常事件。EO系 统中某些但非全部的主要异常事件包括:
[0128] 1)催化剂过度氯化W及催化剂选择性随之损失
[0129] 2)催化剂氯化不足并损失选择性
[0130] 3)催化剂活性的损失
[0131] 4)由于氯化物馈送增加或系统的氯化物损失下降,反应器入气口处总氯化物的突 然增加
[0132] 5)来自环氧乙烧洗涂器顶板(overhead)的高EO突破点,其对催化剂选择性和活性 带来不利影响。
[0133] 6)从清洗塔顶部的高湿气转移,其对催化剂选择性具有负面影响
[0134] 7化于C〇2移除单元中的问题,反应器入日气体处的高C〇2浓度
[0135] 8)在反应器管内部的热点或任何燃烧反应的形成
[0136] 9)反应器容量的突然增加或降低
[0137] 10)任何其它异常事件,包括但不限于反应器回路中任何的流量传送器故障、氯化 物分析器或质谱仪(或气体层析仪)故障等等。
[0138] 用于PCA输入参数的选取准则
[0139] 为了建立可靠的PCA模型,选择适当的输入参数是重要的。可W选择输入参数使得 可W捕捉EO反应系统中的所有潜在的异常事件。
[0140] 参考图2,对于高选择性和中度选择性催化剂,在最佳的氯化物区中操作氯化物浓 度是非常重要的。如图2所示,此最佳区是非常窄的,在此区之外的氯化物的任何偏差将造 成选择性急剧下降。
[0141] -般来说,期望催化剂在工厂中的最佳区执行或运行。催化剂运行与最佳区的任 何偏离难W由面板操作员探测,如果使其维持未被探测,则选择性将急剧下降。选择输入参 数W快速捕捉氯化不足和过度氯化的区域。
[0142] 可W使用下面的评述W选择与PCA模型建立对应的输入参数:
[0143] 1)使用工艺知识和工厂操作经验W将征兆和根本原因参数列入候选清单:
[0144] 起初,一个接一个地选择异常事件W用于进一步的研究。举例来说,选择上述列出 的第一异常事件,即"催化剂过度氯化W及随之的催化剂选择性损失",W用于进一步的分 析。工厂操作经验,现在应用EO反应系统的领域知识识别能捕捉异常事件发生的所有相关 的输入参数。识别出可W被认为是异常事件的征兆(symptom attic)的某些参数。识别出异 常事件的根本原因的某些其它参数。进行逻辑推理W理解催化剂过度氯化期间可能发生的 事。根据经验及工艺知识,识别所有征兆W及根本原因参数。举例来说,选择性将急剧下降 W及出口的氧气浓度在过度氯化事件期间也将下降。所W可W选择运两个参数作为征兆参 数。EDC流量增加 W及随后的总氯化物增加被视为对应过度氯化现象的根本原因参数。根本 原因参数并非总是如此明显。类似的例子,EDC流量不会增加,但是来自系统的氯化物损失 降低并因此增加反应器入口处的总氯化物。没有直接指示来自系统的氯化物损失,所W也 包括例如洗涂器顶部溫度、清洗塔顶部溫度等间接参数作为根本原因参数。
[0145] 2)使用实际的操作数据W增加更多参数:在工厂的寿命中,偶尔发生运些类型的 异常事件。当运些类型的异常事件发生在工厂中时,操作员通常在他们的每日日志中写下 有关发生的细节。研究运些日志W及工厂历史工艺数据W识别工厂过去真正发生运些异常 事件的时间周期。详细研究在此时间周期期间的所有有关的参数W识别更多的征兆和根本 原因参数。使用统计方法W找出催化剂选择性与其它参数之间的相关系数。更紧密地观察 W及包括具有在0.5至1(高度正相关)W及-0.5至-U高度负相关)之间的相关系数的参数 作为PCA的输入。
[0146] 3)研究异常事件期间快速变化的参数:相比于变化很慢(可在数小时之后)的某些 参数,有某些参数是当异常事件发生时(可在任何异常事件发生后的数分钟之内)变化很 快。
[0147] 举例来说,对于过度氯化现象,相比于选择性变化(耗费4-6小时W响应),出口氧 气浓度变化很快(例如在数分钟之内)。快速变化的参数比缓慢变化的参数被给予更多的优 先权,使得工艺中的任何异常可W被快速检测。在上述步骤2中被列在候选清单中的各及每 一参数的趋势被详细地研究,并且快速变化的参数在候选清单中被给予优先权。在异常事 件期间,选择输入参数的专业知识是必要的,W快速捕捉系统的变化。
[0148] 4)输入参数的数目应是最小的:输入参数的数目应尽可能的小W检测如上列出的 异常事件中的所有特征。最简单的故障诊断PCA模型将避免大量的输入参数传送器的噪声 或故障所引起的不必要的故障检测。而且,避免了冗余的工艺参数。举例来说,反应器蒸汽 鼓压力W及反应器冷却液溫度通过蒸汽表关系相关并因此代表冗余信息。所W,它们中的 任一项足W作为输入参数。
[0149] 表3给出了选取用于示例性E0/EG工厂中PCA模型建立的输入参数列表。
[0150] 表3:基于PCA的EO反应器模型的输入参数
[0153] 如何实时捕捉PCA输入数据
[0154] 在PCA建模中,数据的品质和数量至关重要,因为最终模型主要根据运些数据。在 示例性的实际工厂中,收集约六个月的稳定状态下的每两分钟的操作数据。如早先所述,使 用工厂历史数据库(如PI系统、IP21或Exaquantum等一些商业上可取得的数据历史系统)W 收集所有历史数据。
[0155] 在PCA中有两种数据类型。第一类型的数据被称为普通工厂数据,其为工厂正常W 及平顺运行时的数据。
[0156] 通过小屯、读取控制室内操作员所维持的每日日志,可W发现平顺运行的工厂的证 据W及时间间隔。第二类型的数据是当工厂中发生任何异常事件时的输入数据。再次,从每 日日志中取出异常事件的时刻W及性质。运些数据被保存在标识有对应异常事件的单独的 文件中。
[0157] PCA输入数据怎样与ANN输入/输出数据相关?
[0158] 因为它们检测和/或诊断故障的方式不同,所W,虽然某些参数是共同的,但是, PCA输入数据与Ar^N输入/输出数据是不同的。虽然PCA和Ar^N都是对应任何异常性而监控类 似的工艺,但是它们的目的不同。通过应用PCA,多维或多变量的数据集减少至更少的维度 (即主成分),而在数据内仍然保留尽可能多的有用信息,运大幅简化工艺数据的分析、W及 任何异常事件的检测。另一方面,ANN使用反应器模型W根据从其输入参数收到的信息而预 测催化剂的关键性能参数。W工厂正常W及平顺运行时的稳定状态的每小时平均数据训练 Ar^N模型。只要AN饰莫型能准确地预测性能参数,则其指示操作是稳定和正常的。当实际的性 能参数明显不同于ANN预测时,其指示工艺中发生某些异常事件,W致于工艺不再按照其受 训的模型表现。
[0159] 下表表示PCA输入参数与Ar^N参数之间的某些关键差异。
[0160] 表4: PCA输入参数与ANN输入数据之间的差异
[0163] 在Landells等人的专利(美国专利2010/0036529)中;为炼油工艺而初始建立MPC 模型。此模型根据某些独立的工艺参数预测某些相关值。将此预测模型计算的因变量值从 真
正测得的因变量中减掉,W计算残差。在Landells等人的专利中,对一个或多个因变量的 残差值执行PCA。
[0164] 相对地,根据本发明的方式,对原始工艺参数而不是任何残差执行PCA。
[0165] 对原始值施加 PCA的理由如下:
[0166] EO催化剂特性不是静态的,而是随时间变化。催化剂选择性W及活性随催化剂的 年龄(通常是2-3年)变化。反应器输入参数(如氯化物浓度、氧气、乙締浓度等等)的对催化 剂选择性W及催化剂活性的敏感度可随时间改变。此改变在高度及中度选择性催化剂中是 更加显著的。例如,一个单位的氯化物改变将在催化剂寿命的不同年龄不同地改变催化剂 选择性。
[0167] 所W,预测的模型方程和/或模型系数因此需要随催化剂特性的变化而变化。
[0168] 所W,任何静态模型,如为了一次数据而建立的MPC或DMC模型(如Lande 11S等人使 用的),对于整个催化剂寿命可能不是有效或成功的。其需要周期性地重建或再训练。
[0169] 换句话说,由于催化剂特性随时间变化,所W,今天产生优良预测的任何EO反应器 模型从现在开始的六个月后不会产生准确的预测。所W在未来其将产生大残差。如果PCA施 加在残差上(如同Landells等所使用的),则其将错误地检测为一异常事件。在此情形中, PCA无法区分大残差是归因于异常工艺事件还是归因于不良的模型预测。因此,根据本发 明,将PCA施加在原始数据上而不是残差上。其可W消除任何中间的预测模型准确度。
[0170] PCA模型的实施。
[017。 建立模型
[0172] 起初,收集由正常W及异常区域数据组成的所有输入参数数据作为训练数据。起 初,仅有对应于工厂正常运行的数据被馈送至PCA算法,并且相对于主成分轴作图。在图中, 大部分数据集中在一个称为正常区的区域中。
[0173] 产生训练数据的PCA图
[0174] 在本发明中,发现第一 W及第二主成分可捕捉超过90%的数据变化。所W,取代单 独监控25个不同的参数,可仅监控前两个主成分W检测任何异常性。一旦在运行PCA算法后 取得前两个主成分的得分值时,对应的加载值被冻结。计算得分和载入的计算流程在附录 中总结。
[0175] 如图5a所示,绘制包围运些数据的楠圆形,其限定95%的置信区间。换句话说,对 于95%的置信区间,数据集(正常数据)中95%的数据点落在两主成分中的各自的阔值范围 内。如图5a所示,对于PCl,正常区的所有数据的坐标值落在-7至+6,而对于PC2则落在-4.2 至+3.9。如图5a中所示,因而绘制置信区间楠圆形。
[0176] 用于训练数据的霍特林化otelling)T2图
[0^7]在本发明的另一实施例中,计算对应于正常区的各数据点的T2值。T2值通常称为霍 特林T2统计,并且定义了数据点离原点的距离,例如,数据点离两个或两个W上主成分的交 点或原点的距离。用于计算T 2值的计算流程在附录中总结。在一实例中,再次在图中绘制 95%的置信界限线,使得95%的数据落在此线之下。通过计算所有训练数据集的所有T 2值 的95%,W计算高界限线的值。将T2值与预设的阔值(例如通过楠圆置信区间定义的)比较, 将提供异常事件是否已发生或正在发生的指示。
[0178] 用于训练数据的残差图
[0179] 在本发明的又一实施例中,对各数据点计算所谓的残差。残差代表未由预设数目 的主成分表示的数据中的变化量。如果该值增加,则其表示相比于模型的工艺中的变化,运 表示与正常或期望的行为的偏离。再次,使用相同的流程,在图中绘制95%的置信界限线, 使得95 %的数据落在此线之下。
[0180] PCA图中一个或多个异常区域的产生
[0181] 在PCA模型建立的第二部分的实例中,每个异常事件群接着乘W它们对应的负载 W及得分。运些得分值接着绘制在相同的主成分平面上。运些数据将出现在对应于正常区 的楠圆外的不同集中区中。再次,在相同的图形中绘制新楠圆,其代表特定异常事件的95% 置信区间。此楠圆现在代表特定异常区,例如过度氯化区。对各异常区数据群重复相同的流 程,W及由于模型建立的结果而绘制对应每一异常事件的数个楠圆,可获得如图7中所示的 图片。图7表示了具有正常区和不同异常区的实时PCA得分图。在此图中,楠圆(中央大形状 的)可代表正常区,所有其它楠圆可代表不同的异常区,例如过度氯化现象区、氯化不足区、 线上氯化物分析器故障区等等。运样一个图可识别多个异常事件区W及对应的标签。
[0182] 一旦在相同图中绘制了所有正常W及异常区域时,现在此图能用于绘制实时数据 的PCA值。仅有置信楠圆保留在图上,图上所有训练数据点被移除,使得此图能够用于容纳 新的实时数据。对于T 2图和残差图,紧保留轴线W及上限线。
[0183] 使用PCA的故障诊断
[0184] 从由工艺数据集的PCA得到的数据中可识别异常事件。有多种方式可W实现此点。 在本发明的一个实施例中,根据对应预设数目的主成分(例如前两个主成分)的得分值,计 算置信区间。当然,可W应用超过两个的主成分。根据来自数据集的落在对应各主成分的预 设置信区间内的数据点的百分比定义置信水平。预设的数据点百分比通常是在90至95%范 围内的值,例如95%的数据点。因此,对于95%的置信区间,数据集中95%的数据点落在对 应两主成分中的每一个的阔值范围内。置信区间的形状通常为楠圆形。如果最新收集的数 据点落在置信区间外,通常称为孤立点,则运表示不寻常或异常事件可能正在发生。
[0185] 在本发明的另一实施例中,对各数据点计算T2值。T2值通常称为霍特林T2统计,并 且定义了数据点离原点k的距离,例如,数据点离两个或两个W上主成分的交点或原点的距 离。将T 2值与预设的阔值(例如通过楠圆置信区间定义的)比较,将提供异常事件是否已发 生或正在发生的指示。
[0186] 在本发明的又一实施例中,对各数据点计算所谓的残差。残差代表未由预设数目 的主成分表示的数据中的变化量。增加的残差值表示相比于模型的工艺中的变化,运表示 与正常或期望的行为的偏离。
[0187] 为了确定异常事件的发生,上述诊断技术可W单独使用或结合使用。
[0188] 实时实施PCA模型
[0189] 图4:历史数据库和装载有PCA和/或Ar^N软件的专用个人计算机之间的接口,表示 了数据历史服务器(15)输出与具有主成分分析软件的计算机(30)连接。数据历史服务器从 工厂DCS或从工厂中的各种传送器或传感器处接收实时工艺参数值。所有数据可从历史数 据库实时馈送至装载有PCA和/或Ar^N软件的单独的专用个人计算机。可实时计算PCA得分、 负载、T 2值W及残差值。预先产生的图形由新的实时数据更新。
[0190] 实时检测运行正常或异常的工厂
[0191] 可手动或视觉地检测异常事件。在一个实施例中,在控制室中的显示屏为用户提 供主成分得分图,或T2图,或残差图中的一个或多个,其中使用置信区间的指示W警告用户 异常事件发生。当数据点显示为偏离至置信区间外时,则得分值的检查及与其相关的变量 贡献能够用于确定偏离的原因。通过设置检测异常事件何时发生的快速装置(例如,残差 PCA数据的得分值、T2值、W及残差中的一个或多个),则操作员能快速地确定任何偏离的原 因并且评估是否需要手动干预工艺。
[0192] 或者,自动执行分析和异常事件检测,例如使用适当程序化的计算机,其能够根据 例如PCA得分值、T2值或残差中的一个或多个而计算数据点是否落在置信区间外,W及为了 改正发生异常事件的原因而识别需要被修改的变量(如果有的话)。此信息作为输出馈送至 工艺控制装置,该工艺控制装置能纠正一个或多个自变量W消除发生异常事件的原因。
[0193] 如图5a-c中所示,5a: PCA得分图,5b: T2图,5c:残差图和贡献图,单独或结合使用 5a-5c,W实时检测异常事件。在图5中,得分图是累积图,表示最新的数据点101W及先前收 集的数据点相对于前两个主成分PCl:x轴,PC2:y轴的作图。数据点的相对95%置信区间102 的位置,提供工艺是否在预期的容差内运行的指示,或者异常事件是否正在发生。如果EO反 应工艺运行正常,则实时数据点将落在被指定为正常区的大楠圆区内(参考图7)。如果发生 某些异常,则实时图点将落在大楠圆(即正常区楠圆)外,表示工厂中发生某些异常。如果实 时点落入与异常事件相关的任何楠圆内时,则用户将快速地知道正在发生哪个异常事件。 运提供快速并且容易做到的方法,来识别已经知道其缓解措施的异常事件的发生。校正动 作可W由操作员手动执行。或者,运可W自动完成,使得异常事件的识别能提供维持最佳运 行所需的校正动作给工艺控制装置。
[0194] 可能发生某些异常事件,其导致实时图点偏移至代表正常区的大楠圆外,但其未 落在任何异常事件的楠圆下,而是出现在未由楠圆覆盖的其它地方。运表示可能已经发生 某些新的异常事件,该异常事件过去并未发生过,即在训练数据期间未发生的。如此,可W 详细检查工艺W及找出已发生哪一异常事件。在此时段保存的数据,可W用于在PCA模型再 训练期间建立对应新的异常事件的新楠圆(稍后描述)。
[0195] 随时间的T2值W及随时间的残差值的趋势图也在图化W及图5c中示出。如果工艺 被扰乱或者其它异常事件发生,则运可由一个或多个增加的T 2值W及落在预设95%置信区 间102外的得分值表示,例如,如数据点103所表示的,其也对应于增加的T2值108,W及对应 后续数据点109的残差值增加。
[0196] 当检测到异常事件时,由用户通过检查所有对应的图,能够探测到偏离的一个或 多个数据点。一种方式是观察PCl贡献图,如图6所示,其提供关于哪些变量与异常事件相关 的信息。图6中的图表示对应每一 PCA输入变量的贡献值y轴相对于对应落在95 %置信界限 外的得分数据点的第一主成分的图,即对应所选取点的使用PCl的贡献图。具有高值的变量 对于沿着指定主成分的数据点的位置具有高度影响。在所示实例中,与第一主成分有关的 得分数据点的位置尤其受变量6、7W及15严重影响。变量1和5对数据点具有中等影响。
[0197] 在实时校正动作期间使用PCA图
[0198] 在异常事件发生后,可在校正动作期间使用PCA图。运由图8a-8f解释。图8a-8f表 示具有正常区和不同异常区的各自实时PCA得分图的例子或快照。假设过度氯化现象已发 生。图8a代表工厂正常运行的PCA得分图。如从图8a中所见般,实时点正好落在正常楠圆内。 图8b代表3小时后的工厂条件,此时代表目前工厂状态的点开始移向正常楠圆的外周。运给 工厂操作员/工程师提供工厂从正常移至异常区的早期警告。图8c表示点正朝过度氯化区 楠圆移动。操作员能解释此点的轨迹路径W及了解催化剂正进入过度氯化。期望操作员采 取立即的校正动作。操作员可W检查图6(其为当时的贡献图),W找出过度氯化运行的根本 原因并且采取校正动作W消除根本原因。过多的邸C流量可能是根本原因。在操作员未能采 取校正动作的情形中,点将偏移至过度氯化楠圆并且产生警报(图8d)。其也在如图6所示的 面板中显示根本原因。
[0199] 现在,如果操作员采取合适的校正动作,则点开始实时朝正常楠圆移动。参见图 8e,运将操作员已采取的校正动作是正确的W及工艺开始朝正常区移动的指示给予操作 员。如果操作员的校正动作不正确,则点将开始反向移离正常区并且脱离代表正常运行的 楠圆。如果操作员的校正动作
不适当,则点将不会移动并且维持在过度氯化楠圆内。
[0200] 通过运种方式,操作员能理解自己的校正动作足够到什么程度W及准确到什么程 度。在工艺恢复正常后,参见图8f,点将移回至正常区楠圆。
[0201] PCA模型的有效性
[0202] EO催化剂的时变特性
[0203] 如早前所述,催化剂选择性W及催化剂活性随着催化剂的年龄而变。由于催化剂 的活性部位因烧结效应而永久丧失,催化剂会逐渐随着时间失去活性。在催化剂寿命期间 反应器溫度W及总的氯化物需要逐渐增加 W维持生产率。选择性随时间连续下降。所W,使 用最近的数据建立的PCA模型在6个月后可能无效。例如,目前看起来正常的反应器溫度和 总的氯化物值在运行6个月后可能不正常。所W,预测的模型方程或系数因此需要随催化剂 特性的变化而变化。PCA模型需要使用最近的运行数据周期性地再训练。
[0204] 为了处理工艺的时变特性,开发可被追踪并且用于ANNW及PCA模型再训练的定量 准则。运些包含称为"残差"的新变量,其代表在当前的工艺条件下模型的良好性。当残差值 低于3时,本模型能被认为是良好的并且能捕捉工艺的固有物理现象。然而,如果残差值超 出3并且维持在该处,则其被认为是表示当前AW#日/或PCA模型选择性变差W及应当使用最 近的运行数据重建/再训练。
[020引通过残差图捕捉PCA模型的效率
[0206] 当发生异常事件时,在T2图W及残差图中作出下述两观察评述。在第一情形中,仅 有T2值将增加超过其较高限制线,但是残差值将保持在其最大限制值之下。运意为发生异 常事件,但是其通过PCA模型被很好的计入,运通过低残差值来表示。残差代表未由预设数 目的主成分(通常前两个或=个主成分)表示的数据中的变化量。通常,残差图将是在由 95%置信区间表示的最大限制线代表的阔值之下,运意为工艺数据中大部分变化由前两个 或=个主成分捕捉。在第二情形中,当异常事件发生并且T2值W及残差值都越过其较高的 限制线时,运表示工厂中已发生某些异常事件,其未由当前的PCA模型很好地表示。运给操 作员指示要详细研究事件。换句话说,如果残差值增加,其表示相比于模型,工艺中的特性 变化。如果残差值突然上升超过阔值界限并然后返回,则其可被解释为工艺中发生PCA模型 未捕捉到的某些意料不到的事件,即在之前训练数据期间未发生的。但是如果T2和残差值 都相当长时间保持在高值并且在工艺中未发现扰乱或异常,则其能被解释为由于催化剂表 现变化,工艺特性因而永久变化并且其变化不能通过当前模型捕捉。从如图6所示的贡献图 中,可W发现关于哪些参数正将T2W及残差值驱出范围之外的更详细的信息。此时PCA模型 需要使用新的最近的数据被重建或再训练。
[0207] 实施用于EO反应器PCA模型再训练的定量决定准则。
[0208] 在实例中,对于反应器PCA模型,T2W及用于残差的较高限制设置为3。运意为,在 正常运行期间,95%的计算的T2W及残差值将小于3。如果T2W及残差值连续=天都保持在 3 W上并且在EO反应工艺中没有可见的异常时,包括没有传送器或分析器的故障,则运可W 被解释为不再由当前的PCA模型捕捉的工艺特性的永久改变。此时PCA模型需要使用新的最 近的数据被重建或再训练。
[0209] PCA模型的再训练
[0210] 在实例中,通过收集最近=个月的数据而离线完成再训练,并且依照相同的程序 再次建立PCA模型。输入参数可保持相同。在再训练PCA模型后,得分W及负载值将会变化。 新的T2W及残差值将再次低于它们的最大限制3。而且,如早前所述,在再训练阶段中,对于 任何新的异常事件,识别新的楠圆面积。 邮川 ANN模型的再训练
[0212] 基本上,PCA和Ar^N是W相似的EO反应工艺建模。当PCA模型由于工艺特性的变化而 失效时,可W预期Ar^N模型也将失效。一般来说,当重新得到PCA模型时,希望也再训练Ar^N模 型。运也是由MN模型的误差百分比准则表示。如果MN模型的误差百分比连续S天维持高 于3% W上并且工厂运行正常,则AW#莫型也可被再训练。可通过收集最近=个月的数据离 线完成再训练,并且依照与上述相同的程序再次建立AN饰莫型。
[021引基于ANNW及PCA故障诊断的数据流
[0214] 图10:基于ANNW及PCA的故障诊断系统的原理图,其代表基于MNW及PCA的故障 诊断原理图。如图10中所示,基于AW#日基于PCA的故障诊断系统目标均在于单独W及独立 地检测EO反应工艺中的任何故障。
[0215] 诊断故障的替代方式:Ar^N尝试使用Ar^N模型而从选取的输入参数预测EO反应性能 参数,并且将实际输出与计算输出比较。运是基于模型的方式。
[0216] 另一方面,PCA可W采用完全不同的输入集,并且将多维数据集转换成两维数据 集,该两维数据集设置为通过第一W及第二主成分表示,W为了容易观察和理解。
[0217] 不同的输入参数:在实例中,从用于其输入和输出的每小时平均数据中建立Ar^N离 线模型。当工厂处于正常和稳定状态时,取得运些数据。另一方面,对于不同的变量,按两分 钟快照数据来取得PCA数据。PCA输入参数被认为是比Ar^N输入参数更详尽的。而且,在工厂 正常和异常运行期间,取得PCA输入数据。从每日日志中追溯过去发生在EO反应系统中的所 有异常事件和单独收集在该时段期间的数据。
[0218] 离线模型建立W及线上实施:使用训练数据离线建立Ar^N模型。为诊断故障,Ar^N模 型预测的输出与W实时为基础的输出相比较,运两者之间的误差百分比高于30%时产生故 障信号。另一方面,对于正常运行和不同的异常运行,PCA模型在主成分平面内产生不同楠 圆。在PCA平面中实时绘点。此点的位置可W代表该时刻工厂的状态。如果此点位于正常楠 圆内部,则工厂是正常运转。运也可通过实时T2和残差值来表示,对于正常运行,该值将低 于3。相反地,如果该点落在代表异常运行的某些指定的楠圆内,则产生故障信号。运也可由 高于3的T2值来表示。
[0219] 独立诊断:A順和PCA可被认为是相同工艺的两独立审核,他们根据完全不同的输 入集独立诊断故障。它们的方式不同,它们彼此互补并且可被认为是冗余的。采用两不同系 统的目的是增加故障检测的可靠性。从关于故障诊断的各种来源可W知道的是,即使当工 艺正常时,故障诊断系统有时仍会产生故障信号。其使故障诊断系统的用户混淆,并且如果 错误的检测随时间继续,则此系统的可靠性在用户的屯、中是降低的。为了避免运种情况,提 出实施两个冗余的、完全分开的故障诊断系统。为此目的,如图10所示,设置可选的表决逻 辑W警告用户故障。
[0220] 附录
[0221] 主成分的计算
[0222] ?根据上述准则,选取输入变量Xi [022引 ?归一化Xn =U-战超)/0
[0224] ?计算协方差矩阵XVXn的所有特征向量和特征值
[0225] ?按照特征值的降序,设置特征向量。产生的矩阵称为载荷矩阵。第一和第二特征 向量分别Wfl( j)和f2( j)表示。
[0226] ?计算第一和第二主成分为
[0227] PCl = f^XnU)fi<j)
[022引户 C2 =芝I 瓜(/)/?.(/) >1
[0229] 霍特林的T2计算
[0230] 如下计算霍特林的T2
[023。 >t2= (PCl2/特征值 1 ) + (PC22/特征值 2)
[0232] ?T2统计数值给出,在由PCl和PC2定义的平面内,取样离工艺均值的距离的测量
[0233] ?高的T2统计数值因而表示取样呈现极端变化,但是通过PCA模型被很好地计入。 残差的计算
[0234] ?ReS i (j) = Xn(j) - [ (PCi*f 1 (j) + (PC2*f 2 (j)]
[023引?残差=[2resi( j)2/(n-2)]°'5
[0236] ?残差给出,取样垂直于PC1-PC2-平面的距离的测量。
[0237] ?高残差表示取样呈现未通过PCA模型很好计入的变化的形式。
[023引参考文献
[0239] Bulsari A.B.(1994),Applications of artificial neural networks in process engineering,J.Syst.Engg.4,131-170
[0240] Hecht-Nielsen 民.(1989),Theory of the back propagation neural network. Proceedings of the international joint conference on neural networks,I,593-611
[0241] Huang K.,Zhan X-L,Chen F-Q,Lu D-W(2003),Catalyst design for methane oxidative coupling by using artificial neural network and hybrid genetic algorithm,Chem.Engg.Sci.,58
[0242] Lahiri S.K and Ghanta K.C(2008),Development of an artificial neural network correlation for prediction of hold-up of slurry transport in pipelines,Chemical Engineering Science 63,
[0243] Lahiri,S.K and Khalfe N.(2010),Modeling of commercial ethylene oxide reactor : A hybrid approach by artificial neural network&diff erential evolution,International J.of Chemical reactor engineering,Vol 8,Article A4
[0244] Riedmiller M.,Braun H.(1993),A direct adaptive method for faster backpropagation learning:the 民P民OP algorithm,Proc.of the IEEE Int.Conf.On Neural Networks,San Francisco CA,Mar 28-Apr I
[0245] Gill,P.R.;Murray,W.;and Wright,M.H.(1981)"The Levenberg-Marquardt Method."§4.7.3 in Practical Optimization,London:Academic Press,pp.136-137
[0246] Stephanopoulos G.,Han C.(1996),Intelligent systems in process engineering:A review,Comp&Chem.Engg.,20,743-791
[0247] Tambe S.S.,Kulkarni B.D.,Deshpande P.
B.(1996),Elements of Artificial Neural Networks with selected applications in Chemical Engineering and Chemical&Biological Sciences,Simulations&Advanced Controls,Louisville,KY
[0248] 现在描述涉及下列项的本发明优选实的施例。
[0249] 1.用于监控工艺的系统,所述工艺由与工艺输入-输出数据有关的多维工艺数据 域中的工艺数据集所确定,所述系统包括:用于获取多个历史工艺数据集的装置;用于通过 执行多变量数据分析获取从所述多维工艺数据域至较化维度的模型数据域的转换的装置; W及用于将当前工艺数据集转换至模型数据集^监控所述工艺的装置。
[0250] 2.根据项1所述的系统,其中所述执行多变量数据分析包括主成分分析。
[0251] 3.根据项1所述的系统,其中所述执行多变量数据分析包括建立人工神经网络。
[0252] 4.根据项1至3中任一项所述的系统,进一步包括:用于指定模型域的一个或多个 部分的装置,每一部分容纳代表具体工艺运行条件的数据集;W及用于通过识别容纳当前 模型数据集的模型域的指定部分,为当前模型数据集诊断工艺运行条件的装置。
[0253] 5.根据项1至4中任一项所述的系统,其中诊断运行条件包括表示一个或多个异常 运行条件的故障诊断。
[0254] 6.根据项1至5中任一项所述的系统,其中所述工艺为化学工艺,特别是締控的部 分氧化。
[0255] 7.根据项1所述的系统,其中所述化学工艺包括在反应器系统中乙締的氧化W产 生环氧乙烧。
[0256] 8.根据项7所述的系统,其中由所述工艺数据域代表的工艺输入-输出数据选自用 于环氧乙烧生产的反应器系统处测得的下列参数群:
[0巧7] 输入参数:反应器化入口浓度、C2H4入口浓度、C化入口浓度、气体每小时空间速度、 遍及反应器的EO差量、工作率、累积的EO产量、总氯化物浓度、洗涂器顶部溫度W及清洗塔 顶部溫度;
[0258] 输出参数:氧气转换、馈送选择性W及反应器冷却液溫度。
[0259] 9.根据项5至8中任一项所述的系统,其中故障诊断包括将催化剂的过度氯化或氯 化不足诊断为异常运行条件。
[0260] 10.根据项1至9中任一项所述的系统,其中实时获取当前工艺数据和/或实时诊断 运行条件。
[0261] 11.用于监控工艺的方法,所述工艺由代表工艺输入-输出数据的多维工艺数据域 中的工艺数据集所确定,所述方法包括:
[0262] 获取多个历史工艺数据集;
[0263] 通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域 的转换;
[0264] W及将当前工艺数据集转换至模型数据集W监控所述工艺。
[0265] 12.根据项11所述的方法,其中执行多变量数据分析包括主成分分析。
[0266] 13.根据项11所述的方法,其中执行多变量数据分析包括建立人工神经网络。
[0267] 14.根据项11至13中任一项所述的方法,进一步包括:
[0268] 指定模型域的一个或多个部分,每一部分容纳代表具体工艺运行条件的模型数据 集;W及
[0269] 通过识别容纳当前模型数据集的模型域的指定部分,为当前模型数据集诊断工艺 运行条件。
[0270] 15.根据项11至14中任一项所述的方法,其中诊断运行条件包括表示一个或多个 异常运行条件的故障诊断。
[02川 16.根据项11至15中任一项所述的方法,其中所述工艺为化学工艺,特别是締控的 部分氧化。
[0272] 17.根据项16所述的方法,其中所述石化工艺包括在反应器系统中乙締的氧化W 产生环氧乙烧。
[0273] 18.根据项17所述的方法,其中由所述工艺数据域代表的工艺输入-输出数据选自 用于环氧乙烧生产的反应器系统处测得的下列参数群:
[0274] 输入参数:反应器〇2入口浓度、C2H4入口浓度、C〇2入口浓度、气体每小时空间速度、 遍及反应器的EO差量、工作率、累积的EO产量、总氯化物浓度、洗涂器顶部溫度W及清洗塔 顶部溫度;
[0275] 输出参数:氧气转换、馈送选择性W及反应器冷却液溫度。
[0276] 19.根据项15至18中任一项所述的方法,其中故障诊断包括将催化剂的过度氯化 或氯化不足诊断为异常运行条件。
[02W] 20.根据项11至19中任一项所述的方法,其中实时获取当前工艺数据和/或实时诊 断运行条件。
[0278] 21.计算机程序产品,包括非暂时性的计算机可读介质,具体实施程序指令,用于 使系统执行步骤:获取多个历史工艺数据集;
[0279] 通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域 的转换;W及将当前工艺数据集转换至模型数据集W监控所述工艺。
【主权项】
1. 用于监控工艺的系统,所述工艺由与工艺输入-输出数据有关的多维工艺数据域中 的工艺数据集所确定,所述系统包括: 用于获取多个历史工艺数据集的装置; 用于通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域 的转换的装置;以及 用于使用获取的转换将当前工艺数据集转换至模型数据集以监控所述工艺的装置。2. 根据权利要求1所述的系统,其中所述执行多变量数据分析包括主成分分析。3. 根据权利要求1所述的系统,其中所述执行多变量数据分析包括建立人工神经网络。4. 根据权利要求1至3中任一项所述的系统,进一步包括: 用于指定模型数据域中的一个或多个部分的装置,每一部分容纳根据可从历史工艺数 据集获取的模型数据集中的一个或多个簇而代表工艺正常运行条件或具体异常运行条件 的模型数据集,所述历史工艺数据集可在正常事件期间收集以及在异常事件期间分别收 集;以及 通过识别容纳当前模型数据集的模型域的一个或多个指定部分中的一个,为当前模型 数据集(101)诊断工艺运行条件的装置。5. 根据前述权利要求中任一项所述的系统,其中为当前模型数据集(101)诊断工艺运 行条件包括表示一个或多个异常运行条件的故障诊断。6. 根据前述权利要求中任一项所述的系统,其中为当前模型数据集(101)诊断工艺运 行条件包括确定表示当前模型数据集(101)中的变化量的残差。7. 根据权利要求6所述的系统,进一步包括: 根据观察一预设时间量的超过预设阈值的残差,检测不再由当前多变量数据分析捕捉 的工艺特性永久变化的装置。8. 根据前述权利要求中任一项所述的系统,其中所述工艺为化学工艺,特别是烯烃的 部分氧化。9. 根据权利要求8所述的系统,其中所述化学工艺包括在反应器系统(1)中的乙烯氧化 以产生环氧乙烷。10. 根据权利要求9所述的系统,其中由所述工艺数据域代表的工艺输入-输出数据选 自在用于环氧乙烷生产的反应器系统处测得的下列参数群: 输入参数:反应器〇2入口浓度、C2H4入口浓度、C02入口浓度、气体每小时空间速度、遍及 反应器的EO差量、工作率、累积的EO产量、总氯化物浓度、洗涤器顶部温度以及清洗塔顶部 温度; 输出参数:氧气转换、馈送选择性以及反应器冷却液温度。11. 根据权利要求5至10中任一项所述的系统,其中故障诊断包括将催化剂的过度氯化 或氯化不足诊断为异常运行条件。12. 根据权利要求1至11中任一项所述的系统,其中实时获取当前工艺数据和/或实时 诊断运行条件。13. 用于监控工艺的方法,所述工艺由代表工艺输入-输出数据的多维工艺数据域中的 工艺数据集所确定,所述方法包括: 获取多个历史工艺数据集; 通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域的转 换;以及 使用获取的转换将当前工艺数据集转换至模型数据集以监控所述工艺。14. 根据权利要求13所述的方法,其中执行多变量数据分析包括主成分分析。15. 根据权利要求13所述的方法,其中执行多变量数据分析包括建立人工神经网络。16. 根据权利要求13至15中任一项所述的方法,进一步包括: 指定模型数据域中的一个或多个部分,每一部分容纳根据可从历史工艺数据集获取的 模型数据集中的一个或多个簇而代表工艺正常运行条件或具体异常运行条件的模型数据 集,所述历史工艺数据集可在正常事件期间收集以及在异常事件期间分别收集;以及 通过识别容纳当前模型数据集的模型域的一个或多个指定部分中的一个,为当前模型 数据集(101)诊断工艺运行条件。17. 根据权利要求13至16中任一项所述的方法,其中为当前模型数据集(101)诊断工艺 运行条件包括表示一个或多个异常运行条件的故障诊断。18. 根据权利要求13至16中任一项所述的方法,其中为当前模型数据集(101)诊断工艺 运行条件包括确定表示当前模型数据集(101)中的变化量的残差。19. 根据权利要求18所述的方法,进一步包括: 根据观察一预设时间量的超过预设阈值的残差,检测不再由当前多变量数据分析捕捉 的工艺特性的永久变化。20. 根据权利要求13至19中任一项所述的方法,其中所述工艺为化学工艺,特别是烯烃 的部分氧化。21. 根据权利要求20所述的方法,其中所述石化工艺包括在反应器系统(1)中的乙烯氧 化以产生环氧乙烷。22. 根据权利要求21所述的方法,其中由所述工艺数据域代表的工艺输入-输出数据选 自在用于环氧乙烷生产的反应器系统处测得的下列参数群: 输入参数:反应器〇2入口浓度、C2H2入口浓度、C02入口浓度、气体每小时空间速度、遍及 反应器的EO差量、工作率、累积的EO产量、总氯化物浓度、洗涤器顶部温度以及清洗塔顶部 温度; 输出参数:氧气转换、馈送选择性以及反应器冷却液温度。23. 根据权利要求17至22中任一项所述的方法,其中故障诊断包括将催化剂的过度氯 化或氯化不足诊断为异常运行条件。24. 根据权利要求13至23中任一项所述的方法,其中实时获取当前工艺数据和/或实时 诊断运行条件。25. 计算机程序产品,包括非暂时性的计算机可读介质,具体实施为程序指令,用于使 系统执行步骤: 获取多个历史工艺数据集; 通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域的转 换;以及 使用获取的转换将当前工艺数据集转换至模型数据集以监控所述工艺。
【专利摘要】本发明涉及用于监控工艺的系统,所述工艺由与工艺输入-输出数据有关的多维工艺数据域中的工艺数据集所确定,所述系统包括:用于获取多个历史工艺数据集的装置;用于通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域转换的装置;以及用于将当前工艺数据集转换至模型数据集以监控所述工艺的装置。进一步涉及用于监控工艺的方法,所述工艺由代表工艺输入-输出数据的多维工艺数据域中的工艺数据集所确定,所述方法包括:获取多个历史工艺数据集;通过执行多变量数据分析获取从所述多维工艺数据域至较低维度的模型数据域的转换;以及将当前工艺数据集转换至模型数据集以监控所述工艺。
【IPC分类】G05B17/02, G05B23/02
【公开号】CN105492982
【申请号】CN201480043259
【发明人】S·K·拉希里, M·侯赛因
【申请人】科学设计公司
【公开日】2016年4月13日
【申请日】2014年6月6日
【公告号】EP3005004A1, US20140365195, WO2014195915A1