一种“分解-生成-重构”生成策略的柴油机故障诊断数据增强方法

xiaoxiao9月前  139


本发明涉及一种数据增强方法,尤其涉及一种“分解-生成-重构”生成策略的柴油机故障诊断数据增强方法,适用于机械设备的故障领域。


背景技术:

1、柴油机作为国防和工业领域的核心动力装置,在核电、船舶等重要领域扮演着至关重要的角色。由于其结构的复杂性和恶劣的工作环境,柴油机极易发生故障,若未能及时发现和处理,可能导致严重的经济损失甚至安全事故。因此,开发高效的柴油机故障诊断技术具有重要意义。

2、近年来,在机械故障诊断领域,非嵌入式振动监测技术因其安装的便捷性和所获得信息的丰富性而广泛应用。尤其是随着深度学习技术的引入,即使在故障认知受限的情况下,也能实现复杂振动信号的有效特征提取和端到端的故障诊断,大大增强了故障检测的准确性和效率,为机械设备的故障诊断提供了强有力的工具。然而,深度学习诊断模型的性能在很大程度上依赖于足量且平衡的训练数据。在实际工程应用中,机组大多数时间处于正常运行状态,导致采集的数据中正常数据远多于故障数据,这种故障样本极少且不平衡问题严重限制了深度智能模型的应用潜力。为解决故障数据稀缺问题,数据生成技术成为了有效的解决方案。

3、柴油机作为典型往复机械在机构和工作原理上与旋转机械存在显著差异,其振动信号主要受缸内燃烧过程和气门机构间隙导致的冲击力影响,呈现为复杂多源冲击耦合的准周期信号,具有强烈的非线性和非平稳特性。此外,为了有效捕捉高频冲击成分,柴油机振动监测通常采用高采样频率,导致单个四冲程完整周期的信号长度很长。这些特点使得柴油机复杂振动信号样本的生成给深度网络模型带来了极大困难。为了追求高质量生成效果,通常需要显著增加网络规模和复杂度。然而,复杂的网络结构又需要大量高质量数据进行训练,这在实际工业应用中往往难以实现。因此,尚缺乏一种可行、高效、高质量的数据增强方法用于柴油机多源冲击复杂信号的生成任务。


技术实现思路

1、本发明提出了一种创新的“分解-生成-重构”的生成策略,以简化复杂的多源冲击信号的生成任务,目的在于从更细节和局部层面上提高生成信号的质量和多样性,进而通过数据增强技术解决柴油机故障诊断领域的样本稀缺问题,从数据层面提高故障诊断模型的准确性。

2、本发明的目的通过以下技术方案实现:

3、首先,通过共享窗口变分时域分解方法,从多源冲击信号中有效地提取不同故障类型的规范化单冲击子信号,并且确保子信号间的可对比性。然后,构建一种多条件变分对抗自编码器网络,利用故障类型和窗口标签作为条件信息,精确构建潜在空间向量的中心,从而生成多标签类型的高质量单冲击子信号。最后,将生成的子信号重构为完整的多源冲击信号,完成故障数据集的扩充,以此改善数据集样本比例失衡问题,从数据层面解决实际工程中存在的小样本问题。

4、一种“分解-生成-重构”生成策略的柴油机故障诊断数据增强方法,其特征在于,包括以下步骤:

5、第一步:构建共享窗口变分时域分解模型swvtdd(shared window variationaltime domain decomposition)

6、swvtdd的核心思想是求解一组信号提取窗口w={w1(t),w2(t),...,wk(t)},使得其能够共享使用于多组信号s={s1(t),s2(t),...,sm(t)}的冲击提取,其中{}表示集合,k为窗口数量,m为信号组数也为故障类型的数量,wk(t)为第k个提取窗口,sm(t)表示第m组信号,构建m组信号的p阶幅值中心距的变分模型,如下:

7、

8、

9、式中m为信号的序号,k为窗口的序号,sm,k(t)∈{sm,1(t),…,sm,k(t)}表示第m种信号的k个冲击子信号,tk∈{t1,…,tk}表示第k个提取窗口的时间中心,该组时间中心对m组信号共享适配,|| ||2表示l2范数,p为指数系数,p只能取正整数,其控制着提取窗口的形态,在本发明中取值为p=1。

10、然后引入拉格朗日乘子和二次惩罚项,构建多组信号的子信号求解方程如下:

11、

12、式中,为迭代损失,为第m组信号的迭代损失,λm(t)为第m组信号的拉格朗日乘子,α为二次惩罚因子,<·>为矩阵的内积,tm,k为第m个信号的第k个时间中心,为求解可共享的tk做准备。

13、利用交替乘子方向法(admm)将变分求解问题转化为乘子间的交替求解问题,求解冲击子信号sm,k和时间中心tm,k,迭代计算过程如下:

14、

15、

16、式中n为迭代次数,为第n+1次迭代后第m个信号的第k个子冲击信号,为第n次迭代后第m个信号的第i个子冲击信号,为第n次迭代后第m个信号的拉格朗日乘子,为第n次迭代后的第k个窗口的时间中心,为第n+1次迭代后的第m个信号的第k个时间中心,表示以为形心的信号提取窗口,二次惩罚因子α和指数系数p控制信号提取窗口的形状,的迭代求解属于凸优化求极值问题,可利用牛顿法迭代求解。

17、值得注意的是,利用共享的时间中心构建提取窗口,其通过m组信号的k个冲击成分时间中心取平均得到,计算如下:

18、

19、此外,参数α和p控制着冲击提取窗口wk=1/(1+αk(t-tk)2p)的形状和尺寸,为了使提取窗口更加贴合冲击信号,将二次惩罚因子αk∈{α1,…,αk}加入迭代过程,同时以拉普拉斯小波模拟单自由度结构系统的自由衰减响应函数,计算其上包络线与冲击提取窗口的距离,设置冲击提取窗口的长度阈值h1,得到对应的半窗口长度δlnk∈{δln1,…,δlnk}如下:

20、

21、式中n为原始振动信号的数据采样点数,αk表示第k个提取窗口的二次惩罚因子,h1∈[0,1]为可调节的超参数,其控制着半窗口长度δlnk,在本发明中取值为h1=0.8。

22、设置拉普拉斯小波上包络线的阈值h2,计算得到衰减长度δlmm,k∈{δlmm,1,…,δlmm,k}:

23、

24、

25、式中,为子信号的归一化峰值,f为采样频率,f为振动频率,ξ∈[0,1)为粘滞阻尼比,它们为柴油机缸体的参数,h2∈[0,1]为可调节的超参数,其控制着衰减长度δlmm,k,为了使提取窗口能够覆盖住冲击信号,必须满足h2<h1,在本发明中取值为h2=0.2。|sm(t)|表示对振动信号sm(t)求取绝对值后的信号,{|sm(t)|}表示集合{s1(t),s2(t),...,sm(t)}中所有信号取绝对值后信号的集合,max{|sm(t)|}表示该集合中所有信号的最大值,min{|sm(t)|}为其最小值,为子信号的最大值。

26、为了让m个冲击子信号均适配于冲击提取窗口,在第n+1次迭代中,使其衰减长度中的最大值等于半窗口长度计算得到第n+1次迭代后的第k个窗口的二次惩罚因子与其峰值的关系式如下:

27、

28、式中,为第k个窗口下的m个子信号峰值的最大值,其计算如下:

29、

30、更新拉格朗日运算符λ,如下:

31、

32、式中γ为更新因子,为可调节的超参数,同理于神经网络的学习率,在本发明中取值为γ=0.1。

33、设定迭代停止条件如下:

34、

35、式中ε为收敛误差条件,为迭代过程的超参数,在本发明中取值为ε=10-7。

36、通过上述计算完成swvtdd的迭代过程,最终得到适用于数据集的k个冲击提取窗口。

37、第二步:构建多条件变分对抗自编码器mcvaae(multi-conditional variationaladversarial autoencoder)

38、2.1网络结构

39、所提出的mcvaae网络的结构主要由4部分组成:1)编码器e(),2)多条件网络m(),3)生成器g(),4)判别器d(),该4部分网络的结构均可以使用全连接层构建。。

40、编码器由1层输入层、3层全连接层和2个输出层组成,它们的维度分别为batch_num×6400、6400×3200、3200×1600、1600×800、800×50和800×50,其中batch_num为训练批次的样本数量,编码器通过学习实际信号的分布pr(y,k|x),将数据样本xr映射到潜在空间变量z,其中y,k是信号的条件信息,它的运算过程下:

41、[μ,σ]=e(xr)

42、z=μ+σ⊙ε

43、式中,[]表示输出为一个包含多个变量的列表,μ和σ分别为编码器e()的输出:均值和方差变量,⊙代表逐元素相乘。

44、多条件网络m()由2层输入层、2层全连接层和1个层相加组成,它们的维度分别为batch_num×num_y、batch_num×num_k、num_y×50、num_k×50,其中num_y为故障类别数量,num_k为窗口类别数量。多条件网络引入了多个条件信息中心,通过输入标签y和k将条件信息嵌入高维空间,并通过网络层的相加将条件信息融合在一起,为不同故障类型不同窗口标签的信号在潜在空间构建了不同的分布中心c,运算过程如下:

45、[cy,ck]=m(y,k)

46、c=cy+ck

47、式中,y为故障类型标签,k为窗口类型标签,它们根据类别数量使用独热码编码获得,cy和ck分别表示不同故障类型和窗口类型的隐藏层条件中心,它们通过lkl函数与编码器网络的输出μ和c映射到一起。

48、生成器网络由1个输入层、3个全连接层和1个输出层组成,它们的维度分别为batch_num×50、50×800、800×1600、1600×3200和3200×6400。判别器网络由1个输入层、2个全连接层和1个输出层组成,它们的维度分别为batch_num×6400、6400×1600、1600×400和400×1。在生成对抗网络中,生成器试图通过判别器给出的梯度来学习真实的数据分布,判别器学习区分“真实”和“虚假”样本。它们的运算过程如下:

49、xg=g(z,c)

50、[real or fake]=d({xr,xg})

51、式中,g()是生成器网络,d()是鉴别器网络,{xr,xg}表示真实信号和生成信号的集合。

52、2.2损失函数

53、所提出的mcvaae网络的损失函数主要由四部分构成:重构损失lr,散度损失lkl,鉴别器损失ld和生成器损失lg,它们的计算如下:

54、lr=∑|xr-xg|2

55、lkl=kl(qφ(z|x,(y,k))||p(z))=∑-logσ+0.5((σ)2+(μ-c)2-1)

56、

57、

58、式中,kl(qφ(z|x,(y,k))||p(z))是kl散度损失,它衡量的是多条件信息下的z分布qφ(z|x,(y,k))与先验概率分布p(z)之间的差异,表示对所有真实数据样本求期望,表示对所有可能的z求期望。基于对抗的思想,判别器通过最小化ld优化它的参数,生成器通过最小化lg优化它的参数。

59、所提的mcvaae中4部分子网络分别由对应的损失函数优化。

60、第三步:重构多源冲击完整信号

61、本发明将各单冲击子信号对应元素相加,即可得到完整的重构信号,其计算过程如下:

62、

63、其中,为生成信号中第m种故障类型的第k个单冲击子信号,{xg}为生成信号集合,为第m种故障类型的最终重构信号。需要值得注意的是,只有故障类型相同且窗口标签不同的单冲击子信号可以一起用于重构完整信号。

64、针对实际工程现场正常数据远多于故障数据,导致样本比例失衡,同时柴油机振动信号具有多源冲击耦合的复杂特点,生成网络生成高质量故障样本非常困难的问题。本发明提出了一种基于“分解-生成-重构”策略的高质量多样化信号生成方法,将复杂的多源冲击信号生成任务分解为多个局部单冲击子信号的生成任务。通过这种化繁为简的方法,在保持网络规模和数据样本不变的条件下,能够在更细致和局部的层面上完成复杂振动数据样本的高质量生成。


技术特征:

1.一种“分解-生成-重构”生成策略的柴油机故障诊断数据增强方法,其特征在于,包括以下步骤:


技术总结
一种“分解‑生成‑重构”生成策略的柴油机故障诊断数据增强方法适用于柴油机设备的故障诊断领域。本发明简化复杂的多源冲击信号的生成任务,目的在于从更细节和局部层面上提高生成信号的质量和多样性。首先,通过共享窗口变分时域分解方法,从多源冲击信号中有效地提取不同故障类型的规范化单冲击子信号,并且确保子信号间的可对比性。然后,构建一种多条件变分对抗自编码器网络,利用故障类型和窗口标签作为条件信息,精确构建潜在空间向量的中心,从而生成多标签类型的高质量单冲击子信号。最后,将生成的子信号重构为完整的多源冲击信号,完成故障数据集的扩充,以此改善数据集样本比例失衡问题,从数据层面解决实际工程中存在的小样本问题。

技术研发人员:茆志伟,黄安征,叶立锴,张进杰,江志农
受保护的技术使用者:北京化工大学
技术研发日:
技术公布日:2024/9/23

最新回复(0)