故障特征提取的方法研究
摘要:针对常规特征提取方法存在着问题不足,提出了基于BP神经网络和基于互信息熵的特征提取方法,并通过特征提取实例加以说明。结果表明这两种方法是可行和有效的。
关键词:特征提取 故障诊断 神经网络 互信息熵
随着科学技术的发展,现代设备的结构日趋复杂,其故障类型越来越多,反映故障的状态、特征也相应增加。在实际故障诊断过程中,为了使诊断准确可靠,总要采集尽可能多的样本,以获得足够的故障信息。但样本太多,会占用大量的存储空间和计算时间,太多的特征输入也会引起训练过程耗时费工,甚至妨碍训练网络的收敛,最终影响分类精度。因此要从样本中提取对诊断故障贡献大的有用信息。这一工作就是特征提取。
特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干信息。从数学意义上讲,就是对一个n维向量X=[x1,x2,…,xn]T进行降维,变换为低维向量Y=[y1,y2,…,ym]T,m<n。其中Y确实含有向量X的主要特性。
特征提取的方法有很多,常用的方法主要有欧式距离法、概率距离法、统计直方图法、散度准则法等。本文针对现有方法的局限性,研究基于BP神经网络的特征提取方法和基于互信息熵的特征提取方法。
1 基于BP神经网络的特征提取方法
要从N个特征中挑选出对诊断贡献较大的n个特征参数(n<N),通常以特征参数X对状态Y变化的灵敏度ε作为评价特征参数的度量:
εij=(аYi)/(аXj)
采用三层BP网络,输入层n个单元对应n个特征参数,输出层m个单元对应m种模式分类,取中间隐层单元数为q,用W B iq表示输入层单元i与隐层单元q之间的连接权;用w O qj表示隐层单元q与输出层单元j之间的连接权,则隐层第q单元的输出Oq,为:
javascript:window.open(this.src);" style="cursor:pointer;"/>
输出层第j个单元输出yj为:
javascript:window.open(this.src);" style="cursor:pointer;"/>
式中j=1,2,…,m;εj为阈值。
则特征参数xi对模式类别yj的灵敏度为:
javascript:window.open(this.src);" style="cursor:pointer;"/>
代入(1)式,则特征参数Xi的灵敏度εij和特征参数Xk的灵敏度εkj之差可整理为:
javascript:window.open(this.src);" style="cursor:pointer;"/>
大量的试验和研究表明,当网络收敛后有:a1≈a2≈…≈aq。
从上式可以看出,如果:
javascript:window.open(this.src);" style="cursor:pointer;"/>
则必有:εij>εki
即特征参数Xi对第j类故障的分类能力比特征参数Xk强。
将特征参数X和分类模式分类结果y组成的样本集作为BP网络的学习样本,对网络进行训练。设Wiq和Wkq分别为与特征参数Xi和Xk对应输入单元与隐层单元q之间的连接权系数,记:
│Wεi│=│Wi1│+Wi2+…+Wiq
│Wεk│=│Wk1│+Wk2+…+Wkq
如果│Wεi│>│Wεk│,则可以认为Xi的特征灵敏度εi比特征参数Xk的灵敏度εk大。这样可知特征参数Xi的分类能力比特征参数Xk的分类能力强。
2 基于互信息熵的特征提取方法
由信息特征可知,当某特征获得最大互信息熵,该特征就可获得最大识别熵增量和最小误识别概率,因而具有最优特性。特征提取过程就是在由给定的n个特征集X二{XI~X2,…,zn)所构成的初始特征集合情况下,寻找一个具有最大互信息熵的集合:X={X1,X2,…,Xk},k<n。由于最大互信息熵由系统熵和后验熵决定,而系统熵是一定的,后验熵越小,则互信息熵越大,分类效果越好。因此有效的特征提取就是在X给定后,寻找一个具有最大互信息熵或后验熵的集合Y。即已知该域R上的初始特征集合X=[x1,x2,…,xn]T,寻找一个新的集合Y=[y1,y2,…,yk]T,k<n,使互信息熵最大,i=1,2,…,k。
在一定的初始特征集合下,识别样本的后验熵是一定的。在实现特征优化过程中,随着特征的删除,会有信息的损失,使得后验熵趋于增加。因此后验熵增值大小反应了删除特征向量引起的信息损失的情况。当删除不同特征及删除特征数逐步递增时,会对应有不同的后验熵。按后验熵由小到大排列,可获得对应的特征删除序列。其过程可描述为:
(1)初始化:设原始特征集合F={N个特征},令初始优化特征集合S=[K个特征,K=N];
(2)计算后验熵;
(3)实现递减:S=[K-1个特征],并计算相应的后验熵;
(4)选择优化特征集合:以多个递减特征集合所对应的后验熵为依据,选择具有最小后验熵增的特征向量集合为优化特征集合S[N-1个优化特征];
(5)返回(3),重新计算,直到满足分类要求,选择具有最小后验熵的优化特征集合;
(6)输出优化特征集合。
3 特征提取实例
在热电厂的发电机组工作中,发电机组主轴经常遇到如喘振、流体激励等故障。这些故障不仅会引起生产效率下降,而且会对机器造成严重危害,影响机组的安全运行。传统的诊断方法是在主轴轴承处加传感器进行振动测试,得到其频谱图;然后在频域内分析,根据基于能量分布的故障诊断理论将振动信号功率谱密度按一定的规则进行量化,利用神经网络等工具进行故障诊断。但是喘振、流体激励等故障在频域内通常表现为连续分布的有色噪声带,在频域内分析难以区分,难以进行频谱特征提取,全息谱分析方法也不甚有效。传统方法增加了系统的开销,诊断效果不理想。如果在时域内采用信息优化方法做预处理,再用传统的诊断方法进行诊断,可以收到很好的效果。
本文采用时域内故障振动信号的方差、峭度、偏斜度等参数,分别利用BP神经网络和后验熵分析对其进行特征提取