何明格1,殷国富1,林丽君2,赵秀粉1
(1.四川大学制造科学与工程学院,四川 成都,610065;2.西南石油大学电信学院,四川,成都,610500)
摘 要:为了提高大型零件超声波探伤过程中的缺陷辨识能力,提出一种基于概率支持向量机原理,结合经验模式分解和DS证据理论,采用多探头检测的一种超声缺陷识别模型。首先,对每个探头检测的含有缺陷的信号运用经验模式分解法提取信号特征;其次,利用支持向量机来进行缺陷识别,并采用最大后验概率策略来处理传统支持向量机的输出,得到每个探头检测到的缺陷的概率支持度;最后,采用 DS证据理论得出最终的缺陷类型。结果表明,该模型克服了传统的支持向量机在处理多类问题时其硬判决输出后续数据处理的缺陷,同时避免了主观判断,提高了识别精度和准确率。与神经网络结合DS证据理论模型和单探头多级二类支持向量机模型进行了对比分析,论证了本模型的优越性。
关键词:概率支持向量机;缺陷辨识;DS证据理论;经验模式分解 中图分类号:TP235;TP301.6 文献标识码:A
Recognition Model of Ultrasonic Flaws Based on PSVM
He Ming-ge1,Yin Guo-fu1,Lin Li-jun2,Zhao Xiu-fen1
(1. School of Manufacturing Science and Engineering, Sichuan University, Chengdu 610065, China; 2. School of Electronic Information Engineering, Southwest Petroleum University, Chengdu 610500, China)
Abstract: In order to improve the ability of flaws identification in ultrasonic testing, a flaw-recognition model based on Probabilistic Support Vector Machine, combined with Empirical Mode Decomposition and Dempster-Shafer Evidence Theory, was proposed to test on a large rotor with multi-ultrasonic sensors. Firstly, the characters of test signal were extracted with theory of Empirical Mode Decomposition. Secondly, a step forward was added to the output of the SVM classifiers to choose the category with a maximal posteriori probability, thus, an algorithm model of Probabilistic Support Vector Machine was presented. The outputs of Probabilistic Support Vector Machine were just the support degree of ultrasonic flaws. Lastly, the results of ultrasonic defects recognition were obtained with Dempster-Shafer evidence theory. Results showed that the proposed model in this paper overcame the limitation that the outputs of the traditional support vector machines were un-calibrated and should not be used to determine the category when a multi-class problem was presented. Comparison demonstrated that this model had a better performance in improving the recognition accuracy and nicety ratio of defects identification than the model of NN combined with DS and the model of SVM with odd sensor. Keywords: PSVM; flaws recognition; DS evidence theory; EMD
当前,随着各种工程的智能化和自动化要求,智能算法受到广大工程设计者以及科研人员的青睐。在无损检测这一蓬勃发展的技术行业中,对于缺陷的检测和自动识别提出了更高的要求, Cacciola M将计算机智能算法用在超声波检测航空材料的缺陷分类中[1];Acciani G将神经网络用于超声波检测管道的缺陷分类中从而来评价管道的受腐蚀程度[2];C Fei将支持向量机和混沌遗传算法用于石油输送管道的超声检测缺陷的分类中[3];这些学者们都采用了智能优化算法来完成相应缺陷的诊断和自动识别功能,取得了良好的效果。
在众多的缺陷分类识别的智能算法中,支持向
量机(Support Vector Machine,SVM)无疑是当前最为优秀的一种技术。传统的支持向量机是作为二类分类器而提出来的,遇到多类问题时,普遍采用的方式就是利用多个二类SVM逐级识别来构建多级SVM。但SVM的硬判决输出,了后续的数据处理,使其不尽完美,在进行多传感器信息融合时,更显出不足。
在本文中,作者针对某国有大型企业的超大型转子在线实时检测的需要,采用多探头融合技术来检测该大型转子的制造生产缺陷,并实时地给出转子的缺陷类别。为了实现在线实时的缺陷智能识别,作者引入Platt提出的支持向量机概率输出方法[4]、
经验模式分解(Empirical Mode Decomposition,EMD)法以及数据融合理论,提出了一种基于概率支持向量机(Probabilistic Support Vector Machine,PSVM)原理的超声缺陷识别模型,克服了传统SVM的后续数据处理能力不足的缺点。经验模式分解可以根据信号自身的内在特性,将信息自适应地分解到不同的基本模式分量中,在特征提取时可减少冗余特征和不相关特征;概率支持向量机用来完成缺陷特征的支持度计算;采用数据融合理论中的DS证据理论(Dempster Shafer,DS)实现缺陷的融合定类,可减少诊断的不确定性。现场应用表明,本文所建立的模型从整体上显著地提高了缺陷识别的可信度、准确度以及系统的鲁棒性。
1 基本理论原理
1.1 经验模式分解法
经验模式分解法(EMD)是1998年由Huang提出的,它通过对信号的“筛选”将信号分解成不同频率的内模函数IMF(Intrinsic Mode Functions),从而赋予了瞬时频率合理的定义及物理意义,是一种很好的非线性、非平稳信号的分析方法。每个IMF都必须满足以下两个条件:一是极值(极大值和极小值)数与过零点的数目相等或最多相差一个;二是在任意时刻,其局部极大值和极小值确定的上下包络线的均值必须是零。具体的分解步骤如下[5]: (1)根据信号X(t)(t为采样时间)的局部极值求出其上、下包络线的平均值组成的序列m1(t); (2)将原始数据序列减去平均包络值序列后即可得到一个去掉低频的新数据序列:
h1(t)X(t)m1(t) (1) 判断h1(t)是否为IMF(对于非线性、非平稳信号而
言,一般一次处理后一些非对称波依然存在),若不满足IMF条件,将h1(t)看作新的待处理数据重复上述处理过程k次,得到:
h1k(t)h1(k1)(t)m1k(t) (2)
当h1k(t)满足IMF条件时,就从信号X(t)中获得了
第一个IMF,记作:
c1(t)h1k(t) (3)
(3)第一个IMF分量包含信号的最高频率成
份,将第一个IMF从原始信号中分离出来可以得到一个相对频率较低的数据序列:
r1(t)X(t)c1(t) (4) (4)将r1(t)看作是新的待分解信号,重复上述
步骤(1)和步骤(2),即可依次得到r2(t)、 r3(t)、„,直到剩余信号rn(t)满足给定终止条件或者变成一
个单调函数不能再筛选出IMF为止。最后,原始数据序列X(t)可表示为:
nX(t)ci(t)rn(t) (5)
i1式中,rn(t)为残余函数,代表信号的平均趋势。
公式(5)表明,可以将信号X(t)分解成频率从大到小排列的n个IMF分量ci(t)和一个趋势项rn(t)之和。将得到的IMF分量构成特征向量矩阵,由于矩阵的奇异值是矩阵的固有特征,它具有较好的稳定性,所以提取初始特征向量矩阵的奇异值作为缺陷特征向量。 1.2 支持向量机
Vapnik等提出的支持向量机是基于统计学习理论的一种新的通用机器学习方法[6],建立在一套较好的有限样本机器学习的理论框架和通用方法之下,其基本思想是:定义最优线性超平面,并把寻找最优线性超平面的算法归结为求解一个凸规划问题;进而基于Mercer核展开定理,通过非线性映射把样本空间映射到一个高维乃至无穷维的特征空间(Hilbert空间),使其在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。支持向量机采用结构风险最小化原则,比采用经验风险最小化原则的神经网络具有更好的泛化能力[7];与传统的统计学相比,统计学习理论是一种专门研究小样本(有限样本)情况下的机器学习规律的理论,而支持向量机的理论基础就是统计学习理论。因此,支持向量机方法既有严格的理论基础,又能较好地解决小样本、高维数、非线性和局部极小点等实际问题。
SVM通过寻找最优超平面来解决二类优化问题,两类问题就是找到一个最优超平面将样本划分为贴有标签+1和贴有标签-1的两部分。SVM的训练过程就是通过求解如下优化问题来实现的:
l11llmaxiijyiyjK(Xi,Xj) i2i1j1(6)
要求满足约束条件
liyi00iC (7)
i1其中,C为错误惩罚因子,用于控制对错分样本的惩罚程度;α为样本相对应的Lagrange乘子,
K(x,y)是在高维空间计算内积的核函数,该核函数必须满足Mercer条件才能保证该优化问题本质上是一个凸二次规划问题[8]。得到的最优解中只有一小
部分不为零,这些不为零的解所对应的样本就叫支持向量。分类器的计算输出为:
nf(x)iyiK(xi,x) (8)
i1式(8)中n表示支持向量的数目,xi为某一支
持向量,β是一个初始量,它在训练阶段不断的更新。分类规则决定于f的sign函数值,值得注意的是f值是一个非标准化的值,不能够用作两个不同分类器之间的比较。 1.3 DS数据融合理论
DS ( Dempster Shafer)数据融合理论的实质是在同一识别框架下将不同的证据体通过其证据组合规则合成一个新证据体的过程。它能捕捉、融合来自多传感器的信息,这些信息在模式分类中具有能确定某些因素的能力,DS论据理论的3个要素为:支持度m(A)、信任度Bel(A)及似然度Pls (A )。在获某一个辨识框架下的基本概率指派函数(Basic Pro- bability Assignment, BPA)后,证据的信任度、似然度和支持度分别定义为[9]:
Bel(A)m(B) (9)
BApls(A)m(B) (10)
BAm()0[mi(Ai)]m(A)A1A2AnA 1in1[mAi(Ai)1A2]An1in(11)
2 基于概率支持向量机原理的算法模型
2.1 SVM参数和核函数选择 目前,广泛应用的核函数主要有四种: 线性核函数:k(x,xi)=x·xi; 多项式核函数:k(x,xi)=( x·xi+1)d;
径向基(RBF)核函数:k(x,xi)=exp[-‖x-xi‖
2
/(2*σ2)];
Sigmoid核函数:k(x,xi)=tanh[v(x·xi)+c];
线性核函数只是RBF核函数的一种特殊情形[10]
。Sigmoid核函数的参数选择非常困难;而且,Sigmoid核函数在一些参数条件下的表现效果与
RBF一样,在一些参数下还不满足Mercer条件。
多项式核函数比RBF核函数拥有更多的超参数,超
参数的数量会影响模型选择的复杂程度;另外,在
多项式核函数中,其核值极可能会在无穷大和零这样一个大的范围内变化[6]
。因此,本文中我们选择RBF核函数作为支持向量机的核函数。
核函数的参数选择至关重要,它关系到映射后的样本像之间具有的差异效果,主要是通过考察SVM的泛化能力来指导参数的选择。主要有两种方法:第一种是使用测试误差来指导参数的选择,代表是交叉验证法;第二种是使用理论边界,这些理论边界大多基于留一法误差进行估计。本文将上面两种方法综合起来形成支持向量机的两个参数(惩罚因子C和核参数σ)的选择方法——留一交叉验证法。主要步骤如下:
(1) 对(C,σ)进行指数函数增长的参数网格搜索。
(2) 对选定参数使用留一交叉验证法计算均方差(MSE),以评价该参数对SVM的泛化能力的影响。MSE计算公式定义为:
MMSEM1(y*2iyi) (12)
i1vGi式中:M为样本总数;Gi表示以第i个样本为验证
样本的测试集;yi*为第i个样本的SVM输出值。
(3) 以MSE全局最小值为准则,确定最优参数对。
2.2 多类SVM策略
支持向量机最初是作为二类问题提出来的,然而,超声检测所呈现的缺陷类别都是多类的,因此,我们必须将二类SVM的优异表现扩展到多类SVM
上来。 一种比较普遍方式就是构造多级二类问题。在one-against-all模式中,构造k个分类器,第k个分
类器在第k类和其余的类之间建立一个超平面。在one-against-one模式中,就需要定义(k(k-1)/2)个 超平面,每个超平面都能将每一类与别的类区分开
来。尽管第二种模式有时能改进前一种模式的结果,但却是以增加分类器的数目为代价的。
在本文中,我们要求能够实时地在线识别超声检测缺陷,总共需要对4个不同的缺陷类进行辨识。
由于每个SVM都需要一定的计算机内存量(支持
向量的数目乘以分类问题的维数),由于
one-against-one模式对计算机的内存要求很高,会对系统要求的实时性有一定的影响,因此,
one-against-all方式更适合本文的情况。 2.3概率支持向量机算法模型 在选定one-against-all模式作为我们基于二类SVM来构造多类SVM后,每一个分类器都能从余
下的超声检测缺陷中区分出一类超声检测缺陷。在
已经训练好了4个分类器后,当输入我们需要分类的样本时,任何两个分类器都能给出一个确定的结
果,此时,我们应该采用哪个分类器的结果呢?从统计学的观点来看,最优的选择就是选择拥有最大的后验概率输出的分类器。然而,正如前面所提到的,对于基于二类SVM的多个分类器来说,一个
给定的输入X,它的硬判决前的输出值f是一个非
标准的值。因此,就不可能去比较二类SVM分类
器的输出。所以,在一个基于二类SVM的多类分
类问题中,我们有必要将输出值f转化为一个后验 概率P(y=1|f)。
后验概率可以通过在训练集中估算概率密度函数P(f|y=1)和P(f|y=-1)的值来得到。Platt提出使用sigmoid函数来计算后验概率,取得很好的效果[4]:
1 (13) P(y1f)通过PSVM的概率输出算法,我们就可以计算出每
个探头检测到的各类超声缺陷的支持度值,将该支持度值作为DS证据理论的概率分配BPA,再按照公式(11)进行数据的融合,就建立起了基于PSVM的超声缺陷识别模型,如图1所示:
1exp(afb)通过计算sigmoid函数中的参数a和b来取代直接对后验概率的估算,参数a和b可以通过下面的函数得到:
minF(a,b)tilog(pi)(1ti)log(1pi)i (14)
其中:
p1i1exp(afib)N1y
tN2i1i1yi1N2式中N+表示训练结果为正类的样本的数,N-代表训练结果为负类的样本数。采用式(11)进行sigmoid函数的参数计算的一个优点就是可以利用
Hessian矩阵 H(a,b)=▽2
F(a,b),采用牛顿法快速地求得a和b。
通过采用sigmoid函数来实现支持向量机的概率值输出,我们就能将SVM硬判决前的输出f(x)映射到[0,1]区间,也即得到支持向量机的概率输出。然后我们将支持向量机的概率输出值作为DS证据理论的BPA,为了满足DS证据理论的BPA条件,我们必须对SVM的概率输出值做一个归一化的处理,计算公式为:
m(AAi)i)p( (15)
n p(Ai)i1式中,Ai(i=1,2,„,n)为超声波检测信号所属的缺陷
类别;p(Ai)为PSVM的识别输出结果,m(Ai)表示检测缺陷的支持度值。
至此,概率支持向量机的算法模型已经建立好了,有了该模型,通过比较每个PSVM对缺陷类别计算的支持度大小,就可以实现超声缺陷的辨识,概率越接近1表明属于该类的可能性越大,反之越小。
2.4 基于概率支持向量机的超声缺陷识别模型
由于本文涉及的探伤对象为超大型的转子,受其现场工作环境的干扰的影响,超声波探伤系统的工作效率会受到很大的影响。因此,为了保证缺陷识别的高准确率和可靠性,我们采用多探头对转子进行融合缺陷识别,每个探头都与一个PSVM相连。
图1 基于PSVM的超声缺陷识别模型
Fig.1 Recognition model of ultrasonic flow based on PSVM
大型回转件的主要缺陷包括裂纹(F1)、气孔(F2)、夹渣(F3)和缩松(F4),在每个超声波探头Ti(i为探头编号)检测到缺陷信号后,相应的PSVM识别器输出对四类缺陷的支持度概率值,再通过数据融合得到最终的缺陷类别。
3 实例分析
3.1 基于PSVM的大型回转件的缺陷识别过程
这个过程主要包括训练数据的准备、PSVM的构建、以及缺陷类别决策融合,其工作流程如图2所示。
(1)数据准备。通过超声波检测系统我们提取4类缺陷的典型波形数据,每类100个总共400个波形。进行前期处理(消噪和压缩处理)后,我们采用EMD对这400个信号进行分解和特征提取,分成5组数据。
(2)SVM训练。在选用RBF核函数作为4个SVM分类器的核函数后,求解SVM的中所形成的凸二次规划问题,我们采用目前最为广泛使用的SMO方法来解决该优化问题,根据前面准备的5组训练数据采用留一交叉验证法进行每一个SVM分类器的参数选择。
(3)构建PSVM。将每个分类器的输出映射到[0,1]区间,计算出各类检测缺陷的支持度的形式如表1所示。
(4)将现场的待测数据输入到建好的PSVM模型中,根据分类器输出的缺陷分类支持度,利用DS证据理论进行数据融合,得出最终的缺陷判别结果。
图2 基于PSVM的缺陷识别流程
Fig.2 The flow of flaws classification based on PSVM
表1 缺陷类别的支持度
Tab.1 The support degree of flaw classification
缺陷
探头编号
F1
T1 T2 T3
m1(A1) m2(A1) m3(A1)
F2 m1(A2) m2(A2) m3(A2)
F3 m1(A3) m2(A3) m3(A3)
F4 m1(A4) m2(A4) m3(A4)
式的核函数和参数都与PSVM中的一样,采用单探头模式。在比较的时候,我们引入一个衡量准确辨识率的参数MA,其计算公式为:
1k MARi (16)
ki1式中,k表示每个PSVM组下的分类数。本文中k=4;Ri表示对于第i类缺陷的正确分类概率。表3为我们显示了三种辨别方式的准确率。每一种方式的准确率都是在的标准测试样本下进行的,比较过程中测试样本含有200个缺陷数据,每类缺陷数据为50个。
表3不同方式下缺陷辨识准确率的值
Tab.3 Accuracy ratio of flaw classification with different
3.2 仿真分析
按照以上建立的缺陷识别流程,我们利用采集到的400个典型数据进行PSVM的网络训练和测试。训练好的辨识裂纹(F1)的PSVM的参数如表2所示:
表2 PSVM中参数值 Tab.2 The parameters of PSVM
Sigmoid函数
训练样本数 320
SVM数目 169
测试样本数 80
惩罚因子
C 16
核参数σ
a
0.03125
-3.2
参数
b 0
model
辨识模式
缺陷类别
PSVM+DS
裂纹(F1) 气孔(F2) 夹渣(F3) 缩松(F4)
MA
0.98 0.98 0.98 0.96 0.975
NN+DS 0.88 0.86 0.90 0.88 0.88
SVM(单探头)
0.88 0.90 0.84 0.80 0.855
在sigmoid函数的参数都估算出来以及每个SVM都训练完成后,我们就可以将该多类识别模型用于大型回转件中进行在线实时超声波检测缺陷辨识了。为了测试本文构建的PSVM的性能,我们将其同神经网络以及传统SVM输出模式判别方法进行了比较。神经网络采用标准的BP神经网络,总共3层,隐含层神经元数目为30个;传统SVM方
从表3中,我们可以看出:
(1)本文中构造的PSVM和DS证据理论相结合的缺陷识别方式提高了超声波检测中缺陷辨识
的准确性。
(2)从算法上看,其计算量与存储量和传统SVM方式相当,然而传统的SVM方式存在一定量的误判情况,同时一些模糊缺陷会导致传统SVM分类的不确定性,这也正是导致SVM方式下缺陷辨识正确率比较低的原因所在。
在缺陷辨识方法比较过程中,曾出现单探头模式下的四个SVM分类器中某一个对测试样本错误分类或者不能确定分类的情况,我们将该样本数据提取出来放入本文所建立的PSVM模型中进行试验。该样本所属缺陷类别为F1,其测试结果如表5所示:
表4 缺陷类别支持度及融合
Tab.4 The support degree of flaw classification and fusion
results
支持度 F1 F2 F3 F4 识别结果
m1 0.8 0.016 0.133 0.203 F1 m2 0.725 0.056 0.142 0.077 F1 m3 0.443 0.063 0.123 0.371 不确定 融合
0.9622
0.00026
0.0107
0.0268
F1
从表4中,我们可以看出:
(1)经过融合后,缺陷的类别支持度有了明显的可辨识性,说明数据融合降低了识别的不确定性,提高了缺陷的辨识正确率,这也反应在表3中。
(2)从表中的数据我们也能看出,如果3个超声波检测仪中某一个出现故障(在现场比较常见的情况)不能正常工作时,数据融合同样能够给出正确的缺陷识别。说明本文构造的PSVM和DS证据理论相结合的缺陷识别方式有很强的鲁棒性。
4 结 论
传统支持向量机在模式识别中有着的优异表现,概率支持向量机不但继承了这一特点,还克服了传统支持向量机的后续数据处理能力不足的缺陷;模式分解法可以自适应地根据信号自身的内在特性进行分解和提取信号特征,可减少不必要的特征干扰,提高缺陷辨识的准确性;DS证据理论能够融合多探头数据,避免了决策的主观性,同时还提高了辨识的效率、精度和容错能力。本文提出的基于PSVM的超声缺陷识别模型利用传统的二类SVM构造出一个处理多类问题的概率SVM,并结合DS证据理论和EMD模式分解理论,提高辨识系统判别超声缺陷的准确性、可靠性以及系统的鲁棒性。本模型在现场应用中取得了好的实际效果,具有很好的推广价值。
参 考 文 献
[1] Cacciola M, Calcagno S, Morabito FC, et al. Computational intelligence aspects for defect classification in aeronautic composites by using ultrasonic pulses [J]. IEEE Transactions on Ultrasonics, Ferroelectrics, and Frequency Control, 2008, 55(4): 870-878.
[2] Acciani G, Brunetti G, Fornarelli G, et al. Neural network classification of flaws in pipes using ultrasonic waveforms [J]. WSEAS Transactions on Circuits and Systems, 2005, 4(10): 1387-1394.
[3] Fei C, Han Zh, Dong J. An ultrasonic flaw-classification system with wavelet-packet decomposition, a mutative scale chaotic genetic algorithm, and a support vector machine and its application to petroleum-transporting pipelines [J]. Russian Journal of Nondestructive Testing, 2006, 42(3): 190-197.
[4] Lin HT, Lin CJ, Weng RC. A note on Platt's probabilistic outputs for support vector machines [J]. Machine Learning, 2007, 68(3):267-276.
[5] Huang NE, Shen Z, Long SR. The Empirical Mode Decomposition and the Hilbert Spectrum for Non-linear and Non-stationary Time Series Analysis [J]. Proceedings of the Royal Society London, 1998, 454(1):903-995.
[6] Vapnik V N. Nature of Statistical Learning Theory [M]. New York: Springer-Verlag, 1995.
[7] Zheng Enhui, Li Ping, Song Zhihuan. Performance analysis and comparison of neural networks and support vector machines classifier [J]. Proceedings of the World Congress on Intelligent Control and Automation, 2004, 5: 4232-4235.
[8] Christopher JC Burges. A tutorial on support vector machines for pattern recognition [J], Data Mining Knowledge Discovery, 1998, 2(2): 121–167.
[9] Basir Otman, Yuan Xiaohong. Engine fault diagnosis based on multi-sensor information fusion using Dempster-Shafer evidence theory [J]. Information Fusion, 2007, 8(4): 379-386.
[10] Keerthi SS, Lin CJ. Asymptotic behaviors of support vector machines with Gaussian kernel [J]. Neural Computation, 2003, 15(7): 1667–16.
作者简介:何明格(1981-),男,博士研究生,研究方向:超声波无损检测、缺陷智能识别。 Email:hemingge_518@163.com *本文受国家自然科学基金项目(编号:50575153)和四川省国际科技合作与交流研究计划项目(编号:2007H12-017)资助
因篇幅问题不能全部显示,请点此查看更多更全内容