基于t-分布随机邻域嵌入融合最优多频带盒维数的牵引整流器故障诊断

毛向德1,2 董海鹰1,3 梁金平3

(1. 兰州交通大学自动化与电气工程学院 兰州 730070 2. 陕西铁路工程职业技术学院 渭南 714000 3. 兰州交通大学新能源与动力工程学院 兰州 730070)

摘要 针对电力机车牵引变流器中故障率较高的牵引整流器,提出一种基于t-分布随机邻域嵌入(t-SNE)融合最优多频带盒维数特征的故障诊断方法。首先,在最优小波基函数的基础上,利用小波包分解牵引整流器在不同工况、不同运行模式下的故障信号,得到一系列的最优频带;其次,计算各频带系数的分形盒维数,作为高维故障特征;最后,采用t-SNE流形学习对高维特征进行融合,以减少特征之间的冲突和冗余,得到简单敏感的故障特征。结果表明:信噪比为30 dB时,15种故障模式的最终诊断结果为99.79%,对不同的信噪比仍有较高的准确率。与其他方法相比,所提方法对不同类型开关器件(绝缘栅双极晶体管和电力二极管)的开路故障具有较高的诊断率和较强的鲁棒性。

关键词:牵引整流器 能熵比 分形盒维数 t-分布随机邻域嵌入 特征融合

0 引言

牵引整流器是电力机车牵引变流器的重要组成设备,在牵引状态时将交流电整流成直流电供给逆变器,在电气制动状态时又将直流电逆变成交流电返回电网,具有电能双向转换、功率因数可调、电能转换率高等优点[1]。由于整流器的控制策略复杂、运行条件恶劣,在工作过程中往往伴随着高温并产生频繁过电压、过电流、电磁干扰等问题。其故障率远远大于牵引逆变器[2]。当整流器发生故障时,牵引整流器输入电压发生畸变,引起牵引逆变器电流不平衡,谐波增加,逆变失败,损坏机车牵引传动系统,造成意外停机事故。因此,探索先进的整流器故障诊断方法,可以有效地提高电力机车的运维能力,保证了列车的安全与稳定进行。

目前,牵引整流器的故障诊断对象集中于绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor, IGBT)的开路故障,现有的诊断方法主要有基于模型[3]和信号[4]的两种方法。然而,基于模型的方法依赖于精确的系统参数和模型;基于信号的方法在信号分析中阈值设计难度大,需要对系统有丰富的先验知识和理论分析,甚至需要额外的硬件,在负载波动的情况下诊断性能较差。事实上,在工况、负载多变、工作环境恶劣的条件下,牵引整流器的建模和信号分析在一定程度上受到限制。

电力变换器的故障源主要来自其能量转换的核心器件IGBT和电力二极管,由于工作环境恶劣、负载和工况多变、控制策略复杂,因此,基于数据驱动的方法[5]更适合于IGBT和电力二极管的故障诊断。文献[6]通过优化深度信念网络对整流器的单个IGBT进行故障诊断,诊断准确率达到了98.43%,但是没有考虑两个IGBT同时故障和电力二极管的故障。文献[7]对整流器的故障采用了乘法特征训练的随机森林诊断,训练和测试比在2width=6,height=111条件下准确率为98.32%,诊断效果得到了提高,但是对训练和测试比以及噪声的鲁棒性没有涉及到。文献[8]运用堆叠降噪自动编码器和粒子群优化支持向量机完成对整流器二极管的故障诊断,虽然有效地从高维数据中得到了低维特征,但是诊断结果是在训练和测试比为14width=6,height=111的条件下达到96%,没有验证在其他训练和测试比下的诊断效果,而且对负载和噪声的变化没有涉及。文献[9]实现了噪声变化条件下利用非线性自回归模型和极限学习机算法对单相整流器的故障诊断,但没有讨论输入电压的变化对诊断结果的影响。与其他两种方法相比,数据驱动的方法不需要精确的系统模型和严格的信号分析,而是通过对故障信号的数据处理和特征提取,采用模式识别诊断故障器件,具有更好的鲁棒性和动态特性[10]。事实上,良好的信号处理和精准的特征提取,能够减少模式识别的成本,提高故障诊断的准确率。

常见的信号处理和特征提取方法[11]主要有统计分析法、快速傅里叶变换(Fast Fourier Transform, FFT)、短时傅里叶变换(Short Time Fourier Transform, STFT)、小波变换(Wavelet Transform, WT)等算法,这些算法虽然在诊断过程中取得了良好的结果,但是有一定的局限性,如统计分析法易受噪声和负载变化的影响;FFT是建立在线性假设的基础上,对非线性信号的分析会产生误差信息;STFT采用了固定宽度的时间窗口,分辨率恒定,无法同时获得高时间分辨率和高频率分辨率;WT无法做到对信号高频部分的分解。

实际上牵引整流器的故障信号具有非线性、非平稳的特点,为了提取合理的故障特征,不仅考虑信号在时频域上的多分辨率分解,而且需要考虑信号的定量描述。小波包分解[12]能够对故障信号进行多分辨率分解,提高处理信号的能力,得到更为精细的低频和高频成分,挖掘出准确的时频特征。分形维数理论中的盒维数[13]能够完成非线性、非平稳信号的定量描述,使不规则和复杂性的故障特征在盒维数中得到体现。

简单有效的特征提取能够提高故障诊断方法的准确率和鲁棒性。在特征提取过程中,由于存在大量的冗余信息和特征冲突,提取的故障特征维数过大,增加了故障识别的难度,无法保证较高的诊断率[14]。为了解决故障特征维数过大的问题,往往采用降维技术实现高维特征的融合[15]。如主成分分析(Principal Component Analysis, PCA)法[16],核主成分分析(Kernel Principal Component Analysis, KPCA)法[17],但是PCA是建立在线性假设的基础上,对一些非线性数据的融合效果较差。KPCA可以融合非线性数据,然而,在处理大规模数据集时特征提取的效率较低。

流形学习算法[18]具有从非线性高维数据中挖掘低维数据结构的强大能力,受到了广泛关注。常见的几种流形学习主要有:等距特征映射(Isometric Mapping, ISOMAP)[19]、局部线性嵌入(Locally Linear Embedding, LLE)[20]、局部切线空间对齐(Local Tangent Space Alignment, LTSA)[21]等,但是在运算过程中对最近邻域数目的选择,存在计算复杂、数据结构要求严格等问题,对同一系统的不同样本,由于数据结构流形上的曲率以及样本点密度的变化最近邻域数目也不同,算法的可移植性差。t-分布随机邻域嵌入(t-distributed Stochastic Neighbor Embedding, t-SNE)是一种非线性流形学习算法[22],与其他流形学习相比,该算法以保持高维与低维数据邻域分布特性一致为目标,简化了邻域选择问题。

本文提出了一种基于信号多分辨率分解的特征定量描述与融合的牵引整流器故障诊断技术。首先,针对不同工况、不同的故障模式信号选择最优小波基函数,并采用小波包分解对故障信号多分辨率分解,得到一系列的最优频带,并计算各频带系数的分形盒维数,作为高维故障特征;其次,利用t-SNE算法对故障特征进行融合,减少特征之间的冲突和冗余,得到简单有效的故障特征;最后,采用支持向量机(Support Vector Machine, SVM)算法[23]进行模式识别,实现对牵引整流器的故障诊断。

1 系统描述和故障分析

牵引整流器是大功率交流传动HXD3型电力机车牵引传动系统的重要组成设备,如图1所示。牵引整流器和牵引逆变器是牵引传动系统的两大部件。

width=177.35,height=100.55

图1 电力机车牵引传动系统结构组成

Fig.1 Electric locomotive traction transmission system structure composition

在机车牵引或制动过程中牵引整流器有能量传递和回馈作用。在机车牵引状态下,牵引整流器作为牵引变流器的输入端,将牵引变压器二次侧1 450 V交流电整流为2 800 V稳定直流电压供给牵引逆变器[24]。在牵引制动状态下,牵引整流器作为牵引变流器的输出端,将电能反馈给接触网[25]

电力机车牵引整流器也称单相脉宽调制(Pulse Width Modulation, PWM)整流器,电路结构如图2所示,其故障源主要来自电路结构中的IGBT(VT1~VT4)和电力二极管(VD1~VD4)的开路和短路故障。短路故障发生时系统会产生很大电流,监控装置和硬件保护(如熔断器断开)迅速触发机车报警装置[26],通知乘务人员停机检修,易于检测。开路故障会降低牵引传动系统的性能,但不会使系统立即崩溃,由于不会引起电流和电压的显著变化,在很长一段时间内可能无法检测到,因此常被忽略,容易导致其他部件的二次故障,造成系统更大的损失[27]。因此牵引整流器的故障诊断通常针对IGBT和电力二极管的开路故障。

width=139.3,height=72.35

图2 单相PWM整流器电路结构

Fig.2 Single-phase PWM rectifier circuit structure

由于牵引整流器工作在噪声环境中,合理的故障信号采集关系着故障诊断方法的复杂程度。本文首先选择对噪声具有鲁棒性的整流器输入电压Uab信号作为故障采集信号;其次为了模拟噪声环境,在故障采集信号中加入信噪比为30 dB白噪声;最后规定变压器二次电流流向整流器的方向为IN>0;反之,IN<0,在1.5 s时注入开路故障,分析IGBT和电力二极管发生故障时对牵引整流器的影响。

当VT1开路故障时,电压Uab波形如图3所示。当IN>0时,VT1的开路故障对电路不造成影响,整流器仍正常工作;当IN<0时,由于直流侧电容Cd无法对电感充电,只有牵引变压器二次绕组电压UN对电感LN充电,使得电压发生畸变。

width=196.45,height=146.05

图3 1.5 s VT1发生开路故障时电压Uab波形

Fig.3 Uab waveforms of open circuit fault occurs on VT1 at 1.5 s

当VT1和VT3同时开路故障时,电压Uab波形如图4所示。不论IN>0还是IN<0,均失去了直流侧电容Cd对电感LN的充电步骤,由二次电压UN和电感LN对直流侧电容Cd充电,或者只有二次电压UN对电感LN充电,电压的波形发生畸变。

width=196.45,height=143.65

图4 1.5 s VT1和VT3同时发生开路故障时电压Uab波形

Fig.4 Uab waveforms of open circuit fault occurs on VT1 and VT3 at 1.5 s

当VD1发生开路故障时,电压Uab的波形如图5所示,电压Uab在正半周的波形失真,发生畸变,产生瞬间高电压,导致整流器过电压故障。当检测到这种明显高于正常电压的情况时,监控装置和硬件保护会触发机车报警装置,应立即停车检修。事实上,整流器出现高电压报警的原因主要有网压波动过大造成的高电压和整流器中传感器、驱动板、IGBT或电力二极管故障造成的高电压。因此,在发生高电压报警时,应立即停止机车运行,在排除网压不稳定的情况下,检查整流器故障,所以需要通过故障诊断来定位整流器的故障部件,以确定故障的具体原因并进行维修或更换。

width=188.75,height=136.7

图5 1.5 s VD1发生开路故障时电压Uab波形

Fig.5 Uab waveforms of open circuit fault occurs on VD1 at 1.5 s

本文研究了IGBT单开路和双开路故障,以及二极管单开路故障。共有15种故障模式(正常模式和14种故障模式),相应的故障模式见表1。

表1 故障模式

Tab.1 Fault mode

故障类型故障模式 正常正常 单个IGBTVT1 VT2 VT3 VT4 同一桥臂两个IGBTVT1, VT2 VT3, VT4 相同半桥两个IGBTVT1, VT3 VT2, VT4 不同半桥两个IGBTVT1, VT4 VT2, VT3 二极管VD1 VD2 VD3 VD4

2 最优多频带盒维数故障特征提取

为了更好地处理非线性、非平稳信号,并对其进行定量描述,本文采用小波包变换对故障信号进行多分辨率分解,克服了小波变换对高频信号分辨率低的问题;对分解后的各频带系数利用分形盒维数作为故障信号的有效特征,克服了小波包能量特征弱化小波包时频分析的能力。

2.1 多频带系数的计算

小波包对故障信号进行第m层分解,得到width=22,height=11 width=15,height=15个频带,其中,width=27,height=17为第m层分解后的第n个频带、节点width=30,height=15的第r个系数,width=18,height=15width=20,height=15分别为低通和高通滤波器的系数,小波包系数递推公式为

width=103,height=55 (1)

因此,故障信号经过m层分解后得到各频带的小波包分解系数为

width=71,height=21 (2)

式中,width=87,height=21L为第n个频带的长度。

2.2 最优小波基函数的选取

小波包对整流器输入电压信号Uab分解时,小波基函数的选取对分解效果有很大的影响。本文通过能-熵比准则选取最优小波基函数。能-熵比准则即小波包分解后得到的各频带系数的能量值与信息熵的比值,能量值越大所含的故障信息越丰富,信息熵越小说明故障信息的不确定性越小[28]。能-熵比准则计算过程如下:

(1)频带的能量width=24.95,height=15和信息熵width=23,height=15分别为

width=81,height=33 (3)

width=92,height=33 (4)

式中,width=83,height=24,表示小波包系数的能量概率分布,有width=47,height=16width=27,height=33。当width=28,height=16时,有width=58,height=15,且width=83,height=15

(2)计算频带系数的能-熵比r

width=42,height=30 (5)

因此,频带系数的能-熵比越大,所选择的小波基函数从被分析的信号中提取的能量越大,信息熵越小,说明选取的小波基越优。

2.3 基于分形盒维数的故障特征提取

计算故障信号经过小波包m层分解后的每个频带系数的分形盒维数,并将其作为整流器故障特征。分形盒维数的计算步骤如下:

(1)计算网格数width=19,height=15。将各频带系数的集合X划分成width=16,height=15个网格width=19,height=15(大小为width=10,height=12,width=28,height=12)。采用近似法,把网格扩大到width=15,height=13,假设为集合X的网格数,通过以下方程得到width=19,height=15

width=220,height=36

width=159,height=23 (6)

式中,width=15,height=15为采样点数;width=70,height=15,width=47,height=13.95 width=48,height=15,则

width=70,height=28 width=35,height=15 (7)

(2)在width=66,height=17区间,选择线性度较好的线段,线性回归线的起点和终点分别为k1k2,则

width=147,height=15 (8)

(3)利用最小二乘法计算线性回归线的斜率得

width=193.95,height=41(9)

则,每个频带系数的集合X的盒维数Dwidth=9,height=13

因此,M个频带系数的分形盒维数,组成整流器的故障特征XH

width=95,height=17 (10)

2.4 基于t-SNE算法的特征融合

t-SNE是将数据点之间的欧式距离转换为数据之间相似性的条件概率,基本思想是用条件概率表示高维空间数据点之间的相似性。因此,本文利用t-SNE算法对提取的整流器故障特征XH进行融合,以减少特征之间的冗余,得到简单敏感的特征。t-SNE算法的计算步骤如下:

(1)整流器故障特征数据集width=89.35,height=17,任意两个数据点width=13,height=15width=15,height=17之间相似的条件概率width=16,height=17

width=118,height=80 (11)

式中,width=11,height=15为数据点width=13,height=15的高斯方差,具体大小与设定的困惑度width=11,height=12参数有关。

(2)计算故障特征数据的联合概率密度函数width=13,height=17

width=60.95,height=29 (12)

(3)假设蕴含在故障特征空间中的低维流形结构的样本数据为width=78.95,height=17。初始化低维样本数据width=19,height=15,且采用自由度为1的t分布计算低维空间中样本数据的相似度width=13,height=17

width=108,height=59 (13)

(4)使用KL(Kullback-Leiber)散度定义故障特征数据的高斯分布P和低维数据的t分布Q的相似度C

width=142,height=34 (14)

(5)计算梯度width=17,height=28最小化KL散度为

width=190,height=34(15)

(6)假设width=9,height=12为学习率;width=21,height=15为动量因子;t为迭代次数,计算低维数据width=18,height=15

width=166,height=28 (16)

(7)将步骤(3)~步骤(5)进行迭代循环,直到迭代次数t达到最大值T,则输出低维数据 width=20,height=15

width=147,height=17 (17)

式中,width=20,height=15为融合后的故障特征。

2.5 故障诊断策略

本文针对电力机车牵引整流器的故障诊断,提出的基于t-SNE融合最优多频带盒维数的诊断方法,包括五个部分:数据采集、信号处理、特征提取、高维特征融合和模式识别,诊断框图如图6所示。

(1)数据采集。采集整流器在不同运行工况下15种故障模式的电压Uab信号,形成原始样本集。

(2)信号处理。小波基函数选择:根据能熵比选择某一工况下15种故障模式各自对应的最优小波基函数;小波包分解:对每种故障模式信号在最优小波基函数基础上进行小波包分解,得到最优频带。

(3)特征提取。计算各频带系数的分形盒维数,构成不同工况、不同故障模式对应的高维特征向量。

(4)高维特征融合。采用流形学习中的t-SNE算法进行高维特征融合,得到简单有效的特征向量。

(5)模式识别。将故障特征向量随机分为训练样本和测试样本,使用SVM分类器进行故障诊断,通过训练样本对SVM的训练,用测试样本验证训练后的SVM分类器性能,给出诊断结果。

3 基于t-SNE融合最优多频带盒维数的故障特征提取

为了验证上述故障诊断方法,建立牵引整流器仿真模型,主要参数见表2。为了保证所提取的故障特征完整性建议增加样本量。当直流侧电压Udc从2 000 V变化到2 800 V时,每隔10 V采集15种故障模式下的整流器输入电压Uab信号作为故障采集信号;为了模拟噪声环境,在故障采集信号中加入信噪比为30 dB白噪声。每个故障模式有81组样本,15种故障模式有81×15=1 215个样本。

width=423.75,height=355.3

图6 故障诊断框图

Fig.6 Fault diagnosis block diagram

表2 单相PWM整流器主要参数

Tab.2 Single-phase PWM rectifier main parameters

参 数数 值 牵引变压器低压侧电压UN/V1 450 牵引变压器漏电感LN/mH2.3 直流侧电压Udc/V2 800 支撑电容Cd/mF8

3.1 最优小波基函数的选择

本文从挖掘故障特征的程度和计算成本考虑,对故障信号进行5层小波包分解,选择常用于信号分解重构的Daubechies(dbN) 小波系,分别采用dbNN=2~10,九种小波基函数对信号进行小波包分解,使每个样本、每种故障模式共有九组频带,计算并比较每组频带的能-熵比,能-熵比最大,说明所选取的小波基函数最优,对应故障信号分解得到的频带系数最优。表3展示了牵引整流器输出侧直流电压为2 800 V时,不同故障模式对应的最优小波基函数的选择结果以及对应频带的最大能-熵比值。

3.2 最优多频带盒维数特征的提取

将81种工况,每种工况的15种故障模式,分别采用各自最优的小波基函数,对故障信号进行小波包5层分解,得到32个频带,计算每个频带系数的分形盒维数,即每个故障模式有32个盒维数特征,即32维特征,从中任意选取三个维度,实现高维数据的可视化,通过散点图观察聚类效果,如图7所示,通过高维特征向量的数据分布信息,频带盒维数特征将一些故障类型准确聚类,表明盒维数作为故障特征是可行的,但是由于高维特征之间的特征冲突和冗余问题,弱化了分形盒维数对故障特征的定量描述,使得一些故障类型的特征相互关联,故障模式相互重叠,难以区分,聚类效果不理想,这说明提取的高维特征,不利于故障诊断。因此,有必要采用特征融合技术来减少冗余信息和特征冲突,提取更典型的低维特征向量。

表3 不同故障模式的最优小波基函数及能-熵比值

Tab.3 Optimal wavelet basis function and energy entropy ratio for different fault modes

模式dbN能-熵比 正常db81.562 9 VT1db81.445 7 VT2db81.406 9 VT3db81.446 5 VT4db21.430 2 VT1, VT2db91.101 1 VT3, VT4db61.093 4 VT1, VT3db81.100 4 VT2, VT4db81.109 2 VT1, VT4db21.297 VT2, VT3db81.2525 VD1db413.773 VD2db411.454 VD3db413.784 VD4db212.026

width=184.3,height=166.3

图7 高维特征散点

Fig.7 High-dimensional features scatter plot

3.3 基于t-SNE融合高维特征的效果分析

由于高维特征向量的维数为32维,根据极大似然估计[29],计算高维特征的本征维数为3.014 3,设置t-SNE算法参数,初始维度initial_dims=32;困惑度perplexity=30;为了不丢失有用的特征信息,取最大整数,设置目标维度no_dims=4。

融合后每种故障模式有四维特征,其低维特征散点如图8所示。故障类型之间的重叠现象基本消失,聚类效果比较理想。但每个样本由于频带盒维数值极其相似,导致每个故障模式中的不同样本出现重叠,需要分类器进一步分类。

width=178.45,height=157.45

图8 t-SNE融合特征的效果

Fig.8 The effect for t-SNE fusion features

4 故障诊断结果分析与比较

本文将SVM应用于故障模式识别,选取对噪声有鲁棒性的径向基函数(Radial Basis Function, RBF)[30]作为核函数,采用网格搜索和交叉验证确定两个参数误差项的惩罚函数C和偏置系数g 的最优值。采集整流器的输入电压Uab信号,为了符合整流器的真实工作环境,在原始信号中加入一定量的白噪声,将提取并融合后的低维特征(最优频带盒维数特征)作为分类器SVM的输入,按照预设的比例,将输入数据随机划分为训练样本和测试样本。通过对SVM分类器的训练,将测试结果与实际结果相比较给出诊断结果。

4.1 对直流侧电压的鲁棒性分析

在不同直流侧电压下,向采集的电压信号中加入30 dB白噪声,训练样本和测试样本的比例为3width=6,height=112,采集的样本数量为1 215个,按照预设的比例3width=6,height=112,将样本随机分为729个训练样本和486个测试样本,使用测试集中的样本进行测试。诊断结果如图9所示,横坐标为测试样本数目,纵坐标为SVM分类后的故障模式,即诊断结果。第470个样本故障模式VD4被误诊为VD3,VD4的32个测试样本诊断准确率为96.875%;其他故障模式对应的测试样本诊断准确率为100%,最终诊断结果为99.79%。结果表明,所提出的方法不仅对直流侧电压变化具有良好的鲁棒性,而且对于不同类型的器件,如IGBT和二极管具有良好的诊断效果。

width=185.75,height=146.3

图9 SVM诊断结果

Fig.9 SVM diagnosis results

4.2 对噪声的鲁棒性分析

为了验证所选择的诊断方法在不同噪声环境中的诊断率,在原始信号中分别加入信噪比为10、15、20、25、30 dB的白噪声,按照所提的方法,进行特征提取与融合后得到简单敏感的最优特征,然后利用分类器SVM对每组特征运行30次,15种故障模式诊断准确率的平均值、最大值和最小值,如图10所示。

width=192.85,height=113.5

图10 对噪声的鲁棒性比较

Fig.10 Robustness comparison of noise

在信噪比10 dB时30次诊断后的平均值为95.333 3%,最大值为96.875%,最小值为93.333 3%,随着信噪比的增大,诊断结果均优于10 dB,说明所提出的方法对噪声有较强的鲁棒性。

4.3 对训练和测试比的鲁棒性分析

为了验证所选择的训练样本和测试样本比例对诊断率的影响,设定训练和测试比为2width=6,height=111、3width=6,height=112、5width=6,height=111、10width=6,height=111、15width=6,height=111、20width=6,height=111,对含有10、15、20、25、30 dB白噪声的数据分别运行30次后诊断率的平均值为评价指标,诊断结果如图11所示。

图11展示了训练和测试比为3width=6,height=112时,所有含白噪声的数据30次平均诊断结果最低,但对应的诊断率较高,含有不同白噪声的数据在3width=6,height=112时的诊断率分别为95.333 3%,98.444 4%,99.354 2%,99.555 6%,99.541 7%。因此该方法对训练和测试比的鲁棒性 较好。

width=191,height=148.05

图11 对训练和测试比的鲁棒性比较

Fig.11 Robustness comparison of training and test ratios

4.4 对网侧电压和负载的鲁棒性分析

为了验证所提出的诊断方法在网侧电压、负载变化时对诊断结果的影响,将负载的变化设置为满载、半载、空载三个状态;设置网侧电压波动范围为-200~+200 V。采集负载变化与网侧电压波动状态下的故障数据,并加入信噪比为30 dB的白噪声,提取故障特征,按照预设比例3width=6,height=112随机划分训练样本与测试样本,对每组数据运行30次,15种故障模式的平均诊断率为评价指标,如图12所示。

width=182.9,height=114.7

图12 对负载和网侧电压的鲁棒性比较

Fig.12 Robustness comparison for load and grid side voltage

以盒维数为特征的故障诊断结果除了负载在空载时故障率偏低,其余的诊断结果均保持在90%以上,表明以盒维数为故障特征对负载和网侧电压的变化是可行的,通过t-SNE算法对盒维数特征融合后诊断率均得到了提高,除负载为空载状态,其余的诊断结果均在97.9%以上,而且空载状态时的诊断结果89.791 7%较融合前66.259 6%提高了23.532 1%,说明所提出的方法不仅能够得到简单有效的故障特征,而且对负载和网侧电压的变化有较好的鲁棒性。

4.5 不同方法的比较

为了说明所提方法的优越性。选择三大类方法:直接识别频带盒维数特征;传统的降维融合技术PCA和KPCA;基于流形学习的降维融合技术,如ISOMAP算法和LLE算法。采用含有信噪比30 dB白噪声的数据,训练和测试比为3width=6,height=112,每个方法运行30次后诊断结果的平均值作为评价指标,结果如图13所示。

width=192.25,height=172.3

图13 不同方法的比较

Fig.13 Comparison of different methods

图13中,频带盒维数为故障特征向量时,良好的诊断率表明了特征选择的合理性,为了消除特征之间的冗余和冲突,利用融合技术,进一步提高诊断率。但是,由于PCA受限于线性降维的基础,KPCA受限于核函数的选择,ISOMAP和LLE受限于邻域的选择,使得融合效果不理想,采用t-SNE技术融合可以避开以上缺点,而且较融合前的诊断率都得到一定程度的提升(图中黄色区域为提升程度),信噪比越小,噪声越大,提升的程度越大,如信噪比为10、15、20、25、30 dB时采用t-SNE融合后,诊断率分别提升了22.02%、13.812%、9.750 2%、6.576 6%、6.194 7%。

在算法复杂度方面,以高维特征融合时间、训练时间和诊断时间、执行复杂度、计算负担为评价指标,比较见表4。在计算负担方面,几种融合算法都涉及到了目标维度,但是KPCA需要选择核函数;ISOMAP、LLE需要计算近领域数,数据不同,近邻域数也不相同,很难做出选择,而且根据近邻域数两者的融合时间很长,因此执行复杂度方面很难,而t-SNE面对困惑度参数可以设为默认值30,t-SNE实际所要解决的参数就是目标维度,与PCA所需的参数一致,因此t-SNE的执行复杂度较为简单。虽然t-SNE的融合时间大于PCA和KPCA,但是其拥有较高的故障诊断率。与盒维数特征直接识别故障类型相比,经过t-SNE融合后的特征在缩短训练和诊断时间的基础上提高了诊断率。

表4 算法复杂度比较

Tab.4 Algorithm complexity comparison

算法融合时间/s训练时间/s诊断时间/s执行复杂度计算负担(参数) 盒维数—85.8870.018一般— t-SNE15.25167.3270.012一般目标维度、困惑度 PCA0.000 939.5160.009 9简单目标维度 KPCA0.381 739.9030.008一般目标维度、核函数 ISOMAP53.55239.0880.008难目标维度、近邻域数 LLE68.45139.5660.008 7难目标维度、近邻域数

4.6 与先进方法的比较

为了进一步说明本文算法的优越性,将该方法与几种先进的方法进行比较,结果见表5。从表5中可以看出,本文所提出的方法在噪声的鲁棒性、训练和测试比方面优于文献[30]所提出的基于多元经验模态分解和模糊熵特征的方法。相比于文献[31]利用变分模态分解将原始信号分解为一系列本征模态函数,以各分量能量熵为特征的方法,虽然在15 dB、20 dB略高于本文所提出的方法,但是其训练和测试比为7width=6,height=113,而且未考虑工况变化对故障诊断结果的影响。文献[32]通过带自适应噪声的完全集合经验模态分解与模糊熵特征对IGBT的开路进行诊断。文献[6]提出了优化深度信念网络对整流器的单个IGBT进行故障诊断。文献[7]针对整流器的开路故障采用乘法特征训练的随机森林诊断;以上三种方法的故障诊断率虽然较高,但是与本文所提的方法相比较,缺乏了噪声鲁棒性的研究,而且文献[32]和文献[7]在可靠性方面没有提及到。因此本文所提出的方法具有较好的稳定性、较强的鲁棒性和较高的诊断率。

表5 与先进方法的比较

Tab.5 Comparison with advanced methods

文献样本获取噪声等级/dB训练与测试比可靠性准确率 (%) 本文输出电压1032运行30次95.33 1598.44 2099.35 2599.56 3099.54 [30]风速1032运行30次84.23 2092.15 3095.58 [31]滑动时间窗口1073运行20次92.85 1598.67 2099.95 [32]电机速度无41—99.09 [6]输出电流无41运行200次98.43 [7]输入电流无21—98.32

5 结论

针对大功率交流传动电力机车牵引整流器的故障诊断,提出了一种基于t-SNE融合最优多频带盒维数特征的方法。结果表明,所提的故障诊断方法能够实现在直流侧电压大范围变化的情况下,对15种故障模式有较高的诊断率,而且对直流侧电压、噪声、训练与测试比均具有良好的鲁棒性。与其他方法相比,所提方法的诊断效果更优。

参考文献

[1] 潘鹏宇, 胡海涛, 肖冬华, 等. 高速列车变流器“扫频式”dq阻抗测量中的频率耦合干扰机理及抑制策略[J]. 电工技术学报, 2022, 37(4): 990-999, 1009.

Pan Pengyu, Hu Haitao, Xiao Donghua, et al. Frequency coupling interference mechanism and suppression strategy for frequency-sweeping-based dq impedance measurement of high-speed train converter[J]. Transactions of China Electrotechnical Society, 2022, 37(4): 990-999, 1009.

[2] Tian Zisi, Ge Xinglai. An on-line fault diagnostic method based on frequency-domain analysis for IGBTs in traction PWM rectifiers[C]//2016 IEEE 8th International Power Electronics and Motion Control Conference (IPEMC-ECCE Asia), Hefei, China, 2016: 3403-3407.

[3] 许水清, 黄文展, 何怡刚, 等. 基于自适应滑模观测器的中点钳位型三电平并网逆变器开路故障诊断[J]. 电工技术学报, 2023, 38(4): 1010-1022.

Xu Shuiqing, Huang Wenzhan, He Yigang, et al. Open-circuit fault diagnosis method of neutral point clamped three-level grid-connected inverter based on adaptive sliding mode observer[J]. Transactions of China Electrotechnical Society, 2023, 38(4): 1010- 1022.

[4] 武鸿, 王跃, 薛英林, 等. 适用多功率的最近电平调制下MMC子模块开路故障诊断策略[J]. 电工技术学报, 2024, 39(1): 233-245, 302.

Wu Hong, Wang Yue, Xue Yinglin, et al. A diagnosis strategy for open-circuit submodule faults in MMCs under nearst level modulation suitable for different powers[J]. Transactions of China Electrotechnical Society, 2024, 39(1): 233-245, 302.

[5] 王艳新, 闫静, 王建华, 等. 基于域对抗迁移卷积神经网络的小样本GIS绝缘缺陷智能诊断方法[J]. 电工技术学报, 2022, 37(9): 2150-2160.

Wang Yanxin, Yan Jing, Wang Jianhua, et al. Intelligent diagnosis for GIS with small samples using a novel adversarial transfer learning in convolutional neural network[J]. Transactions of China Electro- technical Society, 2022, 37(9): 2150-2160.

[6] Du Bolun, He Yigang, Zhang Yaru. Open-circuit fault diagnosis of three-phase PWM rectifier using beetle antennae search algorithm optimized deep belief network[J]. Electronics, 2020, 9(10): 1570.

[7] Kou Lei, Liu Chuang, Cai Guowei, et al. Data-driven design of fault diagnosis for three-phase PWM rectifier using random forests technique with transient synthetic features[EB/OL]. 2022: 2211.02631.http:// arxiv.org/abs/2211.02631v1

[8] 石旭东, 徐海义, 吴东华, 等. 基于SDAE-PSOSVM的航空变压整流器故障诊断方法研究[J]. 北京理工大学学报, 2021, 41(10): 1069-1076, 1083.

Shi Xudong, Xu Haiyi, Wu Donghua, et al. Fault diagnosis method for aviation transformer rectifier unit based on SDAE-PSOSVM[J]. Transactions of Beijing Institute of Technology, 2021, 41(10): 1069- 1076, 1083.

[9] Zhang Kun, Gou Bin, Feng Xiaoyun. Online fault diagnosis for single-phase PWM rectifier using data-driven method[J]. CPSS Transactions on Power Electronics and Applications, 2022, 7(1): 49-57.

[10] 刘建强, 刘传铎, 王轶欧, 等. 单相PWM整流器IGBT及直流侧电容故障诊断方法[J]. 电工技术学报, 2019, 34(增刊1): 244-257.

Liu Jianqiang, Liu Chuanduo, Wang Yiou, et al. Fault diagnosis method of IGBT and DC side capacitor of single-phase PWM rectifier[J]. Transactions of China Electrotechnical Society, 2019, 34(S1): 244-257.

[11] Liang Jinping, Zhang Ke, Al-Durra A, et al. A state- of-the-art review on wind power converter fault diagnosis[J]. Energy Reports, 2022, 8: 5341-5369.

[12] 肖文妍, 郭谋发, 林佳壕, 等. 基于多频带多特征融合的配电网单相接地故障选段方法[J]. 电气技术, 2024, 25(7): 7-14.

Xiao Wenyan, Guo Moufa, Lin Jiahao, et al. Single- phase-to-ground fault section location method of distribution network based on multi-frequency band and multi-feature fusion[J]. Electrical Engineering, 2024, 25(7): 7-14.

[13] Hu Aijun, Yan Xiaoan, Xiang Ling. A new wind turbine fault diagnosis method based on ensemble intrinsic time-scale decomposition and WPT-fractal dimension[J]. Renewable Energy, 2015, 83: 767-778.

[14] 王琼苑, 褚继峰, 李秋霖, 等. 基于微型气体传感阵列的空气绝缘设备放电故障识别[J]. 电工技术学报, 2023, 38(23): 6494-6502.

Wang Qiongyuan, Chu Jifeng, Li Qiulin, et al. Miniature gas-sensing array employed for the dis- charge fault diagnosis of air-insulated equipment[J]. Transactions of China Electrotechnical Society, 2023, 38(23): 6494-6502.

[15] 侯慧, 朱韶华, 俞菊芳, 等. 基于高效数据降维的配电网风灾停电用户数量预测模型[J]. 电力系统自动化, 2022, 46(7): 69-76.

Hou Hui, Zhu Shaohua, Yu Jufang, et al. Prediction model for user number in power outage caused by wind disaster for distribution networks based on high- efficient data dimensionality reduction[J]. Auto- mation of Electric Power Systems, 2022, 46(7): 69-76.

[16] 胡亚辉, 韦延方, 王鹏, 等. 基于PCA和EEMD的柔性直流配电网故障选线算法[J]. 电源学报, 2024, 22(2): 305-315.

Hu Yahui, Wei Yanfang, Wang Peng, et al. Fault line selection algorithm for flexible DC distribution network based on PCA and EEMD[J]. Journal of Power Supply. 2024, 22(2): 305-315.

[17] 李英顺, 阚宏达, 郭占男, 等. 基于数据预处理和VMD-LSTM-GPR的锂离子电池剩余寿命预测[J]. 电工技术学报, 2024, 39(10): 3244-3258.

Li Yingshun, Kan Hongda, Guo Zhannan, et al. Prediction of remaining useful life of lithium-Ion battery based on data preprocessing and VMD- LSTM-GPR[J]. Transactions of China Electrotech- nical Society, 2024, 39(10): 3244-3258.

[18] 戚晓利, 叶绪丹, 蔡江林, 等. 基于变分模态分解与流形学习的滚动轴承故障特征提取方法[J]. 振动与冲击, 2018, 37(23): 133-140.

Qi Xiaoli, Ye Xudan, Cai Jianglin, et al. Fault feature extraction method of rolling bearings based on VMD and manifold learning[J]. Journal of Vibration and Shock, 2018, 37(23): 133-140.

[19] Tenenbaum J B, de Silva V, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500): 2319-2323.

[20] Roweis S T, Saul L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500): 2323-2326.

[21] Zhang Zhenyue, Zha Hongyuan. Principal manifolds and nonlinear dimensionality reduction via tangent space alignment[J]. Journal of Shanghai University (English Edition), 2004, 8(4): 406-424.

[22] 边荣正, 张鉴, 周亮, 等. 面向复杂多流形高维数据的t-SNE降维方法[J]. 计算机辅助设计与图形学学报, 2021, 33(11): 1746-1754.

Bian Rongzheng, Zhang Jian, Zhou Liang, et al. T-SNE for complex multi-manifold high-dimensional data[J]. Journal of Computer-Aided Design & Computer Graphics, 2021, 33(11): 1746-1754.

[23] 武昕, 严萌, 郭一凡, 等. 基于结构化特征图谱的组合支持向量机非侵入式负荷辨识[J]. 电力系统自动化, 2022, 46(12): 210-219.

Wu Xin, Yan Meng, Guo Yifan, et al. Non-intrusive load identification by combined support vector machine based on structured characteristic spectrum[J]. Automation of Electric Power Systems, 2022, 46(12): 210-219.

[24] 张曙光. HXD3型电力机车[M]. 北京: 中国铁道出版社, 2009.

[25] 黄先进, 杜田倩, 王风川, 等. 基于列车运行图的CRH3牵引变流器IGBT模块寿命预测[J]. 电工技术学报, 2022, 37(增刊1): 172-180.

Huang Xianjin, Du Tianqian, Wang Fengchuan, et al. Mission profiles-based lifetime prediction for IGBT modules applied to CRH3 traction converter[J]. Transactions of China Electrotechnical Society, 2022, 37(S1): 172-180.

[26] 文阳, 杨媛, 宁红英, 等. SiC MOSFET短路保护技术综述[J]. 电工技术学报, 2022, 37(10): 2538-2548.

Wen Yang, Yang Yuan, Ning Hongying, et al. Review on short-circuit protection technology of SiC MOSFET[J]. Transactions of China Electrotechnical Society, 2022, 37(10): 2538-2548.

[27] 杨贺雅, 邢纹硕, 向鑫, 等. 基于多元高斯分布异常检测模型的MMC子模块开路故障诊断方法[J]. 电工技术学报, 2023, 38(10): 2744-2756.

Yang Heya, Xing Wenshuo, Xiang Xin, et al. Open circuit fault diagnosis method of MMC submodule based on multivariate Gaussian distribution anomaly detection model[J]. Transactions of China Electro- technical Society, 2023, 38(10): 2744-2756.

[28] He Hong, Tan Yonghong, Wang Yuexia. Optimal base wavelet selection for ECG noise reduction using a comprehensive entropy criterion[J]. Entropy, 2015, 17: 6093-6109.

[29] 王浩任, 黄亦翔, 赵帅, 等. 基于小波包和拉普拉斯特征值映射的柱塞泵健康评估方法[J]. 振动与冲击, 2017, 36(22): 45-50.

Wang Haoren, Huang Yixiang, Zhao Shuai, et al. Health assessment for a piston pump based on WPD and LE[J]. Journal of Vibration and Shock, 2017, 36(22): 45-50.

[30] Liang Jinping, Zhang Ke. A new hybrid fault diag- nosis method for wind energy converters[J]. Elec- tronics, 2023, 12(5): 1263.

[31] Bai Xiaoze, Li Mingduo, Di Z, et al. Open circuit fault diagnosis of wind power converter based on VMD energy entropy and time domain feature analysis[J]. Energy Science & Engineering, 2024, 12(3): 577-595.

[32] Jiang Tiantian, Wang Yong, Li Zongyang. Fault diag- nosis of three-phase inverter based on CEEMDAN and GWO-SVM[C]//2020 Chinese Automation Con- gress (CAC), Shanghai, China, 2020: 2362-2368.

Fault Diagnosis of Traction Rectifier Based on t-Distributed Stochastic Neighbor Embedding Fusion Optimal Multi-Band Box Dimension

Mao Xiangde1,2 Dong Haiying1,3 Liang Jinping3

(1. School of Automation and Electrical Engineering Lanzhou Jiaotong University Lanzhou 730070 China 2. Shaanxi Railway Institute Weinan 714000 China 3. School of New Energy and Power Engineering Lanzhou Jiaotong University Lanzhou 730070 China)

Abstract In the traction converters of electric locomotives, the traction rectifier has a very high fault rate due to its complicated control and operating conditions. Fault diagnosis of rectifier can improve the operation and maintenance ability of electric locomotives and ensure the safety and stability of the train. The traditional rectifier fault diagnosis technology is limited in system modeling and signal analysis under variable load and strong noise environments. The data-driven rectifier fault diagnosis method is independent of the precise system model and prior knowledge of signal mode. However, redundant information and feature conflicts exist in the feature extraction process. The extracted fault feature dimension is large, which increases the difficulty of fault identification and diagnosis accuracy. This paper proposes a rectifier fault diagnosis method based on fractal box features fused by manifold learning. The fractal box dimension feature is extracted from the fault signal, the effective fault feature is obtained by manifold learning fusion, and the fault component of the traction rectifier is accurately diagnosed.

Firstly, signals of the traction rectifier under different working conditions and fault modes are decomposed using nine Daubechies wavelet functions, and the information of 9 frequency bands for each fault mode is obtained. According to the larger energy entropy ratio of each frequency band coefficient, the optimal frequency band is selected. Secondly, the fractal box dimension of the optimal frequency band is calculated. The t-distributed random neighborhood embedding (t-SNE) algorithm fuses the fault features. Finally, a support vector machine is used for pattern recognition to realize fault diagnosis of the traction rectifier. The optimal frequency band decomposes signal decomposition with different wavelet functions. The fractal box dimension quantitatively describes nonlinear and non-stationary signals. The t-SNE algorithm lowers the conflict and redundancy among features, reducing the difficulty of fault identification and the computational burden of the classifier.

Traction rectifier results show that when the SNR is 10 dB and the preset ratio is 3width=6,height=112, the average diagnostic accuracy is 95.333%. Increasing the SNR and preset ratio improves the diagnostic results, indicating the proposed method is robust regarding noise and preset ratio. The influence of voltage fluctuation and load change shows that the remaining diagnosis results are more than 97.9%, and the diagnosis result is 89.791 7% under the no-load state. The proposed method can still obtain simple and effective fault characteristics when the voltage fluctuation and load change on the network side. Comparisons with feature fusion algorithms in fusion time, training and diagnosis time, and computational complexity verify the superiority of the proposed method.

The following conclusions can be drawn. (1) The proposed method only needs to extract and fuse the fault features of the signal and finally locate the fault component through pattern recognition. Compared with the model-based and signal-based methods that rely on the system model and signal analysis, it is practical for the fault diagnosis of traction rectifiers under complex working conditions. (2) The optimal band box dimension feature can quantify the dynamic changes of system fault signals, reflect different operating states, and distinguish different faults. (3) The proposed fusion algorithm effectively solves the redundancy and conflict problems among features, reduces the cost of pattern recognition, and improves the diagnosis rate.

keywords:Traction rectifier, energy entropy ratio, fractal box dimension, t-distributed random neighborhood embedding, feature fusion

DOI: 10.19595/j.cnki.1000-6753.tces.240433

中图分类号:U264.4

甘肃省青年科技基金资助项目(24JRRA266)。

收稿日期 2024-03-18

改稿日期 2024-05-21

作者简介

毛向德 男,1986年生,博士,讲师,研究方向为车载变流器的故障诊断。E-mail: maoxiangde@163.com

董海鹰 男,1966年生,教授,博士生导师,研究方向为工业综合自动化理论与关键技术、复杂系统的分析建模及智能控制理论与应用、新能源发电控制与优化技术、电力系统运行控制、智能系统。E-mail: hydong@mail.lzjtu.cn(通信作者)

(编辑 陈 诚)