基于一维卷积神经网络的低压万能式断路器附件故障诊断

孙曙光1 李 勤1 杜太行1 崔景瑞1 王景芹2

(1. 河北工业大学人工智能与数据科学学院 天津 300130 2. 省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津 300130)

摘要 由于低压万能式断路器分合闸附件的线圈回路采用交流供电方式,因此线圈回路合闸相位的随机性会导致同一运行状态下电流信号存在差异。利用传统的智能故障诊断方法可能会造成电流信号故障特征提取不准确,导致故障识别率降低。针对此问题,提出一种基于第一层宽卷积核自适应一维深度卷积神经网络(AW-1DCNN)的故障诊断算法。相较于传统智能诊断方法中存在人工特征提取与故障分类两个阶段,该方法将两者合二为一。首先,考虑到分合闸线圈电流信号的特点,采用一维卷积神经网络模型,并将模型的第一层卷积层的卷积核设为宽卷积核来扩大感受野区域;然后,利用特征提取层对电流信号进行自适应特征提取;最后,利用Softmax分类器输出故障诊断结果。实验结果表明,该算法不仅能对不同相位下同一故障进行有效识别,而且在泛化实验中仍能保持较高的故障识别率,能够有效地克服合闸相位变化对故障诊断结果的影响。

关键词:万能式断路器 分合闸附件 线圈电流 一维深度卷积神经网络 故障诊断

0 引言

万能式断路器是低压配电系统中的保护和控制设备,其健康状态对配电系统的性能、稳定性有着重要的影响,因此其日常维护也至关重要[1-3]。分合闸附件作为断路器的关键部件,正常工作是断路器可靠运行的关键保证。但是,在断路器长期的运行过程中,分合闸附件往往会出现不同类别的机械故障,影响断路器的正常工作。鉴于此,为提高万能式断路器运行可靠性,对分合闸附件动作过程中可能出现的故障进行有效的监测、分析以及诊断是非常重要的。

在故障诊断中,特征信号的选取是实现诊断目标的前提,在分合闸过程中,断路器分合闸线圈电流信号不仅易于检测,而且含有丰富的机械状态信息,可作为断路器故障诊断的依据。国内外很多专家学者都提出了基于分合闸线圈电流信号来监测和诊断断路器的机械状态,如Razi-kazemi等重点研究了额定电压为72.5kV和24kV断路器的各类故障状态对分合闸线圈电流波形的影响,并提出了相应检测算法,基于分合闸线圈电流分析断路器初始故障模式以及引发原因[4]。孙银山等提出将小波分析与时域求极值点相结合的方法来提取高压断路器分合闸线圈电流信号的特征值,根据提取的特征值完成对断路器的故障判别[5]。杨凌霄等提出将采集到的分合闸线圈电流数据作为概率神经网络的输入,通过Parzen窗口估计法得到类条件概率密度,然后按Bayes决策规则对分合闸电流信号数据进行故障分类[6]。值得关注的是,上述文献中高压断路器分合闸线圈均采用直流供电,不需考虑合闸相位对线圈电流信号特性带来的影响。而与高压断路器分合闸线圈供电方式相比,本文研究的低压万能式断路器的分合闸线圈采用交流供电方式,动作过程中因线圈回路合闸相位不是固定的,应当考虑合闸相位这一影响因素。因此,在实际的低压万能式断路器故障诊断研究当中,对不同相位下线圈电流信号进行分析更具有现实意义。

近年来,机器学习在学术界和工业界发展迅猛,其已成为当前智能故障诊断的主流算法[7]。如文献[8-10]分别基于不同信号处理手段分解提取不同状态的特征向量,作为支持向量机(Support Vector Machine, SVM)的输入向量进行故障分类。文献[11-12]均采用改进的BP神经网络模型来实现故障诊断。这些研究成果都已取得良好的诊断效果,部分成果也应用于实际工程当中。但是,这些智能诊断算法也普遍存在一些难以忽略的弊端,如对原始信号特征提取要求较高,需要人工特征提取和一定的专家知识、泛化能力较差、易产生局部最优解等问题[13]。此外,对于万能式断路器而言,同一故障状态下,线圈回路合闸相位不同导致电流信号波形存在一定的差异。针对这种现象,传统智能故障诊断方法往往会出现故障特征提取不准确,因此需要采取合适的算法来克服这种缺陷。

为解决上述传统智能故障诊断算法的不足,深度学习(Deep Learning, DL)理论为智能故障诊断提供了新思路和行之有效的解决办法[14]。DL是由多层隐含层构建的深层模型,其利用多层网络结构逐层深入地学习原始输入量的抽象信息,以实现故障特征的自动提取[15-17],摆脱了传统诊断算法对人工特征提取和领域内专家知识的依赖。卷积神经网络(Convolutional Neural Network, CNN)是DL中最重要的模型之一,其网络通过局部权值共享极大地减少了网络参数的数量,降低了网络的复杂度,在一定程度上解决了局部最优解的问题[18],且泛化能力较好。一些专家已经将CNN应用到故障诊断研究领域中,并取得了不错的成果。文献[19]提出了基于LeNet-5的卷积神经网络模型用于故障诊断,其基本思想是将原始信号转化为二维灰度图像作为LeNet-5的输入来实现故障诊断。文献[20]将提取的滚动轴承振动信号进行短时傅里叶变换,得到时频谱图作为二维卷积神经网络的输入,实现了故障的分类诊断。以上研究拓宽了CNN在故障诊断领域中的应用范围,但上述方法均是将一维的原始信号转化为二维的图片,利用二维CNN来完成故障诊断,没有最大化地发挥CNN自动学习原始信号特征的优势,限制了故障识别率进一步提高。此外,线圈电流信号作为一维的时域信号,其各个时刻上的数据信息是相互关联的,若直接把线圈电流信号转化为二维的图片形式,则会造成原始电流信号之间的关联性被破坏,导致故障信息丢失。鉴于此,为适应时域信号的处理,同时能够最大化地发挥CNN自动学习原始信号特征的优势,Jian等提出了一维融合神经网络(One-dimensional Fusion NeuralNetwork, OFNN)的故障诊断模型,该方法直接从原始振动信号中自适应提取特征,避免了对人工特征提取的依赖,并成功应用于滚动轴承的故障诊 断[21]

针对上述分析,本文借鉴CNN故障诊断相关研究进展,并根据一维电流信号的特点,在现有的研究基础上,重点研究低压万能式断路器分合闸附件的故障诊断,提出了基于第一层宽卷积核自适应一维深度卷积神经网络(Adaptive one-Dimensional deep Convolutional Neural Networks with Wide first-layer kernel, AW-1DCNN)的低压万能式断路器分合闸附件的智能故障诊断模型。为提高模型自动提取各状态特征的能力,构建第一层卷积层的卷积核为宽卷积核,来获取更多的数据并为深层网络提供更多的有效信息,而深层卷积核为小卷积核可以增强网络的表达能力,从而实现以原始电流数据为输入,以故障诊断结果为输出的自适应诊断模型。并对此方法进行对比实验与泛化实验,以表明所提诊断模型的有效性与优势。

1 卷积神经网络结构

本节主要介绍卷积神经网络的基本结构和相关理论。

卷积神经网络是一种常见的深度学习网络模型,受生物自然视觉认知机制启发而来[22],通过建立多个滤波器提取输入数据的有效表征。这些滤波器对输入数据进行逐层卷积和池化,将高层语义信息层层抽取出来,逐层抽象,最终获得输入数据的平移旋转不变性的特征表示。

一个典型的CNN模型是由输入层、两组交替出现的卷积层和池化层、全连接层组成。其中,卷积层的作用是将输入信号的局部感受域与卷积核进行卷积,每个卷积核提取输入信号局部感受域的局部特征,在激活函数的作用下构建输出特征矢量,每一层的输出特征矢量均为多个输入特征的卷积结果。假设width=31.95,height=17是第width=6.95,height=13层卷积层第width=6.95,height=12个特征面中第width=9,height=13.95个神经元的输出,则width=31.95,height=17的数学表达式为

width=107,height=41 (1)

式中,width=20,height=15为激活函数;width=24.95,height=17为第width=6.95,height=13层第width=9,height=13.95个局部感受域;width=15,height=17为第width=6.95,height=13层第width=6.95,height=12个卷积核的权重矢量;width=11,height=17为第width=6.95,height=13层第width=6.95,height=12个卷积核的偏置;width=31.95,height=17为第width=6.95,height=13层卷积层第width=6.95,height=12个特征面中第width=9,height=13.95个神经元卷积操作的输出值。为避免梯度饱和效应的发生,V. Nair和G. Hinton于2010年将修正线性单元(Rectifield Linear Unit, ReLU)引入神经网络[23]。ReLU函数是目前深度卷积神经网络中最为常用的激活函数之一。

ReLU函数实际上是一个分段函数,其定义为

width=165,height=60.95 (2)

池化层的引入是仿照人的视觉系统对视觉输入对象进行降采样和抽象,其具有特征不变性、减少输入特征的网络参数、在一定程度上防止过拟合等优点。目前,主流的池化方法有最大池化和均值池化,其数学表达式分别为

width=123,height=24 (3)

width=114,height=36 (4)

式中,width=11,height=10为池化区域宽度;width=23,height=17为第width=6.95,height=13层中第width=6.95,height=12个特征面内第width=6.95,height=11个神经元的值;width=33,height=17为第width=19,height=13层神经元对应的值。由式(3)、式(4)可知,最大池化是将每个特征面感受域的最大值作为最终输出;均值池化则输出感受域内元素的平均值。本文的网络结构采用最大池化层。

经过卷积层和池化层之后再连接两个全连接层:第一个全连接层是把所有的特征矢量展成一维向量;第二个全连接层采用Softmax回归分类器解决分类问题。其模型可表述为

width=180,height=67 (5)

式中,width=41,height=15为模型的训练样本;width=13.95,height=11为训练样本总数;width=12,height=11为工作状态类别数;width=42,height=15为指示函数,当括号值为真时,函数值为1,否则函数值为0;width=10,height=12为训练模型的参数集。

2 基于AW-1DCNN的分合闸附件智能故障诊断模型

本节针对低压万能式断路器分合闸附件在动作过程中因线圈回路合闸相位的随机性导致同一状态下的电流波形存在一定的差异问题,提出基于AW- 1DCNN故障诊断模型,该模型通过多个交替的卷积层、批归一化(Batch Normalization, BN)层[24]和池化层完成对原始数据自适应特征学习,结合全连接层中Softmax分类器实现故障分类,同时本节也将对模型样本数据的确定和AW-1DCNN模型训练过程进行详细说明。

2.1 AW-1DCNN算法模型

如引言所述,一些专家已经将CNN应用到智能故障诊断研究领域中,但上述基于CNN模型用于故障诊断只是将CNN用于一维的原始信号转化为二维的图片之后再做进一步处理,并没有利用其强大的自动学习原始信号的能力,缺乏自适应性。本文提出AW-1DCNN模型和上述文献的二维CNN模型存在明显的结构差异,主要区别在于卷积核和每层的特征输出均为一维矢量。采用一维的CNN模型可以保证对原始电流信号的直接处理,完全保留了原始信号中与故障相关的信息,并且可以最大化地发挥其自动学习原始信号特征的能力。

在对低压万能式断路器分合闸附件故障诊断研究中,AW-1DCNN模型卷积核的大小需要根据分合闸线圈电流信号的特点来设计,设在20kHz的采样频率下分合闸附件在一个完整的动作时间内电流数据覆盖的数据点数为103数量级,若AW-1DCNN的卷积核尺寸太小,则会增加网络深度,且卷积操作的过程中时间也会显著增加;若卷积核尺寸太大,则网络结构太简单,学习能力差,不能清晰定位输入信号中的特征,且可能包含过多的冗余信息。为确保卷积核能够充分提取到输入信号的特征,将本文所提模型的第一层卷积层设为宽卷积核,其余各层均设为小卷积核。第一层采用宽卷积核的目的是为了提取短时特征,扩大感受野区域,进而有效地学习面向诊断对象的有用特征,过滤掉无用信息;其余各层均采用小卷积核的目的是为了减少网络的参数、加深网络层数、增强其表达能力,同时可以有效地抑制过拟合。此外为了避免AW-1DCNN模型中间层特征概率分布发生变化的情况,在卷积层与激活层之间加入BN层,使得中间层的特征概率分布变成标准的正态分布,以此来解决深层网络训练可能带来的“梯度弥散/爆炸”的问题,提高模型的训练效率。

BN具体运算步骤如下:假设某一层的输入为width=18,height=10width=82,height=21,共width=9,height=10维,一批样本集合为width=19,height=11 width=60.95,height=20,归一化的公式如下

width=58,height=34 (6)

width=91,height=34 (7)

width=67.95,height=36 (8)

width=85.95,height=17 (9)

式中,width=18,height=15为输入width=10,height=10的第width=9,height=10维;width=15,height=15width=15,height=17分别为样本集合width=11,height=11的平均值与方差;width=18,height=15为对width=18,height=15批归一化后的结果;width=9,height=10为使数值稳定的常数项,其值一般是接近0的正数;width=19,height=17width=20,height=17分别为BN层的缩放与偏置。

本文构建的AW-1DCNN模型结构如图1所示,主要由输入层、特征提取层和输出层组成。输入层为构建的原始线圈电流信号数据集;特征提取层由卷积层、BN层和池化层组成,其中特征提取层的层数可以根据输入信号的复杂度增加或减少,本文AW-1DCNN模型共有6层卷积与池化层,其中每层卷积层与池化层之间都有BN层与激活层;输出层由一个全连接层以及Softmax回归层组成。

2.2 模型输入样本的确定

本文主要研究低压万能式断路器分合闸附件的机械故障。即合闸过程中除正常运行状态外,主要研究铁心卡涩、机械结构卡涩、铁心行程不足和合闸线圈匝数异常变化四种故障状态;分闸过程中除正常运行状态外,主要研究顶杆阻力异常、衔铁行程不足、分闸线圈匝数异常变化三种故障状态。上述九种运行状态的样本数据均由DW15-1600型低压万能式断路器故障实验系统所获取。本文构建的低压万能式断路器分合闸附件故障实验系统的整体结构如图2所示。该实验系统整体运行过程可以简述为:首先由工控机向STM32F103ZET6单片机发送分合闸相位,然后工控机通过ISA总线控制PLC-720+板卡发出储能、合闸、分闸指令,其中储能指令直接对固态继电器进行操作,用以控制断路器储能过程;分合闸指令则作用于STM32F103ZET6单片机,经过给定相位延时后,驱动分合闸开关电路完成相应动作;同时在PCL-720+板卡发出动作指令前,USB7648A数据采集卡已被启动触发,确保可以采集到低压万能式断路器分合闸附件在整个动作过程中的线圈电流信号。

width=382.7,height=183.55

图1 AW-1DCNN模型结构

Fig.1 AW-1DCNN model structure

width=233.55,height=182.6

图2 实验系统结构

Fig.2 Overall structure of experimental system

2.3 AW-1DCNN模型的训练

本文采用交叉熵损失函数来计算预测结果与真实值之间的误差。其表达式为

width=153,height=32.15 (10)

式中,m为输入小批量的大小;j为目标类别;P为样本的真实值;Q为模型输出的预测结果。

在AW-1DCNN模型的训练阶段,采用Adam[25]优化算法更新权值,Adam优化算法是随机梯度下降算法的扩展式,它与传统的随机梯度下降算法不同,传统的随机梯度下降算法只保持单一的学习率更新所有的权重,学习率在训练过程中并不会改变,而Adam优化算法通过计算梯度的一阶和二阶矩估计为不同的参数设计独立的自适应性学习率,使得每次的学习率都在稳定的范围内。由于Adam算法对超参数具有较强的鲁棒性,所以是深度学习领域中广泛使用的优化器。本文将Adam优化算法的学习率设为0.001。

2.4 基于AW-1DCNN的故障诊断流程

综合2.1~2.3节的分析,可得出本文建立的AW- 1DCNN低压万能式断路器分合闸附件故障诊断算法流程如图3所示,故障诊断方法具体步骤如下:

(1)将不同合闸相位下不同状态的所有电流信号样本采用均值滤波算法进行预处理,同时分为训练样本和测试样本。

(2)建立AW-1DCNN模型并确定AW-1DCNN模型参数,初始化AW-1DCNN模型的权值和偏置。

(3)输入训练样本,进行AW-1DCNN训练学习,通过前向传播求得AW-1DCNN模型输出与预期目标的误差。

(4)判断AW-1DCNN模型是否收敛,若AW- 1DCNN模型收敛,则执行步骤(6),否则执行步骤(5)。

width=197.3,height=311.5

图3 基于AW-1DCNN的故障诊断流程

Fig.3 Flow chart of fault diagnosis based on AW-1DCNN

(5)反向传播和权值优化,利用BP反向传播算法,将步骤(3)求得的误差反向逐层分配到每个节点,并更新权值,重复执行步骤(3)~(5),直至AW-1DCNN模型收敛。

(6)将测试样本作为输入,根据测试样本的准确率判断AW-1DCNN模型是否满足实际诊断要求,如满足,执行步骤(7),否则跳转到步骤(2),重新建立网络模型参数。

(7)将AW-1DCNN模型输出用于低压万能式断路器分合闸附件智能故障诊断。

3 分合闸附件故障诊断实验验证

本节将首先针对低压万能式断路器分合闸附件实测的线圈电流信号,验证所提算法的可行性和有效性,再通过对比实验,讨论该算法相较于其他算法的优势,最后通过泛化实验进一步证明所提算法的泛化性能和聚类能力。

3.1 故障模拟方式与数据样本集

本文数据来自于DW15-1600型低压万能式断路器分合闸附件的模拟故障实测结果。为避免数据样本偏斜,同时又能保证一定数量的样本,需对分合闸附件进行多次故障模拟实验。分合闸附件故障模拟方式见表1。

表1 分合闸附件故障模拟方式

Tab.1 Fault simulation mode of switching accessories

故障类型故障模拟方式 铁心卡涩铁心轴部与线圈间塞入细铁丝 机械结构卡涩滑动连杆椭圆空间内塞入小木棒 铁心行程不足动铁心顶部加适量的橡胶垫 合闸线圈匝数异常变化人为减少合闸线圈匝数 顶杆阻力异常利用弹性绳拴住顶杆推片 衔铁行程不足分闸电磁衔铁上粘贴硬纸片 分闸线圈匝数异常变化人为减少分闸线圈匝数

实验过程中采集分合闸线圈电流信号数据构成数据集,为实现不同相位下进行分合闸附件故障诊断的目的,本文在0°~180°的线圈回路合闸相位范围内,模拟0°、30°、60°、90°、120°、150°、180°相位下的各类工作状态。数据采集卡的采样频率为20kHz,采样时间为100ms,即每个线圈电流波形包含2 000个数据点。实验记录的不同相位下正常状态时的合、分闸线圈电流波形如图4所示。从图4中可以看出,合分闸附件在运行状态相同、合分闸相位不同时的合闸线圈电流波形、分闸线圈电流波形具有明显的区别。主要为不同相位下电流波形的首个波峰或波谷的幅值与波形持续时间均存在较大差异,说明不同的相位对电流信号特征具有一定影响。此外,对每个相位下九种工作状态各采集20组样本,共采集1 260组样本,且样本长度为2 000。表2是低压万能式断路器分合闸附件不同工作状态的信号样本信息及其对应的类别标记。

3.2 AW-1DCNN模型参数

在AW-1DCNN模型的构建中,合适的模型参数不仅可以保证较高的分类正确率,还能加快模型的训练速度。本文根据一维线圈电流信号的特点,并结合卷积核尺寸大小的一些基本的设计准则[26-27]来确定AW-1DCNN模型的参数。第一层卷积层的卷积核尺寸为宽卷积核,深度卷积神经网络的参数选择的设计准则为

width=220.4,height=416.35

图4 不同相位下正常状态时合、分闸线圈电流波形

Fig.4 Current waveforms of switching coil at normal state for different phase angles

表2 实验样本组成

Tab.2 Composition of experimental samples

工作状态(0°~180°)样本长度样本数目类别标记 正常合闸2 0007×200 铁心卡涩2 0007×201 机械结构卡涩2 0007×202 铁心行程不足2 0007×203 合闸线圈匝数异常变化2 0007×204 正常分闸2 0007×205 顶杆阻力异常2 0007×206 衔铁行程不足2 0007×207 分闸线圈匝数异常变化2 0007×208

width=143,height=17 (11)

式中,width=18,height=15为第1个卷积层的步长;width=12,height=12为卷积层的层数;width=10,height=11为输入的线圈电流信号样本的长度,即L=2 000;width=10,height=11为低压万能式断路器合分闸附件动作持续时间内霍尔电流传感器采集的数据点数;width=31,height=17为第1个卷积层的步长必须能够整除输入样本的长度。根据图4中合、分闸线圈电流波形可知,合分闸附件完整动作最长用时约为60ms,故T≈1 200。本文有6层卷积层,所以第一层卷积层的卷积步长只能为10。尽管本文参照了相关文献的参数设计准则,但在实际应用中仍需要进一步调试,得到合适的参数值。

根据上述的准则设计AW-1DCNN,并通过反复实验调整相关参数,最终得到的网络模型结构参数见表3。设计的AW-1DCNN模型第一层卷积核尺寸为width=24.95,height=12,其余各层均采用较小的卷积核,本文使用的网络模型不仅增大了模型输入的感受野区域,提高了输入信息量,同时也加深了网络结构,增强了网络的表达能力。

表3 AW-1DCNN的网络模型结构参数

Tab.3 Network model parameters of AW-1DCNN

编号网络结构网络名称卷积核大小步长卷积核数目 1卷积层Conv164×110×132 最大池层2×12×132 2卷积层Conv216×11×132 最大池层2×12×132 3卷积层Conv33×11×132 最大池层2×12×132 4卷积层Conv43×11×132 最大池层2×12×132 5卷积层Conv53×11×132 最大池层2×12×132 6卷积层Conv63×11×164 最大池层2×12×164 7全连接层FC1节点数:300激活函数:ReLU 8SoftmaxFC2输出节点数:9激活函数:Softmax

3.3 实验结果及分析

本文模型建立在Keras深度学习库中,编程语言为Python,计算机配置为Inter(R) Celeron(R) CPU 1007U@1.50GHz,内存为8GB。在训练AW-1DCNN模型时,以0°、30°、60°、90°、120°、150°、180°相位下的各类工作状态总样本数为本节数据集,分别选择该数据集中各类工作状态的30%、40%、50%,60%、70%、80%的样本用于模型的训练,其余样本用于模型的测试,并观察数据增强是否对模型诊断能力有影响。为了测试模型诊断的稳定性,每个实验重复进行20次。各次实验的识别率如图5所示,平均识别率如图6所示。从图5、图6中可以看出当训练样本比例增加时,各次测试集的识别率曲线越来越趋于平滑,且20次实验标准差也越来越小,即AW-1DCNN模型故障诊断的平均识别率和稳定性随训练样本比例的增加逐渐升高。当训练样本比例为30%时,故障诊断的平均识别率只有89.51%;而当训练样本比例达到80%时,故障诊断的平均识别率达到了98.88%,这说明训练样本的数量对AW-1DCNN的诊断能力有很大影响。此外,本文采集的总样本量只有1 260组,说明AW-1DCNN可以有效地实现小样本下的故障诊断。

width=222.2,height=204.7

图5 不同比例训练样本下各次测试识别率

Fig.5 Different test recognition rates at different proportions of training samples

width=217.55,height=155.75

图6 不同比例训练样本下AW-1DCNN对测试集的平均识别率

Fig.6 Average recognition rate of AW-1DCNN to test datasets at different proportions of training sampless

为了更加直观地分析模型在测试集中各类别的识别结果,引入混淆矩阵对80%训练样本下的测试集的实验结果进行详细分析。测试样本识别结果如图7所示,该混淆矩阵是从20次重复实验中随机选取的一次实验结果。从图7可以看出,该次的实验结果除正常分闸和分闸时衔铁行程不足外,其余7种状态都能达到100%的识别率,且9种状态的平均识别率达到了98.81%。表明AW-1DCNN具有较强的诊断能力。

width=194.9,height=196.45

图7 测试样本识别结果

Fig.7 Identification results of test samples

上述诊断过程主要针对每种状态的训练样本和测试样本均为同一比例来验证本文所提模型的诊断效果,现考虑若存在训练和测试样本比例不一致的情况,本文所提模型是否仍能达到较好的诊断效果。从图7混淆矩阵可以看出,除正常分闸和分闸时衔铁行程不足外,其余状态都能达到100%的识别率。现将这两种状态的训练样本量增加到每种状态样本总量的85%,其余状态的训练样本量为每种状态样本总量的70%,测试样本为每种状态的剩余样本。训练与测试样本比例不同测试识别结果如图8所示。结果表明,AW-1DCNN整体的故障识别率呈微弱下降趋势,但综合识别率仍能达到98.41%。主要表现在正常合闸以及合闸时铁心行程不足的识别率略微下降,而正常分闸和分闸时衔铁行程不足的识别率有所提高。表明AW-1DCNN可以很好地应对不同状态的训练样本与测试样本比例不同的情况,且进一步证明训练样本的数量的增加会提高AW-1DCNN的故障识别率。

3.4 对比实验

为了对比本文提出的算法与目前主流的两种传统故障诊断算法以及当下两种较为常用的深度学习故障诊断算法的优劣,采用BPNN、文献[1]中诊断算法、长短时记忆(Long Short-Term Memory, LSTM)神经网络和一维卷积神经网络(1-Dimensional Con- volutional Neural Network, 1DCNN)四种算法进行实验,为避免实验结果的偶然性,每种算法重复实验20次,实验结果由20次重复实验结果的平均值来表示。且以0°、30°、60°、90°、120°、150°、180°相位下的各类工作状态总样本数为本节对比实验的数据集,选择该数据样本中各类工作状态的80%的样本用于模型的训练,其余样本用于模型的测试。其中每种诊断算法的参数设置如下:

width=198.5,height=195.85

图8 训练与测试样本比例不同测试识别结果

Fig.8 Test recognition results at the different proportion of training and test samples

(1)BPNN:以原始线圈电流数据作为输入,中间1个隐含层,隐含层节点数为50。

(2)文献[1]中的故障诊断算法:多核学习支持向量机(Multiple-Kernel Learning Support Vector Machine,MKL-SVM)。

(3)LSTM:以原始线圈电流数据作为输入,其网络结构为2000-16-32-64-9。

(4)标准1DCNN:以原始线圈电流数据作为输入,其网络结构为2000-c1(16)-s1(2)-c2(32)-s2(2)- c3(64)-s3(2)-100-9。

不同诊断算法实验结果如图9所示。由图9可以看出,本文提出的算法明显优于基于浅层网络结构的BPNN和MKL-SVM两种传统智能故障诊断算法。而与LSTM和1DCNN这两种深度学习算法相比,基于AW-1DCNN模型具有更高的识别率。同时,本文算法模型标准差值和其余四种算法相比,标准差值更小,进一步说明模型具有较好的稳定性。

3.5 泛化实验

由于万能式断路器线圈回路合闸相位的随机性,导致同种状态下的电流波形存在较大差异,但上述实验结果证明AW-1DCNN仍能将其成功识别为同种状态类型,体现出AW-1DCNN的较强泛化能力和聚类能力。

width=233.45,height=163.3

图9 不同诊断算法实验结果

Fig.9 Experimental results of different diagnosis algorithms

为进一步验证模型的泛化能力,本文又分别设计三种不同的数据集进行分析研究。

(1)本文以120°合闸相位下各类工作状态为例,在原有的180组样本的基础上,又分别对9种状态各采集60组样本,共采集720组样本作为训练集,以180°相位下的各类工作状态的180组样本作为模型的测试集,构成数据集A

(2)以0°、30°、60°、90°、120°、150°相位下的各类工作状态的1 080组样本作为模型的训练集,以180°相位下的各类工作状态的180组样本作为模型的测试集,构成数据集B

(3)以0°、30°、60°、90°、120°、150°、180°相位下的各类工作状态的1 260组样本作为模型的训练集,同时在0°~180°的线圈回路合闸相位范围内又采集了15°、45°、75°、105°、135°和165°相位下对应的9种状态样本,其中对每个相位下9种工作状态各采集5组测试样本,共采集270组测试样本作为测试集,构成数据集C

三种数据集的泛化实验结果如图10所示。从图10中可以看出,新的数据集在AW-1DCNN模型上的故障识别率分别为95.56%、98.33%、98.52%,测试结果仍能保持较高的识别率,表明了该算法可以很好地应对线圈回路合闸相位随机性的情况,对万能式断路器合分闸附件发生故障时的快速定位具有很好的应用价值。

除此之外,本文又将设计的3种新的数据集用于3.4节对比实验的五种诊断模型中,为避免实验结果的偶然性,本节对每种模型重复10次实验,取10次诊断结果的平均值作为这5种算法的评价指标。实验结果见表4。从表4可以看出,传统的浅层网络模型的故障识别率与深度学习模型的故障识别率相比具有很大差距,特别是数据集A,识别率的下降程度尤为明显。3个数据集在LSTM模型虽然均达到了80%以上的识别率,但对比两种基于CNN的模型可以看出,基于CNN的模型具有较高的故障识别率,且采用AW-1DCNN模型和标准的1DCNN模型相比,AW-1DCNN模型的故障识别率更高。进一步证明了本文所提算法的泛化性能更好,且能够有效地克服低压万能式断路器合闸相位的随机性导致同种状态下的线圈电流波形特征变化的影响。

width=205.8,height=431.6

width=205.8,height=216.6

图10 泛化实验结果

Fig.10 Generalization experimental results

表4 5种诊断算法的泛化性能实验结果

Tab.4 Experimental results of generalization performance for five diagnostic algorithms

算法识别率(%) ABC BPNN60.0468.2775.44 MKL-SVM65.2971.4180.63 LSTM81.3285.0290.05 1DCNN86.2389.4192.15 AW-1DCNN95.3198.2798.55

4 结论

本文针对低压万能式断路器合分闸附件主要机械故障,同时考虑到不同相位对线圈电流的影响,提出了基于第一层宽卷积核自适应一维深度卷积神经网络的故障诊断算法,通过与传统智能故障诊断方法以及现有深度学习算法相比,结果表明:

1)AW-1DCNN算法不需要依赖人工特征提取和专家知识,实现了对原始电流信号故障特征的自适应提取,降低了故障诊断的操作难度,提高了故障诊断结果的准确度。

2)AW-1DCNN算法是标准1DCNN算法的改进,其在保留原方法强大的非线性特征自学习能力的同时将模型的第一层卷积层的卷积核设为宽卷积核,提高了模型提取原始输入信号故障特征的能力,有效地实现了小样本下的故障识别。

3)AW-1DCNN算法具有较强的泛化能力,通过设计不同的实验数据集,故障诊断识别率均达到了95%以上,充分证明了该算法能够很好地克服线圈回路合闸相位随机性的问题,故障识别率远优于BPNN和MKL-SVM这两种传统智能故障诊断算法,且与LSTM和标准的1DCNN相比,诊断结果也更加优异,且模型的稳定性更高。

考虑到目前只是针对一种型号的断路器进行分析研究,在后续的研究中,将对不同型号的断路器进行进一步的分析,从而使算法的泛化性能得到更高的提升;同时万能式断路器作为在线运行的低压配电器,后续工作中应考虑如何实现万能式断路器的在线诊断问题;此外,还应在复杂的应用场合中验证所提算法的可扩展性。

参考文献

[1] 孙曙光, 张强, 杜太行, 等. 基于分合闸线圈电流的万能式断路器故障诊断[J]. 仪器仪表学报, 2018, 39(2): 130-140.

Sun Shuguang, Zhang Qiang, Du Taihang, et al. Fault diagnosis for conventional circuit breaker based on switching coil current[J]. Chinese Journal of Scientific Instrument, 2018, 39(2): 130-140.

[2] 程学珍, 朱晓林, 杜彦镔, 等. 基于神经模糊Petri网的高压断路器故障诊断研究[J]. 电工技术学报, 2018, 33(11): 2535-2544.

Cheng Xuezhen, Zhu Xiaolin, Du Yanbin, et al. High voltage circuit breaker fault diagnosis based on neural fuzzy Petri nets[J]. Transactions of China Electrotechnical Society, 2018, 33(11): 2535-2544.

[3] 孙曙光, 于晗, 杜太行, 等. 基于振动信号样本熵和相关向量机的万能式断路器分合闸故障诊断[J]. 电工技术学报, 2017, 32(7): 20-30.

Sun Shuguang, Yu Han, Du Taihang, et al. Diagnisis on the switching fault of conventional circuit breaker based on vibration signal sample entropy and relevance vector machine[J]. Transactions of China Electrotechnical Society, 2017, 32(7): 20-30.

[4] Razi-Kazemi A A, Vakilian M, Niayesh K, et al. Circuit-breaker automated failure tracking based on coil current signature[J]. IEEE Transactions on Power Delivery, 2014, 29(1): 283-290.

[5] 孙银山, 张文涛, 张一茗, 等. 高压断路器分合闸线圈电流信号特征提取与故障判别方法研究[J]. 高压电器, 2015, 51(9): 134-139.

Sun Yinshan, Zhang Wentao, Zhang Yiming, et al. Research on feature value extraction and fault recognition of coil current signal in high-voltage circuit breaker[J]. High Voltage Apparatus, 2015, 51(9): 134-139.

[6] 杨凌霄, 朱亚丽. 基于概率神经网络的高压断路器故障诊断[J]. 电力系统保护与控制, 2015, 43(10): 62-67.

Yang Lingxiao, Zhu Yali. High voltage circuit breaker fault diagnosis of probabilistic neural network[J]. Power System Protection and Control, 2015, 43(10): 62-67.

[7] 余路, 曲建岭, 高峰, 等. 基于改进稀疏编码的微弱振动信号特征提取算法[J]. 仪器仪表学报, 2017, 38(3): 711-717.

Yu Lu, Qu Jianling, Gao Feng, et al. Feature extraction of weak vibration signal based on improved sparse coding[J]. Chinese Journal of Scientific Instrument, 2017, 38(3): 711-717.

[8] 杨凯, 张认成, 杨建红, 等. 基于分形维数和支持向量机的串联电弧故障诊断方法[J]. 电工技术学报, 2016, 31(2): 70-77.

Yang Kai, Zhang Rencheng, Yang Jianhong, et al. Series arc fault diagnostic method based on fractal dimension and support vector machine[J]. Transa- ctions of China Electrotechnical Society, 2016, 31(2): 70-77.

[9] 赵书涛, 张佩, 申路, 等. 高压断路器振声联合故障诊断方法[J]. 电工技术学报, 2014, 29(7): 216- 221.

Zhao Shutao, Zhang Pei, Shen Lu, et al. Vibration and acoustic joint mechanical fault diagnosis method of high voltage circuit breakers[J]. Transactions of China Electrotechnical Society, 2014, 29(7): 216-221.

[10] Wen Jin, Wen Hutang, Tong Qin, et al. Fault diagnosis of high-voltage circuit breakers using wavelet packet technique and support vector machine[J]. CIRE-Open Access Proceedings Journal, 2017, 2017(1): 170-174.

[11] 史丽萍, 汤家升, 王攀攀, 等. 采用最优小波树和改进BP神经网络的感应电动机定子故障诊断[J]. 电工技术学报, 2015, 30(24): 38-45.

Shi Liping, Tang Jiasheng, Wang Panpan, et al. Stator fault diagnosis of induction motors using the optimal wavelet tree and improved BP neural net[J]. Transactions of China Electrotechnical Society, 2015, 30(24): 38-45.

[12] Ali J B, Fnaiech N, Saidi L, et al. Application of empirical mode decomposition and artificial neural network for automatic bearing fault diagnosis based on vibration signals[J]. Applied Acoustics, 2015, 89(3): 16-27.

[13] 曲建岭, 余路, 袁涛, 等. 基于一维卷积神经网络的滚动轴承自适应故障诊断算法[J]. 仪器仪表学报, 2018, 39(7): 134-143.

Qu Jianling, Yu Lu, Yuan Tao, et al. Adaptive fault diagnosis algorithm for rolling bearings based on one-dimensional convolutional neural network[J]. Chinese Journal of Scientific Instrument, 2018, 39(7): 134-143.

[14] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.

[15] 任浩, 屈剑锋, 柴毅, 等. 深度学习在故障诊断领域中的研究现状与挑战[J]. 控制与决策, 2017, 32(8): 1345-1358.

Ren Hao, Qu Jianfeng, Chai Yi, et al. Deep learning for fault diagnosis: the state of the art and challenge[J]. Control and Decision, 2017, 32(8): 1345-1358.

[16] Jia Feng, Lei Yaguo, Lin Jing, et al. Deep neural networks: a promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data[J]. Mechanical Systems and Signal Processing, 2016, 9(1): 161-171.

[17] 刘辉海, 赵星宇, 赵洪山, 等. 基于深度自编码网络模型的风电机组齿轮箱故障检测[J]. 电工技术学报, 2017, 32(17): 156-163.

Liu Huihai, Zhao Xingyu, Zhao Hongshan, et al. Fault detection of wind turbine gearbox based on deep autoencoder network[J]. Transactions of China Electrotechnical Society, 2017, 32(17): 156-163.

[18] Li Zhouhang, Wu Yuxin, Tang Guoli, et al. Com- parison between heat transfer to supercritical water in a smooth tube and in an internally ribbed tube[J]. International Journal of Heat & Mass Transfer, 2015, 84: 529-541.

[19] Long Wen, Xing Yuli, Liang Gao, et al. A new convolutional neural network-based data-driven fault diagnosis method[J]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5990-5998.

[20] 李恒, 张氢, 秦仙蓉, 等. 基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J]. 振动与冲击, 2018, 37(19): 124-131.

Li Heng, Zhang Qing, Qin Xianrong, et al. Fault diagnosis method for rolling bearing based on short-time fourier transform and convolution neural network[J]. Journal of Vibration and Shock, 2018, 37(19): 124-131.

[21] Jian Xianzhong, Li Wenlong, Guo Xuguang, et al. Fault diagnosis of motor bearings based on a one- dimensional fusion neural network[J]. Sensors, 2019, 19(1): 122.

[22] Hubel D H, Wisesl T N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex[J]. Journal of Physiology, 1962, 160(1): 106-154.

[23] Nair V, Hinton G. Rectified linear units improve restricted boltzmann machines[C]//Proceedings of the 27th International Conference on Machine Learning (ICML), Haifa, 2010: 807-814.

[24] Ioffe S, Szegedy C. Batch normalization: Acce- lerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd Inter- national Conference on Machine Learning, Lille, France, 2015: 448-456.

[25] Kingma D P, Ba J. Adam: a method for stochastic optimization[J]. International Conference on Learning Representations, California, San Diego, USA, 2014.

[26] Zhang Wei, Peng Gaoliang, Li Chuanhao, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals[J]. Sensors, 2017, 17(2): 425.

[27] Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the inception architecture for computer vision[C]// Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA, 2016: 2818-2826.

Fault Diagnosis of Accessories for the Low Voltage Conventional Circuit Breaker Based on One-Dimensional Convolutional Neural Network

Sun Shuguang1 Li Qin1 Du Taihang1 Cui Jingrui1 Wang Jingqin2

(1. School of Artificial Intelligence Hebei University of Technology Tianjin 300130 China 2. State Key Laboratory of Reliability and Intelligence of Electrical Equipment Hebei University of Technology Tianjin 300130 China)

Abstract Since AC power supply is adopted in the coil circuit of switching accessories for low voltage conventional circuit breaker, the randomness of the closing phase angle of the coil circuit may cause the difference of current signals under the same operating state. Using the traditional intelligent fault diagnosis method may lead to inaccurate fault feature extraction of current signal, and then result in lower fault identification rate. To solve this problem, an intelligent fault diagnosis algorithm based on adaptive one-dimensional deep convolutional neural network with wide first-layer kernel (AW-1DCNN) is proposed. Compared with the traditional intelligent fault diagnosis method including two stages of manual feature extraction and fault classification, the proposed method combines these two stages into one. Firstly, considering the characteristics of the current signal of the switching coil, a one-dimensional convolutional neural network model is adopted, and the convolution kernel for the first convolutional layer of the model is set as a wide convolution kernel to expand the receptive region. Secondly, the feature extraction layer is used to complete the adaptive feature extraction of the current signal. Finally, the fault diagnosis results are output by the Softmax classifier. The experimental results demonstrate that the proposed algorithm can not only effectively identify the same fault at different phase angles, but also maintain a high fault identification rate in the generalization experiment, which effectively overcomes the influence of closing phase angle on fault diagnosis results.

keywords:Conventional circuit breaker, switching accessories, coil current, one-dimensional deep convolutional neural network, fault diagnosis

中图分类号:TM561

DOI: 10.19595/j.cnki.1000-6753.tces.190453

河北省教育厅科研资助项目(ZD2016108)。

收稿日期 2019-04-22

改稿日期 2019-07-04

作者简介

孙曙光 男,1979年生,副教授,研究方向为智能检测与故障诊断。E-mail: sunshuguang_2000@163.com(通信作者)

李 勤 女,1993年生,硕士研究生,研究方向为检测技术与自动化装置。E-mail: 1612282815@qq.com

(编辑 陈 诚)