深度子领域自适应网络电机滚动轴承跨工况故障诊断

宋向金 孙文举 刘国海 赵文祥 王照伟

(江苏大学电气信息工程学院 镇江 212013)

摘要 针对实际生产中旋转机械工况变化引起状态监测数据分布差异及获取待诊断样本标签困难问题,提出多尺度子领域自适应模型(MSDAM)的跨工况下滚动轴承故障诊断方法。首先,以原始振动信号作为输入,无需信号预处理及人工特征参数提取;其次,搭建多尺度卷积神经网络将已知标签样本和待诊断样本特征迁移到同一子空间,捕获具有细粒度信息的多尺度公共特征;然后,以不同的故障类型来划分相关子域,并通过局部最大均值距离(LMMD)来完成子域的适配,有效削弱不同工况同类故障特征的分布差异;最后,在三个数据集的多个迁移任务上进行试验验证。结果证明,所提MSDAM的跨工况故障诊断性能优于关注全局领域适配的迁移学习方法。

关键词:轴承故障诊断 子领域自适应 迁移学习 软标签学习

0 引言

滚动轴承是支撑电机转子旋转的关键部件,其内外圈存在相对运行工况,并且同时承受径向和轴向的联合负荷作用,这种长期复杂的工作环境导致其极易损坏。据相关统计,40%左右的电机故障是由轴承失效引起的[1],因此对轴承运行状态进行故障诊断是非常必要的。

基于传统深度神经网络的轴承故障诊断方法[2-4]若要获得良好分类效果往往需要大规模且高质量的标注样本,并且假设训练集和测试集数据服从相同的概率分布。然而,实际工业应用中标记样本严重稀缺,且标注大规模样本将产生昂贵的标注成本。此外,由于供电系统电压波动、周围环境温度变化、负载变化等因素,训练数据所在工况往往和测试数据所在工况存在波动,进而造成数据集分布差异。深度学习本质就是学习数据的概率分布,当训练集和测试集数据分布不一致时,模型的泛化能力也大大降低。

近些年,基于特征迁移学习的跨工况轴承故障诊断方法取得了长足的发展,其基本思想是在特征提取层和分类层之间引入自适配层,减小训练集(又称源域)和测试集(又称目标域)的数据分布差异,将相关源域的知识迁移到目标域,以提高模型的泛化能力[5-6]。文献[7]采用微调迁移参数的方法,保存在源域上训练的卷积层参数,再使用目标域数据微调模型顶层参数以提取域不变特征,进而使模型适应目标域。文献[8]在迁移模型参数的基础上,引入对抗性思想对齐源域数据和目标域数据之间的边缘分布,从而提取域不变特征。文献[9-10]使用一种非参数深度度量方法最大均值距离(Maximum Mean Discrepancy, MMD),实现源域和目标域的自适应。文献[11]通过使用有限元法获得仿真信号,然后使用基于对抗的领域自适应方法减小仿真信号和真实测量信号之间的差距,从而克服了跨域诊断时训练样本不足和不完整的问题。文献[12]结合非参数度量MMD和基于对抗的方法进一步挖掘数据的域不变特征。上述方法利用迁移学习策略进行跨域故障诊断取得了较好的效果,但只关注对齐源域和目标域的边缘分布,并未考虑两域中各个子域(相同类别的样本组成的子集)之间的分布关系,导致子域之间发生混乱,造成模型对一些样本的误分类。文献[13]研究了子领域自适应,使用MMD对齐数据的边缘分布并利用多个领域鉴别器对齐数据的条件分布,但这种对抗性训练包含多个损失函数,存在收敛速度缓慢的问题。文献[14]将一维振动信号经过连续小波变换生成二维时频图集,输入二维卷积神经网络提取深度特征,并对齐子领域的分布以实现领域自适应。文献[15]将声发射信号经傅里叶变换转换为频谱数据作为一维卷积神经网络的输入,利用局部最大均值距离(Local Maximum Mean Discrepancy, LMMD)适配两领域的子领域,实现了轴承复合故障诊断。然而,上述方法所用的网络模型只能提取单一尺度的特征,无法提取具有更多细粒度信息的多尺度特征。

综上所述,本文提出多尺度子领域自适应模型(Multiscale Sub Domain Adaptive Model, MSDAM)的不同工况下滚动轴承故障诊断方法。无需信号预处理及人工特征参数提取,采用多尺度残差卷积神经网络直接处理原始振动信号,自动学习故障敏感特征,捕获具有细粒度信息的多尺度公共特征。通过已有的源域标签和计算的目标域软标签,计算两领域特征局部最大差异,以匹配条件分布距离,实现子领域自适应,有效削弱不同工况同类故障特征分布差异,从而增强模型的泛化能力,实现跨工况滚动轴承故障分类。

1 理论介绍

1.1 问题描述

在无监督域适应中,定义带有标签的源域数据集width=69.05,height=22.65,其中,ns为源域标记样本数量,width=11.6,height=15.7为源域第i个样本,width=12.75,height=15.7为其对应故障类型标签,且width=34.85,height=15.7RC为标签空间,C为故障类别数量;定义无标签的目标域数据集width=56.9,height=24.95nt为目标域未标记样本数量,width=11.6,height=16.85为目标域中的第j个样本。假设源域数据Ds和目标域数据Dt具有相同的特征空间和标签空间,但是二者分别服从不同的数据概率分布pq,且pq。本文旨在利用深度领域自适应模型,将相关度量领域间分布差异性指标添加到神经网络的损失函数中,通过深度模型优越的特征自动提取能力,将源域和目标域的样本特征映射到一个公共特征空间,在该空间对两域的数据分布进行对齐。同时,针对目标域无标签的情况,借助源域数据训练好的分类器获得目标域软标签,运用新的公共故障特征训练目标域分类器,从而提升模型对目标域故障类型的识别能力。

1.2 子领域自适应

在跨工况轴承故障诊断中,数据分布在两个不同的数据集,经过领域自适应模型被映射到一个公共特征空间,并在这个公共特征空间上对齐高层特征的边缘分布,从而减小源域和目标域的数据分布差异,如图1a所示。但全局域自适应仅关注对齐两领域边缘分布,而不考虑两领域的相关子域之间的关系,致使迁移性能不理想。与全局域自适应相比,子领域自适应侧重于更加精确地对齐相关子领域的分布,源域和目标域子领域条件分布对齐的状态下,两域的边缘分布在自适应之后也彼此接近。图1b表示经过子领域自适应后,两领域中的相同子域被对齐,不同子域被区分开,此时两领域整体的数据分布也被对齐。因此,采用子领域自适应,可以削弱工况变化引起的数据分布差异,有效提高跨工况故障诊断的精度。

width=225,height=93.75

图1 领域自适应示意图

Fig.1 Schematic graph of domain adaptive graph

1.3 最大均值距离

最大均值距离(MMD)[16]是一种双样本检验方式,它根据对两样本检验来决定是否接受概率分布p=q。定义d2(p,q)表示两个概率分布pq之间的最大均值差异,如果d2(p,q)=0,则表示p=q

MMD是迁移学习领域自适应中使用最为广泛的一种损失函数[17],作为一种估计两分布距离的非参数计算方式,主要用来度量源域数据和目标域数据间分布的差异性。在实际应用中,为了计算方便,通常采用MMD的二次方形式,源域width=22.65,height=15.75width=30.85,height=17.15和目标域width=15.1,height=15.75={xt,l j}nt j=1之间的MMD二次方形式可表示为

width=207.1,height=35.65

width=215.3,height=61.05

式中,l为网络层的名称,l=0, 1, 2,width=11.65,height=8.25, LH为可再生希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS);||·||2 H为RKHS中的2-范数运算;width=18.5,height=15.1Xl s, Xl t→H为原始特征空间到RKHS的映射函数;kl(·,·)为高斯核函数,即

width=135.75,height=40.45 (2)

式中,width=9.6,height=9.6为核函数的宽度。

1.4 局部最大均值距离

虽然基于MMD的深度领域自适应[18-20]通过削减源域和目标域样本特征边缘概率分布的距离,可以达到降低源域和目标域样本特征整体差异性的目的,但由于其主要关注源域和目标域的全局分布对齐,而忽略了两领域中各个子域的相关性,导致子域之间分布间距较小,造成模型对一些样本的误分类。采用同时适配边缘分布和条件分布的方法,可以获得更好的迁移效果。子领域自适应不仅可以减小源域和目标域的条件分布差异,而且可以对二者的边缘分布进行适配。因此,针对子领域自适应,本文通过最小化源域和目标域样本特征之间条件分布的LMMD,进一步增强模型的泛化能力。采用LMMD作为分布差异度量,则源域特征width=52.8,height=21.25和目标域特征width=54.85,height=23.3之间的分布距离可表示为

width=187.9,height=39.1 (3)

式中,width=15.75,height=15.75wtc j分别为样本width=11.65,height=15.75xt j属于故障类别c的权重值,并且width=41.85,height=30.15width=40.45,height=31.55,被映射后属于类别c的样本加权和。权重值width=14.4,height=15.75通过式(4)计算。

width=63.75,height=39.75 (4)

式中,width=13.05,height=15.75为向量width=13.05,height=15.75的第c个元素。

在源域中,width=13.05,height=15.75就是源域数据的one_hot标签向量width=13.05,height=15.75,通过式(4)可直接计算得到源域样本的权重width=15.75,height=15.75。由于目标域样本无标注,无法使用目标域标签向量计算每个样本的权重。但注意到,样本width=10.95,height=15.75输入到深度神经网络得到的输出width=11.65,height=15.75表示width=10.95,height=15.75属于C中某一故障类型的概率向量,同时,为降低错误预测带来的影响,网络预测模型标签采用软预测方式,因此,使用网络预测标签width=11.65,height=15.75作为目标域的软标签计算得到目标域样本的权重width=15.75,height=15.75。最终,源域特征和目标域特征之间的LMMD可重新表示为

width=219.45,height=65.15

式中,width=50.75,height=17.15Zl t={zt,l j}ntj=1为神经网络从源域和目标域数据中提取的深度特征。

1.5 多尺度残差卷积

在跨域故障诊断中,由于轴承工作条件发生变化,为了更好地促进学习迁移,一般使用深度卷积网络提取隐藏在数据深处的通用特征[21-22],削弱工况变化带来的影响。然而,研究发现随着网络深度增加,网络性能会发生退化,使用直接映射连接网络不同层的残差网络[23]可以有效抑制网络性能下降。此外,在传统卷积神经网络中,输入信号只能以固定尺度被分析,在跨域诊断中需要匹配源域和目标域的深度特征,被匹配的特征越丰富,网络的适应能力就会越强。因此,本文采用多尺度残差卷积神经网络作为故障特征提取器,无需信号预处理及人工特征参数提取,自动学习振动信号中故障敏感特征,以获得具有更多细粒度信息的多尺度特征。多尺度残差卷积神经网络主要由三个具有不同卷积核的多尺度卷积子块组成,其结构如图2所示。单个多尺度卷积子块中的卷积核大小相同,每个多尺度卷积子块的卷积核大小分别为1×3、1×5、1×7。每个多尺度卷积子块由三个级联的残差块组成,沿前向传播,三个残差块的通道数依次为64、128、256。原始振动信号经过一层1×7卷积和2×2最大池化之后得到基础特征,基础特征输入三个多尺度卷积子块中得到三个不同尺度的特征,每个特征的通道数均为256。三个特征作全局均值池化操作之后沿通道所在的维度拼接在一起作为网络的总输出,由此,最终得到一个768通道,大小为1×1的特征图。

width=342.45,height=454.4

图2 多尺度残差卷积神经网络

Fig.2 Multiscale residual convolution neural network

2 多尺度子领域自适应轴承故障诊断模型

考虑实际生产中旋转机械工况变化引起监测数据分布差异及获取待诊断样本标签困难问题,提出了MSDAM的不同工况下滚动轴承故障诊断方法。该方法通过多尺度残差卷积将已知标签样本和待诊断样本特征迁移到同一子空间,以充分利用轴承不同工况在同种故障状态下的共性特征,并采用LMMD作为度量将所提取的公共特征进行子领域适配,从而增强模型的泛化能力,实现跨工况环境下滚动轴承故障分类。

2.1 多尺度子域自适应模型

所提出的MSDAM故障诊断模型主要由特征提取器和分类器组成。其中,特征提取器Gf采用上文提到的多尺度残差卷积神经网络;分类器Gy由三层全连接层(T/S-FC1,T/S-FC2,T/S-FC3,S为源域,T为目标域)搭建,并将第二层全连接层设定为适配层,通过最小化源域和目标域公共特征之间的LMMD值以减小不同工况所产生的分布差异,其模型结构如图3所示。源域数据width=69.25,height=23.3和目标域数据width=56.9,height=24.7输入特征提取器Gf后得到的多尺度特征,经过展平层得到特征width=52.8,height=21.25width=53.5,height=23.3,然后将特征Z0s和Z0t输入到分类器Gy中,在子领域适配层FC2中得到适配特征width=52.8,height=21.25width=53.5,height=23.3,同时结合源域数据的标签向量width=13.05,height=15.75和目标域数据的预测向量width=11.65,height=15.75,计算源域和目标域适配特征LMMD,即子领域自适应损失Ld

width=93.25,height=17.15 (6)

源域数据经过分类器之后的输出为width=13.05,height=15.75,结合源域标签向量使用交叉熵函数可计算源域分类损失Ly

width=81.6,height=31.55 (7)

式中,J(·,·)为交叉熵损失函数。

在训练过程中,MSDAM需要同时最小化源域的分类损失Ly和子领域自适应损失Ld。因此,优化的目标函数为

width=60.35,height=19.2(8)

式中,θ={w, b}为模型中的权重和偏置;λ为分类损失和子域自适应损失的权衡参数,0<λ<1。

width=67.2,height=25.35 (9)

式中,t为训练当前迭代次数;T为总迭代次数。

随着训练的进行,λ由0变为1,即模型会在训练前期先训练出良好的分类器之后再适配子领域。最后,得到LMMD指标最小的MSDAM诊断模型,完成跨工况故障分类。

width=224.25,height=171.75

图3 多尺度子域自适应模型

Fig.3 Multiscale subdomain adaptive model

2.2 模型超参数设置

模型输入数据长度为1 024,训练批大小为32,总共训练200个epoch。经前期实验,为加快模型收敛速度,MSDAM使用Adam优化算法[24]和动态学习率调整策略进行训练,学习率width=8.25,height=15.1初始值设置为1×10-3,当损失函数在10次迭代后下降值小于1×10-4width=30.85,height=15.1,终止学习率为1×10-5

3 跨域轴承故障诊断实验及分析

3.1 数据集详细信息

本文分别在三个数据集上进行跨工况诊断实验,以验证所提MSDAM的有效性。三个数据集分别是凯斯西储大学轴承数据集(CWRU)[25]、帕德博恩大学轴承数据集(PU)[26]和实验室轴承数据集。

凯斯西储大学轴承故障模拟实验平台的组成如图4所示,包括轴承、电机、转矩传感器、编码器、功率测试仪及其他电子控制设备。本次实验被测轴承为驱动端轴承,型号为SKF6205,采样频率为 12 kHz。使用电火花加工方式在轴承上布置了单点故障,类型分别是滚动体损伤、外圈损伤和内圈损伤,损伤直径分别为0.18 mm、0.36 mm、0.54 mm,结合故障类型和损伤程度单一工况共有九种故障类别,每个故障类别中有6 300个样本,样本长度为1 024。工况划分见表1,根据不同的转速和负载,构建了四组不同工况。

width=225,height=126

图4 凯斯西储大学轴承故障实验平台

Fig.4 Bearing fault experimental platform of CWRU

表1 凯斯西储大学轴承数据集工况划分

Tab.1 Bearing data set working conditions division of CWRU

工况转速/(r/min)负载/kW 11 7970 21 7720.7 31 7501.4 41 7302.1

帕德博恩大学轴承故障模拟平台如图5所示,试验平台由电机、转矩仪、滚动轴承测试模块、飞轮和负载电机组成。压电加速度计(PCB 336C04)固定在滚动轴承模块上配合A-D转换器采集振动信号。故障模拟实验共测试了32套轴承,轴承型号为SKF6203,每个轴承具有不同的损坏类型和故障级别,整体可分为三种健康状态:内圈故障、外圈故障和健康。其中,故障轴承又分为人为损坏和自然加速度实验损坏。根据不同的转速、负载和径向力可划分四种不同的工况,见表2。振动信号的采样频率为64 kHz。

width=228,height=96

图5 帕德博恩大学轴承故障试验平台

Fig.5 Bearing fault experimental platform of PU

表2 帕德博恩大学轴承数据集工况划分

Tab.2 Bearing data set working conditions division of PU

工况转速/(r/min)负载/(N·m)径向力/N 11 5000.71 000 29000.71 000 31 5000.11 000 41 5000.7400

本文选取4个自然加速度损坏轴承和1个健康轴承验证MSDAM性能。自然加速度损坏轴承和健康轴承的信息见表3,损伤方式均为疲劳点蚀,故障类型为外圈故障和内圈故障,每种故障类型又有两个故障等级,所以每种工况共有五种故障类别。

表3 单一工况故障轴承信息

Tab.3 Fault bearing information under single working condition

轴承编号损伤方式故障类型故障等级 KA04疲劳点蚀外圈故障1 KA16疲劳点蚀外圈故障2 KI04疲劳点蚀内圈故障1 KI18疲劳点蚀内圈故障2 K001无健康轴承无

实验室搭建的轴承实验平台如图6所示,实验平台组成包括:永磁同步电机、转矩仪、磁粉制动器和变频器等。

实验测试了1个健康轴承和3个故障轴承,共4个轴承,轴承型号为6209。使用丝锥钻孔加工方式在轴承上布置了单点故障,三个轴承的故障类别分别为轻度外圈故障、中度内圈故障和重度内圈故障。测试时,电机转速分别设置为180 r/min和300 r/min,负载分别设置为2.85 N和4.75 N,不同转速和负载组合可构建四种不同工况,见表4。

width=227.25,height=120.75

图6 实验室轴承故障实验平台

Fig.6 Laboratory bearing fault experimental platform

表4 实验室数据集工况划分

Tab.4 Working conditions division of experimental dataset

工况转速/(r/min)负载/N 13002.85 23004.75 31802.85 41804.75

后续对比实验设计多项跨工况诊断任务,为方便描述,采用简写表示跨工况任务,以1→2为例,1工况为源域,2工况为目标域,依此类推。

实验计算机硬件配置为Intel Core i9-10900K,英伟达RTX-4000GPU,64G RAM,所用深度学习框架为Pytorch。

3.2 对比方法

为验证MSDAM跨工况诊断性能,与两种只关注全局领域自适应方法进行对比,两种方法分别为:

1)深度自适应网络[27](Domain Adaptive Networks, DAN)。DAN通过减少域之间的全局分布差异来增强深度神经网络具体任务层的特征迁移性,并且采用多核MMD避免单一核可能不是最优核的问题。为保证实验客观性,DAN网络模型使用多尺度残差卷积神经网络,学习率调整策略和本文保持一致。在本次实验中DAN仅适配全连接层FC2,交叉熵损失函数和领域自适应损失系数分别为1和10。

2)域对抗神经网络[28](Domain-Adversarial Neural Networks, DANN)。DANN是一种对抗迁移学习方法,由特征提取器、领域鉴别器和分类器构成。DANN借鉴生成对抗网络的思想,特征提取器试图使领域鉴别器混淆它所提取的源域和目标域特征,而领域鉴别器尽可能地辨别数据是来自源域还是目标域,二者交替对抗训练直到鉴别器无法分辨数据来自哪个领域。DANN使用的模型与学习率也与本文提出的方法一致,交叉熵损失函数和领域对抗损失函数的系数均为1。

3.3 实验结果分析

3.3.1 子领域自适应层位置选取

为选取合适的子领域适应层位置以及验证子领域适应层的有效性,将其分别设置在S/T-FC1或S/T-FC2,使用帕德博恩数据集,分析自适应前和自适应后网络层特征变化。

当子领域适应层位置设置在S/T-FC1层,使用t分布随机邻域嵌入技术可视化S/T-FC1和S/T-FC2层的特征分布图形如图7所示。观察图7a和图7b结果可知,由于子领域适应层位置设置在S/T-FC1层,子领域损失只能指导网络优化S/T-FC1及其之前的网络层,虽然S/T-FC1中源域和目标域特征完成了子领域对齐,但是经过S/T-FC2层映射破坏了自适应后的特征分布,最终导致此次跨工况故障诊断性能不佳。

width=222.75,height=95.25

图7 适配S/T-FC1特征分布图

Fig.7 Distribution of features of adaptive S/T-FC1

当子领域适应层位置设置在S/T-FC2层,S/T-FC1和S/T-FC2层的特征可视化分布图形如图8所示。观察图8a和图8b可以看出,将子领域适应层位置设置在S/T-FC2层,子领域损失可以指导网络优化S/T-FC1和S/T-FC2及其之前所有的网络层,因此,S/T-FC1和S/T-FC2输出特征都完成了相关子域对齐。进一步比较图8a和图8b可以看出,相比于S/T-FC1的特征分布,子领域适应层S/T-FC2特征分布更加聚合,此次跨工况诊断性能较为理想。

width=222.75,height=99.75

图8 适配S/T-FC2特征分布图

Fig.8 Distribution of features of adaptive S/T-FC2

综上所述,子领域自适应可以有效地对齐源、目标域特征分布,选取S/T-FC2为子领域自适应层可以最大程度地保持匹配后的特征分布,实现最佳的跨工况诊断性能。因此,本文后续所有实验分析均将子领域自适应层设置在S/T-FC2层。

3.3.2 单尺度与多尺度模型诊断结果对比

为验证多尺度卷积神经网络模型所提取的多尺度特征对迁移学习的促进作用,选取帕德博恩数据集,分别采用单尺度卷积神经网络模型和多尺度卷积神经网络模型捕获特征,实现子领域自适应跨工况诊断实验。其中,单尺度模型由图2中1×3卷积核所在分支组成。

图9为单尺度和多尺度模型参数数量以及各迁移任务平均训练时间。表5为单尺度和多尺度模型在各迁移任务中故障诊断的正确率。相比于单尺度模型,多尺度模型增加了两种不同尺度的分支网络,不可避免地会造成模型参数数量上升和训练时间的增加。观察图9可知,虽然多尺度模型参数数量比单尺度模型增加了1倍左右,但训练时间在数值上增加了 400 s左右且仍在同一个数量级。观察表5可知,单尺度模型故障诊断准确率均值为80.58%,多尺度模型故障诊断正确率均值达到88.56%,相较于单尺度模型提升了7.98百分点。进一步观察表5中不同迁移任务的诊断效果可知,在各个迁移任务中,多尺度模型诊断正确率均高于单尺度模型诊断正确率。其中,在迁移任务1→4和3→4中提升更为明显,分别提升了32.48百分点和35.60百分点。

width=213.75,height=186

图9 模型参数数量与训练时间对比

Fig.9 Comparison of model parameters and training time.

因此,相较于单尺度模型,虽然多尺度模型的参数数量和训练时间都有所增加,但对于基于特征对齐的MSDAM而言,多尺度模型能够从输入信号中提取多尺度特征,可以更好地帮助子域适配层完成源域和目标域的特征对齐,削减源域和目标域数据分布差异,增强MSDAM模型迁移能力,在跨工况故障诊断应用中取得良好效果。

表5 单尺度和多尺度模型跨工况诊断结果

Tab.5 Cross working conditions fault diagnosis of single-scale and multi-scale models

迁移任务准确率(%) 单尺度模型多尺度模型 1→279.8084.80 1→394.6095.52 1→461.6094.08 2→193.0094.08 2→392.8094.32 2→447.8058.60 3→195.0095.20 3→283.8088.40 3→458.6094.20 4→193.2093.20 4→273.8075.72 4→393.0094.60 平均值80.5888.56

3.3.3 凯斯西储大学数据集跨工况诊断

在凯斯西储大学数据集上设计了12个跨工况诊断任务,不同方法的故障诊断正确率对比见表6,观察表中对比结果得到以下结论:

表6 CWRU试验平台不同方法的跨工况诊断结果

Tab.6 Crossworking conditionsfault diagnosis of different methods of CWRU experimental platform

迁移任务准确率(%) DANDANNMSDAM 1→294.4494.8299.22 1→397.2598.6599.55 1→497.7799.4099.48 2→194.7297.7299.46 2→399.5598.7799.55 2→499.5096.6399.54 3→197.8893.6698.89 3→291.0096.8896.80 3→498.9499.5599.55 4→175.6685.597.61 4→277.4496.3896.77 4→394.6186.6699.42 平均值93.2395.3898.81

1)对于12个迁移任务,本文所提方法除3→2的迁移中诊断结果略低于DANN外,其他各个迁移任务的诊断结果均优于DAN和DANN,平均诊断正确率为98.81%,表明本文所提方法具有较好的泛化能力。

2)DAN使用最小化高层特征的MMD来对齐源域和目标域的边缘分布,DANN使用对抗的方法提取域不变特征。但二者都只关注了源域和目标域的全局适配,而忽视了跨域条件分布的差异,从而导致子域的混乱,进而产生更大的分类误差。

3)与DAN和DANN相比,本文所提出的方法使用LMMD对齐了源域和目标域条件分布,充分利用轴承不同工况在同种故障状态下的共性特征,从而可以提取出在同类别中更聚合、在不同类别中差异更明显的特征,增强故障特征的泛化表达,体现出较优的跨工况无监督域适应诊断能力。

为了进一步更直观地评估所提方法的优越性,将输入数据和领域适配层(FC2)中的迁移特征维度降低到二维进行可视化。迁移任务1→2上的输入数据和FC2层的二维图如图10所示。观察图10a,可以得到源域和目标域数据的分布相关但并不服从相同的概率分布的结论。图10b中,DAN使用多核MMD以更准确地计算两域特征的分布距离,经过领域适配后的特征边缘分布对齐良好,然而不同类别特征之间边际不明显。观察图10c发现,DANN所提取的域不变特征,完成了两个领域的边缘分布适配,但特征在同一标签内没有产生重叠,原因是DANN的领域鉴别器无法识别特征的条件信息,所以无法完成特征的条件分布对齐。图10d显示了MSDAM的性能,源域和目标域特征在同一标签内产生重叠,并且不同标签的特征之间边际清晰,本文所提出的模型完成了子域适配的目标,源域和目标域的特征所服从的概率分布更加统一。

width=224.25,height=207

图10 不同方法的特征可视化

Fig.10 Feature visualization of different methods

3.3.4 帕德博恩大学数据集跨工况诊断

在帕德博恩大学数据集上同样设计了12个迁移任务,不同方法的故障诊断对比结果见表7。观察表7可以发现,在12个迁移任务中除工况2→4之外,在其他工况的迁移任务中,本文所提出的方法的诊断正确率都显著地高于DAN和DANN,并且所提出的方法的平均诊断准确率比DAN高10.88百分点,比DANN高10.25百分点,证明了子域适配在跨域诊断中的有效性。帕德博恩数据集不同工况之间的数据分布差异要大于CWRU数据集,所以三种方法在帕德博恩数据集上的表现整体低于在CWRU数据集上的表现。

表7 PU试验平台不同方法的跨工况诊断结果

Tab.7 Cross working conditions fault diagnosis of different methods of PU experimental platform

迁移任务准确率(%) DANDANNMSDAM 1→276.9279.0084.80 1→388.4489.8095.52 1→472.1687.4094.08 2→177.2064.0094.08 2→379.1277.8094.32 2→462.8462.2058.60 3→194.7686.5095.20 3→272.8066.0088.40 3→482.2090.8094.20 4→179.6090.6093.20 4→270.0064.6075.72 4→376.2081.0094.60 平均值77.6878.3188.56

使用t分布随机邻域嵌入将FC2层中的特征维度降低到二维。迁移任务1→2上的原始数据和FC2层的二维图如图11所示。图11a为初始源域数据和目标域数据的降维分布。图11b和图11c为DAN和DANN提取的特征,图中显示领域特征类间边界不明显,即模型无法有效实现相关子域的自适应。从图11d中可以看出MSDAM成功适配了源域和目标域的相关子域,同一标签的源域和目标域特征基本重叠,只有少部分特征发生了漂移。

width=222.75,height=207

图11 不同方法的特征可视化

Fig.11 Feature visualization of different methods.

3.3.5 实验室轴承数据集跨工况诊断

在实验室数据集上也完成了12个迁移任务,实验结果见表8,在绝大多数迁移任务中MSDAM的诊断性能都远优于对比方法,比DAN的平均诊断准确率高11.16百分点,比DANN高24.85百分点。在迁移任务3→1和4→2中,DAN也仅比MSDAM高2.91百分点和0.62百分点,再次证明了所提方法的优越性。

表8 实验室平台不同方法的跨工况诊断结果

Tab.8 Cross workingconditionsfault diagnosis of different methods of self built experimental platform

迁移任务准确率(%) DANDANNMSDAM 1→292.1273.2099.06 1→386.4475.7195.90 1→496.5367.3397.82 2→172.6877.0099.30 2→361.5447.3295.30 2→476.4158.74100.00 3→199.3296.2596.41 3→277.3462.8191.25 3→485.4769.5393.59 4→196.0990.0098.91 4→297.5078.7596.88 4→380.6361.1691.56 平均值85.1771.4896.33

4 结论

本文提出了一种MSDAM的无监督迁移学习方法应用于跨工况轴承故障诊断中。首先,以原始振动信号作为输入,无需信号预处理及人工特征参数提取;其次,搭建多尺度残差卷积神经网络,捕获具有更多细粒度信息的多尺度公共特征;然后,通过最小化源域和目标域公共特征的LMMD,对齐源域和目标域的条件分布,使来自两个领域的同一标签下的特征聚合在一起,并且不同标签的特征之间区分明显。与只对齐了全局分布的DAN和DANN相比,本文所提出的MSDAM模型在经过训练后能有效地适配迁移任务的子域,在训练数据和测试数据的数据分布有偏差,且无法获得大量高质量标注数据的情况下仍能取得良好的诊断效果,具有较好的泛化能力。

参考文献

[1] 宋向金, 赵文祥. 交流电机信号特征分析的滚动轴承故障诊断方法综述[J]. 中国电机工程学报, 2022, 42(4): 1582-1595. Song Xiangjin, Zhao Wenxiang. A review of rolling bearing fault diagnosis approaches using AC motor signature analysis[J]. Proceedings of the CSEE, 2022, 42(4): 1582-1595.

[2] Liu Chenyu, He Deqiang, Chen Yanjun, et al. Rolling bearing fault diagnosis of train running gear based on optimized deep residual network[C]//2021 5th International Conference on Automation, Control and Robots (ICACR), Nanning, China, 2021: 168-172.

[3] 李兵, 梁舒奇, 单万宁, 等. 基于改进正余弦算法优化堆叠降噪自动编码器的电机轴承故障诊断[J]. 电工技术学报, 2022, 37(16): 4084-4093. Li Bing, Liang Shuqi, Shan Wanning, et al. Motor bearing fault diagnosis based on improved sine and cosine algorithm for stacked denoising autoencoders[J]. Transactions of China Electrotechnical Society, 2022, 37(16): 4084-4093.

[4] Gao Shuzhi, Pei Zhiming, Zhang Yimin, et al. Bearing fault diagnosis based on adaptive convolutional neural network with nesterov momentum[J]. IEEE Sensors Journal, 2021, 21(7): 9268-9276.

[5] 陈剑, 杜文娟, 王海风. 基于对抗式迁移学习的含柔性高压直流输电的风电系统次同步振荡源定位[J]. 电工技术学报, 2021, 36(22): 4703-4715. Chen Jian, Du Wenjuan, Wang Haifeng. Location method of subsynchronous oscillation source in wind power system with VSC-HVDC based on adversarial transfer learning[J]. Transactions of China Electrotechnical Society, 2021, 36(22): 4703-4715.

[6] 王艳新, 闫静, 王建华, 等. 基于域对抗迁移卷积神经网络的小样本GIS绝缘缺陷智能诊断方法[J]. 电工技术学报, 2022, 37(9): 2150-2160. Wang Yanxin, Yan Jing, Wang Jianhua, et al. Intelligent diagnosis for GIS with small samples using a novel adversarial transfer learning in convolutional neural network[J]. Transactions of China Electrote-chnical Society, 2022, 37(9): 2150-2160.

[7] 臧海祥, 郭镜玮, 黄蔓云, 等. 基于深度迁移学习的时变拓扑下电力系统状态估计[J]. 电力系统自动化, 2021, 45(24): 49-56. Zang Haixiang, Guo Jingwei, Huang Manyun, et al. State estimation for power systems with time-varying topology based on deep transfer learning[J]. Automation of Electric Power Systems, 2021, 45(24): 49-56.

[8] Chen Zhuyun, He Guolin, Li Jipu, et al. Domain adversarial transfer network for cross-domain fault diagnosis of rotary machinery[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(11): 8702-8712.

[9] Zhou Yuxuan, Dong Yining, Zhou Hongkuan, et al. Deep dynamic adaptive transfer network for rolling bearing fault diagnosis with considering cross-machine instance[J]. IEEE Transactions on Instru-mentation and Measurement, 2021, 70: 1-11.

[10] 袁壮, 董瑞, 张来斌, 等. 深度领域自适应及其在跨工况故障诊断中的应用[J]. 振动与冲击, 2020, 39(12): 281-288. Yuan Zhuang, Dong Rui, Zhang Laibin, et al. Deep domain adaptation and its application in fault diagnosis across working conditions[J]. Journal of Vibration and Shock, 2020, 39(12): 281-288.

[11] Lou Yunxia, Kumar A, Xiang Jiawei. Machinery fault diagnosis based on domain adaptation to bridge the gap between simulation and measured signals[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 1-9.

[12] Li Tianfu, Zhao Zhibin, Sun Chuang, et al. Domain adversarial graph convolutional network for fault diagnosis under variable working conditions[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1-10.

[13] Wan Lanjun, Li Yuanyuan, Chen Keyu, et al. A novel deep convolution multi-adversarial domain adaptation model for rolling bearing fault diagnosis[J]. Measurement, 2022, 191: 110752.

[14] 董绍江, 朱朋, 裴雪武, 等. 基于子领域自适应的变工况下滚动轴承故障诊断[J]. 吉林大学学报(工学版), 2022, 52(2): 288-295. Dong Shaojiang, Zhu Peng, Pei Xuewu, et al. Fault diagnosis of rolling bearing under variable operating conditions based on subdomain adaptation[J]. Journal of Jilin University (Engineering and Technology Edition), 2022, 52(2): 288-295.

[15] 陈仁祥, 唐林林, 孙健, 等. 一维深度子领域适配的不同转速下旋转机械复合故障诊断[J]. 仪器仪表学报, 2021, 42(5): 227-234. Chen Renxiang, Tang Linlin, Sun Jian, et al. Composite fault diagnosis of rotating machinery under different speed based on one dimensional deep subdomain adaption[J]. Chinese Journal of Scientific Instrument, 2021, 42(5): 227-234.

[16] Gretton A, Borgwardt K M, Rasch M J, et al. A kernel two-sample test[J]. The Journal of Machine Learning Research, 2012, 13(1): 723-773.

[17] 卢志刚, 杨英杰, 李学平, 等. 基于深度迁移学习理论含风电光伏系统的地区电网网损率计算[J]. 中国电机工程学报, 2020, 40(13): 4102-4110. Lu Zhigang, Yang Yingjie, Li Xueping, et al. A deep migration learning based power loss rate calculation method for distributed power system with wind and solar generation[J]. Proceedings of the CSEE, 2020, 40(13): 4102-4110.

[18] Long Mingsheng, Wang Jianmin. Learning transferable features with deep adaptation networks[EB/OL]. 2015: arXiv: 1502.02791. https://arxiv.org/abs/1502.02791.

[19] Long M, Zhu H, Wang J, et al. Deep transfer learning with joint adaptation networks[C]//International Conference On Machine Learning, PMLR, 2017: 2208-2217.

[20] Tzeng E, Hoffman J, Zhang Ning, et al. Deep domain confusion: maximizing for domain invariance[EB/OL]. 2014: arXiv: 1412.3474. https://arxiv.org/abs/1412. 3474.

[21] 徐奇伟, 黄宏, 张雪锋, 等. 基于改进区域全卷积网络的高压引线接头红外图像特征分析的在线故障诊断方法[J]. 电工技术学报, 2021, 36(7): 1380-1388. Xu Qiwei, Huang Hong, Zhang Xuefeng, et al. Online fault diagnosis method for infrared image feature analysis of high-voltage lead connectors based on improved R-FCN[J]. Transactions of China Electro-technical Society, 2021, 36(7) : 1380-1388.

[22] 郑含博, 李金恒, 刘洋, 等. 基于改进YOLOv3的电力设备红外目标检测模型[J]. 电工技术学报, 2021, 36(7): 1389-1398. Zheng Hanbo, Li Jinheng, Liu Yang, et al. Infrared object detection model for power equipment based on improved YOLOv3[J]. Transactions of China Electrotechnical Society, 2021, 36(7): 1389-1398.

[23] He Kaiming, Sun Jian. Convolutional neural networks at constrained time cost[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston, MA, USA, 2015: 5353-5360.

[24] Barakat A, Bianchi P. Convergence and dynamical behavior of the ADAM algorithm for non-convex stochastic optimization[EB/OL]. 2018: arXiv: 1810. 02263. https://arxiv.org/abs/1810.02263.

[25] Smith W A, Randall R B. Rolling element bearing diagnostics using the Case Western Reserve University data: a benchmark study[J]. Mechanical Systems and Signal Processing, 2015, 64/65: 100-131.

[26] Lessmeier C, Kimotho J, Zimmer D, et al. Condition monitoring of bearing damage in electromechanical drive systems by using motor current signals of electric motors: a benchmark data set for data-driven classification[C]//European Conference of the Prognostics and Health Management Society, Bilbao, Spain, 2016: 1-17.

[27] Long Mingsheng, Cao Yue, Wang Jianmin, et al. Learning transferable features with deep adaptation networks[EB/OL]. 2015: arXiv: 1502.02791. https:// arxiv.org/abs/1502.02791.

[28] Ganin Y, Ustinova E, Ajakan H, et al. Domain-adversarial training of neural networks[J]. The Journal of Machine Learning Research, 2016, 17(1): 2096-2030.

Across Working Conditions Fault Diagnosis for Motor Rolling Bearing Based on Deep Subdomain Adaption Network

Song Xiangjin SunWenju LiuGuohai ZhaoWenxiang Wang Zhaowei

(School of Electrical Information Engineering Jiangsu University Zhenjiang 212013 China)

Abstract In real-world industrial scenarios, due to variations in working conditions, the vibration data gathered from mechanical equipment presents different probability distributions. Moreover, the gathered vibration data is usually unlabeled. Therefore, the unlabeled vibration data may be misclassified by the trained diagnostic source models. Deep transfer learning with the adaptation of marginal or conditional distribution can extend the knowledge of the trained models in source domains to a novel but it is related to a target domains. However, the only reduction in marginal distribution discrepancy limits the generalization ability and performance of the diagnostic model. Besides, the most effective diagnostic model that matches both marginal and conditional distributions fail to take full advantage of complex and sensitive features in the data set. To address these issues, a multiscale subdomain adaptive model (MSDAM) for rolling bearings fault diagnosis under cross-working conditions is proposed.

Firstly, in order to eliminate signal pre-processing and manual feature extraction dependencies, the original vibration signal is used as the input of the proposed MSDAM. Secondly, a multiscale convolutional neural network is built to capture multiscale common features with fine-grained information and transfer the features of labeled source data and unlabeled target data to the same subspace. Then, the prediction results of the source classifier are used as the soft labels for the unlabeled target data, and the relevant subdomains are divided according to different fault types. Finally,the local maximum mean distance (LMMD) method is employed to align the conditional distributions of the subdomains in the common feature space to effectively reduce the distribution discrepancy of similar fault characteristics under different working conditions.

The location selection experiment of the subdomain adaptation layer shows that the subdomain adaptation layer is set before the classification layer, which can better guide the optimization of the entire network and maintain feature distribution matching. The results on the Paderborn bearing dataset show that the average diagnostic accuracy of the multiscale model is improved by 7.98% compared to the single-scale model. Despite sacrificing extra training time, the proposed MSDAM has stronger transfer ability. To further verify the effectiveness of the proposed MSDAM, a total of 12 transfer learning tasks are carried out on the CWRU bearing dataset, Paderborn bearing dataset, and laboratory-built datasets respectively. The experimental results indicate that the proposed MSDAM has higher accuracy in fault diagnosis across working conditions than the deep adaptation methods such as domain adaptive networks(DAN) and domain-adversarial neural networks (DANN). In addition, t-SNE visualization of the subdomain adaptation layer representations indicates that the proposed MSDAM can accurately align the relevant subdomain distributions.

The following conclusions can be drawn through the analysis of experimental results: (1) The proposed MSDAM can extract more fine-grained common fault features and align relevant subdomains based on LMMD compared with DAN and DANN. (2) The proposed MSDAM only requires the original vibration signal as input, eliminating the need for signal preprocessing and manual feature extraction. (3) A high cross domain diagnostic accuracy on all three datasets proves the strong generalization ability of the proposed MSDAM.

Keywords:Bearing fault diagnosis, subdomain adaptation, transfer learning, soft label learning

DOI:10.19595/j.cnki.1000-6753.tces.221854

中图分类号:TM307

国家自然科学基金青年科学基金(52007078, 62002140)、江苏省自然科学基金(BK20200887)和江苏省“双创”项目资助。

收稿日期 2022-09-30

改稿日期 2023-02-15

作者简介

宋向金 女,1989年生,博士,讲师,硕士生导师,研究方向为交流电机状态监测与故障诊断。E-mail:songxiangjin@ujs.edu.cn(通信作者)

孙文举 男,1998年生,硕士研究生,研究方向为旋转机械设备故障诊断。E-mail:2222107041@stmail.ujs.edu.cn

(编辑 郭丽军)