摘要 随着海量状态监测数据的获取,复杂电磁能装备的关键部件健康状态监测对于实时性和可靠性的要求不断增加,研究利用边缘智能技术赋能装备故障诊断是一种很有发展前景的方法。边缘智能技术致力于将智能算法和算力资源下沉到设备端,在靠近数据源的位置对数据进行处理,能够很好地解决工业嵌入式系统资源受限和海量数据传输所带来的故障诊断时延,防止设备过度损坏。该文提出一种基于边缘智能的轻量化故障诊断方法,在数据采集过程中利用压缩感知技术将密集型的多元监测数据非线性压缩为稀疏采样数据,故障诊断模型集成了深度极限学习机和核函数,深度挖掘压缩采样信号与故障类型之间的内在联系。通过模型轻量化技术,将诊断模型部署在设备端的边缘智能计算卡上,显著降低了数据的传输、计算和存储压力,从而提高了智能故障诊断的实时性。
关键词:压缩感知 深度极限学习机 核函数 轻量化故障诊断
电磁能装备是一种复杂的物理系统[1],其运行涉及电、磁、热、力等多个方面,这些方面相互耦合,使得各功能模块间的联系十分紧密。一旦某些关键部件出现故障,可能会对整个系统造成严重影响,甚至导致系统瘫痪。因此,准确监测关键部件的状态对于保证系统的正常运行至关重要。目前采用在线的采集方式获取设备的时序监测信号进行健康状态评估。大量监测点、高采样率和长时间的监测使得健康管理系统积累了大量的状态监测数据。这不仅推动了电磁能装备故障诊断进入数据驱动的时代[2],也给关键部件的实时精准故障诊断带来了巨大的挑战。
数据驱动的智能故障诊断方法[3-4]在挖掘多元时序监测信号之间的复杂关联方面具有强大的潜力,能够根据时序信号之间的潜在特征精确地诊断和预测故障。这类方法通常分为三个步骤:①数据采集,通过大量的硬件传感器长时间对目标设备进行原位观测,并获取大量的健康状态数据;②特征提取,利用信号处理技术从数据中提取关键特征,主要包括时域、频域和变换域方法;③故障分类,通过学习提取的数据特征,能够对未知信号的健康状况或故障类别进行预测。大多数研究证明了智能故障诊断方法在提高设备运行可靠性、减少故障停机时间以及优化维护成本方面具有显著的优势。然而,在电磁能装备上的应用仍存在一些明显的局限性,值得进一步研究。
1)原始采集信号中包含大量冗余信息,这会极大地降低后续数据的传输、存储和计算的效率。
2)特征提取过程严重依赖信号处理技术和专家的先验知识,存在计算复杂度高、泛化性差及故障特征反映不全面等问题。
3)智能故障诊断模型的参数量和计算量庞大,在资源受限的嵌入式环境下,识别敏感特征的能力有限。
从根本上改变现有实时监测系统的数据处理模式对于电磁能装备从传统故障诊断向智能故障诊断的转变至关重要。针对实际工业系统中的原始采样信号数据规模庞大,传输、存储和计算等方面存在一些不便之处,D. L. Donoho等[5]提出了基于信号稀疏性的压缩感知(Compressed Sensing, CS)理论[6]以应对这一问题。压缩感知基于信号在变换领域的稀疏特性,采用与该领域无关联的测量阵列对信号执行投影操作,从而获得降维后的压缩样本。它使得数据采集从奈奎斯特理论中解脱出来,可以通过变换域中的非线性投影来实现信号的压缩采集,从而将海量冗余数据的采集高效地转换为少量有用信息的采集。因此,通过压缩感知技术,只需采集较少的数据量,即可获得丰富的特征信息,且与奈奎斯特采样方法效果相当。这不仅减少了存储和计算成本,还为实时监测系统的数据采集和处理提供了新思路。
深度极限学习机(Deep Extreme Learning Machines, DELM)[7]是一种多层神经网络,其核心是极限学习机和自动编码器这两种无监督学习的基础单元。通过逐层贪婪无监督的训练方式,深度极限学习机能够有效地对输入数据进行训练。相对于传统单隐层的极限学习机,深度极限学习机能够提取低维观测信号中更复杂的故障特征。深度极限学习机具有训练速度快、泛化能力强及隐含层的权重和偏置更新更简便等特点,因此在故障诊断领域得到广泛应用。它集成了深度神经网络的精度和传统机器学习的速度,是一种理想的故障诊断模型。
边缘智能[8]是指将人工智能算法部署在边缘设备上,结合边缘计算技术,为各类对象提供更快速、高效的智能服务。在装备运行过程中产生的海量状态监测数据对于关键部件的智能故障诊断、预测性维护和参数优化等任务至关重要。然而,这些数据分析任务,特别是以深度学习为代表的数据驱动型任务,需要大量的计算资源,而在现有工业环境中很难满足这些需求。虽然云计算可以提供服务,但通信时延无法满足装备状态响应的实时性要求。因此,边缘智能的服务模型在工业领域应用广泛。
考虑到CS和深度极限学习机的优点,本文首先提出一种结合CS和深度极限学习机的智能故障诊断方法。该方法集成了信号的压缩采集、特征的自适应提取和故障分类的功能,同时还引入核函数,将低维非线性不可分的数据特征映射到高维线性可分,从而实现了更精准的故障分类。然后,利用粒子群优化算法(Particle Swarm Optimization, PSO)[9]自主优化深度核极限学习机(Deep Kernel Based Extreme Learning Machine, DKELM)的各隐含层节点数、正则化系数、顶层核极限学习机(Kernel Based Extreme Learning Machine, KELM)的惩罚系数和核参数,使得该方法能够自适应地实现各种电磁能装备的故障诊断。最后,通过模型轻量化技术将深度模型剪枝后部署在边缘计算设备上,实现装备故障的在线检测。该方法的轻量化主要体现在数据轻量化和模型轻量化两个方面,将密集型的原始采样数据轻量化为少量的压缩采样数据,并将深度网络模型轻量化为可以部署在边缘设备上的优化模型,从而有效地减小了故障诊断过程中的计算和传输时延。
针对电磁能装备关键部件智能故障诊断过程出现的数据量过大、特征选取主观依赖性强及智能模型部署困难等局限[10-11],本文提出了一种集成压缩感知、深度核极限学习机及边缘智能的电磁能装备轻量化故障诊断方法(Compressed sensing, Deep kernel extreme learning machine, Edge intelligent, CDE)。该方法由信号采集单元、故障检测单元及模型简化单元构成。依据压缩感知原理,信号采集单元对原监测信号进行压缩,旨在保留故障数据信息的同时显著减少采集数据量。故障诊断模块构建了以极限学习机和核函数为基础的深度核极限学习机网络,通过对原始信号低维采样值的多层非线性学习,实现了自适应故障特征提取与智能健康状况诊断。模型轻量化模块包含模型剪枝、量化、蒸馏等系列标准化定制方法,以便更好地将智能模型部署在EdgeBoard AI 计算盒/计算卡上实现装备在线故障诊断。
在特征提取阶段的故障诊断模块中,核函数[12]因其卓越的非线性映射特性而被广泛采用,支持向量机便是其最具代表性的应用之一。该函数可以解决高维空间的问题,并能将原本在低维空间线性不可分的数据集映射至更高维度,实现线性可分,从而提升分类的准确性。鉴于核函数的显著效能,本文将其融入到深度极限学习机中,以增强模型的泛化能力和稳定性,进而发展出深度核极限学习机模型。
DKELM将原始输入数据通过个隐含层抽象化为特征
,随后通过核函数进行映射处理。在这个过程中,核隐含层的输出矩阵无需显式表示,而是通过核函数的内积属性来计算
与
的关系,进而获得DKELM的最终输出。核函数
的应用能够将
表达为
式中,为核函数输出矩阵;
为输出矩阵中的元素;H为隐藏层的权重矩阵;
、
为权重矩阵中的元素。
由于可表示为
则DKELM的输出为
式中,N为输入数量;c为正则化参数;T为输入样本对应的标签。
这等同于采用核函数替换了极限学习机隐含层节点的传统映射。所提及的核函数符合Mercer定理[13]的要求,故本研究选择了广泛应用的径向基函数(Radial Basis Function, RBF)核作为实现形式。
式中,为核参数。在融合了核函数的DKELM模型里,无需明确指定隐含层的特征映射函数h(x),只需核函数
的表达式便可计算输出值。此外,核函数通过内积形式运算,消除了设定隐含层节点数量的必要性,以及隐含层初始权重和偏差的设定。通过这种更抽象特征的计算,代替在高维空间进行内积运算,这种方法能够将特征映射至更高的维度以做出决策,这有助于提升故障分类的准确度及算法的泛化能力。
以往的研究[14-15]中,DELM的隐含层节点数和正则化系数大多是通过人为主观选择并固定,但这两项参数对诊断结果具有重大影响。为确保DKELM网络的泛化能力并降低人为干预,本研究采用PSO算法自适应优化隐含层节点数、正则化系数,以及核函数的惩罚系数与核参数,从而提高该方法的泛化性和故障分类准确性。PSO算法是一种模拟社会行为的进化计算方法,它通过个体间的互动和共享信息来追求最佳答案。在PSO算法中,解决方案以搜索空间内的粒子群初始分布,并逐步迭代以识别最优解。每次迭代,粒子根据自身发现的最佳位置pbest和群体中的全局最佳位置gbest来调整其速度和方向。粒子根据特定公式更新其运动状态。
速度更新公式为
位置更新公式为
式中,i为迭代次数;为粒子在第
次迭代的速度;
为惯性权重;c1、c2为认知系数;rand1、rand2为介于(0,1)之间的均匀分布随机数;pbesti为粒子个体最优位置;gbesti为群体最优位置;xi为粒子在第
次迭代的位置;
为收缩因子,用来保持速度在一定的范围。作为一种并行优化技术,PSO算法以其简洁性、强鲁棒性、快速实施和快速收敛性而著称,它通常能高效地定位到全局最优解。该算法能够构建满足特定目标函数的DKELM故障诊断模型。
针对本文所用到的深度学习模型,本文通过前后双向剪枝的方法进行模型轻量化。为了给出剪枝过程的数学分析,假设输入和目标输出分别为和
,
代表网络的参数(或者所有剪枝单元的集合),
代表网络的精度损失。
剪枝过程可以理解为是在寻找W的一个子集,这个子集更加的精简,并且给网络带来的损失也是极其微小的,即
。因此,模型的剪枝过程可视为解决组合优化问题的一种方式,即
式中,hi为参数i产生的输出特征;B为子集中参数数量的上界,主要取决于用户的精度要求,超过这个上界的模型剪枝就失去了意义。在保持精度损失尽可能小的同时找到一个好的参数子集是一个组合优化问题,得到最优的参数子集需要对损失函数进行2|W|次评估。在本文的实验场景中,|W|的值通常达到105量级,可见对损失函数进行全局寻优是不可行的方案,因为所带来的计算成本和时间成本都是无法承受的。本文使用贪心策略,从全部参数集|W|出发,逐步验证并剔除最不显著的参数因素,确保最终满足
的
范数上界约束。
对式(7)进行泰勒级数展开分析,估算损失函数变动时直接去除特定参数。为了方便计算,考虑损失函数对于参数和由参数计算出的输出特征有同等的依赖。假设参数具有独立性,可以得到
,这里
表示输出特征hi被剪后的损失值,
表示未剪枝hi的损失值。虽然参数实际上是相互依赖的,但在训练过程中,已经在每个梯度步骤上做了独立假设。为了近似
,使用了泰勒展开式的一阶导数项,对于一个函数
,在
点处的泰勒展开为
式中,为函数f(x)在数据点a处的p阶导数;
为p阶余数。使用在hi附近的一阶泰勒展开式去逼近
,得到
余数项R1的计算可采用拉格朗日余项公式,具体为
式中,为一个取值介于0~hi之间的实数。然而,本文通常会直接忽略这个一阶余数,在很大程度上是因为需要大量的计算,然而,部分原因归咎于普遍采用的ReLU激活函数倾向于产生较小的二阶项。综合式(9)和式(7),同时省略余数项,有
(11)
因此,需要计算剪枝单元的输出特征hi以及损失函数C关于该特征的梯度,并将它们相乘取绝对值作为该特征对于网络参数因子的重要性值。直观上也很容易理解,一个剪枝单元的输出特征值很小说明该剪枝单元提取到的特征对于任务没有什么帮助,该特征的梯度很小说明该特征的变化幅度小,说明该特征现在和以后对于任务都没有太大的帮助,因此,其对应的模型参数被移除也不会影响模型的性能。每次迭代剪枝过程移除重要性能最小的参数因子,直到满足部署要求。输出特征与该特征的梯度值可以分别通过前向计算和反向计算得到。
CDE方法处理流程如图1所示,具体步骤如下所述。
1)电磁能装备原始监测信号为高频采样信号,但本文的研究发现并非所有采样信号都是严格的变换域稀疏信号,而这是使用压缩感知的基本条件之一,因此不能直接对原始监测信号采用压缩感知的方法。信号采集模块首先通过一个傅里叶变换矩阵将时域信号转换至频域,随后应用一个与离散余弦变换基矩阵无关的高斯随机观测矩阵,对频域信号进行低维空间投影,完成压缩采样,压缩前后的信号对比如图2所示。所得信号为原始信号的频域压缩采样信号,几乎包含原始信号的所有故障信息又实现了数据的轻量化,可直接用于后续的故障诊断过程。
图1 CDE方法处理流程
Fig.1 Processing flow chart of CDE method
图2 压缩采样效果
Fig.2 Compressed sampling renderings
2)故障诊断模块通过逐层贪婪的方法来训练DKELM网络,保存ELM由最小二乘法获得的输出权重,每个隐藏层的权重初始化为ELM的输出权值,采用层序无监督方式进行训练。区别于其他深度学习方法,DKELM避免了反向微调步骤,其显著优势在于快速性能。DKELM旨在最小化重构误差,以使输出尽可能贴近初始输入。通过逐层训练,模型能够捕捉到数据的高阶特征。在DKELM的训练阶段,输入样本X直接用作第1个ELM-AE的目标输出,输出权值X1=X,然后将第1个ELM-AE的输出权值β1作为DKELM第1个隐藏层的输入权重W1,DKELM的第1个隐藏层输出H1作为下一ELM-AE的输入和目标输出(H1=X1=X),依此方式连续训练各层。最终层通过KELM进行训练,其输出矩阵记为Hi。应用核技术可使低维非线性数据在高维空间实现线性可分,从而提高分类精度。PSO算法用于调优DKELM的隐藏层节点数、正则化系数、KELM的惩罚参数和核参数,其中适应度函数为测试样本的分类错误率,最大迭代次数设置为M,迭代终止条件为分类错误率低于阈值或者达到最大迭代次数。通过自适应PSO优化参数,损失函数能够收敛至局部极小值,建立设备健康状态与压缩采集数据间的复杂非线性关系,有效提取并分类故障特征。稀疏信号以及稀疏信号的特征提取示意图如图3所示。
3)为了更加高效地将智能故障诊断模型应用到资源受限的工业嵌入式平台,本文通过双向剪枝对深度模型进行优化,获得了轻量级的智能故障诊断模型。但是仅对深度神经网络模型进行优化是不够的,还要结合推理平台的硬件特性进一步实现软硬件协同加速。当前在资源受限平台的模型推理部署有两种方式:一种是依赖于推理方法的方式;另一种则不依赖推理方法而是直接部署运行库。第一种方式较为通用,利用现有的轻量级推理方法Tensor Flow Lite、Pytorch Mobile、Paddle Lite等对模型进行编译移植即可部署在资源受限平台上运行推理。第二种直接部署运行库到资源受限平台的推理能效通常要优于推理方法式的部署方式,因为运行库的运行更加直接,并且更加节省内存。因此,该方法还集成了一个端到端的深度学习模型全栈编译器,输入该方法支持下的深度学习模型,经过优化处理并编译后,输出资源受限平台上的可运行库。图4描述了该模块的处理流程。
图3 稀疏信号特征提取示意图
Fig.3 Sparse signal feature extraction renderings
图4 深度学习模型运行库生成模块处理流程
Fig.4 Processing flow chart of deep learning runtime library generation module
为了验证本文方法的有效性,本文采用国产百度EdgeBoard AI 计算盒/计算卡作为边缘智能设备部署智能模型,其配置了Xilinx Zynq UltraScale MPSOC XCZU9EG, Quad Cortex-A53 1.5GHz的工业级计算芯片,并搭载了Linux系统。DDR4为 8 GB,eMMC为32 GB,最大算力可达到3.6TOPS。边缘智能计算卡实物如图1(边缘智能部署)所示,通过改进散热和加固可使其适用于工业场景部署。使用Python3.8和Pytorch 1.7.0版本与CUDA 10.2和CUDNN 7.0版本实现本实验的方法及其所有变体。本文采用设备运行过程中的10种类型状态监测数据,将滑动窗口大小设置为4 800点,则每次工况得到数据维度D为10×4 800。共采集了5 000次工况数据,其中包含7种故障类型和1种正常类型,正常占比30%,其余每种故障类型占比10%。然后对原始数据D进行压缩采样和归一化处理,测量矩阵为高斯随机矩阵,压缩率为CR,得到压缩采样数据D′,在后续实验中D′将作为本文研究的智能故障诊断方法输入数据。
2.2.1 压缩采样信号的可恢复性
与传统奈奎斯特采样相比,压缩采样能够对原始信号进行更为彻底的压缩。通过采用随机不等间距的采样方式,采样频率可以远低于奈奎斯特要求,从而大大减少数据采集量。这不仅降低了信号的存储空间需求,还减少了计算量,为实时监测和故障诊断提供了更为高效的方法。其变换域的非零值作为主要特征信息不会减少,虽然会产生大量不相关的干扰值,但是本文可以通过“阈值检测-计算较大值干扰-消除干扰-降低阈值”的迭代提取原始信号的变换域非零值,从而高保真地恢复原始信号。原始信号和压缩信号的变换域对比如图5所示。以机械振动信号为例,在压缩率CR=90%的前提下,可以看出原始信号和压缩信号的变换域非零值几乎不变,表明信号主要特征信息没有丢失。
图5 原始信号和压缩信号的变换域对比
Fig.5 Comparison of transform domain with the original signal and the compressed signal
为了进一步验证压缩采样信号特征信息的完整性,采用L1范数最小值求解方法和正交匹配追踪(Orthogonal Matching Pursuit, OMP)算法对随机抽取的部分样本进行重构。两种方法的原始信号与重构信号的对比如图6所示。在压缩采样中,正交基采用了离散余弦变换(DCT)基,而测量矩阵则使用了高斯随机矩阵。在压缩率为90%的情况下,两种方法均能够较好地重构原始信号,证明了压缩采样信号特征信息的完整性。
图6 原始信号与压缩信号的重构信号对比
Fig.6 Comparison curve of the original signal and the reconstructed signal
同时可以看出,当压缩率为90%时,使用L1范数最小值求解方法的重构信号几乎能够完全还原原始信号的故障冲击特性的波形,重构误差主要是由原始信号中包含的噪声引起的。而使用OMP算法重构的信号虽然能体现出大致波形,但是波形细节失真。可以说明,即使在高压缩率的条件下进行压缩采样,依然可以保持信号中特征信息的完备性,通过选择合适的重构方法,可以实现对原始波形进行精确重构。
2.2.2 故障诊断的准确性与实时性
CDE方法的使用能够极大地提升故障的诊断效率和诊断准确率。为了验证本文提出的智能诊断方法的有效性,将300次工况的测试数据样本输入模型,验证故障诊断的准确性和实时性。为保证实验结果的可靠性,采用20次测试的结果取平均值,并增加了与直接识别原始信号的方法进行对比,其结果见表1。可见本文方法在测试集上的故障诊断准确率可达到99%以上,并且诊断时间保持在百毫秒以内,具有较好的实时性。
表1 本文方法与直接识别原始信号的对比
Tab.1 The comparison between the proposed method and the direct identification of the original signal
方法准确率(%)准确率标准差时间/s时间标准差 DELM91.271.620.210 90.007 5 CDE(PSO)99.970.440.060 70.000 7
为了验证故障诊断的效果,将检测到的故障信号与正常信号进行对比,如图7所示。正常情况下每次工况应该都是一次完整的冲击波形,而该图显示从第4个波峰开始,波形分叉,这是由于电子元器件无法承受高压冲击导致短路。可见本文能够有效地发现并分类故障波形。
图7 故障波形与正常波形对比
Fig.7 Fault waveform compared with normal waveform
目前大多数工业系统的实时性要求是百毫秒级,为了验证本文方法在大规模数据集上依然具有实时性优势,本文将测试数据增加到2 000条规模进行试验。故障分类结果如图8所示,可见故障分类结果清晰。详细对比结果见表2,可见故障分类准确率依然可达99%以上,并且有较好的实时性,而直接识别原始信号的DELM方法性能出现较大下降,说明本文方法针对大规模工业状态监测数据具有一定的优势。
本文方法在实时性上极大地缩短了直接对原始信号进行处理的故障诊断时间,能够很好地满足当前工业系统的实时性需求。同时,对于故障诊断的准确率,本文方法通过优化算法自适应地调整隐含层的节点数、正则化系数、KELM的惩罚系数与核参数,使得准确率比直接处理原始信号更高,并且使算法收获了很好的泛化性。因此,CDE方法不只是针对某一种场景做故障诊断,而是提出了一种在数据驱动条件下电磁能装备的通用故障诊断方法系统。对于不同场景的故障分类问题,只需要调整隐含层的层数和压缩率就能较好的适应。
图8 故障分类结果聚类图
Fig.8 Fault classification result clustering diagram
表2 大规模数据集上的结果对比
Tab.2 Comparison of results on large-scale data sets
方法准确率(%)准确率标准差时间/s时间标准差 DELM76.824.6511.493.210 7 CDE(PSO)99.241.420.39140.940 7
2.2.3 压缩率对诊断效率的影响
测量矩阵的大小与压缩率和原始信号的维度紧密相关。通过调整压缩率,本文可以控制测量矩阵的大小和信号的压缩程度。在实践中,高压缩率意味着使用较少的采样点进行压缩感知,因为减少了样本内存和数据处理时间的需求,所以通常可以提高诊断效率。然而,压缩率并不是越高越好,因为过高的压缩率可能导致随机矩阵无法在有限的观测次数中获取原始信号的完整信息,导致信息损失。本文详细研究了压缩率在50%~95%范围内时,故障诊断准确率和诊断时间的变化情况,结果如图9所示。
由图9可知,随着压缩率的逐渐增大,诊断时间呈下降趋势,但诊断准确率也会逐渐降低。当压缩率达到80%时,准确率的下降趋势减缓,而诊断时间的减少更为显著,这为实时在线检测提供了较好的精度与效率。因此,在权衡诊断准确率和诊断时间的基础上,本文选择压缩率为80%。此外,研究结果表明,当采样频率为Nyquist采样率的1/5时,压缩感知方法能够高保真地恢复原始信号,这意味着压缩采样信号包含了大部分故障信息。因此,直接利用压缩采样信号可以高效地实现故障诊断,同时降低存储成本和诊断时间。另外,当压缩率达到95%时,仍然能够保持较高的诊断准确率。对于一些时延敏感且诊断精度要求相对较低的场景,可以考虑采用高压缩率。这样可以大幅度降低数据采集量,从而缓解数据存储与通信的压力,并减少故障诊断时间。
图9 不同压缩率下的准确率和诊断时间变化
Fig.9 Variation in accuracy and diagnostic time at different compression ratios
2.2.4 PSO优化算法对诊断准确率的影响
采用80%的压缩率,3层隐含层设置对比实验,对比未使用PSO优化算法的诊断方法CDE和优化方法CDE(PSO)的诊断准确率和诊断时间。其中,CDE的隐含层节点数手动设置为[100,50,100],CDE(PSO)隐含层节点数寻优区间设置为[10:1000]。诊断结果见表3。
表3 PSO优化算法对诊断准确率的影响
Tab.3 The influence of PSO optimization algorithm on diagnostic accuracy
方法准确率(%)准确率标准差时间/s时间标准差 CDE97.310.720.059 80.002 3 CDE(PSO)99.970.440.060 70.000 7
通过表3分析可知,相比于CDE方法,CDE(PSO)方法的诊断准确率更高,但诊断时间稍有增加。通过对PSO优化算法的分析可知,诊断时间主要受粒子群迭代次数的影响。如图10所示,通过绘制适应度曲线,发现最优解时的粒子群迭代次数通常为3次,而本实验的粒子群初始迭代次数设置为10次,因此额外增加了一些迭代时延。当设置迭代达到最优解时跳出循环,PSO优化所增加的时间几乎可以忽略。经过PSO优化后的CDE方法参数见表4。
表4 CDE与CDE(PSO)方法参数对比
Tab.4 Comparison of CDE and CDE(PSO) parameters
方法CDECDE(PSO) 隐藏层节点数100-50-10065-57-94 正则化系数100111.948 2 惩罚系数100583.250 9 核参数100210.238 2
图10 PSO优化算法适应度曲线
Fig.10 PSO optimization algorithm fitness curve
2.2.5 模型轻量化对模型性能的影响
为了验证模型轻量化对模型性能的影响,主要利用模型推理时延和推理准确率指标来进行评价。在单核终端驱动的系统上,本文也可以使用简单的指标来预测模型推理时延,比如剪枝参数比例、剪枝运算比例、剩余参数量、浮点操作次数等。应用双向剪枝技术前后模型在边缘智能设备上的性能变化见表5。由表5可得,本文所采用的模型轻量化技术使得模型推理时延加速平均达到了6.82倍。由于特征映射剪枝中的信息损失可能影响模型的精度,于是本文研究了修剪参数百分比与模型精度之间的权衡。
表5 不同策略的剪枝参数比例和时延加速对比
Tab.5 Comparison of the proportion of pruning parameters and time delay acceleration of different strategies
方法剪枝参数比例(%)加乘次数/106准确率(%)执行时间/ms DKELM—398.1499.9760.764 1 DKELM-EI88.50195.8798.827.770 3
DKELM模型的精度损失与修剪参数百分比之间的权衡关系如图11所示。这条曲线表示在相同的数据集上实现的模型精度损失阈值分别对应的模型参数修剪百分比。本文观察到对于DKELM网络,剪枝参数量百分比小于90%就可以保证精度损失小于5%。
图11 DKELM模型的精度与修剪参数比例的关系
Fig.11 Accuracy of the DKELM model versus scale of pruning parameters
考虑到测试样本与训练集来自同一原始数据集,为验证本文方法的通用性,在自制的故障数据仿真平台上对该方法进行验证,故障数据仿真平台如图12所示。同时选取最新故障诊断方法(基于粒子群优化算法优化的堆叠去噪自编码器(Particle Swarm Optimization-Stacked Denoising Autoencoder, PSO-SDAE)[16]、一维卷积神经网络(1D Convolutional Neural Network, 1D-CNN)[17]和基于压缩感知的多尺度网络(Compressed Sensing-Informative Multiscale Networks, CS-IMSNs)[18]进行比较。
图12 故障数据仿真平台
Fig.12 Fault data simulation platform
对以上四种方法的输入数据维度、诊断时间、诊断准确率、准确率标准差分别进行比较,实验结果见表6。为保证实验的可靠性,实验结果采用20次实验的平均值。
表6 对比不同诊断方法的实验结果
Tab.6 The experimental results of different diagnostic methods were compared
方法维度时间/s准确率(%)标准差(%) CDE(PSO)1 000×9600.1698.820.47 PSO-SDAE1 000×4 8004.1795.244.36 1D-CNN1 000×4 8003.2296.613.87 CS-IMSNs1 000×1 20011.992.41.4
由表6可知,本文方法由于采用了压缩感知的方法,所采集的输入数据维度远小于其他方法,这将极大地减少故障诊断的时间。相对于改进的算法PSO-SDAE,该算法在结构上与本文的故障诊断算法有一定的相似性,但本文方法通过结合压缩感知与边缘智能部署,对准确率和实时性的提升更高,且稳定性更强。优化算法1D-CNN由于采用了卷积神经网络,虽然在精度方面相对于其他两种方法有所提升,但相对于本文方法来说有一定差距。同时,本文方法最明显的优势在于采集的样本数据量少,这对于降低存储成本和诊断时间十分重要。最后,对于同样采用了压缩感知的算法CS-IMSNs,由于需要训练多种尺度的神经网络,诊断时间与本文方法相比有明显的差距,且对于陌生的数据集故障诊断准确率不高,通用性不强。
针对电磁能装备关键部件健康状态监测过程出现的数据量过大、特征提取计算复杂和实时性差等局限,本文提出了一种基于边缘智能的电磁能装备轻量化故障诊断方法。验证了压缩采样信号的可恢复性,并研究了本文方法的有效性及其影响因素,同时与现有的方法进行了比较。经过验证,该方法具有较高的实时性和诊断精度,明显优于现有方法。此外,该方法显著降低了故障诊断过程中的传输、存储和计算压力。最后,本文将本文方法通过边缘智能部署应用到实际电磁能装备平台,取得了理想的试验效果,验证了本文方法的实际应用价值。
参考文献
[1] 马伟明. 关于电工学科前沿技术发展的若干思考[J]. 电工技术学报, 2021, 36(22): 4627-4636.
Ma Weiming. Thoughts on the development of frontier technology in electrical engineering[J]. Transactions of China Electrotechnical Society, 2021, 36(22): 4627-4636.
[2] Tidriri K, Chatti N, Verron S, et al. Bridging data-driven and model-based approaches for process fault diagnosis and health monitoring: a review of researches and future challenges[J]. Annual Reviews in Control, 2016, 42: 63-81.
[3] 任翔宇, 秦勇, 王彪, 等. 基于博弈映射学习的多传感源信息融合三相电机智能故障诊断方法[J]. 电工技术学报, 2023, 38(17): 4633-4645.
Ren Xiangyu, Qin Yong, Wang Biao, et al. An intelligent multi-sensor information fusion fault diagnosis method of three-phase motors based on game mapping learning[J]. Transactions of China Electrotechnical Society, 2023, 38(17): 4633-4645.
[4] 李世晓, 杜锦华, 龙云. 基于一维卷积神经网络的机电作动器故障诊断[J]. 电工技术学报, 2022, 37(增刊1): 62-73.
Li Shixiao, Du Jinhua, Long Yun. Fault diagnosis of electromechanical actuators based on one-dimensional convolutional neural network[J]. Transactions of China Electrotechnical Society, 2022, 37(S1): 62-73.
[5] Donoho D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.
[6] Chen Junxin, Sun Shuang, Zhang Libo, et al. Compressed sensing framework for heart sound acquisition in Internet of medical things[J]. IEEE Transactions on Industrial Informatics, 2022, 18(3): 2000-2009.
[7] Tang Jiexiong, Deng Chenwei, Huang Guangbin. Extreme learning machine for multilayer perceptron[J]. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(4): 809-821.
[8] Deng Shuiguang, Zhao Hailiang, Fang Weijia, et al. Edge intelligence: the confluence of edge computing and artificial intelligence[J]. IEEE Internet of Things Journal, 2020, 7(8): 7457-7469.
[9] Houssein E H, Gad A G, Hussain K, et al. Major advances in particle swarm optimization: theory, analysis, and application[J]. Swarm and Evolutionary Computation, 2021, 63: 100868.
[10] 黄凯, 丁恒, 郭永芳, 等. 基于数据预处理和长短期记忆神经网络的锂离子电池寿命预测[J]. 电工技术学报, 2022, 37(15): 3753-3766.
Huang Kai, Ding Heng, Guo Yongfang, et al. Prediction of remaining useful life of lithium-ion battery based on adaptive data preprocessing and long short-term memory network[J]. Transactions of China Electrotechnical Society, 2022, 37(15): 3753-3766.
[11] 刘会兰, 许文杰, 赵书涛, 等. 面向高压断路器故障分类的电流-振动信号类聚几何敏感特征优选方法[J]. 电工技术学报, 2023, 38(1): 26-36.
Liu Huilan, Xu Wenjie, Zhao Shutao, et al. Optimization method of clustering geometric sensitive features of current vibration signals for fault classification of high voltage circuit breakers[J]. Transactions of China Electrotechnical Society, 2023, 38(1): 26-36.
[12] Cao Siyu, Zou Feng, Chen Debao, et al. A new hybrid prediction model with entropy-like kernel function for dynamic multi-objective optimization[J]. Applied Intelligence, 2023, 53(9): 10500-10519.
[13] Ghojogh B, Ghodsi A, Karray F, et al. Reproducing kernel Hilbert space, mercer’s theorem, eigenfunctions, nyström method, and use of kernels in machine learning: tutorial and survey[EB/OL]. 2021: 2106. 08443.https://arxiv.org/abs/2106.08443v1.
[14] 文云峰, 赵荣臻, 肖友强, 等. 基于多层极限学习机的电力系统频率安全评估方法[J]. 电力系统自动化, 2019, 43(1): 133-140.
Wen Yunfeng, Zhao Rongzhen, Xiao Youqiang, et al. Frequency safety assessment of power system based on multi-layer extreme learning machine[J]. Automation of Electric Power Systems, 2019, 43(1): 133-140.
[15] 宋向金, 孙文举, 刘国海, 等. 深度子领域自适应网络电机滚动轴承跨工况故障诊断[J]. 电工技术学报, 2024, 39(1): 182-193.
Song Xiangjin, Sun Wenju, Liu Guohai, et al. Across working conditions fault diagnosis for motor rolling bearing based on deep subdomain adaption network[J]. Transactions of China Electrotechnical Society, 2024, 39(1): 182-193.
[16] Jia Ning, Cheng Yao, Liu Yunyang, et al. Intelligent fault diagnosis of rotating machines based on wavelet time-frequency diagram and optimized stacked denoising auto-encoder[J]. IEEE Sensors Journal, 2022, 22(17): 17139-17150.
[17] 杨洁, 万安平, 王景霖, 等. 基于多传感器融合卷积神经网络的航空发动机轴承故障诊断[J]. 中国电机工程学报, 2022, 42(13): 4933-4942.
Yang Jie, Wan Anping, Wang Jinglin, et al. Aeroengine bearing fault diagnosis based on convolutional neural network for multi-sensor information fusion[J]. Proceedings of the CSEE, 2022, 42(13): 4933-4942.
[18] Hu Zhongxu, Wang Yan, Ge Mingfeng, et al. Data-driven fault diagnosis method based on compressed sensing and improved multiscale network[J]. IEEE Transactions on Industrial Electronics, 2020, 67(4): 3216-3225.
The Lightweight Fault Diagnosis Method of Electromagnetic Energy Equipment Based on Edge Intelligence
Abstract With the proliferation of massive state monitoring data, the health status monitoring of critical components in complex electromagnetic energy equipment demands increasingly stringent requirements for real-time and reliable performance. Edge intelligence technology, dedicated to decentralizing intelligent algorithms and computational resources to the device end, presents a promising approach to addressing the challenges of fault diagnosis in such systems. This paper introduces a novel lightweight fault diagnosis method leveraging edge intelligence, which processes data near its source, mitigating issues related to limited resources in industrial embedded systems and the delays caused by massive data transmission.
At the heart of our proposed method is the application of compressive sensing during data acquisition. This technique effectively compresses dense, multivariate monitoring data into a sparse form, significantly reducing data volume while preserving critical fault-related information. The subsequent integration of deep extreme learning machines (DELM) and kernel functions allows for a profound exploration of the relationships between the compressed data and potential faults. The model is then refined through lightweight techniques, making it suitable for deployment on edge computing devices, thus minimizing the demands on data transmission, computation, and storage resources.
The effectiveness of our method is empirically validated through rigorous testing on an EdgeBoard AI computing platform, a device designed to emulate real-world industrial conditions. The results are compelling: the method achieves a diagnostic accuracy exceeding 99%, with a diagnosis time well within the millisecond range, underscoring its potential for real-time industrial applications. A detailed analysis of the impact of compression ratio on diagnostic efficiency reveals that an 80% compression rate offers the optimal balance between accuracy and speed. Moreover, the incorporation of particle swarm optimization (PSO) into the model further enhances its performance by dynamically optimizing key parameters, leading to superior generalization and classification accuracy.
The robustness of our method is further demonstrated through its application on a fault data simulation platform, where it is compared against state-of-the-art fault diagnosis techniques. The results indicate that our method not only requires less input data dimensionality but also significantly outperforms other methods in terms of diagnostic time and accuracy. The use of temporal-spatial features, extracted through a combination of convolutional neural networks (CNN) for spatial learning and simple recurrent units (SRU) for temporal dynamics, contributes to the model's high performance. The SRU, in particular, stands out for its ability to mitigate the gradient disappearance problem and reduce computational costs compared to traditional recurrent neural networks like LSTM and GRU. The model's resilience to input data noise, as evidenced by the inclusion of Gaussian noise in the tests, further attests to its robustness in practical scenarios.
The study concludes that the edge intelligence-based fault diagnosis method is not only a significant advancement over existing methods in terms of real-time processing and diagnostic precision but also substantially alleviates the computational and transmission burdens associated with fault diagnosis. The successful validation on both the EdgeBoard AI platform and the fault data simulation platform confirms the method's practical applicability and its potential to revolutionize the field of intelligent fault diagnosis for electromagnetic energy equipment.
Keywords:Compressed sensing, deep extreme learning machine, kernel function, lightweight fault diagnosis
中图分类号:TP39; TM15
DOI: 10.19595/j.cnki.1000-6753.tces.240230
国家自然科学基金(62102436)和湖北省自然科学基金(2020CFB339, 2021CFB279)资助项目。
收稿日期 2024-02-02
改稿日期 2024-05-22
单南良 男,1995年生,博士研究生,研究方向为人工智能技术在复杂装备系统中的应用。
E-mail:21001401@nue.edu.cn
廖 涛 男,1987年生,助理研究员,研究方向为电磁发射技术和故障诊断预测等。
E-mail:xgliaotao@163.com(通信作者)
(编辑 赫 蕾)