基于嵌入式YOLO网络的电力绝缘子自爆缺陷检测

李 鹏1 宿雲龙1 宁 昊1 孟庆伟1 魏 强2

(1. 中国石油大学(华东)新能源学院 青岛 266580 2. 国网新疆电力有限公司 乌鲁木齐 830018)

摘要 针对现有绝缘子检测模型参数量和计算复杂度较高,难以在计算资源和存储资源有限的无人机等移动巡检设备上部署的问题,该文首先设计基于深度可分离卷积、Ghost Net网络和SimSPPF空间金字塔池化,重构了一种轻量化YOLOv5s绝缘子自爆缺陷检测网络,以降低模型参数量和模型复杂度。然后对轻量化模型采用结构化剪枝的方法对模型冗余的卷积层进行裁剪,实现模型的进一步压缩;同时,通过知识蒸馏技术弥补模型剪枝造成的检测性能损失,将最终的轻量化模型在绝缘子自爆缺陷检测数据集上进行实验。结果表明,该文提出的模型在保证检测精度的前提下,大大降低了模型复杂度,推理检测速度明显提升。最后,将该文轻量化模型部署至以RK3588为核心的嵌入式设备进行绝缘子自爆缺陷实时检测,测试结果显示该文提出的模型在嵌入式设备的实时推理帧率达到85帧/s,较YOLOv5s原模型的推理速度提升1.89倍,同时能够精确地检测出绝缘子的自爆缺陷部位,显著提高了绝缘子自爆缺陷检测的效率。

关键词:绝缘子检测 轻量化 剪枝 知识蒸馏 嵌入式

0 引言

电能作为社会发展的关键能源,其需求量不断攀升,使得输电线路的建设也持续加快。绝缘子作为输电线路至关重要的组成部分,在电气隔离和机械支持方面扮演着重要角色。但由于绝缘子长期暴露在户外,极端温度、污秽、雷电等恶劣的自然环境会导致绝缘子出现掉串与爆裂等故障,由其引发的事故超过电力故障的一半,对电力系统的稳定运行构成了巨大的安全隐患[1]。为确保输电线路的安全运行,及时巡检输电线路、监测绝缘子的工作状态及排查绝缘子的缺陷显得至关重要[2]。然而传统的人工巡检方式,仅凭工人经验主观判断绝缘子状态,检测效率低、成本高昂且容易漏检或误检[3-4],不符合目前输电线路巡检的智能化、信息化要求。无人机巡检方式多采用云计算模式巡检,将实时采集的待检测绝缘子图像上传到后端的云计算中心进行数据分析、处理,其数据传输延迟、网络宽带要求大、能耗高,难以满足绝缘子缺陷检测的实时性要求。自2021年开始,国家电网公司积极开展输电线路边缘端目标检测即时处理能力的建设,边缘计算的迅速发展为绝缘子自爆缺陷检测提供了新的解决途径。将目标检测算法部署至嵌入式设备,在实时采集图像数据的边缘端进行数据处理与分析,解决了边缘端大量图像数据的传输与计算问题。然而,这种方法也面临着两个主要问题:①嵌入式设备的内存资源有限,无法部署常规大型目标检测算法;②嵌入式设备的计算能力低,在其部署常规目标检测算法运行时推理速度慢,难以满足缺陷检测的实时性需求。因此,亟待开发一种检测精度与检测速度相均衡的轻量化目标检测算法,实现嵌入式设备在边缘端的绝缘子自爆缺陷智能巡检。

当前,基于深度学习的目标检测算法可分为以YOLO(you only look once)系列[5]为代表的One-stage算法和以区域卷积神经网络(Region Convolutional Nenral Network, R-CNN)[6]为代表的Two-stage算法。YOLO作为One-stage算法的典型网络,其核心思想是将目标检测任务视为一个回归问题,在一个端到端的神经网络中同时完成目标定位和分类,在图像上直接预测边界框的坐标和分类。YOLO系列算法的检测速度特别快,且在准确性和速度之间取得了良好的平衡。当前,国内外学者对YOLO目标检测的绝缘子自爆缺陷研究主要集中在提升检测精度方面。通过优化网络结构、引入性能优异的特征提取与融合技术来捕捉和分析绝缘子缺陷的细节和特征,从而提高检测的准确度和可靠性。文献[7]提出一种基于层次多任务深度学习的绝缘子自爆缺陷检测模型,通过卷积神经网络结合多任务学习、特征融合及合成图像数据增强方法,有效提升了分类准确率和自爆缺陷检测性能;文献[8]改进了Mask R-CNN模型,通过引入卷积块注意力模块(Convolutional Block Attention Module, CBAM)注意力模块和Tversky损失,增强了绝缘子自爆缺陷检测的精度和分割性能,提升复杂背景下的鲁棒性;文献[9]提出一种基于YOLOv3的模型,采用ResNet18主干网络和多尺度特征融合方法,提升绝缘子自爆缺陷检测的精度和实时性,适用于复杂环境下的电网巡检;文献[10]将YOLOv5与通道注意力机制和空间注意力机制相结合设计特征平衡网络和特征增强模块,捕获检测目标的通道关系和目标信息,模型具有较强的泛化能力;文献[11]构建YOLOv5-dense检测模型并引入SimAM注意力模块,实现绝缘子区域的精准定位。上述方法均在计算资源与存储资源丰富的服务器端运行,因其添加了大量的复杂模块,模型体积庞大,难以部署在计算资源和存储资源有限的嵌入式设备中,无法实现边缘端的高效绝缘子缺陷检测。

也有少数学者展开对轻量化模型的绝缘子缺陷检测研究,通过将轻量化的主干网络与目标检测相结合,降低模型体积与计算复杂度;运用剪枝等模型压缩技术剪去模型冗余通道,实现模型轻量化。文献[12]采用轻量化策略对YOLOv3进行改进,包括使用深度可分离卷积优化主干网络和设计Dense-SPP模块增强特征提取能力,并通过四维度预测层提高对小目标自爆缺陷的检测性能;文献[13]将YOLOv4与增加坐标注意力机制的Mobile Net相结合,实现检测网络的轻量化;文献[14]对YOLOv5主干网络的残差模块进行轻量化改进,在减小模型体积的同时,提高模型对绝缘子自爆缺陷的检测准确率与检测速度;文献[15]提出了一种基于轻量化网络和增强多尺度特征融合的改进YOLOv5模型,显著提高了绝缘子缺陷的实时检测性能和效率;文献[16]提出基于轻量级RT-DETR的算法,结合特征交互模块与迁移学习方法,实现绝缘子自爆缺陷检测的高效性与边缘部署的适配性;文献[17]在YOLOv8中引入深度可分离卷积和局部卷积减少网络参数量,采用BiFPN网络结构轻量化网络模型;文献[18]在改进YOLOv5模型的基础上进行通道剪枝和微调,提高模型对绝缘子掉串的检测精度与速度;文献[19]对YOLOv8进行基于层自适应幅度的剪枝,减少模型参数量,然后运用知识蒸馏技术弥补剪枝而损失的精度。上述方法虽然在一定程度上对模型进行了压缩,但模型体积仍然过大,且均未在边缘端进行模型部署与优化加速,并未实现边缘端的目标实时检测。

针对上述问题,本文提出一种用于电力绝缘子自爆缺陷检测的嵌入式YOLO网络模型,并将其部署至嵌入式设备进行实时目标检测,主要工作如下:

1)设计了一种基于深度可分离卷积和Ghost Net的轻量化YOLO主干网络,同时将网络中空间金字塔池化(Spatial Pyramid Pooling Fast, SPPF)模块中的SiLU激活函数替换为ReLU激活函数,构建轻量化空间金字塔模块SimSPPF;采用基于L1范数的权重剪枝,对模型进行进一步的压缩,在保证模型检测精度的前提下,裁剪网络结构中的大量冗余,实现模型轻量化。

2)充分利用知识蒸馏技术将精度较高的教师大模型网络的丰富知识迁移至剪枝后的轻量化YOLO学生网络,从而提升压缩模型的检测精度。

3)将本文提出的轻量化模型部署至基于RK3588的嵌入式设备终端进行测试,结果表明本文方法能够在边缘端实现绝缘子自爆缺陷目标的高效实时检测。

1 轻量化绝缘子自爆缺陷检测模型

YOLO作为绝缘子目标检测领域的主流模型之一,在检测准确性和检测速度之间取得了良好的平衡,但是当前的绝缘子检测模型复杂度较高,往往需要借助高性能GPU服务器进行模型设计和测试。面对计算和内存资源有限的无人机等移动终端设备,上述大模型很难在边缘端部署使用。为了解决这一问题,本文设计了一种新的轻量化嵌入式YOLO网络模型,首先通过模型轻量化极大地压缩模型的参数量和计算量,然后利用知识蒸馏方法将教师模型的检测精度迁移至轻量化模型,从而在保证绝缘子自爆缺陷检测精度的前提下实现模型的高效运行。

本文针对目前应用较为普遍的YOLOv5s模型进行轻量化改进,改进后的轻量化YOLOv5s网络结构主要包括主干网络(Backbone)、颈部网络(Neck)和头部网络(Head)三部分[20],如图1所示。首先,本文将深度可分离卷积与Ghost Net相融合构建新的GDWConv卷积模块和C3GDW模块,重构轻量化主干网络,减少模型计算量、降低计算复杂度;其次,在原始SPPF空间金字塔池化基础上构建SimSPPF空间金字塔池化结构,并通过结构化权重剪枝进一步减少模型参数量,加快模型的推理速度;最后,利用知识蒸馏手段提升轻量化模型的绝缘子目标检测性能。

width=222.25,height=257.4

图1 轻量化YOLOv5s网络结构

Fig.1 Lightweight YOLOv5s network structure

1.1 轻量化主干网络构建

卷积层作为目标检测模型的主要基础组件,执行特征提取及特征融合,卷积操作可以通过滑动卷积核计算输入数据的局部特征。为实现检测模型的轻量化卷积运行,在保证检测精度的前提下,减少模型参数量、降低计算复杂度,本文使用深度可分离卷积[21]代替模型中的普通卷积,其结构如图2所示。

width=230.2,height=92.05

图2 深度可分离卷积结构

Fig.2 Depth-separable convolutional structure

为了从图像中获取更多的特征信息,加深对数据的理解,往往构建更深层次、更复杂的深度学习网络。在生成对模型精度至关重要的特征图所涉及的卷积操作中,由于网络参数众多,需要大量的计算资源,也会导致大量的特征冗余。然而,嵌入式计算设备的存储和计算资源有限,在其中部署复杂的目标检测算法较为困难。文献[22]提出的即插即用Ghost卷积模块,其核心理念在于使用少量的参数进行特征映射的生成,而不是传统的完整卷积操作。能够在卷积过程中减少计算量,并有效地利用模型中的计算资源,模型能够在不牺牲模型性能的前提下,处理复杂目标检测任务。

本文将深度可分离卷积与Ghost Net相融合构建GDWConv卷积模块,其结构如图3所示。

width=225.2,height=57.1

图3 GDWConv卷积结构

Fig.3 GDWConv convolutional structure

特征图输入后经过深度可分离卷积进行特征信息提取并生成众多特征图,一部分特征图恒等映射保留原本特征,另一部分采用Ghost核对特征图进行卷积操作生成特征图。最后,将两组特征图进行组合得到GDWConv卷积轻量化卷积模块的输出特征图。GDWConv卷积模块使用深度可分离卷积及卷积和线性变换的组合代替普通的卷积运算,有效地降低了模型的计算量和参数量。

为了在保持检测精度的同时减少网络参数和计算量,提出了一种改进的C3GDW模块,将颈部结构的GDWBottleneck替代原始网络C3模块中的Bottleneck结构。C3GDW结构如图4所示,GDWBottleneck由GDWConv卷积模块组成,主要包括两个GDWConv卷积操作。根据卷积核的步长分为两类操作,当卷积核步长为1时,不进行下采样,直接通过两个GDWConv卷积操作来扩展输入特征图的通道数;而当步长为2时,进行下采样并增加一个步长为2的深度可分离卷积操作。

width=227.7,height=135.65

图4 C3GDW结构

Fig.4 C3GDW structure

1.2 空间金字塔池化SimSPPF

空间金字塔池化主要处理不同尺寸的输入图像或特征映射,使其能够提取多尺度的特征,从而捕捉到更全面的特征信息。YOLOv5s中使用了SPPF结构[23],本文为了进一步减少模型参数量,加快模型的推理速度,将SPPF结构中的SiLU激活函数替换为计算复杂度更低的ReLU激活函数,构建SimSPPF空间金字塔池化结构。SimSPPF模块结构如图5所示。

width=207.9,height=123.9

图5 SimSPPF模块结构

Fig.5 SimSPPF structure

1.3 结构化权重剪枝

结构化剪枝是一种优化神经网络的技术,根据神经元的重要性对网络结构进行精确的修剪,以实现模型的高效化和优化。这种剪枝方法与简单地删除权重不高的神经元的非结构化剪枝不同,它更注重保持网络的整体结构完整性,从而在减少计算成本的同时最大限度地保持模型的性能。文献[24]对于剪枝的研究集中于卷积层的结构性剪枝方法,其特点是根据L1范数计算某一卷积核的绝对权重,然后对网络共享较低的卷积核将会被移除,在剪枝过程中同卷积核对应的通道也将被移除,这种剪枝方法不会引入稀疏性且没有破坏原有的网络结构,无需额外的专用硬件支持,更适合在嵌入式设备上部署。

在剪枝之后,通过一次剪枝和再训练的策略进行网络的重新训练以补偿性能的下降,使其尽可能地恢复到原来的检测精度,并且可以通过小于原始网络训练的时间再次训练,以恢复准确性的损失。

1.4 知识蒸馏

知识蒸馏是一种进一步提高模型检测精度的重要手段[25]。在权重剪枝之后,虽然轻量化模型的参数量和模型体积都大大减少,但模型的绝缘子自爆缺陷检测性能通常也会有一定程度的下降,即使通过微调也难以恢复到原有的检测性能。为了尽可能地消除权重剪枝导致的性能下降,本文使用知识蒸馏技术来提高模型性能。

1.4.1 知识蒸馏整体架构

知识蒸馏使用教师-学生训练模式,由一个结构复杂且检测精度更高的教师模型将知识迁移至模型简单且检测精度更低的学生模型蒸馏,可以辅助学生模型更好地学习绝缘子自爆缺陷目标的信息,实现兼顾精度与速度的电力绝缘子自爆缺陷检测。知识蒸馏的具体框架如图6所示。首先绝缘子数据集输入教师网络和学生网络后得到输出,然后计算学生网络与教师网络之间的蒸馏损失,具体损失函数包括目标损失函数、分类损失函数、坐标回归损失函数三部分。在不断迭代过程中蒸馏损失函数不断地减小并收敛,以此引导学生网络学习教师网络的知识,不断向教师网络逼近,提高学生网络的目标检测性能。

width=207.9,height=182.9

图6 知识蒸馏框架

Fig.6 Knowledge distillation framework

1.4.2 知识蒸馏损失函数构造

对于YOLOv5网络而言,其损失函数由目标置信度损失函数width=15.45,height=15.45、分类损失函数width=14.95,height=14.95、坐标回归损失函数width=14.95,height=14.95三部分组成。其中目标置信度损失用于预测框中包含正确目标的概率,分类损失用于预测边界框所对应的类别,坐标回归损失用于预测边界框的大小和位置。通过多轮的训练迭代,损失值逐步减小并趋向稳定,模型的预测结果逐渐接近真实值。YOLOv5的具体损失函数width=25.25,height=14.95

width=181.8,height=18.25 (1)

式中,width=10.3,height=14.95width=12.15,height=14.95width=10.3,height=17.75分别为目标置信度、类别概率和边界框坐标的模型预测值;width=14.5,height=15.45width=15.45,height=15.45width=14.5,height=15.45分别为目标置信度、类别概率和边界框坐标的真值。

由于标准的蒸馏方法会将教师网络预测中被忽略的边界框也转移到学生网络中,使得学生网络学习了教师网络预测背景区域中的错误边界框,影响了学生网络的边界框回归训练,导致其目标检测性能下降。针对这一问题,对目标损失函数进行修改,其思想是只有教师网络预测的客观值较高时,学生网络才会学习教师网络的边界框坐标和类别概率。修改后的目标损失函数width=25.25,height=17.75

width=140.7,height=17.75 (2)

式中,width=12.15,height=15.45为学生网络预测目标值;width=12.6,height=15.45为教师网络预测目标值;width=48.15,height=17.75width=46.75,height=17.75分别为学生网络目标损失函数和蒸馏目标损失函数;width=14.5,height=14.95为蒸馏损失平衡系数。

若教师网络对图像背景区域中的边界框进行预测,则目标损失函数中迭代后的教师网络预测目标值width=12.6,height=15.45将会接近于0,将width=12.6,height=15.45作为加权因子分别引入学生网络的分类损失函数与回归损失函数中,可以有效地解决教师网络将背景信息迁移至学生网络而导致的检测性能降低的问题。修改后的分类损失函数width=25.25,height=15.45

width=156.15,height=15.45 (3)

式中,width=14.5,height=15.45为学生网络的分类预测目标值;width=14.5,height=15.45为教师网络的分类预测目标值;width=12.6,height=15.45为迭代后教师网络预测的目标概率;width=50.05,height=15.45width=49.1,height=15.45分别为学生网络分类损失函数和蒸馏分类目标损失函数。

修改后的坐标回归损失函数为

width=148.7,height=17.75 (4)

式中,width=12.15,height=17.75为学生网络的坐标回归预测目标值;width=12.6,height=15.45为教师网络的坐标回归预测目标值;width=45.8,height=17.75width=44.9,height=17.75分别为学生网络边界框损失函数和蒸馏边界框目标损失函数。

知识蒸馏的整体损失函数为

width=114.6,height=17.75 (5)

2 实验结果与分析

2.1 数据集创建

本文绝缘子数据集采用开源的中国输电线路绝缘子数据集[26]和第八届数据挖掘挑战赛[27]的部分绝缘子数据,经整理构建高质量的绝缘子数据集,最终构成包含1 450张绝缘子图片的数据集。绝缘子缺陷检测数据集涵盖输电线路下的典型场景,包括晴天、阴天等不同光照条件下的电力绝缘子图像,图像背景有平原、河流、山地、林地等复杂场景,可用于全方位验证本文算法模型的绝缘子自爆缺陷检测性能。将绝缘子分为正常绝缘子(insulator)和自爆缺陷绝缘子(defect)两类。使用Labelimg数据标注工具对数据集中每张图片内的所有正常绝缘子与自爆缺陷绝缘子进行人工标注,将绝缘子数据集按照8:1:1的比例随机划分为训练集、验证集和测试集。数据集中部分绝缘子图像如图7所示。

width=225.2,height=172.15

图7 绝缘子数据集部分图像

Fig.7 Partial images of the insulator dataset

2.2 实验条件

本实验在Windows 10操作平台上进行,其内存为32 GB,显卡型号为NVIDIA GEFORCE RTX 3080 Ti,处理器为Intel(R) Core(TM) i9-10850K 3.6 GHz,编译语言为Python3.10,cuda版本为11.1,基于pytorch1.8.0+cu111的深度学习框架进行模型的训练与测试工作。本文实验选用YOLOv5s.pt文件作为预训练权重,训练超参数设置见表1。

表1 超参数设置

Tab.1 Hyper parameter setting

参数数值 模型训练轮数300 剪枝再训练轮数200 模型蒸馏轮数100 批次数量16 图片像素640×640 变并比阈值0.5

(续)

参数数值 初始学习率0.01 学习率动量0.937 权重衰减系数0.000 5 优化器Adam

2.3 评估指标

本文按照目标检测算法常用的多类别平均精度mAP、单位时间检测帧数(Frame per Second, FPS)、推理时间,模型体积、参数量、计算量作为评价指标,对模型性能进行有效评估,其中mAP为

width=88.35,height=40.2 (6)
width=53.3,height=26.65 (7)
width=56.1,height=26.65 (8)

式中,width=11.7,height=11.7为精确率;width=11.7,height=11.7为召回率;TP为模型正确预测的正样本数量;FP为模型错误预测了负样本为正样本的数量;FN为模型错误地预测了正样本为负样本的数量;width=12.15,height=12.15为类别数量。

2.4 基准模型选取实验

对于YOLO系列目标检测模型而言,YOLOv5、v8、v10版本在设计上优化了计算效率,因其轻量化的网络结构、易于部署和快速推理等优点广泛应用于边缘计算设备和移动设备。针对本文构建的1 450张绝缘子图片的较少样本数据集,为防止简单模型的欠拟合及复杂模型的过拟合,选用YOLO的“s”版本模型进行实验对比,以此选择适合本数据集的模型作为基准模型,对比实验结果见表2。

表2 YOLO系列对比实验结果

Tab.2 YOLO series comparison experiment results

模型参数量/(106个)计算量/G模型体积/MBmAP(%) YOLOv5s7.0215.814.485.9 YOLOv8s11.1328.422.586.6 YOLOv10s8.0424.416.583.2

根据表2,YOLOv5s具有7.02×10-6的参数量和15.8 G的计算量,其模型体积仅为14.4 MB,使其在资源受限的边缘计算环境中能够实现高效的推理。特别是在处理本文较小数据集时,YOLOv5s能够有效地避免过拟合现象,提升模型的泛化能力。此外,YOLOv5s在该数据集上的平均精度均值达到了85.9%,其检测性能与更复杂的YOLOv8s和YOLOv10s相差不大,这进一步验证了其在小规模数据上的适应性。因此,基于YOLOv5s应用剪枝与知识蒸馏等轻量化技术,能够在保证检测精度的前提下,显著提升模型的运行效率,切实满足边缘计算部署与实时检测的实际需求。

针对本文构建的数据集,为了选择性能与效率均衡的基准模型,对YOLOv5的各版本模型进行性能对比,具体对比结果见表3,其中YOLOv5s的参数量和计算量分别为7.02×106和15.8 G,在本数据集上准确率高达85.9%,展现出检测精度和模型体积的理想均衡。与YOLOv5n相比,YOLOv5s在检测准确率上有显著提升;在推理时间方面,YOLOv5s达到了3.8 ms,明显低于更大体积的YOLOv5m、YOLOv5l和YOLOv5x,从而在资源受限的边缘计算场景中实时检测更具优势。此外,YOLOv5s的模型体积为14.4 MB,较好地适应了对内存占用有严格限制的边缘计算设备需求。综合来看,YOLOv5s在低参数量和低计算量的基础上提供了高效的推理速度与检测精度,因此,选用YOLOv5s为轻量化处理的基准模型。

表3 YOLOv5系列对比实验结果

Tab.3 YOLOv5 series comparison experiment results

模型参数量/(106个)计算量/G模型体积/MBmAP(%) YOLOv5n1.764.13.976.8 YOLOv5s7.0215.814.485.9 YOLOv5m20.8647.942.282.8 YOLOv5l46.11107.792.887.2 YOLOv5x86.18203.8173.185.9

2.5 模型轻量化对比实验

为了验证剪枝后的轻量化模型性能,在所构建的绝缘子数据集下训练各个目标检测模型,每次训练使用相同的训练策略与训练技巧,通过实验验证基于YOLOv5s模型轻量化的有效性。首先在YOLOv5s基础上逐一加入Ghost Net网络、深度可分离卷积及空间金字塔池化SimSPPF模块,然后对方案4进行剪枝,遍历Backbone部分中的所有GDWConv和SimSPPF,设置剪枝率为0.8,通过剪枝进一步压缩模型。实验结果见表4。

由表4可知,方案2在原始YOLOv5s模型的基础上引入Ghost Net网络,不但模型mAP值有一定提升,而且模型的参数量、计算量及模型体积大幅降低,说明Ghost Net网络可以使用更低成本的计算方式实现模型轻量化,同时保持网络模型的检测性能。方案3继续引入深度可分离卷积,构建GDWConv和C3GDW,在损失较小精度的情况下进一步减少模型的计算量、参数量与模型体积,这得益于深度可分离卷积操作中实现了输入特征图在空间与通道上的特征提取分离。方案4中引入SimSPPF,在模型复杂度基本不变的情况下,检测性能与推理时间也有一定的提升,说明SimSPPF中的Relu激活函数更有利于加快模型推理速度,提高模型对自爆缺陷检测的效率。最后,对方案5模型进行权重剪枝,以剔除模型中作用较低的卷积核,进一步对模型进行压缩。较YOLOv5s原模型,方案5模型的参数量减少了64.2%、计算量减少了76.0%、模型体积减小了61.8%,模型推理速度也明显降低。证明本文所提出的YOLOv5s模型轻量化的可行性,满足对于内存资源有限的嵌入式设备部署检测要求。

表4 YOLOv5s轻量化对比实验结果

Tab.4 YOLOv5s lightweight comparison experiment results

方案模型名称Ghost NetDWConvSimSPPF剪枝参数量/(106个)计算量/G模型体积/MBmAP(%)推理时间/ms 1YOLOv5s7.0215.814.485.93.8 2YOLOv5s-G√3.688.17.886.53.0 3YOLOv5s-GD√√2.906.26.384.22.6 4YOLOv5s-GDS√√√2.906.26.384.62.1 5YOLOv5s-GDSP√√√√2.513.85.578.51.5

2.6 知识蒸馏对比实验

模型剪枝虽然能够裁去模型的冗余卷积核,实现模型轻量化,但这一过程往往也伴随着模型检测性能的丢失,由表4可见,绝缘子目标检测的平均准确率由原始的85.9%降至78.5%。因此,本文采用知识蒸馏技术,对轻量化学生网络模型进行高性能知识的迁移。本文选用模型更复杂、性能更高的YOLOv5l作为知识蒸馏的教师网络,分别以YOLOV5s原模型、YOLOv5s-GDS模型和YOLOv5s-GDSP模型作为学生网络进行知识蒸馏实验,实验结果见表5。

表5 知识蒸馏实验对比

Tab.5 Comparison of knowledge distillation experiments

网络模型模型名称参数量/(106个)计算量/G模型体积/MB蒸馏前蒸馏后 mAP(%)推理时间/msmAP(%)推理时间/ms 教师网络YOLOv5l46.11107.792.887.26.5—— 学生网络YOLOv5s7.0215.814.485.93.886.13.7 YOLOv5s-GDS2.906.26.384.62.185.22.1 YOLOv5s-GDSP2.513.85.578.51.582.41.3

由表5可知,教师网络的模型复杂度最高,检测性能最好,但是推理时间最长;学生网络因其简单的模型结构导致模型的检测性能较低,检测速度快。经过知识蒸馏之后,各个学生网络在模型复杂度和推理时间基本不变的情况下,检测精度均有不同程度的提升。其中,YOLOv5s-GDSP模型在知识蒸馏之后检测精度提高至82.4%,相比知识蒸馏前提高了3.9个百分点。说明本文设计的知识蒸馏可以让学生网络充分学习教师网络的知识,提升学生网络的绝缘子自爆缺陷检测性能。因此,本文最终选用YOLOv5s-GDSP模型的知识蒸馏后模型作为嵌入式设备实时检测的部署轻量化模型。

2.7 检测结果可视化

为了更加直观地对比本文所提模型的性能较原模型的性能提升效果,本文对YOLOv5s原模型、轻量化YOLOv5s、轻量化YOLOv5s知识蒸馏模型分别在测试集上进行测试实验对比,部分检测结果如图8所示。

图8a为YOLOv5s原模型的检测结果,图8b为轻量化YOLOv5s的检测结果,图8c为轻量化YOLOv5s知识蒸馏后的检测效果。由图8可以看出,YOLOv5s原模型对绝缘子自爆缺陷检测具有较高的检测性能;对原模型改进与剪枝后,轻量化YOLOv5s模型对于绝缘子自爆缺陷检测精度略有降低,存在部分自爆缺陷绝缘子漏检现象,这是因为模型的参数量和计算复杂度降低,导致模型对其细节的敏感度下降;对轻量化YOLOv5s进行知识蒸馏,模型的绝缘子检测精度进一步提升,对各种特殊场景下的自爆缺陷绝缘子均能明确识别,这得益于通过知识蒸馏充分学习了教师网络的优异性能。因此,本文提出的模型较原模型而言,不但可以降低模型的参数量和计算复杂度,还能在各种特殊场景下精确识别漏检的自爆缺陷绝缘子,拥有很高的鲁棒性能和泛化能力,适合部署至嵌入式设备进行实时绝缘子自爆缺陷检测。

width=384.45,height=393.5

图8 部分缺陷绝缘子图像可视化检测结果对比

Fig.8 Comparison of image visualization of partially defective insulators

2.8 泛化能力验证实验

为了进一步验证本文所提出的轻量化模型对新样本的识别效果及泛化能力,从网络公开绝缘子图像数据集中又额外随机选取了300张包含正常绝缘子和自爆缺陷绝缘子的图片作为独立测试集,然后利用训练好的模型在该独立测试集中进行新的测试实验。实验环境和参数配置与第2.2节一致,以确保结果的公正性和一致性。部分绝缘子原图及测试图如图9所示,实验结果见表6。

width=196.05,height=220.25

图9 部分绝缘子原图及测试图

Fig.9 Partial insulator original drawing and test drawing

表6 泛化能力验证实验

Tab.6 Generalization ability validation experiments

模型参数量/(106个)计算量/GmAP(%) YOLOv5s7.0215.883.1 YOLOv5s-GDSP2.513.881.3

从表6中可以看出,无论是YOLOv5s模型还是本文改进后的轻量化YOLOv5s-GDSP模型均具有较好的泛化检测能力,其中,YOLOv5s-GDSP模型在新数据集上的平均检测准确率为81.3%,与原始数据集上的82.4%相差不大,表明经过模型轻量化改进之后,本文模型在绝缘子自爆缺陷检测上的性能依然保持稳定,能够满足不同输电线路场景下绝缘子自爆缺陷检测的应用需求。

2.9 嵌入式设备部署测试

2.9.1 嵌入式平台介绍

本文选用RK3588芯片为核心单元的开发板作为边缘计算的嵌入式设备,进行绝缘子自爆缺陷检测的部署测试。该开发板具有丰富的接口资源,包括USB接口和MIPI-CSI接口等,可直接连接不同分辨率和帧率的摄像头。此外,开发板配备千兆以太网接口,支持连接网络摄像头,并内置Wi-Fi模块支持无线摄像头的使用,实现远程部署和监控,因此,本文的嵌入式设备部署方案支持多种规格型号的摄像头连接。同时,开发板核心RK3588芯片包括四核A76和四核A55,还集成了ARM Mali-G610 GPU,在人工智能(Artificial Intelligence, AI)计算能力方面,RK3588配备了第四代人工智能计算引擎,内置专门优化AI任务处理的三核NPU,其计算能力高达6TOPS,支持多种主流框架如RKNN、TensorFlow和Caffe。硬件结构如图10所示。

width=215.3,height=141.2

图10 硬件结构

Fig.10 Hardware structure

2.9.2 部署结果与分析

在边缘端的嵌入式设备实验中,采用Ubuntu20.04系统,Python环境为3.8,操作工具为 rknn_toolkit2。在将计算机端训练好的轻量化模型部署至边缘计算设备时,首先需将模型转换为RKNN格式,以确保其能够在RK3588上加载并进行推理。将本文提出的轻量化模型经格式转换后部署至嵌入式设备,并基于本地存储的绝缘子视频流数据进行测试。视频流分辨率为1 024×600,帧率为30帧/s,共417帧图像。为评估实时检测性能,选择10帧/s的平均帧率作为检测性能评估指标。

为充分发挥嵌入式设备的计算性能,对其CPU和NPU定频至最高性能,并采用多线程异步操作优化推理过程。测试结果表明,部署至嵌入式设备上的原YOLOv5s模型(14.4 MB)在绝缘子自爆缺陷实时检测中的平均推理帧率为45帧/s,本文轻量化模型(5.5 MB)的平均推理帧率为85帧/s,高于识别需求的基本帧率30帧/s。相比原模型,轻量化模型在模型体积减小61.8%的情况下,检测速度提升了1.89倍。同时,在该视频流中共计出现绝缘子串目标1 048个,自爆缺陷314处,统计视频流数据中每一帧的目标检测结果并计算平均值,本文轻量化模型对正常绝缘子的识别准确率为89%,对自爆缺陷绝缘子的识别准确率为85%,表明该模型能够准确检测正常绝缘子和自爆缺陷绝缘子的目标。本文轻量化模型不仅能实现对正常绝缘子的快速识别,还能以较高的准确率检测自爆缺陷目标,充分满足输电线路绝缘子自爆缺陷检测任务的实时性和准确性需求。嵌入式设备视频测试结果如图11所示。

该嵌入式设备运行时可以实时监测绝缘子的状态,一旦检测至绝缘子区域,会快速、准确地捕捉和分析绝缘子的类型、位置与置信度,并可在其设备上实时观测绝缘子自爆缺陷情况。输电线路巡检人员可以及时、直观地发现绝缘子自爆缺陷区域,根据其信息精确评估绝缘子自爆缺陷的风险程度,为巡检人员及时制定维护方案、合理处理自爆缺陷绝缘子提供了关键的数据支持和决策依据,提高绝缘子巡检的精确性与效率。

3 结论

本文提出一种轻量化YOLOv5s模型,并将其部署至以RK3588为核心的嵌入式设备进行绝缘子的实时自爆缺陷检测,得到以下结论:

1)设计了一种基于深度可分离卷积和Ghost Net网络的DWGConv模块及C3DWG模块,替换原网络的Conv模块和C3模块;重新设计空间金字塔池化层SimSPPF,在保证算法整体框架基本不变的情况下,大幅降低模型参数量和计算量;对模型采用结构化权重剪枝的模型压缩方法对网络的冗余进行剪枝,使其在损失较小精度的情况下,进一步实现模型的轻量化。同时,对剪枝后的模型进行知识蒸馏,以适当恢复模型性能。

width=425.7,height=158.2

图11 嵌入式设备视频测试结果

Fig.11 Embedded device video test results

2)实验结果表明,本文轻量化模型在所构建的数据集上较原模型,在损失仅3.5%全类平均精度的前提下,模型检测速度明显提升,模型复杂度明显下降,在满足模型部署内存需求的同时,实现了检测速度与检测精度之间的良性平衡,模型在测试集下也拥有较高的泛化能力和鲁棒性能。

3)将改进后的目标检测模型成功部署至瑞芯微RK3588嵌入式设备,并充分发挥其计算性能对模型进行有效的推理加速,实现轻量化模型在嵌入式设备的绝缘子自爆缺陷高效检测,可以在实际应用中提高绝缘子巡检工作效率。

未来将扩展数据集以覆盖更多缺陷类型,进一步提升模型对不同缺陷类型绝缘子的分类任务。同时,将本文实现的嵌入式设备与无人机相结合,实现边缘端的实时实地智能绝缘子巡检应用。

参考文献

[1] 何宁辉, 王世杰, 刘军福, 等. 基于深度学习的航拍图像绝缘子缺失检测方法研究[J]. 电力系统保护与控制, 2021, 49(12): 132-140.

He Ninghui, Wang Shijie, Liu Junfu, et al. Research on infrared image missing insulator detection method based on deep learning[J]. Power System Protection and Control, 2021, 49(12): 132-140.

[2] 刘传洋, 吴一全, 刘景景. 无人机航拍图像中绝缘子缺陷检测的深度学习方法研究进展[J]. 电工技术学报, 2025, 40(9): 2897-2916.

Liu Chuanyang, Wu Yiquan, Liu Jingjing. Research progress of deep learning method for insulator defect detection in aerial images of unmanned aerial vehicles[J]. Transactions of China Electrotechnical Society, 2025, 40(9): 2897-2916.

[3] 李斌, 屈璐瑶, 朱新山, 等. 基于多尺度特征融合的绝缘子缺陷检测[J]. 电工技术学报, 2023, 38(1): 60-70.

Li Bin, Qu Luyao, Zhu Xinshan, et al. Insulator defect detection based on multi-scale feature fusion[J]. Transactions of China Electrotechnical Society, 2023, 38(1): 60-70.

[4] 刘思言, 王博, 高昆仑, 等. 基于R-FCN的航拍巡检图像目标检测方法[J]. 电力系统自动化, 2019, 43(13): 162-168.

Liu Siyan, Wang Bo, Gao Kunlun, et al. Object detection method for aerial inspection image based on region-based fully convolutional network[J]. Automation of Electric Power Systems, 2019, 43(13): 162-168.

[5] Wang C Y, Bochkovskiy A, Liao H M. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, BC, Canada, 2023: 7464-7475.

[6] Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, 2014: 580-587.

[7] 徐建军, 黄立达, 闫丽梅, 等. 基于层次多任务深度学习的绝缘子自爆缺陷检测[J]. 电工技术学报, 2021, 36(7): 1407-1415.

Xu Jianjun, Huang Lida, Yan Limei, et al. Insulator self-explosion defect detection based on hierarchical multi-task deep learning[J]. Transactions of China Electrotechnical Society, 2021, 36(7): 1407-1415.

[8] 苟军年, 杜愫愫, 刘力. 基于改进掩膜区域卷积神经网络的输电线路绝缘子自爆检测[J]. 电工技术学报, 2023, 38(1): 47-59.

Gou Junnian, Du Susu, Liu Li. Transmission line insulator self-explosion detection based on improved mask region-convolutional neural network[J]. Transactions of China Electrotechnical Society, 2023, 38(1): 47-59.

[9] 罗潇, 於锋, 彭勇. 基于深度学习的无人机电网巡检缺陷检测研究[J]. 电力系统保护与控制, 2022, 50(10): 132-139.

Luo Xiao, Yu Feng, Peng Yong. UAV power grid inspection defect detection based on deep learning[J]. Power System Protection and Control, 2022, 50(10): 132-139.

[10] 张焕龙, 齐企业, 张杰, 等. 基于改进YOLOv5的输电线路鸟巢检测方法研究[J]. 电力系统保护与控制, 2023, 51(2): 151-159.

Zhang Huanlong, Qi Qiye, Zhang Jie, et al. Bird nest detection method for transmission lines based on improved YOLOv5[J]. Power System Protection and Control, 2023, 51(2): 151-159.

[11] 王道累, 张正刚, 张世恒, 等. 基于密集连接网络的航拍绝缘子旋转目标精准定位方法[J]. 电力系统保护与控制, 2024, 52(1): 35-43.

Wang Daolei, Zhang Zhenggang, Zhang Shiheng, et al. Accurate positioning method of insulator rotating target in aerial photography based on dense connection network[J]. Power System Protection and Control, 2024, 52(1): 35-43.

[12] 贾晓芬, 于业齐, 郭永存, 等. 航拍绝缘子自爆缺陷的轻量化检测方法[J]. 高电压技术, 2023, 49(1): 294-300.

Jia Xiaofen, Yu Yeqi, Guo Yongcun, et al. Lightweight detection method of self-explosion defect of aerial photo insulator[J]. High Voltage Engineering, 2023, 49(1): 294-300.

[13] Zha Mingfeng, Qian Wenbin, Yi Wenlong, et al. A lightweight YOLOv4-based forestry pest detection method using coordinate attention and feature fusion[J]. Entropy, 2021, 23(12): 1587.

[14] 王道累, 张世恒, 袁斌霞, 等. 基于改进YOLOv5的轻量化玻璃绝缘子自爆缺陷检测研究[J]. 高电压技术, 2023, 49(10): 4382-4390.

Wang Daolei, Zhang Shiheng, Yuan Binxia, et al. Research on self-explosion defect detection of lightweight glass insulators based on improved YOLOv5[J]. High Voltage Engineering, 2023, 49(10): 4382-4390.

[15] 陈奎, 刘晓, 贾立娇, 等. 基于轻量化网络与增强多尺度特征融合的绝缘子缺陷检测[J]. 高电压技术, 2024, 50(3): 1289-1300.

Chen Kui, Liu Xiao, Jia Lijiao, et al. Insulator defect detection based on lightweight network and enhanced multi-scale feature fusion[J]. High Voltage Engineering, 2024, 50(3): 1289-1300.

[16] 姜香菊, 王瑞彤, 马彦鸿. 基于轻量级改进RT-DETR边缘部署算法的绝缘子缺陷检测[J]. 电工技术学报, 2025, 40(3): 824-854.

Jiang Xiangju, Wang Ruitong, Ma Yanhong. Insulator defect detection based on lightweight improved RT-DETR edge deployment algorithm[J]. Transactions of China Electrotechnical Society, 2025, 40(3): 824-854.

[17] 阮顺领, 王京, 顾清华, 等. 面向边缘计算的矿区障碍检测模型研究[J]. 煤炭科学技术, 2024, 52(11): 141-152.

Ruan Shunling, Wang Jing, Gu Qinghua, et al. Research on mining area obstacle detection model for edge computing[J]. Coal Science and Technology, 2024, 52(11): 141-152.

[18] 李登攀, 任晓明, 颜楠楠. 基于无人机航拍的绝缘子掉串实时检测研究[J]. 上海交通大学学报, 2022, 56(8): 994-1003.

Li Dengpan, Ren Xiaoming, Yan Nannan. Real-time detection of insulator drop string based on UAV aerial photography[J]. Journal of Shanghai Jiao Tong University, 2022, 56(8): 994-1003.

[19] 罗志聪, 何陈涛, 陈登捷, 等. 基于轻量化YOLO v8s-GD的自然环境下百香果快速检测模型[J]. 农业机械学报, 2024, 55(8): 291-300.

Luo Zhicong, He Chentao, Chen Dengjie, et al. Passion fruit rapid detection model based on lightweight YOLOv8[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(8): 291-300.

[20] 王年涛, 王淑青, 黄剑锋, 等. 基于改进YOLOv5神经网络的绝缘子缺陷检测方法[J]. 激光杂志, 2022, 43(8): 60-65.

Wang Niantao, Wang Shuqing, Huang Jianfeng, et al. Insulator defect detection method based on improved YOLOv5 neural network[J]. Laser Journal, 2022, 43(8): 60-65.

[21] Kaiser L, Gomez A N, Chollet F. Depthwise separable convolutions for neural machine translation[EB/OL]. 2017: 1706.03059. https://arxiv.org/abs/1706.03059v2.

[22] Han Kai, Wang Yunhe, Tian Qi, et al. GhostNet: more features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA, 2020: 1580-1589.

[23] He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1904-1916.

[24] Li Hao, Kadav A, Durdanovic I, et al. Pruning filters for efficient ConvNets[EB/OL]. 2016: 1608.08710. https://arxiv.org/abs/1608.08710v3.

[25] Gou Jianping, Yu Baosheng, Maybank S J, et al. Knowledge distillation: a survey[J]. International Journal of Computer Vision, 2021, 129(6): 1789-1819.

[26]Tao Xian, Zhang Dapeng, Wang Zihao, et al. Detection of power line insulator defects using aerial images analyzed with convolutional neural networks [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2020, 50(4): 1486-1498.

[27] 第八届“泰迪杯”数据挖掘挑战赛B题:电力巡检智能缺陷检测[EB/OL]. [2024-04-19]. https://www.tipdm. org/u/ cms/www/202003/0104085491vr.pdf.

Self-Explosion Defect Detection of Power Insulators Based on Embedded YOLO Network

Li Peng1 Su Yunlong1 Ning Hao1 Meng Qingwei1 Wei Qiang2

(1. College of New Energy China University of Petroleum (East China) Qingdao 266580 China 2. State Grid Xinjiang Electric Power Co. Ltd Urumqi 830018 China)

Abstract Insulators are critical insulating electrical components in power systems, and their proper insulating condition is essential to ensure the safe and stable operation of the power grid. To address the challenges of large model parameters and high computational complexity in existing insulator self-explosion fault detection models, which hinder their efficient deployment on resource-constrained embedded devices, this paper proposed a fault detection method for power insulators based on an embedded YOLO network.

First, a lightweight YOLO insulator defective target detection network based on depth-separable convolution, GhostNet network and SimSPPF spatial pyramid pooling weights was designed, which significantly reduces the number of parameters and computational complexity of the model while maintaining the detection accuracy. Meanwhile, the redundant parts in the network structure were effectively trimmed by the weight pruning method based on the L1 paradigm, which further compresses the model size. To compensate for the degradation in detection performance due to pruning, the features of the high-precision teacher model were migrated to the lightweight student model using knowledge distillation to improve the detection accuracy and performance of the pruned model.

The proposed lightweight YOLOv5s model was applied to a self-constructed insulator self-explosion defect detection dataset, achieving a significant improvement in detection speed and a notable reduction in model complexity, with only a slight decrease in overall average precision. When applied to another independent test set, the model also demonstrated strong generalization ability in detection. The model was designed to balance detection speed and accuracy, ensuring that it meets the memory and computational requirements of embedded devices. Additionally, the optimized model was deployed on an embedded device powered by the Rexchip RK3588, leveraging its computational performance to accelerate the inference process of the optimized model. Test results demonstrated that the deployed model could accurately detect insulator self-explosion defects at a real-time inference speed of 85 frames per second, which is 1.89 times faster than the original model. This significant improvement in efficiency demonstrates the effectiveness of the optimized model in detecting insulator self-explosion defects.

The following conclusions can be drawn from the experiments: (1) The designed lightweight insulator self-explosion defect detection model meets the memory requirements for embedded deployment and the computational performance requirements for real-time self-explosion defect detection, with minimal loss in detection performance. (2) Knowledge distillation technology compensates for the detection performance degradation caused by model lightweighting, achieving a good balance between detection speed and accuracy, while It also demonstrates strong generalization ability and robustness on the independent test set. (3) The model was deployed on the RK3588 embedded device, fully leveraging its computational performance to accelerate the efficient inference of the model. The lightweight model enables efficient detection of insulator self-explosion defects on embedded devices, contributing to improved insulator inspection efficiency in practical applications.

The dataset will be expanded in the future to include additional defect types, thereby enhancing the model's capacity to classify insulators with diverse defect types. Concurrently, the embedded device implemented in this study will be integrated with drones to enable real-time, on-site intelligent insulator inspection applications at the edge.

Keywords:Insulator detection, lightweight, pruning, knowledge distillation, embedded

中图分类号:TM216;TP183

DOI: 10.19595/j.cnki.1000-6753.tces.242110

收稿日期 2024-11-26

改稿日期 2025-01-09

作者简介

李 鹏 男,1987年生,副教授,硕士生导师,研究方向为机器学习和人工智能理论方法及其在电力系统和电气设备故障检测中的应用。E-mail:lipeng@upc.edu.cn

宿雲龙 男,2000年生,硕士研究生,研究方向为人工智能在电力系统故障检测中的实际应用。E-mail:yunlong_su0729@163.com(通信作者)

(编辑 赫 蕾)