采用滑动窗口及多重加噪比堆栈降噪 自编码的风电机组状态异常检测方法

陈俊生1 李 剑1 陈伟根1 孙 鹏2

(1. 输配电装备及系统安全与新技术国家重点实验室(重庆大学) 重庆 400044 2. 国网河南省电力公司电力科学研究院 郑州 450000)

摘要 该文提出一种基于多元变量数据重构的风电机组状态异常检测方法。针对风电场数据采集与监控(SCADA)系统数据,首先,建立基于滑动窗口的堆栈降噪自编码(SDAE)模型,在获取机组正常运行状态下变量间的互相关性和各变量短时相依性的基础上重构机组状态数据;其次,为提高模型特征学习能力,提出多重加噪比的SDAE模型训练方法学习机组状态参数的全局和局部特征;最后,采用重构误差的马氏距离为机组状态监测指标,通过核密度估计方法分析机组正常数据监测指标的概率密度分布,确定机组正常运行状态下监测指标的阈值,定义监测指标连续越限数监测机组状态,计算各状态参数对监测指标越限的贡献度,实现机组参数异常检测。华东某风电场SCADA数据分析结果表明该方法可有效地用于实际风电机组运行状态的异常检测。

关键词:风电机组 异常检测 数据采集与监控系统 堆栈降噪自编码 滑动窗口 多重加噪比

0 引言

风电机组长期运行在多变、恶劣的自然环境中,机组各部件的故障率显著增加。受地理环境和气候状况影响,风电机组的故障维修时间长、成本高。统计显示,陆上风电机组的运维成本约占其总发电成本的10%~15%,而海上风电机组的运维费用则高达20%~25%[1-3]。为降低非计划停运时间和运维成本,提高风电机组的运行可靠性,对风电机组的状态监测提出了新的要求。

目前风电机组状态监测手段主要包括基于模型的方法和基于数据驱动的方法[4],前者需要建立准确的风电机组及其子系统数学或物理模型,现有研究包括基于Kalman滤波理论[5]、观测器技术[6]和奇偶方程[7]实现机组系统或部件的状态评估、预测和故障检测,但由于风能的随机性和风电机组复杂的故障机理,参数的多元耦合建模较为困难,实际中通常难以实现。基于数据驱动的方法可直接通过机组实时运行数据的分析实现状态监测,无需建立精确的物理模型和系统先验信息,因此适用于风电机组的状态监测。

近年来所提出的振动监测和声发声监测[8-11]等数据驱动类机组状态监测方法由于数据存储容量及传感装置高额费用的限制,工程实际中难以推广应用。目前大多数风电场均通过安装数据采集与监控(Supervisory Control And Data Acquisition, SCADA)系统监测机组关键组件的实时运行状态,SCADA系统提供了自然环境参数与设备运行参数等丰富的状态信息。现有基于数据驱动的机组状态监测方法研究大多数是在风电场SCADA数据基础上开展的[12-16],现有研究包括支持向量机[17]、神经网络[18-19]、非线性状态估计[20-21]及自适应神经模糊系统[22]等方法,其核心思想是通过状态参数的预测残差分析实现机组及其子系统的异常状态或潜在故障检测。文献[21]采用改进的非线性状态估计算法建立温度参数预测模型,对风电机组常见部位的故障进行有效检测。但上述方法需要对机组各参数进行逐一建模,分析过程相对繁琐,且未考虑各状态参数间的互相关性。

风电机组各部件相互耦合,机组及其部件的健康状态体现于多个监测参量。当机组运行状态出现异常或发生故障时,多个状态参数可能同时发生变化,参数间的相关性也会受到影响,因此基于多变量间相关性变化的机组状态监测方法将更简便有效。Kruger等通过传统的多变量过程监控方法如主成分分析(Principal Components Analysis, PCA)监测风电机组传感器和变速箱的异常[23]。但PCA是基于线性过程的假设,难以适用于具有高度非线性的风电机组中。对此,有研究学者将自编码(Autoencoder, AE)神经网络和基于深度学习的堆栈自编码(Stacked Autoencoders, SAE)网络模型应用于风电机组关键部件的状态监测中,并取得了良好的效果[24-25]。文献[25]提出了基于深度自编码网络模型的机组齿轮箱故障检测方法,但忽略了SCADA参数的短时相依性,且方法的稳健性有待验证。Vincent等在AE的基础上提出了降噪自编码(Denoising AE, DAE)算法[26],对输入数据加入随机噪声,通过对污染数据的特征映射重构还原原始数据,增强了系统的稳健性。文献[27]利用堆栈降噪自编码(Stacked Denoising Autoencoders, SDAE)对输变电设备状态数据进行清洗,实现输变电设备状态的异常识别,然而实际中风电设备故障数据缺乏,此类方法难以实施,另外采用固定加噪比的SDAE模型难以获得详细的机组状态数据特征。因此如何深度挖掘大量机组正常SCADA监测数据以实现机组状态的异常检测是目前风电机组状态监测领域亟需解决的问题之一。此外,现有大多数状态监测方法忽略了机组状态参数的短时相依性,假设当前时刻状态参数值与先前时刻值相互独立,影响了监测结果的准确性。工业过程监测领域是通过将先前时刻的监测信息整合到当前观测信息中以分析数据的短时相依性,如文献[28]将动态PCA方法用于化工过程的监测,本文将此思想应用于风电机组状态异常检测中。

本文以风电场SCADA数据为研究对象,提出基于SCADA多元数据重构的风电机组状态异常检测方法,建立SDAE模型学习机组正常运行数据的特征表示以实现多元数据重构,通过机组正常数据训练所得模型对待测数据进行检测分析。利用滑动窗口技术处理原始SCADA数据得到计及状态参数时序信息的增广状态数据矩阵,构建基于滑动窗口的SDAE模型同时获取机组变量间的互相关性和各变量的短时相依性;提出多重加噪比的SDAE模型训练方法以提高模型特征学习能力;以重构误差的马氏距离为状态监测指标,由核密度估计方法确定监测指标阈值,定义连续越限数判断机组是否异常;通过计算各状态参数对监测指标越限的贡献度实现风电机组状态的异常检测;最后通过实际采集的SCADA数据验证了本文异常检测方法的有效性。

1 风电机组状态参数

风电场SCADA系统记录了自然环境参数与设备运行参数等丰富的状态信息。自然环境信息主要包括风速、风向和环境温度;设备运行参数主要包括转速、设备温度、油压油位及振动信号等;振动数据主要包括对机舱、传动系统及发动机的振动监测信号,但现有SCADA系统的采样率通常为1S/s,导致振动数据的可用率较低,因此本文不对振动参数进行研究分析。

将反映风电机组自身运行状态的SCADA监测参数称为状态参数,根据受自然环境因素的影响程度,SCADA系统中的机组状态参数分为两类:第1类状态参数与环境因素密切相关,如部件的温度参数、机组输出功率等;第2类状态参数的取值受自然环境的影响相对较弱,只与设备的性能有关,如油压、偏航位置、对风偏差及液压参数等。第2类参数的异常通过设定阈值即可判定,而第1类参数的异常难以通过取值直接判断,因此本文主要检测机组运行状态异常时第1类参数的异常。表1为华东某风电场SCADA系统所采集的部分风电机组状态参数,17个第1类状态参数提供了机组发电机、齿轮箱、变频器和主轴承等主要部件丰富的运行状态信息,通过对这些状态参数的分析可实现机组主要部件的状态监测。

表1 风电机组状态参数
Tab.1 WT condition parameters

参 数 类 别 主轴承叶轮侧温度/℃ 1 主轴承齿轮箱侧温度/℃ 1 齿轮箱输入轴温度/℃ 1 齿轮箱输出轴温度/℃ 1 齿轮箱油温/℃ 1 齿轮箱冷却水温度/℃ 1 发电机绕组温度(U)/℃ 1 发电机绕组温度(V)/℃ 1 发电机绕组温度(W)/℃ 1 发电机轴承a温度(前)/℃ 1 发电机轴承b温度(后)/℃ 1 发电机冷却风温度/℃ 1 控制柜温度/℃ 1 变频控制器温度/℃ 1 叶片电机温度/℃ 1 叶片电池柜温度/℃ 1 输出功率/kW 1 偏航位置/(°) 2 对风偏差/(°) 2 主液压/MPa 0.2 转子刹车系统液压/MPa 0.2 桨距角/(°) 2 风速/(m/s) — 环境温度/℃ —

2 基于滑动窗口和多重加噪比的SDAE

SDAE通过堆叠多个DAE构成深度网络,从风电机组的正常运行数据中采用无监督方式进行状态参数间非线性特征的深度学习,基于正常运行数据间的相关性重构待测状态参量数据,通过对模型重构误差的分析实现机组运行状态的异常检测。

2.1 SDAE网络

AE是一种对输入数据进行重构的神经网络,包括编码过程和解码过程,网络结构包括输入层、隐藏层和输出层,其中输出层与输入层的神经元数量相同。DAE以“破坏”的数据为输入,通过训练以预测原始纯净数据的自编码器,与AE具有相同的网络结构。DAE通过对输入数据添加随机噪声的方式对数据进行破坏,在训练过程中学习消除噪声干扰能力,获取更为稳健的特征表达,重构未污染的输入信息。

假设输入参数x∈Rm,对x进行随机加噪处理得到通过编码过程得到的隐藏层特征表示为

式中,W1为d×m阶编码权值矩阵;b1为d阶偏置向量;σ (·)为编码非线性sigmoid型传递函数。

对隐藏层h的解码过程为

式中,W2为m×d阶解码权值矩阵;b2为m阶偏置向量;δ (·)为编码非线性sigmoid型传递函数。

重构结果z并不是完全精确复现输入数据x,通常引入权重衰减项(正则项)防止模型出现过拟合现象,网络的代价函数为

式中,第一项为方均差项;第二项为权值衰减项;x(k)、z(k)分别为第k个样本的原始数据值及其重构值; λ 为权值衰减系数,表示连接l层 第j个神经元与l +1层第i个神经元的权值参数;s1、s2、s3分别为第1、2、3层的节点数,即输入层、隐藏层和输出层的节点数。采用L-BFGS算法对DAE网络参数寻优。

浅层模型对复杂问题的表达能力有限,而SDAE堆叠多个DAE构成深度学习网络,具有深层非线性映射,能获取高阶的数据特征。在编码阶段,第n-1个DAE的隐藏层为第n个DAE的输入层;在解码阶段,依次对第n, n-1,…, 1个DAE进行解码即可 建立SDAE网络结构。SDAE网络的训练采用贪心逐层算法,分别对各DAE无监督训练,无需故障数据作为标签信息。

2.2 滑动窗口处理方法

风电场SCADA系统采集的风电机组状态参量间具有高度非线性相关性,且各监测参数为时间序列数据,具有短时相依特征,尤其是温度类状态参数,其当前时刻取值会受先前时刻值的影响。本文采用滑动窗口技术处理SCADA系统的机组状态参数数据,使滑动窗口内包含机组当前时刻与先前时刻的状态信息,得到计及参数短时相依性的增广状态数据矩阵,以增广状态数据矩阵为输入,建立SDAE模型的同时获取多元参数间的非线性相关性和参数的短时相依性。

图1所示为采用滑动窗口处理的SDAE模型。 滑动窗口处理方法的具体步骤为:记为 SCADA系统采集的原始机组状态参数数据,其中,i= 1, 2,…, n;j=1, 2,…, m;n为监测变量数,m为采集的样本数据数量。则数据X的第i个分量表示机组 第i个监测变量样本数据,即 设滑动窗口的宽度为β(即滑动窗口内包含β 个时间 点数据),窗口每次移动一个时间点,对于m个样本数量的机组SCADA数据X共有m-β +1个滑动窗 口,记 为第l个滑动窗口采集的第i个机组监测参量的数据,则

第l个滑动窗口采集的数据为

图1 基于滑动窗口处理方法的SDAE模型
Fig.1 The SDAE model with sliding window processing

由式(4)、式(5)可知,对SCADA系统采集的原始机组状态参数数据采用滑动窗口处理,得到SDAE模型的输入数据增广状态数据矩阵为

当β =1时,=Y X,增广状态数据矩阵即为原始机组状态参数数据。经滑动窗口处理,SDAE的输入数据由原始SCADA数据X的n维增大至Y的n×β 维,样本数据量相应由m变为m-β +1。显然通过滑动窗口处理方法得到的增广状态数据矩阵Y既包括机组当前时刻的状态参数信息,又考虑了先前时刻的状态信息。虽然各状态参数的短时相依性存在差异,即各参数当前时刻t的取值受先前各时刻值的影响程度不同,然而SDAE模型可根据输入数据的自身固有特性学习其短时相依性,其差异可通过权值系数的大小体现,若某参数t时刻值主要受t-1时刻值的影响,而受t-2,…, t-β 各时刻值的影响较小,则训练后所得模型最优权值矩阵中对应的t-2,…, t-β 各时刻值的权值较小,因此可采用相同的窗口宽度处理各状态参数。

2.3 基于多重加噪比的SDAE模型训练方法

输入数据的随机置零比(本文定义为加噪比)是DAE算法中的重要参数,通常保持不变,不同的加噪比将使得网络获取不同的特征表达。加噪比参数过大或过小都将不利于网络的表征学习[29]。在DAE的非监督学习框架下,加噪比较大时,输入在训练过程中损坏严重,网络仅能实现输入数据较大邻域范围的流形学习、获取输入数据的粗粒度特征,自编码器只能使用少量的输入数据对原始数据进行重构,因此网络只能了解流形中出现的大丘陵和山谷等数据的一般特征。而当加噪比较低时,输入数据仅轻微损坏,网络可实现输入数据较小邻域范围内的流形学习,倾向于捕捉输入的细粒度特征[30-31]。为能实现输入数据更多不同邻域范围内的流形学习,同时获取其粗粒度与细粒度特征,本文提出一种多重加噪比的SDAE网络训练方法,依次采用c0, c1,…, cT对网络进行训练,首先采用较大的初始加噪比c0训练SDAE网络,再通过逐步减小的多重加噪比对前一加噪比训练得到的SDAE网络进行再训练,加噪比ct对网络的训练可视为是对前一加噪比ct-1训练所得网络的微调过程。随着训练的进行和加噪比的降低,自编码器可获取更多的输入数据特征,有助于其还原重构。因此与采用固定加噪比方法相比,多重加噪比训练方法在训练过程中将捕捉越来越多的输入特征,使网络能更好地实现输入数据的流形学习,从而提高风电机组状态异常检测的准确性。

分别采用0c,1c,…,Tc按序对DAE模型进行训练,其中,c0>c1>…>cT ,c0为初始加噪比,cT为最终加噪比,且首先在初始加噪比0c下,模型将学习输入数据的全局特征,然后随着加噪比的逐步降低,进行数据局部特征学习,具体步骤如下:

(1)采用初始加噪比0c对经滑动窗口处理得到 的增广状态数据矩阵Y加噪处理得到输 入数据Yc,采用L-BFGS算法训练DAE网络得到优化参数及隐含层值。

(2)以 1tc-训练得到的DAE网络权值为初始权值矩阵,采用加噪比tc对增广状态数据矩阵Y加噪 处理得到输入数据Yc,其中 对前一加噪比参数 1tc-训练所得到的DAE网络进行微调。

(3)重复步骤(2)直至 ct=cT 结束,最后得到更新后的基于多重加噪比的DAE网络优化参数。

图2 基于多重加噪比的两层SDAE模型训练流程
Fig.2 The flow chart of two-layer SDAE training with multiple noise ratios

利用追层贪婪算法训练基于多重加噪比SDAE网络。图2为两层SDAE模型的多重加噪比训练流程。首先采用初始加噪比0c训练SDAE网络,其中前一个DAE的隐藏层作为下一个DAE的输入层;然后分别以c1~cT的加噪比(间距为Δc)依次对各DAE网络进行微调,最后得到训练完成的基于多重加噪比的SDAE网络权值矩阵及此模型参数下输入数据的重构值。通过多重加噪比的去噪训练方法所构建的SDAE网络结构提高模型对SCADA状态参数的特征学习能力和机组状态的异常检测能力。

3 风电机组状态异常检测

当利用模型最优化参数对待测数据进行异常检测时,重构误差为衡量数据异常与否的重要准则。基于流形学习的思想[26,31],原始训练数据聚集在低维流形曲线上,通过加噪得到损坏数据,相比于原始干净数据,损坏数据将偏离流形学习曲线,DAE训练结果是使损坏数据映射到原始干净数据所处的低维流形曲线上。正常运行数据训练得到的正常参考模型将偏离分布的数据映射到符合期望的流形学习曲线上或流形学习曲线附近,因此机组正常运行数据的重构误差较小,而异常参数数据的重构误差较大,机组运行数据的重构误差发生较大变化时表明机组运行状态可能出现异常。

当训练数据中包含大量不良数据(如缺失数据、离群数据或限功率运行数据)时,训练数据的数据质量较差,无法准确表征机组正常运行时各参数间的相关关系,因此应选取机组近期连续正常运行两个月以上且数据质量高的运行数据为模型训练数据。当机组近期正常运行数据中无法选出满足要求的训练数据时,应先采用不良数据识别和修正等数据预处理方法提高数据质量。用于机组状态异常检测的SCADA系统数据包括表1中的1~17个状态参数数据,以及环境温度、风速、偏航位置和桨距角4个反映自然环境特征的参数数据,共计21类状态参数数据。

将机组正常运行状态下的SCADA系统采集的原始数据XN,采用滑动窗口处理得到增广状态数据矩阵YN,通过多重加噪比的SDAE网络得到重构输出数据ZN,正常样本的重构误差为

为实现机组异常状态的有效检测,需从多维数据EN中提取出一维状态监测指标。由于马氏距离不受量纲的影响,且马氏距离能在多元数据中考虑变量间的相关性,因此本文选取重构误差的马氏距离为监测指标。第k个正常样本数据点的状态监测指标tk

式中,为第k个正常样本的重构误差;u为正常样本的重构误差均值;1-Cov为正常样本的协方差矩阵的逆矩阵。

根据式(8)计算得到所有正常样本重构误差的马氏距离{tk}(t=1, 2,…, m-β +1),由于此状态监测指标的分布规律未知,为确定正常样本数据状态监测指标的阈值,采用核密度估计方法计算正常样本数据监测指标的概率密度分布。

设正常运行状态下马氏距离{tk}的概率密度函 数为则基于核密度估计的概率密度函数为

式中,tk为样本数据中第k个马氏距离;h为带宽;样本数据个数为m-β +1;K(·)为核密度函数,研究表明[32]:样本数据充分时,核函数的类型对核密度估计的影响较小,因此本文选用最常用的高斯核函数为

根据机组正常运行数据的重构误差马氏距离概 率密度函数置信度α 下的阈值td

由于SCADA数据中可能包含噪声数据和缺失值等不良数据,此类不良数据可能引起监测指标越限,但其连续越限时间较短,因此为实现机组运行状态检测还需考虑监测指标的连续越限数Q。Q的阈值Qd同样由正常样本分析结果获得,即

式中,Qmax为训练数据的监测指标连续越限最大值,可根据训练数据的监测指标越限情况得到;β 为滑动窗口宽度。经采用滑动窗口处理后,增广状态数据矩阵的连续β 个数据点均包含原始数据的某个数据信息,因此当原始数据中某个数据为噪声数据时,将引起增广状态数据矩阵连续个数据点的监测指标越限,监测指标连续越限数最小应为β。

采用宽度为β 的滑动窗口对待检测的机组SCADA数据XM进行处理得到YM,经由正常运行数据训练得到的多重降噪SDAE模型得到YM的重构数据ZM,则待检测时间段内增广状态数据的重构误差为

待检测时间段内,增广状态数据矩阵第j个数据点重构误差的马氏距离为

式中,为待检时间段内YM中第j个数据点的重 构误差。

当由式(14)得到且连续越限时间QM> Qd时,表明机组可能出现异常,为确定与机组状态异常最相关的参数或部件,引入各状态参数对越限的贡献度为

式中,CDi为第i个状态参数的贡献度;为增广状态数据矩阵第j个数据点的马氏距离;K为检测出的增广状态数据矩阵中越限数据点的个数;为去除 中第i个状态参数对应数据后的马氏距 离。各参数的贡献度均是与包含机组所有状态参数时的监测指标进行比对获得,机组异常时各参数贡献度间的相互比较具有相同的基准,因此可用于机组异常参数或部件的有效识别。n维原始SCADA数据经滑动窗口处理变换为N(N=n×β)维的增广状态数据矩阵,为计算第i个状态参数的贡献度,则应首先除去重构误差中对第i个状态参数相对应 的数据,即 中 β(i- 1)+1~βi行数据。

本文不考虑长时间缺失值、离群值和机组限功率运行情况,机组状态异常检测流程如图3所示。当tM<td且QM<Qd时,机组运行正常;当tM>td且QM<Qd时,则检测数据为噪声数据或空值等不良数据;当tM>td且QM>Qd时,则机组出现异常,根据贡献度确定可能导致机组出现异常的状态参数。

4 实例分析

通过华东地区某风电场采集的SCADA数据验证本文状态异常检测方法的有效性。该风电场共有33台1.5MW双馈式风电机组,SCADA数据采样率为1S/s。为降低噪声数据和缺失数据的影响,本文以SCADA数据的10min平均值进行分析。

图3 机组状态异常检测流程
Fig.3 The procedure of WTs anomaly conditions detection

F102机组因齿轮箱输出轴齿轮严重磨损导致输出轴过热,于2016年7月21日23时停机。根据风电场的维修记录,该机组于2016年2月完成了一次 定期检修,且SCADA系统显示该机组在2016年4月7日~7月13日期间未出现参数越限报警情况,且限功率运行情况较少,因此判定F102机组在此期间处于正常运行状态。选取F102机组2016年4月21日~7月13日共12 123个运行数据为SDAE模型的训练样本,其中每组样本包含表1中的第1~17个状态参数数据,以及环境温度、风速、偏航位置和桨距角参数共计21类状态参数数据。采用滑动窗口处理和多重加噪比的训练方法建立SDAE正常参考模型,其中初始加噪比c0=0.5,最终加噪比cT=0.05,间距Δc=0.05,最大迭代次数为500。

不同层数的SDAE模型重构误差马氏距离概率密度分布如图4所示,两层SDAE与三层SDAE所得到的概率密度分布基本相似,为提高运算速度,本文采用两层SDAE模型。

图4 不同层数的监测指标概率密度分布
Fig.4 The PDFs of monitoring indexes with different layers

滑动窗口宽度为0、3、6时模型的重构误差马氏距离概率密度分布如图5所示,未经滑动窗口处理(β =0)的模型重构误差马氏距离分布呈双峰型,随着窗口宽度的增加,模型输入数据的维度增大,因此模型重构误差的马氏距离逐渐变大,而实际中各状态参数(除风速外)具有短时相依性,结合计算时间考虑,选定窗口宽度β =6。图6为滑动窗口宽度为6时多重加噪比SDAE模型的重构误差马氏距离直方图及基于核密度方法估计的概率密度分布。

图5 不同滑动窗口的监测指标概率密度分布
Fig.5 The PDFs of monitoring indexes with different widths

图6 F102机组正常数据的监测指标直方图与 概率密度分布
Fig.6 The histogram and PDF of WT F102 monitoring index under normal condition

图7所示为F102机组12 123个正常样本数据经滑动窗口处理后得到的12 118个增广状态数据的SDAE模型重构误差马氏距离及99%置信度的对应阈值,td=25.151 72,图7中a、b、c、d、e、f 6个越限时间段的详细情况如图8所示,其中最大连续越限数为5,根据第3节状态监测指标的确定方法得到本案例指标连续越限数的阈值为6。

采用正常数据训练得到的正常参考模型评估机组待检测数据。分别取F102机组2016年7月14日~7月16日的291个运行数据及7月20日11∶50时至21日23∶00时(故障发生前1h)的211个运行数据进行检测分析,结果分别如图9、图10所示。图9的检测结果显示监测指标存在越限的情况,但 其连续越限数均未超过阈值6,因此判定为噪声数据,机组运行状态正常,检测结果与实际运行情况相符,验证了本方法的有效性。图10为基于本文方法检测出增广状态数据矩阵的第191个数据点(对应原始SCADA数据为第196个数据点)出现异常,即在机组故障发生前2.5h已检测出状态参数出现异常。

图7 F102机组正常训练数据的监测指标
Fig.7 The monitoring index values of training data under normal condition based on proposed model

图8 F102机组正常训练数据的越限监测指标
Fig.8 The over-limit monitoring indexes of WT F102

图9 F102机组2016年7月14日~7月16日 待测数据的监测指标
Fig.9 The monitoring index values of WT F102 during July 14th to July 16th, 2016

图10 β =6时F102机组2016年7月20日~ 7月21日待测数据的监测指标
Fig.10 The monitoring index values of WT F102 with the window width β set as 6 during July 20th to July 21th, 2016

图11、图12分别为未经滑动窗口处理以及采用窗口宽度为3两种情况的检测结果。当不采用滑动窗口处理时,相应的SDAE模型检测出从第200个SCADA数据开始机组出现异常,即在机组故障停机前40min识别出状态参数出现异常,但此种情况下指标连续越限数的阈值难以确定,无法判定增广状态数据矩阵的第101、132个数据点为噪声数据还是由于机组设备异常导致。当对原始SCADA数据采用宽度为3的滑动窗口处理后,检测出增广状态数据矩阵的第195个数据点异常,对应原始SCADA数据第197个数据点。因此,通过滑动窗口 处理原始SCADA数据后,多重加噪比SDAE模型能更早地检测出机组状态参数的异常情况,从而实现机组状态检测。

图11 未经滑动窗口处理的F102机组2016年 7月20日~7月21日待测数据监测指标
Fig.11 The monitoring index values of WT F102 without sliding window processing during July 20th to July 21th, 2016

图12 β =3时F102机组2016年7月20日~7月21日待测数据的监测指标
Fig.12 The monitoring index values of WT F102 with the window width β set as 3 during July 20th to July 21th, 2016

图13所示为滑动窗口宽度为6时采用固定加噪比SDAE模型(c=0.05)的检测结果,该方法检测出增广状态数据矩阵的第130~135个数据点和第192~206个数据点均为异常数据,而实际情况是机组第138个数据点(即对应增广状态数据矩阵的第133个数据点)为噪声点,因此导致第130~135个增广状态数据点监测指标越限,第192~206个增广状态数据点为机组故障异常数据。此方法虽然可以检测出机组的故障异常,但同时将噪声数据误判断为机组状态异常数据,其原因可能是当加噪比参数固定为0.05时,模型主要根据机组状态数据的局部特征进行数据重构,忽略了状态数据的全局特征,从而引起状态误判的发生。由多重加噪比和固定加噪比SDAE模型的检测结果对比分析表明,多重加 噪比的SDAE机组故障检测方法可有效区分故障异常数据与噪声数据,避免了机组运行状态的误判。

图13 β =6时基于固定加噪比的F102机组2016年 7月20日~7月21日待测数据的监测指标
Fig.13 The monitoring index of WT F102 with the fixed noise radio and the window width β set as 6 during July 20th to July 21th, 2016

上述四种方式所得到的监测指标总体趋势是一致的,机组正常运行时监测指标值在小于阈值的范围内波动。在机组出现异常或发生故障前一段时间内,监测指标开始增大,随后持续越限,但由于参数设置不同,模型所获得的机组参数互相关性和短时相依性存在差异,因此对机组运行状态出现了不同的监测结果。

以该风电场2016年和2017年33台机组共计29起机组故障异常案例和30组正常运行数据进一步分析本文检测方法中网络层数、滑动窗口宽度β、初始加噪比c0、最终加噪比cT及间距Δc对检测结果的影响,单次检测包括对59组案例数据的检测过程,检测结果准确率取10次重复检测结果的准确率均值。

取多重加噪比中初始加噪比c0、最终加噪比cT和间隔Δc分别为0.5、0.05及0.05,分析SDAE网络层数对检测性能的影响。DAE、两层SDAE及三层SDAE模型的检测结果准确率见表2,两层与三层SDAE模型的检测结果准确性明显高于DAE模型,从而验证了深度网络结构能有效提高模型的特征学习能力。但三层SDAE模型的检测结果准确性低于两层SDAE模型,其可能原因是三层SDAE模型出现了训练过拟合情况,为防止模型过拟合并节约计算成本,本文选用两层SDAE网络模型。

表2 各方法的检测结果准确率
Tab.2 Detection accuracy with different layers

(单位: %) 模型层数 异常 正常 总准确率 DAE 96.21 98.33 97.29 两层SDAE 96.90 99.33 98.14 三层SDAE 96.55 99 97.46

采用两层SDAE模型,分析不同滑动窗口宽度对检测结果的影响,不同滑动窗口宽度下检测结果的准确率如图14所示,滑动窗口宽度越大,窗口包含各参数短时相依性的信息越多,因此检测效果越好。但当β >6时,异常案例和正常案例的检测结果准确率不再明显上升,综合计算成本考虑,本文取滑动窗口宽度为6。

图14 不同滑动窗口宽度下检测结果的准确率
Fig.14 The detection accuracy with different widths of sliding window

表3 不同c0、cT与Δc时的检测准确率
Tab.3 Detection accuracy with different c0, cT and Δc

(单位: %) 加噪比 c0=0 c0=0.05 c0=0.1 c0=0.2 c0=0.3 c0=0.4 c0=0.5 c0=0.6 cT =0 83.73 — — — — — — — cT =0.05 — 92.20 93.90 95.08 96.10 97.29 98.14 97.46 cT =0.1 — — 92.37 93.56 95.08 96.95 97.46 96.27 cT =0.2 — — — 92.54 94.58 95.25 96.61 96.78 cT =0.3 — — — — 92.37 94.24 95.93 96.10 cT =0.4 — — — — — 92.03 94.07 95.76 cT =0.5 — — — — — — 91.86 93.73 cT =0.6 — — — — — — — 91.36

采用两层SDAE框架,分析不同c0、cT与Δc对模型检测结果的影响,10次检测结果的平均准确率见表3,其中当cT =c0时即为固定加噪比模型, 两者均为0时为SAE模型;当cT = 0.05时,间距为0.05,其余多重加噪比的间距为0.1。由表3可知:①降噪训练可明显提高模型的检测效果;②多重加噪比的训练方法有效提高了检测准确率,当初始加噪比c0>0.4、且最终加噪比cT<0.2时,模型检测结果的准确率均大于96%,采用过大的加噪比破坏原始输入数据时可能引起原始输入数据中信息的丢失,因此实际中可取初始加噪比为0.4~0.5之间;③多重加噪比的间距越小,检测结果的准确率越高,间距越小时重数越多,网络可实现机组正常运行数据更多邻域范围内的流形学习,从而获取更加详细的特征信息。

计算F102机组各状态参数对状态监测指标越限的贡献度,结果如图15所示,表1中的第1~6个状态参数贡献度较高,其中第4个状态参数即齿轮箱输出轴温度参数贡献度最高,与该机组实际发生的齿轮箱齿轮磨损导致输出轴过热的异常情况吻合,其中第1~3、5、6个状态参数贡献值较高是由于这些参数与齿轮箱输出轴温度参数的相关性强。

图15 F102机组各状态参数的贡献度
Fig.15 The contribution of each condition parameter

图16所示为F102机组齿轮箱输出轴温度预测 残差,由正常运行数据得到预测残差99%置信区间的边界分别为1.637℃、-1.593℃,虽然此方法可检测出故障发生时齿轮箱输出轴温度参数的异常,但在第51、第138个数据点附近出现了误诊断的情况,误将噪声数据识别为故障异常数据。此外,基于状态参数预测残差分析的机组状态监测方法需对各状态参数逐一建模,而本文方法直接对机组多元状态参数进行分析,根据参数相关性的变化检测机组状态的异常,可有效区分机组状态异常数据与噪声数据,避免了机组运行状态的误判。

图16 F102机组齿轮箱输出轴温度预测残差
Fig.16 The prediction residuals of WT F102 gearbox output bearing temperature

以该风电场29起机组故障案例和30组正常运行数据进一步验证本文检测方法的准确性,各方法的检测结果准确率见表4。由表4中各检测方法10次检测结果平均准确率的对比可知,本文检测方法对机组异常状态和正常状态均具有很好的检测效果,总准确率为98.14%,该方法可有效用于实际风电机组的状态异常检测。

表4 各方法的检测结果准确率
Tab.4 Detection accuracy of each method

(单位: %) 检测方法 异常 正常 总准确率 基于预测残差分析的方法 75.17 79.33 77.29 未经滑动窗口处理的方法 86.55 77.67 82.03 基于固定加噪比的方法(c=0.05) 90.69 93.67 92.20 本文方法 96.90 99.33 98.14

5 结论

本文提出了一种基于SDAE的多元状态数据重构的风电机组状态异常检测方法,根据机组多元状态参数多重相关性的变化实现机组异常状态的检测。建立了基于滑动窗口的SDAE模型以同时获取机组变量间的互相关性和短时相依性;采用多重加噪比的训练方法提高了模型特征学习能力,提取模型重构误差的马氏距离为状态监测指标,根据正常数据下监测指标的分布确定检测阈值,结合监测指标的连续越限数确定机组运行状态,最后计算各状态参量对指标越限的贡献度实现风电机组状态异常检测。

由实际的风电场SCADA数据对本文方法的验证结果表明:与基于状态参数预测残差分析的监测方法相比,本文方法避免了误判的发生和复杂的建模过程,有效区分了机组噪声数据与状态异常数据;与未经滑动窗口处理的SDAE及固定加噪比SDAE的状态监测方法相比,本文方法能更准确地挖掘机组故障前状态参数间相关关系的变化,可应用于工程实际中风电机组状态异常检测,提高机组停运预警能力。

参考文献

[1]Wei Qiao, Lu Dingguo. A survey on wind turbine condition monitoring and fault diagnosis—part I: components and subsystems[J]. IEEE Transactions on Industrial Electronics, 2015, 62(10): 6546-6557.

[2]Milborrow D. Operation and maintenance costs compared and revealed[J]. Wind Newsletter, 2006, 19(3): 1-3.

[3]杭俊, 张建忠, 程明, 等. 风力发电系统状态监测和故障诊断技术综述[J]. 电工技术学报, 2013, 28(4): 262-271. Hang Jun, Zhang Jianzhong, Cheng Ming, et al. An overview of condition monitoring and fault diagnostic for wind energy conversion system[J]. Transactions of China Electrotechnical Society, 2013, 28(4): 261-271.

[4]Hameed Z, Hong Y S, Cho Y M, et al. Condition monitoring and fault detection of wind turbines and related algorithms: a review[J]. Renewable & Sustainable Energy Reviews, 2009, 13(1): 1-39.

[5]Wei X, Verhaegen M, Engelen T V. Sensor fault detection and isolation for wind turbines based on subspace identification and kalman filter techni- ques[J]. International Journal of Adaptive Control and Signal Processing, 2010, 24(8): 687-707.

[6]Sanchez H, Escobet T, Puig V, et al. Fault diagnosis of an advanced wind turbine benchmark using interval- based arrs and observers[J]. IEEE Transactions on Industrial Electronics, 2015, 62(6): 3783-3793.

[7]Chan C W, Song Hua, Zhang Hongyue. Application of fully decoupled parity equation in fault detection and identification of DC motors[J]. IEEE Transa- ctions on Industrial Electronics, 2006, 53(4): 1277- 1284.

[8]Caselitz P, Bussel G W, Spinato F. Rotor condition monitoring for improved operational safety of offshore wind energy converters[J]. Journal of Solar Energy Engineering, 2005, 127(2): 253-261.

[9]李东东, 周文磊, 郑小霞, 等. 基于自适应EEMD和分层分形维数的风电机组行星齿轮箱故障检测[J]. 电工技术学报, 2017, 32(22): 233-241. Li Dongdong, Zhou Wenlei, Zheng Xiaoxia, et al. Diagnosis of wind turbine planetary gearbox faults based on adaptive EEMD and hierarchical fractal dimension[J]. Transactions of China Electrotechnical Society, 2017, 32(22): 233-241.

[10]杨明, 董传洋, 徐殿国. 基于电机驱动系统的齿轮故障诊断方法综述[J]. 电工技术学报, 2016, 31(4): 132-140. Yang Ming, Dong Chuanyang, Xu Dianguo. Review of gear fault diagnosis methods based on motor drive system[J]. Transactions of China Electrotechnical Society, 2016, 31(4): 132-140.

[11]Soua S, Lieshout P V, Perera A, et al. Determination of the combined vibrational and acoustic emission signature of a wind turbine gearbox and generator shaft in service as a pre-requisite for effective condition monitoring[J]. Renewable Energy, 2013, 51(2): 175-181.

[12]沈小军, 付雪姣, 周冲成, 等. 风电机组风速-功率异常运行数据特征及清洗方法[J]. 电工技术学报, 2018, 33(14): 3353-3361. Shen Xiaojun, Fu Xuejiao, Zhou Chongcheng, et al. Characteristics of outliers in wind speed-power operation data of wind turbines and its cleaning method[J]. Transactions of China Electrotechnical Society, 2018, 33(14): 3353-3361.

[13]Cross P, Ma X D. Nonlinear system identification for model-based condition monitoring of wind turbines[J]. Renewable Energy, 2014, 71(11): 166-175.

[14]Yampikulsakul N, Byon E, Huang S, et al. Condition monitoring of wind power system with nonparametric regression analysis[J]. IEEE Transactions on Energy Conversion, 2014, 29(2): 288-299.

[15]Sun Peng, Li Jian, Wang Caisheng, et al. A generalized model for wind turbine anomaly identification based on SCADA data[J]. Applied Energy, 2016, 168: 550- 567.

[16]Skrimpas G A, Sweeney C W, Marhadi K S, et al. Employment of kernel methods on wind turbine power performance assessment[J]. IEEE Transactions on Sustainable Energy, 2015, 6(3): 698-706.

[17]Kusiak A, Verma A. A data-mining approach to monitoring wind turbines[J]. IEEE Transactions on Sustainable Energy, 2011, 3(1): 150-157.

[18]Bangalore P, Tjernberg L B. An artificial neural network approach for early fault detection of gearbox bearings[J]. IEEE Transactions on Smart Grid, 2017, 6(2): 980-987.

[19]Zaher A, Mcarthur S D J, Infield D G, et al. Online wind turbine fault detection through automated SCADA data analysis[J]. Wind Energy, 2010, 12(6): 574-593.

[20]尹诗, 余忠源, 孟凯峰, 等. 基于非线性状态估计的风电机组变桨控制系统故障识别[J]. 中国电机工程学报, 2014, 34(增刊1): 160-165. Yin Shi, Yu Zhongyuan, Meng Kaifeng, et al. Fault identification of pitch control system of wind turbine based on nonlinear state estimation[J]. Proceedings of the CSEE, 2014, 34(S1): 160-165.

[21]Peng G, Infield D, Yang X. Wind turbine generator condition-monitoring using temperature trend analysis[J]. IEEE Transactions on Sustainable Energy, 2011, 3(1): 124-133.

[22]Schlechtingen M, Santos I F, Achiche S. Wind turbine condition monitoring based on SCADA data using normal behavior models. Part 1: system description[J]. Applied Soft Computing, 2013, 13(1): 259-270.

[23]Kruger M, Ding S X, Haghani A, et al. A data-driven approach for fault diagnosis in gearbox of wind energy conversion system[C]//Control and Fault- Tolerant Systems, Nice, France, 2014: 359-364.

[24]Wang Long, Zhang Zijun, Xu Jia, et al. Wind turbine blade breakage monitoring with deep autoencoders[J]. IEEE Transactions on Smart Grid, 2018, 9(4): 2824- 2833.

[25]刘辉海, 赵星宇, 赵洪山, 等. 基于深度自编码网络模型的风电机组齿轮箱故障检测[J]. 电工技术学报, 2017, 32(17): 156-163. Liu Huihai, Zhao Xingyu, Zhao Hongshan, et al. Fault detection of wind turbine gearbox based on deep autoencoder network[J]. Transactions of China Electrotechnical Society, 2017, 32(17): 156-163.

[26]Vincent P, Larochelle H, Bengio Y, et al. Extracting and composing robust features with denoising auto- encoders[C]//International Conference on Machine Learning, Helsinki, 2008: 1096-1103.

[27]代杰杰, 宋辉, 杨祎, 等. 基于栈式降噪自编码器的输变电设备状态数据清洗方法[J]. 电力系统自动化, 2017, 41(12): 224-230. Dai Jiejie, Song Hui, Yang Yi, et al. Cleaning method of status data of power transmission and trans- formation equipment based on stacked denoising autoencoders[J]. Automation of Electric Power Systems, 2017, 41(12): 224-230.

[28]Ku W, Storer R H, Georgakis C. Disturbance detection and isolation by dynamic principal component analysis[J]. Chemometrics and Intelligent Laboratory systems, 1995, 30(1): 179-196.

[29]Vincent P, Larchelle H, Lajoie I, et al. Stacked denoising autoencoders: Learning useful representa- tions in a deep network with a local denoising criterion[J]. Journal of Machine Learning Research, 2010, 11(12): 3371-3408.

[30]Chandra B, Sharma R K. Adaptive noise schedule for denoising autoencoder[C]//Proceedings of the 21st International Conference on Neural Information, Kuching, Malaysia, 2014: 535-542.

[31]Geras K J, Sutton C. Scheduled denoising auto- encoders[C]//International Conference on Learning Representations, San Diego, USA, 2015: 1-11.

[32]Wand M P, Jones M C. Kernel smoothing[M]. London: Chapman and Hall, 1995.

A Method for Detecting Anomaly Conditions of Wind Turbines Using Stacked Denoising Autoencoders with Sliding Window and Multiple Noise Ratios

Chen Junsheng1 Li Jian1 Chen Weigen1 Sun Peng2
(1. State Key Laboratory of Power Transmission Equipment & System Security and New Technology Chongqing University Chongqing 400044 China 2. State Grid Henan Electrical Power Research Institute Zhengzhou 450000 China)

Abstract This paper presents a multivariable reconstruction approach to detect the anomaly conditions of wind turbines (WTs), focusing on the data collected from the wind farm supervisory control and data acquisition (SCADA) system. Firstly, the stacked denoising autoencoders (SDAE) model with sliding window was developed to capture nonlinear correlations among multiple variables and temporal dependencies at each variable simultaneously, and reconstruct the status data of WTs. Secondly, the SDAE model with sliding window was trained under multiple noise ratios to learn the coarse-grained and fine-grained features of condition parameters for improving the feature representation of model. Finally, the Mahalanobis distance (MD) of reconstruction error was defined as the monitoring index. The threshold of monitoring index was obtained based on the probability density function (PDF) of MD with the kernel density estimation. The duration of over-limit was utilized to detect the anomaly conditions of WTs. The anomaly conditions of WTs were identified based on the contribution of each variable. The analysis results of SCADA data collected from a wind farm in Eastern China show that the proposed method is effective for the anomaly condition detection of actual wind turbines.

Keywords:Wind turbine, anomaly detection, supervisory control and data acquisition system, stacked denoising autoencoders, sliding window, multiple noise ratios

中图分类号:TM315

DOI: 10.19595/j.cnki.1000-6753.tces.181577

国家重点基础研究发展计划(973计划)(2012CB215205)和高等学校学科创新引智计划(B08036)资助项目。

收稿日期 2018-10-08 改稿日期 2018-12-20

作者简介

陈俊生 男,1989年生,博士研究生,研究方向为风电设备状态监测、故障诊断与运行风险评估。 E-mail: chenjunsheng@cqu.edu.cn

李 剑 男,1971年生,教授,博士生导师,研究方向为新型环保型电工绝缘材料、电气设备绝缘在线监测与故障诊断理论及技 术等。 E-mail: lijian@cqu.edu.cn(通信作者)

(编辑 陈 诚)