用于未来态预测的电网运行断面时空相似性挖掘

顾雪平1 刘 彤1 李少岩1 王铁强2 杨晓东2

(1. 华北电力大学电气与电子工程学院 保定 071003 2. 国网河北省电力公司 石家庄 050021)

摘要 运行状态有效预测可为电网风险预判与优化调控提供数据基础,对保障系统安全运行具有重要意义。该文提出一种用于未来态预测的电网运行断面时空相似性挖掘方法。首先,采用图表示学习算法对电网拓扑及其属性信息进行深层次无监督学习,提取表征运行断面空间特征的属性向量;然后,利用滑动时间窗算法将历史运行断面对应的空间特征向量按照不同时段划分到多个窗口;最后,从微观和宏观两角度计算不同窗口间对应样本相似性,获取与当前时段内断面最相似的一组连续断面,并将该组历史断面的后续时刻断面作为当前电网运行未来状态的参考。通过新英格兰10机39节点系统和实际电网算例进行验证,结果表明所提方法能够有效提取最相似的历史断面,进而实现对未来状态的辅助预测。

关键词:运行状态预测 图表示学习算法 运行断面空间特征 时段划分 相似性匹配

0 引言

随着电网建设的快速发展建设的快速发展,大规模新能源及电力电子设备等不断接入电网,其新的运行特性以及所带来的随机、不确定因素给电网安全稳定运行带来潜在的威胁[1-2]。为及时发现电网安全隐患,实现事故前预警和超前安全分析,避免局部故障酿成大面积停电事故,需对电网运行状态进行实时感知与预判[3-4]

已有电网运行风险预测研究[4]通常为选取能够代表整个系统运行状态的几类电气特征的统计量,如线路两端最大功角差、电压最大越限程度等,之后通过判断这些特征的变化趋势评判电网整体运行状态。但由于不能预测全面的运行数据信息,因此无法预辨识一些风险较大的薄弱环节并采用针对性的防控措施,存在潜在恶性故障发生的可能。电网调控系统存储了多年大量有价值的系统运行数据,其中运行断面数据代表了某一历史时刻电网的整体运行状态,包括潮流、电压、负荷量、发电量和设备状态等运行数据,以及与断面对应的检修信息,包括运行方式安排、风险分析、事故处理预案等[5-6]。若能找到与未来运行断面相似的历史断面,则可为薄弱环节辨识、联锁故障分析及优化防控措施提供重要信息基础,对保障系统安全运行具有十分深远的意义[7-8]

目前,电网相似历史运行断面挖掘领域取得了一定的研究成果。文献[5]通过决策树模型筛选发电机出力、节点负荷等电气特征的统计量作为断面特征,利用改进K-means算法为系统当前断面匹配相似的历史运行断面。文献[6]基于文献[5]方法构造历史样本集,之后利用堆叠自动编码器算法进行深度学习,实现运行断面分类。文献[9]根据发电计划、负荷预测、检修预测等计划类数据,在历史潮流断面中搜索相似断面。文献[10]以相似日为依据获得历史上相似日的运行断面。上述研究通过单断面间特征匹配或相似日提取,实现相似历史运行断面的再利用,但参考价值较低,主要原因有:①利用电气特征量统计值(最大、最小、平均等)、相似日等匹配历史相似运行断面过于粗粒化,结果准确度不高;②仅依靠单断面间相似性进行历史断面的提取,忽略了前后运行状态在时序上的连续性、空间上分布的关联性[11-12],判别结果具有偶然性且无法反映电网运行趋势。因此,应综合考虑运行断面空间和时间特征,并从多个角度考量当前运行状态与历史运行状态的相似性,进而实现对未来态的预测。

近年来,图表示学习方法[13-14]飞速发展,其作为一种针对图形结构知识进行深度学习[15-16]的智能算法,已成功解决多类问题,如链接预测[17-18]、异常检测[19-20]、行为辨识[21-22]等。图的样本和聚合算法(Graph Sample and Aggregate, GraphSAGE)作为图表示学习算法的一种,可通过归纳式深层次学习目标节点与周围邻居节点信息,得到新的节点表征向量[23]。利用该算法对电网运行断面进行特征提取能够充分考虑网络拓扑信息,提取特征具有较强的代表性。针对单断面计算的偶然性、低效性等问题,滑动时间窗[24-25](Sliding Time Window, STW)法可通过设置步长,实现断面连续采样,继而得到运行断面在一段时间内的特征。

本文提出一种用于未来态预测的电网运行断面时空相似性挖掘方法。首先,利用GraphSAGE算法聚合各节点及其周围邻居节点信息,得到包含拓扑信息的运行断面空间属性向量;然后,通过STW算法对历史时序样本属性向量进行移位采样,保证时间关联性;最后,利用余弦相似度与欧氏距离分别对当前窗口与历史窗口内连续断面进行相似性匹配,将综合相似性最高的历史断面的后续时刻断面作为当前断面的未来状态参考。采用IEEE 39节点系统和实际电网算例验证了所提方法的有效性。

1 电网运行状态辅助预测思路

目前,短期(5~15min)运行状态预测方式为工作人员将当前时刻或者相似日相同时刻的运行信息作为未来时刻的断面信息,之后进行风险预判、安全分析等。然而,作为时变性网络,5min或15min内,电力系统可能发生关键性变化,传统方法无法实现及时辨别。

电网多年运行存储了海量的运行断面数据,若能有效挖掘到与当前、未来断面相似的历史断面信息,不仅可辅助预测电网运行未来状态,亦可参考对应的历史工作票信息,辅助运行调度人员分析薄弱环节、故障预案等。电网运行状态辅助预测思路如图1所示。

width=155.25,height=143.25

图1 电网运行状态辅助预测思路

Fig.1 The idea of auxiliary prediction for power grid operation state

由图1可知,本文预测思路为首先对运行断面进行特征提取;然后将当前运行断面特征与历史运行断面特征进行相似性计算,筛选与当前运行断面最相似的历史运行断面;最后,将相似历史运行断面的后续时刻断面,作为当前运行的未来状态参考。

本文的电网运行断面指时间断面,在实际电网运行中每5~15min保存一次,由系统内各元件的电气状态量组成,状态量在时间上具有连续性,每个节点属性、每条支路信息、每类拓扑结构为运行断面的特征之一。因此,在进行运行断面特征提取与匹配过程中,应充分考虑断面的时间和空间特点。

2 计及时空特性的运行断面特征提取

2.1 运行断面的初始信息选择与处理

已有断面特征提取方法一般为在节点、线路中筛选某类型电气特征量的统计指标,例如最大值、最小值、总和,拓扑结构特征通过邻接矩阵表达;亦或是摒弃电气特征和拓扑结构特征,直接根据相似日选取相似断面,不能很好地表征运行断面的特点,导致后续匹配结果参考价值较低。为提高运行断面特征的代表性以及匹配结果的有效性,文中首先根据PSD-BPA、Matpower等潮流计算软件进行计算后所获得的电网运行信息,定义电压幅值、相位、发电有功、发电无功、负荷有功、负荷无功共6个属性量为每个节点初始电气特征,表达为1个6维的列向量,如节点i的初始特征记为xoi=[xo1i xo2iwidth=11.55,height=8.15 xojiwidth=11.55,height=8.15 xo6i]T。设电网的节点数量为m,则电网运行断面初始电气特征可表达为

width=145.35,height=93.05 (1)

式中,Xo为运行断面所有节点初始属性信息组成的6×m维矩阵。由式(1)各节点电气属性可计算得到整个运行断面的潮流信息,相较于传统方法具有较高的代表性。

由于各类属性量纲不同,为提高计算效率,需要进行标准化处理。利用z-score标准化方法对Xo进行处理,经过处理的数据的均值为0,标准差为1。以任一节点i的第j维属性xoji转换过程为例,则属性j在所有节点中的均值width=13.6,height=16.3

width=50.25,height=40.1 (2)

属性j在所有节点中的标准差σj

width=95.75,height=31.9 (3)

节点i的第j个属性标准化后的值xji计算式为

width=58.4,height=31.9(4)

对所有节点属性向量进行标准化后的电网运行断面数据为

width=135.15,height=99.15 (5)

为进一步增强提取的运行断面空间特征的代表性,本文在式(5)的基础上,利用GraphSAGE算法加入了网络拓扑属性信息。

2.2 基于GraphSAGE算法的断面空间特征提取

2.2.1 GraphSAGE算法简介

GraphSAGE算法是一种以网络连接为背景的拓扑属性信息分析方法,通过聚合节点自身和其周围邻居节点的信息,生成新的节点表征向量,在计及各节点属性的同时保留拓扑信息。传统方法通常将电网拓扑用仅由数值0、1组成的邻接矩阵来表达,代表性较低;将拓扑特征与电气特征一起作为相似性的计算依据,需要人为判定电气特征与拓扑特征的相对重要度,存在一定主观性。GraphSAGE算法利用无监督深度学习方式将拓扑特征融入到各节点特征,获得综合表征电气特征和拓扑特征的实值的断面属性向量,提高断面特征代表性,并通过向量高维转换、反向优化等措施,实现运行断面空间特征的有效表达,同时改善传统方法的不足。工作过程主要分为三个步骤:

1)拓扑结构表征

首先,根据电网拓扑结构,建立邻接矩阵,确定系统内各节点与周围邻居节点间的关联关系。将整个拓扑结构的属性细化为节点与节点之间关联性,以每个节点与其邻居节点之间的联系表征整个网络拓扑。进而,可通过每个节点采样邻居节点信息,表征综合电气属性和拓扑属性的运行断面特征。

2)采样邻居节点

采样的邻居节点体现了以各节点为中心的局部拓扑覆盖范围,数量由采样层数K和每层采样数量sk共同决定。当k=0时,节点为自身标准化后的初始属性信息。当k=1时,每个节点均采样与自身直接相连的一阶邻居节点信息,采样的邻居节点数量为s1。当k=2时,采集与自身节点隔一个节点相连的二阶邻居节点信息,采样的邻居节点数量为s2。以此类推,直至k=K。一般情况下,K=2时汇合每个节点的局部拓扑范围便可表征整个网络拓扑[16]。若目标节点的邻居数量小于sk,采用有放回的抽样方法,直到采样出sk个节点;若目标节点的邻居数量大于sk,采用无放回的抽样方法。为保证断面匹配的准确性和快速性,文中设置第一层采样邻居节点数为最多邻居节点数,第二层为次多邻居节点数。

3)聚合邻居信息

明确采样层数K和每层的采样邻居节点数量sk后,利用归纳式聚合方式对邻居节点的属性信息进行聚合。聚合步骤包括目标和邻居节点信息取均值、线性转换、非线性激活等。每一采样层节点信息均由前一采样层节点信息聚合所得,最高采样层各节点信息则代表运行断面最终的特征。

2.2.2 邻居节点采样过程

以某时刻系统局部区域的运行断面为例介绍邻居节点的采样过程。设置任一节点为目标节点v,其某邻居节点为uK=2,s1=4,s2=3,采样过程如图2所示。图2中,●代表目标节点v,⦿为节点v的一阶邻居节点,◎为节点v的二阶邻居节点。

width=96,height=152.25

图2 采样过程示意图

Fig.2 Schematic diagram of sampling process

由图2可知,k=0时,各节点的特征均为自身初始属性数据;k=1时,节点v将采样并聚合周围4个邻居节点的属性信息,同时其他节点,如节点u亦采样并聚合周围邻居节点信息;k=2时,节点v采样并聚合周围3个邻居节点信息,此时周围邻居节点信息已包含了自身的一阶邻居节点信息,故节点v采样到了自身的二阶邻居节点信息。

2.2.3 邻居节点信息聚合

考虑到断面相似性匹配为断面间对应节点各维度属性值的对比,为提高匹配准确率,同时计及匹配效率,在聚合邻居节点信息过程中,除第0采样层各节点特征为式(5)中6维的列向量外,本文通过权重矩阵将其他层各节点特征保持在128维。以k层各节点特征聚合得到k+1层各节点属性向量的过程为例进行说明。

xki为第k层节点i的属性向量,xki=[xk 1ixk 2ixkjixkni]Tk=0时,n=6,k≥1时,n=128;sk=3。随机抽取节点ik层邻居节点属性向量:xkaxkbxkc,对目标节点属性向量与其邻居节点属性向量取均值为

width=173.9,height=28.55(6)

将得到的均值向量eki经权重矩阵进行线性转换,得到向量hki

width=50.95,height=16.3 (7)

式中,width=23.1,height=16.3为第k+1层节点i的权重矩阵。

之后,为使人工神经网络的工作过程相似于人脑,利用线性整流函数对hki进行非线性转换,即得到节点i的第k+1层属性向量,转换过程为

width=169.8,height=36.7 (8)

式中,f(·)为ReLU函数;hk ji为节点i的第j个属性值;n为属性向量维数。

节点信息经层层聚合,得到最高层K层各节点属性向量,之后将该层节点属性向量组成运行断面空间特征进行输出,用于后续断面间相似性匹配。

2.3 运行断面空间特征优化

2.3.1 损失函数设计

部分运行断面中可能存在错误数据、空值等现象,影响特征准确表达。在提取运行断面特征过程中,虽然初始电气属性向量相对稠密、聚合邻居节点信息等可降低一定异常数据的影响,但为进一步提高断面特征容错性,设计了无监督损失函数。该函数依据相邻节点有相似的表示向量、非邻居节点向量差异性较大的原则,达到包容异常数据和强化断面特征的目的。首先,通过Random walk算法获取任一距离目标节点v固定长度的邻居节点u的属性向量;其次,随机采集固定长度以外的“非邻居节点”属性向量;最后,对采集到的属性向量进行损失计算,计算公式为

width=193.6,height=18.35(9)

式中,zvzu分别为目标节点v和其邻居节点u的第k层属性向量;(zT vzu)表示节点vu属性向量相似程度,节点间越相似,值越大;unv的非邻居节点;n为采集的非邻居节点的序号,n=1,2,…,QQ为采集的非邻居节点总数;Pn为随机生成的非邻居节点概率分布;E为期望,对Q次非邻居节点计算结果取均值;g为Sigmoid函数,将属性向量相乘的结果控制在(0,1)区间,用于后续对数计算。

2.3.2 参数反向优化

利用随机梯度下降(Stochastic Gradient Descent, SGD)优化器对前向传播得到的目标节点的属性向量进行反向传播优化,得到最优参数Wk。SGD优化过程为

width=138.55,height=19.7 (10)

式中,width=9.5,height=11.55为学习率;e为迭代次数;k为聚合层数;JG(Wk;zv;zo v)为代价函数;width=19,height=16.3为对损失函数求权重矩阵Wk的偏导;zv为第e次迭代时的节点属性向量;zo ve次迭代前最小损失函数值对应的节点属性向量。

综上可知,本文电网运行断面空间特征提取与优化过程为:首先,确定系统中m个总节点的初始属性信息并进行标准化,建立6×m维矩阵作为运行断面初始特征;其次,将6×m维初始特征和邻接矩阵作为输入,利用GraphSAGE算法依次对各采样层每个节点进行邻居节点采样与聚合,同时对聚合得到的新向量进行反向优化;最后,将最高采样层的各节点属性向量构成128×m维矩阵输出,作为运行断面的新特征,提取流程如图3所示。图3中,skk层采样邻居节点数量,m为系统总节点数量,E为最大迭代次数。

width=203.25,height=336

图3 电网运行断面空间特征提取流程

Fig.3 Flow chart of spatial feature extraction for power grid running section

2.4 考虑电网运行时序性的连续空间特征采样

电网运行具有时序性特点,单断面间的相似性匹配结果参考价值较低,应将当前断面的前几个时刻断面共同作为待匹配项,寻找与该组待匹配断面最相似的一组历史连续断面。STW算法可对时序性样本进行连续采样,将样本按照时间顺序划分到不同窗口。在提取到历史运行断面空间特征的情况下,利用STW算法对断面的空间特征进行移位采样,进一步实现窗口与窗口间对应断面的相似性计算。

文中设置滑动窗口为4,代表1h内电网运行状态,移动步长为1。基于STW算法的历史连续运行断面属性向量采样过程如图4所示。图4中,虚线上方为历史存储断面对应的空间特征,共n个128×m维矩阵,第n个矩阵代表当前断面特征;基于STW算法共生成n-3个滑动窗口,每个窗口包含4个断面空间特征。

width=173.25,height=117

图4 STW采样过程示意图

Fig.4 Schematic diagram of STW sampling process

3 计及时空特性的相似运行断面挖掘

3.1 基于余弦相似度和欧式距离的运行断面相似性计算

运行断面空间特征由128×m维矩阵组成,而矩阵间相似性计算与向量类似,既要考虑两个矩阵属性值总体差异度,还要考虑两个矩阵方向一致性。因此,提出从“宏观”和“微观”两方面综合对比运行断面间相似性。利用欧式距离计算断面间各类属性在数值上的绝对差异度,用于“宏观”比较;采用余弦相似度计算断面间属性各对应数值成相同比例的程度,用于“微观”分析。

宏观相似性由欧式距离的倒数表示,微观相似性由余弦值体现。设两个运行断面提取后的特征分别为XY,两者的相似度计算公式分别为

width=123.6,height=44.85 (11)

width=122.25,height=59.75 (12)

式中,m为运行断面节点数量;j为特征维数;Sim_d、Sim_c取值范围均为[0,1]。

3.2 历史相似运行断面匹配

结合图4分析,将当前运行断面所在窗口内的连续断面与历史窗口内连续断面一一对应进行相似度计算,再求和。由于运行断面的时序性特点,窗口内不同位置的样本相似性对窗口间综合相似度的影响具有差异性,即窗口内断面位置越接近尾端,计算结果越重要。因此,文中对窗口内不同位置的相似值赋予了权重,如第i个窗口内断面与当前窗口内断面的宏观相似度和微观相似度计算如式(13)所示。之后,根据宏观综合相似度和微观综合相似度对各窗口进行降序排列。

width=212.6,height=33.3 (13)

式中,Di为第i个窗口内断面与当前窗口内断面的宏观综合相似度;Ci为第i个窗口内断面与当前窗口内断面的微观综合相似度;didi+1di+2di+3cici+1ci+2ci+3分别为单断面间宏观和微观相似度;w1w2w3w4分别为窗口内不同位置相似度对应的权重。

权重设置依据:①窗口内权重之和为1,单个权重的取值范围为(0,1);②权重值从左到右依次递增;③经加权求和并降序排列后,得到的排序前5的窗口内对应断面间相似度逐渐升高,相似度之间方差较小。经多次试验可知,将权重设置为0.1、0.2、0.3、0.4,即可满足要求。

将窗口的宏观综合相似度排名和微观综合相似度排名取均值,筛选与当前窗口总相似度排序第一的历史窗口,以窗口i总相似度排名计算过程为例,即

width=50.95,height=28.55 (14)

式中,width=10.85,height=16.3为窗口i的微观综合相似度排名;width=11.55,height=16.3为窗口i的宏观综合相似度排名。当两个窗口总相似度排名并列时,将微观综合相似度排名靠前的窗口排序在前。

用于未来态预测的电网运行断面时空相似性挖掘流程如图5所示。

width=213.75,height=185.25

图5 电网运行断面时空相似性挖掘

Fig.5 Temporal and spatial similarity mining of power grid running section

4 算例仿真

采用IEEE 39节点系统和实际电网算例进行仿真计算,验证所提方法有效性。算例分析采用PSD-BPA软件计算系统运行潮流,获取节点运行信息;利用Pycharm平台建立电网运行状态预测模型。

4.1 IEEE 39节点算例

4.1.1 构造样本集

以某省域实际系统10月份日负荷曲线为参考构建算例系统的日负荷曲线。首先,计算实际系统10月份各时刻负荷平均值,选取最接近此平均值的日负荷均值,将其对应的日负荷作为10月份典型日负荷;在典型日负荷中选择最接近该日负荷均值的某一时刻负荷作为此系统基准负荷,计算典型日各时刻负荷与基准负荷的倍数,得到典型日负荷相对关系曲线。计算各时刻最大、最小负荷与基准负荷的倍数;以典型日负荷相对关系曲线为中心,各时刻在最大和最小负荷倍数范围内随机取值,将各日负荷倍数与系统基准负荷相乘即得到不同日期负荷。在根据上述方法确定各日期1~24整点时刻负荷后,以相邻整点时刻的负荷为边界,随机取三个数值作为相邻时刻内三次负荷值,得到以15min为间隔的96点日负荷曲线,同时需要按负荷变化趋势的连续性进行适当调整,以保证负荷曲线的合理性。

以图6所示的IEEE 39节点系统为算例,考虑到潮流收敛问题,将算例系统标准数据总负荷6 150.1MW作为基准负荷,各时刻点负荷在4 920.08~ 7 687.63MW范围内变化,不同日期相同时刻负荷差值为0~922.51MW,同一日期相邻时刻负荷差值为0~1 045.52MW,构造了算例系统10月1日~10月31日的日内96时刻点负荷。按照不同相应比例缩放各节点负荷构造样本集,并参考实际电网运行的做法,计及发电计划、检修任务的实施,保证各母线电压维持在0.95(pu)~1.05(pu)范围内,发电机出力不越限,共构造2 976个连续运行断面。检修时间设置为6~15h,时段分布在6:00~22:00,检修任务见表1。

width=225,height=228.75

图6 IEEE 39节点系统

Fig. 6 IEEE 39-bus system

表1 检修任务表

Tab.1 Maintenance task list

序号检修时间检修类型 110.6/8:00~18:00线路9检修 210.9/12:15~21:15线路10检修 310.12/7:15~21:45线路3、38检修 410.15/6:00~12:00线路8、13检修 510.20/8:00~21:45线路16检修 610.25/6:00~12:00线路29检修 710.29/14:00~20:00线路44检修

选取五组连续断面作为测试样本进行验证,首先匹配与测试样本相似的历史连续运行断面,之后校验最相似历史断面的下一时刻断面与测试样本的实际下一时刻断面的相似度。测试样本集见表2。

表2 测试样本集

Tab.2 Test sample set

测试组序号测试样本对应时刻 Test-110.5/5:30~6:15 Test-210.12/9:00~9:45 Test-310.18/14:30~15:15 Test-410.25/17:45~18:30 Test-510.29/16:15~17:00

4.1.2 匹配结果分析

根据历史窗口的宏观和微观综合相似度排序计算得到总相似度排序,将排序第一的历史窗口内连续断面作为最相似历史断面,五组测试样本匹配结果见表3。

表3 各测试样本匹配结果

Tab.3 Matching results of each test sample

序号测试样本匹配结果 Test-110.5/5:30~6:1510.31/1:00~1:45 Test-210.12/9:00~9:4510.12/9:15~10:00 Test-310.18/14:30~15:1510.17/14:30~15:15 Test-410.25/17:45~18:3010.19/18:00~18:45 Test-510.29/16:15~17:0010.29/15:00~15:45

分别选取无检修和有检修任务下的两组运行断面匹配结果进行分析,其中无检修任务的样本占总样本的91%。以Test-1(无检修任务)和Test-2(有检修任务)为例,结果见表4和表5。

表4 Test-1匹配结果

Tab.4 Matching results of Test-1

相似度排名微观相似断面宏观相似断面 断面对应时刻相似值断面对应时刻相似值 110.31/1:00~1:450.999 89310.31/1:00~1:450.931 952 210.7/2:30~3:150.999 75810.7/2:30~3:150.905 401 310.6/4:00~4:450.999 70410.6/4:00~4:450.887 085 410.7/6:15~7:000.999 52610.16/5:30~6:150.871 131

表5 Test-2匹配结果

Tab.5 Matching results of Test-2

相似度排名微观相似断面宏观相似断面 断面对应时刻相似值断面对应时刻相似值 110.12/9:15~10:000.999 79210.12/8:45~9:300.895 644 210.12/15:30~16:150.999 66610.12/9:15~10:000.872 782 310.12/8:45~9:300.999 66510.12/15:30~16:150.872 224 410.12/15:45~16:300.999 53810.12/15:45~16:300.869 714

由表4可知,在电网拓扑结构不变的情况下,与待测断面相似性较大的历史断面多分布在不同日期的某时刻。该测试组中宏观相似性和微观相似性匹配结果基本一致。除自身样本外,10.31/1:00~1:45时刻对应的断面与10.5/5:30~6:15时刻断面(Test-1)的微观和宏观综合相似性总排序第一,为最相似历史连续断面。

由表5可知,在电网拓扑结构变化的情况下,由于相似的样本较少,与待测断面相似性较大的历史断面多分布在相同日期的前后时刻。宏观相似性和微观相似性匹配结果在排序上存在差异,但相似断面一致。除自身样本外,与10.12/9:00~9:45时刻断面(Test-2)总相似性排序第一的为10.12/9:15~10:00时刻对应的断面。

通过对匹配结果进行分析发现,当历史样本中存在大量与当前断面在时空上相似的断面时,最相似的历史运行断面通常分布在任一时刻;此外,在某些情况下,运行断面的宏观相似性匹配与微观相似性匹配结果可能不一致,应考虑两者的匹配结果,选择总排序最靠前的断面。

4.1.3 预测结果分析

根据系统运行的数据,如发电功率、负荷功率、线路潮流等,对匹配到的测试样本的最相似历史断面的下一时刻断面与实际的测试样本的下一时刻断面进行对比,平均误差率如图7所示。

width=162,height=129

图7 预测断面平均误差率

Fig.7 Average error rate of forecast running section

由图7可知,测试组中Test-1、3、4的预测结果误差相对较低,而Test-2和Test-5为检修情况下的断面,样本集内相似的断面较少,因此预测的平均误差率相对较高。

以Test-3为例,对比预测的下一时刻断面与实际的下一时刻断面各节点、线路功率值,结果如图8所示。

4.1.4 对比分析

文中方法考虑电网运行时空特性对断面进行特征提取与相似性匹配,并从宏观和微观角度筛选相似性综合排序第一的历史连续断面的下一时刻断面作为当前运行下一时刻的参考断面。文献[5]通过决策树模型选择运行断面属性量进行匹配,但忽略了运行断面的时序性;文献[10]通过相似日匹配相似的历史运行断面,忽略了断面的空间特征;而工作人员通常采用当前时刻作为下一时刻断面进行安全分析。将本文所提方法与文献[5,10]所提方法和实际常用方法的预测结果进行比较,以Test-4为例,预测结果与实际相比差异性如图9所示。

width=224.25,height=317.25

width=179.25,height=113.25

图8 预测与实际运行断面的功率对比

Fig.8 Comparison of power between forecast and actual running section

width=164.25,height=105.75

图9 不同角度下预测结果平均误差率

Fig.9 Average error rate of prediction results from different perspectives

由图9可知,文中所提方法预测的运行断面与实际断面误差最小;无空间特征和实际常用方法的预测误差次之;当不考虑时序特征时,误差最大。

此外,在数据存储的过程中,可能出现错误、空缺等异常数据,假设Test-4中17:45时刻的运行断面中节点9电压为1.008(pu),但误存为1.108(pu),则文献[10]和文中所提方法相似性计算结果排序发生变化,以微观相似性匹配为例,结果见表6和表7。

由表6可知,数据记录错误的情况下,文献[10]方法匹配结果排序前5中有4个发生变化,分别为排序第2、3、4、5的结果。

由表7可知,数据记录错误的情况下,文中所提方法匹配结果排序前5中有1个发生变化,为排序第5的结果。

表6 文献[10]方法匹配结果

Tab.6 Matching results of the method proposed in Rer.[10]

排序数据无误数据错误 断面对应时刻相似值断面对应时刻相似值 110.25/17:45~18:30110.25/17:45~18:300.995 972 210.15/17:45~18:300.999 70610.28/17:45~18:300.991 810 310.28/17:45~18:300.999 64010.15/17:45~18:300.990 625 410.10/17:45~18:300.999 52910.30/17:45~18:300.990 144 510.27/17:45~18:300.999 52810.10/17:45~18:300.990 069

表7 文中所提方法匹配结果

Tab.7 Matching results of the method proposed in this paper

排序数据无误数据错误 断面对应时刻相似值断面对应时刻相似值 110.25/17:45~18:30110.25/17:45~18:300.998 777 210.19/18:00~18:450.999 94810.19/18:00~18:450.994 959 310.24/18:00~18:450.999 80410.24/18:00~18:450.993 442 410.30/17:30~18:150.999 75110.30/17:30~18:150.993 208 510.13/17:30~18:150.999 72510.26/17:30~18:150.992 645

由此可见,相较于文献[10]方法,文中所提方法在考虑断面空间特征情况下,对异常数据具有一定的包容性,相似性排序结果受影响的程度较小。

4.2 实际系统算例

实际算例采用河北某区域局部电网,该局部电网拓扑由58个节点,82条边组成。由于本文是针对节点和拓扑进行的特征提取,故将地理接线图中的双回线路在拓扑中简化为一条边,拓扑结构如图10所示。

width=227.25,height=156.75

图10 河北部分区域电网拓扑结构

Fig.10 Topology diagram of Hebei regional power grid

以2018年9月23日14:00的运行断面为当前断面,预测14:15的运行断面。统计该局部电网2018年8月1日0时~9月23日14:00的历史运行断面,共5 048个样本。将9月23日13:15、13:30、13:45、14:00的运行断面作为测试样本,进行历史相似性匹配,筛选出总相似性排序第1的断面,并将其下一时刻断面作为当前电网运行的下一时刻参考断面。

匹配结果中,总排序第1的历史连续断面为8月16日18:00~18:45的断面,对应宏观和微观相似度如图11所示。

width=201.75,height=144

图11 当前断面与历史断面相似值

Fig.11 Similarity between current section and historical section

由图11可知,历史断面与当前断面在宏观和微观上相似性逐渐增大,且预测断面与实际下一时刻断面相似度亦较高。

4.1节从功率流角度验证了预测断面与实际断面的差异程度,此次校验从电压幅值和相位方面进行验证。图11中当前与历史时刻对应匹配和预测断面的电压幅值和相位绝对误差如图12所示。

由图12可知,历史断面与当前断面的电压幅值绝对误差最大不超过0.008(pu),相位绝对误差最大不超过2°。此外,历史断面与实际断面的绝对误差随时间越来越小,证明了所提方法的可行性。在5 048个历史样本的情况下,受配置环境、训练次数等外界因素影响,匹配时间约为1~3s。

width=216.75,height=186

width=219,height=195.75

图12 历史运行断面与实际运行断面的误差

Fig.12 Error between predicted running section and actual running section

5 结论

电网多年运行积累了大量宝贵经验并存储了关键信息,有效挖掘与未来运行状态相似的历史运行断面,可为电网风险预判与优化调控实施提供重要数据信息,对保障系统安全运行具有深远意义。本文提出一种用于未来态预测的电网运行断面时空相似性挖掘方法。该方法采用GraphSAGE和STW算法提取运行断面时空特征;利用余弦相似值和欧式距离,匹配与当前运行断面相似的历史断面,选择相似性总排序第一的历史断面的后续时刻断面作为当前电网的未来运行断面参考。IEEE 39节点系统和实际电网算例证明了所提方法的有效性。与传统方法相比,所提方法的主要优势如下:

1)充分考虑断面各节点运行信息、拓扑状态等在空间上分布关联性、时间上连续性的特点,提取的运行断面特征具有较强的代表性、容错性,提高了后续相似性匹配结果的准确度。

2)在进行匹配时,从宏观和微观角度进行综合相似性计算与排序,使得匹配的历史断面与当前运行断面在状态和趋势上具备较高的一致性,预测的未来运行状态更符合实际情况。

当面对人为误操作、极端天气等偶发事故时,文中方法暂无法实现预测。当电网进行规划增减节点时,短时间内通过将节点状态变化转换为对原有节点的影响进行相似性计算;当积累一段时间的运行信息后,便与其他节点一同进行相似性匹配。

参考文献

[1] 李婷, 胥威汀, 刘向龙, 等. 含高比例可再生能源的交直流混联电网规划技术研究综述[J]. 电力系统保护与控制, 2019, 47(12): 177-187.

Li Ting, Xu Weiting, Liu Xianglong, et al. Review on planning technology of AC/DC hybrid system with high proportion of renewable energy[J]. Power System Protection and Control, 2019, 47(12): 177-187.

[2] 王晨, 寇鹏. 基于卷积神经网络和简单循环单元集成模型的风电场内多风机风速预测[J]. 电工技术学报, 2020, 35(13): 2723-2735.

Wang Chen, Kou Peng. Wind speed forecasts of multiple wind turbines in a wind farm based on integration model built by convdutional neural network and simple recurrent unit[J]. Transactions of China Electrotechnical Society, 2020, 35(13): 2723-2735.

[3] 金红洋, 滕云, 冷欧阳, 等. 基于源荷不确定性状态感知的无废城市多能源协调储能模型[J]. 电工技术学报, 2020, 35(13): 2830-2842.

Jin Hongyang, Teng Yun, Leng Ouyang, et al. Multi-energy coordinated energy storage model in zero-waste cities based on situation awareness of source and load uncertainty[J]. Transactions of China Electrotechnical Society, 2020, 35(13): 2830-2842.

[4] 王涛, 张尚, 顾雪平, 等. 电网运行状态的趋势辨识[J]. 电工技术学报, 2015, 30(24): 171-180.

Wang Tao, Zhang Shang, Gu Xueping, et al. Trends identification of power system operating states[J]. Transactions of China Electrotechnical Society, 2015, 30(24): 171-180.

[5] 梁海平, 田潮, 王铁强, 等. 基于改进K-means算法的电网运行断面相似性匹配研究[J]. 电力自动化设备, 2019, 39(7): 119-124, 140.

Liang Haiping, Tian Chao, Wang Tieqiang, et al. Running section similarity matching based on improved K-means algorithm[J]. Electric Power Automation Equipment, 2019, 39(7): 119-124, 140.

[6] 王铁强, 鲁鹏, 曹欣, 等. 基于堆叠自动编码器的电网运行断面相似性匹配研究[J]. 电力建设, 2021, 42(1): 117-124.

Wang Tieqiang, Lu Peng, Cao Xin, et al. Research on similarity matching of power network operation section applying stacked automatic encoder[J]. Electric Power Construction, 2021, 42(1): 117-124.

[7] 郭烨, 吴文传, 张伯明, 等. 潮流预报在电网安全预警系统中的应用[J]. 电力系统自动化, 2010, 34(5): 107-111.

Guo Ye, Wu Wenchuan, Zhang Boming, et al. Power flow forecasting method and its application in early warning and security countermeasure system[J]. Automation of Electric Power Systems, 2010, 34(5): 107-111.

[8] Ahmed A, McFadden F J S, Rayudu R. Weather-dependent power flow algorithm for accurate power system analysis under variable weather conditions[J]. IEEE Transactions on Power System, 2019, 34(4): 2719-2729.

[9] 黄宇鹏, 李立新, 王磊, 等. 基于神经网络的电网运行趋势估计算法及应用[J]. 智慧电力, 2019, 47(6): 113-120.

Huang Yupeng, Li Lixin, Wang Lei, et al. Power network operation trend estimation algorithm based on neutral network and its application[J]. Smart Grid, 2019, 47(6): 113-120.

[10] 王毅, 侯俊贤, 马世英, 等. 用于调度计划安全稳定校核的潮流数据自动整合调整方法[J]. 电网技术, 2010, 34(4): 100-104.

Wang Yi, Hou Junxian, Ma Shiying, et al. A method of automatic integration and regulation of power flow data for security and stability check of generation scheduling analysis[J]. Power System Technology, 2010, 34(4): 100-104.

[11] 潘超, 李润宇, 蔡国伟, 等. 基于时空关联分解重构的风速超短期预测[J]. 电工技术学报, 2021, 36(22): 4739-4748.

Pan Chao, Li Runyu, Cai Guowei, et al. Multi-step ultra-short-term wind speed prediction based on decomposition and reconstruction of time-spatial correlation[J]. Transactions of China Electrotechnical Society, 2021, 36(22): 4739-4748.

[12] Zhou Mike, Yan Jianfeng, Zhou Xiaoxin. Real-time online analysis of power grid[J]. CSEE Journal of Power and Energy Systems, 2020, 6(1): 236-238.

[13] 涂存超, 杨成, 刘知远, 等. 网络表示学习综述[J].中国科学: 信息科学, 2017, 47(8): 32-48.

Tu Chaocun, Yang Cheng, Liu Zhiyuan, et al. Network representation learning: an overview[J]. Scientia Sinica (Informationis), 2017, 47(8): 32-48.

[14] Wang Jian, Wang Xi, Ma Chaoqun, et al. A survey on the development status and application prospects of knowledge graph in smart grids[J]. IET Generation, Transmission & Distribution, 2020, 15(3): 383-407.

[15] 杨茂, 张罗宾. 基于数据驱动的超短期风电功率预测综述[J]. 电力系统保护与控制, 2019, 47(13): 171-186.

Yang Mao, Zhang Luobin. Review on ultra-short term wind power forecasting based on data-driven approach[J]. Power System Protection and Control, 2019, 47(13): 171-186.

[16] 李兵洋, 肖健梅, 王锡淮. 融合邻域粗糙约简与深度森林的电力系统暂态稳定评估[J]. 电工技术学报, 2020, 35(15): 3245-3257.

Li Bingyang, Xiao Jianmei, Wang Xihuai. Power system transient stability assessment based on hybrid neighborhood rough reduction and deep forest[J]. Transactions of China Electrotechnical Society, 2020, 35(15): 3245-3257.

[17] Zhou Fan, Yang Qing, Zhong Ting, et al. Variational graph neural networks for road traffic prediction in intelligent transportation systems[J]. IEEE Transaction on Industrial Informatics, 2021, 17(4): 2802-2812.

[18] Santoro A, Raposo D, Barrett D G T. et al. A simple neural network module for relational reasoning[C]// 31st Annual Conference on Neural Information Processing Systems, California, 2017: 4968-4977.

[19] 钟智, 管霖, 苏寅生, 等. 基于图注意力深度网络的电力系统暂态稳定评估[J]. 电网技术, 2021, 45(6): 2122-2130.

Zhong Zhi, Guan Lin, Su Yinsheng, et al. Power system transient stability assessment based on graph attention deep network[J]. Power System Technology, 2021, 45(6): 2122-2130.

[20] 李佳玮, 王小君, 和敬涵, 等. 基于图注意力网络的配电网故障定位方法[J]. 电网技术, 2021, 45(6): 2113-2121.

Li Jiawei, Wang Xiaojun, He Jinghan, et al. Distribution network fault location based on graph attention network[J]. Power System Technology, 2021, 45(6): 2113-2121.

[21] Wu Yiming, Bourahla O E F, Li Xi, et al. Adaptive graph representation learning for video person re-identification[J]. IEEE Transaction on Image Processing, 2020, 25(29): 8821-8830.

[22] 孙伟, 朱世睿, 杨建平, 等. 基于图卷积网络的微电网拓扑辨识[J/OL]. 电力系统自动化, 2021: 1-11. http://kns.cnki.net/kcms/detail/32.1180.TP.20211217.1327.002.html.

Sun Wei, Zhu Shirui, Yang Jianping, et al. Topology identification of microgrid based on graph convolution network[J/OL]. Automation of Electric Power Systems, 2021: 1-11. http://kns.cnki.net/kcms/ detail/ 32.1180.TP. 20211217.1327.002.html.

[23] Hamiton W L, Ying R, Leskovec J. Inductive representation learning on large graphs[C]// 31st Annual Conference on Neural Information Processing Systems, California, 2017: 1025-1035.

[24] 陈俊生, 李剑, 陈伟根, 等. 采用滑动窗口及多重加噪比堆栈降噪自编码的风电机组状态异常检测方法[J]. 电工技术学报, 2020, 35(2): 346-358.

Chen Junsheng, Li Jian, Chen Weigen, et al. A method for detecting anomaly conditions of wind turbines using stacked denoising autoencoders with sliding window and multiple noise ratios[J]. Transactions of China Electrotechnical Society, 2020, 35(2): 346-358.

[25] Abdolah S, Babak M, Jagdish Patra C. Sliding-window-based real-time model order reduction for stability prediction in smart grid[J]. IEEE Transactions on Power System, 2019, 34(1): 326-337.

Temporal and Spatial Similarity Mining of Power Grid Running Section for Future State Prediction

Gu Xueping1 Liu Tong1 Li Shaoyan1 Wang Tieqiang2 Yang Xiaodong2

(1. School of Electrical & Electronic Engineering North China Electric Power University Baoding 071003 China 2. State Grid Hebei Electric Power Company Shijiazhuang 050021 China)

Abstract Effective prediction of operation state can provide a data basis for power grid risk prediction and optimal regulation, which is of great significance for ensuring the system safe operation. This paper proposes a method for mining the temporal and spatial similarity of power grid running section for future state prediction. Firstly, the graph representation learning algorithm was used to deeply unsupervised learn the power grid topology and its attribute information, and the attribute vector representing the spatial features of running section was extracted. Further, the spatial feature vectors corresponding to the historical running sections was divided into multiple windows according to different time periods through the sliding time window algorithm. Finally, the similarity of corresponding samples between different windows was calculated from the microscopic and macroscopic perspectives to obtain a group of continuous sections that were most similar to the sections in the current period. The subsequent section of the most similar historical section was used as a reference for the future state of the current power grid. The results validated by IEEE 39-bus system and practical power grid simulation examples show that the proposed method can effectively match the most similar historical sections, then realize the auxiliary prediction of the future operation state.

keywords:Operation state prediction, graph representation learning algorithm, running section spatial feature, period division, similarity matching

DOI:10.19595/j.cnki.1000-6753.tces.211486

中图分类号:TM732

国家电网公司科技项目资助(SGTYHT/17-JS-199)。

收稿日期 2021-09-23

改稿日期 2021-12-27

作者简介

顾雪平 男,1964年生,教授,博士生导师,研究方向为电力系统安全稳定评估与控制、电力系统安全防御与恢复控制、人工智能技术及其在电力系统中的应用等。E-mail:xpgu@ncepu.edu.cn

刘 彤 女,1996年生,博士研究生,研究方向为人工智能技术及其在电力系统中的应用、电力系统安全稳定评估与控制。E-mail:tongliu_1996@163.com(通信作者)

(编辑 赫蕾)