2. 国网重庆市电力公司 南岸供电分公司, 重庆 400060
2. Chongqing Nan'an Branch of State Grid Corporation of China, Chongqing 400060, P. R. China
配电自动化系统可对配电网中的电器元器件进行智能化监测及管控,使配网处于最优运行状态[1]。随着计算机技术的发展和配电自动化设备的研发,配电自动化系统的全面实现几乎不存在技术难题。近几年来,中国加大了配电自动化系统的建设力度,多地区已经初步建设完成了智能配电网试点工程[2-3]。
国内外专家学者对配电自动化系统相关方面的评价进行了研究。文献[4-5]运用层次分析法对智能配电网进行了整体评价;文献[6]运用模糊层次分析法对配电自动化运行进行了评估;文献[7]应用关联分析和博弈论等方法对配电自动化系统网络安全的脆弱性进行了定量评估;文献[8]对馈线自动化效果进行了评价。在电网领域,文献[9]基于主成分聚类分析对智能电网建设进行了综合评价;文献[10]运用人工神经网络对配电网的可靠性进行评估。从评价对象来看,目前针对配电自动化系统评价的相关研究多集中在整体建设效果、通信系统及馈线自动化的评价上,缺乏对配电自动化系统状态操作的综合评价。从评价方法来看,对配电自动化评价的相关研究大多基于传统算法进行,而在电网评价领域,已经开展了结合机器学习算法的评价方法研究。
配电自动化系统状态操作涉及多项指标,各指标呈层次分布。对于多指标多层次,又依赖专家打分的指标体系进行综合评价,需要科学合理地确定原始指标与综合评价结果的关系。传统的层次分析法、模糊综合评价法等只能先对原始指标进行专家打分,再对指标分值基于经验矩阵进行赋权,这些权重不能直接反应原始指标与综合评价结果的关系,且在一定程度上降低了评价结果的客观性。
笔者在建立配电自动化系统状态操作评价分层指标体系的基础上,首先对指标原始数据进行聚类,以训练决策树指标分类器,便于自动分析状态操作情况的不同类别模式。再对指标分值数据应用熵权法进行综合评价,利用该结果和指标原始数据构造综合评价的训练样本,运用多元线性回归算法(MRL, multiple linear regression)学习建立每类模式下配电自动化系统状态操作的评估模型。待评原始指标数据经过决策树分类器分类,再用相应MLR模型评估,便得到综合评价结果。最后以某市的配电自动化系统状态操作指标统计数据为例对评价模型进行验证。结果证明研究方法能够较客观地反映配电自动化状态操作水平,且比传统神经网络模型准确度更高, 可以作为配电自动化系统状态操作的有效评价手段,能够为配电自动化精确化运行提供辅助决策依据。
1 理论基础 1.1 基础算法① 熵权法
熵最先由香农引入信息论,某因素的信息熵Ej越小,则权重越大;Ej越大,则权重越小。基于信息熵的熵权比层次分析、模糊评价等方法更为客观[11]。熵权法的一般步骤如下:
1) 数据标准化;
2) 求各指标信息熵Ej;
3) 确定各因素权重;
4) 加权求和。
② K-means聚类算法
K-means聚类算法是比较经典的聚类算法,有算法效率高、复杂度低等优点[12],K-means聚类算法有唯一参数k,代表把数据集{X1,X2,…,Xn}中的n个数据样本分到k个簇{C1,C2,…,Ck}中。聚类时,计算样本Xi与每个簇的质心uj的距离,并将其划分到距离最近的簇Ci中,
$ {C^i} = \arg \mathop {\min }\limits_j {\left\| {{X^i} - {u_j}} \right\|^2}, $ | (1) |
重新计算质心uj并重复迭代上述步骤,直到簇内距离平方和最小,
$ \arg \min \sum\limits_{i = 1}^k {\sum\limits_{{X^i} \in {C^i}} {{{\left\| {{X^i} - {u_i}} \right\|}^2}} } 。$ | (2) |
③ MLR算法
MLR算法主要用于具有2个及2个以上特征的回归预测问题[13],对于数据集中特征表示为其回归模型
$ Y = {\beta _0} + {\beta _1}{x_1} + {\beta _2}{x_2} + \cdots + {\beta _n}{x_n}, $ | (3) |
其中βi为回归系数,而利用数据集训练模型的目的就是确定该系数。
④ CART决策树
决策树算法主要有ID3、C4.5及CART 3种[14]。其中ID3不能对具有连续属性的值进行处理,C4.5不一定能构建二叉树,而CART算法很好地解决了以上问题,适用于指标数据建立分类器。CATR算法主要分为以下2步:
1) 将样本递归划分进行建树;
2) 用验证数据进行剪枝。
1.2 综合评价方法笔者首先对指标原始数据进行K-means聚类分析,以此结果训练CART决策树指标分类器,便于自动分析状态操作情况的不同类别。再对指标分值数据应用熵权法进行客观赋权,得到综合评价结果,利用该结果和指标原始数据构造综合评价的训练数据样本,运用MLR算法学习建立每类模式下配电自动化系统状态操作的评估模型,根据聚类分析结果进行回归训练可以提高模型的准确度。
2 配电自动化状态操作评价指标通过专家咨询及业务流程分析,选择终端在线率、遥控成功率、遥控使用率、遥信动作正确率、配电自动化主站在线率、配电终端覆盖率[15-16]等6项实用化底层指标作为配电自动化系统状态操作的评价指标。指标分层体系如图 1所示,其中u2=x6。
① 遥控成功率
$ {x_1} = \frac{{{m_1}}}{{{m_2}}} \times 100\% , $ | (4) |
其中:m1为考核期内遥控成功次数;m2为总的遥控次数。
② 遥控使用率
$ {x_2} = \frac{{{y_1}}}{{{y_1} + {y_2}}} \times 100\% , $ | (5) |
其中:y1为考核期内遥控成功次数;y2为本地手动次数。
③ 配电终端在线率
$ {x_3} = \left( {1 - \frac{{{t_1}}}{{n \times {t_2}}}} \right) \times 100\% , $ | (6) |
其中:t1为考核期内总的离线时间;t2为统计区间时间;n为终端个数。
④ 遥信动作正确率
$ {x_4} = \frac{{{k_1}}}{{{k_1} + {k_2}}} \times 100\% , $ | (7) |
其中:k1考核期内遥信动作次数;k2为丢失遥信动作次数。
⑤ 配电主站在线率
$ {x_5} = \frac{{{t_1} - {t_2}}}{{{t_1}}} \times 100\% , $ | (8) |
其中:t1为考核期内日历时间;t2为配电主站停用或基本功能失效时间。
⑥ 配电终端覆盖率
$ {x_6} = \frac{{{s_1}}}{{{s_2}}} \times 100\% , $ | (9) |
其中:s1考核区域内配置终端的中压线路条数;s2区域中压线路总条数。
3 状态操作水平综合评价对配电自动化系统状态操作水平进行综合评价的流程如图 2所示,主要包括模型训练和指标评价2个部分。
聚类分析便于自动分析状态操作情况的不同类别模式,使后续针对不同类别模式进行训练的MLR模型更准确。根据图 1中一级指标大量的原始数据,构造特征向量xf={x1, x2, x3, x4, x5, x6},其中f=1, 2,…,m(m为指标数据总量),采用K-means算法聚类后可得到表 1结果。
表 1中k为聚类数目。
3.1.2 熵权法评价① 运行指标赋权
根据图 1建立运行指标矩阵H,假设该分层体系有m组指标分值数据,指标矩阵H=(xij)m×5如下,i=1, 2,…,m,j=1, 2, 3, 4, 5
$ \mathit{\boldsymbol{H}} = \left[ {\begin{array}{*{20}{c}} {{x_{11}}}&{{x_{12}}}&{{x_{13}}}&{{x_{14}}}&{{x_{15}}}\\ {{x_{21}}}&{{x_{22}}}&{{x_{23}}}&{{x_{24}}}&{{x_{25}}}\\ {}&{}& \cdots &{}&{}\\ {{x_{m1}}}&{{x_{m2}}}&{{x_{m3}}}&{{x_{m4}}}&{{x_{m5}}} \end{array}} \right]。$ |
1) 数据标准化
对各指标数据标准化后的值为
$ {y_{ij}} = \frac{{{x_{ij}} - \min \left( {{x_i}} \right)}}{{\max \left( {{x_i}} \right) - \min \left( {{x_i}} \right)}}\ \ \ \ \ \ \ \ 。$ | (10) |
2) 求信息熵Ej
$ {E_j} = - \left( {\frac{1}{{\ln m}}} \right)\sum\limits_{i = 1}^m {\left( {{p_{ij}}\ln {p_{ij}}} \right)} , $ | (11) |
其中,
3) 确定权重
由E1, E2, …, E5,通过信息熵计算各指标权重
$ {W_j} = \frac{{1 - {E_j}}}{{5 - \sum\limits_{j = 1}^5 {{E_j}} }}。$ | (12) |
4) 计算ui1
$ {u_{i1}} = \sum\limits_{i = 1}^n {{x_{li}}{W_i}} 。$ | (13) |
② 二级指标赋权
根据图 1构建二级指标矩阵H′,H′=(uit)m×2, i=1, 2,…,m,t=1, 2
$ \mathit{\boldsymbol{H'}} = \left[ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {{u_{11}}}&{{u_{12}}} \end{array}}\\ {\begin{array}{*{20}{c}} {{u_{21}}}&{{u_{22}}} \end{array}}\\ \cdots \\ {\begin{array}{*{20}{c}} {{u_{m1}}}&{{u_{m2}}} \end{array}} \end{array}} \right], $ |
计算2个指标的权重W′1、W′2,利用此结果分别加权求和得到m组数据样本的最终综合评价结果yi。
$ {y_i} = {u_{i1}}{{W'}_1} + {u_{i2}}{{W'}_2}。$ | (14) |
① 分类器训练
根据聚类结果构造指标类别样本如表 2所示。
其中:xj为一级指标,j=1, 2, 3, 4, 5, 6,xij为图 1中一级指标原始数据, i=1, 2, …, m,m为样本数量;y为各样本聚类结果的类别,yi为类别值,yi=1, 2, …, k,k∈N+。将类别样本划分为训练集和测试集,运用CART算法训练决策树指标分类器。
② MLR模型训练
根据聚类结果及熵权法评价结构造第n类指标分值样本如表 3所示,n=1,2,…,k。
其中:x′为指标分值数据;y′为状态操作水平综合评价分值,x′∈[0, 100], y′∈(0, 100], d≤m。
将m组样本划分为训练集和测试集,为使模型更准确,每次随机抽取样本占比的10%作为测试集,程序循环500次,每次训练得到一组表达原始数据与综合评价分值映射关系的权重矩阵R和反映模型精确度的均方误差值e,循环完成后求取权重和误差均值。
$ \begin{array}{*{20}{c}} {\mathit{\boldsymbol{R}} = \left[ {{\beta _0}{\beta _1}{\beta _2}{\beta _3}{\beta _4}{\beta _5}{\beta _6}} \right],}\\ {{{\bar \beta }_l} = \frac{1}{{500}}\sum\limits_{c = 1}^{500} {{\beta _{lc}}} ,} \end{array} $ | (15) |
$ \bar e = \frac{1}{{500}}\sum\limits_{c = 1}^{500} {{e_c}} , $ | (16) |
其中,l=0, 1, 2, 3, 4, 5, 6。
最终得到第k类指标的MLR模型为
$ {y_n} = \overline {{\beta _0}} + \overline {{\beta _1}} {x_1} + \overline {{\beta _2}} {x_2} + \overline {{\beta _3}} {x_3} + \overline {{\beta _4}} {x_4} + \overline {{\beta _5}} {x_5} + \overline {{\beta _6}} {u_2}, $ | (17) |
其他类别指标的MLR评价模型训练同理。
3.2 指标评价如图 2所示,待评价指标原始百分比数据不再需要经过专家经验或人为规则打分,只需经过已训练完成的决策树分类器进行分类,应用学习得到的MLR评价模型进行综合评分,可得到更为客观、科学的综合评价结果。
4 实例分析以某市的配电自动化系统状态操作指标统计数据为例,通过对配电自动化系统状态操作水平进行综合评价,用以验证所提出的状态操作指标综合评价模型的实用性。统计数据以周为时间单位,状态操作指标基础值样例如表 4所示。
指标原始数据经PCA降成三维之后的可视化结果如图 3所示。
从图 3可知,样本集分为3类,设置K-means算法中,k=3。由于降维会损失特征贡献值,而聚类特征xf不能接受损失,故以原特征进行聚类分析。
经K-means算法处理后,每种类别数据量占比如表 5所示。
首先,运用熵权法计算表 4中ui1的各因素权重如表 6所示。
计算ui1,公式如下
$ {u_{i1}} = 0.21{x_1} + 0.34{x_2} + 0.25{x_3} + 0.19{x_4} + 0.01{x_5}, $ | (18) |
根据ui1、ui2再次运用熵权法计算得到一级指标的各因素权重如表 7所示。
得到指标综合评价结果
$ {y_{{\rm{score}}}} = 0.37{u_{i1}} + 0.63{u_{i2}}。$ | (19) |
① 分类模型训练
各指标原始数据与聚类结果构成指标的类别样本,如表 8所示。
将该类别样本划分为训练集与测试集,训练分类模型。训练得到的CART决策树模型可视化如图 4所示,测试误差率为2%,满足本例分类精度要求
② MLR模型训练
各指标原始数据及熵权法评价结果形成的分值样本集按聚类结果可划分为3个不同类别的数据样本。每类样本中数据样例如表 9所示。
下面将使用MLR算法分别对已分类数据样本和未分类数据样本进行模型训练对比试验,以说明分类训练能提高模型精度。然后再与人工神经网络模型进行比较,来说明回归模型对于评价对象的适用性和优越性。
1) MLR回归
模型中的训练及测试表现如图 5、6所示。从图 5、6可以看出回归模型拟合程度较高,说明本例适用MLR算法。
取测试集占比为0.1,每次训练时从总样本中随机抽取。已分类与未分类样本数据分别循环500次,求其平均均方误差(MSE,mean squared error),公式如下
$ {\rm{MSE}}{\left( {y,\hat y} \right)_j} = \frac{1}{{{n_{{\rm{samples}}}}}}\sum\limits_{i = 1}^{{n_{{\rm{samples}}}}} {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} , $ | (20) |
$ {\rm{MSE}}\left( {y,\hat y} \right) = \frac{1}{{500}}\sum\limits_{j = 1}^{500} {{\rm{MSE}}{{\left( {y,\hat y} \right)}_j}} , $ | (21) |
MSE结果如表 10所示。
从表 10可以看出,按聚类结果分别训练的模型比不聚类时精确度更高,对于评价模型来说,该测试误差在可接受范围内。
2) 神经网络
BP神经网络是一种按误差逆向传播训练的多层前馈网络,其在综合评价领域得到了广泛运用[17]。研究将运用此法作为MLR的对比算法。神经网络输入层、隐含层和输出层的神经元个数分别设为5、6、1。随机抽取占比设置为0.1的测试集,循环500次后求得BP神经网络模型的平均MSE如表 11所示。
从表 11可以看出神经网络模型比多元回归模型精度更低。由此说明在本例中,MLR模型的评估效果更好,适用性更强。
4.4 指标综合评价如图 1中指标评价模块所示,配电自动化系统状态操作各项指标的原始百分比数据,经过已训练好的决策树分类器进行分类,再应用该类别对应的MRL模型进行综合评估,便可得到综合评价结果。应用提出的综合评价方法得到的配电自动化系统状态操作综合评价结果如表 12所示。
其中,
基于配电自动化系统状态操作的多指标分层体系,提出了一种聚类回归的综合评价方法。通过实验对比分析论证了评价模型的有效性和精确性。方法在一定程度上降低了人为因素干扰,使得评价结果更具客观性和科学性,为配电自动化系统状态操作评价提供了有效途径,评价结果也为可配电自动化系统运行管理提供决策依据。
[1] | Heidari S, Fotuhi-Firuzabad M, Lehtonen M, et al. Planning to equip the power distribution networks with automation system[J]. IEEE Transactions on Power Systems, 2017(99): 1–3. |
[2] |
伦惠勤, 王佳, 胡扬, 等.
智能配电网研究现状及发展展望[J]. 电测与仪表, 2015, 52(8): 10–15.
LUN Huiqin, WANG Jia, HU Yang, et al. Research status and development prospect of smart distribution grid[J]. Electrical Measurement & Instrumentation, 2015, 52(8): 10–15. (in Chinese) |
[3] |
王良.
智能配电网自动化应用实践的几点探讨[J]. 电力系统保护与控制, 2016, 44(20): 12–16.
WANG Liang. Discussion on application practice of distribution automation[J]. Power System Protection and Control, 2016, 44(20): 12–16. (in Chinese) |
[4] |
张欣悦, 荆志朋, 谢晓琳, 等.
面向用户的智能配电网综合评价指标体系及应用[J]. 华北电力大学学报:自然科学版, 2016, 43(2): 106–110.
ZHANG Xinyue, JING Zhipeng, XIE Xiaolin. Comprehensive evaluation system of user-oriented smart distribution grid and application[J]. Journal of North China Electric Power University Natural Science Edition, 2016, 43(2): 106–110. (in Chinese) |
[5] | Iberraken F, Medjoudj R, Aissani D, et al. Decision making on smart grids projects moving using AHP method:the case of algerian network[J]. IFAC Proceedings Volumes, 2013, 46(9): 543–548. DOI:10.3182/20130619-3-RU-3018.00524 |
[6] |
张磐, 凌万水, 郑悦, 等.
基于模糊层次分析法的配电自动化运行评估方法研究[J]. 电测与仪表, 2016, 53(22): 72–77.
ZHANG Pan, LING Wanshui, ZHEN Yue, et al. Research on the evaluation method of distribution automation operation based on fuzzy analytic hierarchy process[J]. Electrical Measurement & Instrumentation, 2016, 53(22): 72–77. (in Chinese) |
[7] | Ye X, Zhao J, Zhang Y, et al. Quantitative vulnerability assessment of cyber security for distribution automation systems[J]. Energies, 2015, 8(6): 5266–5286. DOI:10.3390/en8065266 |
[8] | Chiumarulo M, Djokic S Z, Langella R, et al. On supply reliability and voltage quality in the presence of feeder automation in MV smart grids[C]//International Forum on Research and Technologies for Society and Industry Leveraging A Better Tomorrow. [S. l. ]: IEEE, 2015: 198-204. |
[9] |
高新华, 严正.
基于主成分聚类分析的智能电网建设综合评价[J]. 电网技术, 2013, 37(8): 2238–2243.
GAO Xinhua, YAN Zheng. Comprehensive assessment of smart grid construction based on principal component analysis and cluster analysis[J]. Power System Technology, 2013, 37(8): 2238–2243. (in Chinese) |
[10] | Methods S. Reliability evaluation of distribution power systems based on artificial neural network techniques[M]. USA: Hindawi Publishing Corp, 2012. |
[11] | Song M, Zhu Q, Peng J, et al. Improving the evaluation of cross efficiencies:a method based on shannon entropy weight[J]. Computers & Industrial Engineering, 2017(3): 112–114. |
[12] | Preeti A, Deepali M. Analysis of K-means and K-medoids algorithm for big data[J]. Procedia Computer Science, 2016, 78: 507–512. DOI:10.1016/j.procs.2016.02.095 |
[13] | Raman G S S, Klima M S, Bishop J M, et al. Pressure filtration:bench-scale evaluation and modeling using multivariable regression and artificial neural network[J]. International Journal of Mineral Processing, 2016(3): 158. |
[14] | Pitombo C S, Souza A D D, Lindner A, et al. Comparing decision tree algorithms to estimate intercity trip distribution[J]. Transportation Research Part C Emerging Technologies, 2017, 77: 16–32. DOI:10.1016/j.trc.2017.01.009 |
[15] |
王必恒, 欧阳文, 张怡然, 等.
配电自动化实用化指标分析及诊断决策[J]. 供用电, 2014, 38(5): 54–58.
WANG Biheng, OUYANG Wen, ZHANG Yiran, et al. Practical index analysis and diagnosis decision of distribution automation[J]. Distribution & Utilization, 2014, 38(5): 54–58. (in Chinese) |
[16] |
国家电网技术委员会. 配电自动化建设效果评价指导原则: Q/GDW 11371-2014[S]. 北京: 国家电网公司, 2014: 18-20. Committee of State Grid Corporation of China. Guiding principle of distribution automation construction effect evaluation: Q/GDW 11371-2014[S]. State Grid Corporation of China, 2014: 18-20. |
[17] | Vukovic N, Petrovic M, Miljkovic Z, et al. A comprehensive experimental evaluation of orthogonal polynomial expanded random vector functional link neural networks for regression[J]. Applied Soft Computing, 2017(2): 36–39. |