基于VMD-PE-MulitiBiLSTM的超短期风电功率预测
Ultra-Short-Term Prediction of Wind Power Based on VMD-PE-MulitiBiLSTM
收稿日期: 2023-12-01
| 基金资助: |
|
Received: 2023-12-01
| Fund supported: |
|
作者简介 About authors
陈烨烨(2000),女,硕士研究生,主要研究方向为风电功率预测; 。
李 瑶(1993),女,硕士,工程师,主要从事电网调度研究工作; 。
李捍东(1966),男,硕士,教授,主要从事嵌入式研究工作,470394668@qq.com , E-mail:470394668@qq.com
关键词:
Keywords:
本文引用格式
陈烨烨, 李瑶, 李捍东.
CHEN Yeye, LI Yao, LI Handong.
0 引言
目前,风电功率预测方法有物理方法、统计方法和深度学习方法。物理法主要使用风场地理信息及指定区域的地形和风电机组位置,通过求解区域内流体力学方程,创建一个具体的物理模型进行风电功率的预测;但是需要处理大量天气数据和地理信息,这些信息处理的精度直接影响后续的预测结果。由于风场地形特殊、气象数据量大、更新速度慢,建立的方程往往难以描述风场和功率之间的关系,所以超短期预测的精度往往较低[5]。统计法使用数值天气预报及历史功率,建立起两者的非线性或线性关系,而随着机器学习和人工智能技术的发展,现有的方法也有使用随机森林、支持向量机和极度梯度提升树等;但由于风电功率的波动性和复杂性,采用浅层机器学习算法往往只能处理小规模数据,最后的预测精度也不高[6]。为解决上述问题,深度学习应运而生,深度学习模型可处理非线性的风电序列数据,因此,相较于传统的物理和统计预测模型,深度学习模型被广泛应用[7]。
常用于预测风电功率序列的深度学习模型有长短期记忆(long short-term memory,LSTM)网络[8]、双向长短期记忆(bidirectional LSTM,BiLSTM)网络[9]、卷积神经网络(convolutional neural network, CNN)[10]。LSTM网络具有独特的门控机制,能提取长时间风电序列特征信息,但LSTM只能提取单向序列信息,不能关联过去。文献[11]在LSTM基础上加入CNN提高了单一LSTM的预测性能。文献[12]提出了BiLSTM网络,该方法在时间序列中捕获双向信息,实验表明,其预测精度高于LSTM网络。在其模型中加入了深度级联网络(deep residual cascade network,DRCnet),预测精度有了一定提高[13]。然而,由于风电的波动性较大,仅使用深度学习模型的预测结果并不令人满意。为解决上述问题,许多学者在预测模型基础上增加了数据分解技术,将风电序列划分为不同频率的分量,使用有效模型单独预测每个分量,然后重构预测值以获得最终预测结果[14,15]。文献[16]利用完全自适应噪声集合经验模态分解(complementary ensemble empirical mode decomposition with adaptive noise, CEEMDAN)技术对风速序列进行分解,结合CNN与BiLSTM混合模型进行预测,并使用注意力机制结合网格搜索进行超参数优化,提高了风速预测的精度。但CEEMDAN分解存在模态混叠现象,使用变分模态分解(variational mode decomposition, VMD)技术可有效避免这一现象[17]。文献[18]使用VMD算法将风电序列分解成若干子序列,并使用分位数卷积-循环神经网络进行预测。文献[19]计算VMD分解子序列的排列熵(permutation entropy,PE)值,将PE值相似的序列重构,结合混沌布谷鸟搜素算法优化相关向量机来预测。
基于上述研究,本文提出基于VMD-PE及改进的多层双向长短时记忆(multilayer BiLSTM,MultiBiLSTM)的超短期风电功率预测模型。实验结果表明,本文提出的方法具有较高的精度,具有一定的可行性。
1 数据分解原理
1.1 变分模态分解
VMD[20]利用迭代搜索变分模型最优解来确定每个分解模态的中心频率及带宽,可将风电序列分解成包含不同频率尺度且相对较平稳的序列。分解后的每个模态都有各自的中心频率,可避免模态混叠现象。VMD变分约束模型为
式中:
使用二次项惩罚项和拉格朗日算子转化为无约束问题,求解变分最优如下:
式中:λ(t)为拉格朗日乘法算子;α为二次惩罚因子;〈.,.〉为函数内积算子。
通过交替方向乘子法(alternate direction multiplier method, ADMM)固定
(1)初始化
(2)更新
式中:
(3)满足如下约束条件后更新停止,否则转回步骤(2)继续更新。
式中ε>0。
1.2 排列熵
2 VMD-PE-MulitiBiLSTM预测模型
2.1 BiLSTM网络
LSTM是改进的循环神经网络(recurrent neural network, RNN),解决了传统RNN网络梯度消失、梯度爆炸及长距离依赖信息能力差等问题[8]。其原理主要是通过输入门、遗忘门和输出门3个门来控制其历史信息的记忆。遗忘门用于丢弃无关信息,输入门用于决定单元状态中存储的新信息,输出门用于控制隐层节点的输出。
遗忘门ft、输入门it及输出门Ot的计算公式如下:
式中:y′=[ht-1,xt],xt为当前的输入,ht-1为t-1时刻的隐藏层向量;Wf、Wi、Wo和bf、bi、bo分别为相应门的权重矩阵和偏置项;σ(.)为sigmoid激活函数。
在t时刻,记忆单元Ct的更新公式为
式中:⊙表示Hadamard积;•表示点乘;Wc和bc分别为记忆单元的权重矩阵和偏置项;
隐藏层向量的更新公式为
最终输出yt表示为
式中:Wy和by分别为输出单元的权重矩阵和偏置项。
由于LSTM只能获取风电序列单向信息,无法将信息进行前后关联,因此引入了双向概念来获取2个时间方向的信息,从而形成了结构如图1所示的BiLSTM神经网络。模型含有正序和逆序2个LSTM网络,用于获取t时刻的过去和未来的双向信息。相较于LSTM网络,BiLSTM网络可更有效地提取非线性时间序列的特征,具有较好的鲁棒性。
图1
2.2 特征注意力机制
特征注意力(feature attention, FA)机制为输入序列的特征信息分配注意权重,以区分其对当前时刻预测输出的影响[22]。同时,可自主提取各历史时刻数据之间的特征信息,增强关键时刻的信息表示。具体计算方法为
式中:φl为特征l的能量值;m为提取的特征总数;αl为特征l的注意力权重,表示特征l对于风电序列的重要程度;softmax为归一化指数函数。
2.3 深度级联剩余网络
残差学习主要作用是将网络内的捷径连接起来。多层次残差网络(multi-scale residual network MSRN)和DenseNet是CNN中广泛使用的改进残差学习方法。MSRN使用1D CNN映射可拓展神经网络的训练深度,从而提高模型的准确性;但MSRN层数过多,对于提升模型性能是有限的。DenseNet通过串联连接所有层,而不像MSRN通过加法连接各层,将之前层作为额外的输入;但随着层数的增加,网络的大小也会呈几何级数增加。
深度级联剩余网络使用1D CNN映射,但不连接所有输出,像DenseNet一样,通过串联聚集捷径。因此,DRCnet既能实现MSRN的有效激活,又能保留DenseNet的数据[13]。使用深度级联剩余网络堆叠BiLSTM,具有更好的参数效率。
2.4 改进BiLSTM预测模型
为进一步提升模型预测能力,将FA机制与MulitiBilstm进行连接,使用深度级联网络构建MulitiBilstm,具体模型如图2所示。
图2
模型由FA机制及融合的具有长感受野及短感受野的BiLSTM网络组成,FA机制将加权后的特征输入预测模型。具有长感受野的BiLSTM网络可有效提取风电序列的长期特征,具有短感受野的BiLSTM网络可有效提取风电序列的短期特征,将2种网络进融合,可同时发挥2种网络的优势。网络末端的单个BiLSTM层决定了具有长感受野的BiLSTM层和短感受野BiLSTM层的参与度,这与风电功率短期和长期不确定性对输出的影响有关。因此,融合概念有助于模型更好地分析序列,提高风电预测能力。
在各层BiLSTM网络间使用缩放指数线性单元(scaled exponential linear units, SeLU)激活函数有助于训练深度网络,而不会出现梯度问题。且SeLU激活函数具有自归一化特性。模型对预测值的置信区间进行量化,有助于电力系统更稳定运行,具体分为4步:分类、高斯建模、PI估计和集更新[13]。
2.5 VMD-PE-MulitiBiLSTM预测模型构建
VMD-PE-MulitiBiLSTM模型主要思路是:基于风电功率历史序列非线性及非平稳性特点,使用VMD进行序列分解;考虑到分解后的序列存在模态相似的问题,使用PE对各子序列进行计算,找出相似子序列,并进行序列重组。由于双注意力机制可更好地提取序列特征,深度剩余网络可减少MulitiBiLSTM带来的过拟合问题,基于此构建MulitiBiLSTM预测模型。具体步骤如图3所示,分为4个阶段:
图3
图3
VMD-PE-MulitiBiLSTM预测模型流程图
Fig.3
Flowchart of VMD-PE-MulitiBiLSTM prediction model
(1)对原始风电序列划分训练集和测试集后使用VMD进行序列分解,将风电序列分解成k个稳定的子序列。
(2)计算各子序列PE值,将PE值相似的序列进行合并重组,构成N个重组子序列。
(3)构建MulitiBiLSTM预测模型,使用该预测模型对N个重组子序列进行训练和预测。
(4)将所有重组子序列的预测结果进行叠加,输出最终预测结果。
3 算例及结果分析
3.1 数据介绍及评价指标
实验数据选取贵州地区某风电场的实际发电功率。数据采样间隔时长为15 min,共8 761个数据。模型对数据集进行七三划分,选取前70%的数据作为训练集,剩余30%的数据作为测试集。对数据集进行归一化处理:
式中:x为输入数据;xmax为输入最大值;xmin为输入最小值。将归一化后的数据作为模型的输入,公式见式(
风电功率时间序列如图4所示,可见,秋季的风电功率值明显低于其余3个季节,冬季的风电功率波动较为明显。从总体看,波动序列呈现无规律、非线性的特点,且无周期性特征。
图4
本文使用了平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error, RMSE)指标对模型优劣进行评价。
式中:N为预测样本数; yi为风电功率实际值;
3.2 VMD-PE序列分解与重构
使用VMD对风电功率序列进行分解,模态数过多会导致模态混叠从而产生额外噪声,过少则不能完全表示风电功率的序列特征,因此分解之前需对模态数k进行确定。采用中心频率对k值进行确定,若模态中心频率接近,则视为过分解。将k值从2~15进行实验,最终确定k值为12,惩罚因子设置为1 700,容忍度设置为10-7。
为准确有效地预测风电功率,减小MulitiBiLSTM模型的计算量,采用PE对训练集部分VMD分解的固有模态函数(intrinsic mode function,IMF)进行分析,结果如图5所示。
图5
表1 各模分量合并的结果
Table 1
| 新序列号 | 原序列号 | 新序列号 | 原序列号 |
| 1 | 1,2 | 5 | 7 |
| 2 | 3 | 6 | 8,12 |
| 3 | 4,5 | 7 | 9,10,11 |
| 4 | 6 |
图6
3.3 风电功率预测结果与分析
为验证本文所提模型的有效性,将上述重组子序列通过MulitiBiLSTM模型对重构后的子序列进行逐一预测,最后将预测结果进行叠加。将BiLSTM模型(B)、FA-DRCBiLSTM模型(C)、CEEMDAN-BiLSTM模型(D)、VMD-LSTM模型(E)、VMD-BiLSTM模型(F)、VMD-PE-DRCBiLSTM模型(G)与本文模型(H)分别进行对比实验。MulitiBiLSTM模型中长BiLSTM神经元个数为96,短BiLSTM神经元个数为48,训练模型中优化器采用adam优化器,学习率设置为0.01,批次大小为20,采用1、4和8步时间步长分析误差。多步预测采用的是迭代式,即采用预测值填充进行下步预测,时间步长为4,指用1 h(时间分辨率为15 min)数据预测下个15 min风电功率;8步以此类推。将对比模型与本文模型得到的预测值和真实值(A)绘制折线图,所有模型均进行20次实验后取平均值,实验结果如图7所示。
图7
图7
不同时间步长的对比预测结果
Fig.7
Comparison of prediction results with different time steps
由图7可知:本文模型在峰值处较其余模型有更好的预测结果;随着预测步长的增加,预测效果也在明显变好。
由表2所示各模型对比结果可知:以时间步长为8的预测结果为例,FA-DRCBiLSTM(C)模型相较于BiLSTM(B)模型MAE降低了1.772,RMSE降低了0.265。实验结果表明:在未进行数据分解的情况下,使用双注意力机制可有效提高预测精度。
表2 各模型对比结果
Table 2
| 模型 | 时间步长为1 | 时间步长为4 | 时间步长为8 | |||
| EMAE | ERMSE | EMAE | ERMSE | EMAE | ERMSE | |
| B | 3.383 | 0.194 | 3.694 | 0.219 | 4.783 | 0.385 |
| C | 2.149 | 0.086 | 2.113 | 0.081 | 3.011 | 0.120 |
| D | 3.405 | 0.183 | 2.398 | 0.090 | 3.016 | 0.136 |
| E | 3.284 | 0.174 | 2.693 | 0.113 | 2.280 | 0.078 |
| F | 3.190 | 0.170 | 1.502 | 0.036 | 1.789 | 0.050 |
| G | 1.821 | 0.095 | 0.966 | 0.014 | 1.156 | 0.020 |
| H | 0.831 | 0.007 | 0.896 | 0.008 | 0.920 | 0.009 |
进一步分析,本文模型相较于CEEMDAN-BiLSTM(D)模型、VMD-LSTM(E)模型、VMD-BiLSTM(F)模型、VMD-PE-DRCBiLSTM(G)模型,MAE分别降低了2.096、1.360、0.869和0.236,RMSE分别降低了0.125、0.069、0.041和0.011。实验结果表明:相较于CEEMDAN分解,VMD分解可有效降低预测误差,使用PE计算重组后的序列分解可明显提高预测精度。
4 结论
本文提出了VMD-PE-MulitiBiLSTM预测模型,经实验验证,得出以下结论:
(1)使用VMD分解技术对于非线性、非平稳性的风功率历史序列可有效降噪。针对多子序列,使用PE进行计算重组,可降低预测模型的计算量。
(2)使用MulitiBiLSTM模型对重组子序列进行预测,FA机制可有效提取序列特征,深度剩余网络可减少网络堆叠带来的过拟合问题。
(3)所提方法经实验验证,能一定程度上提高风电功率的预测精度。
参考文献
A local semi-supervised ensemble learning strategy for the data-driven soft sensor of the power prediction in wind power generation
[J].
Approaches to wind power curve modeling: A review and discussion
[J].
计及可用输电能力的风电并网系统中STATCOM的双层优化配置
[J].
Bi-level optimal configuration of STATCOM in wind power grid-connected system considering available transfer capacity
[J].
海上风电场及其关键技术发展现状与趋势
[J].
Development status and prospects of offshore wind farms and it's key technology
[J].
风电功率预测技术研究综述
[J].
A review of researches on wind power forecasting technology
[J].
Exogenous atmospheric variables as wind speed predictors in machine learning
[J].
Short-term wind power forecasting in Portugal by neural networks and wavelet transform
[J].
A long short-term memory-based model for greenhouse climate prediction
[J].
An integrated framework of Bi-directional long-short term memory (BiLSTM) based on sine cosine algorithm for hourly solar radiation forecasting
[J].
Pose-invariant face alignment via CNN-based dense 3D model fitting
[J].
Ultra-short-term multi-step wind power forecasting based on CNN-LSTM
[J].
Framewise phoneme classification with bidirectional LSTM and other neural network architectures
[J].
Deep concatenated residual network with bidirectional LSTM for one-hour-ahead wind power forecasting
[J].
基于EEMD-WOA-LSSVM的超短期风电功率预测
[J].
Ultra-short term wind power forecast based on EEMD-WOA-LSSVM
[J].
A novel framework for ultra-short-term interval wind power prediction based on RF-WOA-VMD and BiGRU optimized by the attention mechanism
[J].
A short-term wind speed prediction method utilizing novel hybrid deep learning algorithms to correct numerical weather forecasting
[J].
基于EVMD和布谷鸟算法的短期风功率区间预测
[J].
Short-term wind power interval prediction based on EVMD and Cuckoo algorithm
[J].
基于变分模态分解和分位数卷积-循环神经网络的短期风功率预测
[J].
Short-term wind power prediction based on variational mode decomposition and quantile convolutional recurrent neural networks
[J].
基于VMD-PE和优化相关向量机的短期风电功率预测
[J].
Short-term wind power prediction based on variational mode factory-permutation entropy and optimized correlation vector machine
[J].
Variational mode decomposition
[J].
Permutation entropy: A natural complexity measure of time series
[J].
Fault diagnosis of rolling bearings using an improved multi-scale convolutional neural network with feature attention mechanism
[J].
/
| 〈 |
|
〉 |
清华大学出版社期刊中心




