基于VMD-PE-MulitiBiLSTM的超短期风电功率预测

doi:10.16513/j.2096-2185.DE.2409201

基于VMD-PE-MulitiBiLSTM的超短期风电功率预测

陈烨烨¹, 李瑶², 李捍东^,¹

1．贵州大学电气工程学院，贵州省　贵阳市　550025

2．国网四川电力公司天府新区供电公司，四川省　成都市　610213

Ultra-Short-Term Prediction of Wind Power Based on VMD-PE-MulitiBiLSTM

CHEN Yeye¹, LI Yao², LI Handong^,¹

1. College of Electrical Engineering, Guizhou University, Guiyang 550025, Guizhou Province, China

2. Tianfu New District Power Supply Company, State Grid Sichuan Electric Power Company, Chengdu 610213, Sichuan Province, China

收稿日期: 2023-12-01

基金资助:

国家自然科学基金项目. 52167007

Received: 2023-12-01

Fund supported:

National Natural Science Foundation of China. 52167007

作者简介 About authors

陈烨烨(2000)，女，硕士研究生，主要研究方向为风电功率预测；。

李　瑶(1993)，女，硕士，工程师，主要从事电网调度研究工作；。

李捍东(1966)，男，硕士，教授，主要从事嵌入式研究工作，470394668@qq.com , E-mail：470394668@qq.com

摘要

为减少超短期风电功率预测的误差，提出基于变分模态分解(variational mode decomposition，VMD)-排列熵(permutation entropy，PE)和多层双向长短时记忆(multilayer bidirectional long short-term memory, MultiBiLSTM)组合的超短期风电功率预测模型。首先，利用VMD分解算法将历史风电功率序列分解成若干个子模态分量，根据计算的PE值重构分解的子模态风电分量；然后，使用特征注意力(feature attention，FA)机制和深度残差级联网络(deep residual cascade network，DRCnet)构建MulitiBiLSTM预测模型，预测重构后的子序列；最后，重构子序列预测值，得到最终风电功率预测结果。使用贵州某风场的数据集对所提出的方法进行验证，并和其他预测模型进行对比。结果表明，使用VMD-PE-MultiBiLSTM模型能显著降低风电功率预测误差。

关键词： 风电功率超短期预测 ; 变分模态分解(VMD) ; 排列熵(PE) ; 多层双向长短时记忆(MultiBiLSTM)

Abstract

In order to reduce the error of ultra-short-term wind power prediction, an ultra-short-term prediction model of wind power based on variational mode decomposition (VMD), permutation entropy (PE) and multilayer bidirectional long short-term memory (MultiBiLSTM) is proposed. Firstly, the historical wind power sequence is decomposed into several sub-modal components using VMD decomposition algorithm, and the sub-modal wind power components are reconstructed according to the calculated PE value. Then, the feature attention (FA) mechanism and deep residual cascade network (DRCnet) are used to construct a MulitiBiLSTM prediction model to predict the reconstructed subsequences. Finally, the predicted value of the sub-sequence is reconstructed to obtain the final prediction result of wind power. The datum set of a wind field in Guizhou province is used to verify the proposed method and compare it with other prediction models. The results show that using VMD-PE-MultiBiLSTM model can significantly reduce the prediction error of wind power.

Keywords： ultra-short-term prediction of wind power ; variational mode decomposition (VMD) ; permutation entropy (PE) ; multilayer bidirectional long short-term memory (MultiBiLSTM)

PDF (6510KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

陈烨烨, 李瑶, 李捍东. 基于VMD-PE-MulitiBiLSTM的超短期风电功率预测. 分布式能源[J], 2024, 9(2): 1-7 doi:10.16513/j.2096-2185.DE.2409201

CHEN Yeye, LI Yao, LI Handong. Ultra-Short-Term Prediction of Wind Power Based on VMD-PE-MulitiBiLSTM. Distributed Energy[J], 2024, 9(2): 1-7 doi:10.16513/j.2096-2185.DE.2409201

0　引言

随着新能源研究的深入推进，风能以其可再生、低碳、清洁等优势，成为世界上具有替代潜力的清洁能源之一^[1]。然而，由于风能的随机性、波动性和间歇性特征，导致风电在大规模并网时引发电力系统的电压和频率波动，对电网造成冲击^[2,3,4]。因此，使用误差小的风电功率预测模型有利于电力系统安全稳定运行。

目前，风电功率预测方法有物理方法、统计方法和深度学习方法。物理法主要使用风场地理信息及指定区域的地形和风电机组位置，通过求解区域内流体力学方程，创建一个具体的物理模型进行风电功率的预测；但是需要处理大量天气数据和地理信息，这些信息处理的精度直接影响后续的预测结果。由于风场地形特殊、气象数据量大、更新速度慢，建立的方程往往难以描述风场和功率之间的关系，所以超短期预测的精度往往较低^[5]。统计法使用数值天气预报及历史功率，建立起两者的非线性或线性关系，而随着机器学习和人工智能技术的发展，现有的方法也有使用随机森林、支持向量机和极度梯度提升树等；但由于风电功率的波动性和复杂性，采用浅层机器学习算法往往只能处理小规模数据，最后的预测精度也不高^[6]。为解决上述问题，深度学习应运而生，深度学习模型可处理非线性的风电序列数据，因此，相较于传统的物理和统计预测模型，深度学习模型被广泛应用^[7]。

常用于预测风电功率序列的深度学习模型有长短期记忆(long short-term memory，LSTM)网络^[8]、双向长短期记忆(bidirectional LSTM，BiLSTM)网络^[9]、卷积神经网络(convolutional neural network, CNN)^[10]。LSTM网络具有独特的门控机制，能提取长时间风电序列特征信息，但LSTM只能提取单向序列信息，不能关联过去。文献[11]在LSTM基础上加入CNN提高了单一LSTM的预测性能。文献[12]提出了BiLSTM网络，该方法在时间序列中捕获双向信息，实验表明，其预测精度高于LSTM网络。在其模型中加入了深度级联网络(deep residual cascade network，DRCnet)，预测精度有了一定提高^[13]。然而，由于风电的波动性较大，仅使用深度学习模型的预测结果并不令人满意。为解决上述问题，许多学者在预测模型基础上增加了数据分解技术，将风电序列划分为不同频率的分量，使用有效模型单独预测每个分量，然后重构预测值以获得最终预测结果^[14,15]。文献[16]利用完全自适应噪声集合经验模态分解(complementary ensemble empirical mode decomposition with adaptive noise, CEEMDAN)技术对风速序列进行分解，结合CNN与BiLSTM混合模型进行预测，并使用注意力机制结合网格搜索进行超参数优化，提高了风速预测的精度。但CEEMDAN分解存在模态混叠现象，使用变分模态分解(variational mode decomposition, VMD)技术可有效避免这一现象^[17]。文献[18]使用VMD算法将风电序列分解成若干子序列，并使用分位数卷积-循环神经网络进行预测。文献[19]计算VMD分解子序列的排列熵(permutation entropy，PE)值，将PE值相似的序列重构，结合混沌布谷鸟搜素算法优化相关向量机来预测。

基于上述研究，本文提出基于VMD-PE及改进的多层双向长短时记忆(multilayer BiLSTM，MultiBiLSTM)的超短期风电功率预测模型。实验结果表明，本文提出的方法具有较高的精度，具有一定的可行性。

1　数据分解原理

1.1　变分模态分解

VMD^[20]利用迭代搜索变分模型最优解来确定每个分解模态的中心频率及带宽，可将风电序列分解成包含不同频率尺度且相对较平稳的序列。分解后的每个模态都有各自的中心频率，可避免模态混叠现象。VMD变分约束模型为

(1) ${\begin{array}{l} min_{{u_{k} (t)}, {ω_{k}}} {{\sum_{k} ‖ \partial_{t} ((δ (t) + \frac{j}{π t}) * u_{k} (t)) e^{- j ω_{k} t} ‖}_{2}^{2}} \\ s . t . \sum_{k} u_{k} (t) = f (t) \end{array}$

式中： ${‖ \cdot ‖}_{2}^{2}$ 为欧里几德范数的平方运算；∂_t(·)为该函数在时间t上的偏导数；u_k(t)为分解后的第k个模态；ω_k为第k个模态的中心频率；(δ(t)＋ $\frac{j}{π t}$ )*u_k(t)为分解后t时刻第k个模态u_k的希尔伯特变换；δ(t)为t时刻的偏导算子。

使用二次项惩罚项和拉格朗日算子转化为无约束问题，求解变分最优如下：

(2) $\begin{array}{l} L ({u_{k} (t)}, {ω_{k}}, λ (t)) = \\ α {\sum_{k} ‖ \partial_{t} ((δ (t) + \frac{j}{π t}) * u_{k} (t)) e^{- j ω_{k} t} ‖}_{2}^{2} + \\ {‖ f (t) - \sum_{k} u_{k} (t) ‖}_{2}^{2} + 〈 λ (t), f (t) - \sum_{k} u_{k} (t) 〉 \end{array}$

式中：λ(t)为拉格朗日乘法算子；α为二次惩罚因子；〈．，．〉为函数内积算子。

通过交替方向乘子法(alternate direction multiplier method, ADMM)固定 $u_{k}^{(n + 1)}$ (t)、 $ω_{k}^{(n + 1)}$ 、λ^(n＋1)(t)(n为迭代次数)中的2个变量，更新其中1个变量，求解式(2)的鞍点。具体步骤为：

(1)初始化 $u_{k}^{(n)}$ (t)、 $ω_{k}^{(n)}$ 、λ⁽ⁿ⁾(t)，迭代次数n设置为0。

(2)更新 $u_{k}^{(n)}$ (t)、 $ω_{k}^{(n)}$ 、λ⁽ⁿ⁾(t)，对所有角频率ω≥0(表示解析信号的单边谱只包含非负频率)，更新公式为

(3) $\begin{array}{l} {\hat{u}}_{k}^{(n + 1)} (ω) \leftarrow \\ \frac{\hat{f} (ω) - \sum_{i > k} {\hat{u}}_{i}^{(n + 1)} (ω) - \sum_{i < k} {\hat{u}}_{i}^{(n)} (ω) + \frac{\hat{λ} (ω)}{2}}{1 + 2 α {(ω - ω_{k}^{(n)})}^{2}} \end{array}$

(4) $ω_{k}^{(n + 1)} \leftarrow \frac{\int_{0}^{\infty} ω | {\hat{u}}_{k} (ω) |^{2} d ω}{\int_{0}^{\infty} | {\hat{u}}_{k} (ω) |^{2} d ω}$

(5) ${\hat{λ}}^{(n + 1)} (ω) \leftarrow {\hat{λ}}^{(n)} (ω) + γ (\hat{f} (ω) - \sum_{k} {\hat{u}}_{k}^{(n + 1)} (ω))$

式中： $\hat{f}$ (ω)、 ${\hat{u}}_{i}^{(n + 1)}$ (ω)、 $\hat{λ}$ (ω)、 ${\hat{u}}_{k}^{(n + 1)}$ (ω)分别为f(t)、 $u_{i}^{(n + 1)}$ (t)、λ(t)、 $u_{k}^{(n + 1)}$ (t)的傅里叶变换；γ为噪声容限。

(3)满足如下约束条件后更新停止，否则转回步骤(2)继续更新。

(6) $\sum_{k} ‖ {\hat{u}}_{k}^{(n + 1)} (ω) - {\hat{u}}_{i}^{(n)} (ω) ‖_{2}^{2} / ‖ {\hat{u}}_{i}^{(n)} (ω) ‖_{2}^{2} < ε$

式中ε>0。

1.2　排列熵

分析非线性序列时，可根据各子序列的信息熵确定序列的复杂度。由于PE^[21]可计算存在噪声的时间序列熵值，且速度快、鲁棒性好，因此适合计算数据量大的非线性序列。详细计算步骤见文献[21]。

2　VMD-PE-MulitiBiLSTM预测模型

2.1　BiLSTM网络

LSTM是改进的循环神经网络(recurrent neural network, RNN)，解决了传统RNN网络梯度消失、梯度爆炸及长距离依赖信息能力差等问题^[8]。其原理主要是通过输入门、遗忘门和输出门3个门来控制其历史信息的记忆。遗忘门用于丢弃无关信息，输入门用于决定单元状态中存储的新信息，输出门用于控制隐层节点的输出。

遗忘门f_t、输入门i_t及输出门O_t的计算公式如下：

(7) $f_{t} = σ (W_{f} y^{'} + b_{f})$

(8) $i_{t} = σ (W_{i} y^{'} + b_{i})$

(9) $O_{t} = σ (W_{o} y^{'} + b_{o})$

式中：y′＝[h_t－1，x_t]，x_t为当前的输入，h_t－1为t－1时刻的隐藏层向量；W_f、W_i、W_o和b_f、b_i、b_o分别为相应门的权重矩阵和偏置项；σ(．)为sigmoid激活函数。

在t时刻，记忆单元C_t的更新公式为

(10) ${\tilde{C}}_{t} = σ (W_{c} \cdot y^{'} + b_{c})$

(11) $C_{t} = f_{t} ☉ C_{t - 1} + i_{t} ☉ {\tilde{C}}_{t}$

式中：⊙表示Hadamard积；•表示点乘；W_c和b_c分别为记忆单元的权重矩阵和偏置项； ${\tilde{C}}_{t}$ 表示候选记忆状态。

隐藏层向量的更新公式为

(12) $h_{t} = O_{t} ☉ σ (C_{t})$

最终输出y_t表示为

(13) $y_{t} = σ (W_{y} y^{'} + b_{y}) = σ (W_{y} [h_{t - 1}, x_{t}] + b_{y})$

式中：W_y和b_y分别为输出单元的权重矩阵和偏置项。

由于LSTM只能获取风电序列单向信息，无法将信息进行前后关联，因此引入了双向概念来获取2个时间方向的信息，从而形成了结构如图1所示的BiLSTM神经网络。模型含有正序和逆序2个LSTM网络，用于获取t时刻的过去和未来的双向信息。相较于LSTM网络，BiLSTM网络可更有效地提取非线性时间序列的特征，具有较好的鲁棒性。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 BiLSTM网络框架

Fig.1 BiLSTM network framework

2.2　特征注意力机制

特征注意力(feature attention, FA)机制为输入序列的特征信息分配注意权重，以区分其对当前时刻预测输出的影响^[22]。同时，可自主提取各历史时刻数据之间的特征信息，增强关键时刻的信息表示。具体计算方法为

(14) $α_{l} = softmax (φ_{l}) = \frac{e^{φ_{l}}}{\sum_{j = 1}^{m} e^{φ_{j}}}$

式中：φ_l为特征l的能量值；m为提取的特征总数；α_l为特征l的注意力权重，表示特征l对于风电序列的重要程度；softmax为归一化指数函数。

2.3　深度级联剩余网络

残差学习主要作用是将网络内的捷径连接起来。多层次残差网络(multi-scale residual network MSRN)和DenseNet是CNN中广泛使用的改进残差学习方法。MSRN使用1D CNN映射可拓展神经网络的训练深度，从而提高模型的准确性；但MSRN层数过多，对于提升模型性能是有限的。DenseNet通过串联连接所有层，而不像MSRN通过加法连接各层，将之前层作为额外的输入；但随着层数的增加，网络的大小也会呈几何级数增加。

深度级联剩余网络使用1D CNN映射，但不连接所有输出，像DenseNet一样，通过串联聚集捷径。因此，DRCnet既能实现MSRN的有效激活，又能保留DenseNet的数据^[13]。使用深度级联剩余网络堆叠BiLSTM，具有更好的参数效率。

2.4　改进BiLSTM预测模型

为进一步提升模型预测能力，将FA机制与MulitiBilstm进行连接，使用深度级联网络构建MulitiBilstm，具体模型如图2所示。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 MulitiBiLSTM模型框架

Fig.2 MulitiBiLSTM model framework

模型由FA机制及融合的具有长感受野及短感受野的BiLSTM网络组成，FA机制将加权后的特征输入预测模型。具有长感受野的BiLSTM网络可有效提取风电序列的长期特征，具有短感受野的BiLSTM网络可有效提取风电序列的短期特征，将2种网络进融合，可同时发挥2种网络的优势。网络末端的单个BiLSTM层决定了具有长感受野的BiLSTM层和短感受野BiLSTM层的参与度，这与风电功率短期和长期不确定性对输出的影响有关。因此，融合概念有助于模型更好地分析序列，提高风电预测能力。

在各层BiLSTM网络间使用缩放指数线性单元(scaled exponential linear units, SeLU)激活函数有助于训练深度网络，而不会出现梯度问题。且SeLU激活函数具有自归一化特性。模型对预测值的置信区间进行量化，有助于电力系统更稳定运行，具体分为4步：分类、高斯建模、PI估计和集更新^[13]。

2.5　VMD-PE-MulitiBiLSTM预测模型构建

VMD-PE-MulitiBiLSTM模型主要思路是：基于风电功率历史序列非线性及非平稳性特点，使用VMD进行序列分解；考虑到分解后的序列存在模态相似的问题，使用PE对各子序列进行计算，找出相似子序列，并进行序列重组。由于双注意力机制可更好地提取序列特征，深度剩余网络可减少MulitiBiLSTM带来的过拟合问题，基于此构建MulitiBiLSTM预测模型。具体步骤如图3所示，分为4个阶段：

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 VMD-PE-MulitiBiLSTM预测模型流程图

Fig.3 Flowchart of VMD-PE-MulitiBiLSTM prediction model

(1)对原始风电序列划分训练集和测试集后使用VMD进行序列分解，将风电序列分解成k个稳定的子序列。

(2)计算各子序列PE值，将PE值相似的序列进行合并重组，构成N个重组子序列。

(3)构建MulitiBiLSTM预测模型，使用该预测模型对N个重组子序列进行训练和预测。

(4)将所有重组子序列的预测结果进行叠加，输出最终预测结果。

3　算例及结果分析

3.1　数据介绍及评价指标

实验数据选取贵州地区某风电场的实际发电功率。数据采样间隔时长为15 min，共8 761个数据。模型对数据集进行七三划分，选取前70%的数据作为训练集，剩余30%的数据作为测试集。对数据集进行归一化处理：

(15) $x = \frac{x - x_{min}}{x_{max} - x_{min}}$

式中：x为输入数据；x_max为输入最大值；x_min为输入最小值。将归一化后的数据作为模型的输入，公式见式(14)。

风电功率时间序列如图4所示，可见，秋季的风电功率值明显低于其余3个季节，冬季的风电功率波动较为明显。从总体看，波动序列呈现无规律、非线性的特点，且无周期性特征。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 风电功率序列

Fig.4 Wind power sequence

本文使用了平均绝对误差(mean absolute error，MAE)和均方根误差(root mean squared error, RMSE)指标对模型优劣进行评价。

(16) $E_{MAE} = \frac{1}{P_{e} N} \sum_{i = 1}^{N} | y_{1} - {\hat{y}}_{i} |$

(17) $E_{RMSE} = \frac{1}{P_{e}} \sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(y_{1} - {\hat{y}}_{i})}^{2}}$

式中：N为预测样本数； y_i为风电功率实际值； ${\hat{y}}_{i}$ 为风电功率预测值；P_e为风机开机容量。

3.2　VMD-PE序列分解与重构

使用VMD对风电功率序列进行分解，模态数过多会导致模态混叠从而产生额外噪声，过少则不能完全表示风电功率的序列特征，因此分解之前需对模态数k进行确定。采用中心频率对k值进行确定，若模态中心频率接近，则视为过分解。将k值从2～15进行实验，最终确定k值为12，惩罚因子设置为1 700，容忍度设置为10^－7。

为准确有效地预测风电功率，减小MulitiBiLSTM模型的计算量，采用PE对训练集部分VMD分解的固有模态函数(intrinsic mode function，IMF)进行分析，结果如图5所示。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 各IMF分量的PE值

Fig.5 PEs of IMF components

由图5可知：模态1和模态2的PE值呈现一定程度的相似性，差值为0.007 5，可将2个模态合并成1个模态进行预测；模态3的值明显区别于其他模态，可独立为一个新的子序列进行预测。同理分析其余模态的PE结果，各模态合并结果如表1所示，重组子序列如图6所示。

表1 各模分量合并的结果

Table 1 Combined results of each module component

新序列号	原序列号	新序列号	原序列号
1	1，2	5	7
2	3	6	8，12
3	4，5	7	9，10，11
4	6

新窗口打开| 下载CSV

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 VMD-PE重组子序列结果

Fig.6 Result of VMD-PE recombination subsequence

3.3　风电功率预测结果与分析

为验证本文所提模型的有效性，将上述重组子序列通过MulitiBiLSTM模型对重构后的子序列进行逐一预测，最后将预测结果进行叠加。将BiLSTM模型(B)、FA-DRCBiLSTM模型(C)、CEEMDAN-BiLSTM模型(D)、VMD-LSTM模型(E)、VMD-BiLSTM模型(F)、VMD-PE-DRCBiLSTM模型(G)与本文模型(H)分别进行对比实验。MulitiBiLSTM模型中长BiLSTM神经元个数为96，短BiLSTM神经元个数为48，训练模型中优化器采用adam优化器，学习率设置为0.01，批次大小为20，采用1、4和8步时间步长分析误差。多步预测采用的是迭代式，即采用预测值填充进行下步预测，时间步长为4，指用1 h(时间分辨率为15 min)数据预测下个15 min风电功率；8步以此类推。将对比模型与本文模型得到的预测值和真实值(A)绘制折线图，所有模型均进行20次实验后取平均值，实验结果如图7所示。

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 不同时间步长的对比预测结果

Fig.7 Comparison of prediction results with different time steps

由图7可知：本文模型在峰值处较其余模型有更好的预测结果；随着预测步长的增加，预测效果也在明显变好。

由表2所示各模型对比结果可知：以时间步长为8的预测结果为例，FA-DRCBiLSTM(C)模型相较于BiLSTM(B)模型MAE降低了1.772，RMSE降低了0.265。实验结果表明：在未进行数据分解的情况下，使用双注意力机制可有效提高预测精度。

表2 各模型对比结果

Table 2 Comparison results of various models

模型	时间步长为1		时间步长为4		时间步长为8
模型	E_MAE	E_RMSE	E_MAE	E_RMSE	E_MAE	E_RMSE
B	3.383	0.194	3.694	0.219	4.783	0.385
C	2.149	0.086	2.113	0.081	3.011	0.120
D	3.405	0.183	2.398	0.090	3.016	0.136
E	3.284	0.174	2.693	0.113	2.280	0.078
F	3.190	0.170	1.502	0.036	1.789	0.050
G	1.821	0.095	0.966	0.014	1.156	0.020
H	0.831	0.007	0.896	0.008	0.920	0.009

新窗口打开| 下载CSV

进一步分析，本文模型相较于CEEMDAN-BiLSTM(D)模型、VMD-LSTM(E)模型、VMD-BiLSTM(F)模型、VMD-PE-DRCBiLSTM(G)模型，MAE分别降低了2.096、1.360、0.869和0.236，RMSE分别降低了0.125、0.069、0.041和0.011。实验结果表明：相较于CEEMDAN分解，VMD分解可有效降低预测误差，使用PE计算重组后的序列分解可明显提高预测精度。

4　结论

本文提出了VMD-PE-MulitiBiLSTM预测模型，经实验验证，得出以下结论：

(1)使用VMD分解技术对于非线性、非平稳性的风功率历史序列可有效降噪。针对多子序列，使用PE进行计算重组，可降低预测模型的计算量。

(2)使用MulitiBiLSTM模型对重组子序列进行预测，FA机制可有效提取序列特征，深度剩余网络可减少网络堆叠带来的过拟合问题。

(3)所提方法经实验验证，能一定程度上提高风电功率的预测精度。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

ZHANG

, LI

, et al.

A local semi-supervised ensemble learning strategy for the data-driven soft sensor of the power prediction in wind power generation

[J]. Fuel, 2023, 333: 126435.