考虑不同天气类型样本的光伏功率日内预测模型
Intraday Prediction Model for PV Power Considering Samples of Different Weather Types
收稿日期: 2023-12-31
| 基金资助: |
|
Received: 2023-12-31
| Fund supported: |
|
作者简介 About authors
付雪姣(1993),女,硕士,助理工程师,研究方向为新能源发电运行技术; 。
吕可欣(2001),女,硕士研究生,研究方向为电力系统自动化、新能源发电技术; 。
吴林林(1986),男,硕士,高级工程师,研究方向为新能源并网技术; 。
刘 辉(1975),男,博士,教授级高级工程师,研究方向为新能源并网技术; 。
张扬帆(1987),男,硕士,工程师,研究方向为新能源发电运行技术; 。
李奕霖(1999),女,硕士研究生,研究方向为电力系统自动化、新能源发电技术; 。
叶 林(1968),男,博士,教授,博士生导师,德国洪堡学者,研究方向为电力系统自动化、新能源发电并网运行与控制,yelin@cau.edu.cn , E-mail:yelin@cau.edu.cn
关键词:
Keywords:
本文引用格式
付雪姣, 吕可欣, 吴林林, 刘辉, 张扬帆, 李奕霖, 叶林.
FU Xuejiao, LYU Kexin, WU Linlin, LIU Hui, ZHANG Yangfan, LI Yilin, YE Lin.
0 引言
在对光伏功率进行预测时,通常使用的方法有统计法、物理法和组合法[9]。物理预测方法着手于研究光伏组件发电的物理过程以及研究太阳辐照强度的传递过程,结合光伏组件安装时的特征和参数以及光伏场站的位置信息构造预测模型,不需要大量的历史数据,但模型的普适性较差,不具备较好的抗干扰能力。统计预测法则是通过统计模型对大量历史数据进行学习,建立历史数据和光伏功率之间的对应关系,从而对光伏电站的输出功率进行预测。统计法是否准确则对数值天气预报(numerical weather prediction,NWP)数据有着较高的要求。常用的统计预测法有些也是基于气象特征对光伏功率进行预测。光伏功率的输出主要与光伏板与阳光接触的有效面积相关,衡量光伏板与阳光接触的有效面积主要可从以下2个方面入手:第1个方面是考虑光伏板被遮挡的程度。文献[10]研究了太阳光的遮挡、折射和散射与云层的关系,根据光伏板输出功率的差异,通过寻优太阳光辐照强度来调整光伏板的角度。文献[11]则通过卫星云观测数据研究云遮挡情况下光伏发电功率该如何进行预测,建立模拟太阳、云和光伏电站位置关系的云遮挡模型,进一步对光伏板被不同高度云团的遮掩程度展开评估。此外,光伏板长期可能会有灰尘积累,也会在一定程度上对光伏功率造成影响。文献[12]通过卷积神经学习构建积灰状态图像识别系统,分析积灰状态图像和发电效率损失率之间的关系。第2个方面则是聚焦于不同的天气场景,观察不同天气场景下光伏电站输出功率的特点。有些研究考虑了相似日和相似样本的划分,文献[13]基于时间场景的差异利用相似度组合指标筛选出相似时段,由此得到若干相似日的组合。
根据以上分析,本文提出一种针对不同天气类型利用人工少数类过采样法(synthetic minority over-sampling technique,SMOTE)和机器学习算法的光伏功率预测模型。冀北某光伏场站的应用结果表明,该模型预测精度有较大提升,验证了本文方法的有效性。
1 研究思路
本文的研究思路如图1所示。首先,基于NWP数据、实测功率数据,建立原始数据集;然后,运用皮尔逊相关系数法选出对光伏功率影响最大的NWP气象因子,再运用影响程度显著的气象因子计算日照时数;将天气划分为正常天气与极端天气,运用SMOTE扩充数据集;最后,利用不同预测模型针对各天气类型完成光伏功率预测。
图1
2 天气类型的分类
2.1 气象因素与光伏功率相关性的分析
在进行天气类型的分类之前,考虑到气象因素众多,会加大分析的难度。因此,应用皮尔逊相关系数[16]衡量气象与功率之间的相关性,根据相关程度对重要性显著的气象进行着重分析。皮尔逊相关系数的计算公式为
式中:Γj和Pj分别为第j对气象因子的大小和光伏功率的大小;
NWP数据包括水平面总辐照度H、散射辐照度Es、直射辐照度Et、温度M、相对湿度R、风速v和实测功率Ps。相关性表格如表1所示,可见:水平面总辐照度和直射辐照度与实测功率之间的相关性最大。因此,将水平面总辐照度和直射辐照度作为对天气类型进行分类的决定性因素。
表1 相关性表格
Table 1
| NWP数据 | 皮尔逊相关系数 | ||||||
| H | Es | Et | M | R | v | Ps | |
| H | 1.00 | 0.79 | 0.97 | 0.30 | -0.40 | 0.23 | 0.91 |
| Es | 0.79 | 1.00 | 0.61 | 0.41 | -0.24 | 0.09 | 0.67 |
| Et | 0.97 | 0.61 | 1.00 | 0.21 | -0.42 | 0.26 | 0.90 |
| M | 0.30 | 0.41 | 0.21 | 1.00 | 0.04 | -0.42 | 0.26 |
| R | -0.40 | -0.24 | -0.42 | 0.04 | 1.00 | 0.02 | -0.42 |
| v | 0.23 | 0.09 | 0.26 | -0.42 | 0.02 | 1.00 | 0.17 |
| Ps | 0.91 | 0.67 | 0.90 | 0.26 | -0.42 | 0.17 | 1.00 |
2.2 基于日照时数对天气类型进行划分
在一天内太阳光直接照射地面的时间为日照时数,也称“实照时数”。根据中央气象局的规定,日照时数定义为在一给定时段内太阳直接辐照度达到或超过120 W/m2的那段时间的总和,以小时为单位,取1位小数。
结合之前应用皮尔逊系数法对气象和功率之间关系的分析,将水平面总辐照度也运用到对日照时数的计算中。本文规定,只有当水平面总辐照度和直射辐照度均超过120 W/m2时才能计入日照时数的计算中。对每日的日照时数加以分析,通过确定日照时数的阈值,来划定不同天气类型[17]。将以上分析概括为
式中:T为日照时数;t为能计入日照时数的时长;a1、a2、b1、c1为不同天气类型下日照时数的阈值。
本文通过多个光伏场站的NWP数据及实测光伏功率的统计,得出不同天气类型日照时数的阈值:a1=7 h,a2=8 h,b1=2 h,c1=0。
图2展示了一个光伏场站每日的日照时数和最大辐照度。由柱状图可见:晴天天数最多,多云或阴天天数较少,覆雪天数最少,且覆雪时日照时数均为0;日照时数的大小与最大辐照度的走势相似。
图2
图2
不同天气条件下的日照时数与最大辐照度
Fig.2
Sunshine durations and maximum irradiance in different weather conditions
3 SMOTE算法对样本进行扩充
机器学习具有良好的认知与识别功能。虽然机器学习具有十分强大的能力,但极易受到复杂的数据表征、不平衡数据和提取嵌入的关系、数据的不断漂移性、从数目庞大的数据量中学习等数据分布不平衡的影响[18]。所以,为改善机器学习的应用效果,对样本进行扩充是必要的,SMOTE就是一种有效的样本扩充方式。
SMOTE作为一种过采样技术,主要用于重建不平衡的数据集。SMOTE算法的主要原理是对某类少量样本进行随机挑选,在该类少量样本周围进行插值,从而实现少量样本的过采样。
SMOTE的基本原理为
式中:Xnew为新生成的样本;Xm为少数类样本实例,即多云或阴天、覆雪天气下辐照度、温度、风速、相对湿度和实测功率等信息;Xn为距离Xm最近的k近邻样本实例;θ∈[0, 1],为一个随机数。
图3
4 基于机器学习的光伏预测
4.1 梯度提升决策树
梯度提升决策树(gradient boosting decision tree,GBDT)可被良好地运用在分类和预测场景[19],但是GBDT的训练速度有限。轻量级梯度提升机(light gradient boosting machine,LightGBM)算法是一个实现GBDT算法的框架,训练速度更快、内存消耗更低、准确率更高。LightGBM采用基于直方图算法的决策树算法,直方图算法首先将连续的特征值离散化,同时构造直方图。直方图中的累积统计量是离散化后的值,当直方图的统计量足够后,根据直方图的离散值寻找最优的分割点。
图4
基于LightGBM的光伏功率预测模型可表示为
式中:
光伏功率分布数据有时被视作正态分布,LightGBM基于将连续的特征值离散化的直方图算法,与光伏功率数据的分布特点相适应,且LightGBM较快的训练速度也与晴天天气类型下较大的数据量相适应。
4.2 随机森林算法
随机森林(random forest, RF)是一种以决策树为基础的集成学习算法。RF算法首先采用引导聚集算法在由水平面总辐照度、散射辐照度、直射辐照度、相对湿度、温度、风速和实测光伏功率构成的原始训练集中进行样本的抽取,在选取出来的m个样本中从上述特征中再次随机选择n个特征确定决策树的分支节点,n=1,2,…,m。在确定好节点和分支后建立m个决策树,得到m个预测结果,最终预测结果为这m个预测结果的平均值。用于多云或阴天天气下光伏功率预测的RF模型可表示为
式中:
以RF为代表的集成学习算法具有准确率高、实现简单的优点,并且对异常离群点不敏感,而多云或阴天天气状态下的NWP数据可能会出现单个异常值,RF不敏感的优势可很好地适应异常值出现的情况。
4.3 多层感知机
图5
由图5可见:MLP的第1层是输入层,第3层是输出层,输入层和输出层之间是中间层,每层实现了全连接。MLP作为有监督学习模型,模型以特定长度的历史数据为基础对提供的输入和输出进行训练与学习,构建出最优模型。
MLP的输出可表示如下:
式中:οq为输出层第q个神经元节点的输入;h为隐藏层神经元节点数;wjq为隐藏层第j个神经元节点到输出层第q个神经元节点之间的权值;Ωj为第j个隐藏层神经元节点的输出;βq为输出层第q个神经元节点的阈值;
MLP神经网络的学习训练过程,就是不断改进更新权重和阈值的过程。在这个过程中,MLP逐渐靠近目标值,最后得到理想的输出[22]。MLP可处理比较复杂的数据,并且具有很强的泛化能力,覆雪天气下光伏功率数据少、数值小,因此适合用MLP进行光伏功率的预测。
5 案例分析与对比
本文选用某省装机30 MW的光伏场站进行案例分析,数据集包括NWP数据和功率实测数据。NWP气象数据包括水平面总辐照度、散射辐照度、直射辐照度、温度、风速和相对湿度。为对本文方法进行验证,选择LightGBM、RF、MLP、递归神经网络(recursive neural network,RNN)、极致梯度提升树(extreme gradient boosting,XGBoost)这5种机器学习算法进行光伏功率的预测,评估指标采用平均绝对误差(mean absolute error,MAE)与均方根误差(root mean squared error,RMSE),MAE和RMSE的具体公式为
式中:Pi,pre为i时刻光伏功率Pi的预测值;Cap为光伏电厂的装机容量;N为数据个数。
分析该光伏电站2023年1月12日00:00—2023年2月22日00:00的NWP数据与功率实测数据。图6为该光伏场站每日最大光伏出力,可见:在此段时间内,有几日实测光伏功率没有达到平均水平。结合实际气候情况,1—2月为冬季,发生降雪等极端天气事件的概率较大,因此光伏出力在覆雪等极端天气发生时出现大幅度削减。晴天、多云或阴天、覆雪天气发生的概率不同,晴天出现的概率最大,多云或阴天出现的概率较小,覆雪天气出现的概率最小,进一步导致晴天天气、多云或阴天、覆雪天气下的样本数量不一致。在进行预测时将各种天气的样本进行平衡是有必要的。
图6
图7
图8
图9
图10
图8为晴天天气类型下的功率预测结果,可见:晴天时光伏功率实际值最大达到了25 MW;不同预测模型的最大值也都分布在20 MW左右,其中LightGBM的预测结果较为理想,预测的最大值与真实值最为接近。表明,LightGBM适用于训练晴天天气类型下较大的数据量。
图9为多云或阴天天气下的功率预测结果,可见:此种天气类型下,光伏功率在一天中的不同时段出现了不同程度的削减,RF对此种天气类型展现出来较好的预测性能。
图10为覆雪天气类型下的功率预测结果,可见:此时光伏功率大幅度削减,最大光伏功率仅达到了6 MW左右;MLP对覆雪天气类型下的光伏功率预测较为准确。
每个预测模型进行数据扩充前后的MAE和RMSE如表2所示,可见:用SMOTE算法进行数据扩充后的预测精度基本有所提升;晴天天气类型下LightGBM算法用SMOTE扩充后的MAE由1.10%降低到了0.63%,精度上升了0.47%,RMSE由2.16%降低到了1.28%,精度提升了0.88%;多云或阴天天气下,RF算法用SMOTE扩充后的MAE由1.41%降低到0.51%,精度提升了0.9%,RMSE由2.97%降低到了1.13%,精度提升了1.84%;覆雪天气下MLP算法用SMOTE扩充后的MAE由1.08%降低到了1.05%,精度上升了0.03%,RMSE由2.33%降低到了2.31%,精度提升了0.02%。
表2 各模型预测误差统计
Table 2
| 天气 | 扩充情况 | RF | RNN | MLP | LightGBM | XGBoost | |||||
| eMAE | eRMSE | eMAE | eRMSE | eMAE | eRMSE | eMAE | eRMSE | eMAE | eRMSE | ||
| 晴天 | 扩充前 | 1.65 | 3.19 | 1.71 | 3.34 | 2.43 | 2.68 | 1.10 | 2.16 | 1.19 | 2.32 |
| 扩充后 | 1.63 | 3.16 | 1.42 | 2.56 | 1.60 | 2.96 | 0.63 | 1.28 | 0.81 | 1.61 | |
| 多云或阴天 | 扩充前 | 1.41 | 2.97 | 1.65 | 3.47 | 1.62 | 3.17 | 1.41 | 2.97 | 1.62 | 3.45 |
| 扩充后 | 0.51 | 1.13 | 1.28 | 2.87 | 1.16 | 2.23 | 0.56 | 1.19 | 1.56 | 3.37 | |
| 覆雪 | 扩充前 | 1.45 | 2.41 | 1.26 | 2.60 | 1.08 | 2.33 | 1.49 | 3.45 | 1.53 | 3.55 |
| 扩充后 | 1.34 | 2.37 | 1.23 | 2.58 | 1.05 | 2.31 | 1.40 | 3.23 | 1.48 | 3.42 | |
6 结论
针对不同天气类型下光伏功率预测精度低和样本数据量不一致的问题,本文提出了一种基于日照时数划分天气类型,并应用SMOTE进行样本扩充的超短期光伏功率预测方法。在算例分析中将不同天气类型下的功率预测结果与不进行样本扩充的预测结果进行对比发现,本文所提出的预测方法其预测精度有所提升。
本文所提算法能对天气类型进行分类,并且为解决不同天气类型下数据量差异较大的问题提供了一种解决方法,提升了不同天气类型下光伏功率的预测精度。
参考文献
A novel integrated method for short-term wind power forecasting based on fluctuation clustering and history matching
[J].
我国分布式能源发展现状及展望
[J].
Status and outlook of distributed energy development in china
[J].
分布式光伏项目国企开发模式及风险研究
[J].
Research on development mode and risks of distributed photovoltaic projects developed by state-owned enterprises
[J].
太阳能光伏/光热技术研究现状与发展趋势综述
[J].
Review on research status and developing tendency of solar photovoltaic/thermal technology
[J].
Exploring key weather factors from analytical modeling toward improved solar power forecasting
[J].
台风灾害下多阶段协同的受端电网弹性提升策略
[J].
Resilience enhancement strategy with multi-stage collaboration for receiving-end grid under typhoon disaster
[J].
美国得州2021年极寒天气停电事故分析及启示
[J].
Analysis and enlightenment of extremely cold weather power outage in texas, U. S. in 2021
[J].
Seeking for a climate change mitigation and adaptation nexus: analysis of a long-term power system expansion
[J].
基于预估-校正综合BP神经网络的短期光伏功率预测
[J].
Short-term photovoltaic power forecasting based on predict-correct combination BP neural network
[J].
基于云层分布规律与太阳光跟踪的光伏电站MPPT策略
[J].
MPPT strategy of photovoltaic station based on cloud distribution pattern and sunlight tracking
[J].
考虑云层遮挡的光伏发电功率超短期预测技术
[J].
Ultra-short-term prediction of photovoltaic power generation considering cloud cover
[J].
基于卷积神经学习的光伏板积灰状态识别与分析
[J].
Image convolutional neural learning based image recognition and analysis method for dust on photovoltaic panel
[J].
基于相似日理论和CSO-WGPR的短期光伏发电功率预测
[J].
Short-term photovoltaic power generation prediction based on similar day theory and CSO-WGPR
[J].
寒潮天气小样本条件下的短期风电功率组合预测
[J].
Combined approach for short-term wind power forecasting under cold weather with small sample
[J].
极端天气下智能配电网的弹性评估
[J].
Resilience evaluation of smart distribution network in extreme weather
[J].
基于实测数据的电网频率信号特征分析与提取方法
[J].
Feature analysis and extraction method of power grid frequency signal based on measured data
[J].
An exponential droop control strategy for distributed energy storage systems integrated with photovoltaics
[J].
Short-term electricity price forecast using frequency analysis and price spikes oversampling
[J].
Day-ahead city natural gas load forecasting based on decomposition-fusion technique and diversified ensemble learning model
[J].
A spatiotemporal directed graph convolution network for ultra-short-term wind power prediction
[J].
利用时空相关性的多位置多步风速预测模型
[J].
A multi-step wind speed prediction model for multiple sites leveraging spatio-temporal correlation
[J].
Productivity prediction of a multilateral-well geothermal system based on a long short-term memory and multi-layer perceptron combinational neural network
[J].
/
| 〈 |
|
〉 |
清华大学出版社期刊中心




