基于敏感性因素分析的数值天气预报修正方法

doi:10.16513/j.2096-2185.DE.2008007

基于敏感性因素分析的数值天气预报修正方法

丛智慧¹, 刘倩², 刘永前³, 韩爽³

1．大唐(赤峰)新能源有限公司，内蒙古　赤峰　024000

2．广东电网有限责任公司惠州供电局，广东　惠州　516003

3．华北电力大学新能源学院，北京　昌平　102206

Correction Method of Numerical Weather Prediction Based on Sensitivity Factor Analysis

CONG Zhihui¹, LIU Qian², LIU Yongqian³, HAN Shuang³

1. Datang (Chifeng) New Energy Co., Ltd., Chifeng 024000, Inner Mongolia, China

2. Huizhou Power Supply Bureau, Guangdong Power Grid Co., Ltd., Huizhou 516003, Guangdong Province, China

3. School of Renewable Energy, North China Electric Power University, Changping District, Beijing 102206, China

收稿日期: 2020-08-20

基金资助:

国家自然科学基金项目. U1765201

Received: 2020-08-20

Fund supported:

National Natural Science Foundation of China. U1765201

作者简介 About authors

丛智慧(1976)，男，硕士，高级工程师，研究方向为能源场站运行；。

刘　倩(1995)，女，硕士，助理工程师，研究方向为风电机组运行数据清洗和风电机组功率预测；。

刘永前(1965)，男，博士，教授，博导，研究方向为智能风电场技术研究，包括风电场流场数值模拟、风电场功率预测、风电场智能控制、风电机组状态诊断与健康管理等；。

韩　爽(1974)，女，博士，副教授，研究方向为风电场功率预测、风特性分析、风资源评估、风电场设计等，hanshuang1008@sina.com 。

摘要

模型输出统计作为数值天气预报(numerical weather prediction，NWP)修正常用的方法，可有效修正系统误差，节省计算资源和时间。为了提高NWP的预测精度，从影响NWP精度的因素出发，分析不同因素对NWP误差的影响模式，得到对NWP风速误差影响最大的因素。然后以该敏感因素为划分依据建立分段修正模型提高NWP的准确性。为防止研究结果依赖于某种特定建模方法，采用4种常用的统计方法建立模型。算例结果表明：NWP风速误差对风向最为敏感，以风向为划分依据建立的修正模型精度最高。以线性回归方法为例，以风向为划分依据比以风速和气压为划分依据的NWP误差分别降低了3.6%和5.3%。

关键词： 数值天气预报(NWP)修正 ; 风速误差 ; 敏感性分析 ; 风向

Abstract

As a common method of numerical weather prediction (NWP) correction, model output statistics can effectively correct system errors and save computing resources and time. In order to improve the prediction accuracy of NWP, this paper analyzes the influence modes of different factors on NWP error, Starting from the factors that affect the accuracy of NWP, and obtains the factors that have the greatest impact on NWP wind speed error. Then based on the sensitive factors, a piecewise correction model is established to improve the accuracy of NWP. In order to prevent the research results from relying on a specific modeling method, four commonly used statistical methods are used to establish the model. The results of numerical examples show that the NWP wind speed error is the most sensitive to the wind direction, and the modified model based on the wind direction has the highest accuracy. Taking the linear regression method as an example, the NWP error based on wind direction is 3.6% and 5.3% lower than that based on wind speed and air pressure.

Keywords： numerical weather prediction (NWP) correction ; wind speed error ; sensitivity analysis ; wind direction

PDF (2945KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

丛智慧, 刘倩, 刘永前, 韩爽. 基于敏感性因素分析的数值天气预报修正方法. 分布式能源[J], 2020, 5(5): 8-15 doi:10.16513/j.2096-2185.DE.2008007

CONG Zhihui, LIU Qian, LIU Yongqian, HAN Shuang. Correction Method of Numerical Weather Prediction Based on Sensitivity Factor Analysis. Distributed Energy[J], 2020, 5(5): 8-15 doi:10.16513/j.2096-2185.DE.2008007

0　引言

数值天气预报是近些年来发展起来的定量预报方法，现今较为成熟的数值天气预报模型有：美国国家环境预报中心用于业务预报的ETA模式、美国宾夕法尼亚大学和国家大气研究中心合作研制的MM5模式、科罗拉多州立大学研发的区域大气模拟系统——RAMS等。随着近代观测技术的发展以及计算机性能的不断提升，数值天气预报技术得到了跨越式发展，成为风电和光伏出力预测的关键技术。Aoife M. Foley等^[1]详细介绍了全球各地的数值天气预报模型，文献[2]针对我国数值天气预报的最新研究和发展进行了总结。

尽管如此，数值天气预报(numerical weather prediction，NWP)数据与真实的天气状况依旧存在较大的差别，这种误差主要产生于建立初始场时的误差以及模型的模式误差^[3]。可通过改进模型分辨率和模型参数化方案减少预报模式误差，同时提高计算效率，但会给网格模拟仿真带来很大的计算负担，同时也很难消除估计地表气象参数时的初始化或系统误差。

因此人们开始关注另一种根据观测资料来修正模式误差的统计方法^[4]。统计校正方法包括2种形式：线上校正和线下校正。与在线修正相比，离线修正方法使用误差统计来改善模型输出，不需要将修正嵌入到模型集成过程中。模型输出统计(model output statistics, MOS)是一种广泛使用的离线修正方法，通过建立较长时间内的观测数据和预测数据的统计关系来修正预报误差。在风电功率预测研究中，许多研究同样也提前通过MOS方法提前对NWP数据进行修正，提高功率预测的准确性。

文献[5,6,7,8]运用Kalman滤波对NWP模型的输出进行过滤以消除NWP的系统误差。Yan^[9]等人基于叠加去噪自编码算法，建立了NWP和机组实测数据的多对多映射结构。Hoolohan^[10]等人通过建立NWP和实测气象数据的高斯过程回归模型修正近地表的NWP风速，并且在修正过程中考虑了大气稳定性对模型性能的影响。Xu^[11]等通过一种不良数据分析器研究风电功率预测误差与从原始NWP提取出的几个新特征之间的关系，进而建立短期功率预测模型。文献[12]运用支持向量机(support vector machine, SVM)修正NWP误差，通过粗糙集降维的方法提取不同点位NWP的关键因素，作为修正模型输入，学习NWP数据和实测数据的关系。文献[13]分别采用线性回归、径向基函数(radical basis function, RBF)神经网络和Elman神经网络建立数值天气预报和观测结果之间的关系来修正误差，结果表明Elman网络具有更加良好的单点修正能力。文献[14,15,16,17,18]用神经网络的方法来修正短期NWP输出风速的误差。Zhao^[19]等人通过统计分析NWP结果与实测数据的残差特征，设计了非线性和非参数相结合的算法对原始预测值进行修正。Chu^[20]等在变权叠加算法的基础上，提出了基于集成叠加的数值天气预报校正方法减小预报误差。文献[21]提出一种数值预报风速序列传递校正算法，建立了5个常用的数值预报风速误差修正模型。文献[22]运用小波将NWP数据分解，再用线性模型修正低频成份的误差。

上述方法使得NWP输出结果更加接近预测机组点位处的实测数据，有效修正NWP数据的系统误差并且计算量小，均侧重于提高统计修正模型的性能以及寻找更加准确的统计方法。本文则从影响NWP风速误差的相关因素入手，分析不同因素对NWP精度的影响模式，得到对NWP风速误差影响最大的因素。最后以该敏感因素为划分依据建立分段修正模型提高NWP风速的准确度。

1　NWP风速误差的敏感因素分析

1.1　NWP误差的定义

NWP的空间分辨率低，再加上本身的误差，NWP风速与机组实测风速存在较大的偏差。这种偏差可以用绝对误差(absolute error, AE)、平均绝对误差(mean absolute error, MAE)和均方根误差(root mean square error, RMSE)来衡量。三种误差的计算方法如下。

(1)绝对误差(AE)。某时刻NWP风速值和实测风速值的差值。该误差有正负区别，当差值为正数时表示此刻NWP风速值比实测风速值大，反之表示此刻NWP风速值比实测风速小。

(1) $e_{AE} = {u^{'}}_{i} - u_{i}$

(2)均方根误差(RMSE)。NWP风速与实测风速值偏差的平方和与样本容量n比值的平方根。衡量某段时间内NWP风速和实测风速值偏差的统计平均值。

(2) $e_{RMSE} = \sqrt{\frac{\sum_{i = 1}^{n} {({u^{'}}_{i} - u_{i})}^{2}}{n}}$

(3)平均绝对误差(MAE)。NWP风速与实测风速值偏差绝对值的平均值。

(3) $e_{MAE} = \frac{\sum_{i = 1}^{n} | {u^{'}}_{i} - u_{i} |}{n}$

式中：u′_i为i时刻的NWP风速值；u_i为i时刻实测风速值；n为样本容量。

1.2　NWP风速误差敏感性分析

1.2.1　NWP风速误差对NWP与实测数据相关度的敏感性分析

表1中列出了某风电场全年各月的NWP风速和实测风速的平均值、NWP风速误差以及NWP风速和实测风速的相关系数。该风电场8月15日至9月16日全部机组数据均缺失，因此只列出了10个月的数据。

表1 全年NWP风速和实测风速对比

Table 1 Comparison of annual NWP wind speed and measured wind speed

月份	风速平均值/(m·s^－1)		NWP风速误差/(m·s^－1)		相关系数
月份	NWP	实测	RMSE	MAE	相关系数
1	10.88	9.86	3.30	2.36	0.82
2	7.90	7.84	2.89	2.25	0.85
3	9.12	9.04	3.15	2.38	0.79
4	7.31	7.47	2.90	2.33	0.82
5	11.24	10.38	3.80	2.88	0.77
6	6.02	6.63	2.96	2.33	0.61
7	6.27	6.48	2.57	2.06	0.62
10	8.20	7.93	2.98	2.13	0.77
11	9.37	8.75	2.76	2.03	0.89
12	13.42	11.74	4.04	2.17	0.83

新窗口打开| 下载CSV

从计算结果看出：

(1)全年NWP风速和实测风速变化趋势相同，存在较明显的正相关关系，全年两者的相关系数高达0.78，说明了基于实测数据对NWP风速进行修正的可行性。

(2) NWP风速误差的变化趋势和两者相关系数的变化趋势相反，NWP风速和实测风速11月份的相关系数最大，相应11月份NWP风速的误差较小。

(3) NWP风速值越大，NWP风速的均方根误差值越大。12月份NWP风速值最大，其误差值也最大。

1.2.2　NWP风速误差对时间的敏感性分析

计算了代表机组点位处NWP风速在全年各时间点的绝对误差，图1为按月绘制的NWP风速误差频率分布直方图。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 各月NWP风速误差频率分布直方图

Fig.1 Monthly NWP wind speed error frequency distribution histogram

从图1看出，各月的NWP风速误差分布特征基本相同，接近正态分布。误差最大频率都在0 m/s附近，表明误差均值靠近0 m/s，NWP风速大于实测风速和小于实测风速的频率基本相同。说明NWP风速误差在各月的分布模式相似，对月份敏感性不高。

1.2.3　NWP风速误差对天气因素的敏感性分析

NWP数据主要包括风速、风向、温度、气压和湿度参数，下面分析上述参数对NWP风速误差的影响规律。

(1) NWP风速误差对风速的敏感性分析。

全年NWP风速误差在不同风速区间的频率分布如图2所示。可以看出，NWP风速误差在不同风速区间频率分布差异较明显。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 不同风速区间NWP误差频率分布直方图

Fig. 2 Histogram of NWP error frequency distribution in different wind speed regions

误差最高频率位置差异：小风速段，误差最高频率位置偏向零的左侧，表明较多的误差为负值；中间风速段，频率最高位置开始向0的正方向偏移，并逐渐远离0，表明随着风速的增大正值误差的数量增加并超过负误差的数量；高风速段，误差最高频率位置远大于0，表明正值误差数量远大于负值误差数量，NWP风速平均误差达到最大。在25.2～28 m/s风速段，误差全部为正值，误差平均水平高达9 m/s左右。这与前面的分析结果相一致，NWP风速越大，其风速误差也越大。

误差频率的幅值差异：低风速段，误差频率幅值较大，直方图形状较窄，表明误差在某一区间的数据量明显超过其它区间；中间风速段，频率幅值较小，直方图形状较宽，表明误差在各区间分布均匀；高风速段，幅值小幅度增大，但在最高风速段幅值突然增大且直方图形状均不同于其它风速区间。

上述研究表明，NWP风速误差对风速值大小较为敏感，建立NWP修正模型时有必要针对不同风速段建立不同模型。

(2) NWP风速误差对风向的敏感性分析。

图3为不同风向的NWP风速误差频率分布直方图。可以看出，当风向角度较小时，最高频率位置处的幅值较小，而当风向角较大时幅值较大。另外不同风向时误差最高频率的位置和频率直方图的形状存在差异，因此NWP风速误差对风向同样较为敏感。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 不同风向的NWP风速误差频率分布直方图

Fig.3 Histogram of frequency distribution of NWP wind speed error in different wind directions

(3) NWP风速对气压的敏感性分析。

图4为不同气压的NWP风速误差频率分布直方图。气压值较小时，NWP风速误差最高频率位置处的幅值较小，且直方图形状矮而宽；随着气压的增大，误差频率幅值开始增大，直方图形状变窄；后2张图中在气压达到最高值时，直方图的分布形状发生变化，不再是类似于正态分布的形状。因此NWP风速误差对气压也较为敏感。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 不同气压下NWP风速误差分布直方图

Fig.4 NWP wind speed error distribution histogram for different pressure

(4) NWP风速误差对温度敏感性分析。

图5为NWP风速在不同温度区间的频率分布直方图。除温度极小值和温度极大值两处频率分布直方图的形状有所不同外，其余温度区间NWP风速误差频率分布图基本相同，因此NWP风速误差对温度的敏感性较差。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 不同温度下NWP风速误差频率分布直方图

Fig.5 Histogram of frequency distribution of NWP wind speed error at different temperatures

(5) NWP风速误差对湿度的敏感性分析。

图6为NWP风速误差在不同湿度区间的频率分布直方图。所有湿度区间的直方图形状、频率幅值以及最大频率位置大致相同，说明NWP风速对天气的湿度敏感性很差。

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 不同湿度下NWP风速误差频率分布直方图

Fig.6 Histogram of error frequency distribution of NWP wind speed with different humidity

1.2.4　NWP风速误差敏感性总结

通过上述分析可见，NWP风速误差对风速和风向数据敏感，对气压值也较为敏感。因此在建立NWP风速修正模型时，依据上述3个因素，将历史数据划分成不同的区间，在各个区间分别建立NWP风速修正模型，最后比较基于风速、风向和气压这3个敏感性因素的的修正效果，将修正精度最高的模型的敏感因素设置为最终的划分依据，为风电场功率预测提供修正的NWP。

2　NWP风速修正模型建模过程

NWP风速修正是通过风电场历史数据探求NWP风速和实测风速之间的映射关系，并依此映射关系修正未来时刻的NWP风速。研究中常用统计方法来寻找输入变量和输出变量之间的这种映射关系，论文采用的NWP风速修正方法包括线性回归方法、支持向量机方法、BP神经网络方法以及随机森林方法这4种主流方法。

根据NWP风速误差的敏感性因素将风电场历史数据划分为不同的类型，这些不同类型数据的天气演变过程存在差异，更能准确捕获NWP风速和实测风速之间的关系，进而提高NWP风速的修正精度。主要建模过程如下。

步骤1：数据预处理。包括缺失数据的插补、异常数据的删除以及数据归一化处理。

步骤2：确定修正模型的输入和输出变量。模型输入是机组点位处的NWP风速，模型输出为机组实测风速数据。

步骤3：划分修正模型训练集和测试集。模型的训练集为全年各月前20天的历史数据，其余数据为测试集数据。

步骤4：根据NWP风速误差的天气敏感因素，将训练集划分为不同的区间数据，在各个区间利用统计学习方法训练历史数据，分别建立NWP风速修正模型。

步骤5：对未来的数值天气预报数据先确定其所处的区间，再使用该区间的NWP风速修正模型进行NWP风速的修正。

3　算例分析

3.1　数据描述

选取我国华北地区某风电场NWP数据和机组实测数据为研究对象。该风电场有24台额定功率为2 MW的机组，选取2014年1月1日至2014年12月31日机组数据采集与监视控制(supervisory control and data acquisition, SCADA)系统，即SCADA系统中采集的实测风速和对应时刻风电场范围内的28组NWP风速、风向、温度、湿度、气压数据，其中24组NWP数据位置为风电机组机位，另外4组为该风电场范围内随机位置处的数据。实测数据和NWP数据的时间分辨率为10 min。2014年8月15日至9月16日，该风电场24台机组的实测数据全部缺失，因此对这2月的数据不做研究。

3.2　修正模型

为进一步探求NWP风速误差对风速、风向以及气压哪一因素最为敏感，根据不同NWP风速误差敏感因素分别建立以下3种对比模型：以NWP风速为划分依据建立的分段修正模型、以NWP风向为划分依据建立的分段修正模型和以NWP气压为划分依据建立的分段修正模型。

以NWP风速为划分依据建立分段修正模型：根据NWP风速将研究数据等间隔划分为10个风速区间，对各个区间数据利用四种统计方法建立修正模型。风速间隔值为

(4) $v_{bin} = \frac{v_{max} - v_{min}}{10}$

式中：v_max和v_min分别为NWP风速的最大值和最小值。

以NWP风向为划分依据建立分段修正模型：根据NWP风向将研究数据等间隔地划分成10个风向区间，区间间隔为36°，并对各个区间数据利用四种统计方法建立修正模型。

以NWP气压为划分依据建立分段修正模型：根据NWP气压将研究数据等间隔划分为10个气压区间，对各个区间数据利用4种统计方法建立修正模型。气压间隔值p_bin(Pa)为

(5) $p_{bin} = \frac{p_{max} - p_{min}}{10}$

式中：p_max和p_min分别为NWP气压的最大值和最小值。

3.3　NWP修正结果对比与分析

表2是分别以风速、风向以及气压为划分依据的修正模型修正后的NWP风速与实测风速之间的均方根误差以及原始均方根误差。

表2 不同敏感因素的NWP风速修正结果

Table 2 Results of NWP wind speed correction for different sensitive factors　m/s

敏感因素	原始NWP误差	BP神经网络模型修正后的误差	随机森林模型修正后的误差	支持向量机模型修正后的误差	线性回归模型修正后的误差
风速	3.00	2.33	2.25	2.32	2.22
风向	3.00	2.52	2.19	2.31	2.14
气压	3.00	2.56	2.42	2.39	2.26

新窗口打开| 下载CSV

可以看出，4种方法中，线性回归方法修正精度最高。按影响因素分析，以风向数据划分的修正模型，除BP神经网络方法外，其余3种方法对NWP风速的修正效果均为最佳。以线性回归方法为例，它的NWP误差比以风速和气压为划分依据的方法分别小3.6%和5.3%，由此可以看出NWP风速误差对风向最为敏感，其次为风速，对气压的敏感性相对较差。

图7为风电场所有机组以风速、风向和气压为划分依据，线性回归方法修正模型修正后NWP风速的年均方根误差。除2号机组外，其他所有机组以风向为划分依据的NWP风速误差均达到最小，而2号机组处以风向和风速为划分依据的误差基本相同。表明全场机组点位处的NWP风速误差均对风向最为敏感，具有统一性和普遍性。

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 考虑不同敏感性因素的NWP的年均方根误差

Fig.7 Annual mean root square error of NWP considering different sensitivity factors

图8为18号机组所在位置处21天的NWP修正风速，可以看出以风向为划分依据的修正模型能更加准确的捕获NWP风速和实测风速的关系，优于其它两种划分依据的修正效果。

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 不同天气划分依据的NWP修正风速时间序列对比图

Fig. 8 Comparison of NWP modified wind speed time series based on different weather classification

4　结论

论文通过计算NWP风速误差在不同时间以及天气因素区间的分布特征，分析了时间、风速、风向、气压、温度、湿度几个因素对NWP风速误差的影响程度，初步确定NWP风速误差的敏感因素。然后建立考虑不同敏感因素的NWP风速修正模型，通过比较修正精度定量确定NWP风速误差对各种敏感因素的敏感性大小。为防止研究结果依赖某种特定建模方法，采用反向传播(back propagation, BP)神经网络、支持向量机、随机森林以及线性回归四种统计方法建立模型。通过算例分析得到以下结论：

(1) NWP风速误差在各月的分布特征基本相同，其对月份敏感性不高。

(2)通过分析全年NWP风速误差在不同风速、风向、气压、温度以及湿度区间的频率分布中误差最高频率位置差以及误差频率幅值和分布图形状，发现NWP风速误差对风速、风向以及气压敏感。

(3)比较不同敏感因素的NWP修正模型精度，发现NWP风速误差对风向最为敏感。以线性回归方法为例，以风向为划分依据的NWP误差比以风速和气压为划分依据分别降低了3.6%和5.3%。并计算了全场风电机组的NWP修正情况，结果表明全场机组点位处的NWP风速误差均对风向最为敏感，具有普遍性。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

FOLEY

A M

, LEAHY

P G

, MARVUGLIA

, et al.

Current methods and advances in forecasting of wind power generation

[J]. Renewable Energy, 2012, 37(1): 1-8.