分布式能源, 2022, 7(1): 1-11 doi: 10.16513/j.2096-2185.DE.2207101

学术研究

基于多尺度分解集成组合模型的碳价格预测研究

华北电力大学经济管理系,河北省 保定市 071003

Carbon Price Prediction Based on Multi-Scale Decomposition Integrated Combination Model

WANG Xiping,,, YU Yiding,

Department of Economic Management, North China Electric Power University, Baoding 071003, Hebei Province, China

收稿日期: 2021-12-24  

基金资助: 河北省社会科学基金项目.  HB19YJ011

Received: 2021-12-24  

Fund supported: Social Science Fund Project of Hebei Province.  HB19YJ011

作者简介 About authors

王喜平(1969),女,教授,研究方向为能源经济与可持续发展研究,hdwxp@126.com; , E-mail:hdwxp@126.com

于一丁(1996),男,硕士研究生,研究方向为能源经济学 。

摘要

准确预测碳价格不仅有助于投资者及监管部门的科学决策,而且有助于碳金融市场的健康发展。考虑碳价格预测的复杂性,基于“分解-重构-预测-集成”的建模原则,构建了多尺度碳价格集成组合预测模型。首先,采用改进型自适应白噪声完备集成经验模态分解(improved complete ensemble empirical mode decomposition with adaptive noise,ICEEMDAN)算法对碳价原始序列进行分解,并以综合贡献度指数(comprehensive contribution index,CCI)对分量进行重构,得到短期、长期和趋势分量;然后,采用门限广义自回归条件异方差(threshold generalized auto-regressive conditional heteroscedasticity,TGARCH)模型预测短期分量,以布谷鸟搜索(cuckoo search,CS)算法优化超参数的长短期记忆(long-short term memory,LSTM)神经网络预测长期和趋势分量;在此基础上,采用非线性集成算法对各分量预测结果进行集成,得到最终的碳价预测结果。以湖北碳市场为样本数据进行实证分析,结果表明所构建的预测模型性能最优,预测结果更准确,可为监管部门和企业决策提供有效信息。

关键词: 碳价格预测 ; 长短期记忆(LSTM)模型 ; 门限广义自回归条件异方差(TGARCH)模型 ; 改进型自适应白噪声完备集成经验模态(ICEEMDAN)分解 ; 超参数优化

Abstract

Precise prediction of carbon prices is not only of significance for policy formulation and investment decisions, but also helpful to the carbon finance market development. Considering the non-stationary and nonlinearity characteristics inherent in the carbon price, this study proposed a novel hybrid model named ICEEMDAN-TGARCH/LSTM(CS)-LSTM(CS), in which the ICEEMDAN (improved complete ensemble empirical mode decomposition with adaptive noise) is applied to decompose the carbon price original series into several subcomponents, then the subcomponents are identified according to comprehensive contribution index (CCI) and divided into short-term, long-term and trend components. TGARCH(threshold generalized auto-regressive conditional heteroscedasticity) is chosen for the short-term components forecasting, while LSTM (long-short term memory) neural network model with hyper-parameters optimized by cuckoo search (CS) algorithm is selected to forecast other components and combine all the forecasting sequences. The empirical results Hubei carbon emission trading market indicated that the proposed model outperformed other benchmark models with the lowest prediction error, meaning that the hybrid model proposed by us can be an effective and accurate tool for carbon price forecasting. It provides effective information for regulatory authorities and enterprises to make decisions.

Keywords: carbon price forecasting ; long-short term memory(LSTM) model ; threshold generalized auto-regressive conditional heteroscedasticity (TGARCH) model ; improved complete ensemble empirical mode decomposition with adaptive noise (ICEEMDAN) decomposition ; hyper-parameters optimization

PDF (2731KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

. 基于多尺度分解集成组合模型的碳价格预测研究. 分布式能源[J], 2022, 7(1): 1-11 doi:10.16513/j.2096-2185.DE.2207101

WANG Xiping, YU Yiding. Carbon Price Prediction Based on Multi-Scale Decomposition Integrated Combination Model. Distributed Energy[J], 2022, 7(1): 1-11 doi:10.16513/j.2096-2185.DE.2207101

0 引言

2020年9月中国向全球宣誓,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和。碳排放权交易作为实现“双碳”目标的重要政策工具,其价值作用日益凸显。目前,全球已有20多家碳排放权交易体系在线运行,其中欧盟交易体系(European Union emission trading scheme, EUETS)规模最大、也最成熟,因而也被视为碳排放交易体系的标杆。自2013年以来,我国先后成立了8个试点碳市场,在此基础上,2017年宣布启动全国碳市场建设,并于2021年7月16日正式在发电行业率先启动碳排放权交易。随着碳市场的不断发展,其金融属性日益凸显。碳价格作为碳金融市场的核心指标之一,不仅影响着减排绩效,也影响着减排主体的成本与未来发展。因此,对其作出精准预测不仅有助于为投资者及监管部门提供科学决策依据,还能有效促进碳金融市场的健康发展。

目前有关碳价格预测的研究主要可以分为3类:(1)基于计量模型的预测。文献[1]基于向量自回归模型(vector auto-regression, VAR)预测碳价格;文献[2]基于马尔科夫区制转换(Markov switching auto-regression, MS-AR)模型预测碳价格;文献[3,4]将广义自回归条件异方差模型(generalized auto-regressive conditional heteroscedasticity, GARCH)模型应用于碳价格预测,以刻画碳价格的尖峰厚尾特征。(2)基于人工智能的预测。尽管基于计量模型的预测结果在统计意义上可靠,但却无法捕捉碳价格序列的非线性特征,因此,基于人工智能的算法,如反向传播(back propagation, BP)神经网络[5,6],支持向量机(support vector machines, SVM)[7],最小二乘支持向量机(least squares support vector machine, LSSVM)[8]和极限学习机(extreme learning machine, ELM)[9]被广泛应用于碳价预测。近来,长短期记忆(long-short term memory, LSTM)作为一种新型循环神经网络被广泛应用于碳价预测,并融入了遗传算法(genetic algorithm, GA)、改进鲸鱼优化算法(improved whale optimization algorithm, IWOA)、粒子群优化(particle swarm optimization, PSO)算法等多种优化算法以提高预测精度,但已有研究主要聚焦于LSTM中的参数(如权重矩阵、偏置向量等)优化,几乎没有关于超参数的优化。(3)基于组合模型的预测。考虑到单一预测技术难以满足预测精度要求,因而集成计量模型和机器学习两者优势的组合预测模型越来越受到关注。文献[10]构建了差分自回归移动平均(auto regressive integrated moving average, ARIMA)模型和LSSVM的组合模型预测了欧盟碳排放配额价格。但该研究是基于碳价格原始序列进行的,考虑到碳价格序列不同时间尺度上的异质性,基于分解-集成的建模思路逐渐成为主流。文献[11]基于经验模态分解分解(empirical mode decomposition, EMD)-GARCH模型预测了中国碳价格。文献[8]基于集合经验模态分解(ensemble empirical mode decomposition, EEMD)和LSSVM的集成模型预测碳价格。文献[12]基于CEEMDAN-RBFNN-SVM模型预测中国8个试点市场碳价格。随着数据分解方法的不断演进,EMD中的模态混叠问题得到了很好的改善,然而残差噪声以及虚假模态问题仍未得到有效解决。为此,COLOMINAS [13]对自适应白噪声完备集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise, CEEMDAN)进一步改进,提出改进自适应白噪声完备集合经验模态分解(improved complete ensemble empirical mode decom-position with adaptive noise, ICEEMDAN)模型,文献[14]发现原始数据序列经过ICEEMDAN分解后的预测结果远优于基于EMD和EEMD分解后的预测结果,这为碳价格预测提供了改进空间。

上述分析表明,尽管碳价格预测取得了丰硕成果,但仍存在改进空间:(1)几乎没有基于ICEEMDAN对碳价格序列进行分解的预测研究;(2)几乎没有集成TGARCH和LSTM两者优势对碳价重构分量进行预测的研究;(3)几乎没有对LSTM超参数进行优化的碳价预测研究。有鉴于此,本文拟构建一种基于分解-集成的碳价格组合预测模型。创新之处在于:(1)采用ICEEMDAN对碳价格原始序列进行分解,克服了EMD和EEMD的缺陷,并进一步采用基于进化聚类算法的综合贡献度指数(comprehensive contribution index, CCI)进行分量重构;(2)采用集成TGARCH和LSTM优势的模型分别对重构分量进行预测:TGARCH预测短期分量,以LSTM预测长期和趋势分量;(3)以布谷鸟搜索(cuckoo search,CS)算法优化LSTM模型中的超参数,以提高预测精度。

1 碳价格多尺度分解集成及预测模型的构建

1.1 ICEEMDAN分解

步骤1 定义Ek(·)为经EMD分解后的第k个模态函数,用EMD方法对ix(i)xβ0E1(w(i))取局部均值以获取第1个残差:

r1=M(x(i))

式中:M(·)为所分解信号的局部均值的算子;〈·〉表示在整个实现过程中取平均。

步骤2 在k=1时的第1个阶段计算第1个模态为

d˜1=xr1

步骤3 第2个残差为对r1β1E2(w(i))的局部均值取平均,并定义第2个模态为

d˜2=r1r2=r1M(r1+β1E2(w(i)))

步骤4 当k=3,…,K时,残差为

rk=M(rk1+βk1Ek(w(i)))

步骤5 第k个模态由下式求出

d˜k=rk1rk

步骤6 对于后续的每个k,重复步骤4和步骤5的计算过程。

1.2 综合贡献度指数和进化聚类算法

以CCI测度各个分解分量对碳价格原始序列的重要性。假定N个分量,则第p个分量的CCI为

eCCI(p)=1Tt=1T|x(t)μ(t)|x(t)+11T1t=1T1R(t)

μ(t)=k=1,kpNgt(k)

R(t)={1,(x(t+1)x(t))(μ(t+1)x(t))00,

其中:1Tt=1T|x(t)μ(t)|x(t)度量剔除第p个分量后对碳价原始序列相对误差的影响,(11T1t=1T1R(t))则反映剔除第p个分量以后对碳价原始序列方向精准性的影响。eCCI(p)值越大,则第p个分量的贡献越大。

在分解的基础上,利用进化聚类算法对不同的IMF分量进行聚类重组,聚类过程根据每个模态的CCI指数,把具有相似重要程度的IMF分量汇聚在一起并进行加总,具体算法采用Matlab编程实现。

1.3 长短期记忆神经网络及其超参数优化

1.3.1 长短期记忆神经网络模型

作为一种特殊的循环神经网络(recurrent neural networks,RNN)模型,LSTM模型被设计用以解决在长序列训练过程中出现的梯度爆炸和梯度消失问题。一个LSTM单元由一个储存信息的记忆细胞组成,该细胞的信息更新由3个特殊的“门”实现:输入门、遗忘门和输出门。LSTM单元的内部结构如图1所示。

图1

图1   LSTM单元的内部结构

Fig.1 Internal structure of the LSTM unit


LSTM单元的计算过程可以被分为以下步骤。

(1)计算t时刻的候选记忆细胞状态:

c˜(t)=tanh(Wc[h(t1),x(t)]+bc)

式中:tanh( )表示激活函数双曲正切函数;h(t-1)表示上一时刻的输出向量;x(t)表示预测模型的输入,也就是碳价格的历史数据;Wcbc分别表示当前记忆细胞的权重矩阵和偏置向量。

(2)计算输入门i(t)的值,输入门决定了当前信息有多少应该被输入到记忆细胞的状态值。

i(t)=σ(Wi[h(t1),x(t)]+bi)

式中:σ(·)表示激活函数sigmoid函数;Wibi分别表示输入门的权重矩阵和偏置向量。

(3)计算遗忘门f(t)的值,遗忘门决定前一期的状态c(t-1)有多少信息可以被保存。

f(t)=σ(Wf[h(t1),x(t)]+bf)

式中:Wfbf分别表示遗忘门的权重矩阵和偏置向量。可以观察到,i(t)和f(t)有相似的形式,而且2个门都由h(t-1)和x(t)决定。

(4)计算当前时刻记忆细胞c(t)的值

c(t)=f(t)c(t1)+i(t)c˜(t)

式中:c(t-1)是上一期LSTM单元状态的值。记忆细胞的更新取决于上一期细胞和候选细胞的状态取值,记忆细胞的更新由输入门和遗忘门控制。长期信息由f(t)控制,短期信息由i(t)控制。

(5)计算输出门的取值o(t),输出门控制记忆细胞状态取值的输出,即

o(t)=σ(Wo[h(t1),x(t)]+bo)

式中:Wobo分别表示输出门的权重矩阵和偏置向量。

(6)计算LSTM单元的输出h(t)

h(t)=o(t)tanh(c(t))

得益于记忆细胞和3个控制门的结构,LSTM模型可以容易地保存、读取、重置和更新长期信息。梯度爆炸和梯度消失的问题在LSTM模型中得到了解决。

1.3.2 超参数优化

(1)超参数。

当学习速率过大时,寻优过程中的参数会在最优解附近变动而非趋近于最优点;当学习速率过小时,模型的收敛速度会变慢。一个迭代就是将所有训练样本训练一次的过程,迭代数量设置的过大,会造成模型过拟合,模型泛化能力不足;迭代次数设置的过小,会造成模型欠拟合,降低预测精度。如果隐藏层节点数过少,模型不能学习到足够的经验;若隐藏层节点过多,会使模型结构变得更复杂,使得网络的收敛速度变慢。本模型设置2层隐藏层,故2个隐藏层各自的节点数计为2个超参数。LSTM模型的上述4个超参数被选择作为应用启发式算法进行寻优的目标。

(2) CS算法。

CS算法中有3个理想状态的假设:1)每只布谷鸟一次生下一枚卵并随机选择一个鸟巢进行孵化。2)在一个随机选择的巢群,将最高质量的鸟巢保存作为下一代。3)可利用的鸟巢数目固定,鸟巢拥有者发现外来卵的概率为Pa∈[0,1]。若鸟巢拥有者发现了巢中的外来卵,它将弃置这枚卵并重建一个新巢穴。基于上述3个理想状态,搜索布谷鸟巢穴位置和路径的更新公式如下:

xi,t+1=xi,t+αL(λ)

L(λ)~μ=tλ,1λ3

式中:xit表示第t次迭代中第i个鸟巢的位置;步长因子α服从正态分布,并且α>0;L(λ)服从莱维随机分布,并定义了莱维随机搜索路径。

在式(15)的位置更新后,产生了随机数r(r∈[0,1]),并且将εpa比较。如果ε>pa,那么巢穴位置进行随机更新;否则,巢穴位置不变。

xi,t+1=xi,t+αsH(paε)(xj,txk,t)

其中:xitxkt为2个不同的随机序列;H(·)表示Heaviside函数;ε为一个从随机分布中提取的随机数;s表示步长。CS算法的实现过程具体见图2

图2

图2   CS算法的流程图

Fig.2 Flowchart of the CS algorithm


1.4 ARMA-TGARCH模型

如果x1, x2,…,xm表示ARMA(pq)-GARCH(rs)模型的碳价格观测值,xt可以被解释为

xt=c+i=1Pai(xtic)j=1Qbjεtj+εt

εt=htηt

ht=ω+i=1rαiεti2+j=1sβjhtj

为了刻画金融风险非对称性的特征,Zakoian(1994)提出了TGARCH模型以描述金融市场的起伏波动的回报率。该模型的均值模型和GARCH模型相同,该模型的条件方差可被描述为

ht=ω+i=1rαiεti2+j=1sβjhtj+k=1mφkεtk2dtk

式中dt作为名义变量。若εtk<0,则dtk=1;若εtk>0,则dtk=0。

当价格上升时,φεtk2dtk=0,i=1rαi表示条件异方差性的影响;而当价格下降时,则用i=1rαi+k=1mφk表示。如果φk=0,则表示价格变化的信息对价格震荡的影响是对称的;反之,则表示该影响是非对称的,并且有一个杠杆效应。

1.5 ICEEMDAN-TGARCH/LSTM(CS)-LSTM(CS)模型构建

图3给出了组合模型的构建流程。首先,以ICEEMDAN对碳价格原始序列进行分解,并基于CCI指数对分解的各经验模态IMF进行重组,得到短、长期和趋势分量;然后,基于对各分量数据特征的分析,以ARMA-TGARCH预测短期分量,以CS优化超参数的LSTM预测长期分量和趋势分量;最后,对各分量预测值进行非线性集成,得到碳价预测结果,并进行比较分析。

图3

图3   构建的组合模型流程图

Fig.3 Flowchart of the proposed hybrid model


2 实证分析

2.1 样本数据

湖北碳排放权交易市场始于2014年4月2日,截至2021年3月12日,其碳交易量达到78.276万t,交易额达到1 688.347万元。作为交易量和交易额最大的试点碳交易市场,市场机制更完善,价格更具有代表性。因此,本文采用湖北碳市场日度价格数据作为研究样本。样本区间为2015-08-28—2021-04-16,共1 320个样本数据。参照已有研究的样本区间划分设定,将总样本的前90%(2015-08-28—2020-10-20,1 200个样本)作为训练集,将剩余的10%(2020-10-21—2021-04-16,120个样本)作为预测模型的测试集,用来检验模型的预测效果。数据均来源于Wind数据库。

2.2 碳价格序列分解及重构

采用ICEEMDAN算法对碳价格原始序列进行分解,共得到10个IMF模态分量和1个残余项,如图4所示。为了降低模型构建复杂程度,对分解得到的10个IMF分量进行重构,先计算各个分量的CCI指数。根据CCI指数和进化聚类算法得到重构结果:IMF1—IMF5构成短期分量MR1,IMF6—IMF10构成长期分量MR2,IMF11构成趋势分量R,具体结果如图5所示。

图4

图4   碳价格序列ICEEMDAN分解结果

Fig.4 ICEEMDAN decomposition result of the carbon price series


图5

图5   分量重构结果

Fig.5 The reconstruction modes


2.3 碳价格预测

2.3.1 基于ARMA-TGARCH模型的碳价格短期分量MR1预测

MR1表征了碳价格高频短期分量,其描述性统计量见表1。从表1中可以看出MR1拒绝正态分布假设,具有尖峰厚尾特征,增强迪基-福勒(augmented Dickey-Fuller, ADF))检验表明MR1拒绝单位根零假设,可以构建ARMA-TGARCH模型。

表1   MR1的描述性统计指标Table 1 Descriptive statistics of component MR1

观测次数均值最小值最大值方差标准差偏态峰度JB统计量ADF统计量
1 320-0.014-10.8915.071.991.412.2332.1358 062.5-11.1

新窗口打开| 下载CSV


基于赤池信息量准则(akaike information criterion,AIC),选择滞后阶数,确定ARMA(15,4)模型,以此为基础进行ARCH效应检验,检验结果表明残差序列存在条件异方差,因此可以构建GARCH模型。进一步检验发现GARCH、EGARCH、TGARCH的AIC值分别为1.408 1、1.472 5和1.388 5,基于AIC,选定能反应非对称效应的TGARCH模型为基础,构建ARMA(15,4)-TGARCH(1,2)用于MR1序列的预测,具体见图6表2是对模型预测效果的评价,表中:MAPE为平均绝对误差百分比;RMSE为均方根误差;MAE为平均绝对误差;TIC为Theil不等系数。

表2   基于ARMA(15,4)-TGARCH(1,2)模型对MR1预测的损失函数Table 2 Loss functions of ARMA(15,4)-TGARCH(1,2) in forecasting MR1

MAPE/%RMSEMAETIC/%
61.044 50.320 010.217 330.118 78

新窗口打开| 下载CSV


图6

图6   TGARCH模型对MR1的预测结果

Fig.6 MR1 forecasting result of TGARCH model


2.3.2 基于LSTM(CS)模型的碳价格长期分量MR2及趋势分量R的预测

ADF检验表明碳价格长期分量MR2和趋势分量R是非平稳序列,采用偏自相关函数(partial autocorrelation function, PACF)分析选定预测模型的输入变量,具体见表3

表3   MR2分量和<i>R</i>分量的输入变量Table 3 Input variables of the component MR2 and R

重组模态滞后期
MR2xt-1xt-2xt-3xt-4xt-5xt-6xt-7xt-8xt-9xt-10xt-11xt-12
Rxt-1

新窗口打开| 下载CSV


LSTM模型中的4个超参数,包括迭代次数、学习率、第1隐含层和第2隐含层节点数,本文采用CS确定,结果发现:当学习率为0.003 788,迭代次数为475,第1隐含层和第2隐含层节点数分别为199和64时,MR2预测结果最优;而当学习率为0.004 482,迭代次数为189,第1隐含层和第2隐含层节点数分别为111和128时,R预测结果最好。

2.3.3 预测结果

在对短期分量MR1、长期分量MR2和R分别预测的技术上,通过布谷鸟优化的超参数LSTM进行非线性集成得到碳价格的预测结果。具体参数如下:当学习率为0.005 436,迭代次数为107,第1隐含层和第2隐含层节点数分别为30和53。图7给出了碳价格最终预测结果,表4是对预测结果的评价。

表4   非线性集成方法预测的4个评价指标Table 4 Four evaluation indicators of nonlinear ensemble method

MAPE/%RMSEMAETIC/%
0.715 710.264 330.212 530.444 47

新窗口打开| 下载CSV


图7

图7   非线性集成方法的碳价格预测结果

Fig.7 Carbon price forecasting result of nonlinear ensemble method


3 实证结果分析

为验证本文所构建的预测模型的优越性,选取了16个基准预测模型进行比较,具体结果见图8表5表5的结果表明本文所构建的预测模型的MAPE、RMSE、MAE、TIC的值分别为0.715 71%, 0.264 33, 0.212 53和0.444 47%,证实了模型的有效性。

表5   模型预测效果对比Table 5 Four evaluation criteria of the various methods

比较项目MAPE/%RMSEMAETIC/%
(1) BP3.344 471.466 441.028 192.467 27
(2) RNN2.946 661.439 960.895 822.423 77
(3) GRU2.882 171.431 470.895 952.414 7
(4) LSTM2.837 341.405 340.885 172.375 87
(5) LSTM(CS)1.777 820.618 990.534 241.052 37
(6) ICEEMDAN-TGARCH/ LSTM(CS)-LSTM(CS)0.715 710.264 330.212 530.444 47
(7) ICEEMDAN-GARCH/ LSTM(CS)-LSTM(CS)0.822 80.332 660.250 20.563 1
(8) ICEEMDAN-LSTM(CS)-LSTM(CS)0.907 640.447 560.279 850.756 01
(9) ICEEMDAN-TGARCH/ LSTM(CS)-0.764 950.328 790.235 560.555 44
(10) ICEEMDAN-GARCH/ LSTM(CS)-0.810 070.352 450.249 480.595 39
(11) ICEEMDAN-LSTM(CS)-1.118 440.460 010.336 090.774 52
(12) EMD-LSTM(CS)-1.294 150.636 410.401 091.073 85
(13) EEMD-LSTM(CS)-1.205 280.495 240.367 720.838 74
(14) CEEMDAN-LSTM(CS)-1.131 390.464 660.343 090.787 24
(15) ICEEMDAN-TGARCH/LSTM-LSTM0.802 610.320 230.244 330.539 69
(16) ICEEMDAN-GARCH/LSTM-LSTM0.832 550.342 380.254 20.577 09
(17) ICEEMDAN-LSTM-LSTM1.706 820.621 730.508 341.044 1

新窗口打开| 下载CSV


图8

图8   各种方法的预测结果

Fig.8 Forecasting results of the various methods


图9(a)为组合模型与BP, RNN, GRU, LSTM和LSTM(CS)等单一模型预测结果的比较,从图9(a)中可以看出,组合模型的预测效果均优于单一模型,其中单一模型(1)—(4)的MAPE大于2.5%,而组合模型(6)—(16)的MAPE均小于1.5%。其原因可能是,由于碳价格的非平稳、非线性特征,没有分解和重组过程的单一模型可能不太适合进行直接的预测。在对原始碳价格进行分解和重组之后,复杂的时间序列数据被转化为相对简单、有规律的平稳时间序列数据,显著地改进了预测的精度。

图9

图9   采用不同方法的预测模型的4个评价指标结果(MAPE、RMSE、MAE、TIC)

Fig.9 Four different evaluation criteria of different methods


图9(b)比较了基于不同分解方法的模型预测结果,从图9(b)中可以看出,基于ICEEMDAN分解的预测结果更优,以MAPE的值来看,基于ICEEMDAN分解预测的结果要比基于EMD、EEMD、CEEMDAN分解的预测误差分别下降0.17%、0.10%和0.02%,这意味着ICEEMDAN能够很好地改进CEEMDAN中的残差噪声问题。而EEMD的改进消除了EMD的模态混合问题,CEEMDAN进一步降低了EEMD的重构误差。

图9(c)比较了基于人工智能模型和计量经济学的集成模型共同构成的混合方法与单纯基于人工智能模型在预测结果上的不同。结果说明,由于前者能考虑到不同成分是否平稳和频率的不同,更适合预测由具有不同数字特征成分构成的数据。MAPE, RMSE, TIC和MAE这4个预测评价指标显示:包含LSTM(CS)方法和TGARCH方法的集成模型(模型(6))具有最优的预测效果,其优于包含LSTM(CS)模型和标准GARCH模型的混合模型(7),更优于只包含LSTM(CS)方法的模型(8)。其中模型(7)和模型(8)的MAPE指标分别为0.882 8%和0.907 64%,大于所提出的模型(6)。究其原因在于,相对于标准GARCH模型,TGARCH模型考虑到了短期价格震荡的非对称性。除此之外,计量经济学的方法在预测短期的高频分量MR1时,其效果好于单纯的人工智能方法。

图9(d)比较了LSTM模型是否有对超参数优化的CS算法对预测结果的影响。结果表明以CS算法优化LSTM超参数会提升模型的整体预测效果。以MAPE的值来看,所提出的模型(6)对LSTM超参数进行了CS优化,其误差要比未进行CS优化的模型(15)的结果小0.1%。采用LSTM模型的其他复合模型(7)(8)的MAPE、RMSE、MAE和TIC指标也均小于未对LSTM进行CS优化的对照组复合模型(16)(17)。这说明了LSTM(CS)方法相比于LSTM方法显著地降低了预测误差,因此,对LSTM的超参数进行群智能寻优是有意义且有效果的。

图9(e)比较了不同集成方法对预测结果的影响,预测精度结果的评价指标表明,采用LSTM(CS)模型的非线性集成方法要优于传统的简单加和加总的方法。究其原因在于,上述提到的分解集成模型分别预测了每一个分量成分,导致了在简单加和加总过程中会产生误差的累积。当每一个预测结果经非线性集成方法汇总后,会有效地克服上述问题。

上述统计检验结果表明,本文所提出的ICEEMDAN-TGARCH/LSTM(CS)-LSTM(CS)模型在捕获碳价格时间序列特征和对碳价格进行的预测中具有显著的优势。

4 结论

碳金融市场作为应对气候变化、解决碳排放污染问题的有效措施之一,对其价格的精准预测就显得尤为重要。为了进一步提升碳价格预测精度,本文构建了ICEEMDAN-TGARCH/LSTM(CS)- LSTM(CS)碳价组合预测模型。首先采用ICEEMDAN算法对碳价原始序列进行分解,并以CCI指数对分量进行重构,得到短期、长期和趋势分量;然后采用TGARCH预测短期分量,以CS算法优化超参数的LSTM模型预测长期和趋势分量;在此基础上,采用非线性集成算法对各分量预测结果进行集成,得到最终的碳价预测结果。以湖北碳市场为样本数据进行实证分析,结果表明与其他模型相比,所构建的预测模型性能最优。

参考文献

JI Q, ZHANG D, GENG J.

Information linkage, dynamic spillovers in prices and volatility between the carbon and energy markets

[J]. Journal of Cleaner Production, 2018(198): 972-978.

[本文引用: 1]

ÇANAKOĞLU E, ADIYEKE E, AĞRALI S.

Modeling of carbon credit prices using regime switching approach

[J]. Journal of Renewable and Sustainable Energy, 2018, 10(3), 035901.

[本文引用: 1]

BYUN S J, CHO H.

Forecasting carbon futures volatility using GARCH models with energy volatilities

[J]. Energy Economics, 2013(40): 207-221.

[本文引用: 1]

DUTTA A.

Modeling and forecasting the volatility of carbon emission market: The role of outliers, time-varying jumps and oil price risk

[J]. Journal of Cleaner Production, 2018, 172, 2773-2781.

[本文引用: 1]

HAN M, DING L, ZHAO X, et al.

Forecasting carbon prices in the Shenzhen market, China: The role of mixed-frequency factors

[J]. Energy, 2019(171): 69-76

[本文引用: 1]

YILDIZ N.

Layered feedforward neural network is relevant to empirical physical formula construction: A theoretical analysis and some simulation results

[J]. Physics Letters A, 2015, 345(1-3), 69-87.

[本文引用: 1]

JIANG L, WU P.

International carbon market price forecasting using an integration model based on SVR

[C]//2015 International Conference on Engineering Management, Engineering Education and Information Technology.

DOI:10.2991/emeeit-15.2015.61      [本文引用: 1]

ZHU B, SHI X, CHEVALLIER J, et al.

An adaptive multiscale ensemble learning paradigm for nonstationary and nonlinear energy price time series forecasting

[J]. Journal of Forecasting, 2016, 35(7), 633-651.

[本文引用: 2]

XU H, WANG M, JIANG S, et al.

Carbon price forecasting with complex network and extreme learning machine

[J]. Physica A: Statistical Mechanics and its Applications, 2020(545), 122830.

[本文引用: 1]

ZHU B, WEI Y.

Carbon price forecasting with a novel hybrid ARIMA and least squares support vector machines methodology

[J]. Omega, 2013, 41(3), 517-524

[本文引用: 1]

LI W, LU C.

The research on setting a unified interval of carbon price benchmark in the national carbon trading market of China

[J]. Applied Energy, 2015, 155, 728-739.

[本文引用: 1]

LU H, MA X, HUANG K, et al.

Carbon trading volume and price forecasting in China using multiple machine learning models

[J]. Journal of Cleaner Production, 2010, 249, 119386.

[本文引用: 1]

COLOMINAS M A, SCHLOTTHAUER G, TORRES M E.

Improved complete ensemble EMD: A suitable tool for biomedical signal processing

[J]. Biomedical Signal Processing and Control, 2014, 14, 19-29.

[本文引用: 1]

HAO Y, TIAN C.

A hybrid framework for carbon trading price forecasting: the role of multiple influence factor

[J]. Journal of Cleaner Production, 2010, 262, 120378.

[本文引用: 1]

/