论文部分内容阅读
原油在世界经济及国家安全中扮演着重要的角色,其价格的分析及预测问题一直是一个经久不衰的话题。本文主要运用统计理论及方法,并结合了自然科学成果(神经网络和遗传算法),对以WTI(美国西德克萨斯轻质原油)为代表的国际原油价格的波动特征进行分析,并充分结合历史现货和期货价格对其的影响,以建立比较精确的合理的预测模型。文章首先阐述了选题背景,对国内外的相关研究做了介绍和评述,并阐述了结合期货价格进行油价预测的必要性。然后运用协整检验并建立误差修正模型(ECM)来验证原油现货价格与期货价格之间是否存在引导关系:结论表明,二者之间存在着相互引导的关系,误差修正项系数都显著地小于0,说明当系统偏离均衡状态时,下一期现货价格及期货价格的调整对修复非均衡状态都有直接的影响,且调整作用都是负向的;另一方面,现货价格较期货价格的调整系数的绝对值大,说明现货价格回复到均衡状态的速度相对较快。具体地,当短期波动偏离长期均衡时,现货价格将以(-0.68)的调整力度将非均衡状态拉回到均衡状态,而期货价格将以(-0.151)的调整力度回复到均衡状态。进一步地,运用Hasbrouck(1995)提出的信息份额模型来探求原油期货市场与现货市场在原油价格发现功能中各自的作用大小。我们得出的结论是现货市场和期货市场在价格发现中扮演的角色基本相同(都接近50%)。很多学者如王群勇,张晓峒(2005)等利用月度的时间序列数据,得出的结论是期货市场对价格发现的贡献程度为54.27%,相应地,现货市场为45.73%,即期货市场对价格发现的贡献要大一些。之所以出现这样的差异,就是由于我们采用的高频数据,两个时间序列的日数据差异比月数据的差异要更小。我们最终的目的是进行原油价格的预测,然而不同特征的时间序列用到的预测方法不同。因此在进行预测之前,很有必要分析原油现货价格时间序列的特征,即长记忆性还是短记忆性,在此部分分别运用了参数方法(GARCH类模型)和非参数方法(R/S分析法)。两者都能反映时间序列的非线性波动,但时间序列若为长记忆性,R/S分析法能确定记忆长度为多少,以便于为接下来的预测作准备,只有在记忆长度之内,所作出的预测才是比较精确的。之前的研究,在对原油价格时间序列建立各种GARCH模型时,一般默认模型的残差服从正态分布,很多研究也是基于正态分布建立GARCH类模型,通过分析,我们得出的结论认为,不管是原油现货价格时间序列,还是其收益率序列,都存在波动集群现象,且后者存在ARCH效应,这样会导致收益率序列不再服从正态分布。为了更加准确地描述GARCH模型中残差的分布特征,我们利用Nelson提出的广义误差分布(GED)对各种GARCH模型的残差项建模。GARCH类模型检验结果表明,原油现货价格收益率序列存在波动集群现象,各类GARCH模型显著性都不错,说明油价的涨跌信息对未来油价的波动影响是非对称的,即油价的波动存在明显的不对称现象。R/S分析得出现货价格时间序列的记忆长度T_s=19天,期货价格时间序列的记忆长度耳=14,这为接下来运用遗传算法及神经网络预测油价提供了比较精确的基础。接下来,进行原油现货价格的预测——神经网络和遗传算法相结合的预测模型(GA-BP模型),并与简单预测模型和误差修正模型所作出的预测进行比较,所采用的预测效果评价指标为均方根误差(RMSE,也叫标准误差)和百分比平均相对误差(MAPE)。均得到了在2%误差范围内的预测效果。进一步进行了样本外预测,认为GA-BP模型的预测效果最理想,并且对于原油价格只能进行短期预测。最后,提出了原油价格预测中所存在的问题,并对全文进行了总结,对我国建立原油期货市场提出了几点建议。