论文部分内容阅读
摘 要:文章借助2011-2014年云南省居民消费价格指数月度数据,采用非参数的斯波曼秩相关检验统计量,用区组Bootstrap方法估计其趋势分析的显著性水平,对云南省居民消费价格指数的趋势做出分析和预测。通过该方法可以消除数据间的自相关性的干扰,同时文章利用R软件计算和求解显著性水平具有更加简单、方便的特点。
关键词:区组Bootstrap方法;居民消费价格指数;趋势分析;R软件
居民消费价格指数,简称CPI,它是一种随着时间变动的相对数,用于衡量居民生活消费品与服务价格水平,能综合反映出居民购买生活消费品与服务价格水平的变动情况。及时了解国家或某个地区的通货膨胀情况对于其经济的发展有着重要的意义。
一、区组Bootstrap 方法
在大多数条件下,统计数据具有一定的相依结构,但并不能满足独立同分布的需要,如果继续使用独立同分布的Bootstrap,很可能导致失败。文中,对云南省居民消费价格指数进行的趋势分析问题是采用带有相依结构数据的Bootstrap方法中的一种即:不交叠区组Bootstrap法,详细的流程有以下几点:首先将n个数据点按照顺序拆分为N个区组,每个区组长度为l,拆分好数据之后,重抽样的对象就变成了这N个区组。
(一)数据区组长度的选取
对于区组Bootstrap法算法来说,最重要的是数据区组长度的选取。研究表明,数据块长度的选取是有规律的,并证明了取块长度为,为样本个数,。
在合理的假设条件下,统计量具有相依结构的样本构造,对统计量来说,其均方误差和样本观察值成比例,而比例的常数项还没有确定下来。但在大多数条件下,并不需要对比例常数进行确定,那么就可以用以下算法略过估计比例常数:
(1)给定(数据块长度)的初始值,通过数值模拟得出统计量的估计值。
(2)取满足,的、,对个可重叠的不同样本, ,分别计算,进一步得到样本容量为、数据块为的的均方误差估计:
(3)固定,对不同的,重复以上过程,找出使最小化的,进一步得到样本容量为的样本最优化块长
以上算法不需要对比例常数进行估计,可以通过以为初始值的迭代过程来验证存在的充分性。
二、趋势分析的理论研究
通常可采用线性分解模型来描述时间序列:
,t=1,2,…,n
式中:为时段的时间序列;为趋势分量;为季节分量;为循环变动分量;为不规则变动分量。
(一)趋势分析
趋势分析研究的是时间序列顺序递增或递减的变化规律。文章采用常用的非参数方法:斯波曼秩相关检验法。其统计量可描述为:
其中表示数据在时间序列中的排序,由于不存在趋势的序列统计值D服从正态分布,则可定义斯波曼检验统计量,其服从标准正态分布。
(二)用Bootstrap方法估计显著性水平
用Bootstrap方法估计显著性水平的原理:假设时间序列, 对于能描述序列趋势的统计量,如果改变序列中的数据的位置,将不会发生明显变化。该方法为:
(1)选择合适的统计量(如斯波曼检验统计量),计算原 的统计值。
(2)对原序列再抽样N次,分别计算第i次抽样序列的统计量,对其进行排序:
(1)
如果介于和之间, 即:
(2)
则可采用经验频率估计分位数: (3)
如果统计量是一绝对值形式, 则为单侧假设检验,相应的显著性水平;否则为双侧假设检验,显著性水平可估计为:
(三)居民消费价格指数趋势分析
借助2011-2014年云南省居民消费价格指数月度数据,采用非参数斯波曼秩相关检验统计量,用区组Bootstrap方法估计其趋势分析的显著性水平,从而对居民消费价格指数趋势做出分析与预测。见表1
利用R软件得到云南省居民消费价格指数基本走势如下:
参考文献:
[1]Rao CR. Linear statistics inference and its applications. (2nd Edit)New York, John Wiley & sons.Inc.1973
[2]Efron B & TibshiraniRJ. An Introdution to the bootstrap. New York: Chapman & Hall, 1993
[3]刘攀,郭生练,肖义等.水文时间序列趋势和跳跃分析的再抽样方法研究[J].水文,2007,27 (2):49-531
[4]薛毅,陈立萍.R统计建模与R软件[M].北京:清华大学出版社,2006:207-273.
关键词:区组Bootstrap方法;居民消费价格指数;趋势分析;R软件
居民消费价格指数,简称CPI,它是一种随着时间变动的相对数,用于衡量居民生活消费品与服务价格水平,能综合反映出居民购买生活消费品与服务价格水平的变动情况。及时了解国家或某个地区的通货膨胀情况对于其经济的发展有着重要的意义。
一、区组Bootstrap 方法
在大多数条件下,统计数据具有一定的相依结构,但并不能满足独立同分布的需要,如果继续使用独立同分布的Bootstrap,很可能导致失败。文中,对云南省居民消费价格指数进行的趋势分析问题是采用带有相依结构数据的Bootstrap方法中的一种即:不交叠区组Bootstrap法,详细的流程有以下几点:首先将n个数据点按照顺序拆分为N个区组,每个区组长度为l,拆分好数据之后,重抽样的对象就变成了这N个区组。
(一)数据区组长度的选取
对于区组Bootstrap法算法来说,最重要的是数据区组长度的选取。研究表明,数据块长度的选取是有规律的,并证明了取块长度为,为样本个数,。
在合理的假设条件下,统计量具有相依结构的样本构造,对统计量来说,其均方误差和样本观察值成比例,而比例的常数项还没有确定下来。但在大多数条件下,并不需要对比例常数进行确定,那么就可以用以下算法略过估计比例常数:
(1)给定(数据块长度)的初始值,通过数值模拟得出统计量的估计值。
(2)取满足,的、,对个可重叠的不同样本, ,分别计算,进一步得到样本容量为、数据块为的的均方误差估计:
(3)固定,对不同的,重复以上过程,找出使最小化的,进一步得到样本容量为的样本最优化块长
以上算法不需要对比例常数进行估计,可以通过以为初始值的迭代过程来验证存在的充分性。
二、趋势分析的理论研究
通常可采用线性分解模型来描述时间序列:
,t=1,2,…,n
式中:为时段的时间序列;为趋势分量;为季节分量;为循环变动分量;为不规则变动分量。
(一)趋势分析
趋势分析研究的是时间序列顺序递增或递减的变化规律。文章采用常用的非参数方法:斯波曼秩相关检验法。其统计量可描述为:
其中表示数据在时间序列中的排序,由于不存在趋势的序列统计值D服从正态分布,则可定义斯波曼检验统计量,其服从标准正态分布。
(二)用Bootstrap方法估计显著性水平
用Bootstrap方法估计显著性水平的原理:假设时间序列, 对于能描述序列趋势的统计量,如果改变序列中的数据的位置,将不会发生明显变化。该方法为:
(1)选择合适的统计量(如斯波曼检验统计量),计算原 的统计值。
(2)对原序列再抽样N次,分别计算第i次抽样序列的统计量,对其进行排序:
(1)
如果介于和之间, 即:
(2)
则可采用经验频率估计分位数: (3)
如果统计量是一绝对值形式, 则为单侧假设检验,相应的显著性水平;否则为双侧假设检验,显著性水平可估计为:
(三)居民消费价格指数趋势分析
借助2011-2014年云南省居民消费价格指数月度数据,采用非参数斯波曼秩相关检验统计量,用区组Bootstrap方法估计其趋势分析的显著性水平,从而对居民消费价格指数趋势做出分析与预测。见表1
利用R软件得到云南省居民消费价格指数基本走势如下:
参考文献:
[1]Rao CR. Linear statistics inference and its applications. (2nd Edit)New York, John Wiley & sons.Inc.1973
[2]Efron B & TibshiraniRJ. An Introdution to the bootstrap. New York: Chapman & Hall, 1993
[3]刘攀,郭生练,肖义等.水文时间序列趋势和跳跃分析的再抽样方法研究[J].水文,2007,27 (2):49-531
[4]薛毅,陈立萍.R统计建模与R软件[M].北京:清华大学出版社,2006:207-273.