圆数据的相关分析与回归建模

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:ZWDragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
圆数据即可以表示在圆周上的数据,一般指角度数据以及可以转化为角度的数据如时刻等。这类数据在经济学、金融学、生态学、环境学以及社会学等领域的理论研究和实际应用中广泛存在,是一个重要的数据类型。  与直线数据不同,这类数据有着其自身独特的分布规律与统计结构。圆数据表示在单位圆周上,取值范围有限,而且具有循环性,这给统计建模带来了极大的困难。文献中的处理方法通常以三角函数作为连接函数将圆数据映射到直线上再利用通常的统计模型进行分析。但是我们注意到单位圆周是欧氏空间外最常见的流形,它与直线的拓扑结构完全不同,二者之间不存在任何连续的一一映射。究其实质,三角函数仅仅是直线上的非线性变换,它无法保证变换后的圆数据仍然具有循环性。所以圆数据的问题应该回到圆周上去分析,充分考虑其分布范围有限以及取值循环两个特征。  直线数据的统计研究目前取得了很多成果,其理论体系已经比较完善。然而,相比之下,圆数据的统计理论还有很多有待建立和完善的地方,包括相关和回归这样的基本的统计理论方法也存在一些尚未解决的问题。本文立足圆数据特别的拓扑结构,针对已有方法的不足,提出了新的圆数据相关性度量方法和回归建模框架,主要贡献如下:  一、基于圆周上的顺序提出了圆数据的秩相关系数。与直线数据不同,圆数据的顺序不能简单地由数值大小来确定,本文深入考察圆数据顺时针旋转和逆时针旋转的规律,定义了一个顺序函数。该顺序函数充分考虑了圆数据循环性特征,而且恰好它取值为正对应顺时针旋转,为负对应逆时针旋转,由此可以方便地定义圆环面上的一致性,进而将直线上的佋佥佮佤佡佬佬τ推广到圆环面上。本文证明了该秩相关系数具有良好的性质,并且与直线数据有相同的佃佯佰併佬佡计算形式。  二、在顺序函数基础上定义了圆数据的矩相关系数。圆数据最常用的相关系数是通过正弦函数变换构建的乘积矩相关系数,但正弦函数非单调的性质会将不同的圆数据映射为相同的数值,这样会使得变换后圆数据不可识别,进而会带来该相关系数理论和应用中的一些问题。本文利用顺序函数构建了圆数据乘积矩相关系数,由于文中提出的顺序函数充分考虑了圆数据的循环性特征,该相关系数克服了正弦函数带来的不可识别的问题,并且具有良好的理论性质。  三、提出了圆变量对圆变量的复数回归模型。结合圆数据特征,考虑到圆数据与起点在原点的单位向量一一对应,而这样的单位向量又与单位复数一一对应。圆数据的变化可以看成其在圆周上的旋转,而这又和复数乘法的几何意义相一致,所以在复数框架下对圆数据建模是合理可行的。本文推广了圆环线性关系,然后在此基础上提出了线性复数回归模型,对非线性关系,提出了反正切复数回归模型。由于复数回归模型直接建立在单位圆周上,避免了连接函数变换过程中圆数据循环特征的损失,而且结构简单,可以方便地推广到多元模型。  本文还利用提出的圆数据相关系数以及圆变量对圆变量的复数回归模型对环境和经济领域的实际数据进行了应用和分析。一是用来自泛太平洋水文监测系统的一个风向数据将本文提出的相关系数和已有的相关系数进行了对比,计算结果表明本文提出的相关系数更加稳定合理地展示数据的相关性。二是利用本文提出来的圆数据相关系数和复数回归模型对股票交易的高频数据进行了联动性和峰值时刻规律性的探索性分析。三是用本文提出的复数回归模型对来自中国气象局的一个风向数据预测,结果表明,线性复数回归模型的参数具有更好的解释性,对风向数据的预测效果比较稳定,误差较小。
其他文献
班级是学校开展教育教学工作的基本单位,班主任则是班级的组织者和领导者。在大力倡导素质教育、实行新标准的今天,期盼有人格魅力的班主任。那么,班主任怎样在工作中释放自
期刊
电梯系统中的电梯制动器是保障电梯有效运行的重要部分,其中的电气控制在我国《电梯制造与安装安全规范》中有十分明确性的规定,通过制度的分析为电梯制动的安全性运行提供了