数据挖掘中金融时间序列的粗糙聚类分析

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zdf657094142
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统统计分析与现代金融计量经济方法研究时间序列的主要思路是建立基于严格数学推导下的统计模型并对其进行参数估计与数据检验,目前已建立起一套较为成熟的理论体系。但该方法既依赖于苛刻的假设条件,又要求所有数据都符合一个固定的数学模型,显得过于牵强。数据挖掘研究时间序列的思路则不同,它由数据直接驱动建立模型,克服了上述的缺陷。时间序列数据挖掘已是当前的研究热点之一,人们也取得不少的研究成果,但对于时间序列相似性度量这一关键难题一直未能得到较好的解决,而很多时序挖掘方法都是建立在相似性的基础上,显然时间序列相似性度量直接影响着这些时序挖掘方法的结果,为此本文首先就该关键的基础性问题展开研究,进一步讨论了该度量方法在序列挖掘中的应用。由于数据挖掘方法众多,本文不可能一一涉及,所以只针对聚类分析进行深入的探讨。聚类分析不仅是数据挖掘的重要组成部分,同时也是多元统计分析的重要方法,在实际中有广泛的运用。本文绕开了已有较多成熟方法的硬聚类,而深入地研究了一种软聚类——粗糙聚类的方法及其在时间序列挖掘中的应用,同时从侧面反映了本文度量序列相似性方法的实用性。全文的主要工作及创新可归纳为以下几点。首先,结合小波分析的思想方法,提出一种基于小波多尺度变换的时间序列相似性度量方法,并通过金融时间序列的实例研究,说明该方法全面考虑了影响序列相似性度量的各种因素,很好地克服了已往方法无法兼顾序列整体形状轮廓与细节差异的缺陷。其次,在相似性度量方法的基础上,研究了序列粗糙聚类方法,通过金融实证研究表明粗糙聚类方法的优点。并深入研究了以下三个问题:(1)建立粗糙聚类质量指标,并研究不同阈值参数对聚类结果的影响;(2)将粗糙聚类法与层次聚类法进行整合,各取所长;(3)将软聚类转化为硬聚类,通过迭代剔除法对粗糙聚类结果精简化,并与之前聚类结果进行比较,说明其可行性。最后,本文模型方法尚无现成的软件模块实现,故本文还给出Matlab软件上具体实现的参考程序,结合实证研究取得较好的效果。
其他文献
目的:结节病是一种原因不明的累及多器官、多系统的肉芽肿性疾病。发病率低,起病隐匿,临床诊断相对困难,病理主要表现为非干酪样坏死肉芽肿。90%以上的结节病有胸部的累及,而20%的
本文着重探讨了双时滞生态流行病SIS模型稳定性和Hopf分支的性质。首先,由于考虑到食饵具有生长期且染病的捕食者可以恢复健康但却不具有对该疾病的免疫性,因此本文在Jia-Fan
经济全球化以及新兴经济体的出现加剧了世界经济发展的复杂性,企业为应对错综复杂的经济环境需要通过"财务转型"来实现持续发展。本文对当前电信运营企业进行财务转型的必要
静电六极杆技术由上世纪60年代开始在实际科研中取得应用。利用极性分子在非均匀电场中的Stark效应,静电六极杆装置可以对分子束中布居在某一转动态的分子进行聚焦从而实现转
[目的]观察亚低温条件下离体大鼠肝细胞悬浮培养后的完整性和功能,为将来生物人工肝临床应用时培育生产足量功能完好的肝细胞作参考。[方法]离体肝细胞悬浮于添加有葡萄糖和
目的:探讨重型肝炎肝移植患者围术期凝血功能变化的观察及护理。方法:选择接受改良背驮式肝移植手术的重型肝炎患者55例,分别于术前、手术1h、无肝10min、新肝5min、新肝期3h
东昆仑东段早古生代埃达克质花岗岩类的成因主要有两种不同的观点:俯冲洋壳熔融、加厚下地壳部分熔融。本文通过对智玉地区花岗闪长岩基开展详细的野外地质观察,发现局部出露的含暗色微粒包体的闪长岩呈反向脉侵入花岗闪长岩中。电子探针分析数据显示,花岗闪长岩、闪长岩和暗色微粒包体中的角闪石主要为镁角闪石,显示壳幔混源特征;花岗闪长岩中黑云母为铁质黑云母-镁质黑云母,显示了壳幔混源-壳源的特征。花岗闪长岩中斜长石
目的:研究放射性核素标记NGR的生物活性,通过体外筛选确定CD13表达阳性细胞株,建立肿瘤动物研究模型,探索核素标记NGR对肿瘤显像的可行性,比较NGR单体与二聚体的体内生物学分布及
目的:探讨螺旋CT后处理技术对中耳正常结构及各种病变显示能力和诊断作用,为临床术前制定手术方案和术后疗效评估提供客观依据。 方法:选取正常中耳11例22耳、慢性中耳炎31例
经历了改革开放40年的经济高速发展,我们创造了所谓中国式的奇迹,随着物质文明的提升,精神文明的建设要求也越来越紧迫,文化的问题日益凸显:传统价值观解体带来了传统道德伦