面向不确定时间序列的分类方法

被引量 : 0次 | 上传用户:woshizhaozhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,经济的进步,人们获得数据的途径越来越多,数据量的增长已经达到了前所未有的速度。人们将此称为“大数据”时代的到来。另一方面,随着数据处理技术的发展,人们对数据的不确定性的认识也更加的深入。例如,在医疗,环境监测,经济等领域,数据的不确定性普遍存在。不确定数据背后隐藏的丰富的信息使得不确定数据的管理和挖掘成为数据库的热点研究问题之一。不确定数据中记录值的取值是不确定的,同传统的确定性数据相比,数据的描述、建模和存储更加复杂。这使得对于不确定数据的管理和挖掘面临着更大的挑战。时间序列是一种重要的数据类型,其在经济金融分析、物理、天文、医学和语音处理等诸多领域有着广泛的应用。在传统的确定性数据领域,关于时间序列的管理和挖掘已经有了很多很好的方法。例如,在时间序列建模方面,主要的方法有:1)基于时间域连续表示的逐段线性近似、逐段回归近似等;2)基于变换的表示的离散傅立叶变换、离散小波变换等。关于传统的时间序列的相似性主要有:Minkowski距离、编辑距离和DTW距离等。但是这些方法并不能直接的应用于不确定时间序列。因此,需要对传统的时间序列的管理和挖掘方法进行改进或者提出新的适用于不确定时间序列的方法。本文针对不确定时间序列的相似性和分类问题进行了研究,采用两个不确定数据的距离函数所构成的随机变量的期望来作为这两个不确定数据的距离度量,称该距离度量为期望距离。期望距离能够简化不确定时间序列的建模,降低不确定时间序列的存储代价。根据传统时间序列的Minkowski距离的DTW距离的思想提出了不确定时间序列的基于期望距离的Minkowski距离和DTW距离,并利用它们进行不确定时间序列的分类。针对不确定时间序列DTW距离的计算代价较高,结合期望距离的特性和传统时间序列DTW距离的下界函数的思想,提出了四种面向不确定时间序列DTW距离的下界函数,从而提高了采用DTW距离来进行不确定时间序列分类时的执行效率。最后,实验结果显示本文提出的不确定时间序列的分类方法有着较高的分类正确性,不确定时间序列DTW距离的下界函数在分类中有着很好的剪枝效果。
其他文献
随着互联网与移动网络的高速发展,网络购物成为越来越多人的消费方式。在网络营销中图片更因其生动、形象的特点而被广泛使用。各家网络商店都将图片使用作为重要的营销手段,
近年来,随着我国公路条件的不断改善和国民经济快速发展,作为高速公路客运主力运输装备的大客车产销量迅速增长。由于大客车载员多,运距长,油耗大,其安全性和能耗问题日益受
<正> 人参与人胖,不是兄弟两,人参一遇人胖,总是令他瘦!瘦!瘦!所以人胖与人参很难合得来。其实,人参是一片好心肠,因为,人要是太胖了,不仅影响健康美姿,行动不便,有碍长寿,还
新产品开发流程是JC公司的核心流程,流程的好坏对新产品开发的设计质量、设计成本和设计周期都有很重要的影响,所以对该流程进行优化非常必要。从国内外的企业流程再造项目实
香港“屯门市广场”工程,包括商场、停车场和五座32层住宅塔楼,建造在四条并行高速公路两侧并横跨公路上空,总建筑面积16.67万m~2,工期只有15个月。本文着重介绍该工程在确保
以美国文学为主的北美文学在20世纪已经具有了世界性的价值和意义,因此北美文学成为1980年以来我国译介和出版的重点。本文回顾了1980年以来我国北美文学翻译和出版经历的三
随着我国经济全球化趋势的深入发展和我国区域经济合作与交流向更深、更广层次发展,航空物流已经成为我国物流运输发展的新增长点,航空物流建设与发展已经成为推动区域经济、发
海洋工程项目近几年在我国发展很快,各家主要船舶建造公司都把海洋工程项目作为本公司新的经济增长点。海洋工程项目管理现在主要采用项目管理模式运作,通过多年在海洋工程管
施工现场材料取样和检验的真实性和代表性直接影响检测数据和结果判定的客观性和准确性。文章论述了材料取样和检验的数理统计学原理,据此及有关标准对施工现场几种主要材料检