【摘 要】
:
时间序列数据(Time Series Data)广泛地存在生活中的各个领域,越来越多的数据挖掘研究者关注于时间序列的挖掘方法和技术,而时间序列的分类是时间序列数据挖掘的重要任务之一
论文部分内容阅读
时间序列数据(Time Series Data)广泛地存在生活中的各个领域,越来越多的数据挖掘研究者关注于时间序列的挖掘方法和技术,而时间序列的分类是时间序列数据挖掘的重要任务之一。数据归约用来得到数据集的归约表示,比原始数据量小,但仍然近似地保持原始数据的完整性,在归约后的数据集上进行挖掘将更有效,并产生相同或几乎相同的分析结果。时间序列数据往往具有大数据集的特点,所以数据归约成为预处理中不可或缺的步骤,并且直接影响后期分类的准确率,因此,时间序列的数据归约是现阶段时间序列数据分析的重要研究热点。
针对时间序列数据归约这一研究热点,本论文以一元时间序列数据为主要研究对象,重点研究适用于分类任务的时间序列数据归约方法。本论文完成的工作主要有:
首先,本论文分析了现阶段常用于时间序列分类挖掘的数据归约方法,并归纳为四大类,它们分别是基于基本统计方法的数据归约、基于模型的数据归约、基于变换的数据归约、基于分形维数的数据归约。同时,针对每一类的数据归约方法,进一步研究了与它相适应的分类方法和它在时间序列数据中的应用邻域。其次,将聚类的思想引入到数据归约当中,形成了基于聚类的时间维度归约方法(TDRBC)。该方法的基本思想是对时序数据的时间维度进行聚类,聚类使用K-均值算法,提取聚类后的聚类中心作为新的数据集,因而能有效地减少数据量,数据归约后的数据集可直接利用分类方法进行分类。文中称这一方法为基本的TDRBC。再次,在基本的TDRBC基础上,引入信息熵的思想,改进原有算法,形成了基于聚类的自适应时间维度归约算法,简称为自适应的TDRBC。该算法的基本思想是:在时间序列的时间采样点上计算信息熵,根据熵值的大小初始化聚类中心,然后再利用聚类时间维度归约方法进行数据归约。最后,为了验证本论文提出的两种新方法的可行性,本论文设计了一套仿真实验,采用具有代表性的四组数据分别进行数据归约,归约方法除了上述的两种新方法外,实验采用现阶段常用的LPCC数据归约作为参照方法。归约后的数据将进行分类识别,得出分类准确率。实验表明:本论文提出的两种数据归约方法,不仅能够有效地降低数据量,达到数据归约的目的,同时还能提高分类的准确率,并具有很强的实用性。
其他文献
体操机器人是非线性、非完整、强耦合、多状态、欠驱动系统,以及在稳摆区域属于自然不稳定系统。这类系统能反映出许多控制领域的关键问题。大量国内外的学者投身于体操机器
如今粉体加工技术已是支持高新技术产业的重要基础技术之一。现代工程技术的发展需求许多粒度极细且分布均匀,纯度高而污染低呈粉体状态的原料和制品。与传统的微粉生产方法相
本文概括介绍了支持向量机算法及逆系统方的相关内容,并针对支持向量机参数难以选择的问题,通过分析参数变化对支持向量机学习结果的影响,提出了一种改进的粒子群优化参数的
步行运动是最简单且最经济、最有效的健身方法,其速度及能量消耗是运动强度很重要的参数反映,实时监测步行速度与能耗是健康促进服务系统的重要技术环节。Nike联合Apple推出一
随着电力市场改革,各大发电集团面临着自负盈亏,这导致企业会以追求效益最大化为目标。而发电机组运行的经济性,则是影响企业经济效益的根本问题。在设备的众多指标中,自耗电作为一项不可避免但却能够节约的指标,一直受到人们的广泛关注。随着能源危机的加重和环境的日趋恶化,风电的发展得到了足够的重视,但是对于风力发电机组自耗电的问题国内外大部分风电场仍未进行深入的研究。本文主要以风力发电机组为研究对象,并针对每
运动生物力学信息的获取是运动生物力学研究的重要组成部分,国内外长期的研究实践表明,运动学、动力学等多种运动生物力学信息的有效集成,是复杂运动系统建模和仿真的基本前提。
随着传统化石能源的逐日枯竭,新能源逐步成为人类关注的重点,其中风能作为清洁性和可再生的能源逐步成为新能源研究的重点,由于风能能量密度低、随机性和不稳定等特点,所以对
随着互联网的飞速发展,信息量的爆炸式增长,需要高效的科学计算,以满足快速挖掘有价值信息的需求。在传统的计算机上处理海量的数据需要很长的时间消耗和能量代价,如何快速高
遥感图像目标检测在高科技军事对抗中用以获得及时准确的战场信息、捕捉战略打击目标、提供精确的定性定位信息等。在资源探测、环境监测、城市规划等民用领域,也起着举足轻重的作用。本文主要研究了遥感图像的水域提取和桥梁检测,所做的工作包含如下三方面的内容:(1)提出了一种基于种子点的遥感图像快速河流提取方法。该算法首先根据人工选取的初始种子点确定水域的条件,然后根据初始种子点所处位置不同自动将河流分为两部分
图像去模糊技术是当今图像处理研究领域中不可或缺的技术环节。通过近几年来业内学者孜孜以求的努力,图像复原技术呈井喷式地发展。当然,这其中许多学术成果的实用性还有待提