时间序列数据特征提取与分类器集成方法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:iiiii119119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据广泛地存在于生产生活的各个方面,其反映了事物不易直接观察的内部状态。与传统分类有所不同,时间序列分类过程中各个属性之间都是有次序关系的,因此时间序列分类问题具有挑战性。在时间序列分类过程中,如何高效地对时间序列数据进行特征提取并根据数据特征建立相应的分类器从而提高分类的准确率成为时间序列分类领域的关键问题。  本文首先对于时间序列的分类算法研究现状进行了总结,接着分析了现有时间序列的特征提取与分类算法存在问题。在目前的算法中,基于实例的学习方法存在速度较慢,不适合对海量的数据处理的问题;而基于模型的时间序列分类算法一般需要数据的先验知识;同时时间序列的集成算法时间与空间复杂度较高,这样就限制了其使用环境。针对以上问题,本文从时间序列特征提取与时间序列分类两个大方面展开了研究,主要工作包括:  (1)提出了一种基于特征点检测的时间序列特征提取算法,将时间序列从原始的高维空间转换到低维的特征空间,且在转换过程中保持了数据的特征。该算法将图像领域的局部特征算法应用到时间序列数据中,以提取时间序列数据中的特征点,利用提取的特征点周围的关键子序列生成局部特征向量集合,并对特征向量加权、筛选,最终实现了特征提取和数据降维。与传统的算法相比,本文提出的特征点检测算法时间复杂度是线性的,并支持增量更新,方便应用于大规模数据集,并且提取到的特征都具有辨别性,算法各个过程都可由人工灵活控制。实验中将该特征提取算法与分类算法相结合,结果表明该算法能够提高分类算法的准确率。  (2)设计了基于尺度空间的时间序列集成分类算法,该算法结合尺度空间理论丰富了训练分类器所使用的训练集,使得训练数据集不仅包含原始信息,还包含了变化趋势等信息;在结构上,该集成算法分为多个层级,分类器按一定顺序逐层训练,在训练多层分类器过程中不断的拓展训练数据集的特征空间,来实现特征信息逐级传递,最终层级的分类器输出最终的分类结果。与传统集成算法相比,本算法各层级之间不再独立,并且可以灵活地更换基分类器种类,也能通过限制层级数来控制算法时间与空间复杂度,拓宽了使用环境。在实验中,该集成算法与本文提出的特征提取算法结合使得分类器准确率得到提高。
其他文献
近几年,随着国内互联网技术的迅猛发展,几大电商如淘宝、京东等,正悄然改变着大众的生活方式;同时,随着微博等社交网站的崛起,国内互联网用户越来越多的在网络上发布自己的主观观点
计算机技术的快速发展使得有限元分析在机械设计与研宄中得到了广泛的应用。在机床设计与制造领域,运用计算机动力学仿真与CAE技术可以在机床开发试制之前对其零部件的工作情
云计算给社会带来了许多变化,社会生活被不断地数字化。如何处理海量的数据成为了一个令人关注的话题。Hadoop是一个分布式计算软件框架,其包含分布式存储和MapReduce计算,能
强化学习是一类无需先验知识的机器学习方法,以Agent与环境不断的交互为主要特征,以寻找能带来最大期望累积折扣奖赏的策略为目标。强化学习中环境可能具有大状态空间甚至连续
高维多目标优化问题是现实社会中普遍存在的一种实际优化问题。相对于普通两到三个目标的多目标优化问题,高维多目标优化问题的最明显特征是目标个数较多,一般大于三个。而且,随
学术影响力评估是指针对文献、学者、期刊和科研机构等评估对象,评估其在学术领域的影响。学术影响力评估可以分类为以下四类问题:(1)文献价值评估问题及预测问题;(2)作者影响
基因转录调控是整个基因表达调控体系的一个重要方面,是基因遗传信息传递和表达的枢纽,也是基因表达调控机制发挥作用的重要环节。识别转录因子结合位点是理解基因转录调控机
学位
异构无线网络融合是未来网络的一个重要发展趋势。在异构无线网络环境下,用户可以充分利用不同无线网络的技术优势,获得"Always Best Connection, ABC"。但是这些不同类型无
双层规划是一类具有两层递阶结构的系统优化问题,在数学规划领域得到蓬勃发展,成为运筹学一个分支,目前已成功应用于诸多领域中,如经济学、管理学、金融学、工程应用等。同时