基于多样化Top-k Shapelets的时间序列分类方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:qrdao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是指将某种现象某一个统计指标在不同时间上的数值按时间先后顺序形成的序列。由于真实系统或现象的内部通常会受到多种因素的影响,从而导致输出的时间序列具有许多复杂的表现:维度高、结构复杂、存在噪声以及存在相似性变形等。传统时间序列分析方法采用统计学方法对时间序列进行建模,但其复杂的特性使得构建的模型很难满足实际系统的要求,因此基于数据挖掘的时间序列研究方法应运而生,使得时间序列挖掘成为一个活跃的研究领域。时间序列分类是时间序列数据挖掘领域的一类重要研究内容,其任务是通过构建分类器为给定的时间序列数据分配一个类标号。作为一种针对局部形态特征的分类方法,shapelets能够区分子序列之间微小的差别,从而获得良好的分类效果,在医疗诊断、姿势识别等多个领域得到应用,但仍然存在亟待解决的问题。本文针对这些问题,所做的主要研究内容如下:(1)针对现有基于shapelets的分类方法中最优shapelets集合存在冗余的问题,提出了一种基于多样化top-k shapelets转换的时间序列分类方法(Div Top KShapelet)。本文引入数据检索领域的多样化top-k查询方法,提出了多样化top-k shapelets的概念及相对应的多样化top-k shapelets图,对候选的shapelets进行处理,从中选出最具有辨别能力且彼此不相似的shapelets,同时,使用SAX技术对原始的时间序列数据集进行降维。实验结果表明:该方法不仅比传统分类方法具有更高的准确率,而且与使用聚类筛选的方法(Cluster Shapelet)和shapelets覆盖的方法(Shapelet Selection)相比,分类准确率最多提高了48.43%和32.61%;同时在所有15个数据集上均有计算效率的提升,最少加速了1.09倍,最高可达到287.8倍。(2)针对现有shapelets分类方法不能解决不平衡时间序列分类的问题,提出了基于多样化top-k shapelets转换的时间序列分类方法(Div IMShapelet+SMOTE)。将不平衡数据分类评价指标AUC,代替传统的信息熵作为衡量shapelets的标准,并利用多样化top-k shapelets对训练集进行转换,最后使用SMOTE方法对转换后的训练集进行过采样。该方法利用AUC值对不平衡数据不敏感的特性,使shapelets特征更能准确评估分类的准确性,不仅可以有效提取时间序列特征,而且在特征的基础上进行数据集的平衡处理。实验表明:与Div Top KShapelet和INOS+SVM方法相比,Div IMShapelet+SMOTE的效果最好,分类准确率最多提高了38.8%和10.2%,AUC最多提高了0.37和0.08,F-measure最多提高了0.35和0.15,能够有效处理不平衡时间序列数据分类问题。
其他文献
随着虚拟现实与计算机技术的不断发展,虚拟手术在医疗卫生领域发挥的作用越来越大,不仅可用于手术技能培训,还可用于手术规划、手术预演、手术导航等。在虚拟手术中,软组织形
随着计算机网络的普及,企业信息化程度不断提高,人们对信息化服务的要求越来越高。在这个信息膨胀的时代,各种电子文本数据急剧增加,占据了网络资源的大部分空间,对于这些文本数据
随着信息科技的快速发展,很多应用领域产生了大量的现实数据。如网络安全、股票分析、电子商务、气象监控等领域。在这些数据中可能隐含着丰富的、有价值的、亟待挖掘的信息,
Web2.0的迅速普及带给人们丰富信息的同时,也使人们对信息的把握能力大大下降,庞大的信息量已经超出了人们预期的设想。传统的信息检索系统已经不能满足用户需求,通用搜索引
P2P视频点播是目前网络应用研究的热点,而数据请求任务调度是P2P视频点播系统设计时需要考虑的关键问题。绝大多数现有的数据调度策略都是从请求节点端出发来进行设计。在这
在我国信息社会高速发展的今天,传统的选举计票方式已经远远不能够满足社会的需求。以往的计票方式,如基于人工唱票的方式、基于电子选举方式和基于机器识别和智能票箱的方式
随着经济的发展,智能交通系统(Intelligent Transportation System,ITS)已成为解决现代道路交通问题的一个重要手段。车载导航系统是ITS的重要组成部分。车载导航系统是由计
随着网络和多媒体技术的不断发展,网络可视电话(VoIP)技术已经在Internet中得到广泛的应用。如何设计一款软硬件简单、稳定性好、音画质高以及价格适中的VoIP终端将具有很好
WSN中传感器节点能量、存储处理和传输能力的限制使得传统的路由协议不适合无线传感器网络,同时与平面路由协议相比,分簇路由协议具有更好的健壮性和可扩展性,适用于大规模WS
工作流模型可以清晰的描述业务流程,而且随着信息技术的进步,其应用范围也越来越广,对工作流模型的科学评价也越来越成为必要。然而,传统工作流管理系统通常只是严格按照工作