基于拟合误差和时刻差异的时间序列表示与鉴定方法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wzhi8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代带来了海量的数据,其中很大一部分数据以时间序列的形式呈现。这些数据具有维度高,属性多的特点,不仅占用计算机大量的存储空间还需要耗费计算机较长时间来处理。因此需要对原时间序列重新表示以达到简化时间序列的表示的目的。在这些时间序列数据的分类任务中,有些同类时间序列间相似度较小并且有些不同类时间序列间相似度较大。这是因为原时间序列的表示方法未能突出同类时间序列的相似之处以及不同类时间序列的不同之处,这就需要对时间序列进行重新表示。另外,在时间序列数据挖掘任务中,判断一条时间序列是否属于某一类这一任务是时间序列数据挖掘任务中重要的任务之一。很多解决这一问题的算法是基于动态时间规划距离的。然而经典的动态时间规划算法没有考虑两条序列的每一条匹配路径上每一对匹配点分别在两序列对应的位置(即时刻)的相似度。针对以上两个问题,本文分别提出了一种时间序列表示方法和一种时间序列分类方法,主要工作如下:(1)本文提出了一种新的时间序列分段常数近似方法,它是基于用一段常数序列代替时间序列段的拟合误差划分时间序列段的,它从第一个时间序列分段开始使用贪心策略不断扩大各分段的长度直到分段的拟合误差超出某一阈值,从而达到简化时间序列的表示的目的。除此之外,本文还对所有基于这种表示所得到的序列的所有元素进行聚类,根据这些聚类中每一聚类与某个时间序列类属性的相关性选出训练集中与这个时间序列类较相关的聚类作为训练集中这类时间序列的表示,从而突出同类时间序列的相似性。(2)本文改进了动态时间规划算法,在最优匹配路径的选取上不仅考虑每条匹配路径中每对匹配点之间的距离,还关注每对匹配点在时间序列中对应的位置(时刻)之间的相似度。本文所提出的算法在一些手写签名数据集和时间序列分类的数据集上的运行结果表明本文所提出的算法能够有效地提升时间序列分类的准确率。
其他文献
目的分析及评价在牙周炎患者正畸过程中采用牙周序列治疗的应用价值。方法选择2015年9月~2017年6月本院所收治的70例牙周炎患者,参考治疗方式的不同分组,对照组35例患者予以
寝室一哥们儿有夜游症。  有一天晚上,我失眠了。  我看见他从上铺慢慢起身下来,用  手拍我脑袋,我很清醒,但没有做声。  他见我没反应,又去另外几个床拍。  大家都知道梦游中途不能叫醒,  就都没有做声。  第二天早上,我们问他:“昨天  你梦到什么了。”  他说:“梦到了一地的大西瓜,  用手拍了,可惜都没熟!不然,我就  打开来吃了。”  从此我们没一人住校。
目的探讨'品管圈'在临床护理静脉用药中的意义和效果评价。方法对2016年科室内临床护理静脉用药情况进行统计,并成立品管圈,将'品管圈'对于降低静脉用药核查
  在文物保护越来越受重视的今天,考古工作也进行得如火如荼,一批批重大的文物群被发现、发掘。然而发掘后的文物如何保护、如何展示,其周边环境如何梳理,成了迫在眉睫的问题。
目的:调查吉林大学第一医院2014年儿科住院患儿临床医嘱超药品说明书用药情况,为促进儿童安全合理用药提供依据。方法:调取吉林大学第一医院6个儿科科室,在2014年1月1日-2014
本论文主要从射线的波动性出发,对个人辐射剂量仪的测量范围进行了讨论。论述了个人辐射剂量仪的测量结果的可靠性。
电机作为工业时代应用最广泛的(配套)产品,是影响配套产品质量的重要因素之一。作为电机构造中的主要零部件,它的质量更直接影响电机质量。长期以来,转子铁心在加工生产过程
协作抑制是指当人们在一个记忆小组中一起提取信息的时候,小组提取的信息总量比等量个体提取的信息总量要少。心理学研究者致力于从认知角度对该现象进行解释。到目前为止,大