时间序列异常检测算法的研究与应用

来源 :电子科技大学 | 被引量 : 12次 | 上传用户:a2422431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是指按时间顺序排列的、随时间变化且相互关联的数据序列,在各个领域都广泛存在。异常检测在不同的研究领域和应用领域一直都是一个重要问题。所以随着互联网的发展和人工智能的兴起,时间序列的异常检测也逐渐吸引力国内外学者的研究热潮。时间序列的异常检测一般分为点异常和模式异常。如果一个单独的数据实例可以被看作是与其他数据相关的异常,那么这个实例就称为一个点异常。这是最简单的异常类型,也是大多数关于异常检测的研究的焦点。有时候时间序列更关注发生在一段时间内的过程是否为异常,那么这就称为模式异常。本文研究和关注的则是模式异常的问题。本文对时间序列的序列异常进行了深入的探讨和研究,主要围绕时间序列表示方法和异常检测算法进行相关研究,本文的研究内容如下。1)提出时间序列的多维符号化表示mSAX方法。该方法首先使用固定的长度把时间序列划分为不可分割的子序列片段;然后根据子序列片段的特征描述将其转化特征向量;再使用离散化方法对各子序列特征向量的各个维度进行符号化,生成多维符号向量。最终将时间序列转化为各项由多维符号向量表示的原子序列。2)提出基于单一线段模式的异常检测算法。该算法首先将原始时间序列进行PLR分段线性表示,把每个单一的线段看做是一个模式;然后把每个单一线段模式的两个端点映射到应用mSAX符号化表示方法划分子序列片段的分割点,将符号化后的时间序列中分割点之间的子序列作为挖掘对象;最后计算每个挖掘对象的最近邻非自我匹配距离,并把该距离作为异常度,同时还提出了一种自动选取异常度阈值的方法,通过对比异常度与异常度阈值的大小来确定异常序列。3)提出基于相邻线段模式的异常检测算法。该算法在基于单一线段模式异常检测算法的基础上,把单一线段扩展到相邻多条线段。使用可重叠滑动窗口遍历的方式,把相邻几条线段的组合作为一个复杂模式,并把该模式的两端分割点映射到原子序列中,把原子序列的每个分割作为挖掘对象。其他过程与基于单一线段模式的异常检测算法类似。本文最后在心电图(ECG)数据集上验证了基于单一线段模式和基于相邻线段模式的时间序列异常检测算法的有效性。
其他文献
数据仓库和联机分析处理(OLAP)技术已经广泛地应用于各行各业,如何提高数据仓库环境下的查询效率是当前数据仓库研究的一个核心问题。利用索引技术是提高查询性能重要的方法
随着图像传感器技术的发展、数据源的不断丰富,多传感器图像融合技术得到了迅猛的发展,已经成为图像理解和计算机视觉领域中一项重要的新技术。图像融合技术始于军事应用,在精确
VOIP(Voice over Internet Protocol)概念提出至今已10余年了,先前由于通话质量等各方面存在缺陷,因此端对端的VOIP电话并没有真正大范围发展起来。但近两年来,随着全球宽带
二十一世纪是信息爆炸的时代,信息处理技术成为人们关注的焦点,面对海量的信息,如果对其不加区分,而采用相同处理,时间及空间复杂度则无法估计。研究发现,在海量信息中,人们
群体队形控制是人群仿真技术和计算机动画的重要分支,对于编队控制、队形设计等具有重要意义,已应用在游戏、动画、群机器人系统等诸多领域。本文结合几何约束机制,研究Power
随着现代社会的快速发展,人们对信息的要求越来越高了,作为重要信息资源之一的档案正面临着全球信息化浪潮的巨大冲击,原有的手工管理档案的方式已经不能满足人们对档案高效
随着网格技术的迅猛发展,网格安全成为影响网格技术的关键问题。特别当网格技术引入到校园网建设中后,不仅可以使得校园内的教学和计算资源得到充分的利用,还能够消除资源孤岛和
电子商务的迅速发展将传统旅游业推进了一个新的发展空间,上海旅游集散中心联合其他各家旅游集散中、汽车公司、酒店共同构建旅游电子商务联盟,以求通过开展电子商务来谋求企业
随着计算机和信息技术的迅速发展,网络已经成为我们日常生活、学习和工作的基础设施。各种基于网络的分布式办公系统层出不穷,电子政务系统就是其中之一。电子政务系统利用网络
随着嵌入式产品的功能和复杂度的不断提高,如何高效地进行开发已成为一个严峻的挑战。嵌入式软件开发已呈现出一些显著的特点:其一是行业内技术人员流动频繁,缺少复用经验的技术