论文部分内容阅读
时间序列数据产生于人类生活和工业的方方面面,在如今数据量急剧增长的时代背景之下,如何更有效地管理与运用这些时间序列数据成为研究者们的关注焦点。虽然时间序列中的异常数据规模和数量较少,但其中隐含的某些信息可能对科技研究或生产生活有着重要的影响。从提出时间序列异常检测的问题以来,国内外众多的研究者对其进行了深入而广泛的研究,并且也提出了应用于众多领域的异常检测方法,但是在时间序列异常检测领域内仍然存在着许多值得研究、探讨和解决的问题。本文围绕时间序列异常检测方法进行研究,主要工作如下:(1)时间序列多尺度异常检测方法针对时间序列点异常检测和线性分段的问题,本文提出一种时间序列多尺度异常检测方法。通过Haar小波变换压缩时间序列,把时间序列分解在不同的尺度上,再使用二次回归模型将小波变换后的时间序列分割成可变长度的模式序列(子序列),并计算模式异常值,然后通过小波重构函数重构原始时间序列,最后通过与自适应阈值相比较检测原始时间序列中的异常模式。使用仿真数据集Keogh_Data对方法进行验证和评估,并与测试Keogh_Data数据集的三种异常检测方法IMM、TSA-Tree和Tarzan进行比较,实现结果表明,对实验数据进行3级小波分解,能够达到很好的异常检测效果;并且与Tarzan方法、基于距离的方法和基于密度的方法在检测精度、检测效率和检测速率方面进行比较,在短期精度和效率方面该方法能够达到93.5%和96.2%,在长期精度和效率方面依然能够达到91.7%和90.5%,异常检测效果有较为明显的提升。(2)基于协同训练和选择性集成学习的时间序列异常检测方法针对传统分类方法进行时间序列异常检测不足的问题,提出基于协同学习的时间序列异常检测方法。传统分类方法主要是通过给定的有标记子序列训练分类器,使分类器对未知的子序列进行预测分类,但在实际研究中大量的有标记子序列需要花费很长的时间和人力才能获得,而数据集中存在的是大量无标记子序列,因此提出结合标记序列和大量无标记序列的协同训练算法对时间序列进行分析。协同训练算法在训练学习过程中又会受到分类器差异性的限制,针对这个问题,结合选择性集成学习提出基于协同学习的时间序列异常检测算法RFCL,并且与小波变换多尺度的方法相结合,辅助协同学习算法选择未标记序列进行分类器的训练和学习,用于时间序列模式的异常检测。最后,在理论研究的基础上,采用仿真数据集Keogh_Data、Ma_Data和真实的经济数据集进行实验,以验证本文所提出的异常检测方法;实验结果表明,本文提出的基于协同学习的时间序列异常检测算法RFCL可以有效的检测出时间序列中的异常模式,并且具有较高的检测精度和检测效率。