论文部分内容阅读
时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列,在经济、金融、科学观测和工程等各个领域都广泛存在。利用已有时间序列,探索时间序列的规律和知识,是人们广泛关注的问题。与传统时间序列分析提出假设然后进行验证的数据处理方法不同,时间序列数据挖掘适合发现型任务,能够从大量历史数据中挖掘出潜在的、未知的、有价值的知识。时间序列数据挖掘已经吸引了越来越多的关注。论文重点研究子序列相似性查询与异常检测,其中包括时间序列的模式表示、相似性度量、相似性查询、异常定义和检测,主要的研究内容和研究成果简单介绍如下:(1)基于形态的时间序列的子序列相似性查询针对时间序列数据的海量和复杂数据特点,直接在时间序列上进行数据挖掘不但在储存和计算上要花费高昂代价,而且可能会影响算法的准确性和可靠性。时间序列的模式表示是一种对时间序列进行抽缘和概括的特征表示方法,是在更高层次上对时间序列的重新描述。论文提出一种基于形态的时间序列子序列符号描述,并给出相应的子序列形态距离公式,以度量时间序列子序列的相似性。该方法直观简洁,对数据的平移、伸缩不敏感,能够反映子序列趋势变化的程度、去除噪声的影响,满足时间多分辨率要求。实验结果表明了算法的有效性。(2)基于LLM的时间序列的异常子序列检测目前,时间序列的异常还没有一个大家公认的定义。论文归纳了时间序列的三种异常类型,并对时间序列的模式异常进行了探讨和研究。为了提高时间序列中异常子序列检测算法的有效性,论文提出一种基于局部线性映射(LLM)的异常子序列检测算法,该算法将时间序列的子序列通过其相邻的子序列线性重构,从而很好的保留了时间序列的子序列与其相邻子序列的相关性,基于LLM的映射特性,使用两种异常指标(贡献因子,重构误差),并将其应用于时间序列数据集的异常子序列检测中。实验结果表明,所提出的算法对异常子序列的异常检测具有很好的效果,能够有效地提高时间序列中异常子序列检测的效率。