论文部分内容阅读
本文研究了时间序列分析的相关技术,包括维度约简、时间序列模式、时间序列相似性搜索等,针对序列模式挖掘技术提出了动态模式匹配的数据挖掘方法,以满足对实时数据进行动态的模式匹配的需求,针对基于动态时间弯曲(Dynamic Time Warping以下简称DTW)的时间序列相似性搜索算法提出优化策略以提高算法的执行效率。基于对以上技术的调研和改进,设计并实现了一个能够对多维时间序列数据进行数据分析并完成预测的预测模型,该模型在环境空气质量预测预警系统中被成功应用。本文的主要工作内容和创新点如下:(1)提出一种新的时间序列模式匹配方法—动态模式匹配,该模式匹配方法得到的模式对预测有直接的参考意义。为了使模式匹配得到更好的匹配效果,在时间序列模式匹配中,应用了时间序列数据标准化技术和基于DTW的时间序列相似性搜索算法。(2)对基于DTW的时间序列相似性搜索算法进行了改进和优化,实现了算法对多维时间序列的支持;其次对算法进行CPU扩展指令集编程优化,使用SSE (Streaming SIMD Extensions)扩展指令集对算法进行重新实现,提高对CPU计算资源的充分利用,在单线程情况下提高算法执行效率。(3)实现了基于DTW的时间序列相似性搜索算法的并行性运行框架,提出了并发情况下的提早终止策略,研究并应用了滑动窗口技术和时间序列数据分段技术,提高算法在多线程计算机体系下的运行效率。(4)综合对以上成果的应用,设计并实现了一个基于时间序列分析技术的预测模型,该模型能够对多维时间序列数据进行有效的分析和预测。同时将模型应用于对空气污染指数预测的具体应用之上,取得比较理想的预测结果。本文取得的成果为,将预测模型实现并应用于环境空气质量预测预警系统之中,对真实的由空气污染指数和气象数据组成的多维时间序列数据进行分析和预测,取得了很好的应用效果,证明基于时间序列分析技术的预测模型可用性。