论文部分内容阅读
时间序列相似查询是从时间序列数据中查找与给定序列相似的序列或子序列,是一种新型的、重要的时间序列数据分析方法,具有广阔应用前景。本文在综合分析国内外时间序列相似查询研究现状的基础上,对子序列相似查询进行深入研究,具体内容如下。首先,原有降维技术造成序列数据搜索空间无界性,使得子序列相似查询算法在索引遍历时不能充分实现点过滤。为此,采用一种新的非线性降维技术有效解决点过滤问题。并且引入提前终止技术,有效减少序列距离计算时的冗余计算。对子序列的查询结果分级,提出分级子序列相似查询算法。其次,当数据序列动态变换和查询参数动态更新时,为了减少直接采用分级子序列相似查询算法产生的许多重复计算,利用增量数组记录上次查询计算的序列距离值,以求解本次查询的最优查询参数。针对数据序列范围增加、数据序列范围减少、查询参数动态变换三种情况,分别提出增量式分级子序列相似查询算法。然后,防止分级子序列相似查询中序列数据的隐私泄露,提出隐私保护模型保护序列数据的安全。利用降维来隐藏原序列数据,通过标号替换策略保护序列的均值。提出安全距离计算协议以实现序列数据的安全距离计算。并详细分析了隐私保护模型的正确性、安全性、精确性及计算代价。在此基础上,提出了隐私保护的分级子序列相似查询算法。最后,对提出的算法进行实验验证,并对实验结果进行分析和比较。