论文部分内容阅读
移动对象轨迹数据的挖掘是移动对象数据库的一个重要研究方向,从轨迹数据中得到的信息可以应用到交通控制、气候预测以及生态研究等多个方面。轨迹数据量庞大、结构复杂,且轨迹数据来源众多,数据模型多样,用传统的数据模型很难对轨迹数据实现有效的管理,因此迫切需要开发新的模型来管理轨迹数据。树结构模型比传统的数据模型更灵活,基于树模型的XML更适合于管理移动对象的轨迹数据。同时由于目前的研究主要集中在空间数据挖掘领域,其更关注对当前信息的研究。因此有必要研究针对移动对象轨迹数据的挖掘技术。本文主要研究了树结构下移动对象的近邻查询算法和相似轨迹的提取方法,并在仿真数据集和真实数据集上进行实验。首先,基于轨迹数据形式化定义时态距离,并用相对简单的近似距离替代精确距离来减少查询过程中的计算量。在关系模型和树结构模型上实现基于动态距离的距离查询、时间点最近邻查询和时间段最近邻查询算法,并对查询效率加以比较,实验结果表明树模型的查询效率明显高于关系模型。然后在树结构模型中引入嵌入式索引,该索引借鉴空间R树索引的思想,将处于一定空间范围内且满足一定条件的数据记录存放在一起,在遍历DOM树时节省搜索空间从而提高查询效率。其次,本文提出了四种相似轨迹的查询方法,分别是最近邻法、平均距离法、标准差法和置信区间法,实验结果表明置信区间法在这几种方法中是最精确的。最后,在真实数据集上实现以上算法,在进行实验之前需要对得到的原始数据进行坐标转换和标准化,实验结果进一步证明了所提出算法的有效性。