论文部分内容阅读
在目前的信息时代里,不确定数据的地位和作用越来越大。虽然传统的关系数据库模型具有灵活存取、逻辑结构和物理结构相对独立等众多优点,但它无法处理这些不完整的、不确定的数据。为了处理这些数据,1996年Dev和Sarkalar提出了一种概率数据模式以及概率数据库模型,但是这种概率数据模式和概率数据库模型存在着诸多缺点,因此我们需要扩展传统关系数据模式,处理概率方面的不确定性数据,以描述动态的世界,建立一个新型的概率数据模式——PDS(Probabilistic Data Schema)概率数据模式。我们在PDS概率数据模式中引进对象属性、静态属性、动态属性和概率属性概念,并提出由上述属性联合构成元组;在此基础上定义了该模型中元组演算的一些基本操作,从而形成了PDS概率数据库理论体系,使其具有处理不确定数据的能力。概率数据库中存储移动对象,R树索引是目前最实用的移动对象索引机制,但是由于R树索引的查找以及更新性能低下,因此我们建立了一个R树索引和Hash索引相结合的混合结构——PRI(Probabilistic R-Tree Index)树索引结构。性能分析表明,采用PRI树索引结构的动态更新性能大大高于R树索引。不确定性是传感器数据库中的常见问题,而如何准确查询不确定数据是当前研究的热点。概率最近邻居查询能够描述不确定数据,概率最近邻居查询能够准确描述不确定数据,本文提出了基于分支界限的概率最近邻居算法和基于Delaunay三角化的概率最近邻居查询算法,并分别给出两种算法的性能分析。