论文部分内容阅读
本文以研究数值和名义属性空间数据上的动态偏好轮廓查询的物化算法为目的。在对国内外研究现状进行了深入分析的基础上,主要针对不同用户对属性值有不同偏好的名义属性的特性,对数值和名义属性空间数据的轮廓查询方法进行了研究。首先,分析了用户对数值和名义属性空间数据的任意子空间上的动态偏好轮廓查询实时应答的现实需求,针对现有的仅在数值和名义属性空间数据的单个空间上适用的轮廓点的支配分析方法及它的局限性,提出了多个子空间之间的轮廓支配分析条件的共享策略以及基于此共享策略的物化某空间的所有子空间的轮廓支配分析条件的算法。其次,分析了在数值属性空间数据上求轮廓体的物化方法,针对现有的方法仅能对数值和名义属性空间数据的某一特定空间上的动态偏好轮廓查询物化的缺陷,提出了在数值和名义属性空间数据上的所有子空间的动态偏好轮廓查询的物化方法,即半物化轮廓体。结合已提出的基于共享策略物化某空间的所有子空间的轮廓支配分析条件的算法,并通过改进的数值和名义属性空间数据的子空间轮廓的共享策略,提出了计算半物化轮廓体的算法。再次,分析了半物化轮廓体上进行动态偏好轮廓查询的特点以及用线性表来存储半物化轮廓体的不足之处。选用改进枚举树的方式,设计了用来存储半物化轮廓体的索引结构。并根据此索引结构的特点,提出了在此索引结构上通过最短的查询路径求任意子空间上动态用户偏好下的轮廓查询算法。最后,将本文所提出的算法与传统算法在反相关数据集和独立数据集两个数据集上分别针对时间效率方面进行了对比实验。