分布式数据库下数据水平分布的skyline计算研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ccll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline计算就是从一个数据集中找到不被其他数据点支配的所有点的集合。如果一个数据a支配另一个数据b,那么a的每一维属性值都不比b对应属性值“差”,而且必须至少有一个属性值比b的“好”。“差”和“好”无统一定义,可以根据用户的选择和喜好定义。近年来,skyline计算逐渐成为数据库领域的一个研究热点,主要是因为它在多标准决策、数据挖掘和数据库可视化等领域有潜在的应用前景。对于集中式数据库下的skyline计算的研究已经比较成熟,分布式数据库下的skyline计算由于起步较晚,现有的研究成果仍不够成熟。本论文主要研究的是分布式数据库下数据呈水平分布时的skyline计算的问题。数据的水平分布指的是数据集合分散的存放在不同的服务器上。论文的主要工作包括以下几个方面:(1)研究各个服务器上的局部skyline集合与全局skyline集合之间的关系,提出通过汇总局部结果再次计算得到全局skyline集合的思想。(2)为了提高计算效率,提出了一种“区域划分和多窗口收集”的优化策略。论文深入讨论了区域划分的思想及不同服务器上划分区域之间的支配关系,给出了三维数据空间下的基于“区域划分和多窗口收集”的skyline计算算法。(3)进一步讨论了对高维数据空间下进行区域划分可能出现的一些问题,提出只对数据的前三维进行区域划分的不完全划分思想和skyline计算的解决方案。(4)进行了大量的实验,通过实验结果分析得出论文提出的“区域划分和多窗口收集”策略对提高分布式数据库上的skyline计算效率有一定的效果。
其他文献
数据库入侵检测技术是数据库安全的重要组成部分。目前的入侵检测系统采用模式匹配方法,虽然对已经存在的攻击具有很高的检测效率和正确率,但对很多未知的入侵攻击行为和方法
随着计算机与信息技术的发展,数据挖掘技术已经广泛应用到人工智能、模式识别、生物信息等许多领域。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理