分布式数据的反SKYLINE查询算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:slb135
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
反skyline查询常用在数据挖掘和决策支持系统中,用于数据的多准则优化。但目前有关反skyline查询的研究仅限于集中式数据,分布式数据上的反skyline查询尚未有文献涉及。在现实应用中,基于更新成本、性能等考虑,数据经常是分散存放并通过网络互连的,现有的集中式算法无法满足分布式环境。本文将分布式数据上的反skyline查询作为研究重点,具体工作包括以下几个方面:  (1)分析当前集中式数据集上的反skyline查询方法,设计了分布式数据集上的反skyline查询算法BBDRS。远程站点利用R树索引预计算反skyline点集的候选集和筛选集,并将其作为发往中央站点的数据摘要,一方面降低了总体反应延迟,另一方面避免发送全部数据,减少了大量的通信开销。  (2)针对上述R树算法花费大量时间建立索引的问题,设计了分布式数据集上一种使用预排序的反skyline查询算法PDRS。该算法采用上述相同的通信策略,核心思想是将各数据点按与查询点的”距离”进行预排序,在避免建立索引的同时大大减少支配比较次数,节省了计算时间。在非很大规模数据上,PDRS性能较BBDRS好。  (3)借鉴当前单数据流上的反skyline查询方法,设计了分布式数据流上的反skyline查询算法—DCDRS算法。客户端,利用DC树索引实时计算和维护当前窗口内最新的数据摘要信息;服务器端,则利用集中式算法计算最终结果。DCDRS算法能够正确并有效的解决分布式数据流环境下的反skyline查询问题。  (4)设计并实现了分布式数据查询实验平台。该平台通过控制端的控制功能,实现了文中实验的自动化完成,避免了大量手工操作,在一定程度上保证了实验数据的真实性与精确性。  本文对分布式数据反skyline查询算法进行的研究,在用户偏好、多条件决策系统以及数据挖掘中具有非常重要的现实意义。在数据存储越来越趋向于分布式的今天,本文的工作可以促进反skyline查询在分布式环境下的应用和发展。
其他文献
随着互联网的快速发展,隐藏在Web后台数据库中的信息资源因为其数据量大、结构完整而受到了广泛关注,这些信息通常需要用户提交查询请求才能访问而且不能被传统搜索引擎所索引,
动态优化问题(Dynamic Optimization Problem,简称DOP)是现实社会中普遍存在的一类实际优化问题。相对于静态优化问题而言,DOP的目标函数或者约束条件会随着时间而变化。近年来,利
在我国目前的医学教育过程中,特别是在普外科教育、解剖教育和微创手术教育过程中,由于缺乏真实的人体器官资源,学生掌握知识的途径主要是通过教师的讲授和从教材中获取相关知识
分片式处理器体系结构(TPA)将计算、存储和互连资源组织成片式的基本结构单元,并将大量的片式单元由高效能、可扩展的片上网络连接起来。为了有效利用TPA丰富的片上资源,高度暴
集团为了考核信息系统运维的水平,与一些先进的指标进行比较,使用一些指标的得分数据来对企业信息系统运维情况进行分析,从而在对比中看出本单位的不足,努力在管理上得到更进一步的改进,在指标上能够获得更高的水平。针对信息系统运维集团提出的指标管理体系,其内容包括系统运行水平、系统运行安全、调运体系建设、运行队伍建设、运行专项工作、事故与障碍等指标。本文就是基于指标体系中各单位运行评价与分析系统提出利用高维
异步无线传感网络中的全网广播是一项最基本的网络服务,主要应用于环境监测、软件更新等场景。无线传感网络中的传感节点大多数由电池提供能量,所以网络中的能量有限,而转发数据
近年来,随着信息化向人类社会各个层面的渗透和发展,在企业、科学、互联网等领域均产生并汇集了大量数据,大数据时代已然来临。目前,越来越多的应用领域涉及到大数据的存储和
随着计算机网络技术的发展,网络尤其是Internet给人们的生活和工作提供了极大便利,如电子商务、网上银行等已经十分普及。网络在改变人们的生活方式和提供企业生产效率的同时,也
随着科技的高速发展,以及无线传感器网络在众多领域的广泛应用,无线传感器网络逐渐成为研究热点。因为传感器节点能量受限,而MAC协议直接关乎节点的能量使用效率,所以研究如何在M
随着最近几年互联网和电子商务产业的兴起,海量的物流需求对物流企业提出了巨大的挑战,传统的物流企业仓库运作模式已经无法适应庞大的物流订单吞吐需求,为此美国电子商务公