面向不确定数据的聚合查询处理与优化技术

来源 :东北大学 | 被引量 : 0次 | 上传用户:FlyinginSky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,许多重要领域都涉及到不确定数据的管理,如:数据集成,无线传感器网络,金融监控,趋势预测以及移动对象的管理。由于固有以及人为的多方面原因,这些领域的数据具有不可避免的不确定性,其不确定性主要体现在对象的数据不确定性,存在不确定性和位置不确定性等方面。近年来,许多研究者把目光投向不确定数据的建模、查询估计、数据索引,Top-k查询,天际线查询以及聚类和数据挖掘等领域,并取得了很多的成果。然而,尽管概率聚合查询是一种非常重要的查询,关于它的研究依然寥寥无几。传统的聚合查询返回位于给定查询范围内的所有对象的概括信息,比如满足查询条件的对象个数。这种查询类型是很重要的,因为用户有时可能只是对聚合信息感兴趣而不是某个具体的对象,所以聚合查在现实中被广泛的应用。例如在交通监控中,为了检测高峰时刻的十字路口A的车流量,查询“在今天上午八点到九点之间有多少辆车通过十字路口A”。本文首先介绍确定数据上的聚合查询技术,并扩展到不确定数据的聚合查询,给出面向不确定数据的聚合查询的定义。然后,在已知的不确定数据索引U-tree的基础上增加不确定对象的聚合信息,提出一种针对面向不确定数据的聚合查询的新的索引结构aU-tree。接着通过对最小边界矩形MBR的预先划分,提出了单个对象和多个对象的过滤技术,并给出基于aU-tree的面向不确定数据的聚合查询算法。为了提高算法效率,缩短计算时间,提出了基于采样的近似查询算法,包括单采样方法和双采样方法。这两种基于采样的近似算法,在确保结果精确度的前提下大大的缩短了计算时间。本文在实验中对aU-tree和近似算法的性能进行了测试,并对近似算法的精确度进行了测试,测试结果表明,近似算法的性能要远高于aU-tree,精确度至少在90%以上。
其他文献
着色是图像编辑领域中一个活跃的、有挑战性的研究课题。着色最初被定义为给黑白图像、电影或视频加上颜色的计算机辅助处理技术,实际上着色问题的研究,对于多方面的应用都具
H.264是目前国际上新一代的主流视频压缩标准,与先前的标准相比,它采用了许多新的技术以提高编码效率,应用领域更加宽广。然而,高编码效率是以提高运算的复杂度为代价的,这严
随着计算机科学技术和视频编码技术的发展,针对不同的数字视频应用,产生了很多视频编码方案和标准。而多种视频压缩标准的共存和网络的异构性导致了视频设备和网络传输出现兼
垃圾邮件已成为互联网用户的烦恼之一,已经严重干扰了人们的正常生活,浪费用户的时间、精力甚至造成了信息安全隐患。  人们已经研究了多种反垃圾邮件技术,基于规则的垃圾邮件
壁画作为人类最古老的绘画形式之一,其丰富多彩的内容,使其成为政治史、文化史等学科的重要研究资料。但由于壁画为不可移动文物,其正在因为风化、风蚀、雨蚀、褪色等病害逐
多媒体技术和数字网络通讯技术飞速发展,使得信息的发布和传输实现了数字化,但是数字媒体信息极易被仿制、处理、公开和传播,引发了数字信息传输的安全问题和数字信息的真实
随着Internet技术的发展,越来越多的应用采用XML作为信息表示和数据交换的标准。在对XML数据查询处理的过程中,用户查询意图通常是不明确的或不完整的,这就使得查询具有一定
学位
真实感是很多CG电影与动画作品的主要追求,真实感材质是真实感渲染中最重要的组成部分之一。材质决定一个物体的颜色,透明度,粗糙度等属性。经过多年的研究,很多复杂的材质模
随着信息技术的发展,业务流程的范围也从部门和组织内部扩展到跨越部门,甚至跨越企业的边界,业务流程呈现出复杂、多变的特点。面向对象Petri网(Object-Oriented Petri Nets)