【摘 要】
:
分布式查询处理是数据集成系统实现的关键技术之一。优化查询处理方式,提高执行效率并缩短查询响应时间,一直是数据集成系统研究的重要主题。 暨南大学信息科学技术学院高
论文部分内容阅读
分布式查询处理是数据集成系统实现的关键技术之一。优化查询处理方式,提高执行效率并缩短查询响应时间,一直是数据集成系统研究的重要主题。 暨南大学信息科学技术学院高性能数据库开发实验室前已开发面向大数据分析环境事务数据在线集成的通用中间件系统II_SERVICE。它支持对跨组织及网域的异构信息源实现虚拟方式与实体化方式相结合的数据集成,从而屏蔽底层数据源差异,向应用提供基于全局模式的透明数据访问支持。 本文在此基础上,致力于研究在网络传输速率难以预测的前提下,如何提高集成端的汇总处理的执行效率,并缩短查询响应时间。主要内容包括: (1)对实现SQL查询的代数运算深入分析其阻塞性及运算分解与组合,以形成尽可能佳的流水线组织及计算节点间数据传递方式。 (2)研究查询运算的状态性,对查询语法树中可以进行存储流水计算的节点进行优化,通过减少输入元组与历史元组的匹配量,进而提高流水线的执行效率,所提出的流水线双哈希连接算法利用双哈希策略可以有效地缓解X-join算法中历史元组的聚集现象。 (3)在查询计划的执行粒度上,尽量把能够使用流水线计算的相邻节点合并成一个动作,进而形成大粒度流水线计算。在查询计划的执行控制上,采用ECA判定规则,以此判断当前动作是否可以与其他动作参与并发执行。
其他文献
随着嵌入式技术的发展和无线通信技术的广泛应用,以移动智能终端为载体的移动地理信息系统(Mobile GIS)已成为地理信息系统研究的热点。移动GIS是集导航、定位、地图查询和空
近年来,网络技术飞速发展,网络攻击复杂化问题日益凸显。但是复杂的网络攻击往往隐藏在大量的普通网络攻击之间,使得现有实时入侵检测系统(IDS)难以发现复杂的多步攻击。因此
随着计算机应用的普及,软件质量成为软件工程最为关心的问题之一,软件测试作为软件质量的有效保障而备受关注。统一建模语言(UML)以其可全方位描述软件系统蓝图的优势,在众多
数据流模型是近年来出现的、一种新型的数据模型,广泛应用于网络监测、传感器网络数据分析、Web点击数据流分析、金融行业和商业交易管理数据等中。数据流的连续、快速、无限
煤与瓦斯突出是引发煤矿重大恶性事故的隐患,在防突治理方面,如何提高瓦斯突出危险性预测的精度,使防突措施减少盲目性,增强针对性的研究工作是有实用意义的。煤与瓦斯突出预
随着人类基因组计划的完成,人们获得了大量的生物学数据。在对这些生物数据进行处理和分析的过程中,涌现出了大量的数学问题。这些数学问题亟需通过有效的计算手段进行解决。
随着互联网技术的飞速发展,网络服务已经渗透到了生活的方方面面,人们也逐渐形成了对网络信息的依赖,在网站中投放广告的方式已经成为目前网络中重要的宣传策略,同时也成为各
对中国书法创作进行计算机模拟的研究,不仅对于继承和发展中国传统文化有非常重要的意义,而且有利于书法艺术的推广和计算机艺术的发展。本文就计算机书法模拟和创作中,关于
随着网络技术的发展和宽带网络的普及,流媒体应用越来越受到人们的关注。传统的视频点播系统通常是基于C/S(Client/Server)模式的,当用户数量大规模增长时,服务器带宽将成为
大坝施工监控工作中,需要一个适用于现场作业的移动信息平台,提供数据采集、远程数据传输和坝区定位等功能。科学技术的发展,特别是无线通信、组网以及移动定位技术的日臻成