【摘 要】
:
连接查询操作是联机分析处理系统(OLAP)的重要操作之一,也是企业决策人员从海量数据中提取信息的重要手段。而多表连接运算一直是连接查询操作的主要瓶颈。随着大数据时代的
论文部分内容阅读
连接查询操作是联机分析处理系统(OLAP)的重要操作之一,也是企业决策人员从海量数据中提取信息的重要手段。而多表连接运算一直是连接查询操作的主要瓶颈。随着大数据时代的到来,目前的传统连接算法无法满足企业管理者的多表查询需求,这也制约着的企业管理者的决策效率。近年来图形处理器(GPU)计算的不断发展,它已经在计算化学、稀疏矩阵求解和物理模型等方面得到了广泛的应用。本文结合GPU高并行的特点,在列式数据库连接算法的基础上,提出了一系列基于GPU的连接查询算法,加快了OLAP数据仓库中多表连接运算的执行效率。具体的内容如下:(1)根据分析型数据仓库的星型数据模式和连接运算的特点,针对大规模数据,设计了通用连接分块存储模型。同时根据GPU联合访存模型的特点,提出了间隔差值压缩算法。该算法的压缩速度约为GPU传统差值压缩算法的2倍;(2)在间隔差值压缩数据和传统差值压缩数据的基础上,提出了基于间隔压缩的选择算法和基于传统差值压缩的连接选择算法,并且利用GPU提高了连接选择运算的响应速度。(3)通过OLAP标准测试数据集(SSB)测试表明,相比于CPU连接算法,基于GPU的压缩数据连接算法可以得到10倍左右的加速比;相比于基于GPU的隐连接算法,基于GPU的压缩数据连接算法可以得到2-4倍左右的加速比。
其他文献
目前传统的信息检索技术己不适应日益增加的大量文本数据处理的需要,用户需要更加有效的检索算法实现文档重要性和相关性的排列,完成不同文档的分类比较,或找出多文档的模式和趋
ScienceML是为ScienceWord在互联网上传输、共享和检索而制定的符合XML规范的科技文档描述语言。三维图形是ScienceWord中的重要组成元素,制定符合XML规范的三维图形描述语言
视觉目标跟踪是计算机视觉领域基础而重要的课题之一,在视频监控、运动识别、交通监控以及军事导航等应用中起着至关重要的作用。近十年来,世界各地的研究者在目标跟踪领域做
本文介绍了一个以TI公司的TMS320DM642为核心芯片的DSP车牌识别系统设计、实现和优化。该系统首先通过摄像机拍摄车辆的视频,输入视频信号到DSP板卡;然后从输入的视频信号中
现代社会中,项目管理已成为经济发展的重要构成要素。在激烈竞争的环境下,各种复杂项目具有大量的信息需要管理,为实现信息的动态管理、提高项目的完成质量和管理效率,必须依赖于
图是数据结构中重要的组成部分。在图模型中,点代表事物,边代表事物之间的关系。图模型有着非常广泛的应用背景,如生物网络、web网络、计算机网络等。近几年来,随着互联网的
随着网络应用的不断扩大,一个企业往往要运行很多并不一定基于Web的应用,于是,SSL VPN(Secure Socket Layer Virtual Private Network)相对IPSec VPN的种种优点,就显得微不足
在漫漫的人类历史长河中,实现个性化学习一直是教育领域孜孜以求的奋斗目标。互联网出现后,研究者开始关注如何运用网络这个学习传递平台来实现个性化、适应性学习,以更好的
随着3G时代的到来,SVG做为XML在图形图象方面的应用越来越广泛,已经成为二维图形成像的既定标准和MMS的主流技术。而嵌入式移动产品这类低端设备作为潜在的、巨大的市场理应
随着计算机和图像处理技术的发展,数字图像拼接技术在现实生活中发挥着越来越大的作用,其应用前景也越来越广泛。本文详细阐述了图像拼接技术的关键技术要点,并从特征点匹配和光