数据立方体优化技术的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:suguangli1507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据立方体是数据仓库和联机分析处理的核心概念。为提高联机分析处理系统的查询性能,通常需要预先计算并保存数据立方体,然而完全的预计算必将导致数据立方体体积的爆炸。因此,降低磁盘空间成本和提高查询性能成为数据立方体研究两个重要却又相互制约的目标。为从根本上解决这些问题,需要探索有效的数据立方体组织方法。本文首先提出基于语义压缩的同基类数据立方体概念,它将由相同基本元组集聚集而来的立方体元组归为一类,称之为同基类,该类中所有立方体元组的聚集值定然相同,仅从每类中选出一个代表进行实际物理存储,从而大大降低数据立方体的空间开销。另一方面,因为类中元组都是基于相同的基本元组集在不同的维集上进行聚集计算,所以这些元组也保存了原有数据立方体的语义信息。在此基础上,将同基类数据立方体中的元组按树状结构组织成同基类方体树,不但进一步减少了数据立方体的物理存储空间,也提高了其点查询性能。当前数据立方体在处理一个区域查询时,都是将其分解成大量点查询,对各点进行点查询后再汇总聚集得到结果,而一个区域查询分解成的点查询个数是查询条件中各维区间分解点数目的乘积,从而导致区域查询效率较低。对此,本文提出一种基于集合运算的数据立方体结构,通过索引和集合的交并运算来加快区域查询,在查询条件为区域的维上,先对区间中各维值的基本元组索引集进行并运算,然后一次性的进行所有维集合的交运算,从而在保持较少的磁盘空间和较好的点查询响应速度的情况下,改善了区域查询的性能。
其他文献
近年来,工作流技术逐渐成为了计算机应用领域中的最为活跃的研究热点之一。工作流系统的时间管理问题在工作流管理中扮演了十分重要的角色。对工作流过程模型中的时间信息进行
语义搜索是目前万维网研究的热点,目标是从大量的网络资源中找到真正语义相关而不是仅仅是关键词匹配的内容。为了实现语义搜索, 必须用机器可以理解的元数据对网络资源进行标
Internet的迅猛发展,带来的直接影响就是通信量的急剧增加和各类实时业务流量对网络QoS要求的提高。通信量的迅速增长使得主干网拥塞日益严重,因此,拥塞控制成为网络研究的重点
随着计算机网络规模的迅速扩大,网络蠕虫攻击成为目前影响网络安全的一个重要问题。新一代蠕虫的传播速度越来越快,其破坏性也越来越大,实现蠕虫早期检测是蠕虫防御的前提和
目前,复杂网络理论已经成为研究自然界和社会系统中很多问题的重要工具,被广泛应用于社会学、经济学、统计物理学、计算机科学和生物信息学等领域。随着社会和网络的飞速发展,人
DoS攻击是目前互联网上常见的攻击形式之一,它由于危害巨大且难以防范,已成为互联网面临的主要安全问题。认证协议作为一类重要的安全协议,常被用于互联网上不同主体之间的安
随着嵌入式系统的快速发展,嵌入式人脸识别技术成为模式识别和人工智能领域的热点研究课题,在公共安全、电子商务、金融等领域有巨大的应用价值。本文的研究得到广东省产学研合
高层体系结构(High Level Architecture,HLA)现已成为仿真领域的通用标准,但是在实际应用中,基于HLA的仿真系统往往无法满足实时性的要求。随着经济的发展,社会对于仿真系统
等级保护是信息系统安全的基础性工作,是加强信息安全保障体系建设的重要手段之一,同时也是分级防护和突出重点的具体体现。信息系统安全等级保护的总体目标是促进我国社会信
随着计算机技术和Internet的发展,管理信息系统(MIS)的应用越来越广泛,特别是在医药经销系统中,MIS的使用可以为企业的管理和决策提供有力的依据,并最终提供工作效率和经济效益。