一种列存储数据仓库中的数据复用策略

来源 :第30届中国数据库学术会议 | 被引量 : 0次 | 上传用户:ting1991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.
其他文献
薪酬体系的设计是建立现代薪酬管理制度的重要组成部分,做好对企业薪酬体系的研究和设计,建立一套科学的、适合企业在知识经济和经济全球化时代发展需要的薪酬体系,对企业来
我国外汇储备的迅猛增长给外汇储备的保值增值带来巨大的压力,通过创建模型测算出汇率、利率波动给外汇储备带来的损失以及利用投资国际证券市场以及组建专业的投资公司所获
智能视频监控越来越多地运用在社会各层人民的工作和生活中,其给人们带来的便捷不言而喻。在智能交通系统中,对运动车辆的检测和跟踪是整个交通事件检测和视频监控系统智能化
烟草产业是贵州省得支柱产业之一,但烟草的种植受国家指标的严格控制。由于喀斯特高原山区地貌的支离破碎以及作物种植的复杂等情况,所以很难通过传统手段实现对烟草生长状况
为进行服务组合优化及适应服务组合优化过程中Web服务的动态性、不稳定性以及多种QoS属性限制等问题,提出一种多信息素动态更新的蚁群算法MPDACO,包括MPDACO局部优化算法和MP
在经济全球化、价值多元化的当今时代,如何说服思想政治教育对象接受思想政治教育内容,增强思想政治教育说服效果,是当前思想政治教育研究中的一个难题。中国传统文化有着十
近几年,我国一些上市公司中频繁出现股东因持股变化而对公司的临时股东大会的召开、公司董事会成员的任免以及公司内部事务议案的提出等事项提出要求而造成的上市公司控制权
<正>~~
伴随城市空间向郊区的急剧扩张,郊区已成为快速城市化过程中疏解城市人口和功能的重要空间。然而,居民迁入郊区后往往会面临着与内城不同的居住环境、指向内城的长距离通勤以
针对计算机网络访问请求具有实时到达以及动态变化的特点,为了实时检测网络入侵,并且适应网络访问数据的动态变化,提出一个基于数据流的网络入侵实时检测框架。首先,将误用检